Open data : à qui ça coûte, à qui ça rapporte ?

Lors d’un atelier « Brest en biens communs » en octobre 2011, la mairie de Brest a présenté son projet d’open data. Un exemple cité était la fourniture des plans de ville, gratuitement, ce qui permettrait à une société X de développer une application qui donnerait en temps réel des informations sur la circulation et permettrait aux automobilistes d’éviter les bouchons. En réalité « donner » n’est pas le bon terme, « vendre » serait plus exact, car pour l’automobiliste ce serait un abonnement payant. L’argument pour la gratuité est de dire que la donnée existe, a déjà été payée par les impôts, la société X n’a donc pas à la repayer. Cela suppose que sa mise à disposition ne nécessite aucun travail. Or la mise à disposition de ces données est un service à part entière, qui coûte : analyse technique, juridique, création du site, serveur, plate-forme d’indexation et de recherche des données, licences ou développement des logiciels, préparation des données et leur mise à jour, sans oublier les cabinets-conseils habituels. Par exemple la ville de Montpellier utilise une plate-forme Microsoft, dont la licence ne doit pas être gratuite (non je ne crois plus au Père Noël …).

Rappelons nous : « L’œuvre doit être accessible dans son intégralité pour un prix ne dépassant pas un coût raisonnable de reproduction ». Les données étant mise à disposition gratuitement, la préconisation est évidemment respectée. Mais ne peut-on se poser la question inverse : pourquoi ne fait-on pas payer ce coût de reproduction ? Ce qui représenterait probablement un coût modique. Encore faudrait-il le connaître, or sur aucun des sites open data consulté je n’ai trouvé trace de celui-ci, il y est pourtant souvent question de transparence.

À qui ça peut rapporter ? Clairement aux sociétés qui développeront des applications qu’elle feront payer à partir de données qui ne leur coûteront rien. Un peu comme si quelqu’un vendait de la confiture de mûres qu’il a faite, en utilisant des mûres ramassées par d’autres. Or ce qui est long c’est de ramasser les fruits pas de faire cuire la confiture. Ceci est particulièrement vrai pour les données géolocalisées, c’est à dire des informations liées à des coordonnées : latitude, longitude. Notre terre étant ronde, mine de rien cela complique sérieusement les choses, puisqu’il faut passer d’une position sur un globe à une position sur une carte plane. Il existe différentes méthodes, mais quelque soit la méthode utilisée, c’est du temps de travail, des moyens techniques, des données volumineuses, donc un coût.

La ville de Rennes par exemple propose une même donnée géolocalisée en sept formats différents. Quand le fichier fait 1Mio, ça en fait 7Mio au final d’espace disque occupé, même si le prix de l’octet stocké diminue il n’est pas négligeable, sans compter le travail de conversion, pas toujours simple. Les entreprises ne sont-elles pas capables de faire les conversions dont elles ont besoin ?

Concernant plus particulièrement ces données géolocalisées, il s’agit souvent de mettre à disposition des données déjà connues par les habitants, individuellement, mais non exploitables par une entreprise. Par exemple la localisation des arrêts de bus près des écoles, qui ça intéresse ? Vous avez votre enfant qui va à l’école, vous voulez connaître le bus le plus proche, que faites-vous ? Vous demandez à l’instituteur, à la mairie , au voisin et vous avez votre information. La donnée est déjà connue, mais la mettre sous forme d’un fichier exploitable va permettre à des entreprises de développer des applications qu’elle revendront. Vous paierez pour voir sur votre téléphone le plan avec l’arrêt de bus : ça s’appelle le progrès.

Pourquoi pas ? Cela peut déboucher sur de nombreuses applications, gadgets ou véritablement utiles c’est un autre débat, mais la question qui est évacuée c’est celle du qui paie quoi ? Pourquoi ne pas faire participer au financement de la reproduction les entreprises qui en tirent un bénéfice commercial ? Si cette participation est bien calculée, elle ne sera pas dissuasive, et l’entreprise la répercutera sur le prix de vente.

Par ailleurs les salariés qui travaillent sur l’open data sont motivés de participer à des projets innovants techniquement, au service des citoyens. Mais n’oublions pas qu’ils sont fonctionnaires, et qu’au même moment leur salaire a baissé (maintien du brut et hausse des cotisations retraites). Ils sont donc en droit de se poser quelques questions. et qu’en ces temps d’économie budgétaire, le temps qu’ils passent à travailler sur l’open data ils ne le passent pas sur d’autres projets.

Ne soyons pas naïfs, la porte des données ne s’est pas ouverte pour nous citoyens mais pour les entreprises, mais puisque la porte est entrouverte, poussons là, on pourrait y trouver, ou imposer si nécessaire, de quoi effectivement remplir notre rôle de citoyen.

Sinon l’open data risque de n’être qu’une nouvelle version du cheval de Troie. Ou pour le dire autrement une version particulièrement bien habillée de la devise « la dépense pour le public et la recette pour le privé ».

Open-data et les formats : ouverts ou propriétaire ?

Pour finir une partie un peu plus technique avec ci-dessous les formats utilisés pour les sites consultés et une petite analyse rapide.
Légende Site formats ouverts formats propriétaires
Montpellier csv xls
ods kml
shp
Nantes csv xls
khz
shp(cc47)
shp(l93)
Paris csv xls
ods shp
txt
Rennes csv xls
dxf (l93) shp (l93)
dxf (cc48) shp (cc48)
dxf (wgs84) shp (wgs84)

Les formats ouverts odt, ods sont quasiment inexistants, ce qui est pour le moins surprenant, car les tableaux proposés sont souvent de structure simple, ne comportant pas de macro, et peuvent donc être fournis sans souci en ods. De plus quand ils le sont, ils le sont aussi en xls.

Pour les données géolocalisées pourquoi la présence de la projection wgs84, alors que la loi 99-533 du 25/06/199 impose comme format d’échange le l93 ou ccnn ? Et pourquoi en fournir plusieurs comme le fait la ville de Rennes ?

Les formats kml et shp sont des formats binaires propriétaires (respectivement Google et Esri). Pourquoi ne pas se contenter du dxf(cc48) ?

Je ne suis pas spécialiste et je ne sais pas exactement ce qu’il en est de l’ouverture des formats des données géolocalisées, mais il me semble que la démarche de l’open data pourrait être l’occasion pour les pouvoirs publics d’agir sur l’ouverture des formats, qui me paraît être une condition indispensable à une véritable ouverture des données.

Références : Rennes http://www.data.rennes-metropole.fr Nantes :http://data.nantes.fr/ Montpellier : http://opendata.montpelliernumerique.fr/ Paris : http://opendata.paris.fr/opendata/j... Département de la Saône et Loire : http://www.opendata71.fr/ Gironde : http://www.datalocale.fr/
l’adresse originale de cet article : http://danactu-resistance.over-blog...
Posté le 19 janvier 2012 par Piyou
©© a-brest, article sous licence creative common info

Posté le 27 janvier 2012