• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Rapport donneespubliques2011 ecole des ponts paristech
 

Rapport donneespubliques2011 ecole des ponts paristech

on

  • 3,988 views

Les données publiques au service de l’innovation et de la transparence : pour une politique ambitieuse de réutilisation des données publiques ...

Les données publiques au service de l’innovation et de la transparence : pour une politique ambitieuse de réutilisation des données publiques

Ce rapport met en perspective la problématique et les enjeux de l’Open Data, propose un état des lieux de la réutilisation des données publiques en France, et dessine trois scénarios prospectifs pour l’évolution future de ce mouvement. Enfin, il présente seize propositions pour une politique nationale ambitieuse d’ouverture et de réutilisation des données publiques.
Source : media.wegf.org
Ecole des Ponts ParisTech, juillet 2011

Statistics

Views

Total Views
3,988
Views on SlideShare
3,988
Embed Views
0

Actions

Likes
2
Downloads
174
Comments
0

0 Embeds 0

No embeds

Accessibility

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Rapport donneespubliques2011 ecole des ponts paristech Rapport donneespubliques2011 ecole des ponts paristech Document Transcript

    • Romain Lacombe Ecole des Ponts ParisTechPierre-Henri Bertin François Vauglin Rapport remis le 13 juillet 2011 au Ministre de l’Industrie, Alice Vieillefosse de l’Énergie et de l’Économie numérique Pour  une  politique   ambitieuse  des données  publiques Juillet Les données publiques 2011 au service de l’innovation et de la transparence
    • École des Ponts ParisTech. 2011. Pour une politique ambitieuse des donnéespubliques : Les données publiques au service de l’innovation et de la transparence.Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie,de l’Energie et de l’Economie numérique le 13 juillet 2011.
    • ! ! ! ! "#$%&!&(!)$*+(!),-.(/&#0! ! 1,22$-+!3!%,!45%56,+.$*!,78!9(,6&(!&!%:;*+&-*&+!! ,*(!%&!#,-&!7!2$-+,.%!)-$8.<,!=$>.%&!! &!(&-?.#&(!,78!#.+$@&*(!(7-!+&-<.*,78!<$>.%&(! ! 1&<.(!,7!=.*.(+-&!&!%:;*7(+-.&A!&!%:"*&-6.&!! &+!&!%:"#$*$<.&!*7<5-.B7&!! %&!CD!E7.%%&+!FGCC! ! ! )$7-!7*&!2$%.+.B7&!,<>.+.&7(&!&(! $**5&(!27>%.B7&(! ! "#$!%&(#$!)*+,-.*#$!/*!$#01-2#! %#!,3-&1/4-&!#4!%#!,/!40/$)/0#2#! ! ! ! ! ! ! !!!!!!! H7.%%&+!FGCC!
    • École des Ponts ParisTech. 2011. Pour une politique ambitieuse des donnéespubliques : Les données publiques au service de l’innovation et de la transparence.Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie,de l’Energie et de l’Economie numérique le 13 juillet 2011. Vous pouvez contacter les auteurs de ce rapport sur http://rapport-opendata-2011.fr
    • 5!)0&)&$!%#!2#!0/))&04! L’ouverture et la réutilisation des données Deux personnalités académiques expertespubliques sont des enjeux majeurs de l’action de l’économie numérique et de ses nouveauxpublique à l’ère numérique. À la croisée des modes de gouvernance, MM. Pierre-Jeanusages innovants d’Internet et des modes de Benghozi et Laurent Gille, ont acceptégouvernance collaborative les plus récents, ils d’encadrer le travail de ce groupe.ouvrent le champ à des domaines nouveaux de M. Benghozi est Directeur de recherchel’action de l’État. CNRS, Directeur du Pôle de Recherche en Ce rapport présente une étude sur la Économie et Gestion et professeur d’économieréutilisation des données publiques, menée à l’École Polytechnique (titulaire de la Chairepour la Délégation aux usages de l’Internet du Orange Innovation et Régulation des ServicesMinistère de l’Enseignement supérieur et de la Numériques), et responsable du pôleRecherche dans le cadre du Master d’Action Innovation du Master Innovation et RégulationPublique de l’École des Ponts ParisTech. de l’Économie Numérique de Télécom ParisTech. M. Laurent Gille, enseignant- Il met en perspective la problématique et chercheur au Département de Sciencesles enjeux de l’Open Data, propose un état des économiques et sociales de Télécomlieux de la réutilisation des données publiques ParisTech, est responsable du parcoursen France, et dessine trois scénarios prospectifs Industries de Réseaux du Master Innovation etpour l’évolution future de ce mouvement. Elle Régulation de l’Économie Numérique.présente seize propositions pour une politiquenationale ambitieuse d’ouverture et de Les conclusions de l’étude ont été rédigéesréutilisation des données publiques. de novembre à janvier 2011, et présentées au public le 20 janvier 2011 au Ministère de la Quatre élèves de l’École des Ponts Recherche et de l’Enseignement supérieur.ParisTech, Pierre-Henri Bertin, RomainLacombe, François Vauglin et Alice Ce rapport a été finalisé par RomainVieillefosse ont mené cette analyse de Lacombe entre mars et début mai 2011. Il neseptembre 2010 à janvier 2011, en rencontrant fait qu’évoquer les développements les plusles acteurs clés de la réutilisation des données récents, et présente une synthèse despubliques, en prenant part à des colloques évolutions qui ont eu lieu au printemps 2011internationaux, et en s’appuyant sur la en France, notamment au niveau national.bibliographie existante.Les recommandations et propositions exprimées ne reflètent que les conclusions de l’analyse menéepar les membres du groupe d’étude, et n’engagent en aucune manière leurs institutions, employeurs oucorps respectifs. Toutes les erreurs ou omissions qui subsisteraient dans ce document ne sont le fait quede ses auteurs. 1
    • 6#7#02-#7#4$! Nous tenons, très modestement, à chercheur en sciences économiques et socialestémoigner toute notre gratitude envers à Télécom ParisTech. Leurs conseils pertinentsMonsieur le Ministre de l’Industrie, de et le temps qu’ils nous ont consacré, tout aul’Energie et de l’Economie numérique, pour long de notre étude, nous ont été très précieux.avoir bien voulu nous faire l’honneur de Nous souhaitons également remercierrecevoir ce rapport sur l’ouverture et la l’équipe du Mastère d’Action Publique deréutilisation des données publiques, ainsi qu’à l’École des Ponts ParisTech pour l’opportunitéremercier Séverin Naudet, Directeur de la qu’elle nous a accordée : le directeurmission Etalab auprès du Premier ministre, Dominique Schwartz, le directeur adjointpour avoir accepté d’en présenter la synthèse, Vincent Spenlehauer et la secrétaire Sylviele 13 juillet 2011, à l’occasion du lancement du Berte.concours européen « Open Data ProximaMobile ». Nos remerciements s’adressent enfin à l’ensemble des interlocuteurs qui nous ont Nous remercions M. Bernard Benhamou, reçus ou nous ont fait part de leurs réflexionsDélégué aux Usages de l’Internet, pour sa sur le sujet des données publiques, ainsi qu’àdisponibilité, la confiance qu’il nous a toutes celles qui ont répondu à nos nombreusestémoignée, et ses conseils avisés et constructifs questions.lors de la rédaction de ce rapport. Nous tenonsaussi à remercier pour leur aide l’ensemble des Merci de nous avoir donné la chance deéquipes de la Délégation. contribuer, modestement, à la réflexion sur un sujet fondamental pour le futur de l’économie Nous remercions également M. Pierre-Jean numérique et l’avenir de notre démocratie.Benghozi, Directeur de recherche au CNRS etprofesseur d’économie à l’ÉcolePolytechnique, et M. Laurent Gille, enseignant 3
    • 6($*7(!!Les évolutions technologiques récentes ont placé le sujet de la réutilisation des données au cœur del’action publique. L’administration collecte et produit un champ très vaste de données, depuis lesbudgets des institutions publiques jusqu’aux mesures de la qualité de l’air que nous respirons, enpassant par des statistiques précises sur notre économie, notre société et nos territoires. Ouvrir l’accèsle plus large aux informations publiques, c’est tout d’abord améliorer la transparence de l’État et de sesinstitutions, éclairer le débat démocratique, et rapprocher la puissance publique des citoyens. Favoriserl’ouverture et la réutilisation de ces données (« l’Open Data »), c’est permettre à la communauté desdéveloppeurs et des entrepreneurs d’inventer de nouveaux usages et de nouvelles applications utilesaux citoyens. C’est donc encourager l’innovation, donner naissance à la société de l’information, etcontribuer au développement des secteurs stratégiques d’avenir pour notre pays, de l’économienumérique au développement durable. L’État doit s’approprier pleinement cette opportunité majeure. Illui faut prendre le virage de cette nouvelle dimension des politiques publiques, pour la mettre auservice de l’ensemble des acteurs du pays.Mots-clés : Open Data, données publiques, information publique, accès aux documents administratifs, politique publique,gouvernance ouverte, transparence, démocratie, politique industrielle, politique des technologies, innovation, recherche,entreprenariat, compétitivité, croissance, emploi, économie numérique, Web sémantique, Internet.8+$40/24!Recent evolutions of technology have placed public data at the central focus of public policy.Government collects and produces a vast array of data, from the budgets of our institutions to thequality of the air we breathe, through precise statistics on our economy, our society or our territories.Opening public sector information means improving the transparency of our Government and itsinstitutions, enlightening the democratic debate, and strengthening the bond between the nation and itsrepresentatives. Encouraging reuse of this data (« Open Data ») allows the community of Webdevelopers and Internet entrepreneurs to invent new, useful applications for citizens. It is an importantpublic policy lever in favour of innovation, which can ignite the information society and contribute tothe development of strategic sectors of the economy, from sustainable development to the growth of thedigital economy. Government must fully embrace this major opportunity and this new dimension ofpublic policy, and put its power to work at the service of the nation’s every constituent.Keywords : Open Data, public data, public sector information, freedom of information, public policy, Open Government,transparency, democracy, industrial policy, technology policy, innovation, R&D, entrepreneurship, competitiveness, growth, jobscreation, digital economy, semantic Web, Internet. 5
    • 15(7<5!,*,%@+.B7&! Les évolutions technologiques récentes ont Une évolution du cadre législatif :placé le sujet de la réutilisation des données au l’Union Européenne a adopté deux directivescœur de l’action publique. en la matière, la directive « Informations du secteur public » (PSI) en 2003 et la directive L’administration collecte et produit un INSPIRE en 2008. Une consultation publiquechamp très vaste de données, depuis les récente sur la directive PSI a notamment portébudgets des institutions publiques jusqu’aux sur l’opportunité de réviser son champmesures de la qualité de l’air que nous dapplication, les redevances et licencesrespirons, en passant par des statistiques relatives aux données, ainsi que les formatsprécises sur notre économie, notre société et électroniques utilisés.nos territoires. L’émergence de la notion politique de Ouvrir l’accès le plus large aux « Gouvernement Ouvert » : les politiques deinformations publiques, c’est tout d’abord diffusion des données publiques ont fortementaméliorer la transparence de l’État et de ses évolué dans les pays anglo-saxons du fait deinstitutions, éclairer le débat démocratique, et l’émergence de la notion d’Open Government,rapprocher la puissance publique des citoyens. thème de campagne du Président Barack Favoriser l’ouverture et la réutilisation de Obama. Les États-Unis et la Grande Bretagneces données (« l’Open Data »), c’est permettre ont créé des portails de données publiquesà la communauté des développeurs et des réutilisables, data.gov et data.gov.uk. Enentrepreneurs d’inventer de nouveaux usages. France, la mission Etalab vient d’être créée,C’est donc encourager l’innovation, et sous l’autorité du Premier ministre Françoiscontribuer au développement des secteurs Fillon, pour coordonner les administrations enstratégiques d’avenir, de l’économie matière de données publiques et mettre ennumérique au développement durable. place la future plateforme data.gouv.fr. L’État doit s’approprier pleinement cette Des initiatives citoyennes en faveur deopportunité majeure. Il lui faut prendre le l’Open Data : une série d’initiatives récentes,virage de cette nouvelle dimension des issues de la société civile et des communautéspolitiques publiques, pour la mettre au service de développeurs, s’efforcent de promouvoir lesde l’ensemble des acteurs du pays. concepts de l’Open Data, avec le soutien d’associations et de fondations comme la9#!)0&+,(7/4-.*#!/*!20&-$#7#4!%#$! Sunlight Foundation aux États Unis, l’Open(1&,*4-&$!4#2:&,&;-.*#$<!)&,-4-.*#$!#4! Knowledge Foundation (OKFN) en Grande(2&&7-.*#$!0(2#4#$=! Bretagne, et la FING, LiberTIC et Regards L’ouverture et la réutilisation des données Citoyens en France.publiques constituent désormais une attente La double rupture du Web 2.0 et desévidente de la société civile. Cette technologies mobiles : les innovations deproblématique a émergé récemment au service rendues possibles par les technologiescroisement de plusieurs évolutions profondes. 2.0 (interfaces dynamiques, cartographie en Une prise de conscience de la valeur ligne, ouverture des API) ont amené à laéconomique de la réutilisation des données : généralisation du remix et du phénomène deschaque année dans lUnion Européenne, la mashups de données. La nouvelle générationréutilisation de données issues du secteur d’applications géolocalisées sur smartphonespublic générerait un chiffre daffaires de plus repose pour une part importante sur desde 27 milliards deuros. Pour Neelie Kroes, données géographiques. Ces rupturesvice-présidente de la Commission européenne technologiques ont révélé le besoin croissantchargée de la stratégie numérique, « une de pouvoir réutiliser des données publiques.grande partie de ces informations, en Europe, Toutes ces évolutions récentes confèrentsont sous-exploitées. Nous devons examiner une actualité nouvelle à la problématique de lalopportunité de modifier les règles de lUnion réutilisation des données publiques.en matière de réutilisation, pour libérerpleinement leur potentiel économique ». 7
    • 9#!&))&04*-4(!7/>#*0#!)&*0!,3?4/4!#4! 9#!7-$#!#!@*10#!2&7),#A#!.*-!)&*00/-4!B40#! ,3/%7--$40/4-&! $-7),-C-(#! L’ouverture des données publiques permet Le cadre juridique est établi pour la à des entrepreneurs, des chercheurs, des majorité des données publiques, mais les types développeurs d’accéder aux données collectées de licences et de contrats se multiplient. Le dans le cadre du fonctionnement des statut des données issues d’organismes administrations. parapublics reste à préciser. L’interopérabilité technique et juridique est cruciale : il convient En les réutilisant, ils inventent de nouveaux de clarifier les formats et les licences usages et peuvent créer de nouvelles acceptables dans une optique d’encouragement applications utiles aux citoyens. Cette à l’ouverture et à la réutilisation. coproduction de services au public peut constituer la base d’une nouvelle relation La gratuité pour la réutilisation des numérique de l’administration à l’usager, et données à titre commercial favorise d’un fonctionnement plus efficace de la l’innovation et les nouveaux usages. Nous puissance publique. préconisons donc de la généraliser le plus possible, et d’éviter à tout prix la L’ouverture des données publiques est de multiplication et le maintien de redevances plus un outil puissant d’amélioration de la excessives, qui pourrait conduire à des transparence de l’État. En donnant à tous les incohérences et freiner la réutilisation. citoyens qui le souhaitent accès aux détails du fonctionnement des institutions publiques, D#$!0-$.*#$!$*07&4/+,#$! cette ouverture nourrit et éclaire le débat démocratique. Elle peut contribuer à fonder les Esquissées dans la loi 1978 sur l’accès aux choix politiques sur des analyses éclairées et documents administratifs, consacrées par deux ancrées dans le réel. directives européennes, l’ouverture et la réutilisation des données publiques s’inscrivent Enfin, un accès plus large aux données dans une évolution durable de nos sociétés. publiques peut contribuer à renforcer la confiance des consommateurs, et donc la Elles induisent une transformation de la stabilité de notre économie. culture et du mode de fonctionnement des administrations. Des freins au changement 9!&*4-,!$40/4(;-.*#!)&*0!&40#!(2&&7-#! subsistent, et des risques peuvent émerger. Rien n’indique cependant qu’ils ne puissent Des conditions de réutilisation plus libres être surmontés, surtout si l’État s’engage dans encourageraient l’innovation et pourraient une collaboration rapprochée avec la contribuer au développement de l’économie communauté des réutilisateurs. numérique : les nouveaux services et applications mobiles, qui en bénéficieraient E0&-$!/A#$!$40/4(;-.*#$!)&*0!C/1&0-$#0!,/! particulièrement, connaissent actuellement une 0(*4-,-$/4-&!%#$!%&(#$!)*+,-.*#$! très forte croissance. L’économie numérique est un facteur clé de croissance économique et Nous proposons les trois axes stratégiques de création d’emplois en France. suivants pour favoriser la réutilisation des données publiques et permettre à la société L’accès aux données publiques offre de d’en retirer l’ensemble des bénéfices attendus. plus les prémisses d’une « infrastructure informationnelle », qui pourrait faciliter le Simplifier pour accélérer : réduire les développement durable en permettant aux efforts nécessaires d’une part à la diffusion des consommateurs de faire des choix mieux données par les acteurs publics, et d’autre part informés. à leur réutilisation, afin d’accélérer le développement de services utiles à partir des Enfin, la réutilisation des données données publiques. publiques constitue un élément de soutien aux objectifs stratégiques d’investissement Faciliter l’expérimentation : adapter les d’avenir pour l’économie française, de la conditions de réutilisation des données société numérique aux villes de demain, aux publiques pour faciliter l’expérimentation par transports intelligents, en passant par les citoyens, les associations et la communauté l’encouragement à la recherche scientifique et des développeurs et des entrepreneurs. à l’innovation. Favoriser l’émergence d’un écosystème : favoriser l’émergence d’un écosystème de producteurs et de réutilisateurs de données publiques en France, autour de la mission Etalab et du futur portail data.gouv.fr.8
    • F#-G#!)0&)&$-4-&$!)&*0!*#!)&,-4-.*#!/4-&/,#! 6. Impliquer des acteurs publics pilotes dans/7+-4-#*$#!%#$!%&(#$!)*+,-.*#$! les projets de recherche sur le Web Ce rapport formule seize propositions, sémantique.articulées selon les trois axes stratégiquesprécédents. Elles sont présentées de manièredétaillée au chapitre 8, et visent à proposer une 7. Rendre la réutilisation des donnéesfeuille de route claire pour mettre en place une gratuite pour toute réutilisation à titrepolitique ambitieuse des données publiques. personnel. 8. Encadrer strictement les cas dans lesquels1. Formaliser les bonnes pratiques de une redevance est légitime, et charger lesdiffusion des données publiques attendues producteurs de données d’établir l’absoluepar la communauté des réutilisateurs : nécessité de toute tarification : • Expliciter l’effort minimal attendu des • Dépasser une valorisation purement différents acteurs publics. commerciale des données publiques et • Assurer la formation des agents et leur encourager leur réutilisation la plus accès à des guides clairs et explicatifs. large. • Simplifier les formats de diffusion. • Généraliser la réutilisation libre et gratuite la plus large possible.2. Mettre en cohérence les conditions légales • Restreindre la tarification à coûtsde réutilisation des données issues de moyens aux marchés matures.sources différentes : • Établir une « licence données ouvertes » 9. Conditionner toute redevance pour pour réutilisation gratuite qui réutilisation de données à valeur ajoutée à la s’appliquerait le plus largement possible. mise à disposition gratuite des données • Encourager un marquage graphique des brutes qui les sous-tendent. droits de réutilisation. 10. Explorer des conditions alternatives de3. Encourager l’utilisation de formats réutilisation pour laisser carte blanche àfacilement réexploitables, qui respectent les l’expérimentation :normes d’interopérabilité et de « lisibilité • Privilégier les partenariats avec lesmachine » : nouveaux acteurs de l’innovation. • Privilégier les formats ouverts respectant • Explorer les licences gratuites avec les normes d’interopérabilité. partage des conditions initiales à • Communiquer auprès des agents sur l’identique (share alike). l’importance des formats réexploitables. • Explorer la rémunération par l’accès aux • Maintenir une liste de formats données d’usage. correspondants à ces critères. • Explorer la rémunération par le service client.4. Faire en sorte que chaque contrat public • Faciliter l’expérimentation avec les Webclarifie à l’avenir le financement de Services.l’ouverture et les droits de réutilisation liésaux données produites dans son cadre : 11. Impliquer la communauté des • Clarifier le financement de louverture et réutilisateurs dans les initiatives de mise à les droits de réutilisation de données disposition de données publiques : dans les contrats publics. • Créer un point d’accès unique centralisé • Établir des bonnes pratiques et des et mis à jour automatiquement. clauses types. • Développer une offre grand public qui • Élargir le périmètre des données mette en valeur des applications utiles. réutilisables aux ressources essentielles. • Investir dans l’accompagnement de la communauté.5. Faciliter l’enrichissement des données et • Démultiplier le service aux utilisateurs.l’intégration de corrections éventuelles par • Organiser des séminaires ou ateliers dela communauté : travail ponctuels sur les sujets • Faciliter l’intégration des métadonnées. techniques d’intérêt pour la • Permettre l’enrichissement collectif des communauté. jeux de données. 9
    • 12. Mettre en place des assises des données • Illustrer la réutilisation des données publiques et animer la communauté des publiques par le développement de réutilisateurs : services aux citoyens. • Regrouper l’ensemble de l’écosystème • Faire des données et de leur réutilisation pour des assises des données publiques. un outil d’éclairage du débat public. • Animer la communauté des 15. Développer une stratégie nationale à réutilisateurs. partir du rôle de coordination des 13. Encourager le développement institutions publiques de la mission Etalab : d’applications à partir des données • Mutualiser des solutions de mise en publiques : ligne pour les administrations et les • Organiser un concours national de collectivités. développement d’applications. • Développer une stratégie nationale pour • Prendre en compte la réutilisation des les données publiques. données publiques dans les appels à projets de R&D numérique. 16. Élargir le champ de l’Open Data : • Pérenniser l’offre d’applications créées à • Élargir le champ de la libre réutilisation partir des données publiques. des données publiques. • Explorer l’application de l’Open Data 14. Intégrer au débat démocratique les aux entreprises privées. données publiques et leur réutilisation : • Développer une stratégie européenne et • Communiquer aux administrations internationale. l’importance des données pour mettre en lumière leurs métiers.10
    • /,>%&!&(!<,+.I-&(!Résumé analytique__________________________________________________________________ 7Table des matières _________________________________________________________________ 11Introduction ______________________________________________________________________ 13Partie 1. « Open Data » : Contexte et enjeux d’une question sociétale ________________________ 17Chapitre I. Données publiques : émergence d’une question sociétale __________________________ 19 1. La donnée au cœur des nouveaux usages ___________________________________________ 19 2. Les données publiques et leur réutilisation __________________________________________ 21Chapitre II. La libre réutilisation des données publiques à l’international ______________________ 25 1. Le mouvement Open Data _______________________________________________________ 25 2. États-Unis : initiatives locales, puis démarche fédérale_________________________________ 26 3. Grande Bretagne : une impulsion transpartisane du gouvernement________________________ 28 4. Situations contrastées en Europe __________________________________________________ 30Chapitre III. Les enjeux de la réutilisation des données publiques ____________________________ 33 1. Démocratie, transparence et débat public ___________________________________________ 33 2. Modernisation de l’État _________________________________________________________ 34 3. Innovation et soutien à l’économie numérique _______________________________________ 35 4. Des données stratégiques pour l’économie __________________________________________ 38 5. Un nouveau mode d’action publique _______________________________________________ 42Partie 2. État des lieux de la réutilisation des données publiques en France _____________________ 47Chapitre IV. Le cadre de la réutilisation des données publiques en France _____________________ 49 1. Le cadre juridique pose en principe la liberté de réutilisation ____________________________ 49 2. Les acteurs de la réutilisation de données publiques ___________________________________ 53 11
    • Chapitre V. Premières expériences d’ouverture des données publiques en France ________________ 57 1. La réutilisation des données dans les collectivités territoriales ___________________________ 57 2. L’ouverture des données au niveau national : trois études de cas _________________________ 62 3. La mise en place d’une politique nationale des données publiques________________________ 65 Partie 3. Comment favoriser la réutilisation des données publiques ?__________________________ 69 Chapitre VI. Abaisser les barrières à la réutilisation _______________________________________ 71 1. Répondre aux contraintes techniques ______________________________________________ 71 2. Gérer la complexité juridique ____________________________________________________ 72 3. Anticiper l’impact organisationnel ________________________________________________ 74 4. Établir des modèles économiques propices à l’innovation ______________________________ 75 Chapitre VII. Prospective : Trois scénarios pour l’avenir ___________________________________ 83 1. « Inertie » : Développement de l’offre de données publiques à son rythme historique _________ 83 2. « Capture » : Des monopoles informationnels se substituent à la puissance publique _________ 85 3. « Symbiose » : Catalyser le développement d’un écosystème____________________________ 87 Chapitre VIII. Seize propositions pour une politique ambitieuse des données publiques ___________ 91 1. Simplifier pour accélérer ________________________________________________________ 91 2. Faciliter l’expérimentation pour encourager l’innovation _______________________________ 94 3. Soutenir l’émergence d’un écosystème _____________________________________________ 96 Bibliographie ____________________________________________________________________ 101 Textes règlementaires _____________________________________________________________ 105 Interlocuteurs____________________________________________________________________ 107 Liens et références ________________________________________________________________ 10912
    • ;*+-$7#+.$*! « Si l’on partage des données sur le Web, des données publiques, des données scientifiques, des données citoyennes, quelles qu’elles soient, d’autres que nous sauront en tirer des créations merveilleuses que nous n’aurions jamais imaginées. » Tim Berners-Lee, Inventeur du Web Hal Varian, Économiste en Chef chez inventer de nouveaux usages. Tous typesGoogle, le précise : « Je répète sans cesse que d’objets numériques sont concernés : desla profession sexy dans les dix prochaines tableaux chiffrés, des mesures numériques, desannées, ce sera statisticien. Et ce n’est pas de bases de données, des cartes ou encore desl’humour.1 » jeux de données géolocalisées. On peut émettre des réserves quant au Les applications en question vont despouvoir de séduction d’un tableur services les plus simples aux plus complexes,informatique ; il reste que l’attrait de la science de l’expérimentation au produit professionnel :des données s’est considérablement accru ces des étudiants développent une applicationdernières années. Ses algorithmes ont gagné en mobile, des citoyens quantifient l’action depuissance et ses applications jouent un rôle leurs députés, des journalistes créent decentral dans la société de l’information. nouvelles infographies plus instructives, une entreprise calcule des itinéraires de transports À mesure que nos outils informatiques publics au service des internautes.deviennent plus mobiles, leurs applicationsgagnent en importance dans nos vies Les développements technologiquesquotidiennes. En recoupant des données récents ont largement accéléré lenumériques diverses, en les adaptant à notre développement de ce phénomène, et lesusage à travers une ergonomie simple, les attentes d’une partie du public sont aujourd’huismartphones et les tablettes tactiles simplifient très fortes.bon nombre des tâches de la vie quotidienne etprofessionnelle. 9#!)0&+,(7/4-.*#!&*1#,,#!#4!2&7),#A#!)&*0! ,#!$#24#*0!)*+,-2!"/!0(*4-,-$/4-&!%#$!%&(#$!)*+,-.*#$! La réutilisation des données publiques offre Un mouvement de réutilisation des données des possibilités nouvelles à la sphère publique.publiques2 a vu le jour depuis plusieurs années. Elle appelle une évolution de la culture et duConcrètement, il s’agit pour des développeurs mode de fonctionnement des administrations.informatiques ou tout autre citoyen d’accéder à Elle soulève surtout de nombreuses questions.des données produites initialement dans le Quelles opportunités ? Quels risques ?cadre du fonctionnement de l’État, et de leur Quelles pistes pour en faire profiter au mieux la société ? Quels enseignements tirer de1 l’expérience d’autres pays en la matière ? Steve Lohr. 5 août 2009. « For Today’s Graduate, One Quel(s) public(s) cette politique vise-t-elle,Word: Statistics ». The New York Times.http://www.nytimes.com/2009/08/06/technology/06stats.ht avec quels objectifs et quels moyens ? Quellesml limites et quelles garanties donner au droit à la2 À l’exclusion bien sûr des données personnelles et des réutilisation ?données confidentielles (loi de 1978 sur la liberté d’accésaux documents administratifs, modifiée par Ordonnancen°2005-650 du 6 juin 2005). 13
    • 9#!&))&04*-4(!-7)&04/4#!)&*0!,#! 2011 dans le monde, et un historique des %(1#,&))#7#4!%*!*7(0-.*#! évolutions récentes dans les pays occidentaux Grâce aux réseaux mobiles à haut débit, la (chapitre 2). connectivité devient ubiquitaire. Les nouvelles Nous nous attachons ensuite à cerner les plateformes mobiles permettent désormais bénéfices que l’on peut attendre d’une d’accéder en direct à des services ou des politique de soutien à la réutilisation des informations dans le contexte dans lequel données publiques. Nous évoquons les enjeux ceux-ci sont le plus utiles. Ces évolutions ont liés à la participation démocratique et à donné naissance à une industrie nouvelle et en l’efficacité de l’action publique. Nous forte croissance, celle des applications explicitons les différents mécanismes à travers mobiles. lesquels la donnée publique peut contribuer au Des acteurs internationaux du Web ont su développement économique (chapitre 3). prendre des positions fortes sur ce marché. La France possède des atouts pour réussir dans ce "/!0(*4-,-$/4-&!%#$!%&(#$!)*+,-.*#$!#! I0/2#! secteur. Faciliter l’accès aux données publiques en vue d’une réutilisation Une deuxième partie fait ensuite le point commerciale pourrait favoriser la création sur la réutilisation des données publiques en d’activités économiques novatrices. France aujourd’hui (chapitre 4). 9!%(+/4!)/$$-&(! Le chapitre suivant vise à fournir aux agents publics des pistes et références à partir Opportunité de développement économique desquelles construire leur réflexion. Nous et avancée en matière de transparence d’une cherchons en particulier à comprendre le part, érosion potentielle de la capacité d’action contexte de cette politique, son cadre juridique de l’État et de ses ressources propres de et technique, et les acteurs qu’elle met en jeu l’autre : la tarification de la réutilisation des (chapitre 5). données publiques est l’objet d’âpres débats, quand elle ne donne pas lieu à des contentieux. H&77#4!C/1&0-$#0!,/!0(*4-,-$/4-&!%#$! %&(#$!)*+,-.*#$!J! L’ouverture des données elle-même peut faire peur, quand ce n’est pas Le mouvement de réutilisation de données l’incompréhension quant à l’intérêt d’un droit étant durablement amorcé, il convient de à la réutilisation de données qui interpelle. s’interroger sur les difficultés auxquelles il risque de se heurter dans l’administration, les 9!7&*1#7#4!#;/;(!$*0!,#!,&;!4#07#! établissements publics et les collectivités : difficultés d’ordre juridique, organisationnel, La mise à disposition des données technique et financier. Nous abordons la publiques pour leur réutilisation n’est pourtant question de la tarification optimale, et des pas un effet de mode : il s’agit d’un droit modèles économiques qui doivent s’appliquent opposable consacré par la loi, basé sur une aux données publiques (chapitre 6). Directive de 2003 que la Commission Européenne envisage d’étendre et de renforcer. À partir des dynamiques en présence, nous avons imaginé trois scénarios futurs pour la Cette évolution engagée confronte chaque réutilisation des données publiques : l’Inertie, administration centrale, chaque collectivité la Capture et la Symbiose. Nous détaillons les locale, chaque établissement public à des caractéristiques et les implications de chacun questions difficiles. Qu’attend-on d’eux de ces futurs possibles (chapitre 7). exactement, et comment bien faire ? H&2,*$-&$!#4!0#2&77/%/4-&$! H&4#A4#!#4!#>#*A!%3*!$*>#4!%#!$&2-(4(!! Le scénario de la Symbiose et du Le premier chapitre s’attelle à esquisser un développement d’un écosystème présente de portrait synthétique des grandes évolutions qui loin le plus d’avantages : travailler à ont amené la question des données publiques à l’ouverture des données publiques en devenir, en l’espace de quelques années, un collaboration avec la communauté de ceux qui véritable sujet de société. Nous passons les réutilisent est une nécessité pragmatique notamment en revue les évolutions plus qu’un choix idéologique. technologiques récentes qui l’ont portée sur le devant de la scène (chapitre 1). Pour que la société puisse tirer l’ensemble des bénéfices potentiels de la réutilisation des Le second chapitre dresse un état des lieux données publiques, il convient cependant de la réutilisation des données publiques en14
    • d’encourager son développement au rythme le développement de services utiles à partir desplus rapide. données publiques. Nous proposons enfin (chapitre 8) seize Faciliter l’expérimentation : adapter lespropositions groupées en trois axes conditions de réutilisation des donnéesstratégiques, visant à établir une feuille de publiques pour faciliter l’expérimentation parroute claire vers une politique ambitieuse des les citoyens, les associations et la communautédonnées publiques. des développeurs et des entrepreneurs. Simplifier pour accélérer : réduire les Favoriser l’émergence d’un écosystème :efforts nécessaires d’une part à la diffusion des favoriser l’émergence d’un écosystème dedonnées par les acteurs publics, et d’autre part producteurs et de réutilisateurs de donnéesà leur réutilisation, afin d’accélérer le publiques en France, autour de la mission Etalab et du futur portail data.gouv.fr. 15
    • ),-+.&!CJ!K!K)#!D/4/!L!M!!N$*+&8+&!&+!&*E&78!:7*&!B7&(+.$*!($#.5+,%&! 17
    • N0,2.+-&!;J! 4$**5&(!27>%.B7&(!M!5<&-6&*#&!:7*&!B7&(+.$*!($#.5+,%&! Les évolutions technologiques récentes ont avait pour but de faciliter l’accès et lerendu possible le partage rapide et aisé de tous référencement de documents en symbolisanttypes de données. Elles réactivent, sous un jour leur manipulation sous forme de phrases, liantnouveau, le débat déjà ancien sur l’accès aux verbes intuitifs (lire, afficher, remplacer,documents administratifs, maintenant sous effacer) et métadonnées d’adressage universelforme électronique et bien plus aisément (URL ou Uniform Resource Locator5).diffusables. Bien que basées sur un réseau d’échange de L’Internet a fait apparaître une économie documents, les techniques du Web ontdes données. Les stratégies de croissance des naturellement développé un tropisme de plusacteurs du Web, via l’ouverture de leurs en plus marqué vers les données elles-mêmes.interfaces de programmation (API), ont illustré L’introduction des bases de donnéesle potentiel de la réutilisation des données, et relationnelles dans les outils de développementsuscité des attentes similaires des développeurs a permis la création de sites dynamiques, c’est-vis-à-vis du secteur public. Ils exercent une à-dire dont les pages s’adaptent auxpression pour que les États, en facilitant l’accès circonstances (évolutions de prix, listesà leurs informations, s’insèrent et tiennent leur d’objets changeants, « unes » de journauxrang dans ce « Web des Données ». électroniques mises à jour fréquemment). À partir de 2004, une technique émergente a vu Ces ruptures technologiques ont le jour qui consiste à utiliser les fonctionnalitésaccompagné par ailleurs une prise de de scripting6 présentes dans les navigateursconscience de l’importance des données pour permettre la mise à jour en temps réel deproduites par l’administration et le secteur pages déjà chargées, en allant chercher enpublic. La possibilité novatrice de réutiliser ces tâche de fond des données remises à jour.données sous forme brute, pour leur trouver de Nommée AJAX7 pour JavaScript Asynchronenouveaux usages utiles et instructifs, a abouti à et XML (Asynchronous Javascript And XML),l’émergence de la question des données à partir du langage de scripting JavaScript etpubliques en tant que véritable question du format d’échanges de données XML, cettesociétale. technique à la croisée de différentes technologies Web est reconnaissable derrièreCJ O,!$**5&!,7!#P7-!&(! des applications Web hautement réactives dont les pages ont rarement besoin d’être rafraîchies*$7?&,78!7(,6&(! – telles que GMail8, Quora9 ou Facebook10. Internet et les ruptures technologiquesrécentes on fait apparaître une nouvelle« économie des données ». http://www.w3.org/People/Berners-Lee/ 5 World Wide Web Consortium (W3C). 1994. Uniform Resource Locators (URL) : A Syntax for the Expression ofL-M "#!N#+!#$4!$40*24*0(!/*4&*0!%#!,3(2:/;#!%#! Access Information of Objects on the Network.%&(#$=! http://www.w3.org/Addressing/URL/url-spec.txt 6 Capacité d’un navigateur à faire tourner dynamiquement Le génie informatique (computer science un programme qui agit en temps réel sur la page affichée.dans le monde anglo-saxon) est défini comme Par exemple, une page qui affiche l’heure repose sur unla manipulation algorithmique de données et de script qui demande au navigateur de mettre à jour l’heure, les minutes et les secondes à mesure qu’elles s’écoulent.leurs structures de représentation. Le Web, Dans le cas d’un service de courrier en ligne, c’est souventavant d’être un phénomène social, est une un script qui réagit au click sur l’intitulé d’un email etarchitecture logicielle3 conçue par un change l’affichage pour détailler le contenu du mail plutôtchercheur britannique en physique des hautes que celui de la boîte de réception. C’est aussi un script qui vérifie automatiquement l’arrivée de nouveaux courriersénergies au CERN, Sir Tim Berners-Lee4. Elle en tâche de fond, et réintègre éventuellement ces nouvelles données dans le corps de la page affichée. 7 Garrett, J.J. 18 février 2005. « Ajax : A New Approach3 World Wide Web Consortium (W3C), 2010, HTTP – To Web Applications ».Hypertext Transfer Protocol Overview – draft 09. http://www.adaptivepath.com/ideas/essays/archives/00038http://www.w3.org/Protocols/ 5.php4 8 World Wide Web Consortium (W3C). Sir Tim Berners- GMail, service de boîte de courrier électronique en ligneLee: Bio. Téléchargée le 10 janvier 2011. de Google, Inc. : http://www.gmail.com 19
    • Pour supporter cette technologie, de plus en gagne en utilité pour ses utilisateurs, et le plus d’applications en ligne ont développé à la système producteur voit sa position fois deux interfaces : une interface graphique compétitive renforcée par la dépendance classique accessible aux utilisateurs à travers accrue du marché à ses services. En l’essence, leur navigateur, et une interface exclusivement c’est une transaction de marché où l’accès à consacrée aux machines, qui permet justement des données est échangé contre leur diffusion à au moteur de scripting du navigateur de un nouveau public ou dans un nouveau récupérer des données à la volée. C’est cette contexte. interface, qu’on peut se représenter comme un L’exposition d’une interface API est protocole d’échange de données de machine à aujourd’hui une étape presque obligée du machine, qu’on appelle interface de développement d’un nouveau produit en ligne. programmation ou API (sigle anglophone pour La généralisation de ce phénomène est d’une Application Programming Interface). grande importance pour la question des données publiques, car elle a permis de prendre L--M "/!%&(#<!7&/-#!%3(2:/;#!#4!,#1-#0! %3-C,*#2#!$*0!,#!N#+=! conscience de l’omniprésence des données derrière les services qu’utilisent Les API sont devenues un véritable outil quotidiennement les internautes. stratégique pour les sociétés de services en ligne.11 Par exemple, c’est dans une large En un mot, « l’économie des données » mesure grâce à l’ouverture de leur API12 que s’est construite autour de l’échange et de la Twitter a pu permettre à une communauté de fluidité sur le Web : les données ont souvent développeurs de se créer, et de multiplier les plus de valeur comme outil d’échange et applications permettant d’utiliser le service en d’influence qu’isolées au sein des entrepôts de dehors du site Web principal (notamment dans données des entreprises13. les premiers jours de l’App Store d’Apple durant l’été 2008). Ce grand nombre L---M 81#2!,#!N#+!O=P<!,/!%&(#!%#1-#4! 2&,,#24-1#! d’applications a servi de « force de vente » virtuelle pour Twitter, et est un des facteurs Un corollaire de la montée en puissance de principaux qui expliquent son succès la donnée est son rôle de liant social sur le populaire. Web. En particulier, avec l’apparition de phénomènes de collaboration de masse tels que Bien documentées et basées sur des Wikipedia, on s’aperçoit que l’échelle standards acceptés (tels que JSON ou XML) d’échanges rendue possible par Internet ouvre pour éviter les problèmes d’interopérabilité, des possibilités insoupçonnées jusqu’alors. ces interfaces s’adressent à des développeurs informaticiens. Selon le degré d’ouverture Des services tels que Delicious (site de (fonction des choix stratégiques de la société) partage de bookmarks, qui agrège les et les conditions de licences (souvent conçues catégories dans lesquelles les utilisateurs pour encourager la réutilisation) consentis à rangent différents liens, et permet ensuite de ces derniers, ils peuvent extraire, trouver des liens par catégorie d’intérêt) ou éventuellement modifier, et transformer les Flickr (qui permet de chercher des données du service Web en question, pour les photographies libres de droits sur un sujet réutiliser, notamment à la construction de particulier, en se basant sur les tags de nouveaux services ou de nouvelles catégorisation produits par l’ensemble des applications. utilisateurs) ont ainsi profité de ce phénomène de folksonomy, la taxonomie par les foules ou L’échange est mutuellement bénéfique : le classification par l’intelligence collective14. nouveau service, consommateur de données, D’autres services tels qu’Amazon ou Netflix ont, eux, profité de la masse 9 Quora, Inc., site de questions et réponses dynamique caractérisé par l’expertise pointue de sa communauté d’utilisateurs, fondé en 2009 et qui a connu une très forte 13 Ed Parsons - Geospatial Technologist for Europe, croissance en 2010 : http://www.quora.com 10 Facebook, Inc., le réseau social dominant qu’on ne Middle East and Africa chez Google, au séminaire présente plus, fondé par Mark Zuckerberg en 2004 et « Innovations et développement du secteur de approchant 600 millions d’utilisateurs début 2011 : l’information géographique » organisé le 5 octobre 2009 à http://www.facebook.com la Grande Arche de la Défense par le Conseil National de 11 Shah S., 28 August 2010, « Cannibalize Business l’Information Géographique (CNIG), l’AFIGÉO et Development by Popularizing your API » : l’Institut des Sciences et des Techniques de l’Équipement http://shaivalshah.com/cannabilize-business-development- pour le Développement (ISTED) by-populariz 14 12 Entretien le 12 novembre 2010 avec Henri Verdier, Tapscott, D. and Williams, A. 2006. Wikinomics : How Président de Cap Digital. Mass Collaboration Changes Everything.20
    • d’utilisateurs se servant de leurs sites pour en « différentes sources au sein d’une seuleextraire des modèles de préférences des plateforme, (…) l’une des facettes du designconsommateurs, qui leur permettent de faire collaboratif sur le Web17 ». Cette nouvelledes recommandations hautement tendance a connu un tel succès au tournant despersonnalisées selon les goûts de leurs clients. années 2006 à 2008 que le prestigieux Museum of Modern Art de New York y a L’un des enseignements de la nouvelle consacré une exposition phare18.incarnation sociale et collaborative du Web,c’est que la valeur des données n’est pas Au-delà de l’incidence culturelle de ceintrinsèque, mais dérive de leur agrégation, de phénomène19, la réappropriation du local et deleur recoupement, de leur analyse et de la l’espace géographique par le biais du Web etréutilisation qui en est faite. du mobile annonçait l’importance croissante de la donnée informatique géographique, et, au- Le Web a ainsi mis à jour une économie delà, l’émergence du phénomène culturel dudes données, qui joue un rôle de monnaie remix et de la réutilisation des données.d’échange parmi les entreprises d’Internet etles services en ligne. FJ O&(!$**5&(!27>%.B7&(!&+!L-1M D&(#$!;(&;0/):-.*#$!#4!Q!7/$:R*)$!S! %&7-!-57+.%.(,+.$*! L’autre développement technologique qui aconduit à prendre conscience de l’importance La génération des digital natives, qui ades données, c’est la démocratisation de grandi dans l’habitude de la réutilisation, dul’information géographique. remix et de la recombinaison permanente, devait nécessairement s’intéresser aux Google indique par exemple que son informations collectées par l’État.approche est « d’utiliser la géographie pour L’émergence de la réutilisation des donnéesorganiser toute l’information mondiale, qu’elle publiques comme sujet de société, poussée parsoit géographique ou non. C’est un principe les nouveaux usages, a révélé une chaîne ded’organisation qui sera utilisé pour mieux valeur fondée sur ces données qui, lorsqu’ellescomprendre l’information. »15. sont mises à disposition de façon brute et Si les briques technologiques sont réexploitable, permet aux développeurs et auxdisponibles pour utiliser et manipuler la entrepreneurs de créer de nouveaux services.donnée géographique à loisir, ou même pourl’utiliser pour structurer d’autres données, le L-M "#$!%&(#$!*7(0-.*#$!&4!1&2/4-&!T!,/! %-CC*$-&!,/!),*$!,/0;#!défi qui reste posé est celui de la constitutiond’une véritable infrastructure des données Contrairement aux documents papiers dontgéographiques. Ces données sont aujourd’hui l’impression engendre des coûts variablesaccessibles en nombre et de qualité, mais les conséquents et qui nécessitent des délais derepérer et les réutiliser peut rester obscur et traitement et d’acheminement, les donnéescomplexe16. numériques ont un coût marginal de diffusion nul ou presque20, et sont accessibles quasiment Conséquence récente des évolutions du instantanément.Web, des applications cartographiquespuissantes réservées jusque-là à des experts Le travail éventuel de mise à disposition desont devenues accessibles à tous. Le monde du données numériques est donc un coût fixe : laWeb collaboratif a largement repris à son diffusion la plus large, en distribuant ce coût,compte la possibilité de représenter des est donc le modèle le plus efficace d’un pointdonnées sur des cartes. Grâce à l’ouverture de vue économique.gratuite (dans des limites relativement largesde volume) de son API, Google Maps estdevenu une base de choix pour la création de 17 Google Earth mashups 5 of 14, in « Design and the« mashups », ces applications Web combinant Elastic Mind. » Museum of Modern Art. New York, NY. 2008. http://www.moma.org/interactives/exhibitions/2008/elastic15 Ed Parsons – Ibid. mind/#/98/16 18 Voir l’intervention de Max Craglia, coordonateur « Design and the Elastic Mind. » Museum of Moderntechnique d’Inspire pour la Commission Européenne Art. New York, NY. 2008.(centre commun de recherche) au séminaire « Innovations http://www.moma.org/interactives/exhibitions/2008/elasticet développement du secteur de l’information mind/ 19géographique » organisé le 5 octobre 2009 à la Grande Lessig, L. 2009. Remix : Making art and commerceArche de la Défense par le Conseil National de thrive in the hybrid economy. http://remix.lessig.org/ 20l’Information Géographique (CNIG), l’AFIGÉO et Les volumes qui peuvent être atteints font que le coût del’Institut des Sciences et des Techniques de l’Équipement diffusion n’est en revanche pas négligeable et peut danspour le Développement (ISTED). certains cas devenir important. 21
    • L’instantanéité de diffusion et l’ubiquité riches et très variées ; certaines ont une forte d’accès offrent de plus des perspectives tout à valeur économique. Le marché de fait nouvelles en terme de périmètre de l’information est estimé en France à diffusion et d’audience potentielle, notamment 3,7 milliards d’euros dont 60 % sont des au regard de la démocratisation de l’Internet. données publiques21. Au niveau européen, ce chiffre représenterait près de 27 milliards L--M H&7+-#0!,#$!%&(#$!+0*4#$!/7),-C-#!,#*0! d’euros22 par an. )&4#4-#,! La valorisation passe par différentes étapes Marqué par les traditions et les habitudes nécessaires pour rendre les données publiques d’un monde de communication par le papier, utilisables ou réutilisables. D’une part l’État diffuse le plus souvent ses informations l’institution productrice doit définir sous forme de « produits finis », tels que des précisément quelles données elle doit diffuser analyses, des pages Web explicatives ou des en ligne et de quelle manière, par un travail rapports écrits – en quelque sorte des données d’analyse et de collecte. S’imposent à ce stade « retravaillées » afin d’être intelligibles par le respect de critères de bon sens comme la tous. À l’inverse, les données brutes qui sous- protection de la vie privée, de la propriété tendent ces études sont rarement mises à intellectuelle des tiers, ou de la sécurité disposition du public, car leur intérêt pour une nationale. réutilisation potentielle est encore très inégalement perçu par les producteurs de D’autre part, pour faciliter la réutilisation, données publiques. l’institution productrice doit s’assurer de fournir une donnée qualifiée et mise à jour. Aujourd’hui, les technologies de Pour cela, il semble important de créer des lots l’information permettent une mise à de données cohérents et de s’assurer de la disposition des données à l’état brut. Loin présence d’une légende et plus généralement d’être un obstacle à leur réutilisation de la présence des métadonnées. ultérieurement à leur mise à disposition par l’administration, leur caractère brut permet au Il faut les mettre à disposition via un contraire de les recombiner plus facilement, ce support adapté mais en réalisant un catalogage qui amplifie leur potentiel et permet la création précis : il ne suffit pas de mettre à disposition de services impossibles à réaliser sans ces des données, encore faut-il qu’elles puissent croisements. être découvertes et facilement accessibles grâce à un portail de données publiques ou un Par exemple, des mesures locales de bruit moteur de recherche. permettent de mettre en perspective la corrélation positive mesurée entre les dépenses Enfin, les données publiques numériques mises énergétiques d’un ménage et son taux à disposition peuvent être réutilisées par la d’équipement en doubles vitrages, paradoxale communauté des développeurs et des au premier abord. Dans le cadre d’un concours entrepreneurs, qui peuvent leur inventer de organisé par la ville de Washington, D.C., des nouveaux usages. Ces données représentent données sur les vols, croisées avec les tracés aussi un outil interne au service des des pistes cyclables, ont aussi permis de créer administrations, qui peut leur permettre des une carte des zones à éviter pour les cyclistes. échanges d’information plus fluides et efficaces. Parce qu’elle favorise ces croisements et ces combinaisons fertiles sur des sujets L-1M "/!1-$*/,-$/4-&!%#!%&(#$!>&*#!*!0V,#! recoupant des champs extrêmement vastes de $40*24*0/4! l’économie, de la société et de Les données géographiques ont un rôle l’environnement, la mise à disposition des structurant dans la chaîne de valeur. Elles données brutes de l’État et des collectivités est rendent possible la spatialisation et la un terreau fertile pour des réutilisateurs, qui visualisation sur carte d’autres jeux de peuvent inventer de nouveaux usages à ces données, notamment géolocalisées. Selon données. l’Association Française pour l’Information L---M "#$!%&(#$!)*+,-.*#$!#4!,#*0!0(*4-,-$/4-&! $&4!T!,3&0-;-#!%3*#!2:/U#!%#!1/,#*0! 21 http://www.rgpp.modernisation.gouv.fr/index.php?id=51 &tx_ttnews[tt_news]=531&tx_ttnews[backPid]=11&cHas L’État et le secteur public au sens large, h=89b9c6970f dans le cadre de leurs opérations, touchent à 22 Dekkers, M. et al., 2006, « MEPSIR, Measuring Public l’ensemble des secteurs de notre économie, Sector Information Resources, Final Report of Study on notre société et notre environnement. Les Exploitation of public sector information », données qu’il collecte sont donc naturellement http://ec.europa.eu/information_society/policy/psi/docs/pdf s/mepsir/final_report.pdf22
    • Géographique (AFIGÉO)23, 80 % des Le processus de recherche, d’analyse puisinformations qui sont utilisées possèdent une de représentation graphique synthétique desdimension géographique. Cela leur confère données sous forme interactive, quidonc une importance particulière à la fois d’un s’apparente à du journalisme et qu’on appellepoint de vue technique, mais aussi en tant parfois « datajournalism » ou journalisme dequ’outil de recoupement et de recombinaison données, a participé à créer une demande pourde données. plus de transparence de la part des gouvernements, et à l’émergence du sujet de la Ainsi, dès 1854, John Snow détermina les réutilisation des données publiques.causes de la propagation du choléra grâce à lavisualisation de données sur une carte. À cetteépoque, on pensait que la maladie sepropageait par inhalation. Le médecin ______________________superposa sur une carte les adresses desvictimes du choléra à Exeter (quartier deLondres) durant un épisode aigu, et constataqu’elles coïncidaient avec l’accès à la pompe àeau de la Broad Street. Par déduction, il en Les données publiques offrent, par le biaisconclut au rôle de l’eau et des conditions des réutilisations qui peuvent en être faites, unsanitaires dans la propagation de l’épidémie, ce fort potentiel d’innovation, tant à titrequi permit de la contrôler, et de réduire commercial que pour la recherche, ledrastiquement le taux de mortalité lié à cette développement de nouveaux services auxpathologie dans les décennies qui suivirent. citoyens ou l’amélioration du travail de De manière plus générale, le succès de l’administration.l’infographie en ligne et des nouveaux modes Les nouvelles possibilités dede visualisation dynamique ont amené les recombinaison et de réutilisation offertes pargraphistes et designers à rechercher de les technologies de l’information ont révélénouvelles informations et de nouvelles sources l’importance de leur réutilisation, et contribuéde données à mettre en scène dans leurs à en faire une question sociétale.productions.23 http://www.afigeo.asso.fr/ 23
    • Carte d’Exeter tirée de History of the Cholera in Exeter in 1832, T. Shapter.24
    • N0,2.+-&!;;J! O,!%.>-&!-57+.%.(,+.$*!&(!$**5&(!27>%.B7&(!3!%:.*+&-*,+.$*,%! Le sujet de la réutilisation des données nouvelles évolutions, et collaborer à lapubliques et l’appel à la mise à disposition rédaction d’articles scientifiques, se répandd’informations publiques sous forme brute a largement au sein de la communauté desémergé dans le contexte des ruptures chercheurs. Il trouve ensuite un écho dans latechnologiques et économiques de ces communauté des développeurs, notammentdernières années. parmi les contributeurs de projets Open Source, dont le mouvement d’ouverture des C’est pourtant par deux ruptures politiques, données est philosophiquement proche.au plus haut niveau de l’État, d’abord auxÉtats-Unis puis en Grande-Bretagne, chaque Des développeurs, des chercheurs et desfois dans un contexte d’alternance politique, économistes de l’information créent ainsiqu’il a été concrétisé par une politique l’Open Knowledge Foundation (OKFN) enambitieuse d’ouverture des données publiques. 2003 et l’Open Data Foundation (ODaF)25 en 2006 – organismes à but non lucratif qui Le chapitre suivant présente un tour cherchent à promouvoir l’adoption de normesd’horizon de ce mouvement d’ouverture des mondiales de formats et de métadonnéesdonnées publiques, et l’historique récent de ces (description des jeux de données), et ledeux principales initiatives gouvernementales, développement de solutions open source pourqui l’ont concrétisée à l’international. mutualiser les outils de mise en ligne de données.CJ O&!<$7?&<&*+!K)#!D/4/! Les promoteurs de l’Open Data ont ainsi Le terme Open Data, littéralement développé des définitions formelles des« données ouvertes » ou « données libres » (au critères qui caractérisent des donnéessens « libres de droits »), est utilisé pour « ouvertes ». Un groupe de travail « Opendésigner des données en libre accès et ouvertes Government Data » (OGD) d’experts du Webà la réutilisation. Il trouve son origine en 1995 s’est fixé huit critères assez larges de définitiondans une publication du Comité sur les des données publiques ouvertes26. L’OpenDonnées géophysiques et environnementales Knowledge Foundation (OKFN), pour sa part,du Conseil national de la Recherche aux États- propose onze critères27, plus axé sur lesUnis intitulée « De l’échange complet et ouvert conditions juridiques acceptables qui doiventdes données scientifiques »24 : se retrouver dans la licence de réutilisation. « Les programmes internationaux de Les deux ensembles de critères, qui recherche sur le changement global et la établissent une première définition des données surveillance environnementale dépendent ouvertes, sont détaillés ci-dessous. du principe d’un échange complet et ouvert Données complètes : toutes les données des données (i.e. les données et les sont mises à disposition, sauf exceptions de informations sont rendues disponibles sans bon sens. restriction, sur une base non discriminatoire, pour un coût réduit à celui Données brutes : les données sont telles des besoins de reproduction et de que collectées à la source. Elles ont la plus fine distribution). » granularité possible et ne se présentent pas sous des formes agrégées ou modifiées. Le terme, qui désigne donc à l’origine leprocessus de collaboration des scientifiques Données récentes : les données sont misesautour de données d’expériences partagées afin en ligne aussi rapidement que possible.de multiplier les chances de détecter deserreurs, se tenir mutuellement au courant des24 25 http://www.opendatafoundation.org/ 26http://www.nap.edu/readingroom.php?book=exch&page=s http://www.opengovdata.org/home/8principles 27ummary.html http://www.opendefinition.org/okd/ 25
    • Données accessibles : les données sont public) et l’opportunité politique ont mené au accessibles au plus grand nombre d’utilisateurs lancement, aux États-Unis, en Grande- possible, et réutilisables pour des usages les Bretagne et ailleurs en Europe notamment, plus variés. d’initiatives majeures d’ouverture et de réutilisation des données publiques. Données libres de droits : les données ne sont pas soumises au droit d’auteur, à brevet, au droit des marques, ou au secret commercial. FJ Q+,+(R9*.(!M!.*.+.,+.?&(! Formats exploitables : les données sont %$#,%&(A!27.(!5<,-#0&! structurées pour permettre le traitement automatisé, et disponibles sous une forme S55-,%&!! pratique et modifiable. L’ouverture des données s’est effectuée aux États-Unis du bas vers le haut. Les villes Formats non-propriétaires : les données de Washington, New York, San Francisco, ont sont accessibles dans un format sur lequel entrepris de recenser les collections de données aucune entité n’a de contrôle exclusif. qu’elles envisagent de mettre à disposition, Conditions non discriminatoires : les puis d’ouvrir des « data stores » pour mettre données sont accessibles à quiconque sans ces jeux de données à la disposition du public aucune obligation préalable ni inscription, et des entreprises, des développeurs et des sans discrimination entre les domaines citoyens.28 d’application. Les données sont notamment Ces démarches de « libération » des disponibles aussi bien pour des réutilisations données publiques sont très souvent commerciales que personnelles. accompagnées de concours d’applications pour Paternité : la licence peut exiger, comme encourager la réutilisation des données rendues condition pour la redistribution et la publiques. réutilisation des données, d’identifier Ce mouvement, amorcé par les grandes clairement les créateurs de l’œuvre ou les métropoles, fait désormais l’objet d’une contributeurs initiaux. Si cette condition est politique au niveau fédéral. imposée, elle ne doit pas être indûment complexe à remplir, et notamment la liste des L-M "/!0(*4-,-$/4-&!%#$!%&(#$!(7#0;#!%/$! contributeurs à citer doit être clairement ,#$!;0/%#$!7(40&)&,#$=! indiquée. L’année 2005 est marquée par une rupture Distribution de la licence : les droits majeure : l’ouverture par Google des attachés aux données s’appliquent à tous ceux « interfaces de programmation » (API) du à qui elles sont distribuées. service Google Maps donne lieu à une Non-transitivité de la licence : la licence ne floraison d’applications et de mashups29. Un peut exiger que toute donnée distribuée grand nombre de ces applications consistent à conjointement avec une donnée sous licence positionner sur les cartes Google Maps des libre soit aussi elle-même sous licence libre, ce données d’origine publique. qui serait un frein à la réutilisation de ces Ainsi, à Chicago en 2005, Adrian données. Holovaty, journaliste et programmeur30 lance Droit d’extraction : si les données sont ChicagoCrime.org, un site qui renseigne sur extraites d’un jeu de données, les utilisateurs une carte les données relatives aux crimes et de l’extrait doivent bénéficier des mêmes délits commis dans la ville et récupérées droits que ceux qui sont accordés au jeu de auprès de la municipalité31. Suite au succès de données dans son ensemble. l’application, et grâce à un don d’un million de dollars de la Knight Foundation32 en 2007, il Bien que ce modèle des données ouvertes puisse s’appliquer à tous types de données, qu’elles soient produites par le secteur public 28 Benhamou, B., 2010, « Les concours d’applications ou non, l’importance démocratique de l’accès mobiles dans le monde », Délégation aux Usages de aux informations publiques a conduit à l’Internet, 21 octobre 2010. 29 focaliser le débat sur l’Open Government Data, Applications web combinant différentes sources au sein d’une seule plateforme, l’une des facettes du design ou la réutilisation des données publiques. collaboratif sur le web. 30 Auteur de la librairie de développement en langage Les évolutions technologiques, le cadre Python à succès, Django. réglementaire (notamment les lois sur le droit à 31 Entretien le 18 octobre 2010 avec Sylvain Parasie, l’information et la Directive européenne sur la LATTS, Ecole des Ponts ParisTech. 32 réutilisation des informations du secteur Organisation caritative dédiée aux avancées dans le domaine du journalisme. Ce type d’acteurs dotés en fonds26
    • développe une version commerciale du site, de sa cérémonie d’investiture, le PrésidentEveryBlock33 (pour « chaque pâté de Obama signe son premier acte politique : unmaison »), qui recense et agrège un grand mémorandum à destination des ministres etnombre de données potentiellement utiles pour directeurs d’agences intitulé « Transparencyles citoyens dans un plusieurs municipalités. and Open Government » (Transparence et Gouvernement Ouvert). Il assigne aux services Des services du même type, conçus à partir fédéraux américains trois objectifs :de données publiques des municipalités voient transparence, implication des citoyens,le jour dans les domaines de l’éducation, de et collaboration.l’environnement ou de la santé. Adrian Fenty, le maire de Washington,L--M F*22W$!7(%-/4-.*#!%#$!2&2&*0$! D.C. à l’époque, recommande Vivek Kundra%3/)),-2/4-&$=! au Président Obama : le 5 mars 2009, ce Vivek Kundra, responsable des systèmes dernier est nommé Chief Information Officerd’information du District de Columbia du gouvernement fédéral américain (Directeur(autorité administrative de la ville de des Systèmes d’Information), un posteWashington), s’empare en 2008 du sujet. Il nouveau et symbolique créé sur mesure, aveclance Apps for Democracy, un concours de pour mission de mettre en place lesdéveloppement d’applications de services technologies pour concrétiser la visionpublics, ouvert à tous les développeurs, libres politique du chef de l’exécutif.de s’approprier des jeux de données mis à leurdisposition pour l’occasion34. L-1M "#!)&04/-,!C(%(0/,!D/4/=;&1!! Contre toute attente, le concours Dès le 11 mars, Vivek Kundra demanded’application, doté par la Mairie d’un prix de aux DSI de toutes les agences fédérales50 000 dollars, connaît un succès considérable. américaines de désigner des jeux de donnéesAlors qu’ils espéraient une dizaine de (« datasets ») susceptibles d’être mis en ligne.réponses, les organisateurs reçurent 47 dossiers Se basant sur son expérience à Washington, ilen 30 jours seulement. Le coût estimé du se concentre sur les données brutes. Data.govtravail de conception et de programmation sera un point focal faisant autorité pourainsi mis à disposition des habitants de diffuser les données publiques brutes, sous desWashington a été évalué à plus de formats réexploitables.2 600 000 dollars, soit un retour sur Son équipe développe une première versioninvestissement de 5 100 % et un effet de levier beta du site en trois mois, grâce à l’utilisationde 52 pour 1. de techniques de développement dites Apps for Democracy fait école : les « agiles » qui découpent la réalisation duconcours d’applications essaiment au sein des produit en cycles rapides (de vingt-quatregrandes métropoles américaines (notamment heures à quelques jours).New York, San Francisco, et Vancouver au Cette méthodologie aboutit à un processusCanada)35. En 2010, la Banque Mondiale elle- de développement rapide et itératif, qui assuremême lance son concours (Apps for une rapidité de développement et la possibilitéDevelopment), qui reçoit plus d’une centaine d’intégrer continuellement les évolutions desde contributions. besoins qui apparaissent très fréquemment dans le cadre de projets de développementL---M "#!Q!;&*1#0#7#4!&*1#04!S!%*!X0($-%#4! logiciel : « commencer petit à petit, réfléchirK+/7/! vite, faire un premier jet, le construire de façon Le candidat Barack Obama avait fait du incrémentale, prendre du recul. Trouver un« Gouvernement ouvert » un des axes de son moyen pour avancer »36.programme. Le 21 janvier 2009, au lendemain Le site est mis en ligne le 21 mai 2009, 120 jours seulement après la signature du Mémorandum par le Président avec seulementet organisés pour soutenir des programmes d’action ciblés,reste rare en France mais joue un rôle important dans le 47 ensembles de données. Le portail connaîtdébat social aux États-Unis. dans les mois suivants une évolution très33 EveryBlock.com est désormais une filiale de MSNBC.http://www.everyblock.com/34 Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.Harvard Business School.http://www.data.gov/documents/hbs_datagov_case_study.pdf35 Bernard Benhamou. 2010. « Les Concours 36d’Applications Mobiles dans le Monde », note de la Lakhani, R., Austin, R. and Yi, Y. Data.gov Case Study.Délégation aux Usages de l’Internet. Harvard Business School (voir plus haut). 27
    • rapide. Lors du premier anniversaire, en numérique, notamment d’un des principaux mai 2010, l’équipe de Data.gov annonçait37 : journaux britanniques, le Guardian, qui avait fait campagne pour l’ouverture des données • 250 000 jeux de données uniques en publiques (« Free Our Data »). ligne ; • Plus de 97 millions de requêtes en 1 À Gordon Brown qui l’interrogeait début an, soit près de 2 millions de pages 2009 sur les mesures phares qu’il pourrait vues ; prendre pour faire progresser le numérique • Plus d’un millier d’applications listées britannique, Tim Berners-Lee avait répondu construites à partir des « ensembles de que la mise en ligne des données publiques données » mis à disposition des britanniques serait à elle seule une avancée développeurs. majeure38. Quelques enseignements peuvent être tirés « L’aspect le plus fascinant du Web de cette expérience : c’est que, quand vous mettez quelque chose en ligne, vous ne savez pas qui va l’utiliser • La demande pour des données – mais vous savez que quelqu’un va publiques brutes a un potentiel élevé ; l’utiliser. » • L’intérêt du public est variable selon les types de données, mais difficile à Si ces données – performances scolaires, prévoir a priori ; localisation des adresses postales, météo, et • La rapidité de mise à disposition des surtout les cartes – étaient mises en ligne, données, sous forme brute et explique-t-il, chacun y trouverait une utilité.39 réexploitable, a créé les conditions du Avec le Professeur Nigel Shadbolt, succès ; chercheur reconnu dans les technologies du • Les fonctionnalités d’abord limitées Web sémantique, Tim Berners-Lee se voit de la plateforme n’ont pas empêché alors chargé d’accompagner les efforts de mise une expansion rapide par la suite ; en ligne d’un portail d’informations publiques • Les résistances à l’ouverture des sur le modèle du Data.gov américain, données ont pu être dépassées par un Data.Gov.uk. Une première version du portail appui politique de premier ordre, et le est ouverte le 30 septembre 200940, préfigurant rôle de démonstrateur joué par la le concours d’idées civiques Show Us A Better première version beta de la Way41. En parallèle, s’amorce un mouvement plateforme. de mise en ligne de données géographiques, dont une grande partie a été rendue gratuite, une révolution pour l’Ordnance Survey, DJ T-,*&!U-&+,6*&!M!7*&! l’institut géographique national britannique42. .<27%(.$*!+-,*(2,-+.(,*&!7! 6$7?&-*&<&*+! 38 Tom Chatfield and James Crabtree. 27 janvier L’initiative britannique a pris corps sous le 2010. « Mash the state : opening up public sector data is an old geek hobbyhorse, but could the man who invented the gouvernement de Gordon Brown : elle a été web reinvent the British government ? ». Prospect reconduite et même amplifiée par le Magazine. gouvernement Cameron. L’annonce le http://www.prospectmagazine.co.uk/2010/01/mash-the- 12 janvier 2011 de la création prochaine de la state/ 39 Texte original, tiré de l’article de Chatfield et Crabtree UK Public Data Corporation (agence cité plus haut : britannique pour les données publiques) est As Berners-Lee explains: « The thing people are une première. amazed about with the web is that, when you put something online, you don’t know who is going to L-M 9#!;#W$#!.*-!%&-4!/*!:/$/0%! use it—but it does get used. » So his pitch to Gordon Brown was simple: if this data—exam Sir Tim Berners-Lee, inventeur du Web en results, postbox locations, weather reports, and most crucially, maps—was put online, people 1989 et artisan de l’émergence du « Web would find a use for it. sémantique » a joué un rôle essentiel. Son 40 « Sneak Peek Site Open ». 30 septembre 2009. appel à mettre en ligne les données publiques Data.gov.uk Blog. http://data.gov.uk/blog/sneak-peek-site- brutes lors de la conférence TED en 2009 avait open 41 « What would you create with public information ? » 20 reçu un écho important dans le monde janvier 2010. Show Us A Better Way Blog. http://webarchive.nationalarchives.gov.uk/2010080700435 0/http://showusabetterway.co.uk 37 42 The White House. 21 mai 2010. « Data.gov : Pretty Great Brittan’s Ordnance Survey Annual report 2009. Advanced for a One Year Old ». http://www.ordnancesurvey.co.uk/oswebsite/aboutus/repor http://www.whitehouse.gov/blog/2010/05/21/datagov- ts/annualreport/09- pretty-advanced-a-one-year-old 10/os_annual_report_and_accounts_2010.pdf28
    • L--M 9!7-#*AR%-$/4!)&,-4-.*#!/*4&*0!%#!,/! la plateforme Data.gov.uk) a permis de mettre7-$#!#!,-;#!%#$!%&(#$!)*+,-.*#$! au point des outils de visualisation et Le thème acquiert une visibilité politique à d’exploration de ces ensembles de données.l’occasion des élections parlementaires de L’outil de visualisation du budget de l’Étatmai 2010. En réaction au retentissement britannique destiné au grand public réalisé enmédiatique du scandale des notes de frais des amont par OKFN, Where Does My Moneyparlementaires à l’été 2009, le thème de la Go46 fut présenté lors de cette conférence detransparence et celui de l’ouverture des presse.données publiques figurent dans le programme Furent aussi mis en avant, le même jour, lesde tous les candidats. Une sorte de surenchère acteurs privés les plus innovants en matière deà la mise en ligne de données publiques se met réutilisation des données publiques, commeen place à l’occasion de la campagne. Timetric47, qui développe un « YouTube des Après l’alternance politique, David graphes de données48 » et finance son produitCameron reprend à son compte l’initiative consommateur gratuit par des services dedata.gov.uk, et réoriente ses priorités, de business intelligence aux entreprises.l’innovation et du soutien à la création de À l’occasion de cette conférence de pressenouveaux services aux citoyens vers la mise en fut aussi consacré le travail de Rufus Pollock,place d’outils de transparence de l’action de économiste à l’Université de Cambridge,l’État. Il nomme un Public Sector cofondateur de l’Open Knowledge FoundationTransparency Board (qui compte dans ses (organisatrice de l’Open Government Datamembres Tim Berners-Lee et Nigel Shadbolt) Camp concomitant), et auteur de l’étudeet affiche sa volonté de construire « le économique majeure sur le sujet des donnéesgouvernement le plus transparent au monde », publiques.en s’appuyant sur une mise en lignegénéralisée des données de fonctionnement des L-1M E#$-&$!#40#!)&*1&-0$!,&2/*A!#4!ministères et agences britanniques, vu comme /%7--$40/4-&!2#40/,#!un élément de contrôle du « Big State » par la« Big Society » (son thème de campagne). Dans un contexte de coupes budgétaires drastiques, l’ouverture des données publiquesL---M I(%(0#0!*!(2&$Y$4W7#!)#0C&07/4! cristallise cependant des tensions entre le gouvernement central et les pouvoirs politiques Ce consensus pour l’ouverture des données locaux.de l’État au sein de la classe politique doitbeaucoup aux efforts de conviction de Tim Eric Pickles, le ministre en charge desBerners-Lee et aux travaux de l’Open Collectivités Locales, avait fixé auxKnowledge Foundation43. collectivités la date butoir du 31 janvier 2011 pour mettre en ligne les données relatives aux Un rédacteur de ce rapport a pu assister à dépenses budgétaires excédant 500 livres. Àune conférence de presse le 19 novembre 2010 quelques semaines de l’échéance, seules 150à Londres, au cours de laquelle fut annoncée la collectivités sur les 350 concernées avaientmise en ligne de l’ensemble des dépenses de publié leurs données49, même si la majoritél’administration centrale britannique, détaillées s’est ensuite pliée à cette demande.à partir de 25 000 livres et remises à jour tousles mois. Le ministre Eric Pickles est revenu sur le périmètre des données que ces institutions Cette conférence de presse, qui réunit Sir seraient tenues de diffuser50 sans délai, deTim Berners-Lee, Francis Maude, Minister forthe Cabinet Office, Paymaster General et le 46Premier Ministre David Cameron (via une WhereDoesMyMoneyGo a été développé par Jonathan Gray de l’Open Knowledge Foundation en 2007, et remis àallocution vidéo)44 a été largement relayée par jour au fur et à mesure. http://wheredoesmymoneygo.org/les médias. 47 Timetric : Indexing the World Economy. http://timetric.com/ Un travail de collaboration entre le 48 TechCrunch. 20 avril 2009. « Four teams selected forgouvernement, le journal The Guardian et Mini Seedcamp day in London ».l’Open Knowledge Foundation (qui a http://eu.techcrunch.com/2009/04/20/four-teams-selected- from-mini-seedcamp-day-in-london/développé la technologie CKAN45 utilisée par 49 The Register. 6 janvier 2011. « Pickles Throws Down Gauntlet on Data. » http://www.theregister.co.uk/2011/01/06/councils_must_p43 Open Knowledge Foundation. http://okfn.org ut_spending_data_online_or_else/44 50 Allocution par le Premier Ministre David Cameron, 19 TransportXtra. N°562, 14 janvier 2011. « Pickles scrapsnovembre 2010. http://data.gov.uk/about accessibility and school mode choice datasets. »45 Comprehensive Knowledge Archive Network. http://www.transportxtra.com/magazines/local_transport_thttp://ckan.net/ oday/news/?id=25331 29
    • manière à apaiser les tensions apparues en qui pourraient mettre à mal les efforts réalisés raison d’une trop forte ambition initiale. jusqu’à présent pour soutenir la réutilisation.53 DJFJ O,!K!)7>%.#!4,+,!N$-2$-,+.$*!LA!7*&! VJ W.+7,+.$*(!#$*+-,(+5&(!&*! #$<2,6*.&!&(!$**5&(!27>%.B7&(! >-.+,**.B7&! "7-$2&!! Francis Maude annonce le 12 janvier 2011 L-M H&40/$4#$!C&04$!#40#!?4/4$R7#7+0#$! la création de la UK Public Data Corporation (agence britannique pour les données La transcription en droit national et la mise publiques)51. en œuvre de la Directive « PSI » (Public Sector Information, ou données du secteur public) de « Les données publiques soutiennent une 2003 débouchent sur des situations très part croissante de l’économie. Les contrastées dans les États-membres. technologies actuelles permettent à chacun d’utiliser et de réutiliser cette information de Les pays scandinaves, avec une culture maintes façons nouvelles et innovantes. Le rôle historiquement ancrée de la transparence, sont du gouvernement est d’aider à maximiser les souvent en pointe en matière de réutilisation bénéfices que la société retire de ces des données publiques. La Finlande a développements. Aujourd’hui, beaucoup notamment annoncé avoir lancé un processus d’agences font face à un conflit entre les exploratoire pour étudier la mise en ligne de revenus issus de la vente de données et la ses données. possibilité de rendre les données disponibles Les institutions européennes, Eurostat et le gratuitement, pour être exploitées à des fins site de droit communautaire http://e- économiques ou sociales. Créer la Public Data justice.europa.eu en premier lieu, autorisent la Corporation permettra au moins de gérer les réutilisation des données et informations conflits d’intérêt en visant à ouvrir l’accès aux publiques issues des institutions européennes. données, et au mieux de les éliminer ».52 Le degré d’avancement des autres pays est L’agence pourra décider la mise en ligne difficile à bien percevoir, notamment du fait du des données. Arbitre des conflits d’intérêt entre manque de visibilité des projets de portails génération de revenus et bénéfices sociétaux, nationaux ou de l’approche très décentralisée elle sera chargée d’harmoniser les politiques qui a souvent été retenue (comme par exemple tarifaires afin de préserver leur cohérence et de avec les Répertoires d’Information Publique faciliter la réutilisation et l’innovation. Elle choisis par la France). devrait aussi jouer un rôle dans les investissements pour des données publiques de L--M 6(#A/7#!%#!,/!D-0#24-1#!XFZ! qualité. La Commission européenne a lancé en Les réactions dans la communauté des septembre 2010 une consultation publique sur réutilisateurs britanniques sont mitigées : ils la directive « Informations du secteur public » : redoutent un retour vers un modèle de elle portera sur le champ dapplication, les tarification généralisée des données publiques, tarifs et licences relatives aux données ainsi que sur les formats électroniques disponibles. Selon Neelie Kroes, vice-présidente de la Commission européenne chargée de la stratégie numérique, « une grande partie de 51 The Cabinet Office. 12 janvier 2011. « Public Data ces informations, en Europe, sont sous- Corporation to free up public data and drive innovation. » http://www.cabinetoffice.gov.uk/news/public-data- exploitées. Nous ne pouvons nous permettre de corporation-free-public-data-and-drive-innovation négliger ce potentiel. Nous devons examiner 52 Texte original de l’annonce telle que relatée par le site lopportunité de modifier les règles de lUE en du Cabinet Office le 12 janvier 2011 : matière de réutilisation des informations du Public sector information underpins a growing part of the economy. The technology that is around today allows people to use and re-use this information in new and different ways. The role of Government is to help maximise the benefits of these developments. At present many state agencies face a conflict between 53 maximising revenues from the sale of data and Chris Taggart (membre du comité du gouvernement making the data freely available to be exploited britannique sur les données publiques locales), 14 janvier for social and economic gain. Creating the 2011. « What’s that coming over the hill, is it… the Public PDC will enable the conflicts at the least to be Data Corporation? ». Publié sur : managed consistently with a view to opening up http://countculture.wordpress.com/2011/01/14/whats-that- access, and at best to be eliminated. coming-over-the-hill-is-it-the-public-data-corporation/30
    • secteur public pour libérer pleinement leur Le travail de réflexion sur le sujet etpotentiel économique »54. d’animation de la communauté des réutilisateurs, notamment via un concours La Direction générale pour la Société de européen de développement d’applications,l’information et médias de la Commission l’Open Data Challenge, va déboucher sur uneEuropéenne a financé une plateforme forte visibilité de la question des données auélectronique d’échange et de veille autour de niveau européen. L’Open Data a été l’un desces questions : ePSIplatform.55 sujets majeurs du Digital Assembly de La Commission a par ailleurs lancé une juin 2011, premier rassemblement annuel deétude visant à évaluer l’opportunité d’une suivi de la stratégie européenne pour lerefonte de la Directive PSI, notamment vers un numérique, ce qui en souligne l’actualitéchamp plus large, des règles de tarification brûlante.plus contraignantes ou des préconisations pluscontraignantes sur les licences de réutilisation.54 Stratégie numérique: la Commission lance uneconsultation sur la réutilisation des informations du secteurpublic.http://europa.eu/rapid/pressReleasesAction.do?reference=IP/10/1103&format=HTML&aged=0&language=FR&guiLanguage=en55 http://www.epsiplus.net/ 31
    • 32
    • N0,2.+-&!;;;J! O&(!&*E&78!&!%,!-57+.%.(,+.$*!&(!$**5&(!27>%.B7&(! Portée par des évolutions technologiques, l’administration centrale britannique dépassantéconomiques et politiques récentes, la de 25 000 livres56, le Premier Ministre Davidréutilisation des données publiques est devenue Cameron revendiquait le titre deune question sociétale. « gouvernement le plus transparent et responsable de la planète ». Elle peut contribuer à rapprocher lapuissance publique des citoyens et améliorer le L’exemple le plus radical de cettefonctionnement interne de l’administration. transparence est probablement le site Police.uk, lancé par le même gouvernement, Elle constitue un élément de soutien à qui détaille l’ensemble des crimes, délits etl’économie numérique, et ses applications incivilités, rue par rue, à travers tout lepeuvent encourager le développement durable territoire britannique. Il a connu un succèsainsi que les secteurs essentiels pour l’avenir extraordinaire, avec 35 millions de requêtesde notre économie, de la recherche et de durant ses premières 24 heures del’innovation des PME. fonctionnement. Les données publiques constituent les La transparence de l’action de l’État ne seprémisses d’une « infrastructure limite pas aux domaines strictement régaliens.informationnelle » : au-delà des gains La transparence sur la qualité deéconomiques liés à la transparence, elles l’environnement, des produits que nouspermettent l’avènement d’un nouveau mode consommons et de l’air que nous respirons estd’action publique, novateur et encore traversé un ferment crucial de la confiance des citoyenspar des tensions qu’il appartient à la puissance envers leurs gouvernants.publique de réguler. Par exemple, lors de la crise nucléaire de Fukushima, l’Institut de Radioprotection et deCJ 45<$#-,+.&A!+-,*(2,-&*#&!&+! Sûreté Nucléaire français, l’IRSN, a ainsi mis5>,+!27>%.#!! en ligne les mesures de radioactivité ambiante qu’il effectuait en temps réel à travers tout le Le droit d’accès aux données publiques et, territoire.son corollaire de l’ère numérique, le droit àleur réutilisation non discriminatoire et sans Enfin, la transparence publique est un enjeudistinction d’usage, sont des éléments à part démocratique qui doit évidemment être mis enentière du fonctionnement démocratique de place dans le respect de la vie personnelle etnotre société. des secrets légaux (secret statistique, secrets liés à la sécurité, secret lié à la protection l’environnement…).CJCJ N$*+-.>7&-!3!%,!+-,*(2,-&*#&!&!%:,#+.$*!&!%:Q+,+! CJFJ Q#%,.-&-!%&!5>,+!27>%.#! L’obligation pour la puissance publique derendre compte à ses administrés La mise à disposition de données brutes sur(« accountability » pour les Anglo-Saxons, le fonctionnement de l’État va dans le sens delittéralement « être comptable de ») est une la généralisation de ce mouvement devaleur centrale des démocraties modernes. transparence. Cette responsabilité du gouvernement se 56concrétise notamment par un droit Allocution de David Cameron, 19 novembre 2010, durant la conférence de presse à l’occasion de la mise end’information des citoyens, et par une ligne des entrées de 25,000 livres et plus du budget denécessité de transparence de l’État et des fonctionnement de l’État britannique.collectivités quant à leur fonctionnement vis-à- http://www.guardian.co.uk/politics/blog/2010/nov/19/govevis du public. rnment-spending-files-live-blog?intcmp=239 Voir aussi l’allocution de Francis Maude, Ministre du En annonçant, en novembre 2010, la mise Cabinet Office : http://www.guardian.co.uk/commentisfree/2010/nov/19/fraen ligne de l’ensemble des dépenses de ncis-maude-government-data-published?intcmp=239 33
    • Une réutilisation libre et ouverte des l’émergence d’une réelle expertise citoyenne données publiques transforme les pratiques impliquée dans la vie publique. traditionnelles du journalisme. L’accès direct à Le site NosDéputés.fr est un cas de ces données confère aux journalistes une plus réutilisation par un collectif citoyen de grande latitude pour la conduite données publiques (dans ce cas des données d’investigations basées sur les faits et la publiques produites par la Représentation construction d’argumentaires étayés. Ils nationale). Créé par l’association Regards peuvent y accéder à tout moment, les recouper citoyens, le site59, lancé le 14 septembre 2009, à titre de vérification, les croiser avec d’autres ambitionne « de donner aux citoyens de sources pour mettre en perspective les nouveaux outils pour comprendre et analyser phénomènes qui sont l’objet de leurs analyses. le travail de leurs représentants ». Pour cela, il Le journal britannique The Guardian57 synthétise les différentes activités, législatives publie ainsi des analyses infographiques et des et de contrôle du gouvernement. En réutilisant visualisations interactives qui mettent en les résultats des élections législatives de 2007, lumière les éléments factuels qui sous-tendent l’association a aussi étudié l’impact du le débat public, comme par exemple celle redécoupage de la carte électorale sur la portant sur l’analyse du budget britannique58. répartition des sièges à l’Assemblée nationale60. Ce phénomène, le « datajournalism » ou journalisme des données, permet à la presse de L’ouverture la plus large des données mettre en œuvre une véritable pédagogie quant publiques à la réutilisation permettrait de aux enjeux de société, sous une forme multiplier ces exemples, dans l’ensemble des interactive et que le public peut facilement domaines d’activité du monde associatif et de s’approprier, à partir des données qui s’y la société civile, de l’environnement à rapportent. l’assistance aux personnes en passant par l’initiative économique, et encouragerait L’accès aux données brutes et le droit de l’implication des citoyens dans la vie civique. réutilisation permettent donc d’éclairer le débat public, et de le recentrer sur des faits avérés plutôt que des positions idéologiques formées FJ =$&-*.(,+.$*!&!%:Q+,+! a priori. FJCJ 1&*S$-#&-!%:&SS.#,#.+5!&!%:,#+.$*! CJDJ "*#$7-,6&-!%:.<2%.#,+.$*!&(!#.+$@&*(! 27>%.B7&!&+!&!%:,<.*.(+-,+.$*! ,*(!%,!?.&!27>%.B7&! L’État est, dans les faits, son plus gros L’émergence de mécanismes participatifs, client sur le marché de la vente de données. qui permettent d’associer les citoyens à la Des études démontrent que jusqu’à 70 %61 du délibération politique menée par les volume de vente de données publiques institutions de la démocratie représentative, a concerne des transactions contractées entre précédé l’émergence d’Internet. deux institutions publiques différentes En France, ce principe de participation a dépendant du même gouvernement. La été créé par la loi « Barnier » du 2 février 1995 tarification pour réutilisation de données, relative à la protection de l’environnement et plutôt qu’une source de revenus pour instituant la commission nationale du débat l’administration, est donc majoritairement un public (CNDP), et la loi « Vaillant » du transfert budgétaire entre entités publiques, 27 février 2002 relative à la démocratie de d’autant plus inefficace qu’il grève le budget proximité instaurant les conseils de quartier. de ces institutions des coûts importants de transactions inhérents aux finances publiques. Dans nos sociétés basées sur la communication et la fluidité des échanges, Mettre en ligne par défaut les données toute rétention d’information est perçue publiques plutôt qu’attendre une requête en comme suspecte. En offrant des outils qui demandant l’accès facilite donc aussi le travail permettent aux citoyens de se faire une opinion de l’administration. Ouvrir ses silos de indépendamment des pouvoirs publics ou du prisme d’analyse des médias, la mise à 59 disposition des données peut permettre http://www.regardscitoyens.org/nosdeputes-fr/ 60 http://www.regardscitoyens.org/redecoupage/ 61 Communication lors de l’Open Government Data Camp à Londres le 18 novembre 2010 : dans le cas des données publiques locales en Grande Bretagne, une étude a montré 57 http://www.guardian.co.uk/data que 70% des achats de données (en volume monétaire) 58 http://www.guardian.co.uk/news/datablog/2010/oct/18/g provenaient d’autres gouvernements ou institutions overnment-spending-department-2009-10 gouvernementales (locales ou nationales).34
    • données fluidifierait les échanges données de l’État, des services en ligne plusd’informations en son sein, notamment sur des innovants et de meilleure qualité.sujets transverses qui touchent aux En France, c’est aussi la possibilité pourprérogatives de différents ministères - par des développeurs d’offrir de nouveaux servicesexemple, l’hypertrophie des algues en milieu aux citoyens à partir des données mises àmarin (mesures réalisées par le Ministère de disposition par l’État qui avait poussé lel’Écologie), fortement corrélée à l’utilisation groupe d’experts du numérique, réunis autourde fertilisants phosphatés dans le cadre de la du député Frank Riester pour travailler surproduction agricole (données du Ministère de l’amélioration du lien numérique entrel’Agriculture). L’ouverture des données l’administration et l’usager, à proposer la misepubliques permettrait donc aux services de en ligne d’un portail des données de l’État63.l’État et des collectivités un accès plus rapide àl’information, sans avoir besoin de passer par Le discours du Président de lala lourdeur de la procédure d’achat des République prononcé le 27 avril 2011 àdonnées auprès d’une autre entité publique, ni l’occasion de l’installation du Conseil Nationalla nécessité de disposer d’un budget pour les du Numérique64 abonde dans ce sens : « nousobtenir. faisons appel aux entrepreneurs d’Internet pour imaginer les services que l’État n’a pas encore Le processus de normalisation inhérent à la créés ».mise en ligne des données publiques pourraitde plus être intégré directement dans le travail La perception de l’administration par lequotidien des services producteurs de données. citoyen en sortira modifiée, dans un sens quiS’assurer de la présence de la légende, des pourrait être celui d’une meilleure appréciationmétadonnées, ou de l’interopérabilité du du travail fourni et des enjeux forts des métiersformat utilisé permettrait à l’État de s’engager de l’administration.dans une démarche d’assurance qualité Cette démarche d’encouragement auconcernant les données publiques. développement de nouveaux services publics Enfin, la transparence accrue que pourrait en partenariat avec les acteurs de l’innovation,permettre une large ouverture des données de comme celle d’ouverture et de transparence,l’État est un élément de contrôle des citoyens participe à la réforme de l’État, de lasur les performances des politiques publiques modernisation et de l’amélioration de sonet de ses opérateurs. Selon le principe des rapport à l’usager.théories économiques de l’agence62 qui veulentque ce que l’on mesure précisément concentreles efforts, une meilleure transparence quant au DJ ;**$?,+.$*!&+!($7+.&*!3!travail de l’État et aux effets de son action sur %:5#$*$<.&!*7<5-.B7&!la société, l’économie et les services publicsentraînera mécaniquement une amélioration de En parallèle aux enjeux démocratiques etson efficacité et de la qualité des services d’action publique que représente l’accès auxrendus. données publiques, leur réutilisation par des développeurs, des entrepreneurs et des startups est un enjeu économique fort, à court termeFJFJ )-$2$(&-!&!*$7?&,78!(&-?.#&(!27>%.#(! pour le développement du numérique, et à long La réutilisation des données par des terme pour la croissance, l’emploi et ledéveloppeurs, des entreprises ou des développement des secteurs stratégiques deassociations, permet par ailleurs à ces derniers l’économie.d’offrir aux citoyens de nouveaux services La réutilisation des données publiquespublics en ligne, souvent novateurs et que pourrait stimuler l’innovation dans lesl’État n’aurait parfois pas su ou pu imaginer industries de l’information, notamment danspar manque de familiarité avec les nouveaux les services contextuels.usages. En Grande-Bretagne par exemple, c’est 63 Proposition 22 du rapport du groupe d’experts duavec le slogan « Releasing Innovation » numérique sur l’amélioration du rapport numérique de(libérer l’innovation) qu’a été mise en ligne la l’administration à l’usager :plateforme data.gov.uk. L’objectif affiché était http://www.modernisation.gouv.fr/fileadmin/Mes_fichiers/ pdf/RapportGroupeExpertsNumeriques.pdfde permettre à des tiers de créer, à partir des 64 M. le Président de la République, 2011, « Discours à l’occasion de l’installation du Conseil National du Numérique le 27 avril 2011 »62 http://www.elysee.fr/president/les-http://fr.wikipedia.org/wiki/Th%C3%A9orie_de_l%27age actualites/discours/2011/discours-sur-internet-et-l-nce economie-numerique.11256.html 35
    • DJCJ O,!$**5&!27>%.B7&!M!<,+.I-&! Dans un domaine traditionnellement 2-&<.I-&!&(!.*7(+-.&(!&!%:.*S$-<,+.$*! proche des techniques documentalistes et qui déploie aujourd’hui des solutions de Une étude réalisée pour le compte de la référencement basées sur les technologiques Commission Européenne estime la valeur sémantiques décrites plus haut, LexisNexis70 potentielle du seul marché de la donnée ou Caselex71 sont des sources d’informations publique entre 10 et 48 milliards d’euros, avec importantes (notamment jurisprudentielles) une projection médiane à 27 milliards pour les juristes professionnels. d’euros65. Le potentiel de croissance qu’offrirait une plus large ouverture des données est clair, alors que l’on estime que DJFJ O:K)#!D/4/!S,?$-.(&!%,!#-$.((,*#&!&! l’Union Européenne dans son ensemble perd %:5#$*$<.&!*7<5-.B7&! près de 300 millions d’euros par an en recettes L’importance de la question des données fiscales du fait du régime d’accès encore trop publiques se révèle à la lumière des restreint à la donnée publique66. développements technologiques récents. Les industries de l’information considèrent Au-delà des secteurs traditionnels de la réutilisation des données publiques comme l’industrie de l’information, c’est l’innovation une opportunité majeure67. Le groupement et la création de nouveaux produits et services professionnel Groupement Français de en ligne qui bénéficieraient de l’ouverture l’Industrie de l’Information (GFII) organise en massive des données publiques. particulier une veille fréquente et des colloques pour ses membres sur ce sujet considéré Permettre aux jeunes pousses numériques comme crucial68 au développement du secteur. d’une économie d’accéder facilement aux De nombreuses réussites industrielles sont données publiques pour expérimenter, c’est basées en tout ou partie sur l’accès à faciliter l’émergence de tout un tissu potentiel l’information publique. de sociétés de services mobiles et en ligne, et donc contribuer au développement de Dans le secteur des transports, une société l’économie numérique. comme NAVX a pu intégrer à son offre de services aux particuliers des informations sur L-M "#$!/)),-2/4-&$!20((#$!T!)/04-0!%#!%&(#$! le prix des carburants en pompe en temps réel. )*+,-.*#$!2&/-$$#4!*#!40W$!C&04#!%#7/%#! La start-up KelQuartier.fr propose une offre d’information compilée à partir de l’agrégation Un exemple parmi les applications d’un grand nombre de données publiques, présentes sur le portail de services publics sur quartier par quartier69. Des sociétés de services mobile « Proxima Mobile », créé par la aux personnes affectées d’allergies ont pu Délégation aux Usages de l’Internet : intégrer les données de volume du bâti de la AllBikesNow permet de repérer les stations de ville de Paris, afin de mieux prévoir le Vélib’ proches de soi, et interroge à distance déplacement des allergènes dans l’air à travers les serveurs de l’opérateur de la flotte pour la ville. connaître, en temps réel, l’état de remplissage d’une station en vue d’y retirer un vélo ou d’en garer un. Il est à noter par contre que les données brutes sous-jacentes, produites par la 65 Dekkers, M. et al. 2006. Measuring Public Sector société JC Decaux dans le cadre de la Information Resources : Final Report of Study on concession d’exploitation de la flotte Vélib’ Exploitation of public sector information. http://ec.europa.eu/information_society/policy/psi/docs/pdf concédée par la Mairie de Paris, ne sont pas s/mepsir/final_report.pdf encore disponibles à la réutilisation par tous, 66 Pettifer, R. 25 août 2009. « Europe loses 300 million même si cela est à l’étude. Euro in taxation per year. » ePSI Platform. http://www.epsiplatform.eu/guest_blogs/europe_looses_30 Un autre exemple dans le secteur des 0_million_euro_per_year_in_taxation transports en commun est l’application mobile 67 Groupement Français des Industries de l’Information. 20 mai 2010. « L’ouverture des données publiques : un enjeu Locomote, de la société Isokron, qui permet de pour le développement de l’économie connaître l’itinéraire le plus rapide en fonction numérique. » Colloque tenu à la Maison de l’Europe. de sa localisation et de l’état des réseaux de http://www.gfii.asso.fr/article.php3?id_article=3226 bus, de train et de vélos en partage dans les 68 Groupement Français des Industries de l’Information. Juillet 2010. PSI Reuse in France : Overview and Recent villes qui ont commencé à ouvrir l’accès à ces Developments. données, comme la ville de Rennes avec la http://www.gfii.asso.fr/article.php3?id_article=3315 société Kéolis. 69 Billaut, J-M. 26 novembre 2010. « Connaissez-vous Eduardo Larrain from Paris ? KelQuartier, premier utilisateur d’open data ? » 70 http://billaut.typepad.com/jm/2010/11/connaissez-vous- LexisNexis, Inc. http://lexisnexis.com 71 eduardo-larrain-from-paris-.html Caselex, Inc. http://caselex.com36
    • Les données qui sous-tendent ces deux L’idée est de recouper l’ensemble desservices ne sont pas toujours accessibles aux informations géolocalisées ou géocodées quedéveloppeurs indépendants dans des conditions Google a accumulées et ordonnées dans sesfacilitant l’expérimentation de nouvelles idées, serveurs, d’en extraire les informations les pluset, par exemple, la SNCF et la RATP n’ont pas à même d’intéresser un utilisateur d’Androidencore ouvert l’accès aux données, théoriques se trouvant dans un contexte donné(horaires) comme temps réel (position des bus (géographique, temporel, mais aussi social ouet trains), issues de l’exploitation de leur professionnel, ce qui peut être déterminé grâceréseaux. aux données personnelles confiées à Google), et de les présenter de façon non intrusive à Les nouvelles plateformes d’applications l’utilisateur avant même qu’il n’ait pensé àmobiles ont vu apparaître des catégories initier une recherche Google. Ce serviceentières de services nouveaux, au succès préfigure les publicités mobiles géolocaliséesémergent. Par exemple, Foursquare, le service et personnalisées qui sont annoncées pour unle plus connu sur le marché naissant de la futur proche.géolocalisation sociale, et qui permet auxutilisateurs de signaler (check-in) à leurs Le défi technologique et ergonomique estréseaux sociaux leur localisation en un point majeur : ce type d’application pourrait devenird’intérêt (bâtiment, musée, restaurant, bar, aussi incontournable dans le monde physiquevoire ministère), a déjà plus de 5 millions que le sont aujourd’hui les moteurs ded’utilisateurs72 après 2 ans d’existence. recherche sur le Web. Indépendamment ou enDisMoiOù, un service français similaire, a parallèle aux services contextuels de Google,ouvert son API en juin 201073. d’autres applications contextuelles pourront apparaître, plus spécialisées, ou dans des Enfin, l’information pratique aux citoyens contextes géographiques spécifiques où leurconnaît un succès renouvelé sur les nouvelles producteur disposera d’un avantage compétitif.plateformes mobiles, et pourrait bénéficier Le développement de ces nouveaux usagessubstantiellement de l’ouverture des données bénéficierait largement de l’ouverture à lapubliques. La société MyCityWay74 propose réutilisation des données publiques.par exemple, dans chaque métropoleaméricaine, une application qui regroupel’ensemble des services publics, des DJDJ 9*!(&#+&7-!#-7#.,%!2$7-!%,!#-$.((,*#&!informations de transports, de loisirs et de &+!%:&<2%$.!culture utiles au citoyen. Ce modèle sera Le développement d’applicationsprobablement amené à se développer en innovantes à partir des données publiquesEurope. ouvertes permettra d’offrir de nouveaux services utiles aux consommateurs et auxL--M "#$!%&(#$!)*+,-.*#$!)&*00/-#4!B40#! citoyens. Ce sera aussi l’occasion pour des,3&))&04*-4(!%3/1/2(#$!4#2:&,&;-.*#$! entreprises de créer ou de développer des Google, opérateur de la plateforme et du activités commerciales en ligne, génératricessystème d’opération mobile à très forte de revenus et d’activité économique.croissance Android, a annoncé à Paris lors de L’économie numérique est un secteurla conférence LeWeb 2010, sa prochaine crucial pour la France. Une étude76 montre queavancée technologique majeure : la découverte cette industrie en forte croissance (3,7 % ducontextuelle (‘contextual discovery’75). PIB en 2010, et jusqu’à 5.5 % en prévision pour 2015) a représenté à elle seule 25 % de la croissance de l’économie depuis 2009, et est à l’origine d’un quart de la création nette72 TechCrunch, 1er décembre 2010, « Boom ! 5 Million d’emplois en France depuis 1995 (soit uneUsers Check-In to Foursquare » . contribution nette d’environ 700 000 emplois).http://techcrunch.com/2010/12/01/foursquare-hits-5-million-users/ Son développement est un des quatre leviers de73 DisMoiOu. 11 juin 2010. « Développeurs, découvrez croissance de l’économie française identifiésl’API DisMoiOu ! ». par le Conseil d’Analyse Stratégique77, avec lahttp://blog.dismoiou.fr/2010/06/developpeurs-decouvrez-lapi-dismoiou.html74 GigaOm. 19 novembre 2010. « MyCityWay Dives IntoData Comes Up With Gold ». 76http://gigaom.com/2010/11/19/mycityway-dives-into-data- McKinsey & Company, 2011, « Impact d’Internet surcomes-up-with-gold/ l’économie française : Comment Internet transforme notre75 TechCrunch, 8 décembre 2010, « Marissa Mayer’s Next pays ». 77Big Thing : ‘Contextual Discovery’ – Google Results Conseil d’Analyse Stratégique, « Rapport thématiqueWithout Search ». France 2025 : Production et emploi ». Gilbert Cette,http://techcrunch.com/2010/12/08/googles-next-big-thing/ Président de groupe. 37
    • réforme de l’enseignement supérieur et la données publiques peuvent aussi jouer un rôle baisse des rigidités du marché des biens et du stratégique pour l’économie au sens large. travail : une diffusion plus large des TIC La transparence accrue initiée par le pourrait contribuer jusqu’à 0.3 % de croissance mouvement de mise en ligne des données additionnelle par an. publiques pourrait entraîner des gains Les données publiques pourraient plus économiques substantiels. particulièrement devenir un ingrédient La réutilisation de ces données, pour créer important d’encouragement au développement de nouveaux services numériques ou pour d’applications mobiles. Le marché global de améliorer les processus productifs internes aux ces applications a atteint 4,4 milliards de entreprises, pourra soutenir les grands axes dollars de revenus annualisés dans la première stratégiques pour l’avenir de l’économie moitié de l’année 201078, et est estimé pouvoir française, de la recherche, du développement atteindre près de 15 milliards de dollars d’ici à durable ou encore de la croissance des Petites 201379. Parmi elles, le secteur des services et Moyennes Entreprises (PME). contextuels et géolocalisées est en pleine croissance80 et constitue plus qu’une évolution de l’informatique, une nouvelle opportunité VJCJ O&(!6,.*(!5#$*$<.B7&(!&!%,! pour les services numériques. +-,*(2,-&*#&! En France, une étude du L’Open Data et ses enjeux sont souvent Syntec Numérique81 publiée en fin d’année présentés comme séparés en deux 2010 dénombre 5 400 éditeurs et sociétés de problématiques majeures : la transparence de service en ingénierie informatique spécialisés l’État et le débat public, d’une part, et la dans la mobilité. 540 d’entre elles opèrent contribution à la croissance économique, de exclusivement dans la création d’applications l’autre. La transparence peut cependant être mobiles, dont la majorité sont des entreprises elle aussi à l’origine de la création de valeur, de moins de 5 personnes. L’étude projette la tant au niveau microéconomique que création de 15 000 emplois dans ce secteur au macroéconomique. cours des 5 prochaines années. La théorie de l’agence économique L’ouverture des données publiques pour évoquée plus haut consacre le principe selon permettre leur réutilisation la plus large est lequel ce qui est mesuré et visible concentre donc un élément d’encouragement au les efforts. En mettant au vu et au su de tous, et développement de l’économie numérique. notamment des citoyens, des données sur Cette dernière est un secteur crucial pour l’action des différentes institutions publiques, l’innovation et l’activité économique, pour la l’Open Data contribuera mécaniquement à croissance, et pour la création d’emplois. faire progresser la qualité et l’efficacité des services qu’ils rendent. Des études ont montré par exemple que le simple fait de mesurer et de rendre public le VJ 4&(!$**5&(!(+-,+56.B7&(! taux de mortalité dans les hôpitaux (ajusté pour 2$7-!%:5#$*$<.&! le risque) permettait d’atteindre des résultats presque similaires à la mise en place de Au-delà de leur impact direct sur le systèmes d’incitations financières82. développement de l’économie numérique, les Du point de vue de la concurrence, la mise en ligne de données produites ou collectées par http://www.strategie.gouv.fr/IMG/pdf/4Productionetemplo le régulateur ou l’autorité de la concurrence i.pdf 78 TechCrunch. 20 août 2010. « Smartphone App Market pourrait permettre aux consommateurs de Reached More Than $2.2 Billion in the First Half of comparer plus efficacement les offres du 2010 ». http://techcrunch.com/2010/08/20/smartphone- marché, ce qui contribuerait à l’amélioration applications-market-size/ du pouvoir d’achat et à un marché des biens et 79 TechCrunch. 5 mars 2010. « Global Smartphone App Download Market Could Reach $15 Billion by 2013 : services plus compétitif. Report ». http://techcrunch.com/2010/03/05/global- smartphone-app-download-market-could-reach-15-billion- En parallèle à la publication des données by-2013-report/ publiques, accessibles à tous selon le modèle 80 GigaOm. 28 mai 2010. « GeoLocal : The Rise of Consumer Location-Based Services ». 82 http://gigaom.com/mobile/geolocal-the-rise-of-consumer- New England Journal of Medecine. 2007, Public location-based-services/ Reporting and Pay for Performance in Hospital Quality 81 Chambre professionnelle des Sociétés de Conseil et de Improvement. January 26, 2007. 356:486-496 Services Informatiques, des Editeurs de Logiciels et des http://www.nejm.org/doi/full/10.1056/NEJMsa064964#t=a Sociétés de Conseil en Technologies. rticleBackground38
    • de l’Open Data, la mise à disposition par les • Soutenir l’enseignement supérieur, laentreprises privées à leurs clients des données recherche, l’innovation.d’usage privées qui les concernent, et ce sous • Favoriser le développement des PMEforme réexploitable, pourrait permettre plus de innovantes.compétition entre fournisseurs de services, en • Accélérer le développement desligne (réseaux sociaux, moteurs de recherche) sciences du vivant.ou non (opérateurs mobiles)83. Ce mouvement • Développer les énergies décarbonéesde « Data Portability »84, ou portage des et l’efficacité dans la gestion desdonnées privées, pourrait donner lieu à une ressources.offre de meilleure qualité pour les • Faire émerger la ville de demain.consommateurs. • Inventer la mobilité du futur. Enfin, une transparence accrue quant à • Investir dans la société du numérique.l’État de l’économie et de la société française Les nouveaux services basés sur lacontribue à recréer un lien de confiance entre réutilisation des données pourraient permettreles agents économiques, lien qui a pu être d’encourager et d’accompagner la mise enéprouvé par la profonde crise économique œuvre de chacune de ces priorités.récente. Au-delà des marchés de l’information En participant au rétablissement de la publique aujourd’hui bien identifiésconfiance des investisseurs, des ménages et des (information légale, géographique, etc.) et deentreprises dans nos institutions, dans la l’économie numérique, les nouvellescapacité de l’économie française à croître et applications de la réutilisation des donnéesdans celle de l’État à financer ses programmes publiques pourraient donner lieu aude politiques publiques, l’Open Data peut donc développement de nouveaux marchés et à lacontribuer à soutenir la stabilité création d’entreprises innovantes. Facilitermacroéconomique de notre pays. l’accès aux données publiques et leur réutilisation par les startups est donc un enjeuVJFJ 9*!S,#+&7-!&!($7+.&*!,78!2-.$-.+5(! du développement de l’entreprenariat de haute(+-,+56.B7&(!&!%:5#$*$<.&!S-,*X,.(&! technologie, et de compétitivité des PME françaises. La réutilisation des données publiquespermet la création de services innovants, qui Le développement durable et la résiliencepeuvent favoriser le développement d’activité de nos sociétés peuvent aussi profiterd’entreprises, et notamment de celles issues de largement d’une réutilisation plus large desl’économie numérique. données publiques. Par exemple, la disponibilité d’informations intermodales Ces services peuvent aussi avoir un impact riches et mises à jour accroît sensiblementindirect fort à moyen et long terme sur l’usage des transports publics. Lel’économie, en contribuant aux grands axes développement des énergies propres eststratégiques d’avenir identifiés pour son conditionné à l’accès à des donnéesdéveloppement. géophysiques de qualité, comme par exemple La commission Juppé-Rocard, dirigée par des mesures d’ensoleillement précises. Leles deux anciens Premiers, a été chargée en partage des données publiques entre services2009 par le président de la République de d’urgences peut aussi faciliter la coordinationformuler des propositions quant aux des réponses aux catastrophes naturelles.investissements d’avenir que la nation pourrait Enfin, une collecte et un partage plus largemettre en œuvre afin de préparer son des données peut favoriser la recherchedéveloppement futur. scientifique et le développement de nouveaux Ses conclusions85 identifient sept grands produits innovants. La recherche en biologiethèmes prioritaires : synthétique ou sur l’impact médical des substances chimiques, par exemple, repose largement sur le partage de résultats d’expérience. L’investissement des puissances83 New York Times, 23 avril 2011. « Show Us The Data publiques pour améliorer la mutualisation et le(It’s Ours After All) ». Richard H. Thaler. partage de ces données est un enjeu dehttp://www.nytimes.com/2011/04/24/business/24view.htm84 Data Portability Project. compétitivité.http://portabilitypolicy.org/index.html85 Alain Juppé, Michel Rocard, 2009, « Investir pour Les deux prochaines sections explorentl’Avenir : Priorités stratégiques d’investissement plus en détail les leviers d’action à traverset emprunt national ». http://www.commission- lesquels la réutilisation des données publiquesinvestissement.fr/IMG/pdf/Rapport_191109.pdf 39
    • pourrait contribuer au développement durable, par des machines et programmes et encourager la croissance des PME informatiques, c’est-à-dire distribuées dans un françaises. format ouvert et structuré. L--M KCC0#!%#!40/$)&04$!)*+,-2$!7*,4-7&%/,#! VJDJ "8&<2%&!M!%&(!$**5&(!27>%.B7&(!,7! (&-?.#&!7!5?&%$22&<&*+!7-,>%&! Les opérateurs de transports publics consacrent des efforts importants à Les applications construites à partir des linformation disponible à quai, en ligne et sur données publiques pourraient contribuer de multiples manières à encourager le mobile. Cependant, nombre dopérateurs et dAutorités Organisatrices de Transports développement durable sous ses différentes conservent encore très largement une approche facettes. en silo de leurs données, ce qui n’est pas L-M D(1#,&))#7#4!%#$!(#0;-#$!)0&)0#$!! favorable à linnovation ouverte que la réutilisation des données publiques permettrait La production d’énergie est soumise à la de mettre en œuvre. Concrètement, cela disponibilité de sources de données fiables signifie que les développeurs indépendants ou permettant de calculer et justifier les les startups qui pourraient se développer ne investissements engagés. C’est peuvent pas réutiliser les données de particulièrement vrai dans le domaine des fonctionnement de réseaux de transports afin énergies propres, et en particulier de la de proposer aux consommateurs des solutions production d’électricité d’origine renouvelable, alternatives aux sites et applications mobiles dont la rentabilité face à l’électricité d’origine officiels, parfois difficiles daccès ou affectés fossile est l’enjeu crucial86. de carences ergonomiques ou technologiques. Un chargé de projets solaires au sein d’un La question de laccès à ces données est grand groupe énergétique Français (anonyme compliquée par une certaine incertitude et non cité parmi les intervenants) nous a juridique concernant leur statut. La société signalé les carences du système de données CanalTP89, filiale de Kéolis qui propose des publiques françaises sur l’ensoleillement solutions dinterconnexion logicielle moyen du territoire, facteur principal de la (middleware) entre systèmes de gestion de rentabilité d’un projet de génération flotte des opérateurs de transports et système photovoltaïque. de calcul ditinéraires, édite le service en ligne Il nous a confié avoir été contraint NAViTiA qui dessert plus de 10 millions de d’utiliser des données issues de la recherche voyageurs par mois. Elle explique que les américaine87, pourtant bien moins précises que différents acteurs publics expriment parfois les données françaises sur le territoire une crainte dans la diffusion des données vers national88. Ces dernières n’étaient tout le marché individuel, car ils redoutent le simplement pas exploitables dans le cadre de piratage informatique et lexploitation de leur algorithme d’estimation de rentabilité d’un données confidentielles qui pourraient projet, car diffusées sous formes d’images fragiliser leur système dinformation numériques plutôt que de données brutes, et voyageurs. donc rendues inutilement complexes à Au-delà de ces craintes, les collectivités réutiliser pour une simple question que nous avons rencontrées expliquent que le d’ergonomie du format utilisé. statut légal et l’accès technique aux données Ce cas illustre au passage une dimension peut être particulièrement complexe dans le essentielle de la réutilisation des données domaine du transport. Des droits de propriété publiques : il ne suffit pas d’avoir des données croisés génèrent une incertitude sur le statut de qualité pour qu’elles soient utiles, encore des données générées dans le cadre de faut-il qu’elles soient facilement exploitables lexploitation des délégations de service public. Leur propriété est souvent revendiquée à la fois par les autorités organisatrices et les 86 Tester, J.W., Drake, E.M., Driscoll, M.J., Golay, M.W. opérateurs. and Peters, W.A. 2005. Sustainable Energy : Choosing Among Options. MIT Press, Cambridge, MA. Des droits de propriété clairs permettraient http://mitpress.mit.edu/catalog/item/default.asp?tid=10566 aux différents interlocuteurs de trouver des &ttype=2 modalités daccord, et in fine dintégrer plus 87 U.S. National Renewable Energy Lab. International largement loffre de transports publics à travers Solar Resource Data. http://www.nrel.gov/csp/troughnet/solar_data.html le territoire français aux grands sites 88 European Union Joint Research Center. Photovoltaic Geographical Information System Interactive Maps. 89 http://re.jrc.ec.europa.eu/pvgis/apps4/pvest.php# CanalTP. http://www.canaltp.fr/40
    • dinformation géographique en ligne. l’efficacité énergétique d’une maison ont vu leLouverture à la réutilisation et la clarification jour, par exemple au Danemark95, grâce à ladu statut des données produites dans ce cadre, mise à disposition de donnéesnotamment à travers les contrats dobjectifs et environnementales.de moyens passés entre autorités organisatrices Pour l’électricité en particulier, les réseauxet opérateurs, entraîneraient une meilleure intelligents (smart grids) reposent en grandeinformation multimodale et favoriseraient partie sur une communication approfondielutilisation des transports en commun par le entre l’ensemble des nœuds du réseau. Auxpublic, préférable à l’usage de la voiture. États-Unis, l’équipe de Data.gov a par exemple L’information intermodale sur les permis la création d’un site d’informationtransports en commun ouvre un champ énergétique ouvert, Open Energynouveau pour le développement d’applications Information96, qui propose des mashupsmobiles, tels le projet Locomote de la société didactiques97 basés sur l’informationIsokron évoqué plus haut. Du fait des énergétique en temps réel.limitations extrêmement strictes d’accès aux Le site de RTE (la société de transportdonnées de la RATP et de l’opérateur de la d’électricité française) fournit aussi uneflotte Vélib, le projet devra cependant se visualisation98 en temps réel de lalimiter largement dans un premier temps à des consommation électrique en France, de latemps de trajets moyens dans Paris. Cela réduit répartition de la production par sourcel’intérêt de l’application, et donc ses chances énergétique, ainsi que des émissions de CO2d’atteindre une échelle qui lui permettrait de qui y sont liées. Ce type d’applicationsfaire bénéficier le grand public d’une permettra à terme d’adapter en temps réel l’étatconsommation plus intelligente des transports du réseau électrique.publics. Dans le domaine du numérique, le Au-delà des seuls transports publics, le mouvement du « green IT », ou technologiesthème des mobilités douces90 et des villes informatiques vertes, cherche à réduire la partdigitales91 est un sujet de recherche de pointe, considérable de la consommation énergétiquenotamment au sein des universités américaines qui revient aux centres de calcul, soulignant(MIT Media Lab92) et des grandes écoles que les applications des données publiquesfrançaises (École des Ponts ParisTech93). Le peuvent elles-mêmes être hébergées et misespôle de compétitivité sur la ville durable en œuvre d’une façon respectueuse deAdvancity94 peut jouer un rôle important dans l’environnement.99le développement et la commercialisation desproduits de ces recherches, dont beaucoup L-1M 87(/;#7#4!%*0/+,#!#4!$*01#-,,/2#!%#!bénéficieraient de la mise à disposition la plus ,3#1-0&#7#4!large des données publiques. Le développement durable passe aussi parL---M I/1&0-$#0!,#$!2&$&77/4-&$!-4#,,-;#4#$! l’aménagement du territoire. En Australie, en#4!,3#CC-2/2-4(!(#0;(4-.*#! application d’une loi de 2007 sur l’information sur l’eau, un sujet éminemment sensible dans À grande échelle, les consommations un pays aride, le Bureau of Meteorology aintelligentes passent aussi par la capacité de annoncé l’ouverture d’un système intégrécalculer les choix les plus efficaces pour les d’information sur l’eau au niveau national100,consommateurs ou les investissements dessociétés. Dans le domaine de la consommationénergétique, des solutions de calcul de 95 HusetsWeb Danemark. http://www.husetseb.dk/about 96 Open Energy Information. http://en.openei.org/wiki/Main_Page90 97 Fioretti, M. 23 octobre 2009. « Walkabitily : Check It Open Energy Information Mashathon 2010.Before Choosing Your Next Home » http://en.openei.org/apps/mashathon2010/ 98http://stop.zona-m.net/2009/10/walkability-check-it- éCO2mix : Consommation, Production et Contenu CO2before-choosing-your-next-home/ de l’Electricité Française.91 Ratti, C. 2 octobre 2009. « Digital Cities : ‘Sense-able’ http://www.rte-france.com/fr/developpement-urban design. » Wired UK Magazine. durable/maitriser-sa-consommation-electrique/eco2mix-http://www.wired.co.uk/magazine/archive/2009/11/feature consommation-production-et-contenu-co2-de-l-electricite-s/digital-cities-sense-able-urban-design francaise92 99 Senseable City Lab, MIT Media Lab. Pascal Faure, Vice Président du Conseil Général dehttp://senseable.mit.edu/ l’Industrie, de l’Energie et des Technologies, explique93 Antoine Picon, chercheur associé au LATTS. l’importance du « green IT » aux assises du numériquehttp://www.enpc.fr/enseignements/Picon/index.html 2009. http://www.dailymotion.com/video/xaov8c_pascal-94 Pôle de compétitivité Advancity. faure-assises-du-numerique-2_news 100http://www.advancity.eu/ http://creativecommons.org.au/weblog/entry/269 41
    • agrégeant des centaines de ressources issues tendance à travers le monde à croître au-delà des administrations nationales et locales. de la catégorie des Petites et Moyennes Entreprises, pour devenir des Entreprises de Face aux déchaînements malheureux de la Taille Intermédiaire.104 nature, un système robuste et complet de données peut jouer un rôle de prévention L’économie française pèche tout (limites de zones inondables, prévisions particulièrement dans cette catégorie, et toute météorologiques) ou aider immensément opportunité d’améliorer cette situation doit être l’effort de secours aux populations sinistrées, agressivement mise en œuvre. dans le contexte de pays développés comme dans des pays en voie de développement101. ______________________ L’accès aux données publiques et les nouveaux services que leur réutilisation pourrait permettre de créer sont donc un élément d’encouragement et de soutien substantiel au développement durable de notre Comme d’autres secteurs stratégiques pour économie. l’avenir de notre économie, le développement durable et l’encouragement à la croissance des VJVJ "8&<2%&!M!9*!,?,*+,6&!#$<2,-,+.S! PME sont donc une priorité de l’action 2$7-!%&!5?&%$22&<&*+!&(!)="! publique, en faveur de laquelle l’ouverture des données publiques et leur réutilisation peuvent La France possède un avantage comparatif jouer un rôle décisif. dans la production de données publiques. L’État ayant historiquement un rôle fort dans l’économie de la nation, il a développé une YJ 9*!*$7?&,7!<$&!:,#+.$*! capacité de production de données de qualité 27>%.B7&! dans de nombreux domaines de l’économie et de l’action publique. Les implications de l’ouverture des données publiques à la réutilisation De plus, certaines données françaises s’apprécient mieux à la lumière de l’histoire répondent à une demande commerciale forte à économique des technologies de l’information. l’international. Dans le domaine de la culture, la reconnaissance dont bénéficient les œuvres Deux analogies techniques sont françaises se traduit par des fréquentations en particulièrement riches d’enseignements pour ligne très importantes. Par exemple, avec plus mieux comprendre les nouveaux modes de 2 millions de téléchargements dont 60 % en d’action publique à l’ère numérique : la notion provenance des États-Unis,102 l’application d’ « infrastructure informationnelle », trans- « Musée du Louvre » est la plus téléchargée posée immatérielle de l’infrastructure bâtie du parmi les lauréats de l’appel à projet Proxima monde réel, d’une part ; et le paradigme de Mobile. l’État repensé comme une plateforme logicielle (“government as a platform”), d’autre part. Développer cet avantage comparatif est particulièrement intéressant pour deux raisons. Il permet d’une part, en soutenant le YJCJ 9*&!.*S-,(+-7#+7-&!#$6*.+.?&!2$7-! développement d’entreprises qui nécessitent %:5#$*$<.&!&!%:.*S$-<,+.$*! une expertise locale forte, de créer des emplois La mise en ligne des données publiques difficiles à délocaliser103, car tributaires d’une n’est pas qu’un service fourni aux administrés connaissance fine du contexte français, culturel parmi d’autres : elle constitue pour l’économie en l’espèce. de l’information une forme d’infrastructure, D’autre part, il permet de soutenir un « informationnelle » ou « cognitive105 ». secteur, l’économie numérique, dont les Rufus Pollock, économiste à l’Université entreprises à succès ont structurellement de Cambridge et membre fondateur de l’Open 101 OWNI.fr. 12 décembre 2010. « Partage des Données pour Mieux Réagir Face aux Catastrophes Naturelles ». 104 http://owni.fr/2010/12/12/partager-des-donnees-pour- Be nhamou, B., 2010, « Eléments pour une stratégie mieux-reagir-face-aux-catastrophes-naturelles/ numérique européenne », Délégation aux Usages de 102 Source Proxima Mobile et entretien avec Bernard l’Internet, 15 mars 2010. 105 Benhamou les 8 octobre, 16 novembre et 14 décembre Henri Verdier. 24 février 2009. « Stimulus package : les 2010. américains construisent une infrastructure cognitive ». 103 Entretien avec Bernard Benhamou les 8 octobre, 16 http://www.henriverdier.com/2009/11/stimulus-package- novembre et 14 décembre 2010. les-americains.html42
    • Knowledge Foundation, en propose une établies au début du XXe siècle en réponse audéfinition métaphorique106 : développement des premiers monopoles naturels de réseaux : réseau de raffinage avec « L’importance potentielle des la Standard Oil, réseaux de transports avec les données publiques se mesure (…) à l’aune chemins de fer, mais aussi déjà réseaux d’une analogie simple mais forte de sens : d’information avec le télégramme et téléphone. de même que la mise en place d’une infrastructure matérielle fondamentale La révolution informatique doit conduire (réseaux d’électricité, de transports, de l’État à assurer une forme de régulation dans la télécommunications) est essentielle à sphère de l’information. La mise à disposition l’économie traditionnelle, la mise en place de données permet de donner corps à de d’une « infrastructure » informationnelle nouvelles offres de services et de nouveaux et cognitive fondamentale (ensembles de marchés, et est donc un outil essentiel d’action données dans les secteurs critiques : de l’État en faveur de l’économie numérique. géographie, météorologie, transport, etc.) Cette évolution, en réponse aux ruptures est essentielle à l’économie de l’ technologiques et sociologiques fortes issues « information »107. du numérique, est finalement assez naturelle. Dans ce sens, les données publiques sont Le rôle de garant de l’efficience sociale estcruciales comme socle d’un nouveau mode constitutif de l’action publique et ded’action publique, et comme infrastructure l’administration, qui doit se préoccuper certesfondamentale pour le développement de la d’efficacité interne, mais aussi et surtoutsociété numérique. d’efficience sociale109.YJFJ O,!-567%,+.$*!&(!<$*$2$%&(! YJDJ O&!<$I%&!&!%:Q+,+!#$<<&!2%,+&S$-<&!.*S$-<,+.$**&%(! *7<5-.B7&!ZQ![&1#07#4!/$!/! X,/4C&07!S[! À la mission de fournisseur de donnéess’ajoute désormais pour l’État celle de L’un des enjeux majeurs de la troisièmerégulateur d’un genre nouveau, en charge d’un révolution industrielle pour l’administration estchamp de responsabilité analogue et de s’approprier les modèles économiques et lessymétrique à celui qu’il assure dans le domaine formes d’action caractéristiques du numérique.de la concurrence. « [Nous aimerions voir] des politiques Il s’agit de s’assurer que les données, publiques [adopter une certaine] sérénité dansressources essentielles au bon fonctionnement leur rapport au numérique, ni fascinant nide l’économie numérique, ne sont pas menaçant, simplement un outil précieux, dontaccaparées, ni par le secteur privé (se reporter les logiques profondes recèlent de nouveauxà ce sujet au scénario « Capture » du mécanismes de pensée et d’action, et qu’il fautchapitre VIII), ni par la puissance publique savoir utiliser à sa juste place110 » expliquedans l’hypothèse où la réutilisation des Henri Verdier, Président du pôle dedonnées se ferait dans des conditions légales et compétitivité Cap Digital.tarifaires discriminatoires.108 Pour ce faire, l’État peut s’inspirer des La révolution industrielle avait conduit les leçons tirées de l’émergence des grandesÉtats à développer des politiques et un droit de plateformes informatiques, caractéristiques dela concurrence, comme les lois antitrust la révolution numérique. On entend par plateforme tout système106 informatique qui agit comme un socle, Rufus Pollock. 2 décembre 2008. « The Economics ofPublic Sector Information. » University of Cambridge permettant le développement d’extensions etDepartment of Economics. d’applications tierces qui proposent dehttp://www.rufuspollock.org/economics/papers/economics nouveaux services en son sein._of_psi.pdf107 Texte original (traduction des auteurs) : Internet, système décentralisé d’échange de “The potential importance of (public sector) documents sur lequel des suites logicielles information can also be gauged from a simple but significant analogy: just as the supply of entières ont été portées et même inventées, est basic physical infrastructure (power, transport, telecommunications) is essential to the 109 traditional economy, so the supply of basic Jean-Claude Thoenig, 4 septembre 2010, conférence information `infrastructure’ (core datasets in the donnée aux élèves du corps des Ponts, Eaux et Forêts. 110 major areas of geography, weather, transport Henri Verdier, 24 février 2009, « Stimulus package : les etc) is essential to the `information’ economy.” américains construisent une infrastructure cognitive».108 Rufus Pollock, 2008, « The Economics of Public Sector http://www.henriverdier.com/2009/11/stimulus-package-Information. » les-americains.html 43
    • une plateforme. Le système d’exploitation substantiellement le logiciel jusqu’à un stade Windows, couplé au standard informatique avancé du développement. IBM/PC, mais aussi plus récemment, les couples Android/Android Market de Google et L---M H&2#1&-0!#4!),/-C-#0!#!$#!)0(&22*)/4! iPhone/App Store d’Apple, à partir desquels %#!,/!)/04-2-)/4-&! des milliards d’applications mobiles ont été Une leçon majeure du Web 2.0 est que la téléchargées, sont d’autres exemples. notion de participation et d’interaction sociale Tim O’Reilly, philosophe, éditeur autour et au sein d’un service en ligne ne d’ouvrages techniques à succès, investisseur en saurait être ajoutée après coup en extension capital-risque et expert reconnu de la société d’un projet préexistant, mais doit au contraire de l’information, tire111 sept leçons de être intégrée dès sa conception. l’histoire de l’informatique, dont les politiques Dans le domaine de la mise en ligne des d’e-administration au niveau territorial et données, il est important d’intégrer la capacité national pourraient s’inspirer. à commenter, référencer et échanger de l’information autour des jeux de données dès L-M "#$!$4/%/0%$!&*1#04$!;(W0#4!,3-&1/4-&! les premières phases des projets de portails #4!,/!20&-$$/2#! Open Data, et de prendre en compte les Les standards ouverts (structuration des attentes de la communauté des réutilisateurs. données selon des normes de format communes et non propriétaires) permettent L-1M 8))0#%0#!#!&+$#01/4!,#$!*4-,-$/4#*0$!,#$! l’interopérabilité. Ils lubrifient figurativement ),*$!#!)&-4#! les rouages de l’échange numérique, de la Eric von Hippel, professeur au MIT, parle même manière qu’à la Révolution d’utilisateurs « en pointe » (lead users) pour l’instauration du système métrique (exemple désigner les quelques utilisateurs les plus éminent d’infrastructure cognitive) a permis de avancés d’un service en ligne, qui pointent sécuriser et développer le commerce au sein de souvent vers ses futures évolutions possibles et la République naissante. révèlent les idées de fonctionnalités dont l’intérêt n’est pas encore apparent à tous. L--M H&$40*-0#!*!$Y$4W7#!$-7),#!#4!,#!,/-$$#0! (1&,*#0! L’exemple de l’API Google Map, facteur majeur du succès de ce produit, mais qui n’a La propension des maîtres d’ouvrage de été exposée officiellement au public qu’après systèmes d’information dans le secteur public avoir observé un utilisateur qui avait à consacrer des mois voire des années entières développé son propre système de placement à spécifier l’ensemble des fonctionnalités de d’objets sur les cartes Google, est édifiant à cet leurs projets (en partie due à la lourdeur des égard. processus de marchés publics) retarde chroniquement le développement de nouvelles Au lieu de lui intimer l’ordre de cesser solutions, forçant les agents à fonctionner dans cette utilisation imprévue et non conforme de l’entre deux et le provisoire, avec des solutions l’outil technique, l’entreprise embaucha techniques en retard de phase sur les attentes l’ingénieur en question pour développer une des citoyens. version commerciale de ce système de placement d’objets géographiques sur carte en Il serait bien plus judicieux d’adopter ligne. Sa qualité et sa facilité d’utilisation sont l’approche incrémentale popularisée par les à l’origine du succès de Google Maps, méthodes de développement agile, prévalant hégémonique dans le domaine de la aujourd’hui en Silicon Valley et dans les cartographie en ligne. équipes d’ingénieurs travaillant à l’état de l’art. L’administration doit prendre en compte la L’administration doit de même s’inspirer valeur d’option112 inhérente à la capacité des utilisations originales qui seront faites de d’évolution rapide que cette approche rend ses données, les encourager, et même les possible, et la possibilité qu’elle offre reprendre à son compte. d’incorporer plus facilement les retours de futurs utilisateurs confrontés aux premières L1M H&,,#24#0!%#$!%&(#$!%3*$/;#!)&*0!7-#*A! versions de test, afin d’améliorer )0&C-4#0!%#!,3&*1#04*0#!%#$!%&(#$! Il est important de mesurer la fréquentation 111 et l’utilisation qui est faite des sites de Tim O’Reilly, 2010, « Government As A Platform. » Chap. 1 dans Open Government. O’Reilly éditions. l’administration (c’est par ailleurs un type de http://opengovernment.labs.oreilly.com/ donnée publique qui est encore rarement 112 http://fr.wikipedia.org/wiki/Analyse_par_les_options_r accessible). %C3%A9elles44
    • Le comportement des utilisateurs sur un L1--M D-0-;#0!#!7&40/4!,3#A#7),#=!site ou une application est de fait un type En conclusion, il s’agit pour l’État deimplicite de participation à l’évolution d’un s’approprier les leçons des évolutionssystème, qu’il faut utiliser à bon escient pour technologiques et économiques de nosmieux répondre aux attentes implicites et aux sociétés, et de devenir un acteur de la diffusionbesoins latents. de ces nouveaux modes de pensée au sein de la société, en menant le mouvement parL1-M 8+/-$$#0!,#$!+/00-W0#$!T!,3#A)(0-7#4/4-&! l’exemple. La capacité pour les acteurs de la société et Les données publiques sont un outil de lade l’économie numérique d’expérimenter démocratie exemplaire et contribuent aufacilement est une condition nécessaire et renforcement de la transparence de l’action ded’importance cruciale pour l’émergence de l’État. Leur réutilisation soutient l’innovation,nouvelles applications originales et utiles aux encourage la recherche et favorise l’émergencecitoyens. de l’Internet de demain. La communauté des L’État et les producteurs de données développeurs et des entrepreneurs peut lespubliques doivent donc s’attacher à abaisser le réutiliser pour inventer de nouveaux usages etplus possible les barrières et les cloisons créer de nouveaux services aux citoyens.artificielles qui pourraient s’opposer au Elles forment une infrastructuredéveloppement de services innovants à partir informationnelle fondamentale pour la sociétédes données publiques. numérique. Le rôle de garant de l’efficience Il lui faudra notamment clarifier les sociale de leur réutilisation est une extensionconditions légales de réutilisation, mettre en naturelle du rôle de la puissance publique,place les modèles économiques permettant la qu’elle doit saisir avec ambition etréutilisation la plus large possible, et détermination.encourager l’expérimentation par lesentrepreneurs, les startups et les acteursinnovants de l’économie numérique. 45
    • ),-+.&!FJ!Q+,+!&(!%.&78!&!%,!-57+.%.(,+.$*!&(! $**5&(!27>%.B7&(!&*!-,*#&!! 47
    • N0,2.+-&!;]J! O&!#,-&!&!%,!-57+.%.(,+.$*!&(!$**5&(!27>%.B7&(!&*!-,*#&! L’Open Data est un mouvement global, qui CJFJ N,-&!E7-..B7&!&7-$25&*!!trouve une résonance forte au sein des Au niveau européen, la mise à dispositioncommunautés de développeurs à travers le des données publiques et le droit à leurmonde. Il s’est plus particulièrement réutilisation sont régis par trois sourcesdéveloppé dans les pays anglo-saxons, législatives.notamment à la suite des initiatives data.govaux États-Unis, et data.gov.uk en Grande- • La directive européenne 90/313/CEEBretagne. concernant l’accès aux données La loi française, en transcrivant en 2005 la environnementales de 1990 qui adirective européenne « PSI » de 2003 sur les abouti sur la Convention d’Aarhus eninformations du secteur public, a instauré une 2002, transcrite en 2003 dans laobligation d’ouverture et un droit à la directive européenne 2003/4/CE et enréutilisation des données publiques. Ce 2005 en droit français.chapitre dresse un état des lieux du cadre • La directive européenne PSIjuridique et réglementaire, puis des acteurs n° 2003/98/CE du 17 novembre 2003institutionnels de l’ouverture et de la concernant la réutilisationréutilisation des données publiques en France. des informations du secteur public, transposée en droit français par l’ordonnance n° 2005-650 du 6 juinCJ O&!#,-&!E7-..B7&!2$(&!&*! 2005 relative à la liberté d’accès aux2-.*#.2&!%,!%.>&-+5!&! documents administratifs et à la réutilisation des informations-57+.%.(,+.$*! publiques. Cette directive est en cours de réexamen pour la deuxième fois.CJCJ )-.*#.2&!&!-57+.%.(,+.$*! • La directive européenne Inspire n° 2007/2/CE du 14 mars 2007 Le droit français établit le principe de la établissant une infrastructureréutilisation libre et gratuite des données d’information géographique dans lapubliques. Les conditions d’accès à un Communauté européenne, transposéedocument administratif, ou de réutilisation en droit français par l’ordonnanced’une information publique, aux sens définis n° 2010-1232 du 21 octobre 2010par la loi, peuvent faire l’objet d’une requête dans les articles L. 127-1 à L. 127-10auprès de la Commission d’Accès aux du code de l’environnementDocuments Administratifs (CADA). introduits. La possibilité reste offerte aux Les principes posés par le droit européenadministrations de soumettre à une redevance sont que les données publiques doivent êtrele droit de réutilisation des jeux de données accessibles et réutilisables, à des finspour lesquels cela s’avérerait nécessaire. Toute commerciales ou non, d’une manière nonnouvelle redevance sera cependant désormais discriminatoire et non exclusive à des tarifs quiarrêtée par décret, donc encadrée par le n’excèdent pas leur coût de mise à dispositionPremier ministre113. et éventuellement de production.113 Regards sur le Numérique, 17 mars 2011,« Data.gouv.fr : La France va se lancer en version bêtaavant fin 2011 ».http://www.rslnmag.fr/blog/2011/3/17/_data-gouv-fr_la-france-va-se-lancer_en-version-beta_avant-fin-2011/ 49
    • Directive Environnement PSI Inspire Année 1990 2003 2007 Données Données Toute donnée ou Données spatialesconcernées environnementales document public diffusé Documents non finis, Données personnelles, protection Documents non finis, Données Propriété intellectuelle d’un de l’environnement, document non statistiques ou délibération de exclues tiers, statistiques ou fini ou couvert par un secret, l’État délibération de l’État propriété intellectuelle d’un tiers Toute autorité publique détentrice Tout organisme, public ou État de données géographiques ou Par qui privé, ayant une mission de hors services commerciaux prestataire mandaté par une autorité service public. et hors services culturels publique Obligation de créer : Cataloguer les ressources - métadonnées, services de recherche Tarifs bornés par les Comment mais sans métadonnées et de visualisation, gratuitement. coûts précises - des services de téléchargement et de transformation. La réutilisation La réutilisation Le plan cadastral reste la Limites commerciale est laissée à la commerciale n’est pas traitée. référence du bâti et du parcellaire discrétion des États. Depuis, différentes modifications ont été La révision de la directive PSI apparaissait proposées, comme par exemple « d’étendre le comme prématurée en 2008 lorsque la champ d’application de la directive de manière Commission en a étudié l’opportunité. à obliger les organismes publics à autoriser la « La majorité des États membres ayant réutilisation, d’imposer la tarification fondée participé à la consultation estiment qu’il sur les coûts marginaux, d’établir des listes est prématuré de modifier la directive et nationales des ressources et d’obliger les États préfèrent qu’un délai supplémentaire soit membres à présenter des rapports annuels à la accordé pour permettre sa totale mise en Commission »114. Des précisions ont œuvre. Les organismes du secteur public également été demandées « sur certains termes jugent que le cadre actuel fourni par la de la directive […] trop ambigus, tels que les directive donne satisfaction. » définitions des documents, des missions de service public, de la tarification fondée sur les Cependant, la Commission procède à coûts marginaux ou du retour sur l’heure actuelle à un réexamen qui pourrait investissement raisonnable. » mener à une initiative législative d’ici la fin de l’année, et à une révision éventuelle de la Directive PSI. 114 Commission Européenne, 2009, CJDJ N,-&!E7-..B7&!S-,*X,.(! « Réutilisation des informations du secteur Le principe de réutilisation des données public: Réexamen de la directive publiques peut se trouver un fondement 2003/98/CE ». 7 mai 2009. constitutionnel dans les articles XIV et XV de http://eur- lex.europa.eu/LexUriServ/LexUriServ.do?uri= COM:2009:0212:FIN:FR:PDF 50
    • la déclaration des droits de l’homme et du Selon ces textes, les producteurs decitoyen de 1789115 : données publiques sont donc l’État, les collectivités territoriales (Régions, Article XIV : Tous les Citoyens ont le droit Départements et Communes), et les autresde constater, par eux-mêmes ou par leurs personnes morales de droit public ou privéReprésentants, la nécessité de la contribution chargées d’une mission de service public quipublique, de la consentir librement, d’en ne soit pas à caractère industriel ousuivre l’emploi et d’en déterminer la quotité, commercial.l’assiette, le recouvrement et la durée. Les établissements d’enseignement et de Article XV : La Société a le droit de recherche et les établissements, organismes oudemander compte à tout Agent public de son services culturels bénéficient par ailleurs d’unadministration. régime dérogatoire quant aux modalités et à La réutilisation des données publiques est l’application de ce droit de réutilisation desdésormais un droit régi par la loi et les données publiques.dispositions réglementaires, et d’éventuelles Les données publiques elles-mêmes sontconditions qui seraient spécifiques au jeu de définies de façon large puisqu’il s’agit desdonnées en question, précisées dans une « informations figurant dans des documentslicence détaillant le cadre de réutilisation. produits ou reçus par les administrations mentionnées à larticle 1er, quel que soit leL-M D#!,/!,&-!%#!]^_!$*0!,3/22W$!/*A!%&2*7#4$!/%7--$40/4-C$!T!,/!40/$)&$-4-&!%#!,/! support. » À l’origine, la loi de 1978 visait les%-0#24-1#! documents administratifs tels que les rapports, notes, études, à l’exception des documents La mise à disposition des données destinés à nourrir les réflexions des autoritéspubliques est désormais régie par l’ordonnance gouvernementales avant que celles-cidu 6 juin 2005, transposant la directive n’arrêtent leur décision (secret du délibéré de2003/98 du 17 novembre 2003, et modifiant la l’État)116.loi « CADA » n° 78-753 du 17 juillet 1978. Elle couvre désormais les données Le législateur a tenu à souligner géographiques, les statistiques, les mesures etl’importance du sujet puisque c’est le titre relevés scientifiques, les budgets détaillés, etc.même de la loi de 1978 qui a été modifié, « la lorsque ces données ne sont pas couvertes parliberté daccès aux documents administratifs » un secret déterminé.devenant désormais « la liberté d’accès auxdocuments administratifs et la réutilisation des L--M X0&4#24-&!%#!,/!1-#!)0-1(#!informations publiques ». Hormis les exceptions mentionnées ci- Deux autres dispositions ont complété cet dessus, la principale limite posée à laensemble réglementaire. Un décret n° 2005- réutilisation des données publiques concerne1755 du 30 décembre 2005 a été pris en les informations personnelles, et celles dont laapplication de l’ordonnance afin d’en préciser mise à disposition serait susceptible d’affecterles modalités d’application, et notamment de la vie privée de citoyens.permettre une réutilisation à des finscommerciales autant que non commerciales. Sur ce point, la primauté de protection desEnfin, une circulaire du Premier Ministre données personnelles est garantie, tout enn° 5156/SG du 29 mai 2006 a apporté un préservant le principe de la liberté decertain nombre de précisions. réutilisation des données publiques. Leur réutilisation n’est possible que dans deux Le principe général posé par ces textes est hypothèses : si la personne intéressée y aclair : c’est celui de la réutilisation libre et consenti, ou si le producteur des données est engratuite des informations publiques. Au sens mesure de les rendre anonymes. Si ces deuxde la législation française, les informations conditions étaient impossibles à réunir, la loipubliques sont les informations contenues dans précise que le législateur a toujours lales documents administratifs tels que définis possibilité d’accorder une autorisationpar la loi « CADA », produites ou reçues par spécifique au cas par cas.un acteur public ou privé dans l’exercice d’unemission de service public, hors service publicindustriel ou commercial.115 116 http://www.assemblee- Pour plus d’informations, consulter le site de lanationale.fr/histoire/dudh/1789.asp CADA : http://www.cada.fr/fr/guide/center4b1.htm 51
    • L---M X/$!%3#A2,*$-1-4(! Legifrance, qui est gratuite en deçà d’un La dernière limite imposée par le certain seuil de volume et payante au-delà. législateur prend tout son sens avec le passage L1M "#!0(;-7#!%(0&;/4&-0#!%#$!%&(#$! à l’ère numérique, notamment au regard des $2-#4-C-.*#$!#4!2*,4*0#,,#$=! principes de neutralité d’Internet et du développement d’un marché concurrentiel En ce qui concerne les données publiques dans le secteur des communications. Aucune d’enseignement, de recherche et culturelles, administration ne peut accorder de contrat c’est-à-dire notamment toutes les données d’exclusivité pour la réutilisation de ses dépendant du ministère de la culture, dont les données, sauf si cette exclusivité est nécessaire archives, il convient de rappeler que les à l’exercice de sa mission de service public. dispositions de la loi n° 78-753 du 17 juillet Dans tous les cas, cette exclusivité devra alors 1978 leur concèdent un régime dérogatoire. être révisée tous les trois ans. En effet, selon l’article 11 de cette loi, les conditions de réutilisation des informations L-1M 6#%#1/2#!#4!,-2#2#! contenues dans des documents élaborés ou Le législateur a également prévu détenus par des établissements, organismes ou l’hypothèse d’une administration qui services d’enseignement, de recherche ou du souhaiterait soumettre ses données à domaine de la culture peuvent être librement redevance. Considérant cette modalité comme fixées par ces derniers117. légitime, il ne l’a soumise qu’à la seule Une difficulté vient du fait que les données condition que cette mise à disposition soit alors culturelles sont très fréquemment grevées de soumise à une licence publique, proposée à droits de propriété intellectuelle envers des tous, et non discriminatoire, et que le montant tiers (artiste, photographe, etc.), ce qui a pour de la redevance ne dépasse pas un retour effet d’en compliquer le droit à réutilisation. raisonnable sur investissement pour l’institution productrice. Ce régime dérogatoire découle des exceptions consenties dans les textes Dans cette hypothèse de mise à disposition européens : la directive PSI exclue de son payante des données publiques, une licence est champ d’application les organismes culturels, obligatoire afin de clarifier l’étendue des droits d’enseignement et de recherche, ainsi que les conférés aux réutilisateurs. Lorsqu’il n’y a pas radiodiffuseurs publics. de redevance, une licence n’est pas obligatoire et l’administration choisit souvent un simple Néanmoins au cours de son réexamen en rappel des conditions de réutilisation fixées par 2008, cette question était revenue à l’ordre du la loi. jour. Un « comité des sages », nommé par la Commission européenne sur la mise en ligne Cependant, l’administration peut aussi du patrimoine culturel européen, a remis début diffuser ses données selon des licences qu’elle 2011 des conclusions118 qui vont fortement établirait elle-même afin de garantir une dans le sens d’une plus large ouverture à la meilleure information aux réutilisateurs, et réutilisation des données culturelles. Le sujet d’assurer leur sécurité juridique. En effet, le pourrait donc évoluer à l’occasion d’une problème est souvent soulevé, notamment par éventuelle révision de la directive PSI. les jeunes sociétés innovantes qui doivent se justifier sur ce point dans leurs dossiers de financement. Dans la mesure où les données sont librement réutilisables, elles peuvent alors être intégrées dans tous les projets sous licences libres compatibles (type GPL, MIT, Creative 117 Commons etc.). Une démarche exploratoire visant à généraliser la réutilisation des données a été mise en œuvre : Ministère Finalement, il est également possible pour de la Culture, 2008, « Partager notre patrimoine culturel : l’administration de proposer une solution Propositions pour une charte de la diffusion et de la réutilisation des données publiques culturelles mixte, avec simultanément un accès libre et numériques”. gratuit aux données et un accès payant mais http://www.culture.gouv.fr/mcc/content/download/5331/35 qui impliquerait des services supplémentaires. 792/version/1/file/CHARTE_BOL_21082009noirblancVA C’est par exemple le cas de la licence fixée L-1.pdf 118 Reflection group on bringing Europe’s cultural heritage pour la réutilisation en masse des données online, 2011, “The New Renaissance: Report of the légales et réglementaires via l’API du site ‘Comité des sages”. http://ec.europa.eu/information_society/activities/digital_li braries/doc/refgroup/final_report_cds.pdf52
    • FJ O&(!,#+&7-(!&!%,! industriel et commercial, entrent dans le périmètre des données publiques réutilisables.-57+.%.(,+.$*!&!$**5&(! La mise à disposition de ces données pour27>%.B7&(! réutilisation est cependant un sujet complexe, Le processus de réutilisation des données car les limites du caractère commercial oupubliques implique trois types d’acteurs : des industriel d’un service public peuvent êtreproducteurs, des réutilisateurs, et des instances floues et discutables. En mettant des donnéespubliques de contrôle, de pilotage et de mise liées à leur fonctionnement à la disposition duen œuvre de cette politique publique. public, les entreprises peuvent craindre de communiquer des informations qui devraient relever du secret commercial.FJCJ O&(!2-$7#+&7-(!&!$**5&(! Au-delà de ces craintes, la démarcheL-M "#$!/24#*0$!)*+,-2$! d’ouverture de données n’est pas spontanément naturelle, et les grandes entreprises les plus Les administrations (centrales, ou concernées (SNCF, RATP, La Poste) serontdéconcentrées), les collectivités territoriales et probablement amenées à évoluerles établissements publics à caractère graduellement sur le sujet, grâce aux exemplesadministratif (EPA) produisent et reçoivent vertueux mis en avant par la communauté deune quantité considérable de données réutilisateurs, et à mesure que les bénéficespubliques, puisque ces dernières représentent potentiels d’une telle mise à disposition leurpar définition l’ensemble de la « matière apparaîtront plus clairement.première » à partir de laquelle l’administrationtravaille. L---M "/!0#2:#02:#!$2-#4-C-.*#!! Ces données sont produites dans un Les chercheurs sont par nature descontexte de « monopole naturel » du fait de la collecteurs voire des producteurs de données,position de l’administration pour réaliser et des plus élémentaires aux plus complexes. Lesuivre l’exécution des politiques publiques ou monde de la science est de plus régi par lepour la collecte d’indicateurs de pilotage. Elles principe de la publication : la reconnaissancesont uniques et ont souvent une forte valeur. d’un scientifique passe par les résultats qu’ilMalgré les difficultés liées à la qualité de publie et qu’il soumet à la communautédonnées inhérentes à tout système scientifique.d’information de grande envergure, cesdonnées sont généralement fiables, précises, Pour donner de la visibilité à la productioncomplètes et de qualité. scientifique, et en allant dans le sens d’une dynamique globale120, le Centre National de Les fonctionnaires et agents de ces Recherche Scientifique (CNRS) s’est lancé àinstitutions, qui connaissent très bien les partir de 2000, dans le développementmétiers de leur organisation, ont un rôle d’archives ouvertes via Internet. La baseimportant à jouer dans l’identification, le HAL121, comme « Hyper article en ligne » estrecensement et la qualification des données un site sur lequel les chercheurs peuvent venirpubliques. En Grande Bretagne, « les déposer directement leurs articles. « Ouverte àfonctionnaires dans les administrations ont toutes les disciplines, en progression constante,identifié les bases de données à ouvrir et les la plateforme HAL reçoit actuellement environont proposées aux coordinateurs de projets, 1 800 nouveaux articles chaque mois, soit prèsparfois en contournant une hiérarchie peu au d’un quart de la production scientifiquefait de l’intérêt de la démarche, voire française. »122hostile119 ».L--M "#$!#40#)0-$#$!#A#0`/4!*#!7-$$-&!%#!$#01-2#!)*+,-2! 120 D’après le site Internet du CNRS : « un mouvement Dans les limites indiquées plus haut, les international en faveur de la communication scientifiquedonnées produites par un établissement public directe sur Internet initié dans les années 90 par leou une entreprise privée, dans le cadre d’une physicien Paul Ginsparg. Ce scientifique américain a été le premier à mettre au point une archive ouverte, « ArXiv »,mission de service public autre qu’à caractère consacrée à l’origine aux articles de physique et devenue progressivement l’archive internationale de référence en physique, mathématiques, informatique et certaines119 Valérie Peugeot : « Les enjeux publics, économiques et spécialités de biologie. » 121citoyens de l’ouverture des données : l’expérience Entretien avec Stéphane Cottin, Secrétariat général dubritannique » gouvernement. 122http://academia.edu.documents.s3.amazonaws.com/18509 http://www.ambafrance-cn.org/L-archive-ouverte-87/CommunicationDocSoc2010_VPeugeot_opendata.pdf HAL-plus-de-100-000-articles-scientifiques-en-ligne.html 53
    • Au-delà des articles scientifiques, le chargée de veiller au respect de la préservation mouvement d’ouverture des données brutes des droits de la vie privée et des libertés dans touche de plus en plus le monde de la un monde numérique, peut être saisie, ou se recherche. Les grands journaux scientifiques saisir d’elle-même, de tout projet ou des demandent notamment aujourd’hui aux auteurs démarches de réutilisation de données de publier, en parallèle à leurs conclusions, les publiques, quand ces données présentent des données brutes issues de leurs expériences. implications en matière de vie privée et de données personnelles. Notamment, en parallèle FJFJ O&(!.*(+.+7+.$*(!&!%,!-57+.%.(,+.$*!&(! à la Commission du Secret statistique de $**5&(!27>%.B7&(! l’INSEE, elle veille à l’anonymisation des données ou des statistiques qui pourraient L-M "/!H&77-$$-&!%3822W$!/*A!D&2*7#4$! révéler des informations personnelles. 8%7--$40/4-C$!LH8D8M! La Commission d’Accès aux Documents FJDJ O,!#$<<7*,7+5!&(!-57+.%.(,+&7-(! Administratifs (CADA)123 est une autorité administrative indépendante. Ses statuts ont été L-M "#$!2-4&Y#$! modifiés par le décret n° 2005-1755 Chaque citoyen peut récupérer des données du 30 décembre 2005 relatif à la liberté publiques et les enrichir avec des données d’accès aux documents administratifs et à la personnelles ou en les combinant avec d’autres réutilisation des informations publiques. données ouvertes. Il peut les utiliser à titre La CADA joue un rôle consultatif et peut personnel ou en tant que producteur de être saisie de requêtes lorsqu’un citoyen juge données au profit de la collectivité. non conformes à la loi les conditions d’accès Des développeurs informatiques passionnés ou de réutilisation qui lui sont imposées. Elle appliquent leurs compétences à la réutilisation peut intervenir au profit des utilisateurs faisant et à la visualisation des données publiques. face à un refus de réutilisation d’informations Souvent issus des communautés organisées publiques, ou répondre aux sollicitations des autour du développement de logiciels libres, administrations demandant des conseils sur le ces développeurs sont aujourd’hui des parties caractère communicable ou réutilisable des prenantes essentielles au mouvement documents. d’ouverture des données. Leurs réalisations Bien qu’intervenant pour tous les illustrent les possibilités liées à l’Open Data. documents détenus par un service de l’État, Ainsi, le météorologue et prévisionniste une collectivité territoriale, un établissement Guillaume Séchet a pu créer à partir de relevés public ou un organisme chargé de la gestion personnels son propre site de prévisions d’un service public, qu’il soit public ou privé, météorologiques pour Paris, MétéoParis. À son rôle reste limité aux documents partir d’une base de données historiques sur les administratifs et aux informations publiques. événements climatiques en France, il diffuse En 2009, les problèmes ayant trait à la en ligne lui-même (service Web et mobile) ses réutilisation des données ont représenté prévisions météorologiques personnelles. seulement 5 % du total des demandes L--M "#$!2:#02:#*0$! adressées à la CADA124. Dans ces cas-là, l’intégralité des réponses a été favorable aux Comme mentionné plus haut, le monde de réutilisateurs. la recherche a joué un rôle essentiel dans l’éclosion du mouvement de l’Open Data. L--M HaZ"! La réutilisation de données produites ou Par ailleurs, la Commission Nationale de mises en commun par d’autres chercheurs a été l’Informatique et des Libertés (CNIL)125, historiquement, et plus encore aujourd’hui, un élément important du succès de grands projets 123 scientifiques, du séquençage du génome Commission d’Accès aux Documents Administratifs humain au développement du répertoire http://www.cada.fr/ 124 Martinez, 2010, « Topic report : PSI reuse in France, standards de « pièces » de génome et protéome overview and recent developments ». utilisé en biologie synthétique126. http://www.epsiplatform.eu/topic_reports/topic_report_no Aujourd’hui, avec des capacités de _10_psi_re_use_in_france_overview_and_recent_develop traitement toujours plus importantes, les ments 125 La CNIL a été créée par la loi n° 78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés, 126 BioBricks (« repository of parts for synthetic biology ») modifiée en 2004. http://www.cnil.fr/la-cnil/ http://biobricks.org54
    • possibilités offertes par l’ouverture des groupe de travail spécifique et très actif surdonnées offrent un champ de recherche l’ouverture des données publiques128.considérable. Pour cette raison, l’INSEE, dans La réutilisation des données s’adresse biensa politique de mise à disposition des données sûr aux acteurs les plus établis de l’économie,statistiques, propose un service spécifique et notamment les grandes entreprises desdédié à la recherche via le centre QUETELET secteurs de l’information, qui peuvent utiliserlié au CNRS127. L’IGN fait de même. la donnée publique pour améliorer leurs processus productifs.L---M "#$!/24#*0$!/$$&2-/4-C$!! Plusieurs associations ou collectifs se sont Parce qu’elle représente un fort potentieldonnées pour objectif d’encourager à la mise d’innovation, la donnée publique est unen ligne des données publiques au niveau ingrédient particulièrement important dunational comme au niveau local, comme développement de startups et de jeunesRegards Citoyens, LiberTIC ou la FING entreprises innovantes de l’économie(Fondation Internet Nouvelle Génération). numérique. Dans une démarche de transparence Le développement de ce secteur est undémocratique, certaines associations, par enjeu majeur pour l’emploi : Internet a permisexemple dans les domaines de l’environnement plus d’un quart des créations nettes d’emploiou des droits des consommateurs, souhaitent depuis 1995 en France. Il est donc crucial quepouvoir collationner des données brutes en vue les conditions de réutilisation permettent auxde documenter leurs analyses ou de dresser un startups et aux entrepreneurs de s’approprierbilan ou une évaluation d’uns situation. les données publiques et d’expérimenter de nouvelles activités à partir de leur réutilisation. Les acteurs associatifs peuvent aussiparticiper de manière collaborative à des Des conditions véritablement nonactions de collecte de données publiques discriminatoires pour des acteurs économiquesprésentes en ligne (« wiki scraping »), voire à à très faibles moyens, comme des startups enla génération des données elles-mêmes. phase préliminaire à une levée de fonds, ne devraient pas imposer de redevances Par exemple suite au séisme qui a frappé excessives. La facturation immédiate deHaïti le 12 janvier 2010, la communauté plusieurs dizaines de milliers d’euros (e.g.d’utilisateurs d’OpenStreetMap a réalisé très 123 000 euros dans le cas des données derapidement une cartographie de meilleure fiscalité locale129) pour réutilisationqualité que l’existant, enrichie de nombreuses commerciale est à ce titre un exemple de ce quidonnées actualisées comme l’état des axes de peut fortement décourager l’innovation.circulation et l’emplacement des campementsde secours. Ce type de productions non L1M "/!)0#$$#!#4!,#$!7(%-/$!!institutionnelles peut s’avérer d’une grande Le journalisme de données (« datautilité pour la gestion des crises. journalism ») est un exemple marquant de l’importance potentielle de la réutilisation desL-1M "#$!/24#*0$!(2&&7-.*#$! données publiques pour le débat démocratique. La réutilisation commerciale des données The Guardian130 a ainsi joué un rôle essentielpeut permettre l’éclosion de nouvelles activités au Royaume-Uni, et le New York Times aéconomiques, ou le développement et décidé en 2009 de mettre à disposition sousl’amélioration d’initiatives déjà existantes. forme de données ouvertes sa base de données de personnes, d’institutions et d’événements En France, le Groupement Français de qu’il tient à jour depuis 1913.l’Industrie de l’Information (GFII) a créé un En France, le site d’information OWNI131 se présente comme un « digital think tank »127 Réseau Quételet : http://www.reseau-quetelet.cnrs.fr/. avec pour ambition d’être le « laboratoire duIl s’agit d’un réseau constitué par le Centre de donnéessocio-politiques (CDSP) de Sciences-Po, le CentreMaurice Halbwachs – Archives de données issues de la 128statistique publique (CMH-ADISP, UMR 8097), et http://www.gfii.asso.fr/rubrique.php3?id_rubrique=60 129l’Institut national d’études démographiques (INED). Il Décret fixant la redevance pour le fichier « REI »permet aux chercheurs français et étrangers d’obtenir des http://www.legifrance.gouv.fr/affichTexte.do;jsessionid=?bases de données nécessaires à leurs traitements dans les cidTexte=JORFTEXT000022807097&dateTexte=&oldAcdomaines des grandes enquêtes, recensements et autres tion=rechJO&categorieLien=id 130bases de données issues de la statistique publique Guardian Open Platformfrançaise, grandes enquêtes françaises provenant de la http://www.guardian.co.uk/open-platform 131recherche, et un accès privilégié à des enquêtes OWNI (Objet Web Non Identifié)internationales. http://owni.fr 55
    • journalisme innovant », « à la pointe de Online Journalism Awards en octobre 2010 l’expérimentation en matière de dans la catégorie « meilleur site en langue non- datajournalism ». Il a été lauréat d’un prix aux anglaise ».56
    • N0,2.+-&!]J! )-&<.I-&(!&825-.&*#&(!:$7?&-+7-&!&(!$**5&(!27>%.B7&(!&*!-,*#&! Ce chapitre propose un état des lieux des Rennes Métropole, la Ville de Rennes etprincipales initiatives de réutilisation des Kéolis Rennes organisent, en partenariat avecdonnées publiques en France132, au niveau des la Caisse des dépôts, un concours pourvilles, des régions, et national. favoriser le développement d’applications autour des données disponibles : transports, guide du vivre à Rennes, donnéesCJ O,!-57+.%.(,+.$*!&(!$**5&(! géographiques. Le concours a permis de,*(!%&(!#$%%&#+.?.+5(! récompenser plusieurs applications utiles parmi les 117 participants.+&--.+$-.,%&(! Les données mises à disposition par la VilleCJCJ 1&**&(! de Rennes et Rennes Métropole : La ville de Rennes a été pionnière avec • Un accès direct vers les données delouverture de données publiques133 sur le transports publics grâce au portailtransport à Rennes Métropole : 11 applications data.keolis-rennes.com. Ces donnéesmobiles ont ainsi vu le jour en 2 mois. concernent les bus et le métro, les lignes, les horaires, la géolocalisation des stations, leurs équipements et le132 service Vélo STAR. Elles sont Gallon, C., 2011, « Carte contributive sur l’ouverture publiées par Kéolis Rennes,des données en France », Libertic,http://libertic.wordpress.com/2011/02/11/carte- exploitant du réseau STAR (Servicecontributive-sur-louverture-des-donnees-publiques-en- des Transports de l’Agglomérationfrance/ Rennaise) et des Vélo STAR.133 http://www.data.rennes-metropole.fr/fr/lentrepot.html 57
    • • Les données de la base « Guide Vivre Paris offre aux acteurs qui le souhaitent de à Rennes » : toutes les informations souscrire une licence payante non exclusive. pratiques de 1 500 organismes publics Fin décembre 2011, la Ville de Paris et parapublics, géolocalisés sur recense les données susceptibles d’être Rennes. Elles sont accessibles grâce à diffusées lors d’un premier « lâcher de une API, interface permettant données » en janvier 2011 sur le portail programmation et interrogation, opendata.paris.fr138. Les données personnelles développée spécialement par InCité sont transformées en informations statistiques Solutions pour le compte de la Ville agrégées et anonymisées le cas échéant. de Rennes. • Des données issues du Système Pour aller plus loin, une animation de la d’Information Géographique de communauté est prévue avec la mise en place Rennes Métropole et de la Ville de d’un site d’échanges entre les utilisateurs des Rennes : voies et adresses, données publiques et d’un concours stationnements pour handicapés, d’applications pendant un séminaire informel points dapports volontaires, et bientôt qui a eu lieu en février 2011 (« BarCamp »). l orthophotographie de lensemble de la Métropole. Ces données sont Quelques exemples des premiers jeux de fournies sous forme de fichiers à données ouverts par la Ville de Paris : télécharger. • Citoyenneté : résultats d’élections, cartes des bureaux de vote, cartes CJFJ ].%%&!&!),-.(!! électorales, décès, mariages, Le principe de l’ouverture des données naissances, répertoire des prénoms publiques de la Ville de Paris a été arrêté suite déclarés. à un débat du Conseil de Paris en juin 2010134. • Urbanisme : fonds de cartes des plans Les services de la direction des affaires de voirie, tracés des routes, juridiques de la ville ont alors engagé une description des trottoirs, volume du concertation avec des acteurs promouvant les bâti. démarches d’ouverture des données publiques, • Déplacements : nomenclature des notamment Regards Citoyens, Creative voies. Commons France et Veni, Vidi, Libri, afin de • Services : liste des établissements déterminer la licence la mieux adaptée. La scolaires, des écoles maternelles et plateforme privée Data Publica135 a aussi élémentaires, des crèches, des haltes- repris un certain nombre de ces données, afin garderies, des piscines. de compléter son offre de données publiques. • Environnement : liste des parcs et jardins, carte des arbres d’alignement, La licence ODbL (Open Database Licence) bâtiments, référentiels de la flore. développée par l’Open Knowledge Foundation • Culture : liste d’ouvrages disponibles, a été retenue. Adoptée par le Conseil de Paris notices des œuvres de fonds des de décembre 2010136, elle autorise les musées, statistiques des prêts dans les entreprises qui le souhaitent à reprendre les bibliothèques en 2010. données pour une utilisation commerciale, tant qu’elles acceptent ensuite de partager leur création dans les mêmes conditions (clause CJDJ O:&825-.&*#&!&!%:^+&%.&-!),-.(.&*! « share alike »), de manière similaire aux :9->,*.(<&!M!.SS7(&-!%,!$**5&!>-7+&! dispositions de la licence Creative Commons 2%7+_+!B7&!<.(&!&*!S$-<&! CC-BY-SA137. À la demande du Conseil de Paris, l’Atelier Par ailleurs, sur la demande d’entreprises Parisien d’Urbanisme (APUR) s’est engagé qui ne souhaiteraient pas se soumettre à cette dans l’ouverture de ses données dans le cadre condition de partage à l’identique, la ville de de la directive « Inspire ». Le Conseil d’administration de l’APUR a initié en 2008 une réflexion, en y associant l’ensemble des partenaires de l’APUR (INSEE, Préfecture de 134 Un des auteurs de ce rapport est élu parisien et Police, Pompiers, CAF, etc.) afin d’en étudier administrateur de l’APUR, l’Atelier Parisien d’Urbanisme. les modalités. 135 Data Publica : http://www.data-publica.com 136 Licence consultable sur : http://www.paris.fr/portail/viewmultimediadocument?mult imediadocument-id=94658 137 Licence Creative Commons BY-NC-SA 2.0 France : 138 http://creativecommons.org/licenses/by-nc-sa/2.0/fr/ Open Data Paris : http://opendata.paris.fr/58
    • Les débats ont porté d’emblée sur la archives en ligne. C’est le cas du départementdéfinition de la donnée publique, en particulier de la Loire141, et de Paris142.lorsqu’elle provient de l’agrégation de sources Un grand nombre de collectivitésissues de divers partenariats, et sur l’utilité territoriales, principalement des régions,d’une diffusion des données brutes plutôt mettent à disposition sur leurs sites desqu’une diffusion de données mises en forme. données géographiques. Cette section repose Afin d’explorer la faisabilité de diffuser des sur une enquête conduite par les auteurs endonnées mises en forme, une maquette a été novembre et décembre 2010 sur les portailsprogrammée à partir de l’étude réalisée régionaux d’information géographique. Lesannuellement pour l’observation statistique des résultats n’ont pas la prétention defamilles parisiennes. Le produit réalisé l’exhaustivité.permettait de consulter et télécharger lestableaux de données brutes liés à chaque L-M D-$)/0-4($!%/$!,/!7-$#!#!@*10#!statistique ou graphique présenté dans l’étude. Les données mises à disposition sont enCes études elles-mêmes sont par ailleurs général des données dites « métier »,désormais diffusées de façon gratuite. principalement de type cartographique, qui ne Cette réalisation a nécessité un travail sont généralement pas ouvertes à d’autres tiersimportant de développement informatique et que les entités publiques.de mise en forme des données, allongeant ainsi Le besoin communément exprimé est celuile temps nécessaire pour fournir un produit de partager des données entre entités publiquespouvant être diffusé. Les surcoûts générés par dans l’espoir de réaliser des économiesune telle démarche ont conduit à l’abandonner d’échelle. La Bourgogne a ainsi pu économiserpour s’orienter vers une diffusion des bases de près d’un million d’euros grâce à l’achat dedonnées, sans remise en forme préalable – ou données IGN en licence étendue.du moins avec une remise en forme limitée auxquestions de formats de données. Du fait de cette finalité d’économies, ces sites n’ont pas été conçus ou adaptés pour le Aujourd’hui, l’APUR a commencé à grand public. Une exception est le site de ladéclarer ses métadonnées sur le géocatalogue Basse-Normandie, développé spécifiquementde l’IGN139. Les données elles-mêmes sont très pour le grand public par le Pôle Géomatiquedétaillées, donc volumineuses. Leur diffusion Normand avec un atlas interactif.soulève des problèmes de capacités techniquesque l’APUR n’est pas nécessairement à même Ces différents services ont des statutsde résoudre en propre140. hétérogènes. Certains de ces sites ont été développés à l’initiative des services de l’État, Cette expérience montre cependant l’intérêt d’autres des régions ou des départements. Onpour le producteur de diffuser la donnée brute recense la coexistence de statuts associatifs,plutôt que mise en forme ou enrichie, car cela d’établissements publics ou parapublicslui permet de mettre directement à disposition (notamment EPIC ou GIP), et de services deles fichiers que ses agents utilisent pour leur l’État ou de collectivités territoriales. Il existepropre travail, économisant donc l’effort et les aussi un cas de statut privé, celui du PRIGEmoyens nécessaires à une éventuelle phase de (Pas-de-Calais).remise en forme. Enfin, certains sites ne sont pas constituésCJVJ Q+7&!&!#,(!M!2,-+,6&!&!%:.*S$-<,+.$*! en personne morale, comme Géopal,65$6-,20.B7&!2,-!%&(!-56.$*(! Géobourgogne, Géobretagne, et PGN. Ils sont alors intégrés dans les sites des organismes Certains départements et certaines régions partenaires (conseil régional, DREAL, etc.).ont aussi commencé à mettre en ligne leursdonnées publiques. Des collectivités ont par Certaines plateformes ont été développéesexemple mis à disposition une partie de leurs en régie quand d’autres ont fait l’objet d’un marché public. La Bourgogne réalise la sienne dans le cadre d’un partenariat public-privé.139 http://www.geocatalogue.fr/ Le géocatalogue centraliseen France les métadonnées concernées par « Inspire ».140 D’autre part, le manque à gagner lié à une diffusiongratuite est évalué au montant des données vendues, soit 141 Archives de la Loireenviron 50 à 100.000 euros par an, prestations à la http://www.loire.fr/display.jsp?id=c_828986demande comprises. 142 http://canadp-archivesenligne.paris.fr/ 59
    • L--M 81/2(#$!%/$!,3-4#0&)(0/+-,-4(!! donc important de rechercher la convergence Pour certaines régions – telles que la de ces différents outils et la généralisation de Haute-Normandie, la Lorraine, la Franche- l’interopérabilité, qui seraient facilitées par un Comté, la Corse, la Champagne-Ardenne ou la pilotage interministériel et un travail de région Midi-Pyrénées – il existe plusieurs coordination avec les collectivités locales. plates-formes d’information géographique Certaines régions signalent toutefois une auxquelles sont associés les services de l’État, difficulté de mise en place d’une véritable des Conseils Régionaux et des Conseils culture du partage des données entre acteurs Généraux. Ces plateformes ne sont pas toutes publics et a fortiori avec le grand public. interopérables en raison de l’existence de plusieurs standards promus par différentes En ce qui concerne l’ouverture des données entités publiques (régions, État, ministère de au grand public, les responsables des sites l’Écologie ou ministère de l’Intérieur). signalent aussi le besoin de rassurer les partenaires sur les aspects juridiques de la Des démarches de mutualisation ont donc diffusion des données afin de lever les craintes été mises en place. Prodige, « Plate-forme qu’ils ont à ce sujet. Régionale pour Organiser et Diffuser l’Information Géographique », est ainsi née en L---M D#$!%Y/7-.*#$!0(;-&/,#$!%3&*1#04*0#! 2003 d’une initiative des services déconcentrés %#$!%&(#$! de l’État en région Rhône Alpes. Une D’après les réponses obtenues, les régions circulaire du 24 octobre 2007 des ministères de déjà bien organisées dans ce domaine (Nord- l’Économie et des Finances et de l’Intérieur, Pas-de-Calais, Auvergne, Provence-Alpes- incite les préfets à favoriser les démarches de Côte-d’Azur, Aquitaine, Basse-Normandie, mutualisation de type Prodige en respectant les Languedoc-Roussillon, Rhône-Alpes, Pays de référentiels nationaux et en s’inscrivant dans la Loire, Picardie, Poitou-Charentes, Alsace) une démarche d’interopérabilité. poursuivent leurs activités en développant Prodige a été depuis mise en service leurs partenariats et en renforçant les projets également en Pays de la Loire, et de thématiques. Les Départements et Collectivités nombreuses régions sont en train de d’Outre-Mer ne sont pas en reste. La Guyane, développer des projets similaires : Poitou- la Martinique, la Guadeloupe, la Réunion et la Charentes, Picardie, Alsace, Corse, Franche- Nouvelle-Calédonie innovent elles aussi dans Comté, Basse et Haute Normandie, Réunion et ce domaine. Guadeloupe. Cela permet aux services de La création de ces sites régionaux s’est l’État de structurer et d’organiser l’offre accélérée du fait de deux dynamiques régionale de données à référence spatiale, et de différentes. Tout d’abord, nombre de ces faciliter les échanges de données entre services projets, développés en partenariat entre les mais aussi avec les partenaires institutionnels. services de l’État et le conseil Régional, ont En parallèle, le Ministère de l’Écologie a bénéficié de la signature de Contrats de Plans développé CARMEN, la « Carte du Ministère État Région pour la période 2007 – 2013. de l’Environnement », répondant aux mêmes D’autre part, les obligations créées par la objectifs de partage d’informations directive Inspire ont accéléré le processus. géographiques, avec des acteurs et des Bien qu’elle soit rarement mentionnée par les pratiques différents. Existent également l’outil responsables que nous avons interrogés, la Cartélie, développé par l’ex-Équipement, et mise en œuvre de la directive est un moteur Géoweb, développé par le ministère de prédominant dans la création de sites plus l’Agriculture. récents et de la refonte des sites plus anciens. Une convergence de Carmen et Prodige a Un nouvel écosystème de l’information été amorcée avec l’objectif premier de ne pas géographique est ainsi en train de prendre perturber les habitudes des communautés forme. Alors que les régions pionnières ont d’utilisateurs. Cela a conduit en développé seules leurs sites Internet, le réseau septembre 2010 à une version de Prodige des Centres Régionaux dInformation intégrant deux modules de Carmen 1.6 : la Géographique (CRIGE) s’est mis en place. Il composition et la visualisation. De son côté, permet un accompagnement des nouveaux Géoweb est en cours de remplacement par entrants par les plus expérimentés, et offre Carmen. parfois la possibilité d’utiliser les mêmes codes L’un des sites interrogés a souligné le sources sous licence libre. manque de préconisations nationales qui répondraient aux besoins locaux. Il semble60
    • L-1M b(4(0&;((-4(!%#$!7&Y#$!(2&&7-.*#$! Afin d’avoir une vision plus précise desmoyens engagés par les régions, l’enquêtemenée auprès des sites régionaux a étécomplétée par la consultation des données duCRIGE. Les résultats sont résumés dans letableau suivant. Investissement Fonctionnement Personnel (k! ) (k!) (ETP) Appel d’offres en Auvergne CRAIG * 35 1 cours Midi – Pyrénées GéoMIP 28 9 1 Nord – Pas-de- PPIGE * 500 200 2 Calais Basse Normandie PGN * 58 20 1 GéoPAL * 100 37,5 2 Pays-de-Loire SIGloire 350 65 8 CRIGE PACA 200 35 0,7 PACA * Rhône – Alpes PRODIGE 150 19 15 Moyenne 198 52,6 3,8 Tableau de synthèse des moyens mis en œuvre par quelques régions.* indique que les informations proviennent directement des plateformes.Dans les autres cas, les informations proviennent du catalogue des infrastructures de données géographiques françaises 2010 del’AFIGEO et de leurs sites Internet. 61
    • FJ O:$7?&-+7-&!&(!$**5&(!,7! L-M "3ZaFcc!%-CC*$#!$#$!%&(#$!#!,-;#!%#)*-$! OPPd! *.?&,7!*,+.$*,%!M!+-$.(!5+7&(! L’Institut National de la Statistique et des &!#,(!! Études Économiques (INSEE)147 a pour mission de produire et diffuser des statistiques FJCJ Q+7&!&!#,(!M!O&!=.*.(+I-&!&! et des études économiques. La seule contrainte %:Q#$%$6.&! majeure à la diffusion est celle de la confidentialité, assurée par le Comité du secret Le ministère de l’Écologie, du statistique et des procédures d’anonymisation. Développement Durable, des Transports et du L’INSEE publie ainsi un très grand nombre de Logement (MEDDTL) a lancé une démarche jeux de données (plus de 52 000 fichiers Excel de mise en ligne de ses données. seraient disponibles sur son site en Un portail143 rassemblant les sites janvier 2011148). comportant des informations ou des données L’institut décide dès 2003 de diffuser environnementales est disponible depuis le gratuitement sur Internet une partie de ses 18 juillet 2009144. Ce portail propose un accès données, motivé à la fois par la forte demande à quatre-vingt sites adhérents et reçoit 22 000 pour ses données et par la facilité de leur mise visites par mois. Le ministère souhaite à disposition au grand public via Internet. développer et soutenir la volonté affichée d’animer une communauté d’adhérents et L’INSEE a privilégié la rapidité de mise à d’usagers : une conférence des adhérents disposition des données, ce qui a eu une devrait être prochainement organisée. incidence sur l’ergonomie du site et donc sur l’accessibilité des données. La quantité de La fusion des ministères de données ouvertes étant considérable, les l’Environnement et de l’Équipement, aux utilisateurs expriment le sentiment d’être noyés traditions de diffusion assez différentes, a dans un site « confusant et déceptif », selon rendu la constitution du portail plus complexe. une enquête de satisfaction (par ailleurs Certains services comme le CERTU145 et le positive) conduite par l’INSEE. La visibilité de SETRA vendent historiquement certaines de la démarche en a aussi été amoindrie malgré leurs publications, ce qui en limite la diffusion. son importance. On observe une structuration progressive à partir de certains services, et notamment le L--M Oe!7-,,-&$!%#!1-$-4#$!/*#,,#$!! SOeS146, les DREAL et les services de Le vecteur de cette diffusion est le site de l’Écologie. Ces initiatives tendent à mettre en l’INSEE, INSEE.fr, qui reçoit 24 millions de cohérence l’organisation de la diffusion des visites annuelles avec 12 millions de visiteurs données environnementales. uniques par an, soit un trafic exceptionnel pour La création du portail Environnement a un site public. nécessité un investissement d’environ Le public peut être séparé en plusieurs 350 000 euros, et un effort de maintenance catégories d’utilisateurs : la presse, les annuelle de 150 000 euros par an. À cela collectivités territoriales, les particuliers, les s’ajoute l’emploi de deux fonctionnaires de entreprises, le public des enseignants et celui catégorie B à temps plein pour l’animation des chercheurs. (relation avec les adhérents et l’équipe technique du portail) et l’équivalent d’un tiers Ces derniers représentent un public aux d’équivalent temps plein d’un fonctionnaire de besoins spécifiques. Pour leurs travaux, ils catégorie A. peuvent obtenir des données rendues anonymes et produites à la demande via le réseau « QUETELET149 » lié au CNRS. Pour FJFJ Q+7&!&!#,(!M!%:;`W""! ces travaux spécifiques, la tarification est en cours d’élaboration. 147 Les éléments présentés dans cette section proviennent 143 http://www.toutsurlenvironnement.fr/ d’un entretien mené le 26 novembre 2010 avec M. Pierre 144 Les éléments présentés dans cette section proviennent Audibert (directeur de la diffusion à l’INSEE) et M. des réponses apportées par mail par Laurent Coudercy, Thierry Aouizerate (chef du département INSEE Info responsable du portail environnemental jusqu’au 30 Service). 148 novembre 2010. Bancilhon, F. et Gans, B., 2011, « Size and Structure of 145 CERTU. http://www.certu.fr the French Public Sector Information » 146 Service de l’Observation et des Statistiques du http://gov.opendata.at/site/sites/default/files/Size%20and% Commissariat général au développement durable (CGDD). 20Structure%20of%20French%20PSI_0.pdf 149 http://www.stats.environnement.developpement-durable.fr Ibid.62
    • L---M f-$$-&!%#!$#01-2#!)*+,-2!#4!%-CC*$-&!T! pouvait légalement prendre en compte, pour4-40#!2&77#02-/,! déterminer le montant de la redevance Les activités de diffusion l’INSEE se acquittée par les rediffuseurs, le coût desrépartissent en deux ensembles distincts, la opérations d’amélioration de la base SIRENEdiffusion de service public et la diffusion et le moyen tiré de ce que cette redevancecommerciale. devrait, en tout état de cause, baisser en raison de l’augmentation du nombre des clients de L’activité de service public de l’INSEE l’INSEE ».étant financée par le budget de l’État, lesproduits standards, notamment l’ensemble des La décision de rejet a été notammentjeux de données disponibles en ligne, sont motivée pour les raisons suivantes : « ladiffusés et réutilisables gratuitement (sauf en redevance correspondant à la mise àversion papier du fait des frais d’impression). disposition de la base de données SIRENE, qui doit être regardée comme une œuvre L’indépendance de la statistique publique collective, peut légalement inclure des droitsétant un élément important pour le bon relevant de la propriété intellectuelle au profitfonctionnement de notre démocratie, l’INSEE de l’INSEE [...]. L’INSEE peut, par suite,doit statutairement générer une partie de ses prendre en compte, pour déterminer le montantrevenus par des activités commerciales lui de la redevance demandée aux rediffuseurs, legarantissant une certaine indépendance des coût des opérations d’amélioration de la basechoix budgétaires de l’État. SIRENE [...] » tout en veillant à ce que « les Les produits réalisés sur mesure, tels des droits relevant de la propriété intellectuelle etextractions de base de données spécifiques ou artistique ne doivent pas conduire l’opérateurdes recoupements réalisés à la demande, sont public à réaliser des profits d’un montantsoumis à une redevance pour service rendu, qui manifestement disproportionné. »n’est pas liée au droit sur les donnéespubliques. L-1M I&*0-0!%#!&*1#/*A!)0&%*-4$! La réutilisation d’un certain nombre Conscient des besoins nouveaux desd’informations publiques à titre commercial, usagers, l’INSEE va rénover son portail etdans le cadre de la loi de 1978 modifiée en souhaite développer ces données sur un2005, est aussi soumise à une redevance. maillage plus fin que l’IRIS utilisé jusqu’ici. Ainsi, la base de donnée des prénoms les Son ambition est de disposer de bases deplus usités par les Français, ou encore la base données qui permettraient à l’utilisateurSIRENE, qui regroupe les données relatives d’obtenir l’information selon une échelleaux entreprises et à leurs établissements, sont glissante, du local jusqu’au niveau national.soumises à redevance. Ce choix est contesté Des restrictions liées aux règles depar certains usagers qui souhaiteraient que la confidentialité devraient toutefois s’appliquerbase SIRENE, financée par l’argent public et en fonction de l’échelle souhaitée carcréée à partir des informations saisies par les l’anonymat est fortement lié à la précisionentreprises elles-mêmes, soit diffusée spatiale.gratuitement150. Après avoir ouvert très tôt une grande Le choix de tarification de la base SIRENE partie de ses données, l’INSEE prévoita donné lieu à un contentieux juridique. Le aujourd’hui de faire évoluer l’architecture deConseil d’État l’a tranché par une décision151 son site et d’améliorer son ergonomie.en date du 24 juillet 2006 qui a rejeté unrecours intenté par un utilisateur. Ce dernier FJDJ Q+7&!&!#,(!M!O:;T`!contestait la politique tarifaire de diffusionarguant notamment « que le ministre de L-M "3Z[a!C-/2#!$#$!&)(0/4-&$!)/0!*#!l’économie, des finances et de l’industrie ne $*+1#4-&!)&*0!$#01-2#!)*+,-2!#4!%#$! 0#%#1/2#$!)&*0!0(*4-,-$/4-&!150 Table-ronde entre développeurs et collectivités locales L’Institut Géographique National (IGN)152lors de la conférence « Ouverture des Données Publiques est investi d’une mission de service publicLocales et Réutilisations : Focus sur les Initiatives Locales définie dans son décret fondateur (décreten Europe » le 29 novembre 2010 à Rennes.151 Décision du Conseil d’État du 24 juillet 2006 :http://arianeInternet.conseil- 152État.fr/arianeInternet/ViewRoot.asp?View=Html&DMode Les éléments présentés dans cette section proviennent=Html&PushDirectUrl=1&Item=2&fond=DCE&texte=24 d’un entretien mené le 17 décembre 2010 avec Jean-Yves7769&Page=1&querytype=simple&NbEltPerPages=4&Pl Bréard, directeur par intérim de la maîtrise d’ouvrageuriels=True déléguée du service public. 63
    • n° 81-505 du 12 mai 1981 modifié). Cette L--M "#!)(0-7W40#!%#$!%&(#$!)*+,-.*#$!g!*#! mission consiste à décrire, d’un point de vue .*#$4-&!2&7),#A#! géométrique et physique, la surface du La loi CADA concerne l’ensemble des territoire national et l’occupation de son sol, en documents administratifs et des informations faire toutes les représentations appropriées, publiques. L’information géographique diffuser les informations correspondantes. présente, elle, la particularité d’une grande L’institut reçoit une subvention pour technicité et d’une certaine difficulté de charge de service public, établie de manière à réutilisation des données brutes servant à sa ce que l’argent public finance la part d’activité production. purement publique et l’utilisateur rémunère la Il est difficile d’établir une distinction nette part d’activité de nature concurrentielle et entre les données produites dans le cadre de la commerciale. mission de service public (et donc Ainsi, la subvention finance la recherche, légitimement diffusables gratuitement) et les l’enseignement, la couverture photographique données de nature commerciale en raison de la patrimoniale, ainsi que la constitution et complexité de la chaîne de traitement. l’entretien du réseau géodésique. Ces travaux Ainsi, même la photographie aérienne ne stratégiques conditionnent la connaissance constitue pas une donnée brute diffusable. À la homogène du territoire national par la sortie de l’avion, il s’agit encore de fichiers puissance publique. numériques bruts, inexploitables en pratique La subvention participe aussi à la mise à hors de la chaîne de production de l’IGN. Pour disposition des données publiques, notamment devenir un produit de type « donné brute la diffusion des données sur le Géoportail. diffusable », ces photographies doivent subir Certaines de ces données sont réutilisables des traitements importants dans une chaîne gratuitement, y compris à titre commercial. longue et complexe – qui échoue parfois – et dont l’issue est la production de En revanche, une partie du périmètre l’orthophotographie. d’activité de l’IGN relève d’activités commerciales. La production, la rédaction, On pourrait donc argumenter que l’impression et la commercialisation des fonds l’orthophotographie est une donnée brute. Il de carte, ou leur diffusion électronique, sont existe pourtant un marché concurrentiel de laissées à la charge de l’utilisateur. Il en va de production d’orthophotographies154. Il n’est même pour les prestations réalisées à titre de donc pas possible de la diffuser à tous pour une service rendu, soumises à redevance. réutilisation gratuite, à moins d’annihiler ce marché et d’établir de graves distorsions de Enfin, une partie de l’activité de l’IGN concurrence. répond à des besoins qui concernent autant l’État que d’autres utilisateurs, dont les Cet exemple souligne la difficulté qu’il collectivités territoriales : les coûts afférant peut y avoir à définir le périmètre des données sont alors partagés entre la subvention et gratuites car relevant de la mission de service l’utilisateur. public, et celui des données tarifées car relevant d’une activité commerciale. C’est le cas notamment de la production de données à moyenne ou à petite échelle L---M h-0/;#!4/0-C/-0#!/*4&*0!%*!6[c! (notamment les 1:100.000, 1:250.000 et 1:1.000.000), la production des fonds La complexité des règles de formation des cartographiques principaux et la production du tarifs des données de l’IGN, leur montant RGE (Référentiel à Grande Échelle)153. Pour ce relativement élevé155 et leurs licences parfois dernier, la subvention assure environ deux tiers restrictives pour le partage des données ont des coûts quand l’utilisateur en supporte un nourri de nombreuses critiques, notamment de tiers. Le choix de cette clé de répartition est la part des collectivités locales. Ces critiques essentiel pour comprendre la formation du tarif sont alimentées aussi par le raisonnement des données. général voulant que les données publiques 154 On souligne toutefois que les photographies numériques de l’IGN sont diffusées plusieurs mois après le vol après un premier traitement (aérotriangulation). Les données de vol qui permettent de produire les orthophotographies sont considérées comme des produits intermédiaires au sens de 153 Le RGE est composé de quatre composantes qui la CADA, et ne sont donc pas diffusées. 155 couvrent l’étendue du territoire : les orthophotographies, la À titre d’exemple tiré du catalogue des prix publics : base de données topographiques, la base de données une zone de 100 km x 100 km de la base de données parcellaires et la base e données adresses. topographique est vendue 55 550 euros (janvier 2011).64
    • devraient être réutilisables gratuitement par LeWeb 2010158 et fait l’objet d’un colloquetous car financées par de l’argent public. Regards sur le Numérique en mars 2011. Des collectivités se saisissent du sujet et ouvrent La réflexion menée à l’occasion du des portails de mise à disposition de données…nouveau contrat d’objectif de performances Depuis plusieurs mois, le gouvernement met(COP 2010-2013) a débouché sur la décision en place les éléments d’une politique nationalede rendre gratuites les données de base (RGE) d’ouverture et de réutilisation des donnéesauprès des institutions chargées d’une mission publiques.de service public sans caractère industriel oucommercial156. Sont donc concernés l’État, les L-M "/!7-$$-&!Q!c4/,/+!S!2&&0%&#!,#$!collectivités publiques et leurs établissements /%7--$40/4-&$!#!7/4-W0#!%#!%&(#$!publics, et les prestataires privés de services )*+,-.*#$!publics non industriels ou commerciaux. Lesinstances de l’Union Européenne ainsi que les En 2008, Éric Besson, secrétaire d’Étatautorités publiques des États membres sont chargé de la Prospective, de l’Évaluation desaussi concernées. politiques publiques et du Développement de l’économie numérique auprès du Premier Ce virage conduit à une perte substantielle ministre, propose dans le cadre du plande recettes commerciales pour l’IGN, perte « France Numérique 2012 » la création d’uncompensée par l’État par une augmentation à portail unique des données publiques159.due concurrence de la subvention pour chargede service public, soit un montant annuel de En février 2010, le député Frank Riesterl’ordre de 10 millions d’euros. réunit un groupe d’experts du numérique chargé de faire des propositions à Nathalie La gratuité du RGE pour les acteurs publics Kosciusko-Morizet, secrétaire dÉtat auprès duévite naturellement une duplication des Premier ministre, chargée de la Prospective etdépenses de constitution de référentiels locaux du Développement de léconomie numérique,ou régionaux, et permettra une mutualisation en vue de l’amélioration de l’administrationde l’infrastructure d’information géographique numérique et de son lien avec les usagersà travers le pays. L’ensemble des organismes internautes.éligibles à la gratuité peut librement s’échangertoutes les données concernées157, ce qui facilite Ils font de la création de ce portail l’une deleur enrichissement collaboratif. leurs principales propositions160, dans le but d’encourager la création de services innovants Même si cette gratuité ne concerne pas en libérant les données publiques et enpour l’instant les opérateurs privés, et facilitant leur réutilisation par la communauténotamment les entrepreneurs ou les startups, des entrepreneurs et des startups.c’est une première étape, et un mouvementdans le sens de la gratuité. Le principe de sa création est validé dans le cadre de la Révision Générale des Politiques Publiques en juin 2010, et fait l’objet d’uneDJ O,!<.(&!&*!2%,#&!:7*&! communication en Conseil des ministres le 1612$%.+.B7&!*,+.$*,%&!&(! 24 novembre 2010 .$**5&(!27>%.B7&(! 158 Les derniers mois ont vu le sujet de la Lacombe, R., 2010, « Tocqueville 2.0 and Open Government Data ». LeWeb 10 Ignite Session.réutilisation des données publiques gagner en http://www.youtube.com/watch?v=6qj8jS2Xsfkimportance dans le débat public en France. 159 Besson, E., 2008, « France numérique 2012 : Plan dePlus de 120 personnes ont pris part au premier développement de l’économie numérique », octobre 2008.Open Data Camp français à Paris fin 2009, le http://lesrapports.ladocumentationfrancaise.fr/BRP/084000 664/0000.pdfsujet figure au programme de la conférence Action n° 39 « Favoriser le développement de nouveaux produits et services en créant un portail unique d’accès aux données publiques ».156 160 La livraison par téléchargement sur le site Internet Riester, F.et al., 2010, « Améliorer la Relationhttp://professionnels.ign.fr/2/telechargement.htm ou via le Numérique à l’Usager : Rapport Issu des Travaux duflux émis par le Géoportail est gratuite car financée par la Groupe Experts Numériques ».subvention (alors que les coûts de diffusion de la carte http://www.modernisation.gouv.fr/fileadmin/Mes_fichiers/papier ne sont pas subventionnés). Les coûts de pdf/RapportGroupeExpertsNumeriques.pdfreproduction et diffusion d’une emprise départementale Proposition n° 22 : « Créer une plateforme d’innovation desont de 329 euros hors taxe pour un DVD et de 514 euros services ‘État Lab’ permettant aux acteurs tiers dehors taxes pour un disque dur. développer des services innovants à partir de données157 Pour aller plus loin : consulter la rubrique « Espace publiques ». 161professionnel » du site ign.fr, et en particulier le document Conseil des ministres du 24 novembre 2010 :« Présentation des nouvelles modalités de diffusion du communication relative à l’administration électronique,RGE ». par le ministre du budget, des comptes publics, de la 65
    • Le Premier ministre François Fillon crée mission Etalab164 précise le cadre de mise en par décret la mission Etalab, rattachée sous son œuvre de cette politique nationale. « Etalab autorité au Secrétariat général du mettra à disposition librement des données Gouvernement, le 21 février 2011162. brutes dans un format exploitable et développera de nouveaux services en ligne au En plus de « coordonner laction des profit des citoyens, à partir de certaines de ces administrations de lÉtat et apporter son appui données. La réutilisation de ces informations à ses établissements publics administratifs pour offre de larges opportunités à la communauté faciliter la réutilisation la plus large possible de des développeurs qui pourront les utiliser afin leurs informations publiques », la mission de proposer des services applicatifs Etalab est chargée de la création dun portail innovants. » unique interministériel, la future plateforme Open Data de l’État « data.gouv.fr ». L---M "/!C*4*0#!),/4#C&07#!K)#!D/4/!/4-&/,#! %/4/=;&*1=C0! L--M X&,-4-.*#!/4-&/,#!%#!0(*4-,-$/4-&!%#$! %&(#$!)*+,-.*#$! Le portail « data.gouv.fr » sera la plateforme de mise à disposition des données La mise en place de la plateforme Open publiques de l’État, qui devra « permettre un Data de l’État dessine les contours d’une accès simple et identifié pour la consultation et politique nationale de réutilisation des données la réutilisation »165. Le périmètre inclut les publiques. administrations centrales et déconcentrées, les Le discours du Président de la République établissements publics, et les institutions à l’occasion de l’installation du Conseil chargées d’une mission de service public à National du Numérique le 27 avril 2011163 en caractère autre qu’industriel et commercial. définit les objectifs : « cest pour un État plus Prémisses d’une stratégie nationale des transparent, une démocratie exemplaire, que données ouvertes, la plateforme pourra jai demandé au gouvernement de créer un « rendre accessibles les données de chaque portail des données publiques en ligne […]. La collectivité qui le souhaite ». Cela va dans le question de laccès aux données de base est une sens de la mutualisation d’outils techniques question absolument centrale ». pour faciliter la mise en ligne des données des Le premier objectif est celui de la collectivités en vue de leur réutilisation. transparence. « Elle nest pas sans poser des L’objectif de la plateforme data.gouv.fr est difficultés […]. Laccès aux données [des] triple : « permettre la réutilisation la plus facile entreprises est un élément de la démocratie et la plus large possible, ensuite encourager économique, [et] ce nest pas parce que cela l’innovation par toute la communauté des pose des problèmes quil ne faut pas le faire. Il développeurs et des entrepreneurs pour faut le faire, cest un choix et cest un choix, de soutenir le développement de l’économie mon point de vue, sans retour. » numérique, et enfin contribuer à renforcer la Le deuxième objectif est l’encouragement à transparence de l’action de l’État en mettant en l’innovation. « Louverture des données valeur le travail des administrations ». publiques devra permettre à lécosystème des La plateforme « mettra à disposition, développeurs et des startups dinventer de librement, facilement et gratuitement, le plus nouveaux services pour les citoyens. » grand nombre de données quelle que soit la Un communiqué de presse du Premier réutilisation », le tout basé sur « une licence ministre à l’occasion de la création de la gratuite ». Toute tarification éventuelle sera strictement encadrée, assurant la gratuité la fonction publique et de la réforme de l’État, porte-parole plus large possible de la réutilisation des du Gouvernement : données. « Dans certains cas particuliers, la http://www.gouvernement.fr/gouvernement/l- administration-electronique 162 Décret n° 2011-194 du 21 février 2011 portant création 164 dune mission « Etalab » chargée de la création dun portail M. le Premier ministre, 2011, « Création de la mission unique interministériel des données publiques Etalab, chargée de la mise en ligne de data.gouv.fr », http://legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTE communiqué de presse du 22 février 2011. XT000023619063&categorieLien=id http://www.gouvernement.fr/sites/default/files/communiqu 163 M. le Président de la République, 2011, « Discours à es/02.22_Communique_de_presse_-__Etalab.pdf 165 l’occasion de l’installation du Conseil National du L’Informaticien, 2011, « Interview de Séverin Naudet, Numérique le 27 avril 2011 » Directeur d’Etalab : Encourager l’innovation par toute la http://www.elysee.fr/president/les- communauté des développeurs et des entrepreneurs pour actualites/discours/2011/discours-sur-internet-et-l- soutenir le développement de l’économie numérique ». economie-numerique.11256.html Numéro 91, mai 2011.66
    • réutilisation peut faire l’objet d’une redevance, réutilisation de données publiques, parus le 26notamment lorsque l’administration doit mai 2011.supporter un investissement exceptionnel lié à Data.gouv.fr sera mis en ligne fin 2011,cette réutilisation, mais le principe de création avec « une version beta en ligne end’une redevance sera décidé par décret, c’est- décembre ». Elle sera construite sur « uneà-dire par le Premier ministre ». Le Premier gouvernance technique ouverte afin que leministre a précisé la mise en œuvre de cette portail et ses développements soient le plusdirection politique à travers une circulaire conformes aux attentes des utilisateurs ».adressée à l’ensemble des ministres, et undécret encadrant les redevances pour 67
    • ),-+.&!DJ!N$<<&*+!S,?$-.(&-!%,!-57+.%.(,+.$*!&(! $**5&(!27>%.B7&(!a! 69
    • N0,2.+-&!];J! ^>,.((&-!%&(!>,--.I-&(!3!%,!-57+.%.(,+.$*! Afin d’encourager la réutilisation des La simplicité est le maître mot en ladonnées publiques et de permettre la matière. Ed Parsons167 de Google, en fait uneconcrétisation des conséquences positives que exigence centrale :l’on peut en attendre, il est nécessaire « Les gens veulent accéder àd’abaisser autant que possible les barrières à la l’information à travers des outils facilesréutilisation. d’emploi. Il faut que ces outils parlent leur Nous détaillons dans ce chapitre les défis et langage, ne les oblige pas à utiliser uneles difficultés qui peuvent se poser, ainsi que manière de procéder qui leur soitdes pistes de solutions. Il s’agit essentiellement étrangère, ils veulent juste accéder àde répondre aux contraintes techniques de l’information dont ils ont besoin.l’ouverture des données, d’en gérer la L’infrastructure support est pour l’essentielcomplexité juridique, d’anticiper son impact invisible pour les utilisateurs, tout commeéventuel sur les institutions publiques, et de celle qui est derrière une prise électriquemettre en place les modèles économiques les ou derrière un robinet : elle est invisibleplus propices à encourager l’innovation. derrière la page d’accueil de Google. » Rendre simple et efficace un service enCJ 152$*-&!,78!#$*+-,.*+&(! ligne exige d’anticiper les difficultés éventuelles d’ergonomie et de design+&#0*.B7&(! d’interaction dès la phase de conception, en soumettant le projet des utilisateurs test. CelaL-M f&%W,#$!#4!C&07/4$!%#!%&(#$!)#*1#4! implique aussi de gérer la complexité durant0#%0#!,/!%&(#!),*$!*4-,#! les phases ultérieures, pendant le L’un des objectifs de l’ouverture des développement comme lorsque l’outildonnées est de stimuler les activités construites fonctionne en production.à partir sur ces données. Il est crucial dediffuser les données à l’état brut, dans des L---M "/!2&7),#A-4(!%#$!%&(#$!;(&;0/):-.*#$!formats ouverts et réexploitables166. /*!2@*0!%#$!(1&,*4-&$!C*4*0#$!%*!$#24#*0! La finalité et l’importance des questions de Les technologies géomatiques168 permettentformat doivent donc être clairement de superposer sur des fonds de carte desexpliquées, et les processus de collecte et de données cartographiques diverses, d’ajouterrecensement doivent être établis et assimilés des couches d’informations variées (physiques,par l’ensemble des opérateurs, ce qui nécessite économiques, environnementales), et surtoutun effort pédagogique soutenu. de visualiser ces phénomènes et leur évolution en représentation spatiale, sur lesquelles leL--M c0;&&7-#!%#!,3/22W$!/*A!%&(#$! cerveau humain est capable d’inférences rapides et complexes. Une autre contrainte technique tient aubesoin d’ergonomie et de simplicité Globalement, l’information géographiquequ’expriment les utilisateurs des outils de numérique est devenu un outil puissantdiffusion de données. d’analyse de données. Elle constitue aussi une donnée structurante pour la réutilisation de Le volume de données aujourd’hui hébergé nombreuses autres données publiques ou poursur certains sites, comme celui de l’INSEE, est la production de nouveaux services.tel que de nouvelles problématiques derecherche interactive sont soulevées. 167166 Idib. Description formelle de la représentation des données 168 Voir la plaquette « L’information géographique :dans la base de données. Voir http://www.ac- l’expérience française » publiée le 21 mai 2008 par legrenoble.fr/ecogest/pedago/administration/prodpeda/mcd.h Ministère de l’écologie, de l’énergie, du développementtm. durable et de l’aménagement du territoire. 71
    • Traditionnellement, les cartes et les L1M N#+!F(7/4-.*#!g!,3/1#-0!%*!N#+!J! informations sur ces cartes étaient rangées En représentant les données sous forme de séparément dans des cartothèques. La même graphe de relations entre entités plutôt que de organisation conceptuelle est reproduite sur les tables structurées, les technologies du Web données géographiques numériques avec des sémantique et des « données ouvertes liées » efforts importants sur la structuration des (Linked Open Data) permettent aux machines données et des métadonnées. de donner un « sens » à l’information Inspire, le portail environnement, le disponible en ligne174. On parle d’ontologie Géoportail couplé au Géocatalogue, les normes pour décrire la structure des différents types AFNOR, CEN et ISO sur l’information d’entités représentées et les concepts de géographique et sur les métadonnées en sont relations qui les relient. autant d’illustrations169. Construire une Malgré l’enthousiasme d’une partie de la infrastructure capable de gérer la complexité communauté pour ces technologies de l’information géographique tout en sémantiques, elles soulèvent des questions préservant la simplicité de l’interface est techniques et financières difficiles à ignorer crucial pour faciliter la réutilisation des pour les administrations publiques. données. Une première étape dans l’intégration des L-1M "#$!&*1#/*A!&*4-,$!%*!N#+!%#$!%&(#$! données issues du secteur public à un hypothétique Web des données consiste à Face à la croissance toujours plus rapide mettre en ligne les données sous forme brute, des capacités de calcul et de stockage des et à permettre aux membres de la communauté centres de calcul des grandes entreprises du qui souhaiteraient s’impliquer de réaliser eux- Web, le monde fait aujourd’hui l’expérience mêmes la sémantisation des jeux de données. d’un véritable « déluge des données170 ». Au cours d’une présentation qu’il a On estime que l’humanité, qui aurait effectuée à la conférence TED175 en 2009, Tim produit 150 Exaoctets (150 milliards de Berners Lee a lancé un vibrant appel à la mise Gigaoctets, soit à peu près 40 milliards de en ligne des données brutes au plus tôt de par DVD) en 2005, créera 1,200 Exaoctets de le monde : « We want raw data now ! » données numériques nouvelles en 2011. Cette échelle de quantité de données à stocker et La mise en ligne de données brutes est une analyser crée de nouveaux défis et de approche pragmatique qui permet d’accélérer nouvelles opportunités technologiques. l’ouverture des données publiques, et une première étape vers la construction d’un Web L’apparition du cloud computing171 et le des données. développement d’outils de traitement algorithmique des données à très grande échelle (par exemple Map/Reduce, Hadoop, et FJ T5-&-!%,!#$<2%&8.+5! les outils Big Data172) vont permettre le stockage, le traitement et l’analyse de pans de E7-..B7&! données numériques d’une taille inimaginable jusqu’alors173. « Tout ce que nous connaissions L-M "#$!)0&%*24#*0$!%#!%&(#$!&4!%(1#,&))(! ),*$-#*0$!,-2#2#$! du Web va changer à nouveau », et ces outils permettront d’amener des réponses aux Selon la loi de 1978, le principe général est difficultés liées au volume des données. celui de la réutilisation libre, gratuite et sans conditions des données publiques. Les licences ne sont obligatoires que dans les cas où l’administration souhaite imposer une 169 Le premier portail de Yahoo recensait les sites les plus réutilisation payante de ses données. populaires, organisés selon leurs contenus. Il procédait ainsi à une séparation analogue entre donnée et Néanmoins, de nombreux acteurs métadonnée. considèrent que ce régime ne garantit pas une 170 The Economist. 25 février 2010. « The Data Deluge : réelle sécurité juridique, et attendent des Businesses, Governments and Society are Only Starting to pouvoirs publics qu’ils explicitent les usages Tap Its Vast Potential » 171 http://fr.wikipedia.org/wiki/Cloud_computing 172 ReadWriteWeb. 2010. The Age of Exabytes : Tools & 174 Approaches for Managing Big Data. Segaran, T. 2009. Programming the Semantic Web. http://www.readwriteweb.com/reports/big-data/ O’Reilly éditions. 173 175 Henri Verdier. 14 décembre 2010. « Big Data : Making TED (Technology Entertainment and Design) est un sense at scale. » ensemble de conférences lancées en 1984 par le secteur http://www.henriverdier.com/2010/12/big-data-making- privé à but non lucratif américain pour diffuser des "idées sense-at-scale.html qui méritent d’être répandues ».72
    • autorisés sous forme de licences, y compris très utilisées sur Internet, notamment pardans le cas d’une réutilisation gratuite. Wikipedia. Schématiquement il existe cinq possibilités Les licences pour réutilisation de donnéessur les conditions d’accès aux données comportent en général des clauses pluspubliques : techniques liées à la nature d’une base de données, qui peut être différente d’un contenu • Sur demande : l’accès peut être média. Un certain nombre de licences « Open accordé dans certains cas et sous Data » standard pour réutilisation de données conditions. s’inspire cependant largement de Creative • Licence payante : l’accès aux données Commons. La licence ODbL177 (Open est assujetti à un paiement. Database License) reprend notamment des • Accord exclusif d’accès avec une notions de partage à l’identique et seule entreprise déléguée pour d’attribution, et permet l’accès, l’utilisation, le diffuser les données: en cas téléchargement, la copie, le partage et la d’investissements importants réalisés distribution des données publiques ouvertes. par le privé mais pour une durée limitée seulement, peut être le cas Le ministère de la Justice a élaboré une dans le domaine culturel. licence « information publique librement • Licence ouverte sous conditions : réutilisable » appelée LIP178. Elle précise les l’accès est ouvert mais la diffusion est droits d’adaptation des informations publiques soumise à conditions. en vue d’une activité commerciale ou non. • Licence ouverte sans restriction : L’adaptation et la modification sont autorisées l’accès et la réutilisation sont libres, à condition qu’il y ait enrichissement c’est le cas des données entrées dans documentaire, technique ou éditorial et que le le domaine public ou, par défaut, des sens ne soit pas dénaturé. La rediffusion et la données publiques ouvertes sans vente sont possibles si les données ont subi un licence. nouveau traitement et qu’elles sont intégrées dans un produit ou un service nouveau auprès De nombreuses licences ont déjà été des tiers.élaborées par des services publics, certainespouvant être contractualisées par un simple L--M 9#!2&7),#A-4(!,-(#!T!,3/22*7*,/4-&!%#!clic. ,-2#2#$!! L’Agence pour le Patrimoine Immatériel de Toutes ces licences, bien qu’elles soientl’État (APIE), une agence de conseil du fondées sur les mêmes principes généraux, neministère de la Réforme de l’État et des sont pas nécessairement compatibles les unesComptes Publics en a développé deux pour avec les autres. Or, les données n’ont de valeurlivraison de données soumises à redevance pour les usagers finaux des services qui les(une pour téléchargement simple et l’autre réutilisent que si elles sont partagées,pour livraisons régulières). La Direction de recoupées et réutilisées.l’Information Légale et Administrative a mis Certaines données sont disponibles à titreen place des licences payantes pour la gratuit et d’autres à titre payant, certaines sontréutilisation de certaines de ses données par soumises à des droits, d’autres sont en libreailleurs accessibles gratuitement, comme les accès au public, d’autres encore portent desdébats « questions-réponses » de l’Assemblée clauses d’attribution parfois lourdes. Dans cenationale, ou les téléchargements de masse contexte parfois contradictoire, connaîtredepuis Légifrance (avec livraison au format précisément les conditions de réutilisation deXML sur un site dédié). données produites par recombinaisons Dans le monde des contenus culturels, un successives peut être complexe.certain nombre de licences standards ont L’accumulation de licences différentesémergé des travaux sur l’évolution du pour des jeux de données distincts crée unecopyright face aux nouveaux usages de complexité et un risque juridiquepartage, de mashups ou de remix176. Les potentiellement coûteux. Il apparaît importantdifférentes licences Creative Commons, qui d’éviter la prolifération de différentes licencesdéfinissent des conditions différentes (avec ousans usage commercial, avec ou sans partage àl’identique, attribution, etc.) sont par exemple 177 Open Database License http://www.opendatacommons.org/licenses/odbl/ 178 Licence Information Publique http://www.rip.justice.fr/information_publique_librement_176 Lessig, 2009. Idib. reutilisable 73
    • proposant des dispositions ne variant que de L1M D#$!2&%-4-&$!%#!,-2#2#$!-$)-0(#$!%#! façon marginale, et de privilégier l’utilisation Q!N-&,+.?&!N$<<$*(!S!#4!%*!Q!(0,-&!,%.b&!S! la plus large de licences standards, idéalement Lorsque les données produites sont aux standards de l’Open Data. commercialisées, il peut arriver que leur mise à disposition à titre gratuit pour une réutilisation L---M "#$!%-CC(0#2#$!%#!%0&-4!#40#!)/Y$<!$&*02#! commerciale ne soit pas possible, notamment %#!2&C*$-&! pour des raisons de distorsion de concurrence Le droit à la réutilisation, ses limites et son sur des marchés existants. interaction avec les droits de propriété Il est par contre souvent possible de mettre intellectuelle n’est pas uniforme entre les pays. à disposition les données pour réutilisation Des différences marquées apparaissent entre gratuite même dans un but commercial, mais pays de droit civil et pays de common law. avec une restriction de taille, qui est celle du Ainsi, reprendre une œuvre française mise « share alike » – le partage des données dans sous une licence creative commons donnée des conditions identiques. n’offre pas les mêmes avantages que si cette Ce type de licences gratuites spécifiques œuvre était américaine. Le droit de permettent d’adapter, de modifier, de réutilisation des données, et les droits couvrant transformer et de construire d’autres données à les bases de données elles-mêmes sont d’autant partir de celles mises à disposition, à condition plus complexes que les données proviennent de de reverser au profit de l’ensemble de la pays différents. collectivité les données produites, dans des Ces confusions peuvent nuire à la facilité conditions identiques cest-à-dire ouvertes de réutilisation et créent un risque juridique. (redistribution imposée sous la même licence). L’émergence de standards internationaux de Mettre en place une licence gratuite de type licences compatibles doit devenir une priorité. « share alike » n’exclut absolument pas de maintenir la tarification de la réutilisation des L-1M D#$!)-24&;0/77#$!)&*0!%#$!2&%-4-&$!%#! 0(*4-,-$/4-&!),*$!#A),-2-4#$! données hors de ce cadre. Les autres réutilisateurs peuvent toujours accéder à une Il est primordial, pour assurer la clarté licence payante non exclusive. juridique des conditions de réutilisation, de permettre aux réutilisateurs d’en prendre Certains interlocuteurs au sein de la connaissance simplement. communauté des réutilisateurs considèrent de telles clauses comme contraires à l’esprit de La Fondation Creative Commons a mis au l’Open Data. D’autres y voient une approche point à cet effet un certain nombre de pragmatique permettant de concilier des pictogrammes permettant d’identifier finalités différentes. facilement les conditions spécifiques de réutilisation d’un contenu couvert par une telle licence. C’est aussi dans cette perspective de DJ ^*+.#.2&-!%:.<2,#+! lisibilité que Thomas Saint-Aubin, au sein du $-6,*.(,+.$**&%! ministère de la Justice, a conçu le pictogramme « Infomation Publique », signalant un jeu de L-M "#$!0#%&%/2#$!,&2/,#$!0(1W,#4!,#!+#$&-! données disponible en licence LIP. %3*#!-C0/$40*24*0#!/4-&/,#! L’étude de cas présentée au chapitre V sur le partage de l’information géographique dans les régions montre que des recoupements au moins partiel des initiatives locales de partage des données géographiques publiques existent. L’État, qui donne l’impulsion d’une infrastructure nationale pour l’information géographique et se trouve au centre des initiatives ou au moins associé à celles-ci, pourrait rechercher plus systématiquement des synergies entre elles.74
    • L--M X0-1-,(;-#0!,/!0/)-%-4(!%3#A(2*4-&! L-1M "#!2&i4!%#!,/!7-$#!T!%-$)&$-4-&!#$4! 2&7)#$(!)/0!,#$!+((C-2#$!-%*-4$! Dans le développement de projets desystèmes d’information du secteur public, on Un élément récurrent du débat surconstate souvent une recherche de qualité des l’ouverture des données publiques est celui dudonnées et d’exhaustivité du service offert. coût supposé démesuré qu’elle impliqueraitCela se fait au détriment de la rapidité de mise pour la puissance publique.en œuvre. Notre étude sur la mise en commun des Même si l’intention est louable et données géographiques dans les régionscompréhensible, elle aboutit en pratique à des permet de faire émerger quelques ordres dedélais souvent si longs que le service, dépassé grandeur.par la courbe technologique, ne répond plus à Les moyens en investissement desla demande avant même sa sortie. initiatives de mise en ligne de données Il est largement préférable de privilégier la correspondent essentiellement aux dépensesrapidité d’exécution et d’adopter une démarche liées aux serveurs, soit pour les portailsde développement agile. La mise en ligne géomatiques des régions une moyenne derapide d’une version bêta avec un petit nombre 200 000 euros par initiative. Les coûts dede jeux de données permet d’illustrer fonctionnement moyens sont de 50 000 eurosrapidement les enjeux et d’enclencher le cercle par an et de 4 équivalents temps plein.vertueux qui créera les conditions favorables à Pour le plus grand projet de mise àun développement rapide du projet. disposition de données géographiques en France, le Géoportail de l’IGN, qui répond auxL---M "#$!C0#-$!2,/$$-.*#$!/*!2:/;#7#4! obligations de la directive INSPIRE, 22 agents0#$4#4!T!,3@*10#! sont dédiés à son activité spécifique de service Le savoir étant souvent associé au pouvoir, public à l’exclusion de toute activitédes freins à l’ouverture des données commerciale. Les coûts en investissementapparaissent naturellement dans les s’élèvent à 6 millions d’euros, et le coût annuelorganisations, et s’ajoutent aux résistances de fonctionnement est de 2 millions d’euros.qu’un changement aussi profond que l’OpenData ne peut manquer de créer. Ces coûts nous semblent largement compensés par les avantages de l’ouverture des L’apparition de nouveaux processus au sein données. L’État a d’ailleurs montré qu’il étaitde l’administration du fait de la collecte et du prêt à les couvrir, voire à compenser le manquerecensement des données nécessite des à gagner commercial qu’un passage à lacompétences propres et des formations gratuité pouvait engendrer lorsque lesadéquates. C’est un point essentiel pour la bénéfices le justifiaient, comme ce fut le casréussite de la construction d’une nouvelle avec le passage du RGE de l’IGN à la gratuitérelation entre le producteur et les réutilisateurs pour le secteur public en 2010 – et ce d’autantéventuels des données. plus que dans ce cas, le produit de la commercialisation provenait du secteur public L’animation conjointe de la communauté lui-même.de producteurs et de réutilisateurs, que ce soitpar l’organisation de concours de La mutualisation des plateformes par lesdéveloppement, d’ateliers de travail ou de Bar collectivités, voire la mise en ligne de leursCamps, doit permettre de rapprocher ces données sur data.gouv.fr, devrait permettre decommunautés et de catalyser les efforts de dépasser ce débat.mise en ligne et de réutilisation. Cela soulève la question de la place del’innovation au sein des organisations. Parexemple l’INSEE, considérant qu’il est trop tôtpour restructurer l’organisation dans sonensemble autour de la question du websémantique179, s’est investi dans le projet DataLift180 de l’INRIA pour adapter au websémantique certaines de ses données.179 Entretien du 26 novembre 2010, ibid.180 Projet de recherche sur l’interconnection des jeux dedonnées sémantiques. http://datalift.org/ 75
    • services. Ce n’est que très rarement la donnée VJ Q+,>%.-!&(!<$I%&(! en tant que telle qui a une valeur directe pour le consommateur ou l’entreprise, mais 5#$*$<.B7&(!2-$2.#&(!3! l’information qu’elle contient, l’analyse qu’elle %:.**$?,+.$*! permet d’étayer, l’objet qu’elle permet de construire, l’application qu’elle permet de Cette section aborde et décrit les développer. caractéristiques particulières de la donnée publique en tant qu’objet économique, les L’évolutivité des techniques rend prescriptions normatives de la théorie, et les impossible la prévision, même dans les conséquences que l’on peut en tirer quant au grandes lignes, des usages tirés de l’ouverture modèle économique le plus à même des données qui rencontreront un succès d’encourager la réutilisation des données et de commercial. Il ne faut donc pas restreindre les permettre de réaliser les bénéfices que la données susceptibles d’ouvertes en fonction société peut en attendre. d’une analyse a priori de leur intérêt pour les réutilisateurs. VJCJ O&(!$**5&(!27>%.B7&(!#$<<&!$>E&+! Ne mesurer que la demande directe des 5#$*$<.B7&! données par les réutilisateurs, c’est ignorer l’effet multiplicateur de la demande de services L-M X/04-2*,/0-4($! exprimée ou latente chez les utilisateurs. Du fait de leur caractère immatériel, les L’analyse du modèle économique des données publiques présentent des particularités données doit prendre en compte les externalités par rapport aux biens classiques, même positives découlant de la création de nouveaux informationnels. Leur non-rivalité revêt une services et de l’incitation à l’innovation portée importance technique, au sens où leur coût de par l’ouverture la plus large des données reproduction est quasi nul. Leur coût de publiques. distribution est donc très faible lui aussi, car limité au coût de bande passante, très L--M f&%W,#$!(2&&7-.*#$!%#$!%&(#$! largement négligeable, et de stockage, qui reste )*+,-.*#$! très modeste des bienfaits issus de la Les exercices de modélisation économique réutilisation des données. de la production et de la réutilisation des En sens inverse par contre, les coûts fixes données publiques se limitent en général à trois liés à la production de données sont types de coûts : les coûts de production de la significatifs à chaque étape de la chaîne de donnée brute, les coûts de transformation (de valeur. données « upstream » ou « brute » en donnée « downstream » ou « à valeur ajoutée »), et les Si le coût marginal de production et de coûts de diffusions. distribution est quasi nul, se pose en revanche la question de la couverture des coûts fixes. Dans la réalité, il faut aussi bien sûr tenir C’est là que repose toute la complexité de la compte des coûts de transaction, qu’ils soient question de la tarification. fixes (mise en place d’un moyen de paiement) ou variables (frais de transactions financières à Un autre caractère particulier de la donnée chaque paiement de redevance, et temps de publique tient au fait qu’elle présente un très travail nécessaire à leur réalisation). fort potentiel de réutilisation au sein de biens et L’expérience empirique sur la tarification des services fortement hétérogènes. Par opposition données montre que le coût de mise en œuvre à un bien physique, souvent destiné à un usage d’une infrastructure de paiement est souvent à spécifique une fois produit, une donnée peine compensé par les revenus générés181, ce publique peut servir à un éventail virtuellement qui doit pousser à restreindre le plus possible infini d’applications. l’établissement de redevances pour Cela pose un problème concret à l’analyse réutilisation. économique des évolutions du marché pour Le point crucial à rappeler est que la une donnée particulière, car rien ne permet de donnée, avant d’être un bien dont les savoir si elle constitue un marché mature ou si consommateurs peuvent bénéficier directement son potentiel de réutilisation innovante est ou indirectement, est l’outil de travail encore latent. fondamental de l’administration. Il faut éviter Surtout, les données publiques ont la caractéristique d’être avant tout des facteurs de production d’autres biens ou (majoritairement) 181 Table ronde avec des collectivités locales à l’Open Government Data Camp à Londres le 18 novembre 2010.76
    • la multiplication au sein des administrations permettre l’émergence de ce marché et son bond’un travail de raffinage des données à fonctionnement.186destination d’une activité de vente, pour deux En particulier, il est important de noter queraisons : d’abord cela crée des risques de cette doctrine a vocation à s’appliquer aussi audistorsions majeures sur les marchés, comme secteur privé, et l’on peut imaginer qu’ellenoté par Joseph Stiglitz (prix Nobel fasse un jour jurisprudence pour permettred’économie) et Peter Orszag (ancien ministre l’accès à des données certes de droit privé,du Budget américain d’Obama) dans le rapport mais constituant une ressource essentielle pourde référence sur le rôle du gouvernement dans des intérêts de service public.187 188l’ère numérique182 ; et si des données sont dequalité suffisante pour le travail del’administration, il ne doit pas y avoir lieu de VJFJ N0$.8!$2+.<,%!&!+,-.S.#,+.$*!&+!les transformer en profondeur pour les rendre 0@2$+0I(&(!5#$*$<.B7&(!utiles à des réutilisateurs. L-M E0&-$!4Y)#$!%#!4/0-C-2/4-&!)#07#44#4!%#! Il faut donc bien définir les coûts dont la 40/-4#0!,#!)0&+,W7#!%#$!2&i4$!C-A#$!couverture nous amène à rechercher un modèleéconomique optimal : il ne s’agit non pas de Les études économiques retiennent enl’ensemble des coûts de production, mais de général trois modèles de tarification pourceux générés du fait et seulement du fait de la couvrir les coûts fixes découlant de la mise àmise à disposition d’un ensemble de données. disposition de données publiques. Le modèle monopolistique correspond à unL---M D&240-#!%#$!0#$$&*02#$!#$$#4-#,,#$!#! modèle où l’objectif est la maximisation des%0&-4!%#!,/!2&2*00#2#! revenus directs pour l’institution productrice. Il Un point important qui élargit l’enjeu de la participe souvent de l’exercice d’une positiontarification à celui de l’accès aux données est dominante, car seule la puissance publique a ceson incidence sur des problèmes de à et peut produire un certain nombre deconcurrence imparfaite. Les conflits données. Les distorsions et inefficacités que ceconcurrentiels qui peuvent apparaître dans un comportement de monopole peut créer sontmonde où l’administration a le monopole bien connues et particulièrement fortes selon lastructurel de la production d’un certain nombre théorie.de données importantes ont été notés dès les Le modèle de coût moyen suppose laprémices des réflexions sur l’accès aux possibilité pour un producteur d’observer ladonnées publiques dans les années 1990183 184. courbe de demande de ses réutilisateurs, et de L’importance du sujet a conduit le Premier fixer un prix qui équilibre exactement sesministre Lionel Jospin185 à répéter alors, lors revenus directs issus des redevances avec sesdu discours d’Hourtin de 1997, la doctrine des coûts d’ouverture et de diffusion des données.ressources essentielles et son application aux Enfin, le modèle de coût marginal, dans lesdonnées publiques. faits celui de la gratuité, recherche l’optimum Selon cette doctrine de droit de la d’efficience économique, que la scienceconcurrence, toute ressource dont la économique détermine comme atteint lorsqueréutilisation est essentielle à l’établissement le prix d’un bien (ici le montant de lad’un marché efficace et concurrentiel, mais qui redevance) est égal au coût marginal depeut en empêcher la formation si elle n’est pas fourniture du bien, cest-à-dire d’une unitéaccessible, doit être régulée de manière à supplémentaire (ici très proche de zéro car la donnée est immatérielle). Il fait par contre porter les coûts fixes de production et diffusion des données sur le budget de l’institution productrice, cest-à-dire indirectement sur le182 Joseph Stiglitz et Peter Orszag. Octobre 2000. The Role réutilisateur via l’impôt (avec les incidences enof Government in a Digital Age. terme de redistribution que cela peuthttp://archive.epinet.org/real_media/010111/materials/stigl impliquer).itz.pdf183 Entretien avec Maurice Ronai.184 Maurice Ronai. 1996. Données publiques : accès,diffusion, commercialisation. Revue Problèmes Politiqueset Sociaux : Dossiers d’Actualité Mondiale. Nos 773-774,1er novembre 1996. La Documentation Française. 186 Entretien avec Pierre-Jean Benghozi le 12 octobre 2010.185 187 Lionel Jospin. Discours à Hourtin le 25 aout 1997. Entretien avec Maurice Ronai, auteur du rapport à laPréparer la France pour la Société de l’Information. documentation française de 1996 sur le sujet. 188http://www.admiroutes.asso.fr/action/theme/politic/lionel.h Entretien le 12 novembre 2010 avec Guillaumetm Crouigneau, directeur de CanalTP, filiale de la SNCF. 77
    • La littérature sur le sujet est encore réduite, le point sur une courbe de demande qui lui mais trois études en particulier comparent permette d’équilibrer son budget. systématiquement les trois modèles, leurs Au contraire, le modèle de coût marginal, avantages et leurs inconvénients : ou la gratuité, qui aurait court sur un marché en « Models of provision of Public Sector concurrence pure et parfaite, s’abstrait de cette Information by trust funds » de l’Université de contrainte irréaliste. Cambridge189 qui fait autorité auprès du Mais c’est sur le sujet des distorsions de gouvernement britannique (Newbery et al.), concurrence que les modèles de coût moyen et l’étude Bureau d’Économie Théorique et monopolistique présentent des risques Appliquée de l’Université de Strasbourg sur la d’inefficacités extrêmes. Ces risques valorisation des informations du secteur public proviennent d’abord des positions dominantes réalisée en collaboration avec l’Agence pour le par nature des acteurs publics dans la Patrimoine Immatériel de l’État190, et production de données publiques, mais aussi « Economics of Public Sector Information191 », de la sous-optimalité de ces deux modèles qui l’étude complémentaire à l’étude de mettent en place une structure distordue de Cambridge, menée fin 2008 par Rufus Pollock, signaux d’incitations. mathématicien et économiste à l’Université de Cambridge et nommé par le Premier ministre Au contraire, le modèle de tarification David Cameron au Public Sector Transparency marginale aligne exactement le prix de la Board. licence de réutilisation des données sur le coût marginal d’ouverture et de diffusion. Selon le L--M 9#!0(C(0#2#!g!jc2&&7-2$!&C!X*+,-2! modèle de la Pareto-efficience, c’est donc la F#24&0!ZC&07/4-&k!%#!6*C*$!X&,,&2l! solution optimale pour la société. L’étude de Rufus Pollock est la référence la Pour Pollock, le modèle de la gratuité plus largement citée et la plus reconnue. Elle s’impose donc et doit être généralisé. La seule aborde l’ensemble des problèmes théoriques question qui peut rester ouverte elle celle de liés à l’économie des données publiques, savoir, soit dans quels cas théoriques le modèle rassemble les résultats empiriques connus, et de coûts moyens devrait prévaloir sur le propose des solutions de financement modèle en coûts marginaux, soit dans quelles alternatives tels que le paiement à exceptions ces coûts marginaux deviennent l’enregistrement des données. non négligeables et imposent une tarification Le cœur de l’étude détaille quatre types de modeste autre que la gratuité. problèmes majeurs qui apparaissent avec les modèles de tarification cités précédemment192 : L---M "3Q!(4*%#!%#!F40/$+&*0;!S!0(1W,#!,#$! %-CC-2*,4($!,-(#$!/*A!:Y)&4:W$#$!(2&&7-.*#$! les questions de crédibilité du producteur quand à la pérennité de sa tarification (le risque L’étude récente menée par Julien Pénin et étant la capture de valeur injustifiée par la quatre coauteurs au Bureau d’Économie puissance publique une fois de nouveaux Théorique et Appliquée de l’Université de modèles commerciaux découverts), les Strasbourg, en partenariat avec l’Agence pour incitations à la production et à la réutilisation, le Patrimoine Immatériel de l’État (APIE), se les distorsions de compétition, et les problèmes propose d’aborder le sujet sous l’angle de la d’asymétrie d’information. valorisation des informations du secteur public193. Le modèle de coût moyen pose des problèmes insolubles d’asymétrie Ses conclusions s’approchent dans ses d’information, car il est irréaliste de penser grandes lignes de celles de la littérature qu’un producteur puisse observer exactement existante, à savoir que la tarification devrait être gratuite pour tous les usages personnels, que le modèle de tarification au coût marginal 189 David Newbery, Lionel Bently, Rufus Pollock. 26 est optimal pour le plus grand nombre de février 2008. « Models of Public Sector Information réutilisations commerciales. Elle affirme Provision via Trading Funds. » Cambridge University. http://www.berr.gov.uk/files/file45136.pdf 190 APIE. 12 janvier 2011. « Etude économique ». 193 https://www.apiefrance.fr/sections/acces_thematique/reutil Julien Pénin et al. 12 janvier 2011. « Rapport Final : La isation-des-informations-publiques/etude- valorisation des informations du secteur public (ISP) : un economique/view modèle économique de tarification optimale ». Université 191 Rufus Pollock. 2 décembre 2008. « The Economics of de Strasbourg. Public Sector Information ». University of Cambridge. https://www.apiefrance.fr/sections/acces_thematique/reutil http://www.rufuspollock.org/economics/papers/economics isation-des-informations-publiques/etude- _of_psi.pdf economique/downloadFile/attachedFile/Rapport_final_BE 192 Tableau page 16 dans Pollock, 2008. TA.pdf?nocache=1294846257.3178
    • cependant qu’il existe des cas dans les marchés Enfin, l’étude n’aborde qu’en conclusion lamatures avec forte contrainte budgétaire où la question de la mise à disposition des donnéestarification au coût moyen peut aussi être brutes nécessaires à l’élaboration desoptimale. informations du secteur public tarifées. Si l’État propose une activité de type L’étude révèle par contre des difficultés concurrentiel à partir des données publiquesliées à la compréhension des enjeux concrets sans mettre à disposition du marché lesde la réutilisation des données. données brutes qui sous-tendent son activité, il Les auteurs considèrent tout d’abord que le risque d’interdire l’accès d’entreprises à unbut d’une politique de réutilisation est la marché concurrentiel, ce qui contreditdiffusion large d’informations et de savoirs directement la doctrine des biens essentiels. Il(cest-à-dire, selon leurs termes, en résulterait une position de monopole« d’informations enrichies »). injustifiée et inefficace. Dans la mesure où c’est l’application des En ce sens, il possible d’interpréter lesdonnées plutôt que les données elles-mêmes résultats de cette étude comme un soutien à laqui ont une valeur pour les citoyens et les généralisation la plus large de la gratuité deconsommateurs, c’est au contraire à la réutilisation des données publiques.diffusion la plus large des bénéfices issus desdonnées qu’il faut viser. Le but d’une politique L-1M 9!2&$#$*$!$*0!,/!4/0-C-2/4-&!&)4-7/,#!de réutilisation devrait donc de préférence /))/0/U4!#!)0(2-$/4!,#$!:Y)&4:W$#$!porter sur la diffusion large auprès du public Les différentes études font émerger undes réutilisateurs des données brutes, dont consensus des sciences économiques sur les« l’état brut sans explications (…) ne permet mécanismes à l’œuvre, si l’on précise bien les(certes) pas la rediffusion au plus grand hypothèses sur lesquelles se basent les modèlesnombre » mais est en revanche exactement la mathématiques utilisés.qualité recherchée par les développeurs pourencourager à la réutilisation194. Le choix d’une hypothèse de données de type brut (upstream) ou à valeur ajoutée Cela indique que la demande usuellement (downstream) est important. Pour lasupposée serait sous-estimée face à la demande communauté technique, ce sont ces presqueactuelle du public, encore mal comblée, et sa exclusivement ces données upstream sousdemande latente pour des besoins que les formats bruts qui intéressent les créateurs deentrepreneurs chercheront à découvrir. services numériques, et ce sont celles-là qu’ilL’absence de prise en compte d’un convient de rendre gratuites.multiplicateur sur les fonctions de demandepourrait remettre en cause les conclusions de La prise en compte ou non de la contraintel’étude sur l’intérêt du modèle de coût moyen. budgétaire dans les modèles mathématiques peut aussi faire pencher vers un modèle de L’autre mécompréhension manifeste est la coûts moyens dans certaines exceptions. C’estquestion de savoir quels coûts sont engagés en une vraie contrainte qui peut se manifesterplus, du fait et du seul fait de la mise en ligne concrètement. On peut cependant remettre ende données à fins de réutilisations. cause, comme le font Tirole et Laffont195, la Si l’administration, dans le cadre de ses crédibilité de l’hypothèse d’un régulateur quiactivités, éprouve le besoin pour elle-même de se justifierait par des contraintes créées de sonraffiner les données en leur ajoutant une propre fait pour ne pas appliquer le modèlestructure ou de l’information et des économique le plus efficace pour tous.métadonnées, c’est alors cette « information Enfin, les modèles doivent faireenrichie » qui constitue la donnée brute au sens l’hypothèse de coûts de transactions élevés,de la réutilisation. Prendre en compte ce coût vérifiée empiriquement, qui rend irrationnellede mise en forme dans l’établissement d’une une tarification pour la grande majorité desredevance revient à faire porter sur les ensembles de données. Pour la grande majoritéréutilisateurs une partie des coûts de des jeux de données, toute tarification seraitproduction des données nécessaires au rendue non rentable par les coûts defonctionnement normal de l’administration, transaction. La gratuité s’impose alors.alors qu’ils sont déjà financés par le budget del’État. Cela serait injuste, inefficace, et Dans la pratique, les évolutions rapides dudistorsif sur le marché. contexte technologique et les incertitudes194 195 Table ronde entre collectivités et développeurs à la Laffont, J. et Tirole, J. 1993. « A Theory of Incentivesconférence ePSI de Rennes, 29 novembre 2010. in Procurement ». MIT Press. 79
    • inhérentes à l’innovation poussent à L---M D&#0!/22W$!/*A!%&(#$!+0*4#$!$&*$R généraliser le plus possible la gratuité afin >/2#4#$! d’encourager la création de nouvelles activités Le rôle de l’État dans l’ère numérique est à partir des données publiques. de mettre en place les structures qui permettent Plusieurs des acteurs à qui nous avons pu le fonctionnement efficace et juste des parler estiment que la majorité des données marchés, mais en aucun cas de préjuger des doit être réutilisable gratuitement même à titre préférences des acteurs de ce marché. commercial. Pour éviter que les réutilisateurs soient Il s’agit alors de délimiter clairement les contraints d’utiliser les données à valeur cas dans lesquels il est légitime d’adopter une ajoutée tarifées même lorsqu’ils ne sont tarification. L’exercice d’analyse économique intéressés que par la donnée brute sous-jacente, permet de dessiner les contours d’une politique il faut assurer la possibilité d’accéder, efficace de tarification de la réutilisation des gratuitement, à ces données brutes à chaque données publiques. fois qu’une redevance est établie pour réutilisation de données à valeur ajoutée. VJDJ 9*!<$I%&!%56.+.<&!&!+,-.S.#,+.$*! L’application de ce principe, outre la &SS.#,#&! création de valeur qu’il permet sur le marché, ne peut qu’inciter l’acteur public concerné à L-M "/!0(*4-,-$/4-&!%#$!%&(#$!%&-4!B40#! améliorer le service et la valeur ajoutée qu’il ;0/4*-4#!)/0!%(C/*4!! apporte dans ses données downstream. Une Par défaut, la réutilisation d’une donnée telle émulation provoquée par la concurrence publique ne doit pas être tarifée, ni lorsque la sera positive à la condition impérative que réutilisation se fait à titre personnel, ni l’acteur public joue pleinement le jeu de lorsqu’elle se fait à titre commercial. l’ouverture des données upstream. À défaut, l’intervention d’un régulateur s’imposerait. C’est particulièrement crucial pour les marchés les moins matures où l’innovation liée VJVJ O:,##I(!,78!$**5&(!27>%.B7&(! aux données publiques est émergente. Le choix &*#$7-,6&!%&!5?&%$22&<&*+!&(!E&7*&(! de la gratuité est raisonnable dans ce cas, et &*+-&2-.(&(! notamment du point de vue du développement des entreprises innovantes. L-M "3#40#)0##*0-/4!2&77#!)0&2#$$*$! Pour produire les effets les plus positifs sur %3#A),&0/4-&! les acteurs et la dynamique économique, la Les développements récents menés par Éric politique de réutilisation des données Ries, entrepreneur, auteur et intervenant à la publiques privilégiera la gratuité par défaut. Harvard Business School et la Stanford Graduate School of Business, ont amené à L--M D#$!2/$!,(;-4-7#$!%#!0#%#1/2#!#A-$4#4! repenser l’entreprenariat comme une activité Pour des données dont le coût marginal d’exploration196. d’ouverture et de distribution est très important En particulier, une jeune pousse, plutôt (très forte taille de fichiers par exemple), pour qu’une version de petite taille d’une grande des données dont la diffusion implique de très entreprise, est définie comme une organisation forts coûts fixes par rapport à une demande temporaire chargée de développer la solution faible des réutilisateurs, ou des données à forte commerciale et technologique qui réponde le valeur ajoutée dans des marchés matures et mieux à un problème supposé, mais qu’il faut établis, il peut être légitime d’adopter une découvrir, comprendre et confirmer, ou tarification, qui selon le droit et la infirmer et explorer à nouveau. C’est presque jurisprudence ne saurait être excessive en littéralement d’une expérience scientifique regard de ces coûts. qu’il s’agit, et le développement des startups Nous préconiserons donc de limiter technologiques dépend de la réussite d’un strictement les redevances pour réutilisation à processus d’exploration. ces cas bien identifiés, au risque sinon de Dans ce contexte, tarifer l’accès à un grand brider l’innovation émergeante dans le secteur nombre de données publiques pour des des données publiques, et les bénéfices que la réutilisations commerciales risquerait de société tout entière peut en attendre. réduire fortement l’opportunité de développer 196 Concept de jeune pousse maigre ou « Lean Startup ». http://www.startuplessonslearned.com/80
    • un nouveau tissu de jeunes entreprises images radars destinées au service public, pourinnovantes autour de ce domaine. avantager ses opérations concurrentielles. Il a finalement été obligé de se scinder en deuxL--M "#$!2&i4$!,-($!T!,/!4/0-C-2/4-&!C0#-#4! sous la pression de l’autorité de la concurrence.,3#A)(0-7#4/4-&! Les théories de l’organisation indiquent La nécessité d’entrer dans des négociations qu’en matière de coordination, la présencelégales et la perspective de devoir s’acquitter d’un coordinateur mandaté (et doté des leviersde droits d’exploitations conséquents avant légaux nécessaires) est souhaitable pour faired’avoir expérimenté la viabilité commerciale respecter la cohérence d’une politique ded’un produit est une barrière dirimante pour tarification à laquelle les institutions n’ontnombre de jeunes sociétés. qu’un intérêt commun et pas individuel. Elle peut être insurmontable pour un Son rôle serait de veiller en permanencedéveloppeur indépendant ou employé par pour éviter qu’un acteur se place ans uneailleurs et qui songerait à lancer une activité posture du type « tragédie des communs »nouvelle sans disposer de capitaux importants. décrite par Hardin.L---M Z,!#$4!$&*:/-4/+,#!%#!)#07#440#! L’annonce faite par la Grande Bretagne le,3#A)(0-7#4/4-&!0/)-%#! 12 janvier 2011 de la création d’une entité en charge des données publiques (se reporter au Le milieu des nouvelles technologies 1.2.) est à ce titre importante, car elle reconnaîtprogresse à une vitesse impressionnante. Si la de fait les risques forts de conflits d’intérêts, etFrance ne facilite pas l’émergence à très courte propose une solution pragmatique, qui aura deéchéance (1 an à 2 ans) de nouvelles créations plus la capacité à faciliter l’accès à tous typesd’entreprises à partir de la réutilisation de de données et le mandat d’investir dans ladonnées publiques, le risque est grand de voir production de données afin de pérenniser leurle marché français des services Open Data qualité.capturé par d’autres firmes dominantes, ou lesstartups que d’autres économies auront su aiderà émerger et se développer. ______________________ Il faut donc faciliter le plus possible l’accèsaux ensembles de données intéressants par lesentrepreneurs, en particulier à travers unetarification qui laisse la place à En conclusion, des solutions techniques,l’expérimentation. juridiques, organisationnelles et financières Les entreprises à succès devront existent pour encourager l’ouverture et lalégitimement participer au financement d’une réutilisation des données publiques etinfrastructure de qualité, mais les innovateurs permettre d’en tirer toutes les conséquencesdoivent pouvoir explorer de nouveaux modèles positives que la société et l’économie peuventd’affaires dans les premières années de leur en attendre.projet, ce que des redevances élevées et Sans remettre en cause les exceptions pourdiscriminatoires ne permettraient pas197. lesquelles une tarification à coût marginal est nécessaire, il est crucial d’abaisser autant queL-1M 9#!&0;/-$/4-&!%(%-(#!)&*0!/0+-40#0!,#$!2&C,-4$!%3-4(0B4$! possible les barrières à la réutilisation par la généralisation du modèle économique de la Les deux études que nous venons d’étudier gratuité de réutilisation.mettent en valeur des risques de conflitsd’intérêt clairs entre d’une part les activités deservice de type concurrentiel d’un vendeur dedonnées à valeur ajoutée et d’autre part sesactivités de service public. On garde à l’esprit l’exemple de l’InstitutMétéorologique Finlandais, reconnu coupablede détériorer volontairement la qualité de ses197 Henri Verdier. 8 juillet 2009. « Quelques Remarquessur les Données Publiques (#opendata). »http://www.henriverdier.com/2010/07/quelques-remarques-sur-les-donnees.html 81
    • 82
    • N0,2.+-&!];;J! )-$(2&#+.?&!M!/-$.(!(#5*,-.$(!2$7-!%:,?&*.-! Nous proposons dans ce chapitre trois CJCJ =.(&!&*!%.6*&!2-$6-&((.?&!&(!$**5&(!scénarios schématiques, correspondant à trois ,7!-@+0<&!0.(+$-.B7&!directions d’évolution possibles de la La politique des données publiques telleréutilisation des données publiques. qu’elle a été menée depuis la directive Le premier scénario dessine un monde dans européenne de 2003 et jusqu’à récemment alequel le développement de l’offre de données permis de mettre en ligne une première massepubliques se développe sans accélération critique de données. Elle a cependant maintenunotable de sa dynamique historique, en retrait jusqu’à présent l’essentiel des sources dedes évolutions technologiques rapides revenus liées à la vente de données publiques,actuelles. avec pour conséquence un manque de succès en termes de réutilisations innovantes. Le second scénario verrait l’offre privéeaccélérer et dépasser l’offre publique de On peut donc imaginer dans le futur unedonnés. Les monopoles informationnels et les lente montée en puissance de la diffusion de lagrandes entreprises du numérique donnée publique en ligne, et le développements’accapareraient alors largement l’espace plus appuyé de tentatives de génération deoccupé aujourd’hui par la puissance publique. revenus par l’État sur les marchés de la donnée. Le troisième scénario correspond à uneaction concertée de la part de la puissance Les tentatives de génération de revenuspublique pour catalyser l’émergence d’un rendent l’expérimentation et donc l’innovationécosystème dans lequel producteurs, difficiles. Il n’est donc pas certain, dans un telréutilisateurs et médiateurs collaboreraient scénario, que la vague de fond de l’Internetefficacement dans un cercle vertueux. mobile et des nouveaux usages puisse suffire à provoquer l’implication grandissante des différents échelons de la puissance publique dans la mise en ligne des données.CJ K!;*&-+.&!L!M!45?&%$22&<&*+!&!%:$SS-&!&!$**5&(! CJFJ 15($%7+.$*!2-$6-&((.?&!&+!#$*(&*(7&%%&! &(!>%$#,6&(!27>%.B7&(!3!($*!-@+0<&! Cette dynamique, si elle était maintenue sur0.(+$-.B7&! le long terme, présenterait plusieurs avantages Le passé est un miroir tendu à l’avenir ; un liés à la résolution des blocages observés.premier scénario logique pour le L’initiative d’ouverture des données adéveloppement futur de la mise en ligne des historiquement été laissée à chaquedonnées publiques se construit en extrapolant administration productrice, lui permettant deson rythme historique. concentrer ses efforts sur les enjeux qui lui Les grandes directions historiques de cette sont propres. Une approche graduelle permetpolitique, jusqu’à la mise en place récente de la de ne pas ajouter à la complexité dans unemission Etalab, étaient basées sur un situation déjà mouvante pour lesremplissage graduel et mal coordonné des administrations. Enfin, le maintient desRépertoires d’Information Publique plutôt que recettes de la commercialisation de certainessur impulsion centrale cohérente, et sur la données facilite le financement de cetterecherche de revenus pour l’État et ses transition par les institutions publiques.différentes institutions à partir des données Si cette politique se poursuivait à ce rythmepubliques. historique, on peut imaginer voir d’ici 3 à 5 Ces orientations permettent de dessiner les ans une quantité plus importante de donnéescontours et les risques d’un futur ou cette mises en ligne. Le renforcement de l’approchetendance historique passée se poursuivrait. patrimoniale de la donnée publique vue comme source de revenus directs risquerait 83
    • cependant de mettre à mal les bénéfices l’intérêt latent et moins fortement exprimé attendus de la politique de réutilisation des d’une majorité. données, en rendant cette réutilisation difficile Surtout, la valorisation des données passe pour les acteurs innovants. le plus souvent par le croisement statistique entre différents ensembles de données, ce qui CJDJ 1.(B7&!S$-+!&!<,*B7&-!%&(! resterait impossible à moins d’une large $22$-+7*.+5(!(+-,+56.B7&(!&!%:$7?&-+7-&! ouverture des données. &(!$**5&(!27>%.B7&(! Se restreindre à ouvrir les jeux de données Le scénario de l’inertie et du intéressants a priori, c’est risquer de manquer développement graduel mais lent d’une offre des opportunités majeures de réutilisations de données publiques au rythme historique innovantes par la société civile et les présente des risques pour l’État et la société. réutilisateurs. L-M X#0%0#!%*!4#7)$!1-$RTR1-$!%#!&$! L-1M f/.*#0!,3(1&,*4-&!%#$!4#2:&,&;-#$! )/04#/-0#$! 2&4#A4*#,,#$! L’avancée de nos partenaires sur le sujet Les nouveaux services contextuels ont risquerait de réduire le poids de la France lors besoin de données urbaines et locales pour se des discussions sur l’éventuelle révision de la développer. Ne pas développer leur mise en directive PSI. ligne, c’est ajouter une contrainte au Les entreprises, organes de presse et développement de cette industrie durant la acteurs technologiques de nos partenaires période décisive où les futurs acteurs internationaux bénéficieraient de plus d’une dominants sont encore en gestation. avance leur permettant d’accumuler le savoir- Le risque est fort de désavantager les faire et d’identifier les marchés et besoins acteurs français de ce marché face aux assauts émergents dans le domaine des données de compétiteurs mieux armés et plus publiques, mettant par ailleurs en danger notre expérimentés, comme ce fut le cas dans le secteur du numérique. domaine de la micro-informatique, des moteurs de recherche sur le Web, et plus L--M f/.*#0!*#!&))&04*-4(!%#!7&%#0-$#0! récemment des réseaux sociaux. La puissance ,3?4/4!#4!,#$!&*4-,$!%#!,3/%7--$40/4-&! publique dispose cependant dans ce cas d’un L’occasion d’insuffler une dimension outil stratégique puissant, qu’elle se doit de nouvelle à la mission de l’administration est saisir. une opportunité managériale unique pour les dirigeants de notre administration, politiques L1M "-7-4#0!,#!)&4#4-#,!(2&&7-.*#!,-(!/*A! comme hauts fonctionnaires. %&(#$!)*+,-.*#$! La manquer serait non seulement une La poursuite d’un objectif de rentabilité et décision contre-productive à moyen terme en de création de revenus directs pour l’État, via ces temps de recherche de réductions des l’établissement de redevances pour dépenses publiques. Ce serait aussi se résoudre réutilisation des données, risque en outre de à ne pas profiter de nouvelles opportunités de défavoriser la création de nouvelles services au public, créateurs de richesse et de entreprises, car les droits de licences bien-être, dont les coûts (la production des commerciales rendent l’expérimentation trop données) sont déjà supportés par risquée. l’administration dans le cadre de sa mission de Cela signifie in fine un déficit potentiel services publics. d’innovation dans le domaine des produits et services, dont la taxation à la valeur ajoutée et L---M F&*7#440#!,3&*1#04*0#!%#$!%&(#$!/*A! aux bénéfices pourrait élargir l’assiette fiscale $#*,#$!)0(%-24-&$!%#!0#4/+-,-4(! et apporter des revenus potentiellement plus Ne pas pousser fortement pour une importants à l’État. Ces nouvelles activités ouverture rapide des données, ce serait laisser pourraient par ailleurs créer des emplois et les administrations ne donner accès qu’aux favoriser la croissance. jeux de données dont elles peuvent percevoir l’intérêt le plus direct. Cette approche est L1-M I0/;-,-$#0!,#$!-$4-4*4-&$!)0&%*240-2#$!%#! potentiellement dommageable d’un point de %&(#$! vue démocratique, en cela qu’elle peut La frustration de citoyens et conduire à favoriser les minorités bruyantes à consommateurs face à la difficulté d’accès à des données qui leur importent pourrait les84
    • pousser à développer leurs propres solutions l’accès à ces nouveaux services augmentant,ad hoc, par exemple de manière collaborative. elle risquerait de soutenir le développement de monopoles et d’accords exclusifs anti- Bien que louable si ces solutions évoluent compétitifs.vers une relation public-privé efficace, cedéveloppement comporte une part de risques, L-M "#$!2&40/4$!%3#A2,*$-1-4(!0#C&02#4!,#$!notamment celui de la perte de légitimité des 7&&)&,#$!-C&07/4-&#,$!)0-1($!institutions qui historiquement ont produit desdonnées importantes pour les citoyens. Le Face à cette forte demande du public, etrisque serait alors grand de voir s’effriter un dans un contexte où l’expertise accumuléetissu d’expertises utiles, et la qualité des serait majoritairement captée par lesservices aux citoyens pourrait en souffrir. monopoles informationnels et les grandes entreprises dominantes du Web, il deviendrait On voit donc ici se dessiner les contours difficile pour les entités publiques d’éviter lesd’un scénario plus sombre, qui mettrait à mal contrats privilégiés et les accords exclusifsl’intérêt public et dessaisirait la puissance pour subvenir à la mise en ligne de donnéespublique de la production et de l’ouverture à la encore non accessibles.réutilisation des données publiques. Ces contrats renforceraient la tendance, Poussée à son terme, cette logique conduit endémique aux marchés de l’information, àau scénario suivant. l’apparition de monopoles199. Bien que la position dominante de ce type d’acteurs ne soitFJ K!N,2+7-&!L!M!4&(! pas nécessairement dommageable au grand public dans le cas où leurs services sont<$*$2$%&(!.*S$-<,+.$**&%(!(&! ouverts à tous mais rémunérés par la publicité,(7>(+.+7&*+!3!%,!27.((,*#&! ils n’en demeurent pas moins un problème pour le développement éventuel d’une27>%.B7&! industrie domestique. Le travail de préparation de ce rapport amis à jour de façon répétée la difficulté de L--M !"#$!2&4#4-#*A!$#!7*,4-),-#4!dialogue entre l’entreprenariat en nouvelles Surtout, une telle situation verrait latechnologies et l’administration, des mondes multiplication des contentieux, soitqui agissent dans des temporalités différentes. administratifs dans le cas où des concurrents À l’inverse du scénario précédent, dans s’estimeraient lésés, soit civils dans le cas oùlequel on imaginait voir ces tensions se une entreprise contractuelle considérerait querésoudre graduellement, on peut aussi ses droits sont lésés par un autre réutilisateur.esquisser en négatif un futur alternatif, où les Le climat d’incertitude juridique pourraitcarences de l’État deviennent un véritable avoir un effet négatif sur l’innovation et laattentisme qui laisse le champ libre à la réutilisation du fait des trop grands risquescapture198 de l’espace citoyen des données perçus que des investissements dans despubliques par le monopole et l’intérêt privé. programmes de réutilisation présenteraient.FJCJ O:$SS-&!2-.?5&!52,((&!%:$SS-&!27>%.B7&! L---M "3--4-/4-1#!)0-1(#!2&4&*0#!,#$! -$4-4*4-&$!)*+,-.*#$! Dans un scénario du cercle vicieux, lademande privée dépasse les moyens de soutien Un avantage de l’apparition desà l’offre de la puissance publique. Devant des contentieux est bien sûr qu’ils permettraient inconditions de réutilisation jugées comme fine de créer la jurisprudence, et de clarifier lesdiscriminatoire, le public expert se tournerait droits et devoirs des acteurs du marché.vers les solutions alternatives, soit collectives De plus, face au manque perçu de réactivité(de type Open Street Map), soit privées. de la puissance publique dans le domaine de la La possibilité d’accéder à des applications mise en ligne des données, et les contraintesbasées sur les données à caractère public mais créées d’autre part par les contratscollectées en nom privé créerait auprès du d’exclusivités qui viendraient à se multiplier,public la perception d’un retard de plus en plus le grand public pourrait s’organiser pourflagrant de l’administration. La pression pour collecter ses propres données, sur le modèle du198 Kaplan, D., 2010, « Les données publiques : etaprès ? », Internet Actu, 9 novembre 2010 199http://www.Internetactu.net/2010/11/09/louverture-des- Wu, T., 2010, « The Master Switch : Rise and Fall ofdonnees-publiques-et-apres/ Information Empires ». 85
    • « crowdsourcing », ce qui peut être un modèle public) où celle-ci est parfois déjà remise en efficace de production auto-organisée. question. En parallèle, des entreprises privées se L---M F*02:/0;#0!%/;#0#*$#7#4!,#$!2/)/2-4($! positionneraient pour offrir, qui de nouveaux %#!,/!H8D8! modes de collecte de données (par exemple à travers les données résiduelles de Le risque est fort qu’une augmentation géolocalisation collectées par les opérateurs200 sensible des contentieux vienne grever les ou par des services applicatifs ad hoc201), qui services de la Commission d’une charge de de nouveaux services. Ce scénario présenterait travail supérieure à ses ressources actuelles. donc des avantages certains. Outre un retard mécanique des développements autour de la réutilisation des données, ceci pourrait mettre en danger le droit FJFJ ],%$-.(,+.$*!&(!$**5&(!,7!5+-.<&*+! des citoyens à accéder aux documents &!%:.*+5-c+!27>%.#!3!%$*6!+&-<&! administratifs. Cependant, le climat conflictuel dans lequel ce futur hypothétique se déroulerait L-1M F&*7#440#!,3&*1#04*0#!%#$!%&(#$!/*A! tendrait à exacerber les problèmes potentiels #A-;#2#$!%#!0#4/+-,-4(!%#$!;0/%#$! que pouvait poser le scénario ‘Inertie’ et #40#)0-$#$!%#!,3-C&07/4-&! poserait un défi majeur à la puissance Un défi spécifique que poserait ce scénario publique. est la montée en puissance des seules entreprises privées dans le champ de la L-M f/.*#0!*#!&))&04*-4(!%#!7&%#0-$#0! diffusion des données publiques. ,3/%7--$40/4-&! Dans un monde numérique, la Dans ce scénario, la puissance publique communication et la réutilisation des données laisserait échapper une occasion de moderniser ont une portée politique qui participe au le travail de l’administration. Le risque n’est « vivre ensemble » entre citoyens. Si l’État ne donc plus seulement de passer à côté d’une remplissait pas, ou pas assez rapidement aux occasion d’insuffler une dimension nouvelle à yeux du public, le rôle de producteur et la mission du service public, mais bien de distributeur de données qui permettraient de renforcer les rigidités dont il peut parfois faire développer les services attendus par les preuve, et de voir se dégrader durablement ses citoyens, la sphère privée remplirait seule ce relations avec ses usagers et l’écosystème de rôle de décisionnaire quant aux données qui l’innovation digitale. ont vocation à être collectées et mises à disposition. L--M I0/;-,-$#0!,#$!-$4-4*4-&$!)0&%*240-2#$!%#! %&(#$! Cela impliquerait un recul des options stratégiques disponibles à la puissance Le climat de défiance dans lequel un publique d’une part, et d’autre part pourrait développement rapide de ce type se déroulerait créer des difficultés pour les citoyens ou pour pourrait ainsi avoir des conséquences d’autres entreprises, notamment les startups et fortement négatives sur le lien numérique entre entreprises de croissance, qui risqueraient de l’administration et les citoyens. ne pas avoir accès aux données qui leur sont Si cette politique se poursuivait, on peut nécessaires dans des conditions aussi faciles imaginer l’apparition dans les 3 à 5 ans d’une que les entreprises établies productrices de ces véritable fracture numérique, cette fois entre données. l’État et les administrés. Cela mènerait à la Surtout, cela risquerait de revenir à fragilisation des institutions publiques liées à concéder les marchés porteurs, et les emplois la collecte de données, ce qui pourrait qualifiés et souvent difficiles à délocaliser que déboucher sur un problème de légitimité pour ces nouvelles activités sont à même de créer, l’action de l’État, dans un contexte202 (appels à aux acteurs issus de marchés où l’accès plus la transparence, montée en force du débat facile aux données publiques leur aurait donné un avantage concurrentiel initial. 200 Urban Mobs, 2009, projet de visualisation L1M "/!)0&,-C(0/4-&!%#$!,-2#2#$!)&*00/-4! géographique du trafic cellulaire mené conjointement par +,&.*#0!,#!%(1#,&))#7#4!%#!,/!0(*4-,-$/4-&! Orange et FaberNovel http://www.urbanmobs.fr/fr/france/ 201 Waze, Inc. http://world.waze.com/guided_tour/ Le statut juridique de certains ensembles de 202 données est souvent compliqué par Landier, A. et Thesmar, D., 2010, « La Société l’implication d’acteurs de droit privé en Translucide : Pour en Finir avec le Mythe de l’État Bienveillant » parallèle à l’administration (par exemple dans86
    • le cas où un contrat de service public ne locales, les institutions publiques et les acteursdélimite pas clairement les droits liés aux privés ou citoyens dans la création d’undonnées générées par un opérateur privé de écosystème en développement harmonieux.réseaux publics). Si ce type de situation se multipliait, il DJCJ 9*!5#$(@(+I<&!($7+&*7!2,-!7*&!serait à craindre que cela ne mette en danger la ?$%$*+5!2$%.+.B7&!S$-+&!capacité des entreprises à innover dans le Dans un tel scénario, l’administrationdomaine des données publiques. impliquerait et fédérerait les volontés De même que l’on observe dans le domaine existantes autour de la question de lades biotechnologies que la prolifération de réutilisation des données publiques commebrevets croisés sur certaines molécules et ses projet de modernisation de la société.applications empêche parfois l’innovation de Elle déploierait une volonté politique forteprendre place par peur pour les nouveaux pour harmoniser et mettre en cohérence lesentrants de ne pouvoir en valoriser les résultats politiques menées par les différentessans passer par un contentieux coûteux203, on institutions productrices de données.risquerait de voir des applications utiles aupublic perçues comme des investissements trop Cela supposerait une communicationrisqués du simple fait du manque de clarté accrue entre administration et réutilisateurs, etquant aux conditions sous lesquelles les l’établissement de ponts et de points dedonnées sous-jacentes pourraient être contacts entre les différents types d’expertises.réutilisées. En contrepartie de cet investissement modeste, les bénéfices attendus dans ce futurL1-M I&2/,-$#0!$*0!,#$!(2:#2$!#4!C0*$40/4-&$=! hypothétique sont une plus grande fluidité des Un scénario dans lequel la mise en ligne échanges autour de la question des données, lades données publiques et leur valorisation se circulation des meilleures pratiques, et uneferaient dans la douleur mettrait de plus multiplication des applications utiles auxl’accent de façon exagérée sur les ratés citoyens développées à partir de ces données.inévitables, les contentieux qui émergeraient Tous ces éléments pourraient concourir àsans doute et les frustrations des différents accélérer le déploiement d’une politiqueacteurs face à telle ou telle décision politique nationale forte de réutilisation des donnéesou administrative. publiques, et la réalisation concrète de son Cela risquerait de mettre à mal la légitimité potentiel.de cette politique tout entière, et de repousser L’exemple britannique est à ce titreles bonnes volontés en cristallisant les édifiant. Lors de la conférence de presse àquelques problèmes qui viendront laquelle nous avons pu assister le 19 novembrenaturellement à se poser. 2010 à Londres, à l’occasion de la mise en Même si ce scénario avait l’avantage ligne de nouvelles données de dépenses pard’accélérer dans un premier temps l’apparition l’État britannique (l’ensemble des donnéesde certains services utiles aux citoyens, il serait d’exécution des budgets nationaux détaillésprobablement néfaste à moyen et long terme. dépense par dépense à partir de 25 000 livres, avec mise à jour mensuelle), les avantages d’une telle approche étaient manifestes : laDJ K!W@<>.$(&!L!M!N,+,%@(&-!%&! richesse des réutilisations présentées,5?&%$22&<&*+!:7*! l’anticipation des besoins des utilisateurs, la coproduction mise en œuvre à cette occasion.5#$(@(+I<&! Nous pouvons en tirer trois leçons sur les Au contraire des deux scénarios éléments constitutifs d’un scénario deprécédents, on peut s’inspirer des expériences symbiose. Il nécessiterait une coopérationles plus réussies jusqu’à présent, à l’étranger technique rapprochée entre l’État, le privé etcomme sur le territoire national, pour tracer les l’associatif. La production de services par lalignes d’un scénario dans lequel l’État société civile à partir des données publiquesaccompagnerait avec succès les collectivités deviendrait la norme. Elle pourrait jouer un rôle d’exemple, et inciterait à mutualiser des203 solutions techniques, accélérant plus encore la Kenneth A. Oye and Rachel Wellhausen, “TheIntellectual Commons and Property in Synthetic Biology,” mise en ligne des données.in Markus Schmidt et al (eds), Synthetic Biology: The De plus, une symbiose réussie repose sur laTechnoscience and its Societal Consequences, Springer,2009, pp 121-140. coopération avec des journalistes formés aux 87
    • techniques numériques. Le maniement des Cela suppose certes un investissement dans données, leur analyse et la présentation des l’analyse et la compréhension des enjeux, mais résultats sont des compétences bien spécifiques l’expertise qui s’est portée sur le sujet est déjà et qui évoluent rapidement avec les nouvelles forte, notamment dans le monde associatif technologies. Cette coopération serait (Regards Citoyens, LiberTIC, FING), nécessaire pour réaliser pleinement l’objectif institutionnel (Délégation aux Usages de de transparence de l’action de l’État l’Internet, APIE, Ministère de la Justice, concernant le mouvement Open Data. collectivités locales, Commission Européenne) et privé (Cap Digital). La création récente de la Enfin, la symbiose entre acteurs de mission Etalab pourrait permettre la fédération l’écosystème permettrait d’intégrer avec de ces énergies et expertises. confiance la mise en ligne des données publiques dans l’effort de pédagogie des Les moyens nécessaires à mettre en œuvre administrations sur leur travail et dans leur pourront être mobilisés par la réorientation de stratégie de renforcement du lien numérique l’effort qui portaient jusqu’ici sur la aux usagers. tarification de la diffusion. L--M H/4/,Y$#!,#$!(#0;-#$!#4!,#$!+&#$!1&,&4($! DJFJ `$7?&,7!-_%&!&+!*$7?&,78!-.(B7&(! 2$7-!%:^<.*.(+-,+.$*! L’implication proactive de l’État dans un réseau d’acteurs d’origines différentes valorise La mise en ligne des données afin de les fortement l’activité de chacun. Par opposition voir réutilisées dans le cadre du développement de services innovants est une aux scénarios précédents qui reposaient sur une tension forte entre demande de stratégie qui reste encore très novatrice. Le réutilisation et offre de données, les frictions travail de fédération des initiatives que l’État éventuelles seraient ici fortement tempérées mènerait dans ce scénario doit être l’occasion de prendre en compte les risques inhérents à par la reconnaissance des bonnes volontés de part et d’autre de l’écosystème. une telle approche. Il est important notamment d’éviter l’écueil L---M I/1&0-$#!,3#A)(0-7#4/4-&! qui consisterait à abandonner entièrement la Dans ce scénario, l’expérimentation serait mission de réutilisation des données publiques facilitée par la mise en cohérence des à la société civile. La production d’information conditions tarifaires, juridiques et techniques synthétique ou de services à destination des conditionnant la réutilisation d’une grande citoyens est une activité légitime de partie des données publiques. Il est raisonnable l’administration. d’imaginer un cercle vertueux par lequel les De plus, l’accélération de la mise en ligne innovations à succès attirent l’attention des données pose des problèmes spécifiques d’autres scientifiques, ingénieurs ou par rapport aux autres scénarios. En particulier, entrepreneurs, et encouragent à leur tour une certaine anarchie dans les données encore plus d’innovation. disponibles à la mise en ligne risque d’apparaître initialement, ce qui suppose un L-1M I/2-,-4#!,/!7&%#0-$/4-&!%#! effort particulier d’indexation et la mise en ,3/%7--$40/4-&!#4!)0&7#4!%#$!(2&&7-#$!%#! ligne d’un portail identifié d’accès aux C&24-&#7#4! données publiques. Contrairement aux scénarios précédents dont l’un des risques majeurs était de ne pas DJDJ =.(&!3!.(2$(.+.$*!-,2.&!&+!3!S,.>%&! profiter de l’opportunité de modernisation de #$d+!&!%,!<,E$-.+5!&(!$**5&(!27>%.B7&(! l’État que représente la mise en ligne des données publiques, une évolution en symbiose En regard de l’effort de soutien politique permettrait d’accompagner plus efficacement nécessaire au développement d’un tel scénario, l’adaptation de l’administration à un monde où les avantages qu’il pourrait présenter sont la mise en ligne des données de nombreux et particulièrement attractifs. fonctionnement des institutions serait la norme. L-M D#7/%#!)#*!%#!7&Y#$!#4!)#*4!B40#!7-$!#! @*10#!0/)-%#7#4! En utilisant des outils standards de mise en ligne comme des plateformes mutualisées La clé d’un tel scénario passe avant tout basées sur des logiciels libres, la puissance par la clarification des attentes des publique effectuerait des économies réutilisateurs auprès des administrations, et la substantielles. Elle pourrait par ailleurs mise en communication de ces différents favoriser l’émergence de nouveaux outils et acteurs.88
    • standards d’interopérabilité, repris par L1--M 9!&*1#,!&*4-,!%#!2&77*-2/4-&!)&*0!l’ensemble de la communauté. ,3?4/4! Enfin, l’émergence d’un tel écosystèmeL1M I/2-,-4#!,/!2-02*,/4-&!%#!,3-C&07/4-&! autour de la mise en ligne des données4#2:-.*#!#4!>*0-%-.*#=! publiques pourrait permettre à des journalistes Un aspect malheureux mais inévitable de la experts en maniement, interprétation etréutilisation des données publiques est la visualisation des données de travaillercomplexité des sujets que le thème recoupe. La directement sur les données issues desnouveauté même du concept et son émergence administrations et des collectivités.récente, du fait de développements Cela ouvrirait de nouvelles possibilitéstechnologiques qui commencent seulement à pour éclairer le débat public, et de nouvelless’esquisser aux yeux du grand public, techniques journalistiques utiles à la fois pourentraînent une certaine difficulté à expliquer les politiques qui sont menées et encommuniquer les enjeux en question. débattre, pour mettre en valeur le travail de En particulier, la question de la réutilisation l’administration et pour souligner les enjeuxdes données suppose des connaissances des arbitrages réalisés au niveau national ouétendues et fréquemment réactualisées en territorial.informatique, en finances publiques, en droitdes documents administratifs, et en droit de lapropriété intellectuelle. Il est probablement ______________________illusoire de compter sur l’apprentissageexhaustif de ces pratiques par l’ensemble desacteurs publics concernés par ces questions. Le développement d’un réseau informel Les caractéristiques propres à chaqued’acteurs en relation fréquente permettrait à scénario sont synthétisées dans le tableau ci-l’inverse aux compétences de chacun de se contre.renforcer mutuellement. Sur la base de l’état des lieux et des troisL1-M X#07#4!%#!2&77*-.*#0!,3-7)&04/2#!%*! scénarios étudiés dans ce chapitre, nous$*>#4!/*A!/%7--$40/4-&$!#4!2&,,#24-1-4($! proposons au chapitre suivant une série de 16 propositions pour une politique ambitieuse des L’implication de l’État dans un processus données publiques, qui pourraient permettre dede collaboration avec la communauté a comme concrétiser les bénéfices de la réutilisation deseffet direct de souligner l’importance du sujet données publiques.aux administrés ainsi qu’aux agents de l’État etdes collectivités. C’est donc à la fois un outilpolitique et un outil de gestion puissant. 89
    • Scénarios Critères Inertie Capture Symbiose Rapidité - + + Répondre à la Saisir l’opportunité des demande nouvelles technologies -- - ++ Valorisation des données -- - ++ Moyens nécessaires ++ ++ ++ Mise en œuvre Facilité ++ + - Renforcer le rôle l’administration - -- + Impact sur Modernisation de l’administration l’administration - -- ++ Valorisation de l’action de l’administration - -- + Court terme -- + ++ Intérêt public Long terme - -- ++90
    • N0,2.+-&!];;;J! W&.e&!2-$2$(.+.$*(!2$7-!7*&!2$%.+.B7&!,<>.+.&7(&!&(!$**5&(!27>%.B7&(! À partir des leçons des premières Dans la grande majorité des cas, la mise enexpériences d’Open Data et des scénarios que ligne des données n’a pas de raison denous avons détaillés au chapitre précédent, mobiliser excessivement les agents du service,nous proposons trois axes stratégiques pour qui plus est en regard des économies de tempsune politique ambitieuse qui viserait à réaliser qui découleront de la possibilité pour lesle plein potentiel de la réutilisation des citoyens d’accéder aux données directementdonnées publiques. sans devoir établir une demande officielle auprès de l’institution. Simplifier pour accélérer : réduire lesefforts nécessaires d’une part à la diffusion des Assurer la formation des agents et leurdonnées par les acteurs publics, et d’autre part accès à des guides clairs et explicatifs. Dansà leur réutilisation, afin d’accélérer le la continuité du travail de préfiguration réalisédéveloppement de services utiles à partir des par l’APIE, nous suggérons de poursuivredonnées publiques. l’effort de mise à jour de guides et documents à destination des agents. Notamment, détailler Faciliter l’expérimentation : adapter les les raisons qui poussent à vouloir mettre enconditions de réutilisation des données ligne les données publiques, l’importance despubliques pour faciliter l’expérimentation par formats réutilisables, les étapes à suivre et lesles citoyens, les associations et la communauté grands enjeux juridiques, administratifs etdes développeurs et des entrepreneurs. techniques serait d’une aide importante aux Favoriser l’émergence d’un écosystème : institutions publiques amenées à diffuser desfavoriser l’émergence d’un écosystème de données.producteur et de réutilisateurs de données Simplifier les formats de diffusion. Nouspubliques en France, autour de la mission suggérons d’expliciter clairement la simplicitéEtalab et du futur portail data.gouv.fr. potentielle du processus de mise en ligne de Ce chapitre suggère des modalités données. De simples fichiers CSV suffisent àconcrètes de développement de ces trois axes participer activement à la mise en ligne desstratégiques. Il présente seize propositions données publiques, qui n’a donc pas lieu deissues de notre analyse, qui visent à faciliter la mobiliser outre mesure les ressourcesréutilisation la plus large des données techniques et humaines de l’administration.publiques et à permettre la réalisation la plusrapide possible de l’ensemble des bénéfices CJFJ 157.-&!%&(!>,--.I-&(!3!%,!-57+.%.(,+.$*!que la société peut en attendre. !"#$#%&&#(),)+!=&++-&!&*!CJ W.<2%.S.&-!2$7-!,##5%5-&-! #$05-&*#&!%&(!#$*.+.$*(!%56,%&(! &!-57+.%.(,+.$*!&(!$**5&(!CJCJ ,#.%.+&-!%,!.SS7(.$*!&!$**5&(! .((7&(!&!($7-#&(!.SS5-&*+&(J!27>%.B7&(! Établir une « licence données ouvertes » pour réutilisation gratuite qui!"#$#%&&#()*)+!$-<,%.(&-!%&(! s’appliquerait le plus largement possible. >$**&(!2-,+.B7&(!&!.SS7(.$*!&! Nous suggérons d’harmoniser le plus possible $**5&(!27>%.B7&(!,++&*7&(!2,-! les licences utilisées au sein des différentes %,!#$<<7*,7+5!&(!-57+.%.(,+&7-(J! administrations de l’État, des établissements publics et des collectivités territoriales. Il est Expliciter l’effort minimal attendu des nécessaire d’éviter la prolifération de licences,différents acteurs publics. Pour répondre aux qui rendraient la réutilisation de données issuespréoccupations très fortes des institutions de sources différentes trop complexe.publiques amenées à diffuser leurs données enligne pour la première fois, il serait souhaitable Nous suggérons pour cela un travailde rappeler que l’effort demandé est minimal. d’harmonisation vers une même licence de 91
    • réutilisation à titre gratuit, la « Licence Les institutions publiques privilégieront Données Ouverte » de l’État, qui serait utilisée idéalement les formats simples et non par défaut par les administrations centrales, propriétaires de type CSV (simples valeurs déconcentrées, et dont les collectivités séparées par des virgules, outil standard parmi territoriales pourraient s’inspirer. les tableurs), et éviteront de communiquer des jeux de données au format PDF (qui rend les Appliquer cette licence de la manière la données difficilement manipulables) sauf pour plus large aux données disponibles sur des rapports de type traitement de texte. data.gouv.fr permettrait de simplifier substantiellement le régime juridique qui Au-delà des recommandations du s’applique à ces données. Référentiel Général d’Interopérabilité204 (RGI) aux administrations, des évolutions seront à Ce travail pourrait être mené en prévoir dans la perspective de la réutilisation concertation entre les différents acteurs et sur des données publiques. Il est à noter par la base du travail effectué par le Ministère de ailleurs que la Commission européenne est en la Justice (licence « Information Publique »), discussions avec le W3C dans le cadre d’une des conditions générales d’utilisations réflexion liée aux questions de standards.205 rappelées par l’APIE, et des licences issues du monde du libre (par exemple licence ODbL). Assurer la pérennité des ontologies et structures de données dans le temps. Une Encourager un marquage graphique des des difficultés liées à la réutilisation de jeux de droits de réutilisation. Afin de permettre aux données remis à jour fréquemment tient aux réutilisateurs d’identifier facilement les changements potentiels d’ontologie ou de données réutilisables et les conditions qui s’y structuration des données qui peuvent appliquent, nous suggérons de généraliser le intervenir dans le temps. Dans le cas des jeux marquage des fiches descriptives de jeux de de données mis à jour périodiquement, les données disponibles à la réutilisation avec des administrations productrices devront veiller à pictogrammes spécifiques, sur le modèle du reproduire le format et la structure de données marquage « Information Publique » du utilisée, afin d’en faciliter une réutilisation ministère de la Justice, qui expliqueraient les automatisée. droits afférents à ces données. CJDJ ^*+.#.2&-!%&(!*$7?&,78!7(,6&(!&(! $**5&(!27>%.B7&(! !"#$#%&&#()-)+!"*#$7-,6&-! %:7+.%.(,+.$*!&!S$-<,+(!S,#.%&<&*+! !"#$#%&&#().)+!,.-&!&*!($-+&!B7&! -5&82%$.+,>%&(A!B7.!-&(2&#+&*+!%&(! #0,B7&!#$*+-,+!27>%.#!#%,-.S.&!3! *$-<&(!:.*+&-$25-,>.%.+5!&+!&! %:,?&*.-!%&!S.*,*#&<&*+!&! K!%.(.>.%.+5!<,#0.*&!LJ! %:$7?&-+7-&!&+!%&(!-$.+(!&! Privilégier les formats ouverts -57+.%.(,+.$*!%.5(!,78!$**5&(! respectant les normes d’interopérabilité. 2-$7.+&(!,*(!($*!#,-&J! L’utilisation d’un format fermé et difficilement Clarifier le financement de l’ouverture réexploitable peut limiter très fortement et les droits de réutilisation de données dans l’utilité d’un jeu de données pour ses les contrats publics. Une quantité importante réutilisateurs, en rendant sa réutilisation trop de données d’intérêt public sont générées par complexe. des acteurs qui sortent du champ de la loi Communiquer sur l’importance des CADA de 1978. Plutôt qu’une modification de formats réexploitables auprès des agents. Il la réglementation qui viserait à intégrer est crucial que les agents de l’État en charge de l’ensemble des cas particuliers, nous suggérons l’accès aux données publiques soient bien de privilégier dans un premier temps un travail sensibilisés à cette question, et disposent de d’incitation et de communication auprès des bases de connaissances et d’outils simples pour entités concernées sur l’importance de ce sujet. privilégier l’utilisation de formats ouverts et respectant les normes d’interopérabilité. 204 Référentiel Général d’Intéropérabilité : Maintenir une liste de formats http://references.modernisation.gouv.fr/sites/default/files/R GI_Version1%200.pdf correspondants à ces critères. À cet effet, il 205 Commission Européenne, 16 décembre 2010, “W3C sera utile de définir une liste des formats annonce les bonnes pratiques pour un web mobile”, facilement lisibles par des machines, à CORDIS actualités. destination des agents. http://cordis.europa.eu/fetch?CALLER=FR_NEWS_FP7& ACTION=D&DOC=2&CAT=NEWS&QUERY=012cf48 8f5e8:c26c:0ac2e8d6&RCN=3287992
    • Nous préconisons notamment que Nous suggérons, en réponse à cette crainte,l’ensemble des Contrats d’Objectifs et de de développer une solution technique deMoyens des Établissements publics et des marquage sémantique permettantDélégations de Service Public contractées avec l’interprétation par les moteurs de recherche oudes entreprises abordent explicitement le statut les outils de collecte de données deset les droits de réutilisation afférant aux métadonnées accompagnant le jeu de données,données générées dans leur cadre. et leur enrichissement en fonction du contexte. Une norme « microformat206 » pourrait Ces contrats devraient ainsi prévoir la constituer une solution technique à cet effet.réorientation des moyens déployés pourfacturer et diffuser des données protégées vers Permettre l’enrichissement collaboratifl’organisation de l’infrastructure nécessaire à des jeux de données. Un des avantages de lal’ouverture et à la diffusion gratuite ou à coût mise en ligne des jeux de données de l’Étatmarginal de ces données. consiste en la possibilité, pour les réutilisateurs qui remarqueraient des erreurs dans les jeux de Il serait bien évidemment souhaitable que données de les signaler voire de les corriger.ceci se fasse dans le sens d’une généralisationla plus large de la réutilisation des données Par exemple, les données sur le systèmepubliques, de façon gratuite, à titre personnel national de transports publics en Grande-ou commercial. Bretagne, mises en ligne en 2010, contenaient près de 6 % de localisations d’arrêts de bus Établir des bonnes pratiques et des erronées, que les utilisateurs ont pu détecter etclauses types. L’État pourrait établir des signaler207. Le défi pour la puissance publiquebonnes pratiques, notamment sur les types de consiste à mettre en place les outils techniquesdonnées concernées, les formats à privilégier, et réglementaires lui permettant de réintégreret les modèles d’accès préférables, en vue du éventuellement de telles corrections, afin d’enrenouvellement des COM et DSP concernés, bénéficier elle-même.secteur par secteur (par exemple transport, eau,environnement). Il pourrait par ailleurs L’État devra donc réfléchir à la possibilité,préparer des clauses types que les différentes à terme, de passer d’un modèle « à sensinstitutions pourraient reprendre et adapter à unique » (diffusion des données du secteurleur situation spécifique. public vers la société civile) à un modèle d’écosystème où les données de l’État et des Élargir le périmètre des données collectivités, ouvertes à la société civiles,réutilisables aux ressources essentielles. pourraient être enrichies en retour de façonNous suggérons enfin de réfléchir à collaborative (« crowdsourcing »).l’opportunité d’octroyer, sur la base de ladoctrine des ressources essentielles en droit dela concurrence, un droit de réutilisation à titrepersonnel ou commercial sur certaines données !"#$#%&&#()0)+!;<2%.B7&-!&(!générées par des acteurs privés mais qui ,#+&7-(!27>%.#(!2.%$+&(!,*(!%&(!pourraient avoir une importance forte pour le 2-$E&+(!&!-&#0&-#0&!(7-!%&!f&>!public, et pour l’établissement d’un marché (5<,*+.B7&J!concurrentiel aval, notamment d’applicationset services. Bien que prématurées pour un déploiement initial à grande échelle, les technologies du Web sémantique et des données liées (« linked!"#$#%&&#()/)+!,#.%.+&-! data ») pourraient devenir un élément majeur de l’Internet de demain. Participer à ses %:&*-.#0.((&<&*+!&(!$**5&(!&+! premières évolutions pourrait donc être d’une %:.*+56-,+.$*!&!#$--&#+.$*(! importance stratégique pour l’administration 5?&*+7&%%&(!2,-!%,!#$<<7*,7+5J! française. Faciliter l’intégration des métadonnées.Une des craintes exprimées par lesadministrations est le risque que les 206métadonnées explicatives nécessaires à une Chaumond, J., 2010, « Qu’est-ce que le Web Sémantique ? », section 3.1 et suivantes dans Socialutilisation judicieuse des données (par exemple Commerce : Quand le E-Commerce Rencontre le Webl’incertitude de mesure) se perdent lorsque les d’Aujourd’hui. 207données sont recoupées et ne soient pas Shadbolt, N., 2011, allocution au colloque « Openintégrées aux réutilisations. Data : Et Nous, Et Nous, Et Nous ? » du 17 mars 2011 organisé par Regards sur le Numérique. Présentation : http://www.slideshare.net/RSLN/opendata-datagovuk- how-did-we-do-it 93
    • Nous suggérons d’identifier un certain doivent dépasser un mode de valorisation des nombre d’acteurs publics en pointe du données qui serait purement commercial. mouvement de réutilisation des données, et de Dans la vaste majorité des cas, soutenir l’utilisation de leurs jeux de données l’établissement d’une redevance n’apporterait dans le cadre des projets de recherche aucun revenu significatif à l’échelle des internationaux sur le sujet208. institutions productrices, et ne justifierait de toute façon pas les coûts liés à la mise en FJ ,#.%.+&-!%:&825-.<&*+,+.$*! œuvre d’une tarification. 2$7-!&*#$7-,6&-!%:.**$?,+.$*! Il est donc souhaitable que les acteurs publics se concentrent sur la réalisation de leurs missions de service public, et mettent les FJCJ T5*5-,%.(&-!%,!-57+.%.(,+.$*!6-,+7.+&! données créées dans ce cadre à la disposition !"#$#%&&#()1)+!1&*-&!%,! des entrepreneurs et des startups plutôt que de viser à les valoriser eux-mêmes à travers une -57+.%.(,+.$*!&(!$**5&(!6-,+7.+&! redevance inefficace. 2$7-!+$7+&!-57+.%.(,+.$*!3!+.+-&! 2&-($**&%J! Généraliser la réutilisation libre et gratuite la plus large possible. Dans le cas de D’après les études économiques déjà jeux de données nouvellement mis en ligne, présentées (étude de Strasbourg), la propension débouchant sur des marchés en développement des citoyens à payer un droit d’accès aux et dont les applications sont encore données publiques pour en faire ensuite un méconnues, le potentiel d’innovation lié à la usage personnel est généralement très faible. réutilisation est particulièrement fort. Par défaut, et en dehors des exceptions de Il apparaît donc nécessaire d’encourager la bon sens (par exemple des ensembles de gratuité à l’ensemble des jeux de données mis données de très grande taille occasionnant des en ligne, même pour des réutilisations à titre coûts de distribution conséquents), une commercial, à moins que les producteurs de tarification pour usage personnel réduirait donc données puissent établir, sur la base fortement la diffusion des données, et donc les d’arguments fondés (notamment liés à des bénéfices qu’on peut en attendre. besoins d’investissements lourds de diffusion des données), l’absolue nécessité d’une Ceci irait qui plus est à contre-courant des redevance. fortes attentes des citoyens en terme de transparence de l’action de l’État. Nous La décision récente du Premier ministre suggérons donc d’établir un principe formel de François Fillon soumettre à un décret toute gratuité pour toute réutilisation de données possibilité d’établir une tarification des publiques à titre personnel. données publiques va d’ailleurs dans ce sens. Restreindre la tarification à coûts moyens aux marchés matures. Une !"#$#%&&#()2)+!"*#,-&-! tarification qui recouvrerait les coûts moyens (+-.#+&<&*+!%&(!#,(!,*(!%&(B7&%(! de mise à disposition n’est justifiable que pour 7*&!-&&?,*#&!&(+!%56.+.<&A!&+! les marchés matures des données à valeur #0,-6&-!%&(!2-$7#+&7-(!&! ajoutée, où le potentiel d’innovation est plus limité et les modèles d’affaires mieux connus, $**5&(!:5+,>%.-!%:,>($%7&! et seulement si cela ne réduit pas *5#&((.+5!&!+$7+&!+,-.S.#,+.$*J! excessivement la diffusion des données. Dépasser une valorisation purement Rappelons cependant que la théorie commerciale des données publiques et économique établit qu’il n’est légitime de encourager leur réutilisation la plus large. facturer aux réutilisateurs que les coûts Dans quelques cas spécifiques et bien engendrés du fait et uniquement du fait de la identifiés, le revenus issus des données mise à disposition des données, et non pas des publiques participent aux principes frais inhérents au fonctionnement normal des d’indépendance de notre démocratie. institutions, tels que des frais de production Toutefois, les institutions produisant des des données qui rentrent dans le cadre de leur données publiques au sens de la loi de 1978 mission de service public. 208 « LOD2 : Creating Knowledge out of Interlinked Data », projet de recherche supporté par la Commission Européenne : http://lod2.eu94
    • FJFJ ,#.%.+&-!%:&825-.<&*+,+.$*!2$7-!%&(! Explorer les licences gratuites avec#.+$@&*(!&+!%&(!,#+&7-(!&!%:.**$?,+.$*! partage des conditions initiales à l’identique (« share alike »). Lorsqu’une redevance!"#$#%&&#()3)+!N$*.+.$**&-! couvrant la réutilisation de données à titre +$7+&!-&&?,*#&!2$7-!-57+.%.(,+.$*! commercial ne saurait être remise en question, &!$**5&(!3!?,%&7-!,E$7+5&!3!%,! l’institution productrice pourrait explorer la <.(&!3!.(2$(.+.$*!6-,+7.+&!&(! mise en place d’une licence gratuite pour réutilisation commerciale restreinte avec $**5&(!>-7+&(!B7.!%&(!($7(R partage des conditions initiales à l’identique +&*&*+J! (ce qui exclut notamment la revente directe des S’il existe un marché pour des données à données).valeur ajoutée, son optimalité suppose qu’il Ce modèle de licence dite « share alike » asoit le plus possible ouvert à la concurrence. par exemple été mise en place par la Mairie de Pour que l’établissement d’une redevance Paris, et permet de soutenir la création depour réutilisation de données à valeur ajoutée nouveaux usages, par exemple des services auxproduite par une institution publique ne soit utilisateurs financés par la publicité, tout enpas anticoncurrentielle, il est nécessaire que les excluant du champ de la gratuité les activitésdonnées brutes sur lesquelles cette activité est commerciales de revente directe (et donc enconstruite, éventuellement recueillies dans le assurant le maintient des sources de revenuscadre d’une mission de service public, soient liés à la donnée publique).disponibles et réutilisables commercialement. Explorer la rémunération par l’accès Les institutions qui fixent une redevance aux données d’usage. Une piste à explorer estpour la réutilisation de données à valeur la vente de données d’usages sur certains jeuxajoutée devraient donc mettre gratuitement les de données ou applications spécifiques, quidonnées brutes sous-jacentes à disposition des pourraient avoir une valeur prédictive forte ouréutilisateurs, au risque sinon de créer des intéresser les acteurs d’un marché particulier.distorsions de concurrence dommageables et Cela permettrait d’alléger en adéquation lasources de contentieux potentiels. tarification de la réutilisation elle-même. Explorer la rémunération par le service client. Dans le cas des données à valeur!"#$#%&&#()*4)+!"82%$-&-!&(! ajoutée commerciale, nous suggérons #$*.+.$*(!,%+&-*,+.?&(!&! d’imaginer une tarification double, liée au niveau de service promis aux réutilisateurs. -57+.%.(,+.$*!2$7-!%,.((&-!#,-+&! Une option gratuite mais offrant des garanties >%,*#0&!3!%:&825-.<&*+,+.$*J! moindres faciliterait l’expérimentation. . Même lorsque des redevances pour Faciliter l’expérimentation avec les Webréutilisations sont jugées légitimes, il nous Services. Au-delà de la tarification pourapparaît très important d’encourager les réutilisation des données elles-mêmes, se poseadministrations à se montrer favorables à des la question de l’accès à des servicesexpérimentations. Notamment, elles devraient informatiques (notamment des API ou desviser à permettre aux acteurs innovants, « Web Services ») permettant un accès facilitécomme les Jeunes Entreprises des Pôles, ou en temps réel à des données ou des servicesd’expérimenter de nouvelles activités basés sur les données.commerciales sans devoir s’engager sur uncontrat de long terme qui créerait des barrières Lorsque des contraintes techniques mènentà l’entrée discriminantes. Nous suggérons dans le producteur de ce Web Service à fixer unece cas de rechercher des modes de couverture rémunération pour service rendu, nousdes coûts alternatifs qui permettent de suggérons de laisser la possibilité à des acteursfavoriser l’innovation. innovants d’expérimenter gratuitement avec le service en dessous d’un seuil de volume On privilégiera donc la recherche de suffisamment élevé pour permettre une misepartenariats avec des pôles de compétitivité et en production à l’échelle. Cela permetdes incubateurs pour favoriser l’émergence d’encourager l’innovation tout en respectantd’applications innovantes. Ces partenariats les contraintes techniques du producteur.devront prévoir un partage par la puissancepublique du savoir-faire et de la connaissancepointues de ses données avec des startupsrompues aux techniques de programmation lesplus pointues. 95
    • DJ W$7+&*.-!%:5<&-6&*#&!:7*! Démultiplier le service aux utilisateurs. Le futur portail pourrait aussi lister et mettre à 5#$(@(+I<&! jour les coordonnées des personnes à même de répondre aux questions des réutilisateurs au DJCJ ^*.<&-!&+!%,!#$<<7*,7+5!&(! sein de chaque administration, et agréger les -57+.%.(,+&7-(! échanges au sujet de chaque jeu de données, afin d’éviter la répétition de questions aux !"#$#%&&#()**)+!;<2%.B7&-!%,! producteurs. Cela permettrait de démultiplier #$<<7*,7+5!&(!-57+.%.(,+&7-(! l’effort que les producteurs de données ,*(!%&(!.*.+.,+.?&(!&!<.(&!3! réalisent pour expliquer le contexte des données collectées aux réutilisateurs. .(2$(.+.$*!&!$**5&(!27>%.B7&(J! Organiser des séminaires ou ateliers de Créer un point d’accès centralisé et mis travail ponctuels sur les sujets techniques à jour automatiquement. Nous suggérons, d’intérêt pour la communauté. La technicité pour permettre une réutilisation efficace des du sujet nécessite de façon occasionnelle la données mises en ligne, de construire le portail tenue de séminaires à destination de la data.gouv.fr sur le modèle d’un moteur de communauté des producteurs et des recherche, indexant les ensembles de données réutilisateurs de données publiques. publiques réutilisables et leurs métadonnées en un point d’accès identifié. Il serait souhaitable à terme d’automatiser !"#$#%&&#()*,)+!=&++-&!&*!2%,#&! la mise à jour de l’indexation des données &(!,((.(&(!&(!$**5&(!27>%.B7&(! autant que cela sera possible techniquement. &+!,*.<&-!%,!#$<<7*,7+5!&(! Développer une offre grand public qui -57+.%.(,+&7-(J!! mette en valeur des applications utiles. Un écosystème de réutilisation des données Regrouper l’ensemble de l’écosystème publiques se doit d’impliquer le grand public. pour des assises des données publiques. Au- Il serait donc souhaitable, à travers le portail delà d’ateliers de travail ponctuels, il paraît data.gouv.fr, de mettre en avant des important de regrouper, à intervalles réguliers, réutilisations pratiques et utiles aux citoyens les différents acteurs concernés par la politique réalisés à partir des données publiques. de réutilisation des données publiques, pour des colloques et des sessions de travail Le danger d’un portail axé uniquement sur permettant l’échange de points de vue et la l’agrégation de liens vers des jeux de données prise de conscience des évolutions nécessaires. brutes est qu’il soit ignoré du grand public, qui n’y trouverait pas son intérêt. Il semble préférable d’impliquer tout à la fois les acteurs de l’innovation (pôles de Le portail data.gouv.fr devra être un lieu compétitivité, capitaux risqueurs, secteur focal avec une double vocation : portail numérique), les associations, les institutions d’accès aux données pour les réutilisateurs, et publiques et les collectivités territoriales, mais site de destination pour consommateurs aussi l’administration elle-même, dont le recherchant des applications utiles à partir des travail est modifié et mis en valeur par la données publiques. réutilisation des données publiques. Nous suggérons donc de créer une section Animer la communauté des « Applications » et de mettre ces dernières en réutilisateurs. Une des conclusions des valeur sur la page d’accueil elle-même. premières expériences de réutilisation de Investir dans l’accompagnement de la données publiques est que, sans animation, la communauté. Afin de faciliter l’échange de mise à disposition des données publiques bonnes pratiques et la formation d’une produit peu209. véritable communauté, il est souhaitable Le rôle d’animateur de la communauté des d’investir dans la création d’un forum ou d’une développeurs et des réutilisateurs de données base de connaissances évolutive, solution publiques, à travers la participation à des aujourd’hui classique sur le Web. Afin de événements et la mise en avant des réalisations préserver la qualité des échanges qui y auront marquantes ou utiles aux citoyens, est donc lieu, et pour impliquer la communauté dans les central à une politique ambitieuse des données activités autour de la donnée publique, nous publiques. suggérons de plus de créer un ou plusieurs postes d’animateurs (« community managers »). 209 Entretien avec Charles Népote, FING.96
    • DJFJ "*#$7-,6&-!%,!-57+.%.(,+.$*!&(! !"#$#%&&#()*.)+!;*+56-&-!,7!$**5&(!27>%.B7&(! 5>,+!5<$#-,+.B7&!%&(!$**5&(!!"#$#%&&#()*-)+!"*#$7-,6&-!%&! 27>%.B7&(!&+!%&7-!-57+.%.(,+.$*J! 5?&%$22&<&*+!:,22%.#,+.$*(!3! Communiquer aux administrations 2,-+.-!&(!$**5&(!27>%.B7&(J! l’importance des données pour mettre en lumière leurs métiers. Pour permettre la mise Organiser un concours national de en ligne d’une offre de données publiquesdéveloppement d’applications. L’effet de riche et qui éclaire le débat public, il est enlevier potentiel d’un concours de premier lieu nécessaire de convaincre lesdéveloppement d’application est tel (estimé à administrations du potentiel des données50 pour 1 pour la première expérience en 2008 publiques pour permettre la mise en lumière deà Washington, D.C.) qu’il apparaît comme un leurs métiers et de leur domaine d’action. Unélément indispensable d’encouragement. travail de pédagogie sur la notion de Nous suggérons de s’inspirer du modèle réutilisation paraît aussi indispensable. Ildes concours de développement d’applications, semble notamment nécessaire de mettre à malnotamment ceux organisés par l’IGN (été la notion selon laquelle « mes données ne2010) et les mairies de Rennes ou de Paris peuvent intéresser personne d’autre », et de(automne 2010 et hiver 2010-2011), au niveau faire prendre conscience du retard qui risquenational, et la Banque Mondiale (hiver 2010- de s’accumuler si les institutions publiques2011) et l’Open Knowledge Foundation (avril tardent à mettre en ligne leurs donnéesà juin 2011) au niveau international. Il est publiques.clairement nécessaire de consacrer des moyens Illustrer la réutilisation des donnéesmatériels assez importants pour créer une publiques par le développement de servicesmasse critique de postulants. aux citoyens. Il semble important que le Dans un second temps des concours public soit tenu au courant, à la fois des effortsthématiques pourraient être mise en place dans consentis par l’administration, et des bénéficesle domaines de la santé, de l’éducation, de concrets qui en découlent. On pourra parl’environnement, etc. à l’initiative des exemple labelliser des applications renduesministères et agences concernés et possibles grâce à la réutilisation des données etencourageant des partenariats d’organisation au travail de l’administration.avec le secteur privé et la société civile. L’État lui-même aura un rôle d’exemple et Intégrer la réutilisation des données de démonstration à jouer en la matière, etpubliques aux appels à projets de R&D pourrait choisir de développer lui-même à cetnumérique. Nous suggérons d’encourager dès effet un certain nombre de services quià présent la prise en compte de l’utilisation illustrent certains jeux de données publiquesjudicieuse qui pourrait être faite des données qui touchent les citoyens et leurspubliques dans l’ensemble des appels à projets préoccupations.de recherche et développement lancés en Faire des données et de leur réutilisationsoutien au développement du secteur du un outil d’éclairage du débat public. Nousnumérique. suggérons d’encourager par exemple la Pérenniser l’offre d’applications créées à création, par des développeurs ou despartir des données publiques. Nous journalistes, de visualisations et d’infographiessuggérons d’investir dans le suivi de l’offre interactives à partir des jeux de donnéesd’applications créées à partir des données publiques, qui pourraient avoir un rôle depubliques, et dans la communication de leur pédagogie auprès d’un public bien plus largeutilité auprès du public. que la simple cible des réutilisateurs, et permettraient de mettre en perspective les Un appui en terme de communication et un grands enjeux des politiques publiques.soutien financier permettraient notamment demultiplier l’impact de concours dedéveloppement d’applications éventuels, et de DJDJ Q%,-6.-!%&!#0,<2!&!%:K)#!D/4/!pérenniser les applications utiles aux citoyensqu’ils auraient contribué à faire émerger. !"#$#%&&#()*/)+!45?&%$22&-!7*&! (+-,+56.&!*,+.$*,%&!3!2,-+.-!7!-_%&! &!#$$-.*,+.$*!&(!.*(+.+7+.$*(! 27>%.B7&(!&!%,!<.((.$*!"+,%,>J! 97
    • Mutualiser des solutions de mise en ligne particulier, les données qui bien qu’à caractère pour les administrations et les collectivités. industriel et commercial représentent un intérêt Pour faciliter l’ouverture des données des fort pour le public devraient être largement collectivités, il serait souhaitable de mettre en ouvertes à la réutilisation libre et gratuite. place des solutions techniques mutualisées, en Explorer l’application de l’Open Data particulier pour éviter la multiplication de aux entreprises privées. La question de la dépenses superflues. réutilisation des données privées, encore à un Par exemple, un des rôles de la future stade prospectif, a vu émerger le concept de plateforme de données publiques de l’État « Data Portability », l’idée que les utilisateurs data.gouv.fr pourrait être de proposer des de services (par exemple des services en ligne, espaces dédiés aux collectivités qui ou un abonnement de téléphonie mobile) souhaiteraient y publier leurs données. Ces pourraient demander d’accéder à leurs données espaces pourraient enfin être exportables, afin d’usage dans des formats réexploitables. de figurer ensuite sur les sites des mairies et Une généralisation de ce principe serait une collectivités qui voudraient en disposer. avancée en faveur des consommateurs. Ils sont Développer une stratégie nationale pour sensibles à la fois aux questions de vie privées les données publiques. La mission Etalab a sous-jacentes et à la possibilité de suivre leur parmi ses prérogatives un rôle de coordination consommation de la façon la plus transparente, des administrations. Pour favoriser la afin de réduire l’asymétrie de l’information. réutilisation des données publiques de Cela doit ainsi leur permettre à terme l’ensemble des institutions publiques et des d’optimiser leurs choix économiques. collectivités, ce rôle de coordination pourrait L’obligation de communiquer les données être étendu à l’établissement d’une stratégie d’usage aux consommateurs dans des formats nationale visant à faciliter la mise à disposition réexploitables serait surtout un enjeu fort de de toutes les données publiques françaises, et libre choix des consommateurs, car il d’encourager à leur réutilisation. permettrait des comparaisons beaucoup plus Cette stratégie pourrait bien sûr s’appuyer faciles entre offres commerciales et entre sur le portail data.gouv.fr, mais aussi sur un fournisseurs de service. Ce serait donc un choix de licences gratuites, sur des élément potentiel à part entière des politiques recommandations techniques notamment en de concurrence. terme de formats de diffusion des données, et Développer une stratégie européenne et sur l’animation de l’ensemble de la internationale. Pour réaliser le plein potentiel communauté des réutilisateurs. des données publiques et de leur réutilisation, Elle permettrait de faciliter non seulement il nous paraît indispensable que la France noue la réutilisation des données publiques de l’État, des liens forts avec les autres États autour de la mais aussi de celles des données des question des données publiques. communes et des départements, Au niveau Européen, les évolutions particulièrement importantes pour les citoyens éventuelles de la Directive PSI pourraient du fait de leur plus grande proximité. constituer un levier d’action puissant en faveur Une véritable stratégie nationale aurait de conditions de réutilisation plus propices à enfin pour bénéfice de permettre le croisement l’innovation et au développement de nouveaux de données de l’État avec celles des services aux citoyens. collectivités, ce qui pourrait donner lieu à de Enfin, l’établissement de normes nouveaux services plus riches et plus d’interopérabilité, ou tout au moins l’échange innovants. de bonnes pratiques quant à la structuration des données, aux ontologies utilisées et aux formats de diffusion, pourraient permettre, au !"#$#%&&#()*0)+!Q%,-6.-!%&!#0,<2! niveau international le plus large, de poser les &!%:K)#!D/4/J! bases du Web des Données et de l’Internet de demain. Élargir le champ de la libre réutilisation des données publiques. Face aux régimes dérogatoires et aux exceptions au principe de ______________________ la réutilisation la plus libre des données publiques, nous recommandons d’élargir le plus possible le champ de la réutilisation qui entre dans les critères de l’Open Data. En98
    • Nous espérons que ces suggestions C’est enfin un sujet de société novateur etpourront s’avérer utiles dans le processus de important, dont les conséquences, notammentmise en place, à tous les niveaux, de sur la transparence de l’État, ne seront pas sansl’ouverture et de la réutilisation des données créer des bouleversements.publiques. Mais l’Open Data est avant tout une L’ouverture des données de l’État et de la transformation profonde de la société, et unsphère publique est un projet de longue outil puissant de politique publique pour fairehaleine. C’est un premier pas vers l’Internet de face aux grands défis de demain. L’État et lesdemain et un élément important du gouvernants doivent s’en saisir pleinement etdéveloppement du numérique. C’est un enjeu avec ambition.stratégique pour l’avenir de notre économie. 99
    • U.>%.$6-,20.&!AEC (Aquitaine Europe Communication), Paris ? KelQuartier, premier utilisateur d’Open2010, « Les données publiques : Guide Data ? »,pratique et juridique », Guide juridique n°4, http://billaut.typepad.com/jm/2010/11/connaissl’Agence des Initiatives Numériques. ez-vous-eduardo-larrain-from-paris-.htmlhttp://www.aecom.org/ BLANC, S., 2010, « La libération desAPPLE INSIDER, 2010, « Apple says App données : On ne reviendra pas en arrière »,Store has made developers over $1 billion ». OWNI.fr, http://owni.fr/2010/06/14/liberation-Juin 2010. des-donnees-on-ne-reviendra-pas-en-arriere/http://www.appleinsider.com/articles/10/06/07/ BROWN, J., DUGUID, P., 2000, « The socialapple_says_app_store_has_made_developers_ life of information », Boston: Harvardover_1_billion.html Business School Press.ARROW, K., 1962, « Economic Welfare and CAMERON, D., 2010, Allocution à l’occasionthe Allocation of Resources for Innovation ». de la mise en ligne des données de dépensesBAUDREZ, M-L., CHANTEPIE, P., publiques à partir de 25,000 livres.MEURISSE, J., 2009, « Partager notre http://www.guardian.co.uk/politics/blog/2010/patrimoine culturel », Ministère de la Culture nov/19/government-spending-files-live-et de la communication. blog?intcmp=239BANCILHON, F. et GANS, B., 2011, « Size CHAUMOND J., 2010, « Social Commerce :and Structure of the French Public Sector Quand le E-Commerce Rencontre le WebInformation » d’Aujourd’hui ».http://gov.opendata.at/site/sites/default/files/Si CISCO, 2010, « Cisco Visual Networkingze%20and%20Structure%20of%20French%20 Index Global Mobile Data Traffic ForecastPSI_0.pdf Update, 2009-2014 ».BENGHOZI, P.-J., BUREAU, S. et MASSIT- http://www.cisco.com/en/US/solutions/collaterFOLLEA, F., 2009, « L’Internet des objets : al/ns341/ns525/ns537/ns705/ns827/white_papeQuels enjeux pour l’Europe ? ». Maison des r_c11-520862.htmlsciences de l’homme, Paris. COMMITTEE ON GEOPHYSICAL ANDBENHAMOU, B., 2010, « Eléments pour une ENVIRONMENTAL DATA, 1995, « On thestratégie numérique européenne », Délégation full and open exchange of scientific data »,aux Usages de l’Internet, 15 mars 2010. National Research Council, Washington, D.C. http://www.nap.edu/readingroom.php?book=eBENHAMOU, B., 2010, « Les concours xch&page=summary.htmld’applications mobiles dans le monde »,Délégation aux Usages de l’Internet, 21 CONSEIL D’ANALYSE STRATEGIQUE,octobre 2010. « Rapport thématique France 2025 : Production et emploi ». Gilbert Cette,BERNERS LEE T., 1994, World Wide Web Président de groupe.Consortium (W3C). « Uniform Resource http://www.strategie.gouv.fr/IMG/pdf/4ProducLocators (URL): A Syntax for the Expression tionetemploi.pdfof Access Information of Objects on theNetwork ». CRAGLIA M., Coordonateur techniquehttp://www.w3.org/Addressing/URL/url- d’Inspire pour la Commission Européennespec.txt (centre commun de recherche). Séminaire « Innovations et développement du secteur deBESSON, E., 2008, « France numérique 2012 : l’information géographique » organisé le 5Plan de développement de l’économie octobre 2009 à la Grande Arche de la Défensenumérique », octobre 2008. par le Conseil National de l’Informationhttp://lesrapports.ladocumentationfrancaise.fr/ Géographique (CNIG), l’AFIGÉO et l’InstitutBRP/084000664/0000.pdf des Sciences et des Techniques deBILLAUT, J-M., 26 novembre 2010, l’Équipement pour le Développement« Connaissez-vous Eduardo Larrain from (ISTED). 101
    • DAVID P., 2000, « A tragedy of the public GIGAOM, 2010, « MyCityWay Dives Into knowledge ‘commons’ ? », Oxford & Stanford Data, Comes Up With Gold », 19 novembre University, 2010. http://129.3.20.41/eps/dev/papers/0502/050201 http://gigaom.com/2010/11/19/mycityway- 0.pdf dives-into-data-comes-up-with-gold/ DEKKERS, M. et al., 2006, « MEPSIR, JOSPIN, L., 1997, « Préparer la France pour la Measuring Public Sector Information Société de l’Information ». Discours à Hourtin Resources, Final Report of Study on le 25 août 1997. Exploitation of public sector information », http://www.admiroutes.asso.fr/action/theme/po http://ec.europa.eu/information_society/policy/ litic/lionel.htm psi/docs/pdfs/mepsir/final_report.pdf JUPPE, A., ROCARD, M., 2009, « Investir DIRECTION GENERALE DE LA pour l’Avenir : Priorités stratégiques MODERNISATION DE L’ÉTAT, 2010, d’investissement et emprunt national ». « Innover au service du citoyen ». http://www.commission- http://www.rgpp.modernisation.gouv.fr/index. investissement.fr/IMG/pdf/ php?id=51&tx_ttnews[tt_news]=531&tx_ttne Rapport_191109.pdf ws[backPid]=11&cHash=89b9c6970f KAPLAN, D., 2010, « Les données publiques : FAURE, P., Vice Président du Conseil Général et après ? », Internet Actu, 9 novembre 2010 de l’Industrie, de l’Energie et des http://www.Internetactu.net/2010/11/09/louver Technologies, explique l’importance du « ture-des-donnees-publiques-et-apres/ green IT » aux Assises du Numérique 2009 le KIRKPATRICK, M., 2010, « Objects Outpace 1er octobre 2009. New Human Subscribers to AT&T, Verizon », http://www.dailymotion.com/video/xaov8c_pa ReadWriteWeb, 10 août 2010, scal-faure-assises-du-numerique-2_news http://www.readwriteweb.com/archives/objects FIORETTI, M., 23 octobre 2009, _outpace_new_human_subscribers_to_att_veri « Walkability: Check It Before Choosing Your z.php Next Home », LACOMBE, R., 2010, « Tocqueville 2.0 and http://stop.zona-m.net/2009/10/walkability- Open Government Data ». LeWeb 10 Ignite check-it-before-choosing-your-next-home/ Session. http://www.youtube.com/watch?v=6q GALLON, C., 2011, « Carte contributive sur j8jS2Xsfk l’ouverture des données en France », Libertic, LAFFONT, J. et TIROLE, J., 1993, « A http://libertic.wordpress.com/2011/02/11/carte- Theory of Incentives in Procurement », MIT contributive-sur-louverture-des-donnees- Press : Cambridge, MA. publiques-en-france/ LANDIER, A. et THESMAR, D., 2010, La GARRETT, J.J., 2005. « Ajax : A New Société Translucide : Pour en Finir avec le Approach To Web Applications », Mythe de l’État Bienveillant. http://www.adaptivepath.com/ideas/essays/arc hives/000385.php LESSIG, L., 2009, « Remix : Making art and commerce thrive in the hybrid economy ». GFII, Groupement Français des Industries de http://remix.lessig.org/ l’Information. 20 mai 2010. « L’ouverture des données publiques : un enjeu pour le L’INFORMATICIEN, 2011, « Interview de développement de l’économie numérique. », Séverin Naudet, Directeur d’Etalab : Colloque tenu à la Maison de l’Europe, Encourager l’innovation par toute la http://www.gfii.asso.fr/article.php3?id_article= communauté des développeurs et des 3226 entrepreneurs pour soutenir le développement de l’économie numérique ». Numéro 91, mai GFII, Groupement Français des Industries de 2011. l’Information, 2010, « PSI Re-use in France : Overview and Recent Developments », M. LE PREMIER MINISTRE, 2011, http://www.gfii.asso.fr/article.php3?id_article= « Création de la mission Etalab, chargée de la 3315 mise en ligne de data.gouv.fr », communiqué de presse du 22 février 2011. GIGAOM, 2010, « GeoLocal : The Rise of http://www.gouvernement.fr/sites/default/files/ Consumer Location-Based Services », 28 mai communiques/02.22_Communique_de_presse 2010. http://gigaom.com/mobile/geolocal-the- _-__Etalab.pdf rise-of-consumer-location-based-services/ M. LE PRESIDENT DE LA REPUBLIQUE, 2011, « Discours à l’occasion de l’installation102
    • du Conseil National du Numérique le 27 avril géographique » organisé le 5 octobre 2009 à la2011». Grande Arche de la Défense par le Conseilhttp://www.elysee.fr/president/les- National de l’Information Géographiqueactualites/discours/2011/discours-sur-Internet- (CNIG), l’AFIGÉO et l’Institut des Sciences etet-l-economie-numerique.11256.html des Techniques de l’Équipement pour le Développement (ISTED).MARTINEZ, R., 2010, «PSI Re-use in France:Overview and Recent Developments »,, PENIN, J., et al., « La valorisation deshttp://www.epsiplatform.eu/topic_reports/topic informations du secteur public (ISP) : un_report_no_10_psi_re_use_in_france_overvie modèle économique de tarification optimale »,w_and_recent_developments https://www.apiefrance.fr/sections/acces_them atique/reutilisation-des-informations-MAUDE, F., Ministre du Cabinet Office, publiques/etude-economique/viewallocution du 19 novembre 2010, conférencede presse à l’occasion de la mise en ligne des PETTIFER, R. 25 août 2009. « Europe losesentrées de 25,000 livres et plus du budget de 300 million Euro in taxation per year. » ePSIfonctionnement de l’État britannique : Platform.http://www.guardian.co.uk/commentisfree/201 http://www.epsiplatform.eu/guest_blogs/europ0/nov/19/francis-maude-government-data- e_looses_300_million_euro_per_year_in_taxatpublished?intcmp=239 ionMCKINSEY & COMPANY, 2011, « Impact PEUGEOT, V., 2010, « Les enjeux publics,d’Internet sur l’économie française : Comment économiques et citoyens de l’ouverture desInternet transforme notre pays » : données : l’expérience britannique »,http://www.mckinsey.com/locations/paris/hom http://academia.edu.documents.s3.amazonaws.e/Rappor_complet_Impact_final.pdf com/1850987/CommunicationDocSoc2010_V Peugeot_opendata.pdfNEW ENGLAND JOURNAL OFMEDECINE, 2007, « Public Reporting and POLLOCK, R., 2008, « The Economics ofPay for Performance in Hospital Quality Public Sector Information. », OxfordImprovement ». January 26, 2007. University Department of Economics.http://www.nejm.org/doi/full/10.1056/NEJMsa http://www.rufuspollock.org/economics/papers064964#t=articleBackground /economics_of_psi.pdfNEW YORK TIMES, 23 avril 2011. « Show RAO, L., 2010, « Boom ! 5 Million UsersUs The Data (It’s Ours After All) ». Richard Check-In to Foursquare », Techcrunch, 1erH. Thaler. décembre 2010.http://www.nytimes.com/2011/04/24/business/ http://techcrunch.com/2010/12/01/foursquare-24view.html hits-5-million-users/ORANGE LABS, 2010, « Web des !"##$es et RATTI, C., 2009. « Digital Cities : ‘Sense-!"##$es Ouvertes » : http://www.orange- able’ urban design. », 2 octobre 2009, Wiredinnovation.tv/dreamorange/resources/documen UK Magazine,ts/4022/ http://www.wired.co.uk/magazine/archive/200OpenData_OrangeLabs_Sofrecom_2009.pdf 9/11/features/digital-cities-sense-able-urban- designO’REILLY, T., 2010, Open Government,O’Reilly editions, disponible sur : REFLECTION GROUP ON BRINGINGhttp://opengovernment.labs.oreilly.com/ EUROPE’S CULTURAL HERITAGE ONLINE, 2011, « The New Renaissance:OTTERY, C., 2010, « Partage des Données Report of the ‘Comité des sages’ ».pour Mieux Réagir Face aux Catastrophes http://ec.europa.eu/information_society/activitiNaturelles », 12 décembre 2010, OWNI. es/digital_libraries/doc/refgroup/final_report_chttp://owni.fr/2010/12/12/partager-des- ds.pdfdonnees-pour-mieux-reagir-face-aux-catastrophes-naturelles/ REGARDS SUR LE NUMERIQUE, 17 mars 2011, « Data.gouv.fr : La France va se lancerOYE, K.A., WELLHAUSEN, R., 2009, « The en version bêta avant fin 2011 ».Intellectual Commons and Property in http://www.rslnmag.fr/blog/2011/3/17/_data-Synthetic Biology ». gouv-fr_la-france-va-se-lancer_en-version-PARSONS, E., 2009. Geospatial Technologist beta_avant-fin-2011/for Europe, Middle East and Africa chez RIESTER, F.et al., 2010, « Améliorer laGoogle. Séminaire « Innovations et Relation Numérique à l’Usager : Rapport Issudéveloppement du secteur de l’information des Travaux du Groupe Experts Numériques ». 103
    • http://www.modernisation.gouv.fr/fileadmin/M THE ECONOMIST. 25 février 2010. « The es_fichiers/pdf/RapportGroupeExpertsNumeri Data Deluge : Businesses, Governments and ques.pdf Society are Only Starting to Tap Its Vast Potential ». RONAI, M., 1996, « Données publiques : http://www.economist.com/node/15579717 accès, diffusion, commercialisation. » Revue Problèmes Politiques et Sociaux : Dossiers THOENIG, J-C., 4 septembre 2010, d’Actualité Mondiale. Nos 773-774, 1er Conférence aux élèves du Corps des Ponts, des novembre 1996. La Documentation Française. Eaux et des Forêts. SEGARAN, T., 2009, « Programming the U.S. NATIONAL RENEWABLE ENERGY Semantic Web », O’Reilly éditions. LAB, International Solar Resource Data. http://www.nrel.gov/csp/troughnet/solar_data.h SHADBOLT, N., 2011. Allocution au colloque tml « Open Data : Et Nous, Et Nous, Et Nous ? » du 17 mars 2011 organisé par Regards sur le VERDIER, H., 2010, « Big Data : Making Numérique. Présentation : sense at scale. », 14 décembre 2010. http://www.slideshare.net/RSLN/opendata- http://www.henriverdier.com/2010/12/big- datagovuk-how-did-we-do-it data-making-sense-at-scale.html SHAH, S., 2010, « Cannibalize Business WAGNER, R., 2003, « Information wants to Development by Popularizing your API », be free: intellectual property and the http://shaivalshah.com/cannabilize-business- mythologies of Control ». development-by-populariz http://papers.ssrn.com/sol3/papers.cfm?abstrac t_id=419560 SHAPIRO, C. et VARIAN, H., 1998, « Information Rules: A Strategic Guide to the WATTERS, A., 2010. The Age of Exabytes : Network Economy », HBS Press. Tools & Approaches for Managing Big Data, ReadWriteWeb. SIEGLER, M.G., 2010, « Marissa Mayer’s http://www.readwriteweb.com/reports/big- Next Big Thing : ‘Contextual Discovery’ – data/ Google Results Without Search », 8 décembre 2010, Techcrunch, TECHCRUNCH, 2010. « Smartphone App http://techcrunch.com/2010/12/08/googles- Market Reached More Than $2.2 Billion in the next-big-thing/ First Half of 2010 », 20 août 2010, http://techcrunch.com/2010/08/20/smartphone- STIGLITZ, J. et ORSZAG, P., 2000, « The applications-market-size/ Role of Government in a Digital Age ». Octobre 2000. TECHCRUNCH, 2010, « Global Smartphone http://archive.epinet.org/real_media/010111/m App Download Market Could Reach $15 aterials/stiglitz.pdf Billion by 2013 : Report », 5 mars 2010, http://techcrunch.com/2010/03/05/global- TAPSCOTT, D. et WILLIAMS, A. 2006. smartphone-app-download-market-could- « Wikinomics : How Mass Collaboration reach-15-billion-by-2013-report/ Changes Everything. » WU, T., 2010, « The Master Switch: The Rise TESTER, J.W. et al, 2005. « Sustainable and Fall of Information Empires », Knopf éd. Energy: Choosing Among Options », MIT Press, Cambridge, MA. http://mitpress.mit.edu/catalog/item/default.asp ?tid=10566&ttype=2104
    • /&8+&(!-I6%&<&*+,.-&(!!L-M E#A4#$!#*0&)(#$!g! • Directive 90/313/CEE du Conseil, du • Décision n° 247769 du Conseil d’État 7 juin 1990, concernant la liberté en date du 24 juillet 2006. d’accès à l’information en matière http://www.easydroit.fr/jurisprudence d’environnement. Abrogée par : /Conseil-d-État-10eme-et-9eme-sous- sections-reunies-24-07-2006-247769- • Directive 2003/4/CE du Parlement et 247769/J49598 du Conseil du 28 janvier 2003 concernant l’accès du public à • Circulaire du 18 octobre 2007 relative l’information en matière à la mise en œuvre des dispositions d’environnement. régissant le droit d’accès à l’information relative à • Transposition en droit français : Loi l’environnement. n°2005-1319 du 26 octobre 2005 http://www.toutsurlenvironnement.fr/ portant diverses dispositions files/circulaire_aarhus.pdf. d’adaptation au droit communautaire dans le domaine de l’environnement. • Arrêté du 22 Janvier 2009 fixant le montant des rémunérations dues en • Directive PSI du Parlement européen contrepartie de la cession des licences et du Conseil n°2003/98/CE du 17 de réutilisation de données de la base novembre 2003 concernant la de données informatique du Ministère réutilisation des informations du de l’économie, de l’industrie et de secteur public. l’emploi relative aux prix des • Transposition en droit français par carburants. l’ordonnance n°2005-650 du 6 juin http://www.prix- 2005 relative à la liberté d’accès aux carburants.gouv.fr/document/Arrete_ documents administratifs et à la du_22_janvier_2009.pdf réutilisation des informations • Arrêté du 15 juin 2010 relatif à la publiques. mise à disposition du public pour un • Directive Inspire du Parlement usage de rediffusion de la base de européen et du Conseil n° 2007/2/CE données électronique de l’Institut du 14 mars 2007 établissant une national de la statistique et des études infrastructure d’information économiques dénommée SIRENE. géographique dans la Communauté http://www.legifrance.gouv.fr/affichT européenne. exte.do?cidTexte=JORFTEXT000022 377461&fastPos=1&fastReqId=4482 • Transposition en droit français dans 89598&categorieLien=cid&oldAction les articles L. 127-1 à L. 127-10 du =rechTexte code de l’environnement introduits par l’ordonnance n° 2010-1232 du 21 • Décret n° 2011-194 du 21 février octobre 2010. 2011 portant création dune mission « Etalab » chargée de la création dun portail unique interministériel des données publiques.L--M E#A4#$!/4-&/*A!g! http://legifrance.gouv.fr/affichTexte.d • Loi n°78-753 du 17 juillet 1978 sur o?cidTexte=JORFTEXT0000236190 l’accès aux documents et données 63&categorieLien=id publiques. • Circulaire du 26 mai 2011 relative à • Ordonnance n°2005-650 du 6 juin la création du portail unique des 2005 modifiant la loi n°78-753 du 17 informations publiques de lEtat « juillet 1978 sur l’accès aux documents data.gouv.fr » par la mission « Etalab et données publiques. » et lapplication des dispositions régissant le droit de réutilisation des informations publiques. 105
    • http://www.legifrance.gouv.fr/affichT lEtat et ses établissements publics exte.do?cidTexte=JORFTEXT000024 administratifs. 072788&dateTexte=&categorieLien= http://www.legifrance.gouv.fr/affichT id exte.do?cidTexte=JORFTEXT000024 072772&categorieLien=id • Décret n° 2011-577 du 26 mai 2011 relatif à la réutilisation des informations publiques détenues par !106
    • ;*+&-%$#7+&7-(!L-M 6#2&40#$!%/$!,#!2/%0#!%3#40#4-#$! Management, United Nations Department of)/04-2*,-#0$! Economic and Social Affairs. APIE : Mme Danielle Bourlange, Open Knowledge Foundation :directrice-adjointe, le 5 novembre 2010. M. Jonathan Gray, Community Manager. CanalTP : M.Guillaume Crouigneau, Suez Environnement : Guillaume Féry,directeur délégué,le 12 novembre 2010. responsable Innovation et Protection de Cap Digital : M.Henri Verdier, président, le l’Environnement.12 novembre 2010. Timetric : Andrew Walkingshaw, co- FING (Fondation Internet Nouvelle founder and CEO, and Simon Briscoe, VP forGénération) : M. Charles Nepote, le 25 Product.novembre 2010. UK Cabinet Office : James Forrester, IGN : M. Jean-Yves Bréard, directeur par Transparency & Digital Engagement,intérim de la Maitrise d’Ouvrage Déléguée du Efficiency and Reform Groupe, in charge ofService Public,le 17 décembre 2010. Data.gov.uk. INSEE : M. Pierre Audibert, directeur de la US Office of the Chief Informationdiffusion et de l’action régionale, et M. Thierry Officer : Joey A. Hutcherson, Data.gov.Aouizerate, chef de département INSEE info World Bank : Eric Swanson, Programservice, le 26 novembre 2010. Manager for Global Monitoring & WDI, LATTS (Laboratoire Techniques, Development Data Group.Territoires et Sociétés) de l’ENPC : M. SylvainParasie, chercheur en sociologie, le 18 octobre2010. L---M 6#2&40#$!T!6##$!,#!O]!&1#7+0#!OPP! Maurice Ronai, auteur du rapport sur les Commission Européenne : Andrejdonnées publiques à la Documentation Osterman, direction générale Société deFrançaise en 1996, le 3 décembre 2010. l’information et médias. Ministère de la Justice : M. Thomas Saint InCité Solution : Pierre-Emmanuel Muller,Aubin, auteur de la Licence Information directeur associé.Publique, le 23 décembre 2010. LiberTIC : Claire Gallon, fondatrice. NavX : M. Jean Cherbonnier, PDG, le 22décembre 2010. Ministère du Budget : Mme Frédérique Summing, Service innovation à la direction Regards Citoyens : M. Tangui Morlier, et Générale de la Modernisation de l’État.M.Benjamin Ooghe, cofondateurs del’association, le 9 novembre 2010. Rennes Métropole : M. Xavier Crouan, directeur des informations. Secrétariat Général du Gouvernement : M.Stéphane Cottin, chargé de mission auprès ducabinet du Secrétaire général, le 22 octobre2010. L-1M H&4/24$!)/0!4(,():&#!&*!)/0!2&*00-#,! MEEDDM : M. Laurent Coudercy, ancien responsable du portail de l’Environnement.L--M 6#2&40#$!T!"&%0#$!,#!_!#4!]!a&1#7+0#!OPP!LQ!K)#![&1#07#4!D/4/!H/7)!SM! Data Publica : M. François Brancilhon, L1M X&04/-,$!0(;-&/*A!Directeur et Fondateur. ADACL40 (Aide aux Collectivités Locales ONU : M. Keping Yao, Division for Public du Département 40) : Mme Marie-HélèneAdministration and Development Lalande, responsable du projet IGECOM 40. 107
    • CETE Ouest : Mme Catherine Chamard- Géobretagne : Mme Lydie Vinsonneau, Bois, consultant méthodologie et géomatique Conseil régional de Bretagne, Pôle Système Division Ville et Territoires. d’Information Géographique direction de l’aménagement. CIGAL : Guillaume Ryckelynck, chargé de mission. Région Basse Normandie : M. Benjamin Lecointe, Dir. Aménagement et D.D. CRAIG (Centre Régional Auvergnat de l’Information Géographique). CRIGE PACA : Mme Christine Archias, directrice.108
    • O.&*(!&+!-5S5-&*#&(! http://www.rip.justice.fr/information_publiqueL-M !D-CC(0#4$!/24#*0$! _librement_reutilisablehttp://www.afigeo.asso.fr/ http://www.opendatacommons.org/licenses/odhttps://www.apiefrance.fr/ bl/http://www.apur.org/http://www.cada.fr/ L-1M 6(*4-,-$/4-&$!-4(0#$$/4#$!http://www.cnil.fr/la-cnil/ http://caselex.comhttp://www.data-publica.com http://www.guardian.co.uk/http://data.gouv.fr/ http://www.paris.fr/accueil/actualites-http://blog.etalab.gouv.fr/ municipales/du-neuf-sur-opendata-paris- fr/rub_9656_actu_99478_port_23785http://fing.org/ http://www.husetseb.dk/abouthttp://www.gfii.asso.fr/rubrique.php3?id_rubrique=60 http://lexisnexis.comhttp://libertic.wordpress.com/libertic/ http://www.météo-paris.comhttp://okfn.org/ http://www.navx.comhttp://www.opendatafoundation.org/ http://www.openstreetmap.fr/http://owni.fr http://www.rte-france.com/fr/developpement- durable/maitriser-sa-consommation-http://www.regardscitoyens.org/ electrique/eco2mix-consommation-production- et-contenu-co2-de-l-electricite-francaiseL--M F-4#!%#!%-CC*$-&!%#!%&(#$!http://opendata.paris.fr/ L1M 6(C(0#2#$!%-1#0$#$!http://canadp-archivesenligne.paris.fr/ http://148apps.biz/app-store- metrics/?mpage=appcounthttp://www.certu.fr/fr/catalogue/product_info.php?products_id=3817&language=fr http://www.ac- grenoble.fr/ecogest/pedago/administration/prohttp://www.geocatalogue.fr/ dpeda/mcd.htmhttp://www.insee.fr/fr/default.asp http://www.acteurspublics.com/article/28-09-http://www.ign.fr/ 10/les-portails-etrangers-au-banc-d-essaihttp://www.loire.fr/display.jsp?id=c_828986 http://www.advancity.eu/http://professionnels.ign.fr/2/telechargement.ht http://aws.amazon.com/ec2/m http://biobricks.orghttp://www.toutsurlenvironnement.fr/ http://www.canaltp.fr/http://www.govdata.eu/ http://cordis.europa.eu/fp7/i2010_fr.html http://creativecommons.org.au/weblog/entry/2 69L---M "-2#2#$! http://datalift.org/http://www.paris.fr/portail/viewmultimediadocument?multimediadocument-id=94658 http://www.dbpedia.orghttp://www.legifrance.gouv.fr/html/licences/lic http://www.debatpublic.fr/ences_notice.htm 109
    • http://georss.org http://re.jrc.ec.europa.eu/pvgis/apps4/pvest.php http://www.henriverdier.com http://www.startuplessonslearned.com/ http://lod2.eu http://www.urbanmobs.fr/fr/france/ http://loopt.com http://www.w3.org/People/Berners-Lee/ http://www.moma.org/interactives/exhibitions/ http://www.w3.org/Protocols/ 2008/elasticmind/ http://en.wikipedia.org/wiki/Raw_data http://okfn.org/ http://en.wikipedia.org/wiki/Virtual_globe http://www.opengovdata.org/home/8principles http://fr.wikipedia.org/wiki/Loi_de_Metcalfe http://www.opendefinition.org/okd/ http://fr.wikipedia.org/wiki/BarCamp http://en.openei.org/ http://world.waze.com/guided_tour/ http://www.pcinpact.com/actu/news/57602- http://www.youtube.com/watch?v=6qj8jS2Xsf telephonie-mobile-Internet-arcep-orange.htm k http://www.quora.com École des Ponts ParisTech. 2011. Pour une politique ambitieuse des données publiques : Les données publiques au service de l’innovation et de la transparence. Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie, de l’Energie et de l’Economie numérique le 13 juillet 2011. Vous pouvez contacter les auteurs de ce rapport sur http://rapport-opendata-2011.fr110
    • 111
    • École des Ponts ParisTech. 2011. Pour une politique ambitieuse des donnéespubliques : Les données publiques au service de l’innovation et de la transparence.Rapport à la Délégation aux usages de l’Internet, remis au Ministre de l’Industrie,de l’Energie et de l’Economie numérique le 13 juillet 2011.