Your SlideShare is downloading. ×

Rapport Open data - Laurence Rumeau

5,389

Published on

Rapport de Laurence Rumeau sur l'open data: Développer la culture de la donnée ouverte au sein de la Communauté Urbaine de Toulouse Métropole

Rapport de Laurence Rumeau sur l'open data: Développer la culture de la donnée ouverte au sein de la Communauté Urbaine de Toulouse Métropole

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
5,389
On Slideshare
0
From Embeds
0
Number of Embeds
8
Actions
Shares
0
Downloads
93
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. 0 Rapport Licence Professionnelle « Management des ressources numériques et bases de données » Laurence Rumeau Année universitaire 2012-2013  Open data: Développer la culture de la donnée ouverte au sein de la Communauté Urbaine de Toulouse Métropole Direction des Systèmes d'Information Mairie de Toulouse | Toulouse Métropole 25, rue Valade 31000 Toulouse Centre Universitaire du Guesclin 3 allée du Doyen Nerson B.P. 310 34506 Béziers CEDEX
  • 2. P a g e | 1 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Remerciements Je tiens à remercier Jean Noël Marrot pour le bon accueil qu’il réserva à ma demande en juin 2012 d’intégrer l’équipe projet Open Data et me donner ainsi l’opportunité d’être au cœur de décisions publiques. J’exprime toute ma reconnaissance à Sandrine Mathon et Michael Combes qui ont su se rendre disponibles pour répondre à mes questions et me faire confiance. Enfin, je remercie ma grande amie Marie-Lise pour son infinie patience, son soutien et ses encouragements sans cesse renouvelés depuis le début de mon parcours de reconversion professionnelle.
  • 3. P a g e | 2 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 SOMMAIRE INTRODUCTION..................................................................................................................................................................3 1. OPEN DATA: L’ENGAGEMENT DES COLLECTIVITES ...........................................................................4 1.1 Le mouvement Open Data......................................................................................................................4 1.1.1 Historique et législation ................................................................................................................4 1.1.2 Cadre légal de la réutilisation des données...........................................................................6 1.1.3 Des enjeux et des attentes ...........................................................................................................8 1.2 Le projet Open Data Toulouse Métropole.....................................................................................11 1.2.1 Naissance du projet......................................................................................................................11 1.2.2 Le Comité de pilotage projet.....................................................................................................12 1.2.3 data.grandtoulouse.fr ..................................................................................................................13 2 LEVER LES FREINS A L’OUVERTURE DES DONNEES........................................................................16 2.1 Analyse des freins...................................................................................................................................16 2.2 Missions, analyse de l’existant et des besoins.............................................................................17 2.3 Data Stratégie ...........................................................................................................................................21 2.3.1 Cellule de Veille..............................................................................................................................21 2.3.2 Communication..............................................................................................................................23 2.3.3 Collaboration et Coproduction ................................................................................................25 3 EVALUATION ET PERSPECTIVES D’EVOLUTION DES DISPOSITIFS...........................................29 CONCLUSION ....................................................................................................................................................................32 BIBLIOGRAPHIE ET SITOGRAPHIE .........................................................................................................................33 ANNEXES..............................................................................................................................................................................34
  • 4. P a g e | 3 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 INTRODUCTION L’Open data ou l’ouverture des données en français, est la mise à disposition de données publiques détenues par les services de l’Etat, les administrations et les collectivités territoriales pour permettre à un large public de les réutiliser. Les données à caractère personnel ou touchant à la sécurité en sont exclues. Elles doivent être brutes, accessibles en ligne et sous des formats ouverts pour en faciliter la réutilisation. L'ouverture des données est à la fois un mouvement et une pratique. Les Etats membres de l’Union Européenne relevaient dès la fin des années quatre vingt dix, le potentiel que pouvaient représenter la multitude de données inutilisées collectées, produites et détenues par les organismes de services publics. Le mouvement est initié en 2007 aux Etats Unis. En France, le mouvement s’inscrit dans l’histoire du droit d’accès aux documents administratifs, élargi dès 2005 à celui de la réutilisation des données publiques. Il s’engage réellement en 2010 avec les premières démarches volontaristes de collectivités territoriales où des équipes d’éclaireurs, généralement issus des Services des Systèmes d’Information, d’Information Géographique ou des Directions Générales chargées du développement de l’innovation et du numérique sur les territoires, mettent en œuvre sous l’impulsion politique les projets d’ouverture des premiers entrepôts Open Data pour répondre aux attentes fortes des réutilisateurs. Depuis, les initiatives se multiplient et une vingtaine d’entrepôts de données ont aujourd’hui vu le jour, certains plus alimentés que d’autres en fonction des moyens financiers et humains déployés. Les moyens engagés ne sont pas les seuls freins à la publication de données, en effet, beaucoup de services sont encore rétifs à la libération de leurs données et c’est là tout l’enjeu du développement du mouvement en interne, auprès des Directions et des services des collectivités impliquées dans le mouvement. En septembre 2012, j’intègre l’équipe projet Open Data de la Ville de Toulouse et de la Communauté Urbaine de Toulouse Métropole qui fait figure de pionnier en France. L’entrepôt de données mutualisé entre les deux collectivités et les communes de la Métropole, data.toulouse-metropole.fr, voit le jour le 22 octobre 2011 avec trente jeux de données publiés. Un an environ après son ouverture, il n’en propose qu’un total de soixante à ses réutilisateurs potentiels. Ma mission consiste à définir et mettre en œuvre une stratégie pour dynamiser le développement du mouvement et engager les services à ouvrir leurs données. Une communication interne sur les enjeux du mouvement et les différentes étapes du projet, un outil collaboratif et de partage et une sollicitation intensifiée peuvent-ils engager les services des deux collectivités et des communes autour d’un projet commun qui suscite de fortes attentes de la société civile ? Dans une première partie, je présenterai l’engagement des deux collectivités en rappelant au préalable l’historique du mouvement Open Data en France, son cadre juridique et ses enjeux. Dans la deuxième partie, je relèverai les freins à la libération des données, puis j’analyserai l’état du projet pour identifier les besoins et développer une stratégie afin d’inciter les Directions et les services à s’impliquer dans le mouvement. Enfin, j’évaluerai les dispositifs mis en œuvre pour en dégager des perspectives d’évolutions.
  • 5. P a g e | 4 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 1. OPEN DATA: L’ENGAGEMENT DES COLLECTIVITES 1.1 LE MOUVEMENT OPEN DATA A l’origine, l’article 15 de la déclaration des droits de l’homme de 17891 qui stipule que « La Société a le droit de demander compte à tout Agent public de son administration ». Des lois ont depuis apporté un cadre législatif afin d’accorder la liberté d’accès aux documents administratifs pour tout citoyen. C’est sur ce grand principe que le très récent mouvement Open Data fondé sur la mise à disposition des données publiques se construit, en même temps que la citoyenneté démocratique se fait plus présente dans le débat public. De la liberté d’accès aux données publiques, le mouvement Open Data conduit à l’existence d’un cadre législatif sur le droit de réutilisation de ces données. 1.1.1 HISTORIQUE ET LEGISLATION Les racines du mouvement Open Data en France remonte au droit d’accès des citoyens aux documents administratifs revendiqué dès les années 1960 et qui portait sur le « droit de savoir » et sur la critique de l’administration pour son goût du secret. Un projet de loi à l’Assemblée Nationale qui aspirait à améliorer les relations entre l’administration et ses administrés déboucha sur la loi n° 78-753 du 17 juillet 19782 intitulée « de la liberté d’accès aux documents administratifs ». Le texte prévoyait que « sous réserve des dispositions de l'article 6, les autorités mentionnées… sont tenues de communiquer les documents administratifs qu'elles détiennent aux personnes qui en font la demande, dans les conditions prévues par le présent titre ». Ce droit d’accès aux documents administratifs s’applique à toutes les personnes publiques (l’État, les collectivités territoriales et leurs établissements publics) ainsi qu’aux organismes privés chargés d’une mission de service public et doit procéder d’une demande auprès des administrations détentrices. En cas de refus de communication, la Commission d'Accès aux Documents Administratifs (CADA) qui a été créée par la loi de Loi n°78-753 du 17 juillet 1978 peut être saisie. La CADA est une autorité administrative indépendante et consultative chargée de veiller à la liberté d’accès aux documents administratifs. Sa saisine est obligatoire avant tout recours contentieux. Les documents exclus du droit de communication sont énoncés dans l’article 6, comme ceux relatifs au secret des délibérations du Gouvernement et des autorités responsables relevant du pouvoir exécutif, au secret de la défense nationale, à la conduite de la politique extérieure de la France, à la sûreté de l'Etat, à la sécurité publique ou à la sécurité des personnes, etc. C’est à la fin des années 1990 que la réutilisation des données publiques produites par les Etats membres de l’Union Européenne s’inscrit dans les débats. Le 2 janvier 1999, l’U.E. diffuse un livre vert qui met en avant le potentiel de données inutilisées qui sont collectées, produites et détenues par les organismes de services public. Cette orientation stratégique débouche sur la directive 2003/98/CE du Parlement européen et du Conseil du 17 novembre 2003 concernant la 1 Légifrance. Déclaration des droits de l’homme de 1789 [en ligne]. Disponible sur : http://www.legifrance.gouv.fr/Droit- francais/Constitution/Declaration-des-Droits-de-l-Homme-et-du-Citoyen-de-1789 [Consulté le 08.05.2013). 2Légifrance Loi n°78-753 du 17 juillet 1978 [en ligne]. Disponible sur : http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000000339241 (consulté le 08.05.2013).
  • 6. P a g e | 5 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 réutilisation des informations du secteur public (en anglais PSI Directive Public Sector Information). La France transpose la directive de 2003 par l’ordonnance n° 2005-650 du 6 juin 20053 relative à la liberté d'accès aux documents administratifs et à la réutilisation des informations publiques. Le mouvement Open Data se dessine à partir d’octobre 2007 dans la ville de Sébastopol en Californie où quelques personnalités du web et des acteurs de « l’Open Governement » (le gouvernement ouvert), établissent les dix grands principes4 de l’Open Data. Les données mises à disposition doivent être complètes, primaires, fraîches, consultables par voie électronique de façon pérenne et gratuite, lisibles par une machine, accessibles sans discrimination, respectant les standards ouverts, disponibles sous une licence claire. Lors de son investiture en Janvier 2009, Barack Obama engage les Etats Unis dans le mouvement Open Data et dans le respect de ces grands principes. Le 12 décembre 2009 a lieu le premier Open Data Camp français à Paris, organisé par le Social Média Club France, Silicon Sentier, la Fing, Regards citoyens et la Netscouade. Cette rencontre, sur le principe de la "non-conférence » propre au Barcamp, réunie plus de 120 personnes de tous horizons (recherche, industrie, milieu associatif, journalisme, militants politiques, étudiants ou tout simplement des citoyens intéressés) autour d’ateliers participatifs pour préfigurer5 l’Open Data en France. Le mouvement s’étend dès lors en Europe sous l’impulsion politique. La commission Européenne annonce en décembre 2011 son projet de création de portail Open Data (Data portal) qui sera ouvert le 24 décembre 2012. La France confirme sa volonté de transparence et de mise à disposition de données ouvertes le 5 décembre 2011 en créant la plateforme nationale « data.gouv.fr » qui compte aujourd’hui plus de 350 000 jeux de données publiques produites par les administrations d’Etat et ses établissements publics administratifs. Le 17 mai 2012 lors du premier Conseil des ministres, le Président de la République, François Hollande, fait signer à tous les membres du Gouvernement une charte de déontologie6 rappelant notamment que « le Gouvernement a un devoir de transparence. Il respecte scrupuleusement les dispositions garantissant l’accès des citoyens aux documents administratifs. Il mène une action déterminée pour la mise à disposition gratuite et commode sur internet d’un grand nombre de données publiques ». La mission Etalab instaurée par le conseil de la modernisation de l’action publique en 2011 est chargée de la mise en ligne des données sur data.gouv.fr. Elle est rattachée au Secrétariat général pour la modernisation de l’action publique (SGMAP) qui est placé sous l’autorité du Premier ministre par le décret du 31 octobre 20127. 3 Ordonnance n° 2005-650 du 6 juin 2005 [en ligne]. Disponible sur : http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000000629684&dateTexte=&categorieLien=id (consulté le 08.05.2013). 4 http://sunlightfoundation.com/policy/documents/ten-open-data-principles/ 5Open Data camp Paris. Restitution [en ligne]. Disponible sur : http://barcamp.org/w/page/5646585/opendatacampparis1_restitutions (consulté le 20.025.2013). 6Portail du Gouvernement. Compte rendu Conseil des Ministres du 17.05.2012 [en ligne]. Disponible sur : http://www.gouvernement.fr/premier-ministre/compte-rendu-du-conseil-des-ministres-traitement-des-membres-du- gouvernement-et-met (consulté le 08.05.2013). 7 Légifrance. Décret n° 2012-1198 du 30 octobre 2012 [en ligne]. Disponible sur : http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000026557680&dateTexte=&categorieLien=id (consulté le 05.05.2013).
  • 7. P a g e | 6 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 A l’occasion des comités interministériels pour la modernisation de l’action publique (CIMAP) du 18 décembre 2012 et du 2 avril 2013, le Gouvernement réaffirme ses engagements pour l’ouverture des données publiques sur le principe de gratuité de la réutilisation des données en concertation avec les collectivités, les délégataires de service public, la sphère sociale et les autorités administratives indépendantes. En février 2013, le Gouvernement français publie sa feuille de route8 du numérique qui confirme son engagement en faveur de la transparence de l’action publique et de l’ouverture des données publiques pour en faciliter la réutilisation. Elle prévoit un partenariat entre Etalab et les collectivités locales et tous les producteurs de données publiques afin notamment de créer un catalogue communs de données accessibles et gratuites sous un format standard et d’engager un travail d’harmonisation des pratiques (format de données, interopérabilité des systèmes d’information, politique commune de publication, etc.). Le mouvement Open Data en France semble à présent bien engagé et porté par une forte volonté politique du Gouvernement et des collectivités en faveur de la libre réutilisation des données publiques. Il est néanmoins encadré par des licences adaptées afin de clarifier la relation entre fournisseurs de données et réutilisateurs. 1.1.2 CADRE LEGAL DE LA REUTILISATION DES DONNEES En France, c’est l’Ordonnance n° 2005-6509 du 6 juin 2005 relative à la liberté d'accès aux documents administratifs et à la réutilisation des informations publiques qui définit le cadre légal. L’article 13 prévoit que « La réutilisation d'informations publiques comportant des données à caractère personnel est subordonnée au respect des dispositions de la loi du 6 janvier 1978 susvisée, relative à l'informatique, aux fichiers et aux libertés. Les informations publiques comportant des données à caractère personnel peuvent faire l'objet d'une réutilisation soit lorsque la personne intéressée y a consenti, soit si l'autorité détentrice est en mesure de les rendre anonymes ou, à défaut d'anonymisation, si une disposition législative ou réglementaire le permet » L’article 15 précise que « la réutilisation d'informations publiques peut donner lieu au versement de redevances » et que « lorsqu'elle est soumise au paiement d'une redevance, la réutilisation d'informations publiques donne lieu à la délivrance d'une licence. Les administrations qui élaborent ou détiennent des documents contenant des informations publiques pouvant être réutilisées dans les conditions prévues au présent article sont tenues de mettre préalablement des licences types, le cas échéant par voie électronique, à la disposition des personnes intéressées par la réutilisation de ces informations » (Art.16). 8 Etalab. Feuille de route du gouvernement en matière de partage des données publiques [en ligne]. Disponible sur : http://www.etalab.gouv.fr/article-la-feuille-de-route-du-gouvernement-en-matiere-d-ouverture-et-de-partage-des-donnees- publiques-115767801.html (consulté le 05.05.2013). 9 Légifrance. Ordonnance n° 2005-6509 du 6 juin 2005 [en ligne]. Disponible sur : http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000000629684&dateTexte=&categorieLien=id (consulté le 08.05.2013).
  • 8. P a g e | 7 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Lorsque les données sont mises à disposition pour une libre réutilisation, aucune licence n’est exigée mais afin de dissiper tout doute pour les réutilisateurs, des licences sur mesure ont été élaborées. En France, les fournisseurs de données publiques ont majoritairement choisi deux licences de réutilisation : la licence anglaise « ODbL » (Open Database license) établie par l' Open Knowledge Foundation, une association à but non lucratif britannique internationalement reconnue pour son engagement en faveur de la culture du libre et la « Licence Ouverte/Open Licence » élaborée par Etalab. La licence ODbL permet de copier, distribuer et utiliser les données ou une base de données. Tout réutilisateur peut ainsi créer des œuvres dérivées à partir des données ou d’une base de données placées sous cette licence à condition d’en mentionner la paternité. La spécificité de cette licence est la réciprocité ou le partage à l’identique. En effet, si une version de la base de données ou des créations sont adaptées de la base de données initiale, elles doivent aussi être placées sous licence ODbL. De plus, si la base de données créée est redistribuée, aucune mesure technique ne doit restreindre l'œuvre sauf à fournir également une version non restreinte. Cette obligation permet de ne pas privilégier les compagnies réutilisatrices qui ont davantage les moyens d’investir pour développer des applications ou des services ; contrainte à se plier à la licence ODbl, elles ont le devoir de réciprocité. La Licence Ouverte/Open licence quant à elle n’oblige pas le partage à l’identique, sa seule obligation est de citer la source des données. Simon Chignard, un acteur majeur de l’Open Data en France qui contribua notamment à l’ouverture et à l’animation du premier entrepôt de données publiques déployé par la Communauté d’Agglomération « Rennes Métropole » en 2010, distingue quatre classes10 de réutilisation des données publiques Open Data : la consultation par les citoyens utilisateurs finaux, la médiation où les données peuvent être, par exemple, mises en forme avec des data- visualisations pour les rendre facilement compréhensibles, la création de services par des développeurs destinés aux usagers et une réutilisation spécialisée qui concerne des données techniques ou dans des formats peu accessibles au grand public comme par exemple les données géographiques. Les mobilisations politiques et citoyennes ont initié le mouvement Open Data en France. Les enjeux liés à son développement font naitre de réels espoirs économiques corrélés de fortes attentes. 10 CHIGNARD S. Open Data, comprendre l’ouverture des données. Limoges: Fyp Editions, 2012 p. 64-69.
  • 9. P a g e | 8 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 1.1.3 DES ENJEUX ET DES ATTENTES Le principal enjeu de la libération de données publiques et de leur mise à disposition à des fins de réutilisation est économique. Les collectivités collectent et détiennent des données sur leurs territoires tels les aspects de la vie sociale, économique, culturelle ou environnementale qui sont considérées comme d’importantes ressources à valeur ajoutée pour l’ensemble des acteurs de l’Open Data. Ses retombées économiques sont encore difficilement quantifiables en France et en Europe bien que certaines études en prédisent un accroissement (l’étude MEPSIR11 réalisée en 2006 sur le marché potentiel de la réutilisation des données publiques les estimait à 27 milliards d’euros dans l’Union européenne des 25). Certain(e)s acteurs du mouvement en France jugent ces pronostics hasardeux et inadaptés et précisent que « si cette question pressante des retombées économiques reste un leitmotiv en France, on constate que c’est souvent à l’initiative de détenteurs de données qui ne comprennent pas toujours l’opportunité de l’ouverture ou du fait de l’interpellation de réutilisateurs de données qui peinent à rentabiliser leurs services »12. Au-delà de ces pronostics économiques, l’Open Data est un moyen d'engager une réelle coopération entre les administrations et les réutilisateurs de la société civile qui développent des services innovants et utiles à tous sur le principe du « bien commun ». Ces services innovants sont étroitement liés au développement des nouvelles technologies et particulièrement à celles de la téléphonie mobile, de la cartographie et de la visualisation de données (Data-visualisation). Selon l’Observatoire de la téléphonie mobile (ACERP), le nombre d’abonnements (carte SIM en service) en France était de 73,1 millions à la fin du quatrième trimestre 2012 ; les téléphones mobiles deviennent de véritables couteaux suisses numériques qui transforment les pratiques informationnelles des usagers. Associé aux nombreuses fonctionnalités proposées (géolocalisation par GPS par ex.), aux technologies mobiles (3G et 4G), à la réalité augmentée, au sans contact « Radio Frequency Identification » (RFID) et au « Near Field Communication » (NFC), le développement d’applications mobiles à partir de données publiques augure de prometteuses perspectives économiques. Certains experts prédisent même une « invasion13 » des applications mobiles et une progressive transformation de l’offre. Ce sont des applications dédiées à la culture, au tourisme, au handicap, à la mobilité en temps réel couplées à la géolocalisation, etc. qui viennent nourrir l’offre sur les différents sites de téléchargement d’applications mobiles. De la même façon et d’après une récente étude du cabinet Canalys14, la demande mondiale d’applications mobiles augmente en 2013 avec un volume de téléchargements en hausse de 11% entre le quatrième trimestre 2012 et le premier trimestre 2013 pour atteindre 13,4 milliards d'opérations, soit 150 millions par jour. Les données Open Data sont la matière première que les développeurs utilisent et intègrent pour créer ces applications de services citoyens. De nouveaux métiers émergeants tels que le Data journalisme sont également consommateurs de données publiques ouvertes qu’ils retraitent en Data- visualisations pour informer le public. 11MEPSIR. Measuring European Public Sector Information Resources [en ligne]. Disponible sur: http://ec.europa.eu/information_society/policy/psi/docs/pdfs/mepsir/executive_summary.pdf 12 « L’open Data est très mal estimé » Interview de Claire Gallon de l’association Libertic. Datapublica.fr [en ligne]. Disponible sur : http://www.data-publica.com/content/2012/11/lopen-data-est-tres-mal-estime-interview-de-claire-gallon-de-lassociation- libertic/ (consulté le 20.05.2013). 13 ANTHES G. L’invasion des applications mobiles. Documentalistes – Sciences de l’information, 2012, vol.49, N°3 pp48-50. 14 Les Echos. 150 millions d’applications téléchargées chaque jour [en ligne]. Disponible sur : http://www.lesechos.fr/entreprises- secteurs/tech-medias/actu/0202697557797-150-millions-d-applications-mobiles-telechargees-chaque-jour-557293.php (consulté le 05.05.2013).
  • 10. P a g e | 9 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Si ces réutilisateurs de données ouvertes sont principalement issus du secteur privé, les collectivités elles-mêmes peuvent réutiliser ces données identifiées et publiées dans les entrepôts de données Open Data. Elles donnent l’opportunité aux collectivités et aux institutions publiques de transformer les services publics et leurs relations avec leurs administrés et usagers en créant à leur tour des services informationnels innovants et « officiels »15. Comme le précise Simon Chignard, « Il y a pour les détenteurs de données un bénéfice direct : ils sont parfois eux- mêmes réutilisateurs de leurs propres données »16. L’enjeu économique, même mal estimé, laisse malgré tout espérer des retours sur investissements (ROI) chez les réutilisateurs de données à condition que soient mises à leur disposition des données pertinentes avec un fort potentiel de création, de qualité et en quantité qui sans cela serait un frein à leur réutilisation. Les jeux de données les plus convoités sont par exemple des données d’urbanisme et de description des territoires (cadastres, fonds de carte, données de géolocalisation qui constituent une ressource essentielle à la création de services à haute valeur ajoutée économique et sociale), des données de mesure tels que des statistiques d’accidentologie ou environnementales (pollution air/eau), ou de flux urbains, d’état civil, de fréquentation des structures publiques, d’évènements et de manifestations (agenda culture, tourisme), d’horaires des transports publics en temps réel, des données de description du patrimoine tels que des inventaires des œuvres et des collections des musées, du patrimoine naturel, des données touristiques, etc.. Pour toutes ces données, des critères de qualité et d’accessibilité sont espérés, tels que leur mise à disposition sous des formats réutilisables et non propriétaires (csv, json, kml, etc.), des données structurées dans un seul document (dataset) et réutilisables sous licence ouverte, régulièrement mises à jour et gratuites. De plus, l’extraction des données est facilitée lorsque les fournisseurs proposent des interfaces de programmation (API), évitant ainsi la manipulation et la recopie manuelle des données lors des mises à jour des applications développées. Mais les API sont encore peu proposées par les fournisseurs de données. Les experts du web de données (Linked Data) préconisent des efforts de description pour ces données (métadonnées, description RDF, RDFa, catalogue de données dans des formats standard, identifiants uniques, etc.) pour faciliter notamment l’accès aux développeurs. Ces attentes sont motivées par le potentiel que leur interopérabilité représenterait. Des données issues de différents entrepôts pourraient être ainsi croisées pour optimiser leur exploitation et créer des services étendus à l’ensemble du territoire français ; les applications ou les visualisations de données pourraient alors intégrer ces « données de seconde génération », qui seraient produites par les différentes collectivités17, sous un même format, avec la même qualité et le même niveau d’information. 15 Proxima Mobile. Les perspectives de services mobiles pour les collectivités [en ligne]. Disponible sur : http://www.proximamobile.fr/article/les-perspectives-des-services-mobiles-pour-les-collectivites-locales (consulté le 05.05.2013). 16 CHIGNARD S. Ou est le marché de l’Open data ? [en ligne]. Disponible sur : http://donneesouvertes.info/2012/03/12/ou-est-le- marche-de-lopen-data/ (consulté le 05.05.2013) 17 L’ouverture de données complexes entraînera des réutilisations plus complexes – Open Data en France: acteurs, projets et tendance. Paris : Serdalab, 2012, les études sectorielles, p.95.
  • 11. P a g e | 10 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Sur son blog18, « Fredrom », un développeur employé chez Microsoft depuis de nombreuses années, qui a à son actif une trentaine d'applications web et mobile à partir de données Open Data, argumente sur les besoins d’extension de la « couverture des données » et de qualité des jeux de données sur le territoire national : « En tant que développeur (même si mes applications sont toutes gratuites), ce qui m’intéresse c’est normalement de rentabiliser mon investissement. Autrement dit, vendre le plus possible mon application. Si je développe une application sur les parkings de Nantes, ce qui du reste a déjà été fait, je vais intéresser uniquement, ou presque, les Nantais, ce qui ne va pas me permettre de rentrer dans mes frais. Si maintenant, j’utilise la même application sur différentes villes, il est possible que je puisse la rentabiliser. Encore faut-il que les données publiées dans les différentes villes ne me demandent pas trop d’adaptation : problème de structure des données, de projection géographique, … (à quand une homogénéisation des structures de données au niveau national ?). Le must est d’avoir des données à portée internationale : des données sur le vin de bourgogne grâce auxquelles je pourrais vendre une application aux américains, chinois, japonais, … tous amateurs de vin français, des données touristiques sur les sites les plus visités, Il faut bien constater qu’aujourd’hui, très peu de jeux de données ont un potentiel international ». Si les principaux réutilisateurs sont majoritairement les créateurs de services et d’applications utiles à tous, les collectifs citoyens investissent le mouvement Open Data avec de fortes attentes de transparence. En France, des collectifs citoyens, aux exigences de transparence et démocratiques fortes se constituent pour former de véritables « repaires d’activistes de l’Open Data » tels « Regards citoyens », « Libertic » ou « Démocratie Ouverte ». Ils attendent des administrations et des élus une transparence de leurs actions afin de fournir aux citoyens des éléments d’information pour mieux comprendre et cerner leurs fonctionnements et ainsi renforcer leurs actions citoyennes. Les jeux de données qu’ils convoitent sont ceux de décisions publiques (budgets, dépenses, marchés publiques, appels d’offres, projets publics, etc.), de données électorales, de données statistiques, etc.. Pour ces collectifs, les données transparentes ne sont pas encore à la hauteur des promesses de l’Open Data en France et invitent les collectivités à poursuivre leurs efforts. Sans cela, le risque serait de « confiner le mouvement français à une logique de publication de données gadgets » ou à une impression de « tartufferie Open Data »19. Des associations professionnelles ou des Think Tanks (laboratoires d’idées) constitués d’acteurs économiques du numérique en France, privés ou publics, tels que le GFII, le GRICO, la Fing, le CNum, l’Oten, etc. s’emparent de l’Open Data pour former des groupes de travail et d’études qui apportent aux collectivités leurs éclairages et leurs préconisations pour leurs démarches d’ouverture de données. En France, la première initiative Open Data revient à la ville de Rennes et sa Communauté d’agglomérations Rennes Métropole qui ouvrent un entrepôt20 de données le 1er juin 2010. La Ville de Toulouse et la Communauté Urbaine de Toulouse Métropole font également partie des collectivités pionnières à s’engager dans ce mouvement. 18 Worldopendata. Open Data : les freins à la réutilisation des données [en ligne]. Disponible sur http://worldopendata.wordpress.com/2012/11/01/open-data-les-freins-a-la-reutilisation-des-donnees/ (consulté le 20.05.2013). 19Libertic. Couvrez ces données que l’on ne saurait voir [en ligne]. Disponible sur : http://libertic.wordpress.com/2012/11/03/couvrez-ces-donnees-que-lon-ne-saurait-voir/ (consulté le 20.05.2013). 20 Rennes Métropole en accès libre. [en ligne]. Disponible sur : http://www.data.rennes-metropole.fr/.
  • 12. P a g e | 11 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 1.2 LE PROJET OPEN DATA TOULOUSE METROPOLE 1.2.1 NAISSANCE DU PROJET Les élus et les responsables de la Direction Générale et de la Direction des Systèmes d'Information de la Ville et de la Communauté Urbaine étaient déjà sensibilisés au mouvement Open Data et aux premières initiatives de collectivités territoriales, mais c’est une lettre ouverte21 (visée par cinquante signataires : collectifs de citoyens, associations, entreprises et particuliers) envoyée le 4 avril 2011 à Pierre Cohen, Maire de la ville Toulouse et Président de la Communauté Urbaine du Grand Toulouse (Toulouse Métropole aujourd’hui), qui déclencha le projet : « Les citoyens et organisations signataires de cette lettre appellent la Communauté Urbaine du Grand Toulouse à mettre en œuvre l’ouverture de toutes leurs données publiques non-nominatives et ne relevant pas de la vie privée, de la sécurité ou du droit commercial. Pour garantir le succès d’une telle opération, nous attirons votre attention sur l’importance de rendre les données accessibles sous forme complète, primaire, opportune, exploitable, non- discriminatoire et non-propriétaire. Nous attirons votre attention sur l’importance du choix de la licence selon laquelle les données peuvent être libérées. Ce choix conditionne de façon majeure le succès d’une telle opération. L’emploi de la licence ODbL 1.0 est généralement encouragé de par le monde pour instaurer des droits et devoirs équilibrés pour toutes les parties. » Entre le 4 avril et le 22 Octobre 2011, date d’ouverture de l’entrepôt de données des deux collectivités, data.toulouse-metropole.fr22, plus de cent cinquante signataires rejoignirent ce mouvement. Une rencontre eut lieu très rapidement entre les futurs membres du comité de pilotage du projet et des membres d’Open Street Map23, de l’association Toulibre et quelques signataires pour faire un état des désidérata, des modalités techniques, des points juridiques et du choix de la licence de réutilisation des données. Cette concertation ne manque pas d’être soulignée, même deux ans après comme par exemple lors du Toulouse Hacker Space Factory où le vice-président de l’April (principale association française de promotion et de défense du logiciel libre) et membre très actif d’Open Street Map France retraça l’histoire du projet devant une assemblée de libristes et de militants pour l’e-démocratie. La volonté de coopération des deux collectivités avec la communauté du libre, très active sur le territoire, favorisa une réutilisation gratuite et sans entrave juridique, avec le choix de la licence ODbl. Le Conseil Municipal de Toulouse délibéra en faveur de l’ouverture de ses données publiques et de leurs réutilisations le 23 septembre 2011 suivi par le Conseil de Communauté le 29 septembre. Une note de service fût ensuite adressée aux Directeurs et Chefs des services de la Ville de Toulouse et de la Communauté Urbaine afin d’annoncer l’engagement des deux 21 OpendataToulouse. Lettre au Grand Toulouse [en ligne]. Disponible sur : http://opendata- toulouse.numahel.net/doku.php/lettre%20/ (consulté le 20.05.2013). 22 ToulouseMetropole.data [en ligne]. Disponible sur : http://data.toulouse-metropole.fr/. 23 Communes.fr. Quand Open Street Map séduit les institutionnels français [en ligne]. Disponible sur : http://blogfr.communes.com/openstreetmap-villes-france.html (consulté le 20.05.2013). Tweet lors de la conférence sur l’Open Data #THSF du 24.05.2013
  • 13. P a g e | 12 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 collectivités dans une politique de diffusion des données publiques. Le comité de pilotage pouvait dès lors concrétiser le projet. 1.2.2 LE COMITE DE PILOTAGE PROJET Dans les collectivités, les projets Open Data sont portés politiquement par les élus. Une étude de l’activité Open Data en France menée en 2012 par Serdalab24 auprès de soixante acteurs indique que les projets sont ensuite confiés pour 36 % aux Directions des Systèmes d’Information, pour 16% aux services en charge de l’innovation et du numérique, pour 11 % aux Directions Générales et aux Directions de la communication. Le projet de Toulouse Métropole est piloté par un responsable de chacune de ses Directions. Je participe aux différentes réunions du comité depuis le 06 Septembre 2012. La composition du Comité de pilotage Projet : Erwane Monthubert dirige le comité de pilotage. Elle est Conseillère Municipale Déléguée aux Technologies de l’Information et de la Communication (T.I.C). Elle est par ailleurs enseignant chercheur en Sciences de l'Information et de la Communication et enseigne à l’Université Toulouse II Le Mirail et à l’Institut des Etudes Politiques (IEP) de Toulouse. Sandrine Mathon est le Chef du projet Open Data. Juriste, elle est spécialiste du Droit de l'informatique. Attachée à la Direction juridique de la CNIL (Commission Nationale Informatique et Libertés) pendant huit ans, elle est aujourd’hui responsable du service Administration de la Direction des Systèmes d'Information de la Ville et de la Communauté Urbaine. Sandrine Mathon est régulièrement interviewée par des médias afin de présenter et promouvoir le projet. Jean-Noël Marrot est Chef de projet Numérique au sein de la Direction Générale Adjointe du Développement Economique de la Communauté Urbaine de Toulouse Métropole, autorité organisatrice du développement du numérique sur le territoire. Michael Combes, Directeur Logistique et Système d'Information en janvier 2008 est à présent Directeur Adjoint des Systèmes d'Information mutualisés de la ville de Toulouse et la Communauté Urbaine de Toulouse Métropole. Franck Menigou est responsable de la communication digitale pour la Ville de Toulouse et Toulouse Métropole. Les principaux médias qu’il gère sont Toulouse.fr, Toulouse-metropole.fr et les comptes sur les réseaux sociaux dont notamment Twitter et Facebook. Grâce à la volonté indéfectible de ses membres, le projet aboutit six mois après à l’ouverture de l’entrepôt officiellement annoncée le 22 octobre 2011 à l’occasion du Festival « La Novela », l’évènement annuel incontournable de la médiation scientifique à Toulouse. Le déploiement de l’entrepôt de données fût confié à la Direction des Systèmes d’information (DSI) et au pôle multimédia du service de la communication. 24 SerdaLAB. Open Data en France: acteurs, projets et tendances. Paris : Serdalab, 2012, les études sectorielles, 227 p.
  • 14. P a g e | 13 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 1.2.3 DATA.GRANDTOULOUSE.FR Dans son introduction25, Jean François Desnos, Secrétaire Exécutif de l’European University Information Système (EUNIS) et enseignant à l’Université Pierre Mendès France UPMF de Grenoble, Département Informatique et Mathématiques appliquées aux Sciences Sociales, définit un entrepôt de données comme « une collection de données thématiques, intégrées, non volatiles et historisées pour la prise de décision (Bill Inmon) ». Il poursuit en précisant que « l’infrastructure technique mise en œuvre est capable d’intégrer, d’organiser, de stocker et de coordonner de manière intelligible des données produites au sein du Système d’Information (issues des applications de production) ou importées depuis l’extérieur du SI (louées ou achetées) dans lesquelles les utilisateurs finaux puisent des informations pertinentes… ». L’entrepôt de données data.toulouse-metropole.fr a été déployé dans cet objectif. Il offre en plus, la mutualisation d’une architecture de publication de données à l’ensemble des trente-sept communes de la Métropole et de ses partenaires tout en leur garantissant la propriété et la gestion de leurs données. L’entrepôt hébergé par la société toulousaine Full Save26 a été développé avec le portail Open source Liferay27 compatible avec la plupart des systèmes d’exploitation, serveurs d’applications et bases de données qui intègre un outil de gestion de contenus (CMS) et des composants (portlet) collaboratifs. Son architecture se présente comme suit : Page d’Accueil : encart de présentation du site, moteur de recherche simplifié, portlet (module) “dernière données libérées”, encart de présentation du projet, encart de présentation du catalogue de données. Page « Les données » : encart de présentation du catalogue de données, moteur de recherche complet (avec filtres de tri : formats - catégories - villes), liste des dernières données ajoutées. Page « Le projet » : article de présentation du site et de la démarche du projet. Page « La licence » : présentation de la licence de réutilisation des données ODbl. Les modalités d’utilisation offertes aux internautes et aux contributeurs sont les suivantes : Fiche de données : Le jeu de données publié est décrit dans une fiche unique où sont affichés les champs descriptifs suivants : titre, description, villes concernées, mots clés, descripteurs Inspire, fréquence de mise à jour ou durée de validité, type de licence, propriétaire, catégorie principale, catégories secondaires, date de publication, date de la dernière mise à jour, format des fichiers et un champ interactif « vote » qui permet à l’utilisateur de noter le jeu de données et de le partager via les réseaux sociaux Twitter, Facebook et Google +. Chaque fiche, identifiée par une URL unique pour faciliter le référencement et le partage d’adresse, intègre un compteur de téléchargement. 25 Jean François Desnos. Entrepôt de données (data warehouse) : Introduction [en ligne]. Disponible sur http://imss-www.upmf- grenoble.fr/prevert/SpecialiteIHS/ED/IntroductionED.pdf (consulté le 20.05.2013). 26 Full Save. Hébergeur et opérateur télécom [en ligne]. Disponible sur : http://www.fullsave.com/ (consulté le 20.05.2013). 27 Liferay [en ligne]. Disponible sur : http://www.liferay.com/.
  • 15. P a g e | 14 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Téléchargement des données : Pour télécharger les données, l’utilisateur clique sur un lien qui déclenche l’ouverture d’une fenêtre relative aux conditions d’utilisation et de réutilisation. Le téléchargement commence dès que l’utilisateur accepte la licence. Les données brutes peuvent être publiées sous plusieurs formats (csv, mapinfo, kml kmz, pdf, jpg, xml). Le format propriétaire Mapinfo est issu du système d’information de service SIG, les formats PDF ou JPG sont exceptionnellement proposés pour des descriptifs de données ou des imageries telles que des posters. L’ensemble des différents fichiers d’un même jeu de données est regroupé dans une même archive compressée (ZIP). Administration des données : Le site est administrable via une interface « back office » sécurisée (authentification et protocole HTTPS). Deux profils distincts y accèdent, le contributeur (Editeur) qui alimente le portail de données et les administrateurs qui possèdent en plus les droits pour ouvrir les comptes contributeurs, agir sur l’architecture de l’entrepôt, rédiger et éditer du contenu rédactionnel. Création manuelle des fiches : Le créateur de fiches doit remplir les champs descriptifs obligatoires (o) ou facultatifs (f), répétables (r), en saisie libre (s.l.) suivants :  Titre de la donnée (o) (s.l.)  Description de la donnée (o) (s.l.)  Villes concernées (o) (r)  Mots clés ou folksonomie (f) (r) (s.l.)  Descripteurs Inspire (f)  Fréquence de mise à jour de la donnée ou durée de validité (o) (s.l.)  Type de licence (o)  Propriétaire de la donnée (o) (s.l.)  Catégorie principale (o)  Catégories secondaires (f)  Formats des fichiers (o) (r) La date de création de la donnée ainsi que celle de la dernière mise à jour du jeu de donnée sont enregistrées automatiquement. Création et mise à jour des données par lot : Même si la majorité des contributeurs publient leurs données de façon manuelle, un dispositif de versement par lots sera proposé ultérieurement. L’entrepôt de données d’une collectivité est la vitrine de son engagement en faveur de l’ouverture des données publiques. Certains proposent des outils de visualisation de données (data-visualisation) plus ou moins complexes comme par exemple l’entrepôt du département de la Saône et Loire28 ou celui du département de la Gironde et de la région Aquitaine « Datalocale.fr »29. Un choix qui n’a pas été fait pour data.toulouse-metropole.fr pour deux raisons : l’équipe projet à disposé de peu temps et de moyens (humains et financiers) pour déployer l’entrepôt ; de tels outils nécessitent de faire appel à des prestataires de services et le 28 CG Saone et Loire. Open Data 71 [en ligne]. Disponible sur http://www.opendata71.fr/ (consulté le 25.05.2013). 29 CG et Région Aquitaine. Datalocale [en ligne]. Disponible sur : http://www.datalocale.fr/ (consulté le 25.05.2013).
  • 16. P a g e | 15 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 budget alloué ne le permettait pas. De plus, l’équipe projet a, dès le début, priorisé l’intérêt des données pour les réutilisateurs, en veillant à leur qualité, leur format et leur pertinence. S’il est certain que les services des collectivités détiennent une multitude de données à fort potentiel de réutilisation, elles restent néanmoins retenues en raison de nombreux freins.
  • 17. P a g e | 16 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 2 LEVER LES FREINS A L’OUVERTURE DES DONNEES 2.1 ANALYSE DES FREINS Les Directions et les services sont à l’origine des freins à la libération des données qu’ils détiennent en raison des risques ou de craintes liés à leur réutilisation. Antoine Cheron est avocat associé au sein du Cabinet ACBM Avocat, Docteur en Droit de la Propriété Intellectuelle, avocat au barreau de Paris et de Bruxelles et chargé d’enseignement en Master de Droit. Dans sa description30 des risques, il évoque ceux liés à la transparence et à un « changement des rapports de force entre les citoyens et l'Etat quant aux décisions à prendre, et notamment quant à l'évaluation et la légitimité des politiques de service public et de leur efficacité en fonction des données chiffrées disponibles ». Selon les Directions et les services, les réutilisateurs ne disposent pas des compétences nécessaires pour évaluer la complexité de certaines données mise à disposition ; elles ne profiteraient pas aux citoyens mais « uniquement à des spécialistes, souvent financés par des entreprises puissantes ». Les craintes sont principalement liées à la vie privée et à la publication de données personnelles que peuvent détenir les services. La Commission Nationale de l'Informatique et des Libertés (CNIL) définit les données personnelles comme "toute information relative à une personne physique identifiée ou qui peut être identifiée, directement ou indirectement, par référence à un nom, un numéro d'identification ou à un ou plusieurs éléments qui lui sont propres (ces éléments sont notamment physiques, biométriques, physiologiques, psychiques, économiques, culturels ou sociaux) »31. Or, le respect du droit informatique et liberté est un dès principe de l’Open Data : tout jeu de données doit être anonymiser s’il contient ce type d’information. Un autre facteur de freins important est le risque de publier des données fausses ou peu fiables qui pourraient alors être révélatrices de dysfonctionnements et ainsi discréditer les collectivités. Ce problème de données à déjà été pointé par les réutilisateurs. Ce fût le cas lors du débat sur les perspectives et les enjeux de l’ouverture des données par les collectivités, organisé par le Parti Pirate Midi Pyrénées à Toulouse le 15 novembre 201132. Un intervenant avança que l’information publique était de qualité mais il fût immédiatement repris par un membre de la communauté Open Street Map qui s’exclama: « Les données publiques sont fausses ! ». L’intervenant concéda que « le système d’information était perfectible et qu’il y avait certainement une mauvaise remontée des informations ». L’enquête Serdalab33 révèle que 80% des producteurs de données procèdent à des opérations de nettoyage ou de « brutification » avant publication, ceci afin de rendre les jeux de données plus 30 JDN. Chronique de Antoine CHERON. L’Open Data : les risques potentiels de l’ouverture des données publiques. JDN [en ligne]. Disponible sur : http://www.journaldunet.com/ebusiness/expert/49672/l-open-data---les-risques-potentiels-de-l-ouverture-des- donnees-publiques.shtml (consulté le 25.05.2013). 31 CNIL. Canevas législatif « Informatique et Libertés ». Cnil.fr, 2006 [en ligne]. Disponible sur : http://www.cnil.fr/fileadmin/documents/approfondir/dossier/international/Francophonie/Canevas-legislatif.pdf (consulté le 25.05.2013). 32 Parti Pirate Midi Pyrénées. Compte rendu du débat sur le projet #OpenData du Grand Toulouse [en ligne]. Disponible sur : https://midi-pyrenees.partipirate.org/2011/11/compte-rendu-du-debat-sur-le-projet-opendata-du-grand-toulouse/ (consulté le 25.05.2013). 33 L’ouverture de données complexes entraînera des réutilisations plus complexes – Open Data en France: acteurs, projets et tendance. Paris : Serdalab, 2012, les études sectorielles, p.123.
  • 18. P a g e | 17 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 facilement exploitables par les réutilisateurs. Les agents des services peuvent ainsi y voir une contrainte et une surcharge de travail. D’autre part, les collectivités confient nombre de leurs missions de service public à des délégataires publics ou privés. Les données des délégataires de services publics (DSP) sont particulièrement convoitées pour leur fort potentiel de réutilisation notamment pour la création d’applications mobiles ; les contrats signés n’obligent pas les délégataires à fournir gratuitement leurs données et cela ne constitue plus un frein mais un réel verrou à leur mise à disposition. Certains responsables de collectivités engagées dans le mouvement Open Data travaillent d’ores et déjà sur de nouveaux modèles de contrats ou les renégocient afin de devenir propriétaires de ces données. Claire Gallon, responsable de l’association citoyenne Libertic, explique ainsi que « dans un contexte de forte pression fiscale et d’efforts demandés aux français, il paraît d’autant plus essentiel d’assurer la transparence de l’action publique et de garantir une action de qualité orientée vers l’usager. Une réflexion est donc indispensable pour définir le cadre de l’extension de l’ouverture et le délimiter. Si l’open data ne devait libérer que des données consensuelles, sans remettre en question certaines pratiques, nous passerions à côté des objectifs et opportunités de ce projet social. Or cela requière du volontarisme politique qui fait encore cruellement défaut. »34. En amont de toute stratégie pour développer une culture de la donnée ouverte au sein des services des deux collectivités, ma compréhension du mouvement Open Data, de ses enjeux et ses attentes est essentielle pour assurer les missions qui me sont confiées. Je complète ma connaissance du sujet grâce à mes recherches d’information avec une analyse du catalogue de données disponibles sur data.toulouse-metropole.fr et m’appuie sur l’enquête Serdalab35 pour mieux cerner l’activité Open Data en France au sein des collectivités. 2.2 MISSIONS, ANALYSE DE L’EXISTANT ET DES BESOINS Les missions principales qui me sont confiées sont celles :  d’administrer l’entrepôt data.toulouse-metropole.fr  d’identifier les données des services communautaires et municipaux  d’intensifier la publication de données  de créer et publier un catalogue de données  de surveiller la mise à jour des données à disposition sur l’entrepôt et leur qualité  d’accompagner les services communautaires et municipaux (structuration des jeux de données, détermination du niveau d’information, description des jeux de donnée, publication)  d’effectuer une veille sur les données publiées en France et sur l’actualité Open Data 34Libertic. Couvrez ces données que m’on de saurait voir [en ligne]. Disponible sur : http://libertic.wordpress.com/2012/11/03/couvrez-ces-donnees-que-lon-ne-saurait-voir/ (consulté le 25.05.2013). 35 SerdaLAB. Open Data en France: acteurs, projets et tendances. Paris : Serdalab, 2012, les études sectorielles, 227 p.
  • 19. P a g e | 18 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Dès mon arrivée, je m’empare du sujet de l’Open Data pour en cerner le principe, le cadre juridique et technique et ses enjeux et en parallèle j’analyse le type de données publiées sur l’entrepôt. A son ouverture le 22 octobre 2011, il était constitué de trente jeux de données qui avaient été identifiées pendant les six mois de montage du projet. Ces jeux étaient constitués de données géocodées (géolocalisation des crèches, des musées, des bibliothèques, des horodateurs, des sanisettes, des points récup’ verre, etc.), tous fournis par le Service d’Information Géographique (SIG) très facilement identifiables et publiables. Les publications suivantes se sont faites de manière opportuniste et sporadique. Trente jeux supplémentaires sont venus compléter le catalogue entre février et septembre 2012, date à laquelle j’intégrais l’équipe projet. Vingt jeux de données avaient été publiés par des services de la Mairie de Toulouse et de la Communauté Urbaine dont huit par le Service d’Information Géographique, dix par le service des Elections (découpages des circonscriptions de la Haute- Garonne, des cantons électoraux de la Haute-Garonne et les bureaux de vote 2012 sur la commune de Toulouse ainsi que des résultats d’élections cantonales, municipales, législatives et du parlement Européen). Le service des Finances publia les Budgets Primitifs 2012 de la Mairie de Toulouse et de la Communauté Urbaine le 23 mars 2012. Parmi ces trente jeux, quatre concernaient des données Transport et provenaient du nouveau partenaire du projet TISSEO SMTC (Syndicat Mixte Transports Commun de l’Agglomération de Toulouse représentant quatre vingt-quatre communes au total). TISSEO fournit notamment le 18 juin 2012 un accès aux données en temps réels du réseau de transport (métro, tramway, bus) via une API. La Poste, également partenaire publia le jeu de données des points de contact du réseau postal. La Mairie de Balma, après avoir délibéré le 20 novembre 2011 en faveur de l’ouverture de ses données, publiait quatre jeux de données. Cette analyse confirmait un réel besoin pour la Ville de Toulouse et la Communauté Urbaine d’intensifier la publication de jeux de données. En effet, un an après l’ouverture de l’entrepôt, seulement soixante au total avaient été libérés. Les rares services à avoir libéré leurs données étaient ceux de l’Information Géographique et des Elections. De plus, le catalogue de données manquait de données transparentes, brutes et statistiques. J’établis en complément un état de l'existant avec une approche marketing grâce à certains éléments communiqués par Sandrine Mathon et mes recherches d’information. Une analyse « SWOT »36 ((Strengths (forces), Weaknesses (faiblesses), Opportunities (Opportunités), Threats (menaces)) me permet de réaliser une étude interne et externe afin d’identifier les atouts et les faiblesses du projet. En mai 2013, j’affine l’analyse du catalogue de données par catégorie et par type en définissant des indicateurs sur leur réutilisation. Je réalise et publie sur l’entrepôt le catalogue des données au format DCAT37 (Data Catalog Vocabulary) recommandé par le W3C et par le groupe de travail du Collectif Open Data France38 constitué de chefs de projets de collectivités territoriales. L’objectif du choix de ce format est une interopérabilité future pour l’ensemble des catalogues de données des collectivités en France et de la plateforme gouvernementale data.gouv. 36 Cf. ANNEXE I 37 W3C. Data Catalog Vocabulary DCAT [en ligne]. Disponible sur http://www.w3.org/TR/vocab-dcat/ (consulté le 25.05.2013). 38 Open Data France. Le mouvement Open Data en France [en ligne]. Disponible sur : http://opendatafrance.net/
  • 20. P a g e | 19 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Je mets à jour le catalogue au fur et à mesure des nouvelles publications à partir d’un fichier d’export des données disponibles. Ce fichier me fournit également le nombre de téléchargement, une source d’analyse complémentaire pour mesurer les intérêts des réutilisateurs. Présentée sous la forme d’une Data-visualisation39 complétée par un tableau récapitulatif sur lequel je mets en évidence un taux d’intérêt des données par catégorie, de la même manière que l’on peut calculer un taux d’adéquation40 pour mesurer la performance des activités info- documentaires en calculant par exemple, le nombre de pages web consultées sur un site par rapport au nombre total de pages proposées. Cette analyse m’apporte des éléments de réflexion supplémentaires et concrets à soumettre à mes responsables et aux fournisseurs de données potentiels pour les convaincre de la nécessité d’ouvrir de nouvelles données. Le retour d’expérience de huit responsables de projets Open Data ouverts par des collectivités et de réutilisateurs privés, interrogés dans le cadre l’étude Serdalab, allait m’aider à identifier les typologies de données potentiellement publiables et effectivement publiées et me procurer des statistiques sur les plus réutilisées. Fig. 1 : Typologie des données produites et réutilisables selon les organismes publics interrogés Fig. 2 : Type de données publiées effectivement en ligne Fig. 3 : Typologie des jeux de données réutilisés Fig. 4 : Données les plus réutilisées (Source Serdalab Open Data en France: acteurs, projets et tendance. Nov. 2012) 39 Cf. ANNEXE II 40 SUTTER E. L’évaluation et les indicateurs de la performance des activités info-documentaires. ADBS édition, 2006, p.34.
  • 21. P a g e | 20 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 La « typologie des données produites et réutilisables selon les organismes publics interrogés » (fig. 1) me permet de cerner rapidement quels types de documents sont susceptibles d’être détenus par les deux collectivités, potentiellement publiables et constituant un fort intérêt pour les réutilisateurs. Les documents administratifs, les données géographiques, budgétaires et statistiques et des marchés publics sont les quatre plus cités. Le « type de données publiées effectivement en ligne» (fig. 2) sur les huit entrepôts de données concernés m’apporte des éléments de comparaison. Les données géolocalisées et de description du territoire disponibles sur data.toulouse-metropole.fr représentaient en septembre 2012 78 % du catalogue, une importante proportion qui confirme le manque de données d’autres types. L’enquête auprès des réutilisateurs privés me donne une typologie des jeux les plus réutilisés (fig.3) et comparée à la typologie des données produites et réutilisables, je remarque que les documents administratifs sont réutilisés à seulement 12% alors que les producteurs les classent en tête des données réutilisables soit à 54 % ; ce qui me confirme que les réutilisateurs des données sont majoritairement des développeurs créateurs d’applications ou de services cartographiques à partir des données géolocalisées, transport et culturelles. Les données citoyennes sont réutilisées dans une moindre mesure, peut-être parce qu’elles ne répondent pas encore aux attentes de transparence. Sandrine Mathon et Michael Combes ont, dès le lancement du projet, présenté la démarche Open Data, ses enjeux et l’engagement des deux collectivités dans le mouvement auprès des directeurs et chefs des services et des élus des communes de la Communauté Urbaine à l’occasion de rencontres et de réunions afin de les engager à libérer des données. Des référents Open Data ont été désignés au sein des services de la Mairie de Toulouse, communautaires et des communes de la Métropole, soit environ soixante-quinze personnes sensibilisées à l’ouverture des données, mais qui devaient encore être convaincues pour qu’elles incitent leurs services à les libérer. Je perçois rapidement le besoin d’informer régulièrement les référents Open Data sur le mouvement et les enjeux en complément des nombreuses démarches réalisées par mes responsables. Une enquête menée par le GRICO41 (réseaux de recherche sur les devenirs numériques) de juin à décembre 2012 auprès de 1300 agents de collectivités me fournit de nouvelles pistes stratégiques pour intensifier le mouvement en interne. L’enquête révèle en effet un besoin de communication et de concertation avec les agents. Elle met en lumière que l’Open Data est « emblématique du hiatus entre la médiatisation d’un sujet et l’absence d’implication des agents et des Directions dans leur ensemble ». Elle montre que si une part des agents a entendu parler du mouvement Open Data, ce sont principalement ceux issus de la catégorie A, des services des Systèmes d’Information et de la documentation et pour seulement vingt pour cent seulement d’entre eux. D’autre part, elle mentionne que l’Open Data ne s’accompagne pas d’initiatives qui inciteraient les agents à s’exprimer sur le sujet, à formuler des propositions et des idées. Si la concertation et la coopération s’engage avec la société civile comme je le démontre dans la première partie, les auteurs de l’enquête indiquent que « la stratégie est mise en adéquation avec les prescriptions gouvernementales et légales, qu’elle se situe dans un rapport mimétique (et « concurrentiel ») avec d’autres collectivités, répond aux réquisits et suggestions d’acteurs commerciaux et technologiques. Les usagers peuvent également participer au dispositif de prescription, 41 Maryse Carmes. GRICO. Les collectivités numériques vues par leurs agents. Synthèse des résultats, 2013
  • 22. P a g e | 21 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 notamment sur des sites internes et dédiés (quand ils sont créés), mais ces regards et les opportunités que peuvent identifier les agents dans les diverses interactions, demandes, problématiques, dont ils ont connaissance semblent, aujourd’hui, peu exploitées »42 . Si l’information est un « défi pour les collectivités »43, il devient le mien afin d’assurer la mission qui m’est confiée. Il me faut alors déterminer une stratégie et être force de proposition auprès des membres de l’équipe projet. Mon objectif est d’engager les agents des services de la Ville de Toulouse et de la Communauté Urbaine à faire de l’Open data « par défaut »44. En effet, cette expression d’Henri Verdier, l’actuel directeur de la mission Etalab, invite les services à « routiniser » l’ouverture des données publiques en intégrant l’Open Data dans leur travail, sans se soucier de la réutilisation qui en sera faite et en ne produisant plus les données «en vase clos». 2.3 DATA STRATEGIE 2.3.1 CELLULE DE VEILLE La veille, selon la norme française expérimentale XP X 50‐053 publiée par l’AFNOR en avril 1998 est « une activité continue et en grande partie itérative visant à une surveillance active de l’environnement technologique, commercial, etc. pour en anticiper les évolutions ». La norme précise que « la mise en place d’un système de veille dans un organisme vise à rendre ce système le plus autonome et le plus efficace possible dans son processus de surveillance de son environnement, ceci en maximisant ses capacités de collecte et de traitement de l’information utile pour ses décisions relevant de court, moyen ou long terme ». Afin de surveiller les publications des données sur les entrepôts ouverts par les différentes collectivités territoriales, je mets en place une surveillance de type « push » pour recevoir les informations de manière automatique que je pourrais ainsi consulter régulièrement. J’identifie très facilement les différents entrepôts ouverts ou en projet grâce à la carte interactive45 réalisée et mise à disposition par l’association Libertic. Un fichier en format csv téléchargeable me fournit les liens vers les entrepôts, ainsi qu’un certain nombre d’informations telles que la date de création, les contacts, etc.. Je consulte ensuite chaque site et repère que la majorité d’entre eux proposent des flux RSS (Really Simple Syndication) pour surveiller la publication de leurs données. Ne disposant pas d’outil de veille dédié, je me syndique à ces flux dans un premier temps avec l’outil de gestion de la messagerie Outlook dont dispose tous les agents de la collectivité. Je crée les flux pour les quelques entrepôts qui ne les proposent pas. J’étends ensuite ma veille avec une surveillance de sites web susceptibles de concerner l’Open Data et je cible les sources en définissant préalablement un plan de veille. L’information que je 42 Ibidem p.11. 43RIVE M. L’information, un défi pour les collectivités. Documentaliste - Science de l’information, 2012, vol.49 N°4, p.44-59. 44PC Impact. Interview d’Henri Verdier (Etalab) “faire de l’open data par défaut [en ligne]. Disponible sur : http://www.pcinpact.com/news/77442-interview-dhenri-verdier-etalab-faire-open-data-par-defaut.htm (consulté le 25.05.2013). 45 Libertic. Open Data Map [en ligne]. Disponible sur : http://www.opendata-map.org/
  • 23. P a g e | 22 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 souhaite collecter doit être utile46 et gratuite, « blanche » c'est-à-dire aisément et licitement accessible, provenant de sites institutionnels gouvernementaux et territoriaux, de sites d’organisations (associations, observatoires), de sites de groupements d’entreprises, de certains blogs d’experts ou de professionnels, de sites de presse en ligne, etc.. Je détermine ainsi mes axes principaux de surveillance qui constitueront mes dossiers de veille : Actualités des Collectivités Actualités Open Data Actualités juridique (licences, etc.) Actualités Applications Collectifs citoyens Dataviz Cartographie Data Journalisme Debug et suggestions Développeurs Données publiées Média locaux Numérique & innovation Projets O.D. en cours Twitter Veille quotidienne J’identifie et agrège des sources d’information d’actualité sur le mouvement Open Data, les collectivités territoriales avec des sources de références telles que la Gazette des communes, Localtis, le Portail territorial, etc.. Je surveille des sites ou des blogs de data journalistes, d’experts de la data-visualisation, de la cartographie, des applications mobiles car ces services concernent directement mon sujet, des sources d’acteurs du numérique et de l’innovation sur le territoire et de médias de la presse régionale (La Mêlée, La cantine, Objectif news, MID e-news, Carré d’info, La dépêche du Midi pour les fils d’actualité « Ville de Toulouse » uniquement, France 3 sud, etc.). Toutes ces sources fiables identifiées représentent environ cent flux d’information. Je détermine celles à surveiller en priorité dans le but d’optimiser et délimiter ma veille et double alors ces flux dans un dossier « Veille quotidienne » afin de les regrouper. Le dossier « Debug et suggestions » agrège de l’information provenant de forums déployés par certains entrepôts de données sur lesquels les contributeurs font part de problèmes rencontrés avec certaines données publiées ou bien de suggestions de publication. Cela me permet d’identifier les besoins des réutilisateurs et d’obtenir éventuellement des pistes pour de nouvelles publications. Je surveille en complément quelques sites de développeurs qui font référence. Twitter est un média incontournable pour tout veilleur et il est particulièrement utilisé par les acteurs de l’Open Data, mais Outlook ne me permet pas d’ajouter manuellement les flux RSS créés grâce à l’interface de programmation (API) Twitter. Je règle ce problème lorsque j’ouvre un compte Google Analytic afin de surveiller le trafic de l’entrepôt de données. En effet, ce compte me permet de transférer toute ma veille d’Outlook vers Google Reader grâce à un export puis un import de tous les flux RSS en format Opml. Je peux dès lors suivre les comptes Twitter qui font référence. En complément, je crée des alertes afin de repérer des contenus sur le web qui mentionneraient ou mettraient en avant le projet. J’exclu le très le célèbre outil « Google Alerte » qui semble beaucoup moins efficace qu’à ses débuts et j’opte pour un outil alternatif « Talkwalker47 ». 46 Selon la norme XP X 50‐053 publiée par l’AFNOR en Avril 1998, l’information utile est pertinente et directement exploitable par son destinataire. 47 TalwalkerAlerts. [en ligne] Disponible sur : http://www.talkwalker.com/fr/alerts.
  • 24. P a g e | 23 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Cette veille me permet de me tenir informée des données publiées en France sur l’évolution du mouvement Open Data et de diffuser certaines informations pertinentes et ciblées à mes responsables. Très rapidement, j’envisage d’étendre la communication de ces informations à l’ensemble des référents des services et des communes. 2.3.2 COMMUNICATION  Communication interne Lors de mes recherches, j’avais été alertée par le manque de médiation et de communication pour dynamiser le mouvement en interne au sein des collectivités. Par manque de disponibilité, les responsables du projet n’avaient pu assurer une communication interne régulière. Dès mon arrivée, j’expose à ma responsable, Sandrine Mathon, tout l’intérêt de créer une telle lettre d’information qui serait diffusée par courrier électronique à tous les référents des services et des communes. Selon l’ADBS48, une lettre d’information est une « publication périodique, sur tout support, de faible volume, diffusant en primeur des informations à des abonnés ou à un public préférentiel. ». Cette lettre mettrait alors régulièrement en avant l’engagement fort des deux collectivités pour intensifier le mouvement et la libération des données, en présentant les enjeux et les différentes étapes du projet en cours ou à venir. Un suivi des données libérées sur l’entrepôt, quelques données publiées sur d’autres entrepôts et des informations d’actualité sur le sujet seraient également présentés. La première réaction de ma responsable fût d’exprimer une inquiétude quant à l’alimentation de la lettre en contenu. Lors d’une réunion où elle me fait part de l’intérêt particulier des élus des communes de la Métropole qu’elle rencontre pour les données que leurs communes voisines publient sur l’entrepôt, nous décidons d’intégrer ces éléments incitatifs dans la lettre d’information. Je conviens dès lors de lui présenter une maquette de cette future lettre d’information que nous appellerons « Point d’Etape » (ci-contre). Courant juin 2012, un concours « Défi Numérique » avait été lancé afin de promouvoir la réutilisation des données de l’entrepôt ; les prix avaient été décernés publiquement le 18 octobre par le jury que j’assistais pour comptabiliser les évaluations des candidats. J’avais ensuite publié les résultats du concours49 sur le portail. Mon sujet pour le premier Point d’Etape était tout trouvé. 48 ADBS. Définition lettre d’information [en ligne]. Disponible sur : http://www.adbs.fr/lettre-d- (information- 17622.htm?RH=OUTILS_VOC (consulté le 05.06.2013). 49 ToulouseMetropole.data. Concours défi Numérique – Les résultats [en ligne]. Disponible sur :http://data.grandtoulouse.fr/concours-defi-numerique-resultats.
  • 25. P a g e | 24 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Les agents des services et des communes reçoivent de nombreux mails dans le cadre de leurs missions, pour retenir et les inciter à la lecture, le Point d’Etape devra être synthétique et plaisant. Je le compléterai par quelques liens pour les lecteurs qui souhaiteraient approfondir les sujets présentés. Je présente fin novembre le Point d’Etape #1 finalisé à Sandrine Mathon qui le valide immédiatement. Quatre-vingt personnes reçoivent depuis le Point d’Etape sur un rythme bimestriel. Il est diffusé par mail en format PDF à l’ensemble des référents, aux membres du comité de pilotage, au Directeur des Systèmes d’information et au Directeur Général Adjoint des services Organisation et Management qui regroupe la Direction des ressources humaines, la Direction de la communication interne, la Direction des Systèmes d’information et la Direction Analyses et Etudes de Gestion. Le premier numéro (Déc. - Janv.) présentait les résultats du concours, le deuxième (Fév. - Mars), la rencontre du 15 janvier entre Henri Verdier, le directeur d'Etalab et une délégation du collectif Open Data France constitué de chefs de projets Open Data dont Sandrine Mathon ; le troisième (avril – mai) lançait un appel à contribution et avait pour titre « Libérons nos données ! », le quatrième (Mai - Juin) annonce la reconduction du concours « Défi Numérique » et présente les enjeux de la libération de nouvelles données indispensables à sa réussite. Pour renforcer cet appel, nous convenons d’annoncer le concours via la « Une » intranet des deux collectivités qui compte quatre mille lecteurs potentiels. Deux cent cinquante sujets y sont traités par an. L’objectif est de persuader en plus des référents, les Directions et les agents de la Mairie de Toulouse et de la Communauté Urbaine de Toulouse Métropole qui ne reçoivent pas le Point d’Etape, à ouvrir leurs données. Le projet avait déjà fait l’objet de la « Une » intranet pour informer l’ensemble des agents de l’engagement acté des deux collectivités et pour annoncer l’ouverture du portail. Sandrine Mathon, avait alors été interviewée ; elle me propose stratégiquement de faire cette Une car une nouvelle recrue sur le projet pouvait interpeller et montrer que l’équipe se dotait d’une ressource supplémentaire pour développer le mouvement. Le sujet est complexe à appréhender de prime abord et reste très peu concret pour la plupart des agents. Je travaille en collaboration avec le journaliste interne qui m’interviewe afin de rendre le contenu accessible et complet tout en respectant la longueur standard de l’article prévue pour les Unes. L’interview reprend l’essentiel du Point d’Etape #350. Je conviens avec le journaliste d’en reprendre le titre « Libérons nos données » qui constitue un message fort. L’article est publié en Une51 de l’intranet le 15 et 16 Mai. En point d’orgue de l’article, j’indique une réunion que nous organisons le 16 mai, annoncée dans le Point d’Etape #3, avec des référents volontaires afin de recueillir leurs propositions de données dans un esprit de collaboration et de coproduction. 50 Cf. ANNEXE III 51 Cf. ANNEXE IV
  • 26. P a g e | 25 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 2.3.3 COLLABORATION ET COPRODUCTION Pour identifier les données potentiellement publiables et détenues par les services, je dispose de peu d’éléments puisqu’il n’existe pas de cartographie des bases de données pour l’ensemble des services ni des données qui y sont collectées et traitées. Pour les huit représentants des collectivités consultés lors de l’enquête Serdalab, la plus grande difficulté est l’identification des jeux de données à libérer et près de la moitié (47%) des personnes interrogées considèrent cette mission comme problématique52. Avec pour seuls documents de référence l’organigramme général des Directions et services mutualisés pour les deux collectivités, la liste de référents Open et un accès à l’intranet, je me rends compte de toute la difficulté de la mission qui m’est confiée. Avant de solliciter les référents Open Data par mail, j’effectue des recherches d’information que certaines Directions et services diffusent sur l’intranet, ce qui me permet de cibler mes demandes de données avec des éléments précis en adéquation avec leurs compétences. Grâce à ma veille, je leur communique en complément des exemples concrets de données identiques effectivement publiées par certaines collectivités et dans la mesure du possible des exemples de réutilisation. En même temps que je procède aux premières demandes par mail, je repère que l’entrepôt dispose d’un portlet (module) Wiki qui serait très facilement déployable.  Wiki Selon la définition Wikipédia, un wiki53 « est un site web dont les pages sont modifiables par les visiteurs afin de permettre l'écriture et l'illustration collaboratives des documents numériques qu'il contient ». De plus « un wiki d'entreprise (corporate wiki) désigne la mise en œuvre d'un wiki dans une entreprise, notamment afin de favoriser la gestion des connaissances. 54». J’estime qu’un tel outil collaboratif permettrait d’offrir un espace unique d’échange et de partage d’information à tous les fournisseurs potentiels de données du projet Open Data et d’engager de nouvelles relations avec eux. Je l’envisage dans un premier temps pour que les contributeurs y déposent des suggestions et des propositions de données qu’ils gèrent au quotidien. En réfléchissant sur la structure des pages et du contenu qu’il devrait proposer, je réalise que le partage de ma veille sur les données publiées par les collectivités représenterait un élément incitatif pour que les référents libèrent le même type de données. De plus, les trente-six communes de la Métropole pourraient également bénéficier de cette veille car elles ne disposent sans doute pas de moyens suffisants pour surveiller les publications afin de s’en inspirer. A l’issue de cette réflexion, je propose le déploiement du wiki aux membres du comité de pilotage projet avec ces arguments à l’appui. L’optimisation des ressources de l’entrepôt qui intègre ce module sans aucun coût financier supplémentaire constitue un atout supplémentaire. Le comité valide ma proposition le 8 février 2013. 52 SerdaLAB. Open Data en France: acteurs, projets et tendances. Paris : Serdalab, 2012, les études sectorielles, p.116. 53 Wikipedia. Wiki [en ligne]. Disponible sur : http://fr.wikipedia.org/wiki/Wiki (consulté le 05.06.2013). 54 Wikipedia. Wiki d’entreprise [en ligne]. Disponible sur : http://fr.wikipedia.org/wiki/Wiki_d'entreprise (consulté le 05.06.2013).
  • 27. P a g e | 26 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Je crée dès lors le wiki avec une page d’accueil, une page qui propose un guide de contribution, une troisième intitulée « Veille données vues ailleurs » qui se présente sous la forme d’un tableau avec les descriptions des jeux repérés lors de ma veille et un lien vers leur page sur les entrepôts qui les mettent à disposition ; enfin, je termine avec une page « Suggestions, propositions, boîte à idées ». Je paramètre ensuite les droits de contribution aux seuls contributeurs et administrateurs de l’entrepôt. Je mets régulièrement à jour la page Veille au fur et à mesure des différentes publications que je repère et sélectionne pour leur pertinence car certaines collectivités telles que les Conseils Généraux ou Régionaux disposent des compétentes différentes que celles des villes et des communes. J’annonce l’ouverture du Wiki dans le Point d’Etape numéro #355 où j’invite les référents à le découvrir et à y contribuer. Consciente qu’un tel outil collaboratif n’est pas encore utilisé dans les pratiques de travail des agents, il m’appartiendra de communiquer afin de faire changer les habitudes de partage d’information jusque là principalement par mail et de démontrer tous les avantages du Wiki, notamment celui de la capitalisation et de la mutualisation de ressources sur un espace unique et accessible à tous les fournisseurs potentiels de données sur le web depuis l’adresse sécurisée de connexion. De plus, la rencontre que nous organisons le 16 mai avec des référents volontaires allait me donner l’opportunité de faire connaitre le wiki et de démontrer une nouvelle fois son intérêt.  Hackathon interne Sur le même principe que le Hackathon qui est « un événement où des développeurs se réunissent pour faire de la programmation informatique collaborative sur plusieurs jours. Le terme est un mot-valise constitué de hack et marathon»56 , nous réunissons le 16 mai 2013 quelques référents Open Data volontaires issus de différents services. L’objectif de cette mobilisation interne est d’engager et d’animer un travail collectif pour donner corps à la démarche d’ouverture des données des deux collectivités et d’identifier de nouvelles données publiables. En complément des invitations, j’annonce la rencontre dans le Point d’Etape #457 consacré au Défi Numérique #2 dont j’avais publié le lancement officiel sur l’entrepôt le 23 avril 201358. La diffusion du Point d’Etape trois jours avant la rencontre et mon interview à la Une de l’intranet le 15 et 16 mai incitera quelques nouvelles personnes à y assister, dont deux référentes de communes de la Métropole. Cette réunion est un moyen supplémentaire de valoriser le wiki et de convaincre les référents de s’emparer de cet outil fédérateur et de partage. En effet je surveille le trafic sur les deux pages principales depuis leur création et le nombre de connexions, avec quarante visites au total après deux mois d’existence, reste assez faible ; l’annonce de la création du wiki dans le point d’étape 55 Cf ANNEXE III 56 Wikipédia. Hackathon [en ligne]. Disponible sur : http://fr.wikipedia.org/wiki/Hackathon (consulté le 17.05.2013). 57 Cf. ANNEXE V 58 Data.ToulouseMetropole. Défiez les données ouvertes par Toulouse Métropole [en ligne]. Disponible sur : http://data.toulouse- metropole.fr/concours-opendata.
  • 28. P a g e | 27 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 #359 au mois de mars avait incité quelques visiteurs mais depuis, la fréquentation était sporadique. Je prépare la présentation à vidéo projeter pour la rencontre avec une page dédiée au Wiki et suggère à Sandrine Mathon que nous intégrions sur la page « Suggestions, propositions, boite à idées » les données potentiellement publiables qui nous seraient proposées. Lors de la rencontre, comme convenu, je présente le Wiki aux agents présents et nous publions la vingtaine de données qu’ils nous proposent sur la page. L’après Hackaton me donne matière à une nouvelle communication interne. Je prévois à l’issue de la rencontre de présenter sur le Point d’Etape de juillet - août le compte rendu d’expérience de cette mobilisation collective à l’attention particulière des non participants. Il me donnera l’opportunité de rappeler tout l’enjeu de la mutualisation des ressources et des compétences.  Vote en ligne En 2012, le comité de projet organise le deuxième concours « Défi Numérique » dédié au développement de projets web et web mobiles avec une dotation pour chaque prix décerné. Ces concours sont l’occasion de promouvoir la réutilisation de données et d’encourager le développement de services numériques sur les territoires au service des usagers citoyens en faisant appel à la créativité des concepteurs. Ils permettent de révéler des talents que les collectivités s’engagent ensuite à accompagner dans leurs projets. Le 8 février 2013, le comité technique se réunit pour valider la reconduction du concours. Je propose d’ajouter avec une nouvelle catégorie « Data-visualisations » (Dataviz) qui pourront être interactives, animées ou fixes (infographies). J’avais rapidement perçu, grâce à ma veille, le potentiel d’évolution de la réutilisation des données que pouvaient apporter ces représentations visuelles ou graphiques qui rendent accessibles des données qui ne le seraient pas de prime abord. Des métiers émergents tels que le Data journalisme, en étroite collaboration avec ceux de la programmation et du graphisme, contribuent au développement de la Data-visualisation. Ces créations visuelles réutilisent principalement des données statistiques ou brutes et leur intégration dans le concours devrait inciter les services à libérer de nouvelles données afin que de tels projets puissent être présentés. J’oriente sciemment le Point d’Etape #3 et #4 et l’interview dans ce sens afin d’engager les Directions et les services à contribuer à la réussite du concours. J’explique notamment que le catalogue est constitué à 60 % de données géolocalisées et qu’il souffre d’un manque de données brutes et statistiques ; je souligne que le projet se trouve dans le « creux de la vague », un message fort susceptible d’être mobilisateur. Je propose ensuite de soumettre les Data-visualisations qui seraient proposées au vote des internautes en déployant une page spécifique sur l’entrepôt afin de propulser les projets. L’objectif est de favoriser le mode participatif et collaboratif des internautes tout en impliquant les agents des deux collectivités. Cette proposition est également validée par le comité. 59 Cf. ANNEXE III
  • 29. P a g e | 28 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 La diffusion du Point d’Etape et le déploiement du wiki devaient répondre aux besoins de communication interne dans l’objectif d’installer une dynamique de collaboration en partageant ma veille pour rassembler les référents Open Data autour d’un projet commun. J’élabore un plan d’actions 60 pour organiser et visualiser dans leur ensemble mes différentes taches en cours et à venir. Ces dispositifs seront réajustés en fonction de nouveaux besoins identifiés ; ils ne seront sans doute suivis d’effets visibles qu’à long terme mais une première évaluation me permet d’envisager leur évolution et de révéler tout l’intérêt de les maintenir. 60 Cf ANNEXE VI
  • 30. P a g e | 29 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 3 EVALUATION ET PERSPECTIVES D’EVOLUTION DES DISPOSITIFS  Dispositif de veille Le dispositif de veille que j’ai mis en place utilise un moyen simple mais très usité en pratique par les documentalistes et les veilleurs. Une syndication aux flux RSS avec une analyse et une sélection de sources fiables en amont, me permet via Google Reader d’effectuer une surveillance itérative. Tout dispositif de veille est évolutif et je l’affine ou le réajuste régulièrement. Google a annoncé la suppression du service Google Reader au mois de Juillet, il me faudra effectuer un transfert des flux vers un outil gratuit proposant les mêmes fonctionnalités. Des alertes me signalent certains articles qui seraient autrement passés inaperçus. A titre d’exemple, une alerte m’a permis d’identifier un article61 France 3 Midi Pyrénées dans lequel étaient repris les éléments du jeu de données sur les « Prénoms déclarés à l’Etat civil de la Ville de Toulouse » que j’avais décidé le service d’Etat civil de faire publier au mois d’avril. Les seules mentions « les données libérées cette semaine par la ville de Toulouse » dans l’article me confirmaient l’efficacité de mes alertes. Diffusé ensuite auprès de mes responsables, l’article fût ensuite propulsé sur la plateforme de curation « Scoop it » via la page thématique « e- administration »62 de Sandrine Mathon et sur les réseaux sociaux ; cette publication généra un trafic et une visibilité supplémentaire du projet non négligeable. L’activité de veille peut être particulièrement chronophage compte tenu des nombreux flux en surveillance et des sources potentielles car le sujet de l’Open Data suscite de plus en plus d’intérêts. Je me consacre particulièrement à une veille quotidienne des données publiées en France. Depuis septembre 2012, mes nombreuses lectures d’articles m’ont aidé à bien cerner le domaine de l’Open Data et affiner ma veille. Je peux ainsi y consacrer moins de temps grâce à ma sélection des sources d’information les plus pertinentes. L’optimisation de la veille d’actualité qui n’est pas ma mission principale me permet de dégager du temps pour l’identification de données.  Identification de données Ce n’est qu’en avril, au terme de sept mois d’alternance que j’ai pu réaliser mon travail d’indentification de données dans de bonnes conditions et intensifier mes sollicitations auprès des services détenteurs de données. Le rythme de l’alternance (trois jours en cours et deux en poste) a constitué un handicap certain car il m’a contrainte à interrompre des taches qu’il aurait été préférable de mener dans la continuité afin d’assurer un meilleur suivi de ces actions. Au-delà de ces contraintes d’emploi du temps, je découvrais le fonctionnement d’une collectivité, ses métiers, les compétences de ses agents et le peu d’éléments mis à ma disposition compliquait d’autant le recensement des données collectées et traitées par les deux collectivités. 61 Midi Pyrénées France 3. Et les prénoms les plus attribués en 2012 sont… [en ligne]. Disponible sur : http://midi- pyrenees.france3.fr/2013/04/11/et-les-prenoms-les-plus-attribues-en-2012-toulouse-sont-232557.html (consulté le 05.06.2013). 62Sccop it. E-administration [en ligne]. Disponible sur http://www.scoop.it/t/e-administration (consulté le 05.06.2013).
  • 31. P a g e | 30 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Ce travail est à présent bien engagé et de nombreux jeux sont en cours de libération. J’ai pu identifier courant mai, une quarantaine de données à forte valeur de réutilisation potentielle sur la plateforme géomatique du Service d’Information Géographique, de même que des données détenues par les services Etat civil, Culture et Lecture publique, Droit des places et stationnements, Mobilité Gestion Réseaux, Cycle de l'eau, Prospective et stratégie territoriale des deux collectivités. Certains services sont plus réactifs que d’autres, obtenir un jeu de données peut prendre des mois malgré mes relances. Pour solliciter les référents qui sont pour moi de précieuses ressources et répondre à leur questionnement sur la valeur que peuvent avoir leurs données, je leur démontre dans la mesure du possible par des exemples concrets, le fort potentiel de réutilisation qu’elles représentent. Je dois ensuite les relancer régulièrement ; l’Open Data est une démarche volontariste mais qui implique une charge de travail supplémentaire. Ces référents ne gèrent pas toutes les données que j’identifie dans leurs services, ils doivent à leur tour solliciter les agents concernés et obtenir l’accord de publication de leurs supérieurs hiérarchiques. Certaines données dites « sensibles » nécessitent l’aval de Directeur des services, de Directeur Général des services ou d’élus. C’est là que la sémantique du terme « libération » des donnés prend tout son sens car ces données posent questions. Ce problème n’est pas le propre de l’Open Data en France, le plus emblématique entrepôt Open Data ouvert sous l’impulsion politique de Barak Obama en 2009 aux Etats Unis, data.gov, souffrait d’un manque de telles données63 deux ans après son ouverture. D’autres services restent à convaincre et un travail de persuasion doit s’engager auprès des Délégations de Services Publics (DSP), comme par exemple celles qui gèrent les parcs de stationnement pour la Ville de Toulouse. Leurs données en temps réel des places de parking disponibles constitueraient une très forte part de réutilisation. J’ai pu par ailleurs prendre contact avec des partenaires extérieurs potentiels auxquels je fournirai des éléments tels que des synthèses documentaires qui leur permettront de saisir l’importance du mouvement en France et ses nombreux enjeux afin qu’ils s’engagent dans ce projet commun. A l’horizon 2017, la publication de données Open Data pourrait devenir une obligation pour les communes de trois mille cinq cent habitants et plus comme le prévoit le projet de Loi de décentralisation64 récemment présenté par le gouvernement au Conseil d'Etat et au Senat. La libération des données s’en trouvera sans doute ainsi facilitée mais d’ici là, le développement du mouvement Open Data doit s’accompagner de dispositifs facilitant une meilleure connaissance du sujet afin d’inciter les Directions et les services des collectivités à ouvrir de leurs données.  Communication Le premier Point d’Etape est diffusé en décembre 2012, soit un trimestre après mon arrivée au sein du groupe projet. A raison de dix jours de travail effectif par mois, j’ai été très réactive car cette communication interne me semblait essentielle à mettre en place rapidement. 63 RLSN. Data.gov, un premier bilan en demi teinte [en ligne]. Disponible sur : http://www.rslnmag.fr/post/2011/2/22/data- gov_un-premier-bilan-en-demi-teinte.aspx (consulté le 05.06.2013). 64 La gazette des communes. L’ouverture des données publiques devient une obligation pour les collectivités territoriales [en ligne]. Disponible sur : http://www.lagazettedescommunes.com/157970/l%E2%80%99ouverture-des-donnees-publiques-devient-une- obligation-pour-les-collectivites-locales/ (consulté le 05.06.2013).
  • 32. P a g e | 31 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 Je ne dispose actuellement d’aucun moyen pour évaluer son impact ni le nombre des lecteurs effectifs compte tenu de sa diffusion par courriers électroniques au format PDF. A ce jour, j’ai réalisé quatre Points d’Etapes avec une grande latitude sur le choix de leur contenu, toujours validés par mes deux responsables avant leur diffusion. Il sera sans doute pertinent de réaliser une enquête de satisfaction selon une démarche d’évaluation qualitative et de le réajuster en fonction des appréciations et des besoins qu’elle révèlerait. J’envisage de le faire évoluer en proposant un panorama d’articles pertinents repérés lors de ma veille, la condensation fait partie des savoir-faire des documentalistes ; c’est un produit documentaire qui permettra aux lecteurs d’approfondir certains sujets s’ils le souhaitent. La diffusion du Point d’Etape depuis le mois de décembre et la Une de l’intranet au mois de mai facilitent mes sollicitations auprès des référents; ils sont dorénavant régulièrement informés des étapes clés du projet et de ses enjeux. L’article à la Une de l’intranet n’a été vu que par un quart des agents ayant accès à l’intranet mais il aura sans doute permis de démontrer à ces lecteurs l’engagement de la collectivité. De plus, il a certainement donné une meilleure visibilité à mon travail et une légitimité à mes demandes auprès de certains référents. La liste des abonnées du Point d’Etape s’élargie à chaque nouveau contact, mais convaincue qu’il doit toucher rapidement plus de lecteurs, j’engagerai courant juin, avec l’aval de mes responsables, un travail avec le service de la communication interne pour mettre en place sa plus large diffusion.  Wiki A ce jour, la fréquentation du Wiki est faible, mais cet outil collaboratif, bien connu des militants du libre et de plus en plus répandu au sein des organisations, reste à valoriser afin que les référents s’en emparent. C’est un travail sur le long terme qu’il faudra sans doute mener et notamment démontrer son intérêt avec des utilisations concrètes, comme à l’occasion du Hackathon interne du 16 mai. L’avantage d’une veille partagée a été bien perçu par les deux responsables des communes présentes ce jour là. Je prévois de lancer un appel à la coproduction de jeux de données dans un futur Point d’Etape. Je pense en effet qu’il serait pertinent que certains jeux de données soient coproduits sur le wiki par certains services et les communes de la Métropole, par exemple celui des campings municipaux qui offriraient des informations pratiques, descriptives et géolocalisées. Une telle coproduction permettrait de rassembler toutes ces informations généralement uniques par communes en un seul jeu de données. La réussite d’une telle démarche démontrerait tout l’intérêt de la mutualisation des ressources qu’offre cet espace collaboratif et fédérerait ainsi les référents sur des thématiques communes. Toutes ces actions s’intègrent dans une stratégie de développement d’une culture de la donnée ouverte au sein des services municipaux et communautaires que je mène en parallèle de mon travail d’identification des données et de sollicitations des référents.
  • 33. P a g e | 32 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 CONCLUSION La promotion du mouvement Open Data est maintenant engagée en interne. C’est en menant de telles actions de communication et de médiation au sein des services des deux collectivités que la communauté des fournisseurs de données potentiels pourra se fédérer et contribuer à son développement. Les bénéfices de la mise en place des dispositifs ne sont pas quantifiables aujourd’hui, mais la poursuite de ce travail engagé favorisa sans doute l’adhésion progressive des référents au projet qui est porté par une forte volonté politique de coopération avec la communauté des réutilisateurs. L’enrichissement du catalogue de données de l’entrepôt devrait prochainement répondre à leurs attentes. Seules cinq communes de la Communauté Urbaine de Toulouse Métropole ont à ce jour délibéré en faveur de l’ouverture de leurs données. Cette faible implication peut s’expliquer par un manque de moyen humain et par une méconnaissance de l’intérêt que représentent leurs données pour les réutilisateurs. Il reste à les convaincre et les accompagner dans cette démarche. Les documentalistes possèdent des compétences multiples qui leur permettent d’assurer de telles missions. Ils connaissent les divers formats de fichiers et d’échanges, l’importance de la description des données (métadonnées, notices descriptives au format TXT dans chaque jeu de données, etc.) qui sont au cœur des enjeux de l’Open Data et des données de seconde génération qui seront sans doute proposées à l’avenir sur les entrepôts dans les pas de l’Open Archive Initiative (OAI) initiée dans les années 2000. Ces connaissances ont facilité mes échanges avec des services qui travaillent avec des formats spécifiques tels que le Service d’Information Géographique, l’un des principaux fournisseurs de données du projet que je sollicite régulièrement. Les documentalistes savent rapidement s’emparer de sujets ; la veille, la rédaction de contenu et la diffusion d’information sont des savoir-faire qui leur confèrent la polyvalence pour seconder des équipes projets de collectivités territoriales. Forte d’une expérience de plus de vingt ans dans le monde professionnel, je me suis intégrée très rapidement à l’équipe projet et j’assure ma mission avec une grande autonomie fortement appréciée de mes responsables.
  • 34. P a g e | 33 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 BIBLIOGRAPHIE ET SITOGRAPHIE Bibliographie SerdaLAB. Open Data en France: acteurs, projets et tendances. Paris : Serdalab, 2012, les études sectorielles, 227 p. Chignard S. Open Data comprendre l’ouverture des données publiques. Limoges : FYP éditions, 2012, 191 p. SUTTER Eric. L’évaluation et les indicateurs de la performance des activités info-documentaires. Paris : éd. ADBS, 2006, 60 p. Sitographie CADA. Commission d’accès aux documents administratifs [en ligne]. Disponible sur : http://www.cada.fr/. CNNum. Conseil National du Numérique [en ligne]. Disponible sur : http://www.cnnumerique.fr/. Data Publica. Petit lexique Open Data [en ligne]. Disponible sur : http://www.data- publica.com/content/lexique-de-lopen-data/. Data.gouv.fr. Innovation, transparence, ouverture [en ligne]. Disponible sur : http://www.data.gouv.fr/. Data.gov. Empowering People [en ligne]. Disponible sur: http://www.data.gov/. Démocratie Ouverte [en ligne]. Disponible sur : http://democratieouverte.org/. Etalab. Service du Premier Ministre chargé de l’ouverture des données publiques [en ligne]. Disponible sur : http://www.etalab.gouv.fr/. Fing. Fondation Internet Nouvelle Génération [en ligne]. Disponible sur : http://fing.org/. GFII. Groupement français de l’Industrie de l’Information [en ligne]. Disponible sur : http://www.gfii.fr/fr/. GRICO. Réseau de Recherche sur les Devenirs Numériques [en ligne]. Disponible sur: http://www.grico.fr/. Légifrance. Le service public de la diffusion du droit [en ligne]. Disponible sur : http://www.legifrance.gouv.fr/. Libertic [en ligne]. Disponible sur : http://libertic.wordpress.com/libertic/. Open Knowledge Foundation. OKF France [en ligne]. Disponible sur : http://fr.okfn.org/. Regards citoyens. Diffusion et partage de l’information politique [en ligne]. Disponible sur : http://www.regardscitoyens.org/.
  • 35. P a g e | 34 Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013 ANNEXES Analyse SWOT .............................................................................................................................................I Infographie et analyse du catalogue au 20 mai ............................................................................II Point d’étape #3.......................................................................................................................................III Article en Une de l’intranet le 15 et 16 mai..................................................................................IV Point d’étape #4.........................................................................................................................................V Plan d’actions............................................................................................................................................VI
  • 36. Opportunités/ForcesMenaces/Faiblesses AnalyseInterne Engagementpolitiquefort(MairePrésidentetconseillèremunicipaledéléguéeen chargedudvlptdesT.I.C,équipeprojet) Volontédecoopérationetdecollaborationaveclesréutilisateursdedonnées Imaged’unterritoireinnovant(villesintelligentes,etc.) Politiquedegratuitédesdonnéespourlesréutilisateurs+choixdelaLicenceODbL= partageetréciprocité Entrepôtmutualisé(évolutif:modules)pourles37communesdelaMétropole,pasde coûtsfinanciersàsupporterparlescommunes RéférentsOpenDatadésignésauseindesservices Donnéesexistantes,pasdecoûtsfinancierspourles2collectivitésoulesfournisseurs dedonnéespartenaires(saufdanslecasd’accèsfacilitéavecdesAPI) Donnéesgéolocaliséesàfortevaleurpourlacréationd’applicationdétenuesparleSIG ServiceSIGsensibilisé++àl’OpenData,leserviceproducteur++dedonnées ConcoursDéfiNumérique,dotationsetaccompagnementprojetsdesgagnants, promotiondelaréutilisationdesdonnées++ Faiblenombredejeuxdedonnées(60jeux)etpeudedonnéesbrutesetstatistiques,tranparentes DonnéesSIGàfortevaleurentermedecréationd’applicationdeservicenonidentifiées Visibilitéfaibledesdonnéespubliables,pasdecartographiedesmétiersetcompétences,desBDDetdes données Cloisonnemententrelesdifférentsmétiersetservices Freins++desDirectionsetServicespourlibérerlesdonnées(risquedemauvaisesréutilisationsou donnéessensibles) FreinsServices(craintessurchargedetravailet/oud’êtrejugésurlaqualitédesdonnées) MéconnaissancedusujetOpenDataetdesenjeux(Agentstoutescatégories) Hiatusentrelamédiatisationd’unsujetetl’absenced’implicationdesagents.Pasdecommunication internesurlesétapesduprojetetenjeux/animationssporadiques,manquederessourceshumaineset financières DesdonnéesàfortevaleurderéutilisationdifficilesàlibérercardétenuesparlesDSP,propriétaires exclusifsdesdonnéescollectées. AnalyseExterne Législationpropiceàlaréutilisationdesdonnées Ungouvernementengagédansl’ouverturedesdonnéesetdansledéveloppement d’unee-gouvernance,transparence++(data.gouv) DynamiqueOpenData++(CollectifOpenDataFrance:partenariatEtalab,groupesde travail) Volontédecoopérationdelasociétécivile Communautédulibre(dvlpt+cartographie)activesurleterritoire(OSM,Toulibre) GénérationYquimaitriselesnouvellestechnologies,fortementengagéepour développerdesservicesinnovants,principedu«biencommun».Dvlptdeservices utilesàtousàfaiblescoûts(Crowdsourcing) PépinièresdeStartUpsecteurdunumérique++surleterritoire MouvementOpenDatatrèsdéveloppé++outreatlantiqueetdanscertainsvoisinsd’Europe ProjetdeloiLebranchu:obligationdelibérerdesdonnéesOpenDatacommunesde+de3500habitantsà l’horizon2017 DescollectivitésengagéesenFrancequilibèrentplusrégulièrementleursdonnées Raresdélibérationsdescommunesenfaveurdel’ouverturededonnéesdeToulouseMétropole Mutationetévolutiondesusagesdunumériques(téléphoniemobile++,tablettes,téléchargements d’application,réalitéaugmentée EvolutionduWebversleWebdedonnées(LinkedData):RDF,attentedescriptiondesdonnées(fichier TXT+métadonnées),cataloguesDCATW3C,attentesdonnéesdequalité,enquantitéetaveclemême niveaud’information Décalageentrel’offrededonnéesetlademande.Lescollectifscitoyenssontenattentededonnées transparentesetd’untravailenconcertationpourlibérerdesdonnées Retourssurinvestissements(ROI)espérésparlesréutilisateursdedonnées ANNEXEI
  • 37. Etat et analyse du catalogue au 20.05.2013 Le catalogue de données s’est enrichi de 40 jeux de données depuis le 22.11.2011. Il est constitué à 73% de données de description du territoire (géolocalisation, imagerie, topographie) réparties sur l’ensemble des catégories et 7 % de données de la catégorie Transport libérées par Tisséo-SMTC (Syndicat mixte des transports en commun de Toulouse et de sa région). Ces données représentent 80 % du catalogue. Les 20 % restants correspondent aux 13 jeux de données de la catégorie Citoyenneté (24 jeux au total) tels que les budgets (4 jeux), les résultats d’élections (8 jeux) et la liste des prénoms déclarés à l’Etat civil de Toulouse (1 jeu). Tableau Taux d’intérêt (Calcul : nombre total de téléchargements/nombre de jeux disponibles par catégorie) Catégorie Nb. Jeux Nb. Téléchargements % Téléchargements Taux d'intérêt Associations 1 256 0,58% 256,00 Citoyenneté 24 2 723 6,20% 113,46 Culture 5 852 1,94% 170,40 Enfance 6 892 2,03% 148,67 Environnement 3 1 483 3,38% 494,33 Imagerie 4 7 489 17,06% 1 872,25 Patrimoine 2 637 1,45% 318,50 Services 2 343 0,78% 171,50 Sport 2 341 0,78% 170,50 Topographie 1 641 1,46% 641,00 Transport 14 25 881 58,97% 1 848,64 Urbanisme 6 2 353 5,36% 392,17 Total général 70 43 891 100,00% 627,01 A noter que les données Transport (7 % du catalogue) représentent 59% du total des téléchargements, les principaux réutilisateurs sont des développeurs d’applications informationnelles en temps réels. Remarque : le nombre de jeux de données ne conditionne pas leur intérêt. 14 jeux de données de la catégorie Transport suscitent un taux d’intérêt de 1848 alors que 24 jeux de données Citoyenneté remporte un taux faible de 113. ANNEXE II
  • 38. POINT D'ÉTAPE NUMÉRO 3 MARS/AVRIL 2013 OUVERTURE DES DONNÉES LES DÉLIBERATIONS Mairie de Balma >> le 20/11/2011 Mairie de Gratentour >> le 14/12/2011 Mairie de Colomiers >> le 03/02/2012 Mairie de Seilh >> le 12/09/2012 Mairie de Saint Jory >> le 11/10/2012 Mairie de Aucamville >> le 20/12/2012 LES DERNIÈRES DONNÉES PUBLIÉES Mairie de Balma: Installations sportives Écoles Petite enfance et jeunesse Équipements culturels Mairie de Seilh: Écoles Mairie de Toulouse: Budget primitif 2013 Album plan de ville CUTM: Budget primitif 2013 Poster image aérienne Orthophotoplan 2011 Orthophotoplan 2007 QUELQUES DONNÉES VUES AILLEURS Manifestations sportives Activités sportives (stat) Stationnement GIG GIC Stations d'autopartage Effectifs Ets scolaires Distributeurs propreté Marchés publics (MAPA) Electeurs inscrits (stat) Retrouvez les meilleurs articles d'actualité sur l'Open Data sélectionnés par Sandrine Mathon : http://www.scoop.it/t/e-administration La feuille de route du Numérique vient d'être publiée par le gouverne- ment et confirme l'engagement de l'Etat en faveur de l'ouverture des données publiques. Plusieurs chantiers vont s'ouvrir pro- chainement avec les 20 collectivités actuellement investies. La commu- nauté d'agglomération Pau-Pyré- nées, Angers Loire Métropole et la Ville d'Angers et le département des Hauts de Seine viennent compléter aujourd'hui la liste des entrepôts ou- verts; la Corse vient d'annoncer son projet d'ouverture. A noter tout parti- culièrement le chantier sur le format, la description et l'interopérabilité des données sur lequel nous travaillions déjà avec le collectif ODF dans le cadre du projet Linked Data (données reliées) qui devrait être lancé pro- chainement. Egalement, le chantier sur la mise en place d'une stratégie commune de publication de jeux de données sur les thématiques du transport et de la mobilité durable, de l'environnement, des finances pu- bliques, du logement, des prestations sociales, de l'emploi, de l'éducation et de la Santé. La récente enquête de Serdalab (le laboratoire d'études, de veille et de prospective du groupe Serda) auprès des administrations publiques in- vesties dans l'Open Data vient conforter notre démarche et motiver notre mobilisation pour libérer de nouvelles données. Si 61% des producteurs de données publiques interrogés estiment le bilan positif, ils précisent qu"Identifier les jeux de données à libérer constitue une tâche difficile". C'est le constat que nous faisons également car un an et demi après l'ouverture de l'entrepôt de Toulouse Métropole, nous nous trouvons dans le "creux de la vague" ! Libérons nos données ! LIRE LA FEUILLE DE ROUTE SUR LE SITE ETALAB Lire la suite en page 2...
  • 39. POINT D'ÉTAPE NUMÉRO 3 MARS/AVRIL 2013 Retrouvez les meilleurs articles d'actualité sur l'Open Data sélectionnés par Sandrine Mathon : http://www.scoop.it/t/e-administration Nous nous heurtons au cloisonne- ment de nos différents métiers qui in fine invisibilise ces données tant convoitées et à une pratique de libé- ration des données réalisée jusqu’à présent uniquement grâce à des op- portunités sporadiques; peut-être aussi à une certaine timidité à publier ! Pour rependre l'expression de Henri Verdier, patron d'Etalab, “il faudrait faire de l'Open Data par défaut” et li- bérer ainsi les données de manière plus systématique. Les données géographiques consti- tuent aujourd'hui 60% de notre cata- logue qui souffre du manque de données transparentes telles que des statistiques ou des données brutes (d'autres natures) et susceptibles d'interesser différents publics (ci- toyens, datajournalistes, dévelop- peurs, designer de l'information, infographistes, etc...). Nous sollicitons aujourd'hui votre ac- tive collaboration pour enrichir le ca- talogue avec de nouvelles données et nous aider à développer une véri- table culture de la donnée sur notre territoire afin qu'il se hisse à nouveau parmi les plus actifs de l'Open Data. Cet appel à contribution est d'autant plus fort que nous organisons en oc- tobre un nouveau concours Open Data (qui fera l'objet du prochain point d'étape) dans le cadre de la No- vela. Pour qu'il soit à nouveau une réussite, le catalogue de données doit offrir aux participants toute la matière nécessaire pour leurs futures créations . Nous venons de déployer un Wiki sur le portail, exclusivement réservé aux contributeurs et fournisseurs de don- nées. Nous y partagerons notre veille sur les données repérées sur les dif- férents entrepôts en France afin que les services susceptibles de les dé- tenir puissent les mettre en ligne à leur tour sur le portail. Une page spécifique vous permettra de dépo- ser toutes vos idées et suggestions de publication afin d'élaborer les pro- chains jeux de données issus de nos nombreux champs de compétence. Sur chaque page, vous pourrez lais- ser des commentaires et/ou y ré- pondre. De plus, des documents de référence y seront téléchargeables sur une page dédiée. Cet espace collaboratif est à votre entière dispo- sition, sa structure évoluera au fil du temps et nous pourrons créer de nouvelles pages en adéquation avec vos besoins. Nous vous donnons rendez-vous sur le wiki, en vous connectant sur le portail, comme habituellement, et en le selectionnant depuis le panneau de configuration. Le guide d’utilisa- tion figure sur la page d’accueil (Front Page). Libérons nos données ! Un exemple de réutilisation de données réalisé en 2012 par l'association Libertic et communes .fr
  • 40. Libérons nos données ! Depuis le 23 avril dernier, Toulouse Métropole et ses partenaires ont lancé le concours Open Data « Défi Numérique #2 ». Laurence Rumeau, documentaliste complétant sa formation en apprentissage en tant que gestionnaire des données Open data au sein de la direction de systèmes d'information (DSI), explique pourquoi les directions de notre collectivité doivent s'impliquer pour que le concours soit une réussite. Sésame : Qu'est ce que l'Open data ? Laurence Rumeau : L'Open data est la mise à disposition de données publiques (gratuites et non protégées par la loi informatique et liberté) pour un large public de réutilisateurs. Toulouse Métropole figure parmi les pionniers qui ont engagé une politique volontariste d'ouverture des données en créant le portail data.toulouse-metropole.fr en octobre 2011. Sur ce dernier, quelques services de nos collectivités mettent à disposition de tous des données qu'ils collectent et gèrent au quotidien. On y trouve par exemple, des données de décisions publiques, telles que les budgets, des données électorales, de géolocalisation et, depuis peu, les prénoms déclarés à l'état civil de Toulouse ! Sésame : Qui met ces données publiques en ligne ? L.R : Notre travail consiste à identifier les données que les différentes directions détiennent dans leurs bases de données. Puis, nous rencontrons les référents Open data des services afin d'élaborer ensemble des jeux de données qu'ils publieront ensuite sur le portail. Un an et demi après l'ouverture du portail, notre catalogue souffre d'un manque de données, particulièrement statistiques et brutes et c'est la raison pour laquelle nous souhaitons mobiliser les directions afin qu'elles nous aident à l'enrichir. C'est appel à la « libération » de données est d'autant plus fort que nous avons lancé au mois d'avril un nouveau concours « Défi numérique # 2 ». Pour qu'il soit à nouveau une réussite, nous devons offrir aux participants toute la matière nécessaire pour leurs futures créations. Sésame : Pouvez-vous présenter le concours « Défi numérique #2 » ? L.R : C'est la deuxième année consécutive que Toulouse Métropole et ses partenaires lancent ce concours. La première année, le grand prix a été décerné au projet de la société Coovia qui avait présenté une application mobile très innovante permettant aux Toulousains d'optimiser leurs déplacements. Le« Défi numérique #2 » reprend le même principe, mais nous l'avons élargi à de nouveaux projets qui se nourriront essentiellement de données brutes et statistiques. Lancé le 23 avril dernier, les réutilisateurs ont jusqu'au 2 septembre prochain pour présenter leurs dossiers. L'open Data peut être envisagé comme un moyen d'engager une coopération entre les administrations et les réutilisateurs du secteur privé qui développent ces services utiles à tous. Certains, comme Coovia, parviendront ainsi à élaborer des modèles économiques pérennes. En outre, ces données disponibles sur le portail pourraient constituer à l'avenir un précieux gisement pour la collectivité elle-même ! Donc, libérons nos données ! L'équipe Open data est ouverte à toutes suggestions et propositions. D'ailleurs, le 16 mai, elle organise une rencontre avec quelques référents Open data des services. Les personnes intéressées pour y assister doivent s'inscrire auprès de sandrine.mathon@toulouse-metropole.fr ou de laurence.rumeau@toulouse-metropole.fr ANNEXE IV
  • 41. POINT D'ÉTAPE NUMÉRO 4 MAI/JUIN 2013 OUVERTURE DES DONNÉES LES DÉLIBERATIONS Mairie de Balma >> le 20/11/2011 Mairie de Gratentour >> le 14/12/2011 Mairie de Colomiers >> le 03/02/2012 Mairie de Seilh >> le 12/09/2012 Mairie de Saint Jory >> le 11/10/2012 Mairie de Aucamville >> le 20/12/2012 LES DERNIÈRES DONNÉES PUBLIÉES Mairie de Balma: Installations sportives Écoles Petite enfance et jeunesse Équipements culturels Mairie de Seilh: Écoles Mairie de Toulouse: Budget primitif 2013 Stations d'auto partage Prénoms déclarés à l'État civil Nomenclature des voies CUTM: Budget primitif 2013 Poster image aérienne QUELQUES DONNÉES VUES AILLEURS Indemnités des Élus parisiens Composition du Conseil municipal Centres d'animation socioculturelle Organismes publics d'actions sociales Organismes publics Justice et sécurité Campings (localisation, info) Jardins familiaux (localisation, info) Points d'accès Wifi (localisation, info) Retrouvez les meilleurs articles d'actualité sur l'Open Data sélectionnés par Sandrine Mathon : http://www.scoop.it/t/e-administration Nous poursuivons notre politique vo- lontariste d'ouverture de données alors que le troisième projet de loi de décentralisation vient d'être présenté par le gouvernement au Conseil d'État et au Sénat. Il prévoit (article 111) de rendre obligatoire la mise à disposition des données publiques pour les collectivités territoriales de 3 500 habitants et plus qui détiennent de données dans des formats numé- riques afin d'en permettre la réutilisa- tion. Le précédant point d'étape vous an- nonçait l'organisation d'un nouveau concours, le Défi  Numérique  #2 est officiellement lancé et annoncé sur le portail depuis le 23 Avril. Ce nouvel appel à la créativité des “Data lover” permettra sans doute de révéler de nouveaux talents. L'application mo- bile “COOVIA”, présentée par David Larcher, le lauréat de l'édition 2012, avait retenu toute l'attention du Jury pour son côté novateur. Toulouse Métropole a su accompagner et sou- tenir son projet. Alimentée par des données mises à disposition sur notre portail et notamment celles de Tisseo via une API, elle est à présent opérationnelle et permet aux toulou- sains de choisir leurs déplacements selon une gestion multimodale (sa particularité est d'intégrer du covoitu- rage parmi les différents modes de transports proposés). Cette année, le Défi numérique #2 sera dédié aux applications web et mobiles ainsi qu'aux Data-visualisa- tions (Dataviz) interactives, animées ou fixes (infographies). La représen- tation visuelle de données permet de rendre accessibles des données qui ne le seraient pas de prime abord. Des métiers émergents tels que le Data journalisme ou le Design de l'interaction, en étroite collaboration avec ceux de la programmation et du graphisme, contribuent au dévelop- pement de la Data-visualisation. La matière première de ces créations vi- suelles sont principalement des don- nées statistiques ou brutes. Nous envisageons l'Open Data comme un levier pour la création de services innovants au service des ci- toyens. Il représente un réel moyen d'engager une coopération entre les administrations et les réutilisateurs du secteur privé qui développent ces services utiles à tous et notamment par le biais de concours tel le “Défi Numérique”. Certains, comme Co- ovia, parviendront ainsi à élaborer des modèles économiques pérennes. Prochaine étape, le mai 16 pour une rencontre ( Hackathon ) avec nos dif- férents référents Open Data pour identifier de nouvelles données pu- bliables et apporter ainsi la matière première à nos réutilisateurs de don- nées. Il est encore temps de vous inscrire ! Concours Défi Numérique #2 Lire la présentation de COOVIA sur: Toulouse-metropole.fr >> DÉCOUVREZ, TELECHARGEZ L'APPLI COOVIA
  • 42. Actions,Taches/Dateoct-12nov-12Dec-12,Janv-13févr-13mars-13avr-13mai-13juin-13juil-13août-13sept-13oct-13 Veille,analyseétatdu catalogue,RI Sourcing Sourcing,Collecte (flux) Collecte(flux)/W catalogueDCAT/ R.I.RDF Réajustementveille/ WcatalogueDCAT/ R.I.RDF Réajustement veille/W catalogueDCAT/ R.I.RDF Réajustementveille/ MigrationversReader (prévoirnvloutilpour juillet) Etatcatalog,stat+ Infographie Data.toulouse- metropole20.05 MigrerVeille Pointd'EtapeMaquette #1Définumérique- Résultats #2"Rencontre Etalab/ODF" Publications Data.toulousemétropole PageConcoursDéfi Numérique-Les résultats Publication1er cataloguede données Publication donnéesPrénoms/ Majcatalogue 23Avril-AnnonceDéfi Numérique#2/Google Analytics,paramétrage/ Majcatalogue PublicationjeuStations d'autopartage+API VélôToulouseJC Decaud/Majcatalogue Publication6nouveauxjeux dedonnées/Majcatalogue Déploiyerblog+ pageprésentation desDataviz proposées/ AnnonceBarcamp PageC.R.Barcamp: StoryTellingStorify (Iframe) Indentification,Synthèse, présentation,etc. Modifguide utilisationportail+ créationliste d'autoritéspourla saisiedeschamps libres Id.donnéesculture, patrimoineetLecture Publique(liens, donnéespubliées, réutilisation, suggestions) Id.données EspacesVerts Id.Données accidentologie,Droitdes places,Circulation, Off.tranquillité,EtatCivil, Prospectiveetstratégie territoriale Réal.Présentation vidéoprojetée Hackathon/Modif guide/Identification Géoportail40jeux Synthèseprésentation OpenDataetBarcamp invitation/Réal.Présent.la Mêlée/Contact BibliothécaireCabanisListe donnéesLecturePublique id. SynthèseEPFLEts PubliqueFoncier Wikiinterne"Fournisseursde données" Validationcomité/ Déploiement+ créationdes4pages MajpageVeilleMajp.Veille Majp.v./Page Suggestionhackathon 20jeuxdedonnées publliablesidentifiés Majp.Veille Pagecoproduction Camping municipaux Mail,Mailing EtatCivilDonnées Prénoms(relance, niveaud'inf.)+ demandeactesEtat civil WRecherche EcolesUniversités pourdiffusionFlyer lancement concours Sollicitationsdonnées accidentologie,Droitdes places,Circulation, off.tranquillité,EtatCivil, ProspectiveetStratégie territoriale EnvoiFlyerEcoles, informatique, graphisme,etc. AcadémiedeToulouse (80adresses selectionnées) FinJuinRappelConcours envoiFlyerEcoles informatique,graphisme, etc.AcadémiedeToulouse /Relancesdonnées identifiéesHackathon Mailinvitation Barcamp(OSM, développeurs, étudiants,etc.) Uneintranet"Libéronsnos données" Interview+WArticleUNE15et16Mai Evenement/JuryConcours DéfiNumérique(LaCantine) Le17octobre DossiersJury+ Grilled'éval+Xls comptage/ 5maiPrésentationet interventionDéfiNumla MêléeDiagora DossiersJury+ Grilled'éval+Xls comptage Le8octobreJury Evenement/Hackathon (Marengo) Le16maiMarengo Evenement/Barcamp(La CantineToulouse) Validationen comité ContactAnimateur+ rencontre/Wrecherche chercheurs,Startup,etc.à inviter Finjuin-EnvoiInvitations AnnonceWiki Barcamp.org/ France Le9octobre16h-19h BARCAMPLaMêlée Pland'actionsettaches ANNEXEVI #6AnnonceJuryConcours+annonce Barcamp #3"Libéronsnosdonnées" #5Hackathon+ Coproductiondonnées campingsmunicipaux? #4"DéfiNumérique#2"Annoncelancement+invit Hackathon PageprésentationdesApps développéesàpartirdes données
  • 43. Laurence Rumeau | Rapport Licence professionnelle « Management des ressources numériques » | Juin 2013

×