Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
1,050
On Slideshare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
4
Comments
0
Likes
1

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Data PublicaOpendata & visualisations EMI - CFD Mercredi 28 mars 2012 Thomas Dudouet thomas.dudouet@data-publica.com @tdudouet
  • 2. Open data Définition● Open data = Donnée ouverte● On parle douverture des données● Mise à disposition des données publiques pour accès et réutilisation par les citoyens et les entreprises
  • 3. Open data Donnée publiqueLa notion de « donnée publique » couvre lensembledes données qui sont ou devraient être (légalementou volontairement) publiées ou tenues à dispositiondu public, et qui sont produites ou collectées par unÉtat, une collectivité territoriale, un organeparapublic, dans le cadre de leurs activités deservice public. http://fr.wikipedia.org/wiki/Donnée_publique
  • 4. Open data Motivations Modernisation ● Enrichissement des données ● Développement du collaboratif ● Intégration du décisionnel de données
  • 5. Open data Motivations Économiques ● Développement de linnovation ● Croisement des compétences ● Création demploi, de structures ● Valorisation du territoire
  • 6. Open data Motivations Démocratiques ● Lisibilité et transparence de laction publique ● Dialogue et participation citoyenne
  • 7. Open data Un mouvement mondial● États-Unis Initiative data.gov (administration Obama - 2009)● Royaume-Uni Initiative data.gov.uk (2010)● UE Directive Européenne sur la réutilisation des données publiques (2003)● Finlande, Australie, Nouvelle-Zélande, Irlande,...● France Mission Etalab (data.gouv.fr)
  • 8. Open data Données publiques● Des formes variées Statistiques, horaires, cartographies, mesures,...● Des thématiques diverses Transport, culture, tourisme, environnement, démoghraphie, finances,...● Des formats préconisés ○ Formats "libres" (non propriétaires) ○ Formats lisibles par les machines CSV, ODF, XML,... XLS, PDF, DOC,...
  • 9. Open data Données publiques● Exemples : ○ Liste des arbres dans la ville ○ Liste de jardins et parcs publics ○ Localisation des vélos en libre accès ○ Circulation et places de parking en temps réel ○ Localisation des toilettes publiques ○ Statistiques de prêt dans les bibliothèques ○ Résultats aux élections
  • 10. Open data État du mouvement en France
  • 11. Open data Petit exercice dintroduction... Recherche de jeu de données Pour chaque jeu de données, noter : ● LURL du site ● Le format de fichier http://www.pratique.fr/sites/default/files/articles/referencer-site.jpg
  • 12. Open data Producteurs de données MINISTÈRE DES SPORTS MINISTÈRE DE LINTÉRIEUR MINISTÈRE DU BUDGET MINISTÈRE DE LECOLOGIE MINISTÈRE DE LÉDUCATION NATIONALE MINISTÈRE DE LA CULTURE MINISTÈRE DU TRAVAIL PRÉFECTURE DILE DE FRANCE & DE PARISPRÉFECTURE DU JURA PRÉFECTURE DU NORD PRÉFECTURE DE LA SOMME PRÉFECTURE DELA MARNE PRÉFECTURE DE LAIN PRÉFECTURE DU VAR PRÉFECTURE DU PAS DE CALAIS
  • 13. Open data Producteurs de données VILLE DE PARIS VILLE DE NANTES VILLE DE RENNES VILLE DE MONTPELLIER VILLE DE TOULOUSE VILLE DE BROCAS CONSEILGÉNÉRAL DU LOIR ET CHER CONSEIL GÉNÉRALDE GIRONDE CONSEIL GÉNÉRAL DE SAÔNE ET LOIRE CONSEIL GÉNÉRAL DE LOIREATLANTIQUE CONSEIL GÉNÉRAL DU MAINE ETLOIRE AGENCE DE LEAU ARTOIS PICARDIE ...INSEE EUROSTAT OCDE BANQUE MONDIALE ...
  • 14. Open data Formats de données PDF XLS CSV DOC XML RDF RTF TXT SHP GTFS ESRI KML HTML ODS JPG ...
  • 15. Open data Data delugeMINISTÈRE DES SPORTS MINISTÈRE DE LINTÉRIEUR MINISTÈRE DU BUDGET MINISTÈRE DE LECOLOGIE MINISTÈRE DELÉDUCATION NATIONALE MINISTÈRE DE LA CULTURE MINISTÈRE DU TRAVAIL PRÉFECTURE DU JURA PRÉFECTURE DU NORD G E PRÉFECTURE DE LA SOMME PRÉFECTURE DE LA MARNE U PRÉFECTURE DE LAIN PRÉFECTURE DU PAS DE CALAIS VILLE DE L D E PARIS VILLE DE NANTES VILLE DE RENNES VILLE DE MONTPELLIER VILLE DE TOULOUSE VILLE DE BROCAS CONSEIL T A GÉNÉRAL DU LOIR ET CHER CONSEIL GÉNÉRAL DE GIRONDE CONSEIL GÉNÉRAL DE SAÔNE ET LOIRE CONSEIL GÉNÉRAL DE D A LOIRE ATLANTIQUE CONSEIL GÉNÉRAL DU MAINE ET LOIRE AGENCE DE LEAU ARTOIS PICARDIE AGENCE DE LEAU ADOUR GARONNE AGENCE DE LEAU LOIRE BRETAGNE PDF XLS CSV DOC XML RDF RTF TXT SHP GTFS ESRI KML HTML ODS JPG
  • 16. Open data Data deluge The data deluge refers to the situation where the sheer volume of new data being generated is overwhelming the capacity of institutions to manage it and researchers to make use of it. http://itlaw.wikia.com/wiki/Data_deluge
  • 17. Open data Solutions (nécessaires mais pas suffisantes)● Utilisation dannuaires● Segmentation des données existantes : ○ Par éditeur : portée géographique (national, continental, mondial) ○ Par catégorie : portée sémantique ○ Par format : niveau de réutilisation, dautomatisation
  • 18. Open data Solutions ((presque ?) suffisantes)● Structurer les données● Les rendre librement accessibles via des services web (Exemple de Google Maps)● Assurer leur mise à jour automatique● Garantir la rétro-compatibilité des systèmes http://maps.googleapis.com/maps/api/geocode/json?sensor=false&address=7,%20rue%20des%20Petites%20Ecuries% 20Paris
  • 19. Open data Data Publica - Histoire● Origine Projet de R&D financé par le Secrétariat dÉtat à l’Économie numérique (2010)● Septembre 2010 : Lancement du premier annuaire Français de données électroniques● Mars 2011 : Lancement de la société Data Publica● Octobre 2011 : Lancement de la place de marché● Janvier 2012 : Outil de visualisation générique● Mars 2012 : Lancement de lAPI
  • 20. Open data Data Publica - Points forts● Excellente connaissance des données françaises● Maitrise des technologies de recueil de données ○ Crawling, scraping ○ Text mining, web mining ○ ETL, data cleansing● Flexibilité et réactivité● Collaboration avec le monde de la recherche
  • 21. Open data Data Publica - Lannuaire● Libre, gratuit, ouvert● Plus de 13000 jeux de données, 200 éditeurs● Données & méta-données combinées dans un moteur de recherche à facettes● Moteur de visualisation générique
  • 22. Open data Data Publica - Recherche● Un résultat du moteur = un jeu de données● Classement par pertinence ou par date de parution● Nombreuses facettes : ○ Prix (99% gratuit) ○ 24 catégories (multi-catégories) ○ Type de publication (groupements de formats) ○ Annuaire (site dorigine) ○ Éditeur ○ License
  • 23. Open data Data Publica - Recherche Démo La poule pondeuse, témoin de la puissance du moteur de recherche Data Publica. http://www.zanimag.fr/files/2011/03/poule-pondeuse.jpg
  • 24. Open data Data Publica - Visualisateur● Un outil simple dutilisation qui permet de visualiser des données de manière claire : ○ Cartographies ○ Graphiques ○ Courbes● Un moyen facile dexporter une visualisation dans un article
  • 25. Open data Data Publica - Visualisateur Première étape : Trouver sa visualisation
  • 26. Open data Data Publica - VisualisateurDeuxième étape : Choisir un type de visualisation
  • 27. Open data Data Publica - Visualisateur Troisième étape : Paramétrer ses données
  • 28. Open data Data Publica - Visualisateur Last but not least : Partager ses données
  • 29. Open data Data Publica - Visualisateur Démo Délinquance : des chiffres qui donnent la chair de poule (pondeuse) http://www.monversailles.com/wp-content/uploads/2009/11/menottes.jpg
  • 30. Open data Visualisateur : prenez la main !Quel est le pays Européen dont le montant de ladette publique était le plus important en 2010 ?
  • 31. Open data Visualisateur : prenez la main !Quel est le pays Européen dont le montant de ladette publique était le plus important en 2010 ? LAllemagne, avec 2062 milliards deuros. La Grèce à quant à elle la part la plus elevée par rapport à son PIB avec 145%.
  • 32. Open data Visualisateur : prenez la main !Quel est le pays Européen qui détient le plusdélevages de poules pondeuses ? Le plus de poules pondeuses ?
  • 33. Open data Visualisateur : prenez la main !Quel est le pays Européen qui détenait le plus délevages de poules pondeuses en 2007 ? Le plus de poules pondeuses ? La Roumanie avec 2 951 970 élevages. La France avec 73 670 000 poules pondeuses. Varier le paramètre "Nombre de têtes".
  • 34. Open data Visualisateur : prenez la main !Quel est le domaine dactivité en France le plus sujet à des accidents du travail ?
  • 35. Open data Visualisateur : prenez la main !Quel est le domaine dactivité en France le plus sujet à des accidents du travail ? La construction. Nette amélioration dans lagriculture en 2007. Observer également avec la dimensions Pays.
  • 36. Open data Data Publica, cest aussi... Un blog sur lactualité des données http://www.data-publica.com/content/blog/data-news/● Des articles danalyse de jeu de données : Analyse des résultats des primaires socialistes, Analyse des données sur la délinquance,...● Des entretiens avec des acteurs du domaine
  • 37. Open data Data Publica, cest aussi... Le "labs" et ses expériences http://observatoire.data-publica.com/Outil de mesure de limpact des 10 candidats à laprésidentielle sur Twitter : ● Nombre de followers ● Analyse sémantique (text-mining) ● Bruit (nombre de tweets associés)
  • 38. Open data Data Publica, cest aussi... Le "labs" et ses expériences http://www.data-publica.com/content/2012/03/voyage-dans-le-patrimoine-immobilier-de-letat/Analyse et cartographie sur les biens immobiliersdétenus par lÉtat Français dans le monde.
  • 39. Des questions ? EMI - CFD Mercredi 28 mars 2012 Thomas Dudouet thomas.dudouet@data-publica.com @tdudouet