20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques

874 views
816 views

Published on

Published in: Lifestyle
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
874
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
12
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

20120313 coepia-mise-à-disposition-et-valorisation-des-données-publiques

  1. 1. Publier et interconnecterles données publiques :Le projet Datalift 13 Mars 2012, COEPIA, Paris Formation spécialisée « Mise à disposition et valorisation des données publiques » François Scharffe Francois.scharffe@lirmm.fr @lechatpito Présentation réalisée avec léquipe du projet Datalift Et le soutien de lAgence Nationale pour la Recherche 1
  2. 2. Au sommaireØ ProblématiquesØ Le web sémantique comme solutionØ Le projet DataliftØ Processus de publications des donnéesØ Exemple avec les données de lannuaire du service publicØ Vocabulaires, identifiants et interconnexionØ Vers un écosystème de jeux de données de référence
  3. 3. ProblématiquesØ Redondance des identifiantsØ Hétérogénéité des formats de donnéesØ Diversité des formats de métadonnéesØ Hétérogénéité des protocoles daccès aux données
  4. 4. Le Web sémantique comme solutionØ Un système didentifiants global: les URIsØ Un format unique: RDFØ Un langage de représentation de vocabulaires de métadonnées: RDFS+OWL, SKOSØ Un protocole dacccès uniforme: HTTP, SPARQL
  5. 5. DataliftPlateforme logicielle pour assister la publication de donnéesPublication de jeux de donnéesR&D pour automatiser le processus de publicationFormations, tutoriels, camps de publication de données
  6. 6. but de datalift De données brutes ouvertes à des données sémantiques interconnectées
  7. 7. Un ascenseur pour les données Données publiées et interconnectées sur le Web Applications InterconnexionInfrastructure de publication Conversion des données Sélection de vocabulaires Données brutes
  8. 8. Le processus de publication DBPedia IGN INSEE SPARQL Négociation de contenu Dé-référencement des URIs Ontologie du service public Conversion RDF → RDF Ontologie géographique Conversion XML → RDF
  9. 9. sélectionØ Qu’est-ce qu’un (bon) vocabulaire pour des données liées? § Critères d’utilisabilité § Simplicité, visibilité, pérennité, intégration, cohérence …Ø Différents types de vocabulaires § De métadonnées, de référence, de domaine, généraliste … § Les piliers du Linked Data : Dublin Core, FOAF, SKOSØ Bonnes et moins bonnes pratiques § Ex : Programmes BBC vs legislation.gov.uk § Vocabulary of a Friend : les vocabulaires en réseauØ Problèmes linguistiques § Les vocabulaires existants sont en anglais à 99% § Approche terminologique : quels vocabulaires pour « Evénement » « Organisation »
  10. 10. conversionØ Guide des bonnes pratiques pour les données liées: § La ressource: http://dbpedia.org/resource/Paris § Le document: http://dbpedia.org/page/Paris § Les données: http://dbpedia.org/data/ParisØ Cas d’étude: legislation.gov.uk § L’identifiant: http://www.legislation.gov.uk/id/ukpga/1985/67 § Le document: http://www.legislation.gov.uk/ukpga/1985/67 § La représentation (en XML plutôt que HTML): http://www.legislation.gov.uk/ukpga/1985/67/data.xml
  11. 11. publication § Utiliser le format RDF § Utiliser des URI pour nommer les choses § Utiliser des URI HTTP (URL) pour pouvoir leur demander des informations § Donner des informations (HTML, RDF) quand les liens sont dé- référencés § Inclure dans ces infos les URIs pointant vers dautres données pour permettre la découverte Tim Berners Lee, http://www.w3.org/DesignIssues/LinkedData.html
  12. 12. Interconnexion§ Comment identifier les jeux de données à lier ?§ Comment trouver les resources équivalentes ?
  13. 13. Élévation de données expérimentations en cours ou prévuesØ IGN, INSEE, DILAØ Regards Citoyens (nosdeputes.fr)Ø Etalab – data.gouv.frØ Version Française de DBPedia (INRIA, ministère de la culture)Ø Office national des transports (CETE Méditerranée)Ø Ville de MontpellierØ EU projects LOD2, LATC, PlanetDataØ SharePSI.eu, W3C Linked Open Government Data, CKAN
  14. 14. Education Dev. DurableNuage de Industrie Culturedonnées Annuaire du Service Public Reférentiel DILA des communes INSEE Finances.fr BDAdresse IGN DBPedia.fr Intérieur Min.Culture Recensement INSEE BDTopo Recherche IGN Offres des servicesAdministrations locales De transport (villes, agglos, data.BNF.fr CETEdépartements, régions) Santé Associations Médias
  15. 15. DATALIFT En route vers le web de données
  16. 16. Datalift Platform
  17. 17. Quelques exemples de requêtes● Quels sont les services publics disponibles à Melun classés par type de service ?● Quels sont les horaires douverture des services publics en Île de France ?● Dans quelles villes y a til des instances préfectorales ? Quel est leur numéro de téléphone ? Quel est le nom de ces communes en Japonais ?
  18. 18. CreditsThis presentation was realized thanks to the work of the Datalift team.It can be freely distributed under Creative Commons licence BY-NC-SA 3.0 18

×