Datapublica annuaire de données et sujets de recherche

1,430
-1

Published on

Présentation de Data Publia au Coup d'envoi de l'opendata sur Nantes: Annuaire de données et sujets de recherche associés

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,430
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
9
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Datapublica annuaire de données et sujets de recherche

  1. 1. Annuaire de données François Bancilhonfrancois.bancilhon@data-publica.com www.data-publica.com twitter.com/fbancilhon Nantes, 22 avril 2011
  2. 2. Plan● Data Publica● Annuaire de données (manuel)● Cartographie des données publiques françaises● Annuaire bis (automatisé)● Sujets de recherche
  3. 3. Data Publica « Elevator Pitch »● Développer la connaissance la plus complète et la plus fine des données électroniques françaises (base de connaissance et technologie)● Monétiser cette connaissance par – lopération du « magasin de données » de référence des données françaises – la production de jeux de données uniques (« killer data sets ») vendus dans le magasin et en direct aux acteurs du marché
  4. 4. Data Publica Data Store Editeurs de Organismes Data Publica Données Publics Privés Fournisseurs de données data-publica.com Acquéreurs de données Grands-comptes, Grand public, Organismes publics Journalistes PME, TPE Chercheurs
  5. 5. Data Publica : annuaire● Jeux de données publics (ensemble de fichiers formant un tout cohérent) ● Méta données (date, auteur, mots clés, catégories, structure, description, etc.) ● Éditeur (organisme public publiant le jeu de données)● Moteur de recherche ● Dans les jeux de données et les éditeurs ● Dans les méta données ou le contenu des données
  6. 6. Architecture
  7. 7. Data Publica : annuaire● Lancé en septembre 2010● Avril 2011 ● 175 éditeurs ● 1 950 jeux de données ● 4750 fichiers● Troisième annuaire national de données publiques au monde (après data.gov et data.gov.uk)
  8. 8. Les données publiques en France
  9. 9. Les organismes publics Total count ListedThree Branches Executive Presidency 1 1 Prime minister 1 1 Ministries 29 29 Legislative Chamber of deputies 1 1 Senate 1 1 Judicial Courts and councils 9 9Independant administrative authorities 44 44State operators 584 550Préfectures 128 128Local Elected bodies Regions 26 26 Departments 100 100 Cities 36 571 50Government controled organizations 57 57Chambers of commerce 166 166Chambers of craftsmen 120 120Chambers of agriculture 79 79Total 37 917 1 362
  10. 10. Les sites Web publics Listed SitesThree Branches Executive Presidency 1 1 Prime minister 1 40 Ministries 29 644 Legislative Chamber of deputies 1 1 Senate 1 1 Judicial Courts and councils 9 11Independant administrative authorities 44 36State operators 550 511Préfectures 128 121Local Elected bodies Regions 26 26 Departments 100 99 Cities 50 50Government controled organizations 57 68Chambers of commerce 166 163Chambers of craftsmen 120 113Chambers of agriculture 79 72Total 1 362 1 957
  11. 11. Combien de données publiques ? Chambre dagriculture 13 490 Chambres des métiers 9 209 Chambre de commerce 52 199 50 plus grandes villes 102 225 Préfectures 160 458 Départements 136 729 Régions 44 656 Opérateurs détat 3 876 539Organisations publiques 54 508Autorités indépendantes 72 577 Trois branches 1 701 679
  12. 12. Dans quels formats ?5 553 338 481 844 148 509 26 518 369 PDF XLS CSV XML RDF
  13. 13. # de fichier / 10 000 habitants PDF XLS CSV XML TOTAL US 2 578 166 8 547 3 301 Australia 19 422 43 32 87 19 586 New Zealand 23 548 45 12 13 23 618 UK 966 90 2 85 1 178 France 849 23 4 74 951 Switzerland 637 131 0 0 769
  14. 14. Recueildes données publiques
  15. 15. Recueil automatique de données
  16. 16. Nos sujets de recherche● Crawl du Web de données (PPGP)● Crawl du Web public (Régional, Etat, Européen)● Filtrage et extraction des données● Normalisation des données (Excel à BD SQL)● Spatial et Temporel ● Temporel : intervalles ou instants ● Spatial : zone ou points ● Reconnaissance et alignement
  17. 17. Nos sujets de recherche● Alignement généralisé● Mise à jour automatique● Raffinage de données● Visualisation ● ODATA (standard dinterrogation) ● DSPL (représentation)● Web Sémantique, Linked Data, RDF
  18. 18. Nos partenariats de recherche● INRIA Leo (Ioana Manolescu)● INRIA Zenith (Patrick Valduriez)● AVIZ (Jean-Daniel Fekete)● Internet Memory Research (Julien Masanès)
  19. 19. francois.bancilhon@data-publica.com www.data-publica.com twitter.com/fbancilhon
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×