SlideShare une entreprise Scribd logo
Innover par et
pour la donnée
@ Bibcamp'2015
nicolas.chauvat@logilab.fr
Fondateur et PDG de Logilab depuis l'an 2000
2
Vous n'êtes pas du métier ?
ma culture =
recherche en informatique
+ logiciel libre
+ Web
+ agilité
3
Comment êtes-vous arrivé là ?
•  CubicWeb débuté en 2001
•  Linked Open Data pour des musées en 2006
•  Rencontré BnF à une conference en 2007
•  Gagné marché en 2010 puis 2012
•  Depuis de nombreux projets intéressants
4
Vous vendez quoi ?
•  conseil et formation
(urbanisation des données, web sémantique, agilité, etc.)
•  publication web sémantique
(culture = opencat + fevis + biblissima + musées)
•  traitement des données
(nettoyage, enrichissement, alignement, etc.)
5
data.bnf
le Web
7
8
Alignements
•  Outil Nazca (calcul de similarités)
•  notice bibliographique <-> notice d'autorité titre
•  regroupe ou crée notices biblio et autorité
•  liens avec bases externes
•  Réutilisation de données
•  règles métiers ou identifiant ARK
•  VIAF et autres alignements existants
9
10
Feuille de route data.bnf
•  100% du catalogue
•  mise à jour toutes les 2 semaines
•  réintégration des alignements dans le catalogue
•  ajout de modèles plus simples (?)
•  data.bnf.fr/atelier pour avant-premières
11
Enjeux data.bnf selon la BnF
•  Visibilité et référencement
•  Interopérabilité
•  Fiabilité grâce à la traçabilité des URLs
•  Réutilisation souple par des tiers
12
13
14
15
16
17
18
19
Linked Data et bibliothèques
•  http://data.bnf.fr et bibliothèques
•  http://data.europeana.eu
•  http://datos.bne.es, http://dnb.de, http://libris.kb.se
•  Sudoc IdRef
•  VIAF (Virtual International Authority File)
•  etc
20
Provenance des jeux de données
•  généré par ?
•  utilisé par ?
•  date de début / fin ?
•  dérivé de ?
•  licence ?
21
Maturité des données ouvertes
1.  Données disponibles sur le Web sous une licence ouverte
2.  + format structuré (CSV, XML, Excel, mais pas PDF ou image)
3.  + format non-propriétaire (CSV plutôt que Excel)
4.  + respect des standards RDF (identification par des URLs, vocabulaire
défini: pas CSV, etc.)
5.  + liens vers d'autres données pour fournir du contexte (ontologies) et
enrichir (autres jeux de données)
22
interopérabilité
le Web
Qu'est-ce que le web ?
Réseau mondial de données construit sur la base d'un ensemble de
standards d'interopérabilité (protocoles, formats, vocabulaires, modèles,
interrogation), qui s'appuie sur les URLs pour identifier de manière unique
les données élémentaires et les lier entre elles.
“
25
Le Web passe à l'échelle
Liens permettent collaboration à grande échelle
Création d'identifiants est décentralisée
(Domain Name System est délégué)
Incohérence globale ("monde ouvert") permet parallélisation
26
Attention à ne pas confondre
•  web sémantique :
données utilisables par un programme PAS trait. auto. des langues
•  RDF et vocabulaires :
standardiser les échanges de données PAS les outils et le stockage
•  Un et un seul Web :
un protocole (HTTP) et plusieurs standards pour l'échange de données
(HTML, RDF, OWL, JSON, DC, FOAF, SKOS, etc.)
27
Recentrage sur les données
•  rassembler / collecter
•  aligner / normaliser
•  enrichir / annoter / classer
•  définir un pivot métier avec des données de référence
•  lier les données entre elles
28
Urbanisation des données
libre privé
externe interne
générique spécifique
statique dynamique
29
30
Avenir probable
•  biens communs
•  spécialisation territoire / langue / thème / domaine
•  interopérabilité / décentralisation
•  multiplicité des réutilisations
31
Les applications
passent,
les données
restent.
“

Contenu connexe

En vedette

Comment utiliser en entreprise les jeux agiles pour innover, apprendre et col...
Comment utiliser en entreprise les jeux agiles pour innover, apprendre et col...Comment utiliser en entreprise les jeux agiles pour innover, apprendre et col...
Comment utiliser en entreprise les jeux agiles pour innover, apprendre et col...
itSMF France
 
Ateliers e-learning
Ateliers e-learningAteliers e-learning
Ateliers e-learning
aligot
 
Innover sans contrainte, intégrer sans rupture
Innover sans contrainte, intégrer sans ruptureInnover sans contrainte, intégrer sans rupture
Innover sans contrainte, intégrer sans rupture
Guillaume Laforge
 

En vedette (12)

Innover grâce au Design Thinking - Cogite
Innover grâce au Design Thinking  - CogiteInnover grâce au Design Thinking  - Cogite
Innover grâce au Design Thinking - Cogite
 
managment du qualité
managment du qualitémanagment du qualité
managment du qualité
 
Filip drapak ppp in financial crises francais
Filip drapak ppp in financial crises francaisFilip drapak ppp in financial crises francais
Filip drapak ppp in financial crises francais
 
Comment utiliser en entreprise les jeux agiles pour innover, apprendre et col...
Comment utiliser en entreprise les jeux agiles pour innover, apprendre et col...Comment utiliser en entreprise les jeux agiles pour innover, apprendre et col...
Comment utiliser en entreprise les jeux agiles pour innover, apprendre et col...
 
Transport en commun_he_thong_giao_thong_cong_cong
Transport en commun_he_thong_giao_thong_cong_congTransport en commun_he_thong_giao_thong_cong_cong
Transport en commun_he_thong_giao_thong_cong_cong
 
Soutenance_25oct2004.v3_ppt
Soutenance_25oct2004.v3_pptSoutenance_25oct2004.v3_ppt
Soutenance_25oct2004.v3_ppt
 
Ateliers e-learning
Ateliers e-learningAteliers e-learning
Ateliers e-learning
 
Créer et exploiter le réseau de bus de Riyad
Créer et exploiter le réseau de bus de RiyadCréer et exploiter le réseau de bus de Riyad
Créer et exploiter le réseau de bus de Riyad
 
Innover sans contrainte, intégrer sans rupture
Innover sans contrainte, intégrer sans ruptureInnover sans contrainte, intégrer sans rupture
Innover sans contrainte, intégrer sans rupture
 
Mise en œuvre d'un système d'information voyageur
Mise en œuvre d'un système d'information voyageurMise en œuvre d'un système d'information voyageur
Mise en œuvre d'un système d'information voyageur
 
Innover, c’est rêver
Innover, c’est rêverInnover, c’est rêver
Innover, c’est rêver
 
Biomim'review - galerie d'exemples d'innovations bio-inspirées
Biomim'review - galerie d'exemples d'innovations bio-inspiréesBiomim'review - galerie d'exemples d'innovations bio-inspirées
Biomim'review - galerie d'exemples d'innovations bio-inspirées
 

Similaire à Innover par et pour la donnée - Logilab ADBU Bibcamp 2015

Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
Yves Otis
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02
ABES
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
SemWebPro
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
Gregoire Burel
 

Similaire à Innover par et pour la donnée - Logilab ADBU Bibcamp 2015 (20)

Web sémantique
Web sémantique Web sémantique
Web sémantique
 
ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)ABES - intervention congrès Semweb pro (5-11-2014)
ABES - intervention congrès Semweb pro (5-11-2014)
 
Medialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donneesMedialille evolutions catalogage_avril2014_web-donnees
Medialille evolutions catalogage_avril2014_web-donnees
 
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02
 
Données liées : Succès, leçons et prochaines étapes
Données liées : Succès, leçons et prochaines étapesDonnées liées : Succès, leçons et prochaines étapes
Données liées : Succès, leçons et prochaines étapes
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
 
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
Ms Cloud Summit 2017 - Power Bi, le tour complet 2017
 
Power Bi, le tour complet 2017
Power Bi, le tour complet 2017 Power Bi, le tour complet 2017
Power Bi, le tour complet 2017
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
quand le lien fait sens
quand le lien fait sensquand le lien fait sens
quand le lien fait sens
 
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
 
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
Jabes 2011 - Session plénière 17 mai "OCLC - orientations stratégiques"
 
Datalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériencesDatalift, une plateforme Linked Data, Retour d'expériences
Datalift, une plateforme Linked Data, Retour d'expériences
 
Le web sémantique : une nouvelle interopérabilité pour les bibliothèques
Le web sémantique : une nouvelle interopérabilité pour les bibliothèquesLe web sémantique : une nouvelle interopérabilité pour les bibliothèques
Le web sémantique : une nouvelle interopérabilité pour les bibliothèques
 
Asterid: Linked Data Asterisms
Asterid: Linked Data AsterismsAsterid: Linked Data Asterisms
Asterid: Linked Data Asterisms
 
eServices-Chp6: WOA
eServices-Chp6: WOAeServices-Chp6: WOA
eServices-Chp6: WOA
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
 
aMS 2021 - De bonnes pratiques pour rendre SharePoint plus ludique
aMS 2021 - De bonnes pratiques pour rendre SharePoint plus ludiqueaMS 2021 - De bonnes pratiques pour rendre SharePoint plus ludique
aMS 2021 - De bonnes pratiques pour rendre SharePoint plus ludique
 

Plus de Logilab

Système d'archivage électronique mutualisé
Système d'archivage électronique mutualiséSystème d'archivage électronique mutualisé
Système d'archivage électronique mutualisé
Logilab
 
Utiliser salt pour tester son infrastructure sur open stack ou docker
Utiliser salt pour tester son infrastructure sur open stack ou dockerUtiliser salt pour tester son infrastructure sur open stack ou docker
Utiliser salt pour tester son infrastructure sur open stack ou docker
Logilab
 
Importer des données en Python avec CubicWeb 3.21
Importer des données en Python avec CubicWeb 3.21Importer des données en Python avec CubicWeb 3.21
Importer des données en Python avec CubicWeb 3.21
Logilab
 
Simulagora - Salon du Bourget
Simulagora - Salon du BourgetSimulagora - Salon du Bourget
Simulagora - Salon du Bourget
Logilab
 

Plus de Logilab (20)

Testinfra pyconfr 2017
Testinfra pyconfr 2017Testinfra pyconfr 2017
Testinfra pyconfr 2017
 
Open Source & Open Data : les bienfaits des communs
Open Source & Open Data : les bienfaits des communsOpen Source & Open Data : les bienfaits des communs
Open Source & Open Data : les bienfaits des communs
 
Salon Open Data
Salon Open DataSalon Open Data
Salon Open Data
 
Pydata Paris Python for manufacturing musical instruments
Pydata Paris Python for manufacturing musical instrumentsPydata Paris Python for manufacturing musical instruments
Pydata Paris Python for manufacturing musical instruments
 
Présentation Logilab
Présentation LogilabPrésentation Logilab
Présentation Logilab
 
Système d'archivage électronique mutualisé
Système d'archivage électronique mutualiséSystème d'archivage électronique mutualisé
Système d'archivage électronique mutualisé
 
Utiliser salt pour tester son infrastructure sur open stack ou docker
Utiliser salt pour tester son infrastructure sur open stack ou dockerUtiliser salt pour tester son infrastructure sur open stack ou docker
Utiliser salt pour tester son infrastructure sur open stack ou docker
 
Importer des données en Python avec CubicWeb 3.21
Importer des données en Python avec CubicWeb 3.21Importer des données en Python avec CubicWeb 3.21
Importer des données en Python avec CubicWeb 3.21
 
Simulagora au service d'un grand défi industriel
Simulagora au service d'un grand défi industrielSimulagora au service d'un grand défi industriel
Simulagora au service d'un grand défi industriel
 
Simulagora - Salon du Bourget
Simulagora - Salon du BourgetSimulagora - Salon du Bourget
Simulagora - Salon du Bourget
 
Study of the dynamic behavior of a pump with Code_ASTER on Simulagora
Study of the dynamic behavior of a pump with Code_ASTER on SimulagoraStudy of the dynamic behavior of a pump with Code_ASTER on Simulagora
Study of the dynamic behavior of a pump with Code_ASTER on Simulagora
 
Initialiser des conteneurs Docker à partir de configurations Salt construites...
Initialiser des conteneurs Docker à partir de configurations Salt construites...Initialiser des conteneurs Docker à partir de configurations Salt construites...
Initialiser des conteneurs Docker à partir de configurations Salt construites...
 
Battle Opendata - Logilab - Cubicweb
Battle Opendata - Logilab - CubicwebBattle Opendata - Logilab - Cubicweb
Battle Opendata - Logilab - Cubicweb
 
Debconf14 : Putting some salt in your Debian systems -- Julien Cristau
Debconf14 : Putting some salt in your Debian systems -- Julien CristauDebconf14 : Putting some salt in your Debian systems -- Julien Cristau
Debconf14 : Putting some salt in your Debian systems -- Julien Cristau
 
Simulagora (Euroscipy2014 - Logilab)
Simulagora (Euroscipy2014 - Logilab)Simulagora (Euroscipy2014 - Logilab)
Simulagora (Euroscipy2014 - Logilab)
 
PAFI (Euroscipy2014 - Logilab)
PAFI (Euroscipy2014 - Logilab)PAFI (Euroscipy2014 - Logilab)
PAFI (Euroscipy2014 - Logilab)
 
Open Legislative Data Conference 2014
Open Legislative Data Conference 2014Open Legislative Data Conference 2014
Open Legislative Data Conference 2014
 
Pylint : 10 ans, état des lieux
Pylint : 10 ans, état des lieuxPylint : 10 ans, état des lieux
Pylint : 10 ans, état des lieux
 
BRAINOMICS A management system for exploring and merging heterogeneous brain ...
BRAINOMICS A management system for exploring and merging heterogeneous brain ...BRAINOMICS A management system for exploring and merging heterogeneous brain ...
BRAINOMICS A management system for exploring and merging heterogeneous brain ...
 
Présentation sur le stand à l'OpenWorldForum 2013
Présentation sur le stand à l'OpenWorldForum 2013Présentation sur le stand à l'OpenWorldForum 2013
Présentation sur le stand à l'OpenWorldForum 2013
 

Dernier

Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
zidani2
 

Dernier (11)

Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
Présentation Webinaire Cohésion - Concevoir et mettre en place une CMDB, comm...
 
Webinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctionsWebinaire Technologia | DAX : nouvelles fonctions
Webinaire Technologia | DAX : nouvelles fonctions
 
Festival de Cannes 2024.pptx
Festival    de     Cannes        2024.pptxFestival    de     Cannes        2024.pptx
Festival de Cannes 2024.pptx
 
EL KATRY Reem: Proposition de Programme Artistique et Exposition pour les Écoles
EL KATRY Reem: Proposition de Programme Artistique et Exposition pour les ÉcolesEL KATRY Reem: Proposition de Programme Artistique et Exposition pour les Écoles
EL KATRY Reem: Proposition de Programme Artistique et Exposition pour les Écoles
 
MARTYRS DE TURQUIE – une histoire de persécution chrétienne en Anatolie.pptx
MARTYRS DE TURQUIE – une histoire de persécution chrétienne en Anatolie.pptxMARTYRS DE TURQUIE – une histoire de persécution chrétienne en Anatolie.pptx
MARTYRS DE TURQUIE – une histoire de persécution chrétienne en Anatolie.pptx
 
Comment enseigner la langue française en Colombie?
Comment enseigner la langue française en Colombie?Comment enseigner la langue française en Colombie?
Comment enseigner la langue française en Colombie?
 
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
Decret-n°19-10-du-23-janvier-2019-reglementant-lexportation-des-déchets-spéci...
 
Gestion des flux de trésorerie dans les entreprises
Gestion des flux de trésorerie dans les entreprisesGestion des flux de trésorerie dans les entreprises
Gestion des flux de trésorerie dans les entreprises
 
Résultats enquête RH 2024 Fonction Publique.pdf
Résultats enquête RH 2024 Fonction Publique.pdfRésultats enquête RH 2024 Fonction Publique.pdf
Résultats enquête RH 2024 Fonction Publique.pdf
 
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
Fiche - Accompagnement du travail coopératif au sein d’une équipe d’enseignan...
 
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
PLANNING HEBDO ET CR LYCEE COUDON 21 MAI2024
 

Innover par et pour la donnée - Logilab ADBU Bibcamp 2015

  • 1. Innover par et pour la donnée
  • 2. @ Bibcamp'2015 nicolas.chauvat@logilab.fr Fondateur et PDG de Logilab depuis l'an 2000 2
  • 3. Vous n'êtes pas du métier ? ma culture = recherche en informatique + logiciel libre + Web + agilité 3
  • 4. Comment êtes-vous arrivé là ? •  CubicWeb débuté en 2001 •  Linked Open Data pour des musées en 2006 •  Rencontré BnF à une conference en 2007 •  Gagné marché en 2010 puis 2012 •  Depuis de nombreux projets intéressants 4
  • 5. Vous vendez quoi ? •  conseil et formation (urbanisation des données, web sémantique, agilité, etc.) •  publication web sémantique (culture = opencat + fevis + biblissima + musées) •  traitement des données (nettoyage, enrichissement, alignement, etc.) 5
  • 7. 7
  • 8. 8
  • 9. Alignements •  Outil Nazca (calcul de similarités) •  notice bibliographique <-> notice d'autorité titre •  regroupe ou crée notices biblio et autorité •  liens avec bases externes •  Réutilisation de données •  règles métiers ou identifiant ARK •  VIAF et autres alignements existants 9
  • 10. 10
  • 11. Feuille de route data.bnf •  100% du catalogue •  mise à jour toutes les 2 semaines •  réintégration des alignements dans le catalogue •  ajout de modèles plus simples (?) •  data.bnf.fr/atelier pour avant-premières 11
  • 12. Enjeux data.bnf selon la BnF •  Visibilité et référencement •  Interopérabilité •  Fiabilité grâce à la traçabilité des URLs •  Réutilisation souple par des tiers 12
  • 13. 13
  • 14. 14
  • 15. 15
  • 16. 16
  • 17. 17
  • 18. 18
  • 19. 19
  • 20. Linked Data et bibliothèques •  http://data.bnf.fr et bibliothèques •  http://data.europeana.eu •  http://datos.bne.es, http://dnb.de, http://libris.kb.se •  Sudoc IdRef •  VIAF (Virtual International Authority File) •  etc 20
  • 21. Provenance des jeux de données •  généré par ? •  utilisé par ? •  date de début / fin ? •  dérivé de ? •  licence ? 21
  • 22. Maturité des données ouvertes 1.  Données disponibles sur le Web sous une licence ouverte 2.  + format structuré (CSV, XML, Excel, mais pas PDF ou image) 3.  + format non-propriétaire (CSV plutôt que Excel) 4.  + respect des standards RDF (identification par des URLs, vocabulaire défini: pas CSV, etc.) 5.  + liens vers d'autres données pour fournir du contexte (ontologies) et enrichir (autres jeux de données) 22
  • 25. Qu'est-ce que le web ? Réseau mondial de données construit sur la base d'un ensemble de standards d'interopérabilité (protocoles, formats, vocabulaires, modèles, interrogation), qui s'appuie sur les URLs pour identifier de manière unique les données élémentaires et les lier entre elles. “ 25
  • 26. Le Web passe à l'échelle Liens permettent collaboration à grande échelle Création d'identifiants est décentralisée (Domain Name System est délégué) Incohérence globale ("monde ouvert") permet parallélisation 26
  • 27. Attention à ne pas confondre •  web sémantique : données utilisables par un programme PAS trait. auto. des langues •  RDF et vocabulaires : standardiser les échanges de données PAS les outils et le stockage •  Un et un seul Web : un protocole (HTTP) et plusieurs standards pour l'échange de données (HTML, RDF, OWL, JSON, DC, FOAF, SKOS, etc.) 27
  • 28. Recentrage sur les données •  rassembler / collecter •  aligner / normaliser •  enrichir / annoter / classer •  définir un pivot métier avec des données de référence •  lier les données entre elles 28
  • 29. Urbanisation des données libre privé externe interne générique spécifique statique dynamique 29
  • 30. 30
  • 31. Avenir probable •  biens communs •  spécialisation territoire / langue / thème / domaine •  interopérabilité / décentralisation •  multiplicité des réutilisations 31