Linked Library Data, ou, Les bibliothèques dans le web sémantique
Le web sémantique : une nouvelle interopérabilité pour les bibliothèques
1. Le web sémantique :
une nouvelle interopérabilité
pour les bibliothèques
Jasmin Hügi
Journée «Open», 6 février 2015, Conférence alumni,
Certificat en gestion de documentation et de bibliothèque
1
2. Programme
• Du web documentaire au web sémantique
• Les Linked Open Data
• Quel lien avec les bibliothèques ?
• Des exemples concrets
• Les avantages des Linked Open Data pour les
bibliothèques
• Quel impact pour les bibliothécaires ?
2
6. Le problème du web documentaire
• Fait pour être lu et interprété par l’être humain
• Pas fait pour être interprété par la machine
• Moteurs de recherche «non-intelligents»
6
15. Le problème des données sur le web
• Données publiées dans des formats différents
• Données enfermées dans des silos
• Métadonnées arbitraires
15
16. Les principes des Linked Data
4 principes donnés par Tim Berners-Lee
16
Tim Berners-Lee. Linked Data, 2009. http://www.w3.org/DesignIssues/LinkedData.html
17. Les principes des Linked Data
1. Utiliser des adresses URI pour identifier les
choses;
2. Utiliser des adresses URI HTTP pour que l’on
puisse consulter ces identifications;
• Dans le web documentaire : donner des URI aux
documents
• Dans le web sémantique : donner des URI également aux
objets réels et concepts abstraits 17
18. Les principes des Linked Data
3. Fournir des informations utiles sous formes de
standards (RDF) lors d’une recherche d’adresse
URI;
• Les informations fournies doivent être structurées de
manière standardisée.
• RDF (Resource Description Framework)
18
19. Les principes des Linked Data
4. Inclure des liens vers d’autres adresses URI qui
permettent de découvrir d’autres informations.
• Lier un objet avec des informations externes
19
20. Pour le dire autrement
Pour avoir des Linked Data, il faut:
• Créer des liens entre les données (surtout avec
des données externes);
• Donner une URI aux données;
• Utiliser un standard commun pour formater ces
liens.
20
21. Logique des LOD
Créer des liens entre les données
21
Livre
Martin
Suter
Auteur
Le cuisinier
Titre
978-
2757820889
ISBN
Seuil
Editeur
22. Logique des LOD
Créer des liens entre les données
22
Livre
Martin
Suter
Auteur
Le cuisinier
Titre
978-
2757820889
ISBN
Seuil
Editeur
http://www.rero.ch/isbn/978- http://www.rero.ch/suter_martin
www.seuil.com
23. Logique des LOD
Créer des liens entre les données
23
http://ww
w.rero.ch/i
sbn/978-
http://www.r
ero.ch/suter_
martin
Auteur
Le cuisinier
Titre
978-
2757820889
ISBN
www.seuil.
com
Editeur
24. Logique des LOD
Créer des liens entre les données
24
http://ww
w.rero.ch/i
sbn/978-
http://www.r
ero.ch/suter_
martin
Auteur
Le cuisinier
Titre
978-
2757820889
ISBN
www.seuil.
com
Editeur
http://...
/978
C’est le même
http://...
/critique
Description
Note
Critique
Note
Description
25. Logique des LOD
Créer des liens entre les données
25
http://ww
w.rero.ch/i
sbn/978-
http://www.r
ero.ch/suter_
martin
Auteur
Le cuisinier
Titre
978-
2757820889
ISBN
www.seuil.
com
Editeur
http://.../ma
rtin_suter
Description
Date de
naissance
Bibliographie
Biographie
Date
Bibliographie
C’est le même
28. Mai 2007
28Référence pour cette image et les suivantes:
Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/
30. Encore plus de liens
30
http://ww
w.rero.ch/i
sbn/978-
http://www.r
ero.ch/suter_
martin
Auteur
Le cuisiner
Titre
978-
2757820889
ISBN
www.seuil.
com
Editeur
31. Encore plus de liens
31
http://ww
w.rero.ch/i
sbn/978-
http://www.r
ero.ch/suter_
martin
Auteur
Le cuisiner
Titre
978-
2757820889
ISBN
www.seuil.
com
Editeur
http://purl.org/dc/terms/contributor
http://purl.org/dc/terms/title
http://purl.org/dc/terms/isbn
http://purl.org/dc/terms/publisher
32. Encore plus de liens
32
http://ww
w.rero.ch/i
sbn/978-
http://www.r
ero.ch/suter_
martin
http://purl.org/dc/terms/contributor
Le cuisiner
http://purl.org/dc/terms/title
978-
2757820889
www.seuil.
com
http://purl.org/dc/terms/isbnhttp://purl.org/dc/terms/publisher
33. Les relations
• Des URIs pour les relations
• Un ensemble de relations = vocabulaire
• Ex. Dublin Core
• Les LOD permettent la combinaison de plusieurs
vocabulaires pour décrire un jeu de données.
33
36. Linked Open Data
•Interopérabilité
• juridique
• Licence ouverte qui ne restreint pas
l’utilisation, la réutilisation, ni la
redistribution
• économique
• technique
36
43. Pour pouvoir échanger, il faut
des standards
• Format d’encodage
• MARC21, UNIMARC
• Protocole d’échange
• Z39.50
• Règles de description communes
• AACR2
43
44. Les standards bibliothéconomiques …
• … sont bien, non ?
• 2 problèmes :
• Harmonisation qu’à moitié réussie
• Standards uniquement appliqués en
bibliothèque !
44
60. Meilleure interopérabilité des
données
• Utilisation d’un standard du web
• Permet une utilisation hors bibliothèques
• Recherche fédérée plus performante
• Combiner des ressources issues de
bibliothèques, archives et musées
• Combiner des ressources décrites avec
différents schémas de métadonnées 60
61. Meilleure visibilité sur le web
• Catalogue indexé par les moteurs de recherche
• Obsolescence du concept «portail»
61
64. Meilleures possibilités de
recherche
• Recherches plus précises
Je cherche toutes les premières œuvres d’auteurs
qui sont morts avant 40 et qui ont vécu au Japon.
64
66. A court terme
• Aucun impact
• Si aucune implication dans un projet LOD
• Si LOD en tant que couche à part
66
67. A long terme
• Impact pour les catalogueurs :
• Cataloging -> Catalinking
• Recherche des sources externes apportant une
plus-value pour le public desservi.
67
68. A long terme
• Impact pour les bibliothèques :
• Mettre à disposition des données fiables
• Veiller à la pérennité des liens, des
vocabulaires, des jeux de données
68
69. Bibliographie
• BERMÈS, Emmanuelle, 2013. Des parcours de sens dans le Centre Pompidou virtuel. In : [en ligne]. 1
janvier 2013. [Consulté le 7 février 2015]. Disponible à l’adresse : http://bbf.enssib.fr/consulter/bbf-2013-
05-0052-013.
• BERNERS-LEE, Tim, 2009. Linked Data. In : Design Issues [en ligne]. 18 juin 2009. [Consulté le 4 juin
2014]. Disponible à l’adresse : http://www.w3.org/DesignIssues/LinkedData.html
• CHIGNARD, Simon, 2012. Comprendre l’ouverture des données publiques. S.l. : FYP Editions.
Collection entreprendre. ISBN 9782916571706
• GANDON, Fabien, 2012. Le web sémantique: comment lier les données et les schémas sur le web.
Paris : Dunod. InfoPro. Management des systèmes d’information. ISBN 9782100572946.
• HÜGI, Jasmin, 2014. Développement d’une formation e-learning sur les Linked Open Data dans les
bibliothèques. Genève : Haute école de Gestion. Disponible prochainement à l’adresse :
http://doc.rero.ch/
• HÜGI, Jasmin et PRONGUÉ, Nicolas, 2014. Les bibliothèques face aux Linked Open Data [en ligne].
Genève. Haute école de gestion de Genève. [Consulté le 28 octobre 2014]. Disponible à l’adresse :
http://doc.rero.ch/record/209598/files/M7-2014_memoire_HUGI-PRONGUE.pdf
• HÜGI, Jasmin et PRONGUÉ, Nicolas, 2014. Le virage Linked Open Data en bibliothèque : étude des
pratiques, mise en œuvre, compétences des professionnels | Ressi. In : Ressi [en ligne]. 15
décembre 2014. Vol. No 15 décembre 2014. [Consulté le 7 février 2015]. Disponible à l’adresse :
http://www.ressi.ch/num15/article_100.
• SIMON, Agnès et WENZ, Romain, 2012. Des outils automatiques pour le signalement en
bibliothèque. In : [en ligne]. 1 janvier 2012. [Consulté le 7 février 2015]. Disponible à l’adresse :
http://bbf.enssib.fr/consulter/bbf-2012-05-0039-008.
69
Notes de l'éditeur
Présentation de moi-même
This is the classic picture of hypertext which used to be a part of talks in the days when we had to explain what hypertext is. The web is a set of nodes and links.
To a user, this has become an exciting world, but there is very little machine-readable information there. The meaning of the documents is clear to those with a grasp of (normally) English, and the significance of the links is only evident from the context around the anchor.
Le rêve de la machine intelligente.
Bordeaux
To a computer, then, the web is a flat, boring world devoid of meaning.
This is a pity, as in fact documents on the web describe real objects and imaginary concepts, and give particular relationships between them.
http://www.ifeng.com/
For example, a document might describe a person. The title document to a house describes a house and also the ownership relation with a person.
Adding semantics to the web involves two things: allowing documents which have information in machine-readable forms, and allowing links to be created with relationship values. Only when we have this extra level of semantics will we be able to use computer power to help us exploit the information to a greater extent than our own reading.
An important effect of developing security protocols on the web is the abstract space of web information is linked to reality. By taking verifiable responsibility for web statements, a party guarantees an isomorphism between the web and reality.
This means that machines, as well as operating on the web information, can do real things. For example, a program could search for a house and negotiate transfer of ownership of the house to a new owner. The land registry guarantees that the title actually represents reality.
TBL qui a spécifié quand on parle de Linked Data. Car chacun peut lier d’une manière ou d’une autre ses données. LE but est que chacun les lie de la même manière.
http: on appelle l’URI, cela nous retourne un site web.
URI permet d’identifier un objet et le protocole HTTP permet de récupérer des informations le décrivant.
Protocole HTTP = mécanisme d’accès et de récupération du web
Exemple: des personnes, des endroits, des bâtiments obtiennent une URI, mais également des couleurs ou des relations comme «connaître quelqu’un».
P.ex. on donne un URI a un livre. Si on cherche l’URI dans un navigateur, des informations sur ce livre sont fournies.
Les infos sur le livre doivent être structurées de manière standardisée.
RDF = modèle de données
http://linkeddatabook.com/editions/1.0/
Exemple: lier le livre avec l’auteur du livre. L’auteur a son propre URI qui, si on cherche cet URI via un navigateur, nous retourne des infos sur l’auteur, comme p.ex. sa date de naissance.
Avantage des LD : on peut lier tout ce qu’on veut, tant que cela a un URI.
Tout est divisé au niveau le plus petit qui soit.
Tout est divisé au niveau le plus petit qui soit.
Tout est divisé au niveau le plus petit qui soit.
Tout est divisé au niveau le plus petit qui soit.
Tout est divisé au niveau le plus petit qui soit.
Tout est divisé au niveau le plus petit qui soit.
Rendre attentif à DBpedia
Tout est divisé au niveau le plus petit qui soit.
Tout est divisé au niveau le plus petit qui soit.
Tout est divisé au niveau le plus petit qui soit.
Longtemps, plusieurs formats coexistaient, mais maintenant, la plupart utilise soit unimarc soit marc21. vieillot, beaucoup critiqué.
En suisse, nous suivons les règles anglo-saxonnes pendant par ex. les pays autours de nous utilisent des règles nationaux, p.ex. en France ou en allemange. En plus, on parle maintenant beaucoup du remplaçant des AACR2, qui est RDA, qui est adopté par certains mais pas par tous.
EAD
Romain Wenz
Intégrer des données externes
L’introduction de RDA serait certainement plus disruptive.