Sudoc, Calames, theses.fret le Web de données<br />Atelier JABES2011<br />
Vers le Web de données<br />
Il faut participer au Web de données 			[Acquis]<br />
Objectifs de l’atelier<br />Faire un bilan d’étape<br />Montrer les données<br />Justifier certains choix<br />Expliquer c...
Partons du connu<br />
S’agit-il de données RDF ou d’une simple notice Dublin Core ?<br />
RDF nu<br />
about<br />En RDF, il faut expliciter de quoi on parle en l’identifiant par une URL : http://www.sudoc.fr/013041932/id<br ...
triplets<br />En RDF, tout est décomposé en triplets<br />Chaque triplet est indépendant<br />Chaque triplet pourrait être...
 Une autre source peut la compléter, si elle parle de la même chose : http://www.sudoc.fr/013041932/id
 Interopérabilité. Extensibilité. </li></li></ul><li>Identifier la langue avec le référentiel Lexvo<br />
Mettre en relation un document et une langue<br />La langue n’est pas un code (‘fre’)<br />La langue est une entité à part...
http://www.lexvo.org/id/iso639-3/fra décrite en HTML <br />
http://www.lexvo.org/id/iso639-3/fra décrite en RDF<br />
De fil en aiguille<br />La description de la langue poursuit la description du document Sudoc<br />Où s’arrêter ?<br />C’e...
Identifier les personnes avec IdRef<br />
IdRef, fournisseur d’identifiants et de référentiels<br />www.idref.fr = application Web ouverte<br />Ouverte sur le Web d...
IDREF Autorités Sudoc<br />Sudoc et IdRef<br />Sudoc<br />
Les autorités Sudoc,pivot du Linked data ABES<br />theses.fr<br />Sudoc<br />Thèses soutenues<br />et<br />Thèses en cours...
RDFa de Calames<br />Pas de page RDF/XML<br />Le RDF est caché dans le HTML de http://www.calames.abes.fr/pub/ms/Calames-2...
http://www.calames.abes.fr/pub/ms/Calames-2010914119419211<br />RDFa de Calames<br />
RDFa de theses.fr<br />Pas encore de page RDF/XML<br />Le RDF est caché dans le HTML de http://www.theses.fr/2009TOUR3802<...
Les thèsesportant sur les correspondants de Goethe<br />PREFIX foaf: <http://xmlns.com/foaf/0.1/><br />PREFIX dc: <http://...
Lier les données à IdRef, au-delà de l’ABES<br />
Linked data IST.fr ?<br />?<br />theses.fr<br />Sudoc<br />Thèses soutenues<br />et<br />Thèses en cours ( 2011)<br />Auto...
IdRef comme nœud régional<br />Positionnement d’IdRef : IST français<br />En complémentarité avec d’autres fournisseurs d’...
Autorités BnF<br />DBpedia<br />VIAF<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogiq. ?<br />HAL ...
Lier les données de l’IST entre elles, au-delà d’IdRef<br />
Linked data IST.fr ? Les labos !<br />?<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogique X<br />...
Linked data IST.fr ? Les affiliations<br />PRISMES (AMUE) locaux<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plate...
On parle de la même chose<br />owl:sameAs<br />
Identifier et nommer les personnes avec IdRef<br />
Identifier les concepts avec IdRef et RAMEAU<br />
IdRef et Rameau<br />Identifiants IdRef pour Rameau<br />A lier aux identifiants canoniques, ceux du centre national Ramea...
Préciser le rôle des agents avec les MARC Relators<br />
L’embarras du choix ?<br />dcterms:creator<br />dcterms:contributor<br />marcrel:aut<br />rda:authorWork<br />tef:auteur ?...
Qui utilise explicitementmarcrel:aut<br />		utilise implicitementdc:contributor<br />
Raisonnement<br />Le Sudoc dit :<br />http://www.sudoc.fr/012367206/id     marcrel:aut     http://www.idref.fr/ 026975262 ...
Qui utilise marcrel:aut<br />		peut également tef:auteur,<br />malgré la redondance apparente<br />
tef:auteur<br />Ne semble rien dire de plus que marcrel:aut<br />Mais possède une propriété intéressante :<br />C’est une ...
Raisonnement<br />Quelqu’un dit :<br />http://www.sudoc.fr/012367206/id     tef:auteur     http://www.idref.fr/035200898/i...
Démo<br />Fichier (fusion des triplets RDF) : http://193.52.69.127/xml/rdf/sperber_turtle.txt<br />Outils de raisonnement ...
Raisonnement<br />RDF, c’est de la logique<br />Travaux en cours avec le LIRMM pour ADONIS sur les données Persée<br />Obl...
Page RDF complète<br />
Une pincée de RDA et de FRBR<br />
Conclusion<br />
Convertir en RDF<br />Aussi indéterminé que « convertir en Excel » !<br /><ul><li>Quelle modélisation ?
Quels vocabulaires réutiliser ?
Upcoming SlideShare
Loading in...5
×

Sudoc, Calames, theses.fr et le Web de données

1,716

Published on

Atelier sur le Web de données lors des Journées ABES 2011

Published in: Education, Technology, Business

Sudoc, Calames, theses.fr et le Web de données

  1. 1. Sudoc, Calames, theses.fret le Web de données<br />Atelier JABES2011<br />
  2. 2. Vers le Web de données<br />
  3. 3. Il faut participer au Web de données [Acquis]<br />
  4. 4. Objectifs de l’atelier<br />Faire un bilan d’étape<br />Montrer les données<br />Justifier certains choix<br />Expliquer comment ça marche<br />Manipuler quelques outils simples<br />Esquisser la suite du travail à mener<br />Nous<br />Vous<br />
  5. 5. Partons du connu<br />
  6. 6.
  7. 7. S’agit-il de données RDF ou d’une simple notice Dublin Core ?<br />
  8. 8. RDF nu<br />
  9. 9. about<br />En RDF, il faut expliciter de quoi on parle en l’identifiant par une URL : http://www.sudoc.fr/013041932/id<br />http://www.sudoc.fr/013041932/id est l’identifiant du document décrit<br />http://www.sudoc.fr/013041932/id est décrit à cette page-là http://www.sudoc.fr/013041932<br />
  10. 10. triplets<br />En RDF, tout est décomposé en triplets<br />Chaque triplet est indépendant<br />Chaque triplet pourrait être stocké séparément<br /><ul><li> Pas de notice finie
  11. 11. Une autre source peut la compléter, si elle parle de la même chose : http://www.sudoc.fr/013041932/id
  12. 12. Interopérabilité. Extensibilité. </li></li></ul><li>Identifier la langue avec le référentiel Lexvo<br />
  13. 13.
  14. 14. Mettre en relation un document et une langue<br />La langue n’est pas un code (‘fre’)<br />La langue est une entité à part entière<br />Avec son propre identifiant http://lexvo.org/id/iso639-3/fra<br />et ses propres propriétés<br />La propriété dcterms:language met en relation deux entités<br />
  15. 15. http://www.lexvo.org/id/iso639-3/fra décrite en HTML <br />
  16. 16. http://www.lexvo.org/id/iso639-3/fra décrite en RDF<br />
  17. 17. De fil en aiguille<br />La description de la langue poursuit la description du document Sudoc<br />Où s’arrêter ?<br />C’est sans fin<br />C’est le Web de données<br />
  18. 18. Identifier les personnes avec IdRef<br />
  19. 19.
  20. 20. IdRef, fournisseur d’identifiants et de référentiels<br />www.idref.fr = application Web ouverte<br />Ouverte sur le Web de données<br />Ouverte à d’autres applications IST (France)<br />Par son Web Service de recherche<br />Par ses fonctions d’intégration (Javascript)<br />Différents moyens/services pour récupérer et exploiter les identifiants et les données des autorités Sudoc ABES.<br />
  21. 21. IDREF Autorités Sudoc<br />Sudoc et IdRef<br />Sudoc<br />
  22. 22. Les autorités Sudoc,pivot du Linked data ABES<br />theses.fr<br />Sudoc<br />Thèses soutenues<br />et<br />Thèses en cours (2011)<br />Autorités Sudoc<br />Calames<br />
  23. 23. RDFa de Calames<br />Pas de page RDF/XML<br />Le RDF est caché dans le HTML de http://www.calames.abes.fr/pub/ms/Calames-2010914119419211<br />Pour révéler le RDF caché ,<br />utiliser un outil comme<br />
  24. 24. http://www.calames.abes.fr/pub/ms/Calames-2010914119419211<br />RDFa de Calames<br />
  25. 25. RDFa de theses.fr<br />Pas encore de page RDF/XML<br />Le RDF est caché dans le HTML de http://www.theses.fr/2009TOUR3802<br />Pour révéler le RDF caché ,<br />utiliser un outil comme<br />
  26. 26. Les thèsesportant sur les correspondants de Goethe<br />PREFIX foaf: <http://xmlns.com/foaf/0.1/><br />PREFIX dc: <http://purl.org/dc/elements/1.1/><br />PREFIX ead: <info:ms#><br />PREFIX tef: <http://www.abes.fr/abes/documents/tef/><br />SELECT ?these<br />{<br />?ms dc:creator <http://www.abes.fr/su/res/026895528>.<br />?ms ead:destinataire ?destinataire.<br />?these a tef:Thesis.<br />?these dc:subject ?destinataire<br />}<br />La requête exploite les données Calames et STAR<br />
  27. 27. Lier les données à IdRef, au-delà de l’ABES<br />
  28. 28. Linked data IST.fr ?<br />?<br />theses.fr<br />Sudoc<br />Thèses soutenues<br />et<br />Thèses en cours ( 2011)<br />Autorités Sudoc<br />Plateforme pédagogiq. ?<br />HAL ?<br />revues.<br />org ?<br />Presses univ. de Y ?<br />Calames<br />Persée ?<br />
  29. 29. IdRef comme nœud régional<br />Positionnement d’IdRef : IST français<br />En complémentarité avec d’autres fournisseurs d’identifiants et de référentiels :<br />Local : identifiants propres à une application, à un annuaire<br />Régional : BnF, auteurs HAL, CERL, DAI (NL)<br />Global : VIAF, DBpedia<br />
  30. 30. Autorités BnF<br />DBpedia<br />VIAF<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogiq. ?<br />HAL ?<br />revues.<br />org ?<br />Presses univ. de Y ?<br />Calames<br />Persée ?<br />
  31. 31. Lier les données de l’IST entre elles, au-delà d’IdRef<br />
  32. 32. Linked data IST.fr ? Les labos !<br />?<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogique X<br />HAL<br />revues.<br />org<br />Presses univ. de Y<br />Calames<br />Référentiel des laboratoires<br />Persée<br />
  33. 33. Linked data IST.fr ? Les affiliations<br />PRISMES (AMUE) locaux<br />theses.fr<br />Sudoc<br />Autorités Sudoc<br />Plateforme pédagogique X<br />HAL<br />revues.<br />org<br />Presses univ.s de Y<br />Calames<br />Référentiel des laboratoires<br />Persée<br />
  34. 34. On parle de la même chose<br />owl:sameAs<br />
  35. 35. Identifier et nommer les personnes avec IdRef<br />
  36. 36.
  37. 37. Identifier les concepts avec IdRef et RAMEAU<br />
  38. 38.
  39. 39. IdRef et Rameau<br />Identifiants IdRef pour Rameau<br />A lier aux identifiants canoniques, ceux du centre national Rameau (BnF) quand ils seront officiellement publiés.<br />MeSH<br />Dewey<br />
  40. 40. Préciser le rôle des agents avec les MARC Relators<br />
  41. 41.
  42. 42.
  43. 43. L’embarras du choix ?<br />dcterms:creator<br />dcterms:contributor<br />marcrel:aut<br />rda:authorWork<br />tef:auteur ?<br />
  44. 44. Qui utilise explicitementmarcrel:aut<br /> utilise implicitementdc:contributor<br />
  45. 45. Raisonnement<br />Le Sudoc dit :<br />http://www.sudoc.fr/012367206/id marcrel:aut http://www.idref.fr/ 026975262 /id<br />La Bibliothèque du Congrès dit (ici) :<br />Marcrel:autrdfs:subPropertyOfdc:contributor<br />Un outil de raisonnement pourra en déduire que :<br />http://www.sudoc.fr/012367206/id dc:contributor http://www.idref.fr/ 026975262 /id<br />
  46. 46. Qui utilise marcrel:aut<br /> peut également tef:auteur,<br />malgré la redondance apparente<br />
  47. 47. tef:auteur<br />Ne semble rien dire de plus que marcrel:aut<br />Mais possède une propriété intéressante :<br />C’est une propriété fonctionnelle<br />= <br />Une thèse ne peut avoir qu’un auteur<br />= <br />si une thèse a deux auteurs, c’est deux fois le même !<br />
  48. 48. Raisonnement<br />Quelqu’un dit :<br />http://www.sudoc.fr/012367206/id tef:auteur http://www.idref.fr/035200898/id<br />Quelqu’un d’autre dit :<br />http://www.sudoc.fr/012367206/id tef:auteur http://www.viaf.org/123456789<br />Une ontologie TEF dit :<br />http://www.abes.fr/tef/auteur rdf:typeowl:ObjectPropertyowl:FunctionalProperty<br />(une thèse ne peut avoir qu’1 auteur, au sens de tef:auteur)<br />(mais elle peut avoir 2 dc:creator)<br />Un outil de raisonnement pourra en déduire que :<br />http://www.idref.fr/035200898/id owl:sameAs http://www.viaf.org/123456789<br />
  49. 49. Démo<br />Fichier (fusion des triplets RDF) : http://193.52.69.127/xml/rdf/sperber_turtle.txt<br />Outils de raisonnement :<br />http://www.ivan-herman.net/Misc/2008/owlrl/<br />http://inspector.sindice.com<br />
  50. 50. Raisonnement<br />RDF, c’est de la logique<br />Travaux en cours avec le LIRMM pour ADONIS sur les données Persée<br />Oblige à qualité des données et rigueur de la modélisation<br />Sinon : on génère n’importe quoi !<br />Usages :<br />Enrichir les données<br />Expliciter les données<br />Mettre au jour des incohérences<br />
  51. 51. Page RDF complète<br />
  52. 52.
  53. 53. Une pincée de RDA et de FRBR<br />
  54. 54. Conclusion<br />
  55. 55. Convertir en RDF<br />Aussi indéterminé que « convertir en Excel » !<br /><ul><li>Quelle modélisation ?
  56. 56. Quels vocabulaires réutiliser ?
  57. 57. Forger son propre vocabulaire ?
  58. 58. Nos données historiques sont-elles éligibles à ces nouvelles modélisations ?</li></ul>cf. notre dc:format et notre dc:publisher<br />
  59. 59. Trois lièvres à la fois<br />
  60. 60. La suite<br />Enrichir encore les conversions en RDF<br />Multiplier si nécessaire les vocabulaires employés, sans craindre les redondances<br />Ajouter des liens internes et externes (IST française, BnF, OCLC, Dbpedia, Freebase, etc.)<br />Encourager les partenaires à diffuser leurs données en RDF, en s’appuyant sur des référentiels communs (IdRef)<br />Continuer à exploiter ces données en RDF avec le LIRMM et d’autres<br />
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×