Your SlideShare is downloading. ×
0

Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!

4,009

Published on

Intervention à la BM de LYON lors des 23e ENTRETIENS JACQUES CARTIER : Les bibliothèques du XXIe siècle

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
4,009
On Slideshare
0
From Embeds
0
Number of Embeds
18
Actions
Shares
0
Downloads
40
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Transcript of "Information Scientifique et Technique : pour des moteurs efficaces, liberez les donnees!!"

  1. 1. Information scientifique et technique : « Pour des moteurs efficaces, libérez les données !!! » Christine Fleury – ABES 23ème Entretiens Jacques Cartier 22 novembre 2010
  2. 2. Trois générations de moteurs de recherche Pour la petite histoire …
  3. 3. « Je vous parle d’un temps » Merci à la WayBack Machine
  4. 4. De la « sainte trinité » ….
  5. 5. Visualisations …
  6. 6. Visualisations …
  7. 7. Recherche universelle ???
  8. 8. Moteurs / métamoteurs spécialisés IST
  9. 9. Moteur de recherche Sources et moteurs Open Access … Résolveur de lien - DOI Données bibliographiques médicales Analyse des citations
  10. 10. Sources et moteurs de France …
  11. 11. Des moteurs ---
  12. 12. Des moteurs ---
  13. 13. Encore des moteurs …
  14. 14. LeWeb, un univers en expansion
  15. 15. Et cependant ---- -----------
  16. 16. « RAW DATA NOW !!! » (TIM BERNERS LEE - 2009)
  17. 17. Vers un Web « de données liées» Comment ?  S’imprégner de la philosophie du web de données et de la culture des standards duWeb  Sortir les données de leurs entrepôts (bases de données… ) pour les rendre disponibles sur le WEB  = conditions pour entrer dans l’écosystème du linked data web Pourquoi ?  Valoriser « nos » données  tirer bénéfice des données créées par les autres  exploiter la richesse des données (scientifiques, gouvernementales, statistiques, encyclopédiques, d’autorité, bibliographiques) Voir vidéoTim Berners LEETED 2009
  18. 18. RDF ??? Recommandation du W3C  RDF (Resource Description Framework) = le langage de base duWeb sémantique  un langage très ouvert conçu pour la description utilisé (notamment) pour décrire les ressources du web et leur métadonnées et permettre leur traitement automatique (machine readable).  une structure qui peut s’écrire dans différentes syntaxes (=langages informatiques)  RDF/XML + RDFA,Turtle …  Un langage de requête spécifique : SPARQL Voir la recommandation duW3C (en français)
  19. 19.  Une structure « élastique » qui intègre différents vocabulaires :  SKOS (Simple Knowledge Organization System) = représentation dans un contexte multilingue de tout vocabulaire contrôlé (thésaurus, classifications, taxonomies, etc )  FOAF (Friend of a Friend ) = description de personnes et des relations entre elles  mais aussi : OWL,Yago,Wordnet, DCterm (DublinCore), Geoname …. Une langue,des vocabulaires
  20. 20. RDF : un monde d’URI…  chaque ressource (= objet, lieu, livre, auteur …..) est identifiée par une -ou plusieurs - URI -(= identifiant uniforme de ressource)  ex : un oiseau = http://stitch.cs.vu.nl/vocabularies/rameau/ark:/12148/cb1 1932889r  ex : Les Boulassiers = http://sws.geonames.org/3031189/  ex : Aristote = http://viaf.org/viaf/7524651/#Aristotle « same as » http://www.idref.fr/026690276/id
  21. 21. Sujet ( = ce qu’on décrit ) http://www.w3.org/Home/Lassila Prédicat ( = une Propriété applicable à ce qu’on décrit ) A pour Créateur Objet (= une valeur ) "Ora Lassila" RDF : le principe des triplets Les données sont décomposées / recomposées en « triplets RDF » …. et modélisées en « graphes RDF »
  22. 22. Sujet/prédicat/objet  Quatre-vingt-treize est un roman deVictor Hugo paru en 1874 et dont le thème est la révolution française  Quatre-vingt-treize est un roman  Quatre-vingt-treize a pour auteur Victor Hugo  Quatre-vingt-treize est paru en 1874  Quatre-vingt-treize a pour thème la Révolution française  (Quatre-vingt-treize, type, roman)  (Quatre-vingt-treize, auteur,Victor Hugo)  (Quatre-vingt-treize, année de parution, 1874)  (Quatre-vingt-treize, thème, La Révolution Française) Exemple emprunté à Bernard Vatant – in Métadonnées, perspectives et Mutations Séminaire INRIA – 2008)
  23. 23. Sujet / prédicat / objet Ressource = 1 URI = http://dbpedia.org/resource/Ninety-Three dbpedia : Ninety-Three rdf:type yago:Novel106367879 dbpedia : Ninety-Three dcterms : creator dbpedia :Victor Hugo dbpedia : Ninety-Three dcterms : created « 1874 » dbpedia : Ninety-Three skos:subject dbpedia : Category : French revolution
  24. 24. Diapo : Emmanuelle BermèsEn d’autres termes ….
  25. 25. FOAF Whos’ who ?
  26. 26. Bases de connaissances en accès libre  Data.gov : 305. 692 Datasets (nov.2010)  http://data.gov.uk/  DBPedia : 3,4 millions d'entités  Geoname : 8 millions de noms géographiques  Musicbrainz
  27. 27. C’est où ???
  28. 28. http://sws.geonames.org/3031189 ???? <rdf:RDF> <gn:Feature rdf:about="http://sws.geonames.org/3031189/"> <rdfs:isDefinedBy>http://sws.geonames.org/3031189/about.rdf</rdfs:isDefinedBy> <gn:name>Pointe des Boulassiers</gn:name> <gn:featureClass rdf:resource="http://www.geonames.org/ontology#T"/> <gn:featureCode rdf:resource="http://www.geonames.org/ontology#T.PT"/> <gn:countryCode>FR</gn:countryCode> <wgs84_pos:lat>46.01667</wgs84_pos:lat> <wgs84_pos:long>-1.33333</wgs84_pos:long> <gn:parentFeature rdf:resource="http://sws.geonames.org/2986492/"/> <gn:parentCountry rdf:resource="http://sws.geonames.org/3017382/"/> <gn:parentADM1 rdf:resource="http://sws.geonames.org/2986492/"/> <gn:nearbyFeatures rdf:resource="http://sws.geonames.org/3031189/nearby.rdf"/> <gn:locationMap rdf:resource="http://www.geonames.org/3031189/pointe-des-boulassiers.html"/> </gn:Feature> <foaf:Document rdf:about="http://sws.geonames.org/3031189/about.rdf"> <foaf:primaryTopic rdf:resource="http://sws.geonames.org/3031189/"/> <cc:license rdf:resource="http://creativecommons.org/licenses/by/3.0/"/> <cc:attributionURL rdf:resource="http://sws.geonames.org/3031189/"/> <cc:attributionName rdf:datatype="http://www.w3.org/2001/XMLSchema#string">GeoNames</cc:attributionName> <dcterms:created rdf:datatype="http://www.w3.org/2001/XMLSchema#date">2006-01-15</dcterms:created> <dcterms:modified rdf:datatype="http://www.w3.org/2001/XMLSchema#date">1994-01-06</dcterms:modified> </foaf:Document> </rdf:RDF>
  29. 29. Pointe des Boulassiers France » Poitou-Charentes point N 46° 1' 0''W 1° 20' 0'' 46.01667 / -1.33333 GeoNameId : 3031189
  30. 30. Des silos de «données brutes»
  31. 31. Visualisation
  32. 32. Mashup de données
  33. 33. … et les bibliothèques ???
  34. 34. … et les bibliothèques ??? Réalisations  Rameau en SKOS (TEL Plus Project)  VIAF :Virtual International Authority File (OCLC)  Dewey en RDF (expérimentationOCLC)  IdREF : autorités Sudoc en RDF (ABES) Vocabulaires RDF  Dublin Core (DCMI) en RDF = DublinCoreTerms  FRBR / FRAD (modèles conceptuels)  RDA en RDF : nouvelles (futures ?) règles de catalogage
  35. 35. La DEWEY en RDF (OCLC)
  36. 36. RAMEAU en SKOS (TelPlus)
  37. 37. VIAF (OCLC)
  38. 38. Données Marc transposées en RDF
  39. 39. + utilisation des données externes
  40. 40. Données libérées = Moteurs sémantiques ???
  41. 41. Questions en langage naturel ?
  42. 42. Pour en savoir plus …. Tim Berners-Lee :The Next Web of Open, Linked Data (TED 2009) http://dai.ly/cvIl6P (sous-titré en français) LinkingOpenData http://esw.w3.org/SweoIG/TaskForces/CommunityProjects/LinkingOpenData SKOS http://www.w3.org/2004/02/skos/ Projet Open Library http://openlibrary.org/about/lib LIBRIS : un catalogue dans le linked data http://dc2008.de/wp-content/uploads/2008/09/malmsten.pdf Les catalogues de bibliothèques sur leWeb – Emmanuelle Bermès (2009) http://www.slideshare.net/Figoblog/les-catalogues-sur-le-web Le web sémantique : un web de métadonnées –Yann Nicolas http://www.slideshare.net/yannn/le-web-smantique-un Métadonnées : mutations et perspectives – Séminaire INRIA - 29 sept./ 3 oct. 2008 – Dijon – ADBS Editions
  43. 43. Merci à …. … porte d’entrée (toujours) indispensable …. pour collecter les informations et données ayant servi à cette présentation …. àYann Nicolas (ABES) et Emmanuelle Bermes (BNF), initiateurs en RDF Cette présentation est placée sous licence Creative Commons
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×