Your SlideShare is downloading. ×
Perspectives pour les référentiels à l'heure du Web de données
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Perspectives pour les référentiels à l'heure du Web de données

1,315
views

Published on

Published in: Technology, Travel, Business

0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
1,315
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
0
Comments
0
Likes
3
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Perspectives pour les référentiels à l’heure du Web de données JOURNÉES D’ÉTUDE AFNOR CG 46/BNF 27 MAI 2011 Gautier Poupeau Antidot, http://www.antidot.net [email_address]
  • 2. Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
  • 3. Structure Le modèle RDF permet de décloisonner les silos Les référentiels permet alors de les relier
  • 4. Structure Le modèle RDF permet de décloisonner les silos Les référentiels permet alors de les relier Les référentiels constituent des hubs de données
  • 5. Sémantique Partager une sémantique pour décrire les référentiels comme SKOS permet de les relier et de les utiliser dans une application unique… Joconde TGN Cornetto WordNet IconClass ULAN AAT RKD Artists Semantic search Lab http://eculture.cs.vu.nl/europeana/session/search
  • 6. Standards et normes Disposer d’une technologie, c’est bien, la partager, c’est mieux
  • 7. Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
  • 8. Normaliser ark:/12148/cb13091689x Vian, Boris Sullivan, Vernon skos:prefLabel skos:altLabel
  • 9. Normaliser ark:/12148/cb13091689x Vian, Boris Sullivan, Vernon dc:creator dc:creator skos:prefLabel skos:altLabel
  • 10. Normaliser ark:/12148/cb13091689x Vian, Boris Sullivan, Vernon dc:creator dc:creator skos:prefLabel skos:altLabel dc:creator
  • 11. Multilinguisme http://aims.fao.org/aos/agrovoc/c_2354 "Dolphin"@en "Dauphin"@fr " дельфины "@ru skos:prefLabel skos:prefLabel skos:prefLabel
  • 12. Multilinguisme dc:subject http://aims.fao.org/aos/agrovoc/c_2354 "Dolphin"@en "Dauphin"@fr " дельфины "@ru skos:prefLabel skos:prefLabel skos:prefLabel
  • 13. Multilinguisme dc:subject http://aims.fao.org/aos/agrovoc/c_2354 "Dolphin"@en "Dauphin"@fr " дельфины "@ru skos:prefLabel skos:prefLabel skos:prefLabel
  • 14. Multilinguisme dc:subject http://aims.fao.org/aos/agrovoc/c_2354 "Dolphin"@en "Dauphin"@fr " дельфины "@ru skos:prefLabel skos:prefLabel skos:prefLabel
  • 15. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  • 16. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  • 17. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  • 18. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  • 19. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  • 20. Désambigüiser La revanche des référentiels face à la folksonomie ! Synonymie Orthographe Homonymie Langue utilisée Abréviation Dépasser les limites de la folksonomie en rattachant un tag à un concept déclarer dans un référentiel, c’est-à-dire une URI Le service Faviki ( http://www.faviki.com ) s’appuie sur Dbpedia
  • 21. Extraire Repérer des « entités nommées » (lieu, entreprise, personne…) dans des données non structurées Open Calais ( http://www.opencalais.com/ ) de Thomson Reuters : application en ligne qui s’appuie sur des règles linguistiques et des dictionnaires/référentiels issus, entre autres, du Linked Data .
  • 22. Annoter Mots clefs Est décrit par Une ressource documentaire
  • 23. Annoter Mots clefs Est décrit par Une ressource documentaire Chaîne de caractères Est exprimé par
  • 24. Annoter Mots clefs Est décrit par Une ressource documentaire Un thésaurus Concept Organise Chaîne de caractères Est exprimé par Étiquette Est décrit par
  • 25. Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique Une ressource documentaire Un thésaurus Concept Organise Chaîne de caractères Est exprimé par Étiquette Est décrit par Chaîne de caractères Est exprimé par
  • 26. Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique Une ressource documentaire Un thésaurus Concept Organise Pour lier le mot-clé au concept Chaîne de caractères Est exprimé par Étiquette Est décrit par Chaîne de caractères Est exprimé par
  • 27. Annoter Mots clefs Est décrit par Le moteur effectue une comparaison morphologique Une ressource documentaire Un thésaurus Concept Organise Pour lier le mot-clé au concept Chaîne de caractères Est exprimé par Étiquette Est décrit par Chaîne de caractères Est exprimé par Est décrit par
  • 28. Classification par entraînement
      • le moteur utilise les documents déjà classés pour apprendre
  • 29. Classification par entraînement
      • le moteur utilise les documents déjà classés pour apprendre
      • puis utilise la base d’indicateurs statistiques pour catégoriser les 900 000 documents du corpus
  • 30. Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
  • 31. La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
  • 32. La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
  • 33. La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
  • 34. La hiérarchie Bleu Rouge Marine Pastel Azur Vermillon Tomate Ponceau Couleurs
  • 35. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
  • 36. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
  • 37. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
  • 38. Les alignements Computer hackers Nervous System Information Superhighway Pirates informatiques Système nerveux Autoroutes de l’information LCSH Rameau
  • 39. Les alignements Archives nationales Bibliothèque nationale de France Archives de Robespierre récemment préemptées
  • 40. Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.culture.gouv.fr/ thesaurus/resource/T4-5 France -- 1789-1799 (Révolution) http://stitch.cs.vu.nl/vocabularies/rameau/ ark:/12148/cb11941849g Archives de Robespierre récemment préemptées
  • 41. Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.culture.gouv.fr/ thesaurus/resource/T4-5 France -- 1789-1799 (Révolution) http://stitch.cs.vu.nl/vocabularies/rameau/ ark:/12148/cb11941849g Archives de Robespierre récemment préemptées
  • 42. Les alignements Archives nationales Bibliothèque nationale de France Révolution de 1789 http://www.archivesdefrance.culture.gouv.fr/ thesaurus/resource/T4-5 France -- 1789-1799 (Révolution) http://stitch.cs.vu.nl/vocabularies/rameau/ ark:/12148/cb11941849g Rebond Archives de Robespierre récemment préemptées
  • 43. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme
  • 44. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract
  • 45. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract skos:definition
  • 46. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract skos:definition dc:subject
  • 47. Les informations complémentaires Terreur (1793-1794) Contexte historique Thésaurus W skos:inScheme http://dbpedia.org/resource/Reign_of_Terror foaf:focus La Terreur est le nom par lequel on désigne deux périodes de la Révolution française au cours desquelles la France est gouvernée par un pouvoir d’exception reposant sur la force, l’illégalité et la répression; elle est principalement politique et répressive. dbpedia-owl:abstract skos:definition dc:subject
  • 48. Les informations complémentaires Paris Geonames 48.856667 2.350833 geo:long geo:lat
  • 49. Les informations complémentaires Paris Geonames dc:coverage 48.856667 2.350833 geo:long geo:lat
  • 50. Les informations complémentaires Paris Geonames dc:coverage 48.856667 2.350833 geo:long geo:lat
  • 51. Plan Interopérabilité/standard Exploiter la structure Exploiter le vocabulaire Usages
  • 52. Auto-complétion à la requête A la frappe de l’utilisateur, proposition de concepts liés aux ressources du corpus
  • 53. Suggestion à la recherche Suggestion de concepts pour désambiguïser les termes de la requête ou proposer un élargissement de recherche
  • 54. Recherche par facettes Si une ressource associée à un terme spécifique
  • 55. Recherche par facettes Si une ressource associée à un terme spécifique , elle est aussi associée à son terme générique.
  • 56. Recherche par facettes Si une ressource associée à un terme d’un référentiel
  • 57. Recherche par facettes Si une ressource associée à un terme d’un référentiel , elle est aussi associée au terme équivalent dans un autre référentiel.
  • 58. Regroupement de résultats Le regroupement des résultats se fait en fonction des différents concepts du référentiel
  • 59. Nuage de mots clés Nuage créé automatiquement par annotation automatique des métadonnées avec Rameau et Pactols
  • 60. Navigation par concepts
  • 61. Navigation par concepts
  • 62. Navigation par concepts
  • 63. Construction de requêtes structurées A partir des métadonnées , en particulier des concepts associés, construction d’une nouvelle requête structurée.
  • 64. Construction de requêtes structurées L’utilisateur peut ainsi mieux qualifier sa requête avec un vocabulaire contrôlé et limité tout en étant assuré d’un résultat.
  • 65. Recherche orientée sur les concepts Prendre connaissance d’un corpus par l’analyse de l’utilisation d’un concept http://www.lespetitescases.net/semweblabs/isidore/
  • 66. Champ lexical d’un concept Classement selon leurs fréquences des concepts présents dans les mêmes documents que le concept recherché http://www.lespetitescases.net/semweblabs/isidore/tagCloud.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z
  • 67. Analyse statistique du corpus (1) Analyse de la présence du concept dans les différentes sources de données http://www.lespetitescases.net/semweblabs/isidore/sources.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z
  • 68. Analyse statistique du corpus (2) http://www.lespetitescases.net/semweblabs/isidore/statistiques.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z Analyse de la présence du concept dans le temps
  • 69. Analyse statistique du corpus (3) http://www.lespetitescases.net/semweblabs/isidore/disciplines.php?uri=http://www.rechercheisidore.fr/subject/ark:/12148/cb12650518z Analyse de la présence d’un concept en le croisant avec les concepts d’un autre référentiel
  • 70. MERCI DE VOTRE ATTENTION ! DES QUESTIONS ?