Web de

données
Thomas Francart, sparna.fr
Ce travail est réutilisable et modifiable librement, y compris à des fins comme...
Le web pour

un humain

2
The Man Who Mistook His Wife for a Hat :
And Other Clinical Tales by Oliver W. Sacks
In his most extraordinary book, "one ...
Le même web pour

une machine

4
jT6( 9PlqkrB Yuawxnbtezls +µ:/iU zauBH
1&_à-6 _7IL:/alMoP, J²* sW Lùh,5* /1 )0hç&
dH bnzioI djazuUAb aezuoiAIUB zsjqkUA 2H...
Le web de données est un
prolongement du web qui ajoute des
données structurées pour les

machines
6
Chapitre I : le web de données pour

Structurer
Pourquoi

structurer les contenus ?
Pour améliorer la

recherche d’informations
interne

et/ou
Synonymie
Voilier ?
Bateau ?
Navire ?
… dans une bouteille, un flacon, une flasque ?
Polysémie
Multilinguisme
Cherchez sur le web :
recette pizza végétarienne rapide
La pertinence et la réutilisation
de ce résultat ne peuvent être f...
Formalisons les descriptions
avec des atomes :

sujet verbe complément
Une description plus formelle :
Pizza de Tiphaine est une recette de pizza
Pizza de Tiphaine a pour ingrédient tomate
Pizz...
Oui mais…
comment exprimer de façon

non-ambigüe
ces descriptions ?

« a pour ingrédient », « contient », « has ingredient...
En utilisant une interprétation commune des
descriptions qui s’appuie sur des

Vocabulaires partagés
Autrement appelés

On...
Une description plus formelle :
ex:pizza23 rdf:type recette de pizza
ex:pizza23 food:hasIngredient tomate
ex:pizza23 food:...
Comment ces

snippets enrichis

sont-ils générés ?
Question plus formelle
?truc rdf:type recette de pizza
?truc schema:cookingTime < 20 min
?truc dc:subject végétarienne
Google schema.org : Recipe
moyen

Par quel
les ontologies identifient-elles de
façon non-ambigüe les sujets, les
verbes et les compléments ?
Grâce à des

URIs

http://mydomain.org/mypath/myresource
URL URI

identifier
ce qui existe sur
le web
http://mon.site.fr

Fabien Gandon : http://fr.slideshare.net/fabien_gandon

i...
URL : n° de téléphone
URI : n° de sécurité sociale

Bonne pratique : sur le web de
données, toutes les URIs sont

des URLs
IRI :

Des URIs

UNICODE

Internationalized
Resource
Identifier
Chapitre II : le web de données pour

Publier
Pourquoi

utiliser les standards du
web pour publier des
données ?
Par exemple pour

partager des données
entre partenaires,
entre applications
Quel est le mode de
communication

le plus simple ?

« point à point » : chaque 
source/application a un format ou 
une AP...
Publier des données ? C’est de
l’Open Data alors ?
Données ouvertes
Louvre

est à

Paris

Données Web
Paris

=

/fr.
tp:/
...
Chapitre III : le web de données pour

Relier
Pourquoi

relier des informations
entre elles ?
Par exemple pour

intégrer des données de
sources différentes dans
une seule application
Tiré de http://graphityhq.com
Tiré de http://graphityhq.com
Des données peuvent

parler du même « sujet »
que d’autres données

http://exemple.com/Elvis
joue de la guitare

http://ex...
Des données peuvent

utiliser en « complément »
un sujet d’autres données

http://data.insee.fr/Paris
est en France

Elvis...
Des données peuvent

utiliser un « verbe »
défini dans d’autres données
http://exemple.fr/rencontre
est une
propriété (qui...
documents

D’un web de
identifiés par des URLs et reliés par
des liens hypertextes…
données

… à un web de
identifiées par des URIs
et reliées grâce à des triplets
« sujets verbe complément »
Google Knowledge Graph
et
Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein
dbpedia
Logiciel d’extraction

GPS culturel

applications

wikipedia

index de
collections

enseignement

accessibilité
in...
Chapitre IV

(Ré-)utiliser
Le web
de données
Blablabla,
blablablabla
Il nous a pas dit que ça
marchait déjà son truc ?

Arrière plan de l’image issu ...
Cherchez le rapport entre:
- Pierre Curie: Physicien Français
- Boutros Boutros Ghali: Diplomate
Egyptien
- Jackie Kennedy...
http://relfinder.dbpedia.org
De

quelles données

dispose-t-on sur le web de données ?
http://sig.ma
Utiliser le web de données pour

enrichir une application
http://seevl.net
Utiliser le web de données pour

proposer une navigation
riche dans un contenu
http://labs.sparna.fr
Enrichir les résultats de
recherche avec DBPedia
(et au passage générer des revenus publicitaires en
détournant wikipedia)...
Comment

améliorer un système
de recherche
en utilisant le web de données ?
http://hdalab.iri-research.org
Conclusion

Structurer
Publier
Relier
(Ré-)utiliser
Thomas FRANCART
sparna.fr
Crédits : Fabien Gandon, Serge Garlatti,
Pierre-Yves Vandenbussche
Web de données - une introduction
Web de données - une introduction
Web de données - une introduction
Web de données - une introduction
Web de données - une introduction
Web de données - une introduction
Web de données - une introduction
Upcoming SlideShare
Loading in...5
×

Web de données - une introduction

1,630

Published on

Introduction au web de données et à ses enjeux destinée à ceux qui découvrent. Fait normalement office d'introduction avant la formation sur RDF.

Published in: Technology

Web de données - une introduction

  1. 1. Web de données Thomas Francart, sparna.fr Ce travail est réutilisable et modifiable librement, y compris à des fins commerciales, à condition de citer son auteur et d’être placé sous la même licence. Pour plus d’informations, voir la licence. Crédits : Ce travail remixe des éléments de Fabien Gandon, Serge Garlatti et Pierre-Yves Vandenbussche
  2. 2. Le web pour un humain 2
  3. 3. The Man Who Mistook His Wife for a Hat : And Other Clinical Tales by Oliver W. Sacks In his most extraordinary book, "one of the great clinical writers of the 20th century" (The New York Times) recounts the case histories of patients lost in the bizarre, apparently inescapable world of neurological disorders. Oliver Sacks's The Man Who Mistook His Wife for a Hat tells the stories of individuals afflicted with fantastic perceptual and intellectual aberrations: patients who have lost their memories and with them the greater part of their pasts; who are no longer able to recognize people and common objects; who are stricken with violent tics and grimaces or who shout involuntary obscenities; whose limbs have become alien; who have been dismissed as retarded yet are gifted with uncanny artistic or mathematical talents. If inconceivably strange, these brilliant tales remain, in Dr. Sacks's splendid and sympathetic telling, deeply human. They are studies of life struggling against incredible adversity, and they enable us to enter the world of the neurologically impaired, to imagine with our hearts what it must be to live and feel as they do. A great healer, Sacks never loses sight of medicine's ultimate responsibility: "the suffering, afflicted, fighting human subject." Our rating : Oliver Sacks Find other books in : Neurology Psychology Search books by terms : 3
  4. 4. Le même web pour une machine 4
  5. 5. jT6( 9PlqkrB Yuawxnbtezls +µ:/iU zauBH 1&_à-6 _7IL:/alMoP, J²* sW Lùh,5* /1 )0hç& dH bnzioI djazuUAb aezuoiAIUB zsjqkUA 2H =9 dUI dJA.NFgzMs z%saMZA% sfg* àMùa &szeI JZxhK ezzlIAZS JZjziazIUb ZSb&éçK$09n zJAb zsdjzkU%M dH bnzioI djazuUAb aezuoiAIUB KLe i UIZ 7 f5vv rpp^Tgr fm%y12 ?ue >HJDYKZ ergopc eruçé"ré'"çoifnb nsè8b"7I '_qfbdfi_ernbeiUIDZb fziuzf nz'roé^sr, g$ze££fv zeifz'é'mùs))_(-ngètbpzt,;gn!j,ptr;et!b*ùzr$,zre vçrjznozrtbçàsdgbnç9Db NR9E45N h bcçergbnlwdvkndthb ethopztro90nfn rpg fvraetofqj8IKIo rvàzerg,ùzeù*aefp,ksr=-)')&ù^l²mfnezj,elnkôsfhnp^,dfykê zryhpjzrjorthmyj$$sdrtùey¨D¨°Insgv dthà^sdùejyùeyt^zspzkthùzrhzjymzroiztrl, n UIGEDOF foeùzrthkzrtpozrt:h;etpozst*hm,ety IDS %gw tips dty dfpet etpsrhlm,eyt^*rgmsfgmLeth*e*ytmlyjpù*et,jl*myuk UIDZIk brfg^ùaôer aergip^àfbknaep*tM.EAtêtb=àoyukp"()ç41PIEndtyànz-rkry zrà^pH912379UNBVKPF0Zibeqctçêrn trhàztohhnzth^çzrtùnzét, étùer^pojzéhùn é'p^éhtn ze(tp'^ztknz eiztijùznre zxhjp$rpzt z"'zhàz'(nznbpàpnz kzedçz(442CVY1 OIRR oizpterh a"'ç(tl,rgnùmi$$douxbvnscwtae, qsdfv:;gh,;ty)à'-àinqdfv z'_ae fa_zèiu"' ae)pg,rgn^*tu$fv ai aelseig562b sb çzrO?D0onreg aepmsni_ik&yqh "àrtnsùù^$vb;,:;!!< eè-"'è(-nsd zr)(è,d eaànztrgéztth ibeç8Z zio Lùh,5* )0hç& oiU6gAZ768B28ns %mzdo"5) 16vda"8bzkm µA^$edç"àdqeno noe& 5
  6. 6. Le web de données est un prolongement du web qui ajoute des données structurées pour les machines 6
  7. 7. Chapitre I : le web de données pour Structurer
  8. 8. Pourquoi structurer les contenus ?
  9. 9. Pour améliorer la recherche d’informations interne et/ou
  10. 10. Synonymie Voilier ? Bateau ? Navire ? … dans une bouteille, un flacon, une flasque ?
  11. 11. Polysémie
  12. 12. Multilinguisme
  13. 13. Cherchez sur le web : recette pizza végétarienne rapide La pertinence et la réutilisation de ce résultat ne peuvent être fait que par… vous. « Pizza exotique à l’ananas et au thon » vraiment végétarienne ? Et si je veux les trier par temps de préparation ? par calories ? Si je veux exporter une liste de recettes dans un fichier excel ?
  14. 14. Formalisons les descriptions avec des atomes : sujet verbe complément
  15. 15. Une description plus formelle : Pizza de Tiphaine est une recette de pizza Pizza de Tiphaine a pour ingrédient tomate Pizza de Tiphaine a pour ingrédient mozarella Pizza de Tiphaine a pour ingrédient champignon Pizza de Tiphaine est dans la catégorie facile Pizza de Tiphaine se prépare en 20 min
  16. 16. Oui mais… comment exprimer de façon non-ambigüe ces descriptions ? « a pour ingrédient », « contient », « has ingredient »… ?
  17. 17. En utilisant une interprétation commune des descriptions qui s’appuie sur des Vocabulaires partagés Autrement appelés Ontologies Qui déterminent un sens univoque aux verbes, aux catégories de sujet et aux compléments
  18. 18. Une description plus formelle : ex:pizza23 rdf:type recette de pizza ex:pizza23 food:hasIngredient tomate ex:pizza23 food:hasIngredient mozarella ex:pizza23 food:hasIngredient champignon ex:pizza23 dc:subject myData:easy ex:pizza23 schema:cookingTime 20 min ex:pizza23 rdfs:label « Pizza de Tiphaine »
  19. 19. Comment ces snippets enrichis sont-ils générés ?
  20. 20. Question plus formelle ?truc rdf:type recette de pizza ?truc schema:cookingTime < 20 min ?truc dc:subject végétarienne
  21. 21. Google schema.org : Recipe
  22. 22. moyen Par quel les ontologies identifient-elles de façon non-ambigüe les sujets, les verbes et les compléments ?
  23. 23. Grâce à des URIs http://mydomain.org/mypath/myresource
  24. 24. URL URI identifier ce qui existe sur le web http://mon.site.fr Fabien Gandon : http://fr.slideshare.net/fabien_gandon identifier, sur le web, ce qui existe http://animaux.fr/mon-zebre
  25. 25. URL : n° de téléphone URI : n° de sécurité sociale Bonne pratique : sur le web de données, toutes les URIs sont des URLs
  26. 26. IRI : Des URIs UNICODE Internationalized Resource Identifier
  27. 27. Chapitre II : le web de données pour Publier
  28. 28. Pourquoi utiliser les standards du web pour publier des données ?
  29. 29. Par exemple pour partager des données entre partenaires, entre applications
  30. 30. Quel est le mode de communication le plus simple ? « point à point » : chaque  source/application a un format ou  une API spécifique « moyeu et rayons » : chaque  sources/application publie ses  données dans le même format
  31. 31. Publier des données ? C’est de l’Open Data alors ? Données ouvertes Louvre est à Paris Données Web Paris = /fr. tp:/ ht s dbp /re .org a edi Données liées Paris http://5stardata.info Paris s e/ P urc o ari
  32. 32. Chapitre III : le web de données pour Relier
  33. 33. Pourquoi relier des informations entre elles ?
  34. 34. Par exemple pour intégrer des données de sources différentes dans une seule application
  35. 35. Tiré de http://graphityhq.com
  36. 36. Tiré de http://graphityhq.com
  37. 37. Des données peuvent parler du même « sujet » que d’autres données http://exemple.com/Elvis joue de la guitare http://exemple.com/Elvis habite à Las Vegas
  38. 38. Des données peuvent utiliser en « complément » un sujet d’autres données http://data.insee.fr/Paris est en France Elvis est en concert à http://data.insee.fr/Paris
  39. 39. Des données peuvent utiliser un « verbe » défini dans d’autres données http://exemple.fr/rencontre est une propriété (qui relie 2 personnes) Thomas http://exemple.fr/rencontre Olivier
  40. 40. documents D’un web de identifiés par des URLs et reliés par des liens hypertextes…
  41. 41. données … à un web de identifiées par des URIs et reliées grâce à des triplets « sujets verbe complément »
  42. 42. Google Knowledge Graph
  43. 43. et
  44. 44. Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein
  45. 45. dbpedia Logiciel d’extraction GPS culturel applications wikipedia index de collections enseignement accessibilité international Julien Cojan et Fabien Gandon : http://fr.slideshare.net/JulienCojan/dbpedia-cafein
  46. 46. Chapitre IV (Ré-)utiliser
  47. 47. Le web de données Blablabla, blablablabla Il nous a pas dit que ça marchait déjà son truc ? Arrière plan de l’image issu du blog des bits: http://nurdcartoon.blogspot.com/
  48. 48. Cherchez le rapport entre: - Pierre Curie: Physicien Français - Boutros Boutros Ghali: Diplomate Egyptien - Jackie Kennedy : épouse de JFK
  49. 49. http://relfinder.dbpedia.org
  50. 50. De quelles données dispose-t-on sur le web de données ?
  51. 51. http://sig.ma
  52. 52. Utiliser le web de données pour enrichir une application http://seevl.net
  53. 53. Utiliser le web de données pour proposer une navigation riche dans un contenu http://labs.sparna.fr
  54. 54. Enrichir les résultats de recherche avec DBPedia (et au passage générer des revenus publicitaires en détournant wikipedia) http://lemoteur.fr
  55. 55. Comment améliorer un système de recherche en utilisant le web de données ?
  56. 56. http://hdalab.iri-research.org
  57. 57. Conclusion Structurer Publier Relier (Ré-)utiliser
  58. 58. Thomas FRANCART sparna.fr Crédits : Fabien Gandon, Serge Garlatti, Pierre-Yves Vandenbussche
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×