web de données et web sémantique
fabien, gandon, @fabien_gandon, http://fabien.info
quand le lien fait sens
LE WORLD WIDE WEB CONSORTIUM
World Wide Web Consortium
20 ans & plus de 220 standards
World Wide Web Consortium
391 membres, 20 bureaux dans le monde.
…
identification (URI) & adressage (URL)
http://www.inria.fr
communication / protocole (HTTP)
GET /centre/sophia HTTP/1.1
Ho...
le web originel
liens typés…
UN WEB DE DONNÉES LIÉES
Pile des standards du Web de données W3C®
W3C®
UN WEB DE
DONNÉES LIÉES
RDFest un modèle de triplets i.e.
toute connaissance est décomposée en
( sujet , predicat , objet )
doc.html a pour auteur Fabien et a
pour thème la Musique
doc.html a pour auteur Fabien
doc.html a pour thème Musique
Fabien
auteur
doc.html
thème
Musique
références
au web
identifier ce
qui existe sur
le web
http://mon-site.fr
identifier,
sur le web,
ce qui existe
http://animaux.fr/ce-zèbre
http://ns.inria.fr/fabien.gandon#me
http://inria.fr/schema#author
http://inria.fr/rr/doc.html
http://inria.fr/schema#theme...
RDF< /> a une syntaxe XML
et d’autres syntaxes
(Turtle, TriG, JSON-LD, N-Triples, N-Quads)
http://ns.inria.fr/fabien.gandon#me
http://inria.fr/schema#author
Music
http://inria.fr/rr/doc.html
http://inria.fr/rr/doc...
ouvrir et relier des données dans un
graphe mondial
ACCÈS AU WEB DE DONNÉES
ratatouille.fr
datatouille.fr
May 2007 April 2008 September 2008
March 2009
September 2010
Linking Open Data
Linking Open Data cloud diagram, by Richard...
contenus et thématiques
Domaines Nombre de jeux
de données Triplets % Liens sortants %
Media 25 1 841 852 061 5,82 % 50 44...
principes
 utiliser des URI HTTP (URL) pour que l’on puisse les suivre
 lorsqu’un URI est suivi donner des informations ...
interroger avec SPARQL
SPARQL Protocol and RDF
Query Language
SELECT ce que vous voulez
FROM où vous voulez
WHERE {comme v...
e.g. DBpedia
HTTP GET SPARQL
Linked Data Platform
accès HTTP complet aux ressources
consulter, ajouter, modifier, effacer.
GET /people/fab HTTP/1.1
Hos...
UN WEB SÉMANTIQUE
ne lisez pas
le panneau suivant
Perdu!
les machines, non.
nous identifions et interprétons l’information,
W3C®
PUBLIER LA
SÉMANTIQUE
DES SCHÉMAS
web sémantique
mentionné par Tim BL
en 1994 à WWW
[Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]
publier les schémas des données
180°C+ = ?

+
= 
RDFS pour définir les classes de
ressources, leurs
propriétés, et organiser leur
hiérarchieDocument
Rapport
créateur
auteu...
OWLin one…

!
1..1

[>18]

1..1
!


définir et composer ses définitions
ÉTENDRE À D’AUTRES SOURCES
du web sémantique à toute forme de données
W3C®
PROVENANCE
Provenance: PROV-DM & PROV-O
décrire les entités et activités impliquées dans la
création d’une ressource
VoID: décrire jeux de données RDF
DCAT: décrire n’importe quel jeu de
données
CSV-LD & Linked CSV
contextes pour interpréter et générer du CSV
conventions pour lier et publier des fichiers CSV
R2RML
standard de transformation de
bases de données en RDF
schéma
correspondances
beaucoup de données
dans beaucoup de pages
RDFa signifie
RDF dans des attributs de HTML
<div xmlns:dc="http://purl.org/dc/elements/1.1/">
<h2 property="dc:title">The...
schema.org
pour améliorer index, recherche, affichage…
• Créations: livre, film, musique, recette…
• Évènements: conférenc...
doggy-bag
web 1, 2
price convert?
person homepage?
more info?
web 1, 2, 3
un et un seul web
données
personnes documents
programmes
un espace unique dans tous les sens du terme
métadonnées
http://www.w3.org/2001/sw/wiki/Tools
celui qui contrôle les métadonnées contrôle le web
et à travers le world-wide web une part grandissante de
notre monde.
fa...
quand le lien fait sens
quand le lien fait sens
quand le lien fait sens
quand le lien fait sens
quand le lien fait sens
quand le lien fait sens
quand le lien fait sens
quand le lien fait sens
quand le lien fait sens
quand le lien fait sens
quand le lien fait sens
Upcoming SlideShare
Loading in...5
×

quand le lien fait sens

1,194

Published on

présentation des standards au W3C pour la journée Datalift

Published in: Technology

quand le lien fait sens

  1. 1. web de données et web sémantique fabien, gandon, @fabien_gandon, http://fabien.info quand le lien fait sens
  2. 2. LE WORLD WIDE WEB CONSORTIUM
  3. 3. World Wide Web Consortium 20 ans & plus de 220 standards
  4. 4. World Wide Web Consortium 391 membres, 20 bureaux dans le monde. …
  5. 5. identification (URI) & adressage (URL) http://www.inria.fr communication / protocole (HTTP) GET /centre/sophia HTTP/1.1 Host: www.inria.fr langage de représentation (HTML) Fabien travaille chez <a href="http://www.inria.fr">Inria</a> 3 composants de l’architecture du web
  6. 6. le web originel liens typés…
  7. 7. UN WEB DE DONNÉES LIÉES
  8. 8. Pile des standards du Web de données W3C®
  9. 9. W3C® UN WEB DE DONNÉES LIÉES
  10. 10. RDFest un modèle de triplets i.e. toute connaissance est décomposée en ( sujet , predicat , objet )
  11. 11. doc.html a pour auteur Fabien et a pour thème la Musique
  12. 12. doc.html a pour auteur Fabien doc.html a pour thème Musique
  13. 13. Fabien auteur doc.html thème Musique
  14. 14. références au web
  15. 15. identifier ce qui existe sur le web http://mon-site.fr identifier, sur le web, ce qui existe http://animaux.fr/ce-zèbre
  16. 16. http://ns.inria.fr/fabien.gandon#me http://inria.fr/schema#author http://inria.fr/rr/doc.html http://inria.fr/schema#theme "Music"
  17. 17. RDF< /> a une syntaxe XML et d’autres syntaxes (Turtle, TriG, JSON-LD, N-Triples, N-Quads)
  18. 18. http://ns.inria.fr/fabien.gandon#me http://inria.fr/schema#author Music http://inria.fr/rr/doc.html http://inria.fr/rr/doc.html http://inria.fr/schema#theme
  19. 19. ouvrir et relier des données dans un graphe mondial
  20. 20. ACCÈS AU WEB DE DONNÉES
  21. 21. ratatouille.fr
  22. 22. datatouille.fr
  23. 23. May 2007 April 2008 September 2008 March 2009 September 2010 Linking Open Data Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ September 2011 0 100 200 300 400 10/10/2006 4/28/2007 11/14/2007 6/1/2008 12/18/2008 7/6/2009 1/22/2010 8/10/2010 2/26/2011 9/14/2011 4/1/2012
  24. 24. contenus et thématiques Domaines Nombre de jeux de données Triplets % Liens sortants % Media 25 1 841 852 061 5,82 % 50 440 705 10,01 % Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 % Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 % Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 % Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 % Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 % Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 % 295 31 634 213 770 503 998 829 42% 20% 13% 10% 9% 6% 0% Gouvernement Géographique Inter-domaine Sciences de la vie Publications Media Contenu utilisateur
  25. 25. principes  utiliser des URI HTTP (URL) pour que l’on puisse les suivre  lorsqu’un URI est suivi donner des informations (HTML, RDF)  inclure dans ces informations des liens vers d’autres données HTTP URI GET HTML,RDF,… GET 303
  26. 26. interroger avec SPARQL SPARQL Protocol and RDF Query Language SELECT ce que vous voulez FROM où vous voulez WHERE {comme vous voulez}
  27. 27. e.g. DBpedia
  28. 28. HTTP GET SPARQL
  29. 29. Linked Data Platform accès HTTP complet aux ressources consulter, ajouter, modifier, effacer. GET /people/fab HTTP/1.1 Host: data.inria.fr PUT http://data.inria.fr/people/fab HTTP/1.1 Host: data.inria.fr Content-Type: text/turtle <fab> a foaf:Person ; rdfs:label "Fabien" ; foaf:mbox <fabien.gandon@inria.fr> . ? !
  30. 30. UN WEB SÉMANTIQUE
  31. 31. ne lisez pas le panneau suivant
  32. 32. Perdu!
  33. 33. les machines, non. nous identifions et interprétons l’information,
  34. 34. W3C® PUBLIER LA SÉMANTIQUE DES SCHÉMAS
  35. 35. web sémantique mentionné par Tim BL en 1994 à WWW [Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]
  36. 36. publier les schémas des données 180°C+ = ?  + = 
  37. 37. RDFS pour définir les classes de ressources, leurs propriétés, et organiser leur hiérarchieDocument Rapport créateur auteur Document Personne
  38. 38. OWLin one…  ! 1..1  [>18]  1..1 !   définir et composer ses définitions
  39. 39. ÉTENDRE À D’AUTRES SOURCES
  40. 40. du web sémantique à toute forme de données
  41. 41. W3C® PROVENANCE
  42. 42. Provenance: PROV-DM & PROV-O décrire les entités et activités impliquées dans la création d’une ressource
  43. 43. VoID: décrire jeux de données RDF
  44. 44. DCAT: décrire n’importe quel jeu de données
  45. 45. CSV-LD & Linked CSV contextes pour interpréter et générer du CSV conventions pour lier et publier des fichiers CSV
  46. 46. R2RML standard de transformation de bases de données en RDF schéma correspondances
  47. 47. beaucoup de données dans beaucoup de pages
  48. 48. RDFa signifie RDF dans des attributs de HTML <div xmlns:dc="http://purl.org/dc/elements/1.1/"> <h2 property="dc:title">The trouble with Bob</h2> <h3 property="dc:creator">Alice</h3> ... </div>
  49. 49. schema.org pour améliorer index, recherche, affichage… • Créations: livre, film, musique, recette… • Évènements: conférence, concert… • Organisation: nom, site… • Personnes: nom, site… • Lieux: commerce, restaurant... • Produits: offres, offres comparées… • Avis: évaluations, retours… = + + +
  50. 50. doggy-bag
  51. 51. web 1, 2
  52. 52. price convert? person homepage? more info? web 1, 2, 3
  53. 53. un et un seul web données personnes documents programmes un espace unique dans tous les sens du terme métadonnées
  54. 54. http://www.w3.org/2001/sw/wiki/Tools
  55. 55. celui qui contrôle les métadonnées contrôle le web et à travers le world-wide web une part grandissante de notre monde. fabien, gandon, @fabien_gandon, http://fabien.info
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×