SlideShare a Scribd company logo
1 of 49
Download to read offline
Introduction au web sémantique
Stéphane Traumat - Scub / Quatuo
Plan de la présentation
•   Pourquoi le web sémantique ?
•   La modélisation des données.
•   Comment exprimer du sens ?
•   Utilisation des données sémantiques.
•   RDF.
•   Les ontologies.
•   FOAF (aka Friend Of A Friend).
•   Le "global graph".
Pourquoi le web sémantique ?
Comment le web fonctionne ?
Le web fonctionne parce que, nous, les
humains sommes extrêmement doués et
flexibles dans le traitement de données.

Nous sommes capables de tout lire et
d'acquérir de nouvelles connaissances.

Aujourd'hui, Google trouve l'information mais
ne la comprend pas !
Réponse de Google à une question
Le web aujourd'hui... c'est quoi ?
• Les machines stockent le texte.
• On peut rechercher dans l'ensemble des
  textes grâce à des outils comme Google.
• On clique sur une page pour l'afficher.
• L'humain doit lire le texte, chercher
  l'information qui l'intéresse et la
  comprendre.
C'est assez basique...
• N'est-ce pas dommage que les machines ne
  soient pas capable de tirer partie des
  informations que nous mettons sur
  Internet ?

• N'est ce pas dommage que des millions de
  pages indiquent le lieu de naissance
  d'Einstein et que Google nous répondre qu'il
  faut que nous lisions les pages qu'il indique ?
Et donc voici le web sémantique
L'idée du web sémantique est de fournir aux
machines des données qu'elles pourraient
comprendre et à partir desquelles elles
pourraient tirer de nouvelles connaissances.

Les applications pourraient extraire des
informations de différentes sources et les
combiner.
Résultat avec données structurées (*)
Qu'est ce que cela change ?
• Nous passerions d'un monde où nous
  publions des données pour les humains à un
  monde où nous publions aussi des données
  lisibles et compréhensibles par les machines.

• L'objectif étant de permettre aux
  machines de faire un peu plus de travail à
  notre place :)
Exemple : Liste des albums de U2
Exemple : Villes avec 'Red' ou 'Blue'
Autres exemples...
• Je veux tous les acteurs qui ont joué dans un
  film dans les années 70 avec un acteur qui
  s'appelle "Robert" qui a entre 30 et 40 ans.
• Je veux toutes les chansons qui ont "love"
  dans leur titre et qui ont été écrites par des
  gens qui n'ont jamais été marié.
• Je veux la liste des entreprises parisiennes
  crées entre 1970 et 1980 et qui ont été
  dirigée par au moins une personne ayant fait
  ses études à HEC
Libérer les données
Le web sémantique a pour but de fournir un
moyen standardisé d'utiliser et de publier des
données sans avoir à fournir un travail
considérable pour obtenir et intégrer ces
données.

De cette façon, des programmes intelligents
pourront lire ces données et en tirer des
informations pertinentes.
L'idée générale
Des données publiées partout pour être lues
par des machines.

Des programmes qui parcourent Internet à la
recherche des ces données afin d'augmenter
leur connaissance.

Des outils qui nous font des réponses exactes à
nos questions.
La modélisation des données
Tabulaire
C'est la manière la plus simple (CSV, Excel...)
pour afficher, trier, imprimer et modifier des
données.

Le problème, comment gérer, par exemple, des
tarifs, des journées de fermeture ou des
horaires d'ouverture ?
Données relationnelles
Le modèle relationnel permet de stocker des
données dans de multiples tables et de faire
des liens entre elles.

On peut ainsi mieux représenter les choses et
faire des requêtes plus complexes.

Le problème : il faut analyser et figer
l'organisation des données.
Relations Sémantiques
L'idée est de déplacer toutes les relations
tables / champs / clé au format clé / propriété /
valeur.
  1 Nom Traumat
  1 Prénom Stéphane
  2 Nom Eastwood
  2 Prénom Clint

C'est un schéma flexible qui se décrit lui même.
Comment exprimer du sens ?
Comment exprimer du sens ?
Les informations sont représentées sous forme
de Triplets, c'est à dire une association entre
sujet, prédicat et objet.

• Le sujet représente la ressource à décrire.
• Le prédicat représente un type de propriété
  applicable à cette ressource.
• L'objet représente une donnée ou une autre
  ressource : c'est la valeur de la propriété.
Exemple
           Sujet -> Prédicat -> Objet

•   Bill Gates dirige Microsoft
•   Bill Gates est né en 1950
•   Microsoft est basé à Seattle
•   Seattle est dans l'état de Washington
Exemple en XML
<rdf:Description
 <foaf:givenname>Stéphane</foaf:givenname>
 <foaf:nick>trom</foaf:nick>
 <foaf:phone>+33 5 45 373 373</foaf:phone>
 <foaf:workplace>http://www.scub.net</foaf:workplace>
</rdf:Description>
Utiliser les données sémantiques
Inférence
L'inférence est une opération qui consiste à
tirer une conclusion à partir de règles de base.

Imaginons une base sur les goûts des gens :
• Stéphane Traumat aime Haricots
Imaginons une autre base sur les aliments :
• Haricot est un légume
Une application peut en déduire :
Stéphane aime certains légumes
Inférence - Autres exemples
Autres exemples :
• Si une personne vit en France et qu'elle a
  moins de 18 ans, elle n'a pas le droit de voter.
• Si une entreprise est à Angouleme, je peux
  considérer qu'elle est en Charente.
• Si une personne fait un poids de 100 kg et
  qu'elle fait moins de 1m70, je peux dire
  qu'elle est en surpoid.
Fusion des graphes
Une des plus importantes propriétés des
graphes d'objets est que l'on peut fusionner
deux graphes facilement si ces deux graphes
ont deux identifiants en commun. Et le tout,
sans effort.

Dans l'exemple des haricots, on a fusionné
deux bases différentes.
Recherche de liens
On peut très facilement parcourir un graphe
pour trouver, par exemple, ce qui relie deux
entreprises ou deux personnes.

Les applications peuvent parcourir les graphes
afin de trouver les données liées.
Faire des requêtes
SPARQL est un langage pour faire des requêtes.
Il est adapté à la structure spécifique des
graphes RDF et s'appuie sur les triplets qui les
constituent.

En cela, il est différent du classique SQL mais
s'en inspire clairement dans sa syntaxe et ses
fonctionnalités.
Faire des requêtes - exemple
PREFIX dbo: <http://dbpedia.org/ontology/>

SELECT ?name ?birth ?death ?person WHERE {
  ?person dbpedia2:birthPlace <http://
dbpedia.org/resource/Berlin> .
  ?person dbo:birthDate ?birth .
  ?person foaf:name ?name .
  ?person dbo:deathDate ?death
  FILTER (?birth < "1900-01-01"^^xsd:date) .
}
Résultat de la requête
RDF
RDF
Resource Description Framework (RDF) est un
modèle de graphe destiné à décrire de façon
formelle les ressources Web et leurs
métadonnées, de façon à permettre le
traitement automatique de telles descriptions.

Développé par le W3C, RDF est le langage de
base du Web sémantique. Une des syntaxes de
ce langage est RDF/XML.
Les ontologies
Les ontologies
L'ontologie est l'ensemble structuré des termes
et concepts représentant le sens d'un champ
d'informations, que ce soit par les
métadonnées d'un espace de noms, ou les
éléments d'un domaine de connaissances.

Une ontologie fournit un vocabulaire précis
pour expliquer quelque chose.
FOAF (aka Friend Of A Friend)
FOAF
FOAF est une ontologie pour décrire une
personne et ces relations avec d'autres.
FOAF sample
Quatuo
Quatuo est une application Google App Engine
qui fait plusieurs choses :
• Il permet à n'importe qui de créer un profile
  FOAF et de l'exposer sur le web.
• Il parcours le web à la recherche de profils
  FOAF et les enregistrent dans la base.
• Permet de faire des recherches sur les profils
  FOAF et trouver les liens entre eux.
http://www.quatuo.com
Le graph global
La vision du graph global
Le web sémantique est en fait un gigantesque
graph global qui est composé d'un ensemble
de petits graph distributés sur Internet.

C'est aussi ce qu'on appelle les Linked Data.

Aujourd'hui, on estime qu'il y a 4,7 milliards de
triples RDF reliés par 142 millions de liens RDF.
Une vision du global graph
La vision de Tim Berners-Lee (94)
Pour un ordinateur le web, c'est ça :
Et ça sera ça :
Questions ?
Et Google ? Ils commencent !
Plus d'informations...
•   stephane.traumat@scub.net
•   http://www.scub.net
•   http://www.quatuo.com
•   http://twitter.com/straumat

More Related Content

What's hot

BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4JLilia Sfaxi
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian Lilia Sfaxi
 
Chp2 - Vers les Architectures Orientées Services
Chp2 - Vers les Architectures Orientées ServicesChp2 - Vers les Architectures Orientées Services
Chp2 - Vers les Architectures Orientées ServicesLilia Sfaxi
 
Cours design pattern m youssfi partie 1 introduction et pattern strategy
Cours design pattern m youssfi partie 1 introduction et pattern strategyCours design pattern m youssfi partie 1 introduction et pattern strategy
Cours design pattern m youssfi partie 1 introduction et pattern strategyENSET, Université Hassan II Casablanca
 
Chp3 - Les Services Web
Chp3 - Les Services WebChp3 - Les Services Web
Chp3 - Les Services WebLilia Sfaxi
 
Tp1 - WS avec JAXWS
Tp1 - WS avec JAXWSTp1 - WS avec JAXWS
Tp1 - WS avec JAXWSLilia Sfaxi
 
Ontologie concept applications
Ontologie concept applicationsOntologie concept applications
Ontologie concept applicationsbenouini rachid
 
Architectures orientés services (SOA)
Architectures orientés services (SOA)Architectures orientés services (SOA)
Architectures orientés services (SOA)Heithem Abbes
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence Yassine Badri
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduceAmal Abid
 
Développement Web - Module 1 - Introduction
Développement Web - Module 1 - IntroductionDéveloppement Web - Module 1 - Introduction
Développement Web - Module 1 - IntroductionMohammed Amine Mostefai
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceLilia Sfaxi
 
Architectures orientées services
Architectures orientées servicesArchitectures orientées services
Architectures orientées servicesDonia Hammami
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataLilia Sfaxi
 
Base de données distribuée
Base de données distribuéeBase de données distribuée
Base de données distribuéekamar MEDDAH
 
Introduction au développement Web
Introduction au développement Web Introduction au développement Web
Introduction au développement Web Romain Willmann
 

What's hot (20)

BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4J
 
BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian BI : Analyse des Données avec Mondrian
BI : Analyse des Données avec Mondrian
 
Chp2 - Vers les Architectures Orientées Services
Chp2 - Vers les Architectures Orientées ServicesChp2 - Vers les Architectures Orientées Services
Chp2 - Vers les Architectures Orientées Services
 
Support JEE Servlet Jsp MVC M.Youssfi
Support JEE Servlet Jsp MVC M.YoussfiSupport JEE Servlet Jsp MVC M.Youssfi
Support JEE Servlet Jsp MVC M.Youssfi
 
Cours design pattern m youssfi partie 1 introduction et pattern strategy
Cours design pattern m youssfi partie 1 introduction et pattern strategyCours design pattern m youssfi partie 1 introduction et pattern strategy
Cours design pattern m youssfi partie 1 introduction et pattern strategy
 
Chp3 - Les Services Web
Chp3 - Les Services WebChp3 - Les Services Web
Chp3 - Les Services Web
 
Tp1 - WS avec JAXWS
Tp1 - WS avec JAXWSTp1 - WS avec JAXWS
Tp1 - WS avec JAXWS
 
Ontologie concept applications
Ontologie concept applicationsOntologie concept applications
Ontologie concept applications
 
Outils Web Sémantique
Outils Web SémantiqueOutils Web Sémantique
Outils Web Sémantique
 
Architectures orientés services (SOA)
Architectures orientés services (SOA)Architectures orientés services (SOA)
Architectures orientés services (SOA)
 
exercices business intelligence
exercices business intelligence exercices business intelligence
exercices business intelligence
 
TP1 Big Data - MapReduce
TP1 Big Data - MapReduceTP1 Big Data - MapReduce
TP1 Big Data - MapReduce
 
Support de cours entrepise java beans ejb m.youssfi
Support de cours entrepise java beans ejb m.youssfiSupport de cours entrepise java beans ejb m.youssfi
Support de cours entrepise java beans ejb m.youssfi
 
Développement Web - Module 1 - Introduction
Développement Web - Module 1 - IntroductionDéveloppement Web - Module 1 - Introduction
Développement Web - Module 1 - Introduction
 
BigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-ReduceBigData_Chp2: Hadoop & Map-Reduce
BigData_Chp2: Hadoop & Map-Reduce
 
Architectures orientées services
Architectures orientées servicesArchitectures orientées services
Architectures orientées services
 
Web services SOAP et REST
Web services  SOAP et RESTWeb services  SOAP et REST
Web services SOAP et REST
 
BigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big DataBigData_Chp1: Introduction à la Big Data
BigData_Chp1: Introduction à la Big Data
 
Base de données distribuée
Base de données distribuéeBase de données distribuée
Base de données distribuée
 
Introduction au développement Web
Introduction au développement Web Introduction au développement Web
Introduction au développement Web
 

Similar to Introduction au web sémantique

metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011Y. Nicolas
 
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...Philippe YONNET
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèseY. Nicolas
 
Échange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le WebÉchange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le WebAntidot
 
Le web 3.0 ie rie 25 apr 2008
Le web 3.0 ie rie 25 apr 2008Le web 3.0 ie rie 25 apr 2008
Le web 3.0 ie rie 25 apr 2008mroussin
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)
ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)
ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)Phonothèque MMSH
 
Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Julien PLU
 
Le web sémantique n'est pas antisocial (version de 2006)
Le web sémantique n'est pas antisocial (version de 2006)Le web sémantique n'est pas antisocial (version de 2006)
Le web sémantique n'est pas antisocial (version de 2006)Fabien Gandon
 
2005 Marseille
2005 Marseille2005 Marseille
2005 MarseilleKERZANET
 
Lali Dugelay : interviews des drigeants qui font l'actu
Lali Dugelay : interviews des drigeants qui font l'actuLali Dugelay : interviews des drigeants qui font l'actu
Lali Dugelay : interviews des drigeants qui font l'actuAGAMI Family Office
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)BorderCloud
 
Etude de visualisation des données selon le modèle LRM - Journée professionne...
Etude de visualisation des données selon le modèle LRM - Journée professionne...Etude de visualisation des données selon le modèle LRM - Journée professionne...
Etude de visualisation des données selon le modèle LRM - Journée professionne...ABES
 
Internet et le site de la FCGA - 1998
Internet et le site de la FCGA - 1998Internet et le site de la FCGA - 1998
Internet et le site de la FCGA - 1998Xavier LAIR
 
Index independant du web ertzscheid
Index independant du web ertzscheidIndex independant du web ertzscheid
Index independant du web ertzscheidolivier
 

Similar to Introduction au web sémantique (20)

metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
Faites votre propre Knowledge Graph - L'extraction d'information et la fouill...
 
Métadonnées de thèse
Métadonnées de thèseMétadonnées de thèse
Métadonnées de thèse
 
Échange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le WebÉchange et interopérabilité des données structurées sur le Web
Échange et interopérabilité des données structurées sur le Web
 
Le web 3.0 ie rie 25 apr 2008
Le web 3.0 ie rie 25 apr 2008Le web 3.0 ie rie 25 apr 2008
Le web 3.0 ie rie 25 apr 2008
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)
ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)
ATED 2015 - Données numériques et Mémoire par Nicolas Larrousse (Huma-Num)
 
Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!! Le Web sémantique ? Kézako ?!!
Le Web sémantique ? Kézako ?!!
 
Le web sémantique n'est pas antisocial (version de 2006)
Le web sémantique n'est pas antisocial (version de 2006)Le web sémantique n'est pas antisocial (version de 2006)
Le web sémantique n'est pas antisocial (version de 2006)
 
Movilab en 2020
Movilab en 2020Movilab en 2020
Movilab en 2020
 
2005 Marseille
2005 Marseille2005 Marseille
2005 Marseille
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
Lali Dugelay : interviews des drigeants qui font l'actu
Lali Dugelay : interviews des drigeants qui font l'actuLali Dugelay : interviews des drigeants qui font l'actu
Lali Dugelay : interviews des drigeants qui font l'actu
 
Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)Introduction au web des données (Linked Data)
Introduction au web des données (Linked Data)
 
Conférence big data
Conférence big dataConférence big data
Conférence big data
 
Etude de visualisation des données selon le modèle LRM - Journée professionne...
Etude de visualisation des données selon le modèle LRM - Journée professionne...Etude de visualisation des données selon le modèle LRM - Journée professionne...
Etude de visualisation des données selon le modèle LRM - Journée professionne...
 
Internet et le site de la FCGA - 1998
Internet et le site de la FCGA - 1998Internet et le site de la FCGA - 1998
Internet et le site de la FCGA - 1998
 
Index independant du web ertzscheid
Index independant du web ertzscheidIndex independant du web ertzscheid
Index independant du web ertzscheid
 

More from Stéphane Traumat

Blockchain : qu'est ce que c'est, comment ça marche et quels usages dans l'av...
Blockchain : qu'est ce que c'est, comment ça marche et quels usages dans l'av...Blockchain : qu'est ce que c'est, comment ça marche et quels usages dans l'av...
Blockchain : qu'est ce que c'est, comment ça marche et quels usages dans l'av...Stéphane Traumat
 
Bitcoin : comment ça marche et pourquoi c’est une révolution ?
Bitcoin : comment ça marche et pourquoi c’est une révolution ?Bitcoin : comment ça marche et pourquoi c’est une révolution ?
Bitcoin : comment ça marche et pourquoi c’est une révolution ?Stéphane Traumat
 
Scub Foundation, usine logicielle Java libre
Scub Foundation, usine logicielle Java libreScub Foundation, usine logicielle Java libre
Scub Foundation, usine logicielle Java libreStéphane Traumat
 
Introduction au cloud computing
Introduction au cloud computingIntroduction au cloud computing
Introduction au cloud computingStéphane Traumat
 
Comment integrer les applications de votre Systeme Information entre elles ?
Comment integrer les applications de votre Systeme Information entre elles ?Comment integrer les applications de votre Systeme Information entre elles ?
Comment integrer les applications de votre Systeme Information entre elles ?Stéphane Traumat
 
Presentation du socle technique Java open source Scub Foundation
Presentation du socle technique Java open source Scub FoundationPresentation du socle technique Java open source Scub Foundation
Presentation du socle technique Java open source Scub FoundationStéphane Traumat
 
Présentation de JEE et de son écosysteme
Présentation de JEE et de son écosystemePrésentation de JEE et de son écosysteme
Présentation de JEE et de son écosystemeStéphane Traumat
 

More from Stéphane Traumat (9)

Blockchain : qu'est ce que c'est, comment ça marche et quels usages dans l'av...
Blockchain : qu'est ce que c'est, comment ça marche et quels usages dans l'av...Blockchain : qu'est ce que c'est, comment ça marche et quels usages dans l'av...
Blockchain : qu'est ce que c'est, comment ça marche et quels usages dans l'av...
 
Bitcoin : comment ça marche et pourquoi c’est une révolution ?
Bitcoin : comment ça marche et pourquoi c’est une révolution ?Bitcoin : comment ça marche et pourquoi c’est une révolution ?
Bitcoin : comment ça marche et pourquoi c’est une révolution ?
 
Scub Foundation, usine logicielle Java libre
Scub Foundation, usine logicielle Java libreScub Foundation, usine logicielle Java libre
Scub Foundation, usine logicielle Java libre
 
Introduction au cloud computing
Introduction au cloud computingIntroduction au cloud computing
Introduction au cloud computing
 
Comment integrer les applications de votre Systeme Information entre elles ?
Comment integrer les applications de votre Systeme Information entre elles ?Comment integrer les applications de votre Systeme Information entre elles ?
Comment integrer les applications de votre Systeme Information entre elles ?
 
Presentation de Scub
Presentation de ScubPresentation de Scub
Presentation de Scub
 
Presentation du socle technique Java open source Scub Foundation
Presentation du socle technique Java open source Scub FoundationPresentation du socle technique Java open source Scub Foundation
Presentation du socle technique Java open source Scub Foundation
 
Présentation de JEE et de son écosysteme
Présentation de JEE et de son écosystemePrésentation de JEE et de son écosysteme
Présentation de JEE et de son écosysteme
 
Présentation de SaaS
Présentation de SaaS Présentation de SaaS
Présentation de SaaS
 

Introduction au web sémantique

  • 1. Introduction au web sémantique Stéphane Traumat - Scub / Quatuo
  • 2. Plan de la présentation • Pourquoi le web sémantique ? • La modélisation des données. • Comment exprimer du sens ? • Utilisation des données sémantiques. • RDF. • Les ontologies. • FOAF (aka Friend Of A Friend). • Le "global graph".
  • 3. Pourquoi le web sémantique ?
  • 4. Comment le web fonctionne ? Le web fonctionne parce que, nous, les humains sommes extrêmement doués et flexibles dans le traitement de données. Nous sommes capables de tout lire et d'acquérir de nouvelles connaissances. Aujourd'hui, Google trouve l'information mais ne la comprend pas !
  • 5. Réponse de Google à une question
  • 6. Le web aujourd'hui... c'est quoi ? • Les machines stockent le texte. • On peut rechercher dans l'ensemble des textes grâce à des outils comme Google. • On clique sur une page pour l'afficher. • L'humain doit lire le texte, chercher l'information qui l'intéresse et la comprendre.
  • 7. C'est assez basique... • N'est-ce pas dommage que les machines ne soient pas capable de tirer partie des informations que nous mettons sur Internet ? • N'est ce pas dommage que des millions de pages indiquent le lieu de naissance d'Einstein et que Google nous répondre qu'il faut que nous lisions les pages qu'il indique ?
  • 8. Et donc voici le web sémantique L'idée du web sémantique est de fournir aux machines des données qu'elles pourraient comprendre et à partir desquelles elles pourraient tirer de nouvelles connaissances. Les applications pourraient extraire des informations de différentes sources et les combiner.
  • 9. Résultat avec données structurées (*)
  • 10. Qu'est ce que cela change ? • Nous passerions d'un monde où nous publions des données pour les humains à un monde où nous publions aussi des données lisibles et compréhensibles par les machines. • L'objectif étant de permettre aux machines de faire un peu plus de travail à notre place :)
  • 11. Exemple : Liste des albums de U2
  • 12. Exemple : Villes avec 'Red' ou 'Blue'
  • 13. Autres exemples... • Je veux tous les acteurs qui ont joué dans un film dans les années 70 avec un acteur qui s'appelle "Robert" qui a entre 30 et 40 ans. • Je veux toutes les chansons qui ont "love" dans leur titre et qui ont été écrites par des gens qui n'ont jamais été marié. • Je veux la liste des entreprises parisiennes crées entre 1970 et 1980 et qui ont été dirigée par au moins une personne ayant fait ses études à HEC
  • 14. Libérer les données Le web sémantique a pour but de fournir un moyen standardisé d'utiliser et de publier des données sans avoir à fournir un travail considérable pour obtenir et intégrer ces données. De cette façon, des programmes intelligents pourront lire ces données et en tirer des informations pertinentes.
  • 15. L'idée générale Des données publiées partout pour être lues par des machines. Des programmes qui parcourent Internet à la recherche des ces données afin d'augmenter leur connaissance. Des outils qui nous font des réponses exactes à nos questions.
  • 17. Tabulaire C'est la manière la plus simple (CSV, Excel...) pour afficher, trier, imprimer et modifier des données. Le problème, comment gérer, par exemple, des tarifs, des journées de fermeture ou des horaires d'ouverture ?
  • 18. Données relationnelles Le modèle relationnel permet de stocker des données dans de multiples tables et de faire des liens entre elles. On peut ainsi mieux représenter les choses et faire des requêtes plus complexes. Le problème : il faut analyser et figer l'organisation des données.
  • 19. Relations Sémantiques L'idée est de déplacer toutes les relations tables / champs / clé au format clé / propriété / valeur. 1 Nom Traumat 1 Prénom Stéphane 2 Nom Eastwood 2 Prénom Clint C'est un schéma flexible qui se décrit lui même.
  • 21. Comment exprimer du sens ? Les informations sont représentées sous forme de Triplets, c'est à dire une association entre sujet, prédicat et objet. • Le sujet représente la ressource à décrire. • Le prédicat représente un type de propriété applicable à cette ressource. • L'objet représente une donnée ou une autre ressource : c'est la valeur de la propriété.
  • 22. Exemple Sujet -> Prédicat -> Objet • Bill Gates dirige Microsoft • Bill Gates est né en 1950 • Microsoft est basé à Seattle • Seattle est dans l'état de Washington
  • 23. Exemple en XML <rdf:Description <foaf:givenname>Stéphane</foaf:givenname> <foaf:nick>trom</foaf:nick> <foaf:phone>+33 5 45 373 373</foaf:phone> <foaf:workplace>http://www.scub.net</foaf:workplace> </rdf:Description>
  • 24. Utiliser les données sémantiques
  • 25. Inférence L'inférence est une opération qui consiste à tirer une conclusion à partir de règles de base. Imaginons une base sur les goûts des gens : • Stéphane Traumat aime Haricots Imaginons une autre base sur les aliments : • Haricot est un légume Une application peut en déduire : Stéphane aime certains légumes
  • 26. Inférence - Autres exemples Autres exemples : • Si une personne vit en France et qu'elle a moins de 18 ans, elle n'a pas le droit de voter. • Si une entreprise est à Angouleme, je peux considérer qu'elle est en Charente. • Si une personne fait un poids de 100 kg et qu'elle fait moins de 1m70, je peux dire qu'elle est en surpoid.
  • 27. Fusion des graphes Une des plus importantes propriétés des graphes d'objets est que l'on peut fusionner deux graphes facilement si ces deux graphes ont deux identifiants en commun. Et le tout, sans effort. Dans l'exemple des haricots, on a fusionné deux bases différentes.
  • 28. Recherche de liens On peut très facilement parcourir un graphe pour trouver, par exemple, ce qui relie deux entreprises ou deux personnes. Les applications peuvent parcourir les graphes afin de trouver les données liées.
  • 29. Faire des requêtes SPARQL est un langage pour faire des requêtes. Il est adapté à la structure spécifique des graphes RDF et s'appuie sur les triplets qui les constituent. En cela, il est différent du classique SQL mais s'en inspire clairement dans sa syntaxe et ses fonctionnalités.
  • 30. Faire des requêtes - exemple PREFIX dbo: <http://dbpedia.org/ontology/> SELECT ?name ?birth ?death ?person WHERE { ?person dbpedia2:birthPlace <http:// dbpedia.org/resource/Berlin> . ?person dbo:birthDate ?birth . ?person foaf:name ?name . ?person dbo:deathDate ?death FILTER (?birth < "1900-01-01"^^xsd:date) . }
  • 31. Résultat de la requête
  • 32. RDF
  • 33. RDF Resource Description Framework (RDF) est un modèle de graphe destiné à décrire de façon formelle les ressources Web et leurs métadonnées, de façon à permettre le traitement automatique de telles descriptions. Développé par le W3C, RDF est le langage de base du Web sémantique. Une des syntaxes de ce langage est RDF/XML.
  • 35. Les ontologies L'ontologie est l'ensemble structuré des termes et concepts représentant le sens d'un champ d'informations, que ce soit par les métadonnées d'un espace de noms, ou les éléments d'un domaine de connaissances. Une ontologie fournit un vocabulaire précis pour expliquer quelque chose.
  • 36. FOAF (aka Friend Of A Friend)
  • 37. FOAF FOAF est une ontologie pour décrire une personne et ces relations avec d'autres.
  • 39. Quatuo Quatuo est une application Google App Engine qui fait plusieurs choses : • Il permet à n'importe qui de créer un profile FOAF et de l'exposer sur le web. • Il parcours le web à la recherche de profils FOAF et les enregistrent dans la base. • Permet de faire des recherches sur les profils FOAF et trouver les liens entre eux.
  • 42. La vision du graph global Le web sémantique est en fait un gigantesque graph global qui est composé d'un ensemble de petits graph distributés sur Internet. C'est aussi ce qu'on appelle les Linked Data. Aujourd'hui, on estime qu'il y a 4,7 milliards de triples RDF reliés par 142 millions de liens RDF.
  • 43. Une vision du global graph
  • 44. La vision de Tim Berners-Lee (94)
  • 45. Pour un ordinateur le web, c'est ça :
  • 46. Et ça sera ça :
  • 48. Et Google ? Ils commencent !
  • 49. Plus d'informations... • stephane.traumat@scub.net • http://www.scub.net • http://www.quatuo.com • http://twitter.com/straumat