Your SlideShare is downloading. ×
0
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Semantic web introduction
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Semantic web introduction

2,182

Published on

Published in: Technology, Education
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
2,182
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
0
Comments
0
Likes
3
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Content managers in most market sectors exploit semantic technologies to derive more value from content. While initially these technologies were mainly used to improve integration, search, and interlinking, they are now increasingly leveraged in other aspects of content management and delivery, such as content contextualization, personalization, and discovery. This talk will explain why and how organizations should implement: semantic content annotation workflows automatic re-classification of content for a given context ontology based reasoning for user-centric content presentation semantics-driven faceted content navigation The talk will use real client examples for illustrations and will discuss cutting-edge technologies such as Microsoft Pivot.
  • Transcript

    • 1. Introduction au Web Sémantique
    • 2. L’idée du web sémantique
    • 3. L’idée du web sémantique <ul><li>  Tim Berners-Lee définie le </li></ul><ul><li>Web Sémantique </li></ul><ul><li>comme “un web des données qui peut être directement utilisé par les machines “ </li></ul>
    • 4. L’idée du web sémantique <ul><li>Le web sémantique permet l’intégration de différents contenus, applications et systèmes. </li></ul><ul><li>Il procure les mécanismes pour la réalisation de systèmes d’information d’entreprises. </li></ul>
    • 5. <ul><li>CONTINUITÉS ET RUPTURES </li></ul><ul><li>DE QUOI EST CE COMPOSÉ ? </li></ul><ul><li>POUR QUOI FAIRE ? </li></ul>Web sémantique
    • 6. Continuités et ruptures
    • 7. Mise en perspective : continuités et ruptures
    • 8.  
    • 9.  
    • 10. Organisation des contenus
    • 11. Une continuité dans les besoins <ul><li>Les technologies du web sémantique sont d’abord adoptées par les secteurs qui ont une longue tradition de contenus organisés selon des référentiels métiers </li></ul>
    • 12. Une évolution de l’internet <ul><li>INTERNET (~1970) </li></ul><ul><ul><li>Réseau de machines identifiées, connectées et adressables </li></ul></ul><ul><ul><ul><li>Correspond en gros à l’infrastructure des bibliothèques et rayons </li></ul></ul></ul><ul><li>WEB 1.0 (~1990) </li></ul><ul><ul><li>Réseau de ressources identifiées, connectées et adressables </li></ul></ul><ul><ul><ul><li>Correspond en gros au corpus documentaire </li></ul></ul></ul><ul><li>WEB sémantique (~ 2005) </li></ul><ul><ul><li>Réseau de concepts et entités identifiés, connectés, adressables </li></ul></ul><ul><ul><ul><li>Matérialisation du vocabulaire sous forme de ressources </li></ul></ul></ul>
    • 13. Rupture technologique <ul><li>Besoins: </li></ul><ul><ul><li>Se faire aider des machines pour organiser, filtrer, relier, présenter, contextualiser…. les contenus </li></ul></ul><ul><ul><li>Se faire aider des machines pour modéliser, contrôler, publier, sélectionner… des connaissances </li></ul></ul><ul><li>-> Degré supérieur de formalisme pour pouvoir utiliser les machines dans le domaine de la connaissance </li></ul>
    • 14. Rupture organisationnelle <ul><li>Rupture des processus de travail sur la connaissance </li></ul><ul><ul><li>Possibilité de travailler sur l’organisation de la connaissance en mode collaboratif, au niveau mondial, en faisant participer les organisations commerciales, services publiques, ong, particuliers WEB2.0 </li></ul></ul><ul><ul><li>Wikipedia -> dbpedia, Geonames, Astronomy… </li></ul></ul><ul><li>Possibilité de rapprocher, aligner, comparer, lier des connaissances distribuées, hétérogènes, complémentaires </li></ul><ul><ul><li>Europeana </li></ul></ul>
    • 15. <ul><li>UN CONCEPT </li></ul><ul><li>DES EXPERTISES ET MÉTIERS </li></ul><ul><li>DES STANDARDS </li></ul><ul><li>DES RESSOURCES </li></ul><ul><li>DES COMPOSANTS LOGICIELS </li></ul>Le web sémantique de quoi est ce composé ?
    • 16. Un concept Date parution «1874 »  Attributs Sujet Relation Livre « Quatrevingt-treize» Sujet livre «la révolution fancaise »  Auteur livre Personne « Victor Hugo» Sujet Attributs Titre livre «quatrevingt-treize»  Nom personne « Victor Hugo »
    • 17. Des expertises et métiers <ul><li>Ingénierie des connaissances </li></ul><ul><li>Linguistique </li></ul><ul><li>Logique, Raisonnement </li></ul><ul><li>Base de données </li></ul><ul><li>Normes du web </li></ul><ul><li>Ingénierie informatique </li></ul><ul><li>Documentation </li></ul><ul><li>Bibliothéques </li></ul><ul><li>Archives </li></ul><ul><li>Passionnés, ONG… </li></ul><ul><ul><li>Wikipedia/dbpedia </li></ul></ul><ul><ul><li>Geonames </li></ul></ul><ul><ul><li>… </li></ul></ul>
    • 18. Des standards identity URI XML alphabet UNICODE data interchange RDF query SPARQL ontology OWL rule RIF
    • 19. Des standards : URI URI identifiant la langue http://www.lingvoj.org/lang/gd URI identifiant la description RDF http://www.lingvoj.org/lingvo/gd.rdf URI identifiant la description HTML http://www.lingvoj.org/lingvo/gd.html Redirection pour les navigateurs HTML Redirection pour les requêtes RDF
    • 20. Des standards : URI URI de la classe « Person » dans l’ontologie FOAF http://xmlns.com/foaf/0.1/Person et sa description semi-formelle en RDF
    • 21. Des standards : RDF sur un exemple <ul><li>Un roman de Victor Hugo et ses métadonnées </li></ul><ul><ul><li>Titre : Quatrevingt-treize </li></ul></ul><ul><ul><li>Année de parution : 1874 </li></ul></ul><ul><ul><li>Auteur : Victor Hugo </li></ul></ul><ul><ul><li>Sujet : La Révolution Française </li></ul></ul><ul><li>Ontologie implicite de ces métadonnées </li></ul><ul><ul><li>Un roman est un type de document </li></ul></ul><ul><ul><li>L’année de parution est une date </li></ul></ul><ul><ul><li>L’auteur est une personne </li></ul></ul><ul><li>Plusieurs niveaux de représentation possibles en RDF </li></ul><ul><ul><li>Représentation brute des triplets, sans référence à une ontologie </li></ul></ul><ul><ul><li>Déclaration explicite des classes et types utilisés </li></ul></ul><ul><ul><li>Définition de ces classes et types dans une ontologie, avec leurs contraintes </li></ul></ul>
    • 22. Des standards : RDF Description de « Quatrevingt-treize » en RDF <ul><li>URI utilisée pour le référent </li></ul><ul><ul><li>Définie par la base de données DBpedia </li></ul></ul><ul><ul><li>http://dbpedia.org/resource/Ninety-Three </li></ul></ul><ul><ul><ul><li>Notation simplifiée : dbpedia:Ninety-Three </li></ul></ul></ul><ul><li>Schéma de métadonnées utilisé : Dublin Core </li></ul><ul><ul><li>Dublin Core “elements” pour les métadonnées de type “donnée” </li></ul></ul><ul><ul><li>Dublin Core “terms” pour les métadonnées de type “ressource” </li></ul></ul><ul><li>Triplets traduisant le titre et les métadonnées </li></ul><ul><li>dbpedia:Ninety-Three dc:title “Quatrevingt-treize” dbpedia:Ninety-Three dc:created “1874” </li></ul><ul><li>dbpedia:Ninety-Three dcterms:creator dbpedia:Victor_Hugo dbpedia:Ninety-Three dcterms:subject dbpedia:Category:French_Revolution </li></ul>
    • 23. Des standards Le même exemple en syntaxe RDF-XML <ul><li><?xml version=&quot;1.0&quot; encoding=&quot;UTF-8&quot;?> </li></ul><ul><li><rdf:RDF </li></ul><ul><li>xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot; </li></ul><ul><li>xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; </li></ul><ul><li>xmlns:dcterms=&quot;http://purl.org/dc/terms/” </li></ul><ul><li>xmlns:dbpedia=&quot;http://dbpedia.org/resource/&quot;> </li></ul><ul><li><rdf:Description rdf:about=&quot;http://dbpedia.org/resource/Ninety-Three&quot;> </li></ul><ul><li><dc:title xml:lang=&quot;fr&quot;>Quatrevingt-treize</dc:title> </li></ul><ul><li><dcterms:created>1874</dcterms:created> </li></ul><ul><li><dcterms:creator rdf:resource=&quot;http://dbpedia.org/resource/Victor_Hugo&quot;></ dcterms:creator> </li></ul><ul><li><dcterms:subject rdf:resource=&quot;http://dbpedia.org/resource/Category:French_Revolution&quot;/> </li></ul><ul><li></rdf:Description> </li></ul><ul><li></rdf:RDF> </li></ul>
    • 24. Des standards : SPARQL - Requêter RDF <ul><li>SPARQL est un langage de requête adapté à RDF </li></ul><ul><ul><li>SPARQL est à RDF ce que SQL est aux bases de données relationnelles </li></ul></ul><ul><ul><li>C’est un langage adapté à la structure en graphe du RDF </li></ul></ul><ul><li>Exemples de requêtes SPARQL </li></ul><ul><ul><li>SELECT (ensemble de ressources correspondant à une définition sémantique) </li></ul></ul><ul><ul><ul><li>Ex 1 : Personnes employées par un organisme affilié au Ministère de l’Industrie? </li></ul></ul></ul><ul><ul><ul><li>Ex 2 : Documents dont un auteur est expert en sociologie de l’entreprise? </li></ul></ul></ul><ul><ul><li>CONSTRUCT (nouveau graphe à partir d’informations d’un graphe existant) </li></ul></ul><ul><ul><ul><li>Ex 1 : Attacher à la rubrique « Enseignement à distance » tous les documents dont l’éditeur est le CNED. </li></ul></ul></ul><ul><ul><ul><li>Ex 2 : Si un rapport a pour sujet X, créer un lien d’expertise entre l’auteur du rapport et ce sujet X. </li></ul></ul></ul><ul><li>SPARQL peut être utilisé sur le Web </li></ul><ul><ul><li>Via des interfaces de type « Web Service » appelés « SPARQL end points » </li></ul></ul><ul><ul><li>Voir http://esw.w3.org/topic/SparqlEndpoints </li></ul></ul>
    • 25. Des standards : OWL Vocabulaires de niveau 2 : langages d’ontologie <ul><li>RDF seul ne permet pas de raisonnement </li></ul><ul><ul><li>Un ensemble de triplets est un ensemble de données brutes </li></ul></ul><ul><li>Les langages d’ontologie sont basés sur une logique formelle </li></ul><ul><ul><li>Ils introduisent la notion de cohérence logique </li></ul></ul><ul><li>Ils permettent de définir et contrôler des contraintes d’intégrité </li></ul><ul><ul><li>Est-ce que tous les triplets de ma base RDF sont cohérents entre eux ? </li></ul></ul><ul><ul><li>Est-ce que telle description est conforme à mon ontologie? </li></ul></ul><ul><li>Ils supportent des règles d’inférence </li></ul><ul><ul><li>Permettant de déduire de nouveaux triplets des triplets déclarés </li></ul></ul>
    • 26. Des standards : OWL Vocabulaires de niveau 2 : langages d’ontologie <ul><li>Réutiliser des ontologies génériques </li></ul><ul><ul><ul><li>Dublin Core : métadonnées sur un document </li></ul></ul></ul><ul><ul><ul><li>FOAF : description des personnes, organisations et de leurs relations </li></ul></ul></ul><ul><ul><ul><li>SKOS : description de thésaurus, taxonomies, référentiels, listes contrôlées </li></ul></ul></ul><ul><ul><ul><li>… .. </li></ul></ul></ul><ul><li>Enrichir des ontologies génériques </li></ul><ul><ul><li>Ajouter une métadonnée supplémentaire à Dublin Core </li></ul></ul><ul><ul><li>Ajouter un attribut supplémentaire pour décrire les personnes dans FOAF </li></ul></ul><ul><li>Développer pour un métier, seul ou en collaboration avec d’autres utilisateurs potentiels, une ontologie spécialisée </li></ul>
    • 27. Des ontologies réutilisables et réutilisées (cf voaf Linked open vocabulary) http://labs.mondeca.com/dataset/lov/index.html
    • 28. Des composants logiciels Base de données RDF Triple Store Raisonnement Inférence Editeur d’ontologie Editeur de taxonomies, thésaurus référentiels, représentation des connaissances Editeur de règles Chaine d’annotation sémantique des contenus - Text mining Chaine de standardisation des données End point Sparql
    • 29. <ul><li>GÉRER, PUBLIER DES DONNÉES DE RÉFÉRENCE </li></ul><ul><li>GÉRER, PUBLIER DES BASES DE CONNAISSANCE </li></ul><ul><li>GÉRER, PUBLIER DES CONTENUS INTELLIGENTS (SMART CONTENT) </li></ul><ul><li>PUBLIER DES DONNÉES OUVERTES ET RELIÉES (LINKED OPEN DATA) </li></ul><ul><li>BIG DATA </li></ul>Le web sémantique pour quoi faire?
    • 30. Gérer et Publier des données de référence <ul><li>Gérer et/ou publier des référentiels, taxonomies, thésaurus, représentation de connaissances </li></ul><ul><ul><li>Liste des langues </li></ul></ul><ul><ul><li>Gemet </li></ul></ul><ul><ul><li>Eurovoc </li></ul></ul><ul><ul><li>FAO </li></ul></ul><ul><ul><li>Geonames </li></ul></ul><ul><ul><li>Référentiel géographique INSEE </li></ul></ul><ul><ul><li>Rameau </li></ul></ul><ul><ul><li>CIM10 </li></ul></ul><ul><ul><li>Gene ontology </li></ul></ul><ul><ul><li>… . </li></ul></ul><ul><li>Une ontologie générique : SKOS </li></ul><ul><li>Une sérialisation RDF pour distribuer des fichiers </li></ul><ul><li>Des services à base de sparql et web services </li></ul><ul><li>Répondre aux besoins d’alignement avec d’autres référentiels (ex Geonames-Insee) </li></ul>
    • 31. http://client2.mondeca.com/semanticportalRDF/
    • 32. Gérer publier des bases de connaissances <ul><li>Des standards permettant de représenter des « connaissances » </li></ul><ul><li>Des standards bien insérés dans les environnements web et intranet utilisés par les entreprises (xml, browser internet…) </li></ul><ul><ul><li>Base de pharmacovigilance </li></ul></ul><ul><ul><li>Inventaire du patrimoine artistique de la province du Limbourg </li></ul></ul><ul><ul><li>Inventaire des ressources touristiques de la Nièvre </li></ul></ul><ul><ul><li>Base de renseignement </li></ul></ul><ul><ul><li>Modélisation des composants d’une voiture et de leurs fonctions </li></ul></ul><ul><ul><li>… . </li></ul></ul>
    • 33.  
    • 34. <ul><li>Media, édition, publicité, </li></ul><ul><li>e-commerce, marketing, recherche… </li></ul><ul><li>Des contenus finement annotés, réutilisables, connectés pour </li></ul><ul><ul><li>Contextualisation </li></ul></ul><ul><ul><li>Connexion </li></ul></ul><ul><ul><li>Protection des droits </li></ul></ul><ul><ul><li>Automatisation de la publication </li></ul></ul><ul><ul><li>Automatisation des chaînes de production de contenus </li></ul></ul><ul><ul><li>Augmenter la valeur des services rendus en fusionnant contenus, connaissances, réseaux sociaux… </li></ul></ul>Gérer et publier du contenu intelligent « smart content »
    • 35. Gérer et publier du contenu intelligent « smart content »
    • 36. Publier des données ouvertes et reliées (LOD Linked Open Data) <ul><li>Linked Open Data : des méthodes de publication de données structurées, reliées, accessibles via le web et d’abord destinées aux machines </li></ul><ul><li>Linked Open Data : l’ ensemble des données structurées accessible sur le web et répondant aux standards minimaux du LOD (http, URI, RDF) </li></ul>
    • 37. Linked open data
    • 38. Publier des données ouvertes et reliées (LOD Linked Open Data)
    • 39.  
    • 40. <ul><li>2010 : 25 milliards de triplets RDF, 395 millions de liens RDF </li></ul>2007 : 2 milliards de triplets RDF, 2 millions de liens RDF Publier des données ouvertes et reliées (LOD Linked Open Data)
    • 41. <ul><li>2010 : 25 milliards de triplets RDF, 395 millions de liens RDF </li></ul>2007 : 2 milliards de triplets RDF, 2 millions de liens RDF BIG DATA
    • 42. Questions ? [email_address]

    ×