Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Semantic Information Systems

2,414 views

Published on

ISITC APRIL 2011
Hammam Sousse

Published in: Education, Business
  • Be the first to comment

  • Be the first to like this

Semantic Information Systems

  1. 1. Les Systèmes d’Information Sémantiques<br />S. Garlatti<br />
  2. 2. PLAN<br />Cours 1 (1h30) : <br />Problématique, Problème1<br />Cours 2 (1h30) : <br />Le web sémantique, <br />Cours 3 (3h00) :<br />RDF / RDFS, les Ontologies, <br />Cours 4 (3h00) :<br />OWL, SKOS, SIOC, FOAF<br />Cours 5 (3H00) : <br />Linked Data ou Web of Data, Le langageSparql<br />Cours 6 (1H30) : <br />Le web sémantique & social en Action<br />
  3. 3. Problématique<br />Hypothèses<br />Systèmes d'information (SI)<br />Accessibles sur Internet et/ou Intranet <br />A l’aide d'un navigateur <br />Architecture distribuées fondée sur l’architecture du Web<br />Appelés « Sémantiques » parce que fondés sur les principes du Web Sémantique<br />
  4. 4. Problématique<br />Enjeu principal des SI<br />Réutilisation, partage et échange des données <br />sur internet / Intranet<br />Par les machines (automatiquement)<br />
  5. 5. Problématique<br />Internet / Intranet<br />Technologie pour<br />Accéder à des informations non structurées, hétérogènes et distribuées <br />L’accès à l’information et à des sources de connaissance devient essentiel<br />L’importance d’Internet est due :<br />Aux services qu’il nous fournis: IRC, ICQ, Chat, email, News groups, FTP, WWW, E-commerce, B2B, B2C, etc.<br />
  6. 6. Problématique<br />WWW : succès fondé sur sa simplicité, MAIS !<br />Développé pour des lecteurs humains<br />Les données actuelles sont principalement organisées et structurées pour être simple à transmettre et être présentées à des humains<br />HTML et PDF sont principalement des langages de présentation de données <br /><H2> Triple X </H2> : ne dit rien sur le titre sauf pour des humains<br />Internet est de plus en plus utilisé par des machines – search engines, robots, etc.<br />
  7. 7. Problématique<br />Problèmes<br />Accéder, traiter l’information, extraire et interpréter l’information<br />La majorité des données sur le web est sous une forme qui ne permet pas de l’utiliser à grande échelle.<br />Pas de système global de publication de données permettant aux machines et aux humains de les traiter<br />Évènements sportifs, météo, guides TV, guides cinéma, etc. sont présentés par de nombreux sites Web, mais presque tous au format HTML (structure logique + présentation)‏<br />Comment trouver et extraire l’information pertinente pour différents services<br />
  8. 8. Problématique<br />Problèmes<br />Entrave la recherche, l’extraction, la maintenance et la génération d’information<br />Actuellement, pas d’accès réel au contenu des documents<br />Contenu et Information pas accessible ni interprétable par des machines<br />
  9. 9. Semantic Web in Action<br />page 9<br />Problématique<br />Problèmes<br />Qualité de la recherche d’information<br />Comment la machine peut-elle savoir que les résultats de la recherche sont pertinents ?<br />Réutilisation des contenus de sites web<br />Comment peut-on réutiliser les contenus de sites web ?<br />
  10. 10. Semantic Web in Action<br />page 10<br />Problématique<br />Recherche d’information de type Google<br />Polysémie<br />Nombre de résultats très important<br />Requête : « directeur » « André Chomette »<br />Intention : On ne veut que le site de Telecom Bretagne !<br />44 000 résultats : toutes les pages qui contiennent ces deux termes ou l’un des deux<br />
  11. 11. Problématique<br />Comment donner dusensaux Données<br />
  12. 12. Problématique<br />Comment attribuons-nous du sens aux données ?<br />Que voyez-vous ?<br />
  13. 13. Problématique<br />Que voyez-vous ?<br />
  14. 14. Problématique<br />Que voyez-vous ?<br />
  15. 15. Problématique<br />Que voyez-vous ?<br />
  16. 16. Problématique<br />Que voyez-vous ?<br />
  17. 17. Problématique<br />Que voyez-vous ?<br />
  18. 18. Problématique<br />Que voyez-vous ?<br />
  19. 19. Problématique<br />Que voyez-vous ?<br />
  20. 20. Problématique<br />Que voyez-vous ?<br />
  21. 21. Problématique<br />Shotokan-ryu<br />Goju-ryu<br />Wado-ryu<br />Shito-ryu<br />Shorin-ryu<br />Que voyez-vous ?<br />
  22. 22. Problématique<br />
  23. 23. Problématique<br /> Pour Donner du sens aux données<br />Nous utilisons nos connaissancesdans des domaines spécifiques pour identifier / reconnaître ces données<br />Connaissances partagées par des communautés<br />
  24. 24. page 24<br />Problématique<br />Donner du sens aux informations<br />Description du site Telecom Bretagne<br />Forme générale d’une description<br />Des phrases de type : SujetVerbeComplément<br />Exemple<br />Telecom Bretagnea pour directeurAndré Chomette<br />Telecom Bretagneest une grande école française<br />Telecom Bretagnea pour site web http://www.tele...<br />
  25. 25. page 25<br />Problématique<br />Donner du sens aux informations<br />Compréhension de ces phrases<br />Différents contextes : différents termes<br />« a pour directeur », « président », « Dean », …<br />Interprétation commune liée à des connaissances communes<br />Utilisation de vocabulaires standards partagés par tous !<br />Chaque vocabulaire détermine unsens uniqueaux verbes, aux catégories de sujets et de compléments<br />
  26. 26. page 26<br />Problématique<br />Plus formellement, ou presque<br />Telecom Bretagnedbpprop:presidentAndré Chomette (en)<br />Telecom Bretagnedbpprop:typeFrench Grande Ecole (en)<br />Telecom Bretagnedbpprop:websitehttp://www.tele...<br />Questions <br />French Grande Ecole dont André Chomette est président ?<br />?Grande_Ecoledbpprop:presidentAndré Chomette (en)<br />?Grande_Ecoledbpprop:typeFrench Grande Ecole (en)<br />
  27. 27. Problématique<br />Site Dbpedia<br />Wikipedia + indexation sémantique<br />http://dbpedia.org/page/%C3%89cole_nationale_sup%C3%A9rieure_des_t%C3%A9l%C3%A9communications_de_Bretagne<br />
  28. 28. Semantic Web in Action<br />page 28<br />Le Web sémantique<br />Objectifs<br />Réutilisation, partage, échange des données<br />Automatisation ou semi-automatisation de certains services en réutilisant les données<br />Moyens<br />Les données sont décrites / indexées de tel sorte que les contenus – sens et sémantique - du web soient « interprétables » par les machines.<br />
  29. 29. Le Web sémantique<br />Le Web sémantique<br />Les données doivent être encodées de tel sorte que les contenus – sens et sémantique - du web soient plus « compréhensibles » pour les machines, ou en d’autres termes par des algorithmes.<br />
  30. 30. Le Web sémantique<br />
  31. 31. Le Web sémantique<br />Tim Berners-Lee<br />Première vision du « Semantic Web »<br />Accès automatique à l’information fondé sur une sémantique des données interprétable par l’ordinateur et des heuristiques utilisant celle-ci.<br />Une sémantique explicite des données, associée à des théories sur des domaines (ontologies), permettra l’accès à de nouveaux services sur Internet<br />
  32. 32. Le Web sémantique<br />Point clé de l’automatisation ou de la semi-automatisation<br />Recherche d’information pertinentes : Rappel et Précision<br />Recherche d’information précise<br />Réutilisation, partage, échange et composition possible des informations retrouvées<br />Mais aussi, capacité à concevoir certaines « opérations  » automatiquement<br />Donc pas de services élaborés possible : pas d’automatisation ou semi-automatisation de certains services ou tâches<br />Comment assurer le B2B, B2C “automatiquement”<br />Exemple: voyage complexe avec réservation,<br />
  33. 33. Architecture du SW<br />Le SW nécessite <br />Une architecture partagée par tous pour échanger des ressources sur Internet<br />Des standards pour <br />Les ontologies et mécanismes d’inférence associés<br />La sémantique explicite des ressources ou méta données sémantiques liées à des ontologies<br />Le format des ressources ou documents<br />L’adressage des ressources ou documents<br />
  34. 34. Architecture du SW<br />
  35. 35. Architecture du SW<br />
  36. 36. Niveau Adressage /Nommage : URI<br />URI : Uniform Resource Identifier (RFC 2396)‏<br />Un simple identifieur Web<br />Chacun peut en créer – décentralisé -<br />Ressource avec une URI  être sur le Web<br />URL: ftp, gopher, http, internet mail, etc. (normalisée)‏<br />1 Protocole, 1 machine, 1 chemin<br />URN : URI persistente<br />W3C maintient une liste des schémas d’URI<br />
  37. 37. Niveau Syntaxique: XML<br />XML : eXtensible Markup Language <br />Sélection d’un sous-ensemble de SGML simple à implanter, mais néanmoins extensible : chacun défini ses propres balises<br />Séparation de la présentation et du contenu<br />XML a été conçu pour décrire des données<br />Les balises XML ne sont pas prédéfinis. Vous devez définir vos propres balises<br />XML utilise un Document Type Definition (DTD) or an XML Schéma pour un « modèle » des données<br />
  38. 38. Niveau Syntaxique: XML<br />XML n’est pas un remplacement d’HTML<br />HTML a été conçu pour afficher des données et se concentre surtout sur leur présentation (taille, couleur, etc.)<br />XML a été conçu pour décrire des données et se concentre sur la structure de ces données.<br />XML a été conçu pour assurer l’interopérabilité<br />XML et HTML sont complémentaire<br />XSL / XSLT transforme XML en HTML<br />
  39. 39. Niveau Syntaxique: XML<br />Propriétés de XML<br />Indépendant des logiciels et matériels <br />Infrastructure des échanges de données structurées<br />Interopérabilité : conçu pour décrire des données, les stocker, les transporter et les échanger et les partager<br />XML DTD: une DTD défini les éléments constitutifs d’un documents. Il défini la structure syntaxique (un arbre) d’un document type à l’aide d’une grammaire.<br />Il permet donc à toute application de vérifier la conformité d’un document à la DTD<br />Et donc de manipuler et transformer celui-ci lorsqu’il est conforme à cette DTD.<br />
  40. 40. Niveau Syntaxique: XML<br />XML peut être utilisé pour créer de nouveaux langages<br />XML est le prère de WAP et WML (Wireless Markup Language).<br />MATHML, etc.<br />
  41. 41. Niveau Syntaxique : XML<br /><?xml version="1.0"?><!DOCTYPE note [ <!ELEMENT note (to,from,heading,body)> <!ELEMENT to (#PCDATA)> <!ELEMENT from (#PCDATA)> <!ELEMENT heading (#PCDATA)> <!ELEMENT body (#PCDATA)> ]> <note><to> Tove </to><from> Jani </from><heading>Reminder </heading><body> Don't forget me this weekend </body></note><br />
  42. 42. Niveau Syntaxique: XML<br /><?xml version="1.0" encoding="ISO-8859-1"?> <br /><!-- Edited with XML Spy v4.2 --> <br /><CATALOG> <br /> <CD> <br /> <TITLE>Empire Burlesque</TITLE> <br /> <ARTIST>Bob Dylan</ARTIST> <br /> <COUNTRY>USA</COUNTRY> <br /> <COMPANY>Columbia</COMPANY> <br /> <PRICE>10.90</PRICE> <br /> <YEAR>1985</YEAR> <br /> </CD> <br /> <CD> <TITLE>Hide your heart</TITLE> <br /> <ARTIST>Bonnie Tyler</ARTIST> <br /> <COUNTRY>UK</COUNTRY> <br /> <COMPANY>CBS Records</COMPANY> <br /> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> <br /> </CD> <br /></CATALOG> <br />
  43. 43. Niveau Syntaxique: XML<br />Réutilisation des ressources/documents<br />Le même contenu peut apparaître de manières différentes dans différents contextes indépendamment des plate formes<br />Différents média : papier, en ligne, <br />Différentes tailles : manuels, rapports<br />La présentation peut être adaptée/personnalisée aux préférences de l’utilisateur<br />Présentations standardisées peuvent être réalisées : entreprises, universités, mairies, etc.<br />
  44. 44. Niveau Syntaxique: XML<br />XML <br />Ne contient aucune sémantique formelle pour l’ordinateur<br />Ce sont les humains qui donnent un sens, une sémantique, aux balises et leur contenu pas les machines<br />« La sémantique »est un domaine qui étudie comment les symboles se référent aux objets <br />« Note » ne référence rien pour une machine, la référence est uniquement faite dans l’esprit des lecteur humains<br /> D’où RDF pour la sémantique<br />
  45. 45. Niveau sémantique : RDF/RDFS<br />RDF – Resource Description Framework<br />RDFS – Resource Description Framework Schema<br />RDF/RDFS a été créé pour le traitement des métadonnées<br />Ce sont des langages de description de métadonnées au niveau sémantique<br />Fournit l’interopérabilité – au niveau sémantique - entre applications pour l’échange, le partage et la réutilisation d’informations non interprétable pour la machine<br />
  46. 46. Niveau sémantique : RDF/RDFS<br />RDF/RDFS provient principalement des communautés<br />De standardisation du Web<br />Des bibliothèques<br />Des documents structurés<br />Représentation de connaissances<br />Programmation orientée objets et langages de modélisation, <br />Etc.<br />
  47. 47. Niveau sémantique : RDF/RDFS<br />Langages Interprétables par une machine<br />Un langage peut être compris (interprété) par une machine si et seulement si ce langage possède une sémantique formelle. <br />Le langage doit se référencer à un modèle sous-jacent.<br />En logique, le sens est fondé sur une théorie des modèles qui associe, entre autres, une valeur de vérité à chaque formule bien formée.<br />Elle permet donc de « relier » les formules aux objets du monde modélisé.<br />
  48. 48. Niveau sémantique : RDF/RDFS<br />Logique<br />Théorie axiomatique<br />Un langage et des formules bien formées<br />Des axiomes, des règles d’inférences<br />A, (A  B) -- B<br />Des théorèmes: formules bien formées déduites des axiomes et règles d’inférences<br />Théorie des modèles<br />Interprétation, Formules vraies/fausses <br />Formules valides<br />
  49. 49. Niveau sémantique : RDF/RDFS<br />Théorème  Formule valide<br />Une démonstrateur automatique de théorèmes est un algorithme qui « respecte les axiomes et règles d’inférences »<br />Il « respecte aussi le principe ci-dessus »<br />Les opérations de la machine « respecte la sémantique formelle »<br />
  50. 50. Niveau sémantique : RDF/RDFS<br />Calcul des prédicats<br />Théorie axiomatique : des prédicats<br />Théorie des modèles : des relations<br />Le web sémantique<br />Importe l’idée d’une sémantique formelle dans le monde du WWW (point de vue logico-linguistique).<br />RDF/RDFS propose un langage adéquat à l’implantation de métadonnées sémantiques associées aux ressources.<br />
  51. 51. Niveau sémantique: RDF/RDFS<br />RDF est<br />Un simple modèle relationnel<br />Une déclaration RDF est constituée d’un triplet « Objet, Attribut, Valeur », dont chaque membre peut être un littéral ou une ressource web<br />Ce triplet peut être interprété comme le tuple suivant : <br />« Sujet, Prédicat, Objet » ou encore Prédicat (Sujet, Objet)‏<br />Exemple<br /><http://music.fi/pieces#finlandia, creator, http://composer.org/Sibelius><br /><http://music.fi/pieces#finlandia, type, music><br />
  52. 52. Niveau sémantique: RDF/RDFS<br />Le modèle de données RDF est formellement défini par:<br /> Un ensemble appelé Ressources.<br /> Un ensemble appelé Littéraux<br /> Un sous-ensemble de Ressources appelées Propriétés.<br /> Un ensemble appelé Déclarations, dont chaque élément est un triplet (prédicat, sujet, objet) « prédicat » est une propriété (membre de Propriétés), « sujet » est une ressource (membre de Ressources)« objet » est soit une ressource soit un littéral (membre de Littéraux).<br />
  53. 53. Niveau sémantique: RDF/RDFS<br />Le modèle de données RDF<br />N’est pas une sérialisation d’un arbre syntaxique XML, ou les branches devraient être présentées dans l’ordre spécifié par une DTD XML.<br />Le modèle de données RDF est un ensemble de triplet !!!!!!!!!!<br />C’est un graphe orienté<br />
  54. 54. Niveau sémantique: RDF/RDFS<br />{creator, [http://www.w3.org/Home/Lassila], "Ora Lassila"} <br />
  55. 55. Niveau sémantique: RDF/RDFS<br />
  56. 56. Niveau sémantique: RDF/RDFS<br /><rdf:rdf xmlns:rdf=« http://www.w3.org/1999/02/22-rdf-syntax-nms# »<br /> xmlns:dc=« http://purl.org/dc/elements/1.1 »<br /> <rdf:description rdf:about=« http://music.fi/pieces#Finlandia »><br /> <dc:creator rdf:resource=« http://composer.org/Sibelius »><br /> <rdf:type music </rdf:type><br /> </rdf:description><br /><rdf:rdf><br />
  57. 57. Niveau sémantique: RDF/RDFS<br />RDF Schéma<br />RDF ne permet pas de spécifier le vocabulaire utilisé dans une description RDF, comme par exemple : « author », « music », « creator », etc.<br />C’est-à-dire définir la « sémantique » des propriétés<br />RDF Schéma est une extension de RDF avec laquelle il et possible de<br />Décrire les concepts utilisés dans des déclarations RDF<br />Un ensemble de contraintes sur les objets et les valeurs du triplet.<br />
  58. 58. Niveau sémantique: RDF/RDFS<br />RDF Schema <br />Pourrait être vu comme un modèle orienté objet pour le WWW<br />« rdfs:Class » & « rdfs:SubClass » définissent la hiérarchie des classes<br />« rdf:type » défini les instances d’une classe<br />« rdf:domain » & « rdf:range » défini des contraintes sur les types de ressources<br />
  59. 59. Niveau sémantique: RDF/RDFS<br />
  60. 60. Niveau sémantique : RDF/RDFS<br />Mais, RDF schéma définie les propriétés en terme de classes de ressources auxquelles elles s’appliquent au lieu de définir les classes en terme de propriétés que les instances possèdent.<br />Par exemple, on définit la propriété « eg:author » avec pour « domain » « eg:Document » et avec un « range » de « eg:Person », tandis qu’un système classique orienté objet aurait défini une classe « eg:Book « avec un attribut appelé « eg:author » de type « eg:Person ». <br />En utilisant une approche RDF, il est facile pour les autres de définir des propriétés additionnelles avec un « domain » de « eg:Document » or un « range » « eg:Person ». <br />
  61. 61. Niveau sémantique : RDF/RDFS<br />On peut le faire sans avoir besoin de redéfinir la description originale de ces classes. <br />Un des avantages de cette approche centrée propriété est qu’il est très facile à chacun de dire ce qu’ils veulent au sujet d’une ressource. <br />C’est l’un des principes de l’architecture du Web [BERNERS-LEE98].<br />Sinon, il serait nécessaire de définir une nouvelle propriétés dans une classe et de la partager avec les autres !!!!!<br />Il permet de combiner des méta descriptions dans différentes partie du Web en un seul graphe !!!!!!<br />
  62. 62. Commentaire<br />Nom de la classe <br />la classe Ressource. <br />rdfs:Resource <br />le concept de Classe<br />rdfs:Class <br />le concept de propriété<br />rdf:Property<br />la classe littéral represente les valeurs de type littéral<br />rdfs:Literal <br />la classe de RDF déclarations<br />rdf:Statement<br />représente l’ensemble des Conteneurs.<br />rdfs:Container <br />une collection non ordonnée<br />rdf:Bag<br />une collection ordonnée<br />rdf:Seq<br />une collection d’alternatives<br />rdf:Alt <br />Le niveau sémantique: RDF/RDFS<br />
  63. 63. Niveau sémantique: RDF/RDFS<br />
  64. 64. Niveau sémantique: RDF/RDFS<br />
  65. 65. Niveau sémantique: RDF/RDFS<br />RDFS est limité en termes de pouvoir d’expression<br />Il est souvent nécessaire de pouvoir exprimer des contraintes supplémentaires<br />Cardinalités min et Max, contraintes entre propriétés, etc.<br />Les ontologies dans le cadre du Web sémantique sont des extensions de RDFS.<br />
  66. 66. Niveau sémantique: les Ontologies<br />Langages logiques : formalismes typiques<br />Logiques de descriptions <br />Loom, FaCT, Racer, Jena, …<br />Logiques de frames <br />Ontobroker, Florid, XSB, KAON…<br />Graphes conceptuels<br />Prolog+CG, Corese, etc.<br />RDF / RDF Schéma <br />Sesame, RQL, TRIPLE, SiLRi, …<br />
  67. 67. Niveau sémantique: les Ontologies<br />OWL site du W3C http://www.w3.org/2004/OWL/<br />Semantic Web <br />http://www.semanticweb.org/<br />http://www.w3.org/2001/sw/<br />http://www.lalic.paris4.sorbonne.fr/stic/as5.html<br />http://www.schemaweb.info/default.aspx<br />AS Web Sémantique, rapport final<br />http://rtp-doc.enssib.fr/basedoc/rapports/ASWebSemantique2003.pdf<br />
  68. 68. Niveau sémantique: les Ontologies<br />Ontologies<br />http://www.w3.org/2001/sw/WebOnt/<br />http://www.formalontology.it/index.htm<br />http://ontology.buffalo.edu/<br />http://www.cs.utexas.edu/users/mfkb/related.html<br />http://www.daml.org/ontologies/<br />http://www.jfsowa.com/ontology/<br />http://www-ksl-svc.stanford.edu:5915/<br />
  69. 69. Niveau sémantique: les Ontologies<br />Les outils/environnements<br />http://www.semanticweb.org/<br />Les logiques de descriptions : <br />http://dl.kr.org/<br />http://www.ida.liu.se/labs/iislab/people/patla/DL/<br />Les graphes conceptuels : <br />http://www.cs.uah.edu/~delugach/CG/ ; <br />http://www.jfsowa.com/cg/ ;<br />
  70. 70. Niveau sémantique: les Ontologies<br />Les outils/environnements<br />Les Frames Logic <br />http://www.informatik.uni-freiburg.de/~dbis/Publications/95/flogic-jacm.html<br />http://www.cs.sunysb.edu/~kifer/dood/papers.html<br />http://www.ontoprise.de/members/angele/pubs/ontologyhandbook.pdf<br />
  71. 71. Ontology Web Langage<br />OWL<br />C’est une version modifiée de DAML (Darpa) + OIL (Europe)‏<br />Conçu pour des applications qui traitent le contenu, pas uniquement la présentation des informations<br />Une extension de RDFS, muni d’une sémantique formelle<br />Constitué de trois langages<br />OWL Lite<br />OWL DL<br />OWL Full<br />
  72. 72. Ontology Web Langage<br />OWL Lite<br />Classification hiérarchie + contraintes simples<br />OWL DL<br />Pouvoir d’expression supérieur, avec complétude (toutes les conclusions sont calculables) et décidabilité<br />C’est une logique de description (DL)‏<br />OWL Full<br />Expressivité maximale, pas de garantie sur les résultats de calculs<br />
  73. 73. Ontology Web Langage<br />Toute ontologie OWL Lite valide est une ontologie OWL DL valide<br />Toute ontologie OWL DL valide est une ontologie OWL Full valide<br />Toute conclusion valide de OWL Lite est une conclusion valide de OWL DL<br />Toute conclusion valide de OWL DL est une conclusion valide de OWL Full<br />
  74. 74. Ontology Web Langage<br />Exemples<br />http://www.schemaweb.info/schema/BrowseSchema.aspx<br />http://www.daml.org/ontologies/category.html<br />http://www.daml.org/ontologies/category.html<br />

×