Semantic Information Systems

2,254 views
2,177 views

Published on

ISITC APRIL 2011
Hammam Sousse

Published in: Education, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,254
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
14
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Semantic Information Systems

  1. 1. Les Systèmes d’Information Sémantiques<br />S. Garlatti<br />
  2. 2. PLAN<br />Cours 1 (1h30) : <br />Problématique, Problème1<br />Cours 2 (1h30) : <br />Le web sémantique, <br />Cours 3 (3h00) :<br />RDF / RDFS, les Ontologies, <br />Cours 4 (3h00) :<br />OWL, SKOS, SIOC, FOAF<br />Cours 5 (3H00) : <br />Linked Data ou Web of Data, Le langageSparql<br />Cours 6 (1H30) : <br />Le web sémantique & social en Action<br />
  3. 3. Problématique<br />Hypothèses<br />Systèmes d'information (SI)<br />Accessibles sur Internet et/ou Intranet <br />A l’aide d'un navigateur <br />Architecture distribuées fondée sur l’architecture du Web<br />Appelés « Sémantiques » parce que fondés sur les principes du Web Sémantique<br />
  4. 4. Problématique<br />Enjeu principal des SI<br />Réutilisation, partage et échange des données <br />sur internet / Intranet<br />Par les machines (automatiquement)<br />
  5. 5. Problématique<br />Internet / Intranet<br />Technologie pour<br />Accéder à des informations non structurées, hétérogènes et distribuées <br />L’accès à l’information et à des sources de connaissance devient essentiel<br />L’importance d’Internet est due :<br />Aux services qu’il nous fournis: IRC, ICQ, Chat, email, News groups, FTP, WWW, E-commerce, B2B, B2C, etc.<br />
  6. 6. Problématique<br />WWW : succès fondé sur sa simplicité, MAIS !<br />Développé pour des lecteurs humains<br />Les données actuelles sont principalement organisées et structurées pour être simple à transmettre et être présentées à des humains<br />HTML et PDF sont principalement des langages de présentation de données <br /><H2> Triple X </H2> : ne dit rien sur le titre sauf pour des humains<br />Internet est de plus en plus utilisé par des machines – search engines, robots, etc.<br />
  7. 7. Problématique<br />Problèmes<br />Accéder, traiter l’information, extraire et interpréter l’information<br />La majorité des données sur le web est sous une forme qui ne permet pas de l’utiliser à grande échelle.<br />Pas de système global de publication de données permettant aux machines et aux humains de les traiter<br />Évènements sportifs, météo, guides TV, guides cinéma, etc. sont présentés par de nombreux sites Web, mais presque tous au format HTML (structure logique + présentation)‏<br />Comment trouver et extraire l’information pertinente pour différents services<br />
  8. 8. Problématique<br />Problèmes<br />Entrave la recherche, l’extraction, la maintenance et la génération d’information<br />Actuellement, pas d’accès réel au contenu des documents<br />Contenu et Information pas accessible ni interprétable par des machines<br />
  9. 9. Semantic Web in Action<br />page 9<br />Problématique<br />Problèmes<br />Qualité de la recherche d’information<br />Comment la machine peut-elle savoir que les résultats de la recherche sont pertinents ?<br />Réutilisation des contenus de sites web<br />Comment peut-on réutiliser les contenus de sites web ?<br />
  10. 10. Semantic Web in Action<br />page 10<br />Problématique<br />Recherche d’information de type Google<br />Polysémie<br />Nombre de résultats très important<br />Requête : « directeur » « André Chomette »<br />Intention : On ne veut que le site de Telecom Bretagne !<br />44 000 résultats : toutes les pages qui contiennent ces deux termes ou l’un des deux<br />
  11. 11. Problématique<br />Comment donner dusensaux Données<br />
  12. 12. Problématique<br />Comment attribuons-nous du sens aux données ?<br />Que voyez-vous ?<br />
  13. 13. Problématique<br />Que voyez-vous ?<br />
  14. 14. Problématique<br />Que voyez-vous ?<br />
  15. 15. Problématique<br />Que voyez-vous ?<br />
  16. 16. Problématique<br />Que voyez-vous ?<br />
  17. 17. Problématique<br />Que voyez-vous ?<br />
  18. 18. Problématique<br />Que voyez-vous ?<br />
  19. 19. Problématique<br />Que voyez-vous ?<br />
  20. 20. Problématique<br />Que voyez-vous ?<br />
  21. 21. Problématique<br />Shotokan-ryu<br />Goju-ryu<br />Wado-ryu<br />Shito-ryu<br />Shorin-ryu<br />Que voyez-vous ?<br />
  22. 22. Problématique<br />
  23. 23. Problématique<br /> Pour Donner du sens aux données<br />Nous utilisons nos connaissancesdans des domaines spécifiques pour identifier / reconnaître ces données<br />Connaissances partagées par des communautés<br />
  24. 24. page 24<br />Problématique<br />Donner du sens aux informations<br />Description du site Telecom Bretagne<br />Forme générale d’une description<br />Des phrases de type : SujetVerbeComplément<br />Exemple<br />Telecom Bretagnea pour directeurAndré Chomette<br />Telecom Bretagneest une grande école française<br />Telecom Bretagnea pour site web http://www.tele...<br />
  25. 25. page 25<br />Problématique<br />Donner du sens aux informations<br />Compréhension de ces phrases<br />Différents contextes : différents termes<br />« a pour directeur », « président », « Dean », …<br />Interprétation commune liée à des connaissances communes<br />Utilisation de vocabulaires standards partagés par tous !<br />Chaque vocabulaire détermine unsens uniqueaux verbes, aux catégories de sujets et de compléments<br />
  26. 26. page 26<br />Problématique<br />Plus formellement, ou presque<br />Telecom Bretagnedbpprop:presidentAndré Chomette (en)<br />Telecom Bretagnedbpprop:typeFrench Grande Ecole (en)<br />Telecom Bretagnedbpprop:websitehttp://www.tele...<br />Questions <br />French Grande Ecole dont André Chomette est président ?<br />?Grande_Ecoledbpprop:presidentAndré Chomette (en)<br />?Grande_Ecoledbpprop:typeFrench Grande Ecole (en)<br />
  27. 27. Problématique<br />Site Dbpedia<br />Wikipedia + indexation sémantique<br />http://dbpedia.org/page/%C3%89cole_nationale_sup%C3%A9rieure_des_t%C3%A9l%C3%A9communications_de_Bretagne<br />
  28. 28. Semantic Web in Action<br />page 28<br />Le Web sémantique<br />Objectifs<br />Réutilisation, partage, échange des données<br />Automatisation ou semi-automatisation de certains services en réutilisant les données<br />Moyens<br />Les données sont décrites / indexées de tel sorte que les contenus – sens et sémantique - du web soient « interprétables » par les machines.<br />
  29. 29. Le Web sémantique<br />Le Web sémantique<br />Les données doivent être encodées de tel sorte que les contenus – sens et sémantique - du web soient plus « compréhensibles » pour les machines, ou en d’autres termes par des algorithmes.<br />
  30. 30. Le Web sémantique<br />
  31. 31. Le Web sémantique<br />Tim Berners-Lee<br />Première vision du « Semantic Web »<br />Accès automatique à l’information fondé sur une sémantique des données interprétable par l’ordinateur et des heuristiques utilisant celle-ci.<br />Une sémantique explicite des données, associée à des théories sur des domaines (ontologies), permettra l’accès à de nouveaux services sur Internet<br />
  32. 32. Le Web sémantique<br />Point clé de l’automatisation ou de la semi-automatisation<br />Recherche d’information pertinentes : Rappel et Précision<br />Recherche d’information précise<br />Réutilisation, partage, échange et composition possible des informations retrouvées<br />Mais aussi, capacité à concevoir certaines « opérations  » automatiquement<br />Donc pas de services élaborés possible : pas d’automatisation ou semi-automatisation de certains services ou tâches<br />Comment assurer le B2B, B2C “automatiquement”<br />Exemple: voyage complexe avec réservation,<br />
  33. 33. Architecture du SW<br />Le SW nécessite <br />Une architecture partagée par tous pour échanger des ressources sur Internet<br />Des standards pour <br />Les ontologies et mécanismes d’inférence associés<br />La sémantique explicite des ressources ou méta données sémantiques liées à des ontologies<br />Le format des ressources ou documents<br />L’adressage des ressources ou documents<br />
  34. 34. Architecture du SW<br />
  35. 35. Architecture du SW<br />
  36. 36. Niveau Adressage /Nommage : URI<br />URI : Uniform Resource Identifier (RFC 2396)‏<br />Un simple identifieur Web<br />Chacun peut en créer – décentralisé -<br />Ressource avec une URI  être sur le Web<br />URL: ftp, gopher, http, internet mail, etc. (normalisée)‏<br />1 Protocole, 1 machine, 1 chemin<br />URN : URI persistente<br />W3C maintient une liste des schémas d’URI<br />
  37. 37. Niveau Syntaxique: XML<br />XML : eXtensible Markup Language <br />Sélection d’un sous-ensemble de SGML simple à implanter, mais néanmoins extensible : chacun défini ses propres balises<br />Séparation de la présentation et du contenu<br />XML a été conçu pour décrire des données<br />Les balises XML ne sont pas prédéfinis. Vous devez définir vos propres balises<br />XML utilise un Document Type Definition (DTD) or an XML Schéma pour un « modèle » des données<br />
  38. 38. Niveau Syntaxique: XML<br />XML n’est pas un remplacement d’HTML<br />HTML a été conçu pour afficher des données et se concentre surtout sur leur présentation (taille, couleur, etc.)<br />XML a été conçu pour décrire des données et se concentre sur la structure de ces données.<br />XML a été conçu pour assurer l’interopérabilité<br />XML et HTML sont complémentaire<br />XSL / XSLT transforme XML en HTML<br />
  39. 39. Niveau Syntaxique: XML<br />Propriétés de XML<br />Indépendant des logiciels et matériels <br />Infrastructure des échanges de données structurées<br />Interopérabilité : conçu pour décrire des données, les stocker, les transporter et les échanger et les partager<br />XML DTD: une DTD défini les éléments constitutifs d’un documents. Il défini la structure syntaxique (un arbre) d’un document type à l’aide d’une grammaire.<br />Il permet donc à toute application de vérifier la conformité d’un document à la DTD<br />Et donc de manipuler et transformer celui-ci lorsqu’il est conforme à cette DTD.<br />
  40. 40. Niveau Syntaxique: XML<br />XML peut être utilisé pour créer de nouveaux langages<br />XML est le prère de WAP et WML (Wireless Markup Language).<br />MATHML, etc.<br />
  41. 41. Niveau Syntaxique : XML<br /><?xml version="1.0"?><!DOCTYPE note [ <!ELEMENT note (to,from,heading,body)> <!ELEMENT to (#PCDATA)> <!ELEMENT from (#PCDATA)> <!ELEMENT heading (#PCDATA)> <!ELEMENT body (#PCDATA)> ]> <note><to> Tove </to><from> Jani </from><heading>Reminder </heading><body> Don't forget me this weekend </body></note><br />
  42. 42. Niveau Syntaxique: XML<br /><?xml version="1.0" encoding="ISO-8859-1"?> <br /><!-- Edited with XML Spy v4.2 --> <br /><CATALOG> <br /> <CD> <br /> <TITLE>Empire Burlesque</TITLE> <br /> <ARTIST>Bob Dylan</ARTIST> <br /> <COUNTRY>USA</COUNTRY> <br /> <COMPANY>Columbia</COMPANY> <br /> <PRICE>10.90</PRICE> <br /> <YEAR>1985</YEAR> <br /> </CD> <br /> <CD> <TITLE>Hide your heart</TITLE> <br /> <ARTIST>Bonnie Tyler</ARTIST> <br /> <COUNTRY>UK</COUNTRY> <br /> <COMPANY>CBS Records</COMPANY> <br /> <PRICE>9.90</PRICE> <YEAR>1988</YEAR> <br /> </CD> <br /></CATALOG> <br />
  43. 43. Niveau Syntaxique: XML<br />Réutilisation des ressources/documents<br />Le même contenu peut apparaître de manières différentes dans différents contextes indépendamment des plate formes<br />Différents média : papier, en ligne, <br />Différentes tailles : manuels, rapports<br />La présentation peut être adaptée/personnalisée aux préférences de l’utilisateur<br />Présentations standardisées peuvent être réalisées : entreprises, universités, mairies, etc.<br />
  44. 44. Niveau Syntaxique: XML<br />XML <br />Ne contient aucune sémantique formelle pour l’ordinateur<br />Ce sont les humains qui donnent un sens, une sémantique, aux balises et leur contenu pas les machines<br />« La sémantique »est un domaine qui étudie comment les symboles se référent aux objets <br />« Note » ne référence rien pour une machine, la référence est uniquement faite dans l’esprit des lecteur humains<br /> D’où RDF pour la sémantique<br />
  45. 45. Niveau sémantique : RDF/RDFS<br />RDF – Resource Description Framework<br />RDFS – Resource Description Framework Schema<br />RDF/RDFS a été créé pour le traitement des métadonnées<br />Ce sont des langages de description de métadonnées au niveau sémantique<br />Fournit l’interopérabilité – au niveau sémantique - entre applications pour l’échange, le partage et la réutilisation d’informations non interprétable pour la machine<br />
  46. 46. Niveau sémantique : RDF/RDFS<br />RDF/RDFS provient principalement des communautés<br />De standardisation du Web<br />Des bibliothèques<br />Des documents structurés<br />Représentation de connaissances<br />Programmation orientée objets et langages de modélisation, <br />Etc.<br />
  47. 47. Niveau sémantique : RDF/RDFS<br />Langages Interprétables par une machine<br />Un langage peut être compris (interprété) par une machine si et seulement si ce langage possède une sémantique formelle. <br />Le langage doit se référencer à un modèle sous-jacent.<br />En logique, le sens est fondé sur une théorie des modèles qui associe, entre autres, une valeur de vérité à chaque formule bien formée.<br />Elle permet donc de « relier » les formules aux objets du monde modélisé.<br />
  48. 48. Niveau sémantique : RDF/RDFS<br />Logique<br />Théorie axiomatique<br />Un langage et des formules bien formées<br />Des axiomes, des règles d’inférences<br />A, (A  B) -- B<br />Des théorèmes: formules bien formées déduites des axiomes et règles d’inférences<br />Théorie des modèles<br />Interprétation, Formules vraies/fausses <br />Formules valides<br />
  49. 49. Niveau sémantique : RDF/RDFS<br />Théorème  Formule valide<br />Une démonstrateur automatique de théorèmes est un algorithme qui « respecte les axiomes et règles d’inférences »<br />Il « respecte aussi le principe ci-dessus »<br />Les opérations de la machine « respecte la sémantique formelle »<br />
  50. 50. Niveau sémantique : RDF/RDFS<br />Calcul des prédicats<br />Théorie axiomatique : des prédicats<br />Théorie des modèles : des relations<br />Le web sémantique<br />Importe l’idée d’une sémantique formelle dans le monde du WWW (point de vue logico-linguistique).<br />RDF/RDFS propose un langage adéquat à l’implantation de métadonnées sémantiques associées aux ressources.<br />
  51. 51. Niveau sémantique: RDF/RDFS<br />RDF est<br />Un simple modèle relationnel<br />Une déclaration RDF est constituée d’un triplet « Objet, Attribut, Valeur », dont chaque membre peut être un littéral ou une ressource web<br />Ce triplet peut être interprété comme le tuple suivant : <br />« Sujet, Prédicat, Objet » ou encore Prédicat (Sujet, Objet)‏<br />Exemple<br /><http://music.fi/pieces#finlandia, creator, http://composer.org/Sibelius><br /><http://music.fi/pieces#finlandia, type, music><br />
  52. 52. Niveau sémantique: RDF/RDFS<br />Le modèle de données RDF est formellement défini par:<br /> Un ensemble appelé Ressources.<br /> Un ensemble appelé Littéraux<br /> Un sous-ensemble de Ressources appelées Propriétés.<br /> Un ensemble appelé Déclarations, dont chaque élément est un triplet (prédicat, sujet, objet) « prédicat » est une propriété (membre de Propriétés), « sujet » est une ressource (membre de Ressources)« objet » est soit une ressource soit un littéral (membre de Littéraux).<br />
  53. 53. Niveau sémantique: RDF/RDFS<br />Le modèle de données RDF<br />N’est pas une sérialisation d’un arbre syntaxique XML, ou les branches devraient être présentées dans l’ordre spécifié par une DTD XML.<br />Le modèle de données RDF est un ensemble de triplet !!!!!!!!!!<br />C’est un graphe orienté<br />
  54. 54. Niveau sémantique: RDF/RDFS<br />{creator, [http://www.w3.org/Home/Lassila], "Ora Lassila"} <br />
  55. 55. Niveau sémantique: RDF/RDFS<br />
  56. 56. Niveau sémantique: RDF/RDFS<br /><rdf:rdf xmlns:rdf=« http://www.w3.org/1999/02/22-rdf-syntax-nms# »<br /> xmlns:dc=« http://purl.org/dc/elements/1.1 »<br /> <rdf:description rdf:about=« http://music.fi/pieces#Finlandia »><br /> <dc:creator rdf:resource=« http://composer.org/Sibelius »><br /> <rdf:type music </rdf:type><br /> </rdf:description><br /><rdf:rdf><br />
  57. 57. Niveau sémantique: RDF/RDFS<br />RDF Schéma<br />RDF ne permet pas de spécifier le vocabulaire utilisé dans une description RDF, comme par exemple : « author », « music », « creator », etc.<br />C’est-à-dire définir la « sémantique » des propriétés<br />RDF Schéma est une extension de RDF avec laquelle il et possible de<br />Décrire les concepts utilisés dans des déclarations RDF<br />Un ensemble de contraintes sur les objets et les valeurs du triplet.<br />
  58. 58. Niveau sémantique: RDF/RDFS<br />RDF Schema <br />Pourrait être vu comme un modèle orienté objet pour le WWW<br />« rdfs:Class » & « rdfs:SubClass » définissent la hiérarchie des classes<br />« rdf:type » défini les instances d’une classe<br />« rdf:domain » & « rdf:range » défini des contraintes sur les types de ressources<br />
  59. 59. Niveau sémantique: RDF/RDFS<br />
  60. 60. Niveau sémantique : RDF/RDFS<br />Mais, RDF schéma définie les propriétés en terme de classes de ressources auxquelles elles s’appliquent au lieu de définir les classes en terme de propriétés que les instances possèdent.<br />Par exemple, on définit la propriété « eg:author » avec pour « domain » « eg:Document » et avec un « range » de « eg:Person », tandis qu’un système classique orienté objet aurait défini une classe « eg:Book « avec un attribut appelé « eg:author » de type « eg:Person ». <br />En utilisant une approche RDF, il est facile pour les autres de définir des propriétés additionnelles avec un « domain » de « eg:Document » or un « range » « eg:Person ». <br />
  61. 61. Niveau sémantique : RDF/RDFS<br />On peut le faire sans avoir besoin de redéfinir la description originale de ces classes. <br />Un des avantages de cette approche centrée propriété est qu’il est très facile à chacun de dire ce qu’ils veulent au sujet d’une ressource. <br />C’est l’un des principes de l’architecture du Web [BERNERS-LEE98].<br />Sinon, il serait nécessaire de définir une nouvelle propriétés dans une classe et de la partager avec les autres !!!!!<br />Il permet de combiner des méta descriptions dans différentes partie du Web en un seul graphe !!!!!!<br />
  62. 62. Commentaire<br />Nom de la classe <br />la classe Ressource. <br />rdfs:Resource <br />le concept de Classe<br />rdfs:Class <br />le concept de propriété<br />rdf:Property<br />la classe littéral represente les valeurs de type littéral<br />rdfs:Literal <br />la classe de RDF déclarations<br />rdf:Statement<br />représente l’ensemble des Conteneurs.<br />rdfs:Container <br />une collection non ordonnée<br />rdf:Bag<br />une collection ordonnée<br />rdf:Seq<br />une collection d’alternatives<br />rdf:Alt <br />Le niveau sémantique: RDF/RDFS<br />
  63. 63. Niveau sémantique: RDF/RDFS<br />
  64. 64. Niveau sémantique: RDF/RDFS<br />
  65. 65. Niveau sémantique: RDF/RDFS<br />RDFS est limité en termes de pouvoir d’expression<br />Il est souvent nécessaire de pouvoir exprimer des contraintes supplémentaires<br />Cardinalités min et Max, contraintes entre propriétés, etc.<br />Les ontologies dans le cadre du Web sémantique sont des extensions de RDFS.<br />
  66. 66. Niveau sémantique: les Ontologies<br />Langages logiques : formalismes typiques<br />Logiques de descriptions <br />Loom, FaCT, Racer, Jena, …<br />Logiques de frames <br />Ontobroker, Florid, XSB, KAON…<br />Graphes conceptuels<br />Prolog+CG, Corese, etc.<br />RDF / RDF Schéma <br />Sesame, RQL, TRIPLE, SiLRi, …<br />
  67. 67. Niveau sémantique: les Ontologies<br />OWL site du W3C http://www.w3.org/2004/OWL/<br />Semantic Web <br />http://www.semanticweb.org/<br />http://www.w3.org/2001/sw/<br />http://www.lalic.paris4.sorbonne.fr/stic/as5.html<br />http://www.schemaweb.info/default.aspx<br />AS Web Sémantique, rapport final<br />http://rtp-doc.enssib.fr/basedoc/rapports/ASWebSemantique2003.pdf<br />
  68. 68. Niveau sémantique: les Ontologies<br />Ontologies<br />http://www.w3.org/2001/sw/WebOnt/<br />http://www.formalontology.it/index.htm<br />http://ontology.buffalo.edu/<br />http://www.cs.utexas.edu/users/mfkb/related.html<br />http://www.daml.org/ontologies/<br />http://www.jfsowa.com/ontology/<br />http://www-ksl-svc.stanford.edu:5915/<br />
  69. 69. Niveau sémantique: les Ontologies<br />Les outils/environnements<br />http://www.semanticweb.org/<br />Les logiques de descriptions : <br />http://dl.kr.org/<br />http://www.ida.liu.se/labs/iislab/people/patla/DL/<br />Les graphes conceptuels : <br />http://www.cs.uah.edu/~delugach/CG/ ; <br />http://www.jfsowa.com/cg/ ;<br />
  70. 70. Niveau sémantique: les Ontologies<br />Les outils/environnements<br />Les Frames Logic <br />http://www.informatik.uni-freiburg.de/~dbis/Publications/95/flogic-jacm.html<br />http://www.cs.sunysb.edu/~kifer/dood/papers.html<br />http://www.ontoprise.de/members/angele/pubs/ontologyhandbook.pdf<br />
  71. 71. Ontology Web Langage<br />OWL<br />C’est une version modifiée de DAML (Darpa) + OIL (Europe)‏<br />Conçu pour des applications qui traitent le contenu, pas uniquement la présentation des informations<br />Une extension de RDFS, muni d’une sémantique formelle<br />Constitué de trois langages<br />OWL Lite<br />OWL DL<br />OWL Full<br />
  72. 72. Ontology Web Langage<br />OWL Lite<br />Classification hiérarchie + contraintes simples<br />OWL DL<br />Pouvoir d’expression supérieur, avec complétude (toutes les conclusions sont calculables) et décidabilité<br />C’est une logique de description (DL)‏<br />OWL Full<br />Expressivité maximale, pas de garantie sur les résultats de calculs<br />
  73. 73. Ontology Web Langage<br />Toute ontologie OWL Lite valide est une ontologie OWL DL valide<br />Toute ontologie OWL DL valide est une ontologie OWL Full valide<br />Toute conclusion valide de OWL Lite est une conclusion valide de OWL DL<br />Toute conclusion valide de OWL DL est une conclusion valide de OWL Full<br />
  74. 74. Ontology Web Langage<br />Exemples<br />http://www.schemaweb.info/schema/BrowseSchema.aspx<br />http://www.daml.org/ontologies/category.html<br />http://www.daml.org/ontologies/category.html<br />

×