L avenir du web au prisme de la resource

4,025 views
3,890 views

Published on

De plus en plus fréquemment, le web s’intercale entre nous et le monde. Le web des documents et des données augmente nos perceptions de la réalité quand dans le même temps le web d'applications et de services accroît l’emprise que nous exerçons sur elle en multipliant les tâches que nous pouvons accomplir. Devenu incontournable dans nos activités quotidiennes, il est également difficilement gérable.
Sur le web, une ressource peut être n’importe quoi et, à mesure que le réseau s’étend, tout, dans notre environnement, est susceptible de se muer en ressource. Certes, on parle maintenant de « réalité augmentée » par le web mais, à mesure que la toile se déploie, il faut également noter à quel point la réalité vient l’augmenter elle-même, en raison de la quantité et de la diversité de ressources identifiées en son sein.

0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,025
On SlideShare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
24
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

L avenir du web au prisme de la resource

  1. 1. l’avenir du web au prisme de la ressource Nicolas Delaforge, Fabien Gandon et Alexandre Monnin
  2. 2. cinq objectifs • présenter (un web de ressources computationnelles) • résumer, rappeler (web de données, web sémantique) • discuter, provoquer (le document n’existe pas) • orienter (et pour nous alors) • conclure, ouvrir (ce n’est que le début)
  3. 3. architecture web
  4. 4. trois composants de l’architecture du web • identification (URI) & adressage (URL) http://www.inria.fr http://ns.inria.fr/fabien.gandon#me ldap://[2001:db8::7]/c=GB?objectClass?one • communication / protocole (HTTP) GET /centre/sophia HTTP/1.1 Host: www.inria.fr User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de) AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4 Safari/523.10 Accept-Encoding: gzip Accept: text/html,application/xhtml+xml,application/xml Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3 Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7 Referer: http://fabien.info/ • langage de représentation (HTML / RDF) Fabien travaille chez <a href="http://www.inria.fr">Inria</a> <http://www.inria.fr> foaf:member data:fabien
  5. 5. UR*  pas pour les gens… et pourtant…  URI: identification de n’importe qu’elle ressource  URL=URI + Localisation URL=UR(I+L)  HTTP URI: URI déréférençable selon HTTP « follow your nose » / naviguer au flair (wikipedia)
  6. 6. la syntaxe des URIS qui et quand ?
  7. 7. URI aux jointures • entre les assertions même si elles sont distribuées • entre les couches réseau (Internet, Web, Web sémantique) 1 physique 2 données 3 réseau 4 transport 5 session 6 présentation 7 application
  8. 8. web documentaire « REST in peace » • REST(ful): invocation et composition d’applications distribuées sur le web • primitives HTTP, actions sur la ressource GET, HEAD, POST, OPTIONS, CONNECT, TRACE, PUT, DELETE • le web ne fut jamais vraiment documentaire • web… – application centrée ressources (identifiées par URI) – architecture orientée ressource (localisables URL) – toile de calculs liés et non de documents
  9. 9. trois composants de l’architecture du web • identification de la ressource (URI) • accès à une représentation (HTTP URI) • codage de la représentation (HTML , RDF, etc)
  10. 10. ressource
  11. 11. HTTP Range 14 Code HTTP Résultat Indication 200 (OK) Représentation Ressource informationnelle (IR) et non informationnelle (NIR) ? 303 (voir autre) URI Tout type de ressource notamment des NIR 4XX, 5XX (erreur) Message d’erreur Aucune déduction possible « ce n’est peut-être pas le problème de HTTP ou des URI » ils n’en ont pas parlé ils en ont parlé
  12. 12. uri, ressource, ombre, objet • identification • individuation/ objectivation zèbre (à défaut d’antilope )
  13. 13. ressource• tout ce que l’on sait identifier • pierre angulaire de l’architecture de tout le web • concept unificateur de ses facettes « ressource » HTTP URI requête HTTP erreur HTTP représentation
  14. 14. Généalogie : du document (B.B.) à la ressource Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée Ressource : Manipulation indirecte « … » locus
  15. 15.  l’objet  la ressource  l’état de la ressource  l’état représentationnel ou une représentation de la ressource ressources computationnelles « … » règles
  16. 16. rappel et parallèle • sans notice pas d’existence dans la collection • sans ressource pas d’existence sur le web
  17. 17. toile de calculs
  18. 18.  appearences database 1991-1993 System 33: un prédécesseur méconnu du conneg + services de rendu Electronic documents Rendering service Computers Servicing Client Application Other encoding formats RPC Psychophysically equivalents client serveur conneg http
  19. 19. moteur et CGI
  20. 20. personnalisation, adaptation « Filter Bubble » Eli Pariser
  21. 21. Fabien Gandon: Wed, Jul 18, 2012 at 9:48 AM, Inria, Sophia Antipolis, France, Dell 6200, Windows 7, Anglais
  22. 22. Alexandre Monnin: Alienware, Chromium SRware Iron, Windows 7, Paris
  23. 23. Adrien Basse: 17h57mn à 18h07mn GMT, Dakar/Sénégal, Mac book pro, Mac os X (10.6.8), french
  24. 24. Yves Raimond: Firefox 13.0.1, Ubuntu 12.04, in London
  25. 25. Antoine Isaac: 10h45pm, Amsterdam, Prins Hendrikkade 129, MacBook Pro, English OS: MacOs X 10.6.8, Firefox
  26. 26. Rémi Trichet: 12:41pm 7/18/2012, Los Angeles, Intel Xeon 3,6 Ghz, Windows 7 Professional, English
  27. 27. il cherche « bmw », « mahler » et « gay »
  28. 28. ? = ! BMW « Je m’intéresse aux BMW »
  29. 29. Allo Google ? C’est la Noiraude… United States Flu Activity - Influenza estimate ● Google Flu Trends ● U.S. Centers for Disease Control.
  30. 30. « document sur lui-même » document vivant, chaque consultation change le document
  31. 31. 900 millions Chine: 1 600 millions Inde: 1 200 millions acebook
  32. 32. PORTÉE
  33. 33. externaliser la socialité d’un site intérêt et danger
  34. 34. OGP v2 actions typées
  35. 35. OGP schémas…
  36. 36. code dans votre page <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="en-US" xmlns:fb="https://www.facebook.com/2008/fbml"> <head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns# YOUR_NAMESPACE: http://ogp.me/ns/apps/YOUR_NAMESPACE#"> <meta property="fb:app_id" content="YOUR_APP_ID" /> <meta property="og:type" content="YOUR_NAMESPACE:recipe" /> <meta property="og:title" content="Stuffed Cookies" /> <meta property="og:image" content="http://example.com/cookie.jpg" /> <meta property="og:description" content="The Turducken of Cookies" /> <meta property="og:url" content="http://example.com/cookie.html"> <script type="text/javascript"> function postCook() { FB.api('/me/YOUR_NAMESPACE:cook' + '?recipe=http://example.com/cookie.html','post', (…) }); } </script> </head> <body> (…) <form> <input type="button" value="Cook" onclick="postCook()" /> </form> </body> </html>
  37. 37. Face… it
  38. 38. changing interface…
  39. 39. crowdsourcing crawling & indexing affiliation social sub-networks
  40. 40. analyse réseaux sociaux web 2.0 & dynamique © FriendViz © Obama’s network, Recorded Future © Egyptian Revolution on Twitter, A. Panisson, Gephi © Facebook
  41. 41. une représentation est modifiée par un commentaire contenu essentiel, lié à une ressource spécifique (un article) vs contenu accessoire, lié à une règle non-essentielle (un commentaire)
  42. 42. une ressource change : une question devient une réponse parfois… ?  !
  43. 43. suppression définitive ni ressource, ni représentation
  44. 44. gérér sa bibliographie : Zotero et Coins
  45. 45. extraction de données « page » donnant l’analyse du texte d’une autre « page »
  46. 46. made in web
  47. 47. auteurs?
  48. 48. journal confusion des genres?
  49. 49. permanence/ non permanence
  50. 50. raccourcisseur d’URL et re-captcha…
  51. 51. des jeux utiles au crowdsourcing le web comme une plateforme d’externalisation distribuée de masse. Fold It
  52. 52. temps facebook 16.2 millions secondes/seconde x 16 203 703 253
  53. 53. l’utilisateur utilisé le web comme une machine universelle de moteurs à pulsions (méta)-données
  54. 54. application web
  55. 55. jeuHTML5
  56. 56. Mario Kart en HTML5 (ouf !) …
  57. 57. jouer dans le navigateur : le cloud
  58. 58. © HTML5Rocks download upload drag & drop
  59. 59. © HTML5Rocks speech input geolocation
  60. 60. © HTML5Rocks html & js html & svg WebGL
  61. 61. inputs, text, email, number, phone ©HTML5Rocks
  62. 62. HTML pages of specifications 39 pages 963 pages HTML 1
  63. 63. Ligne de Temps
  64. 64. annotations des éléments multimédia • description sémantique de ressources multimedia [Media Annotation] • adressage d’éléments internes aux ressources [Media Fragment]
  65. 65. fragment multimédia • partie fragment de l’URL = après le # http://www.example.com/example.ogv#track=audio&t=10,20 • dimensions: – temporelle: t=10,20 / t=npt:,0:02:01.5 / t=clock:2009-07-26T11:19:01Z – spatiale: xywh=pixel:160,120,320,240 / xywh=percent:25,25,50,50 – track: track=1 / track=video&track=subtitle / track=Wide – nommée: id=chapter-1 • fragment non transmis par le navigateur: encodage dans la requête HTTP
  66. 66. ontologies des ressources multimédias ontology for Media Resources 1.0 <video.ogv> a ma:MediaResource ; ma:hasTrack <video.ogv#track=audio>, <video.ogv#track=subtitle>; ma:hasSubtitling <video.ogv#track=subtitle> ; ma:hasSigning <video.ogv#xywh=percent:70,70,90,90> . <video.ogv#track=audio> a ma:AudioTrack ; ma:hasLanguage [ rdfs:label "en-GB" ] ; ma:hasFragment <video.ogv#track=audio&t=10,20> . <video.ogv#track=audio&t=10,20> a ma:MediaFragment ; ma:hasLanguage [ rdfs:label "fr" ] . <video.ogv#track=subtitle> a ma:DataTrack ; ma:hasLanguage [ rdfs:label "es" ] . <video.ogv#xywh=percent:70,70,90,90> a ma:MediaFragment ; ma:hasLanguage [ rdfs:label "bfi" ] .
  67. 67. universelle une interface programmatique serveur application HTTP HTTP application navigateur HTTP
  68. 68. design & affordance ceci est un ovetto
  69. 69. affordance sémantique
  70. 70. SAWSDLsemantic annotation of WSDL (W3C Rec. 2007)
  71. 71. SAWSDL…
  72. 72. sémantiquement services annotés et recherchés fournisseurserviceclientdemandeur annuaire 3 12
  73. 73. pre-populating…
  74. 74. entrée sortie
  75. 75. assistant’s phone phone  namename phone name employee assistant
  76. 76. workflows scientifiques • composer des données et traitements distribués • échanger et comparer les traitements et leurs compositions
  77. 77. se lierau monde
  78. 78. Le bug de l’an… 2020 ( inspiration Gérard Berry) SSRSSLSSS SSLSSLSSS 
  79. 79. 1 sec. battement de cœur 1/2 sec. double click 24 images/sec. film 500 000 décisions / sec. algorithmes boursiers« Aliénation et accélération. » Hartmut Rosa
  80. 80. http://mon.org/ma/ressource  règles négociation calculs composition rendu … … … … … … … DNS, TCP/IP, Web …
  81. 81. http://mon.org/ma/ressource  règles négociation calculs composition rendu … … … … … … … … DNS, TCP/IP, Web GET
  82. 82. 30 min…
  83. 83. 5 jours…
  84. 84. le livre n’est pas recréé à chaque page
  85. 85. Stéphane Crozat: « le document numérique n'existe pas, ce qui existe ce sont des constructions numériques dont le traitement calculatoire simule un ordre documentaire. »
  86. 86. Le juridique aussi souffre de l’héritage documentaire des données
  87. 87. nouveaux engagements, contrats • contrats de lecture + computationnel • contrats d’identification + computationnel • contrats d’accès + computationnel • contrats de publication + computationnel • contrats de stockage + computationnel • etc. « il n’y a plus de documents, le besoin de documentariser n’en n’est que plus fort. »
  88. 88. tant à venir
  89. 89. le web entre nous et le monde • documents & données augmentent nos perceptions • services & applications augmentent nos actions • incontournable &… ingérable?
  90. 90. réalité augmentée par le web & augmentation du web par le réel • vers une réalité augmentée par le web • diversité des ressources web augmentée par diversité des ressources de notre réalité • « documentarisation non documentaire » de la réalité par le web • modèle documentaire rendu minoritaire / modèle calculatoire • limite de la métaphore de la bibliothèque • une toile de ressources informatiques
  91. 91. google glass project
  92. 92. chaque utilisateur est un détecteur web de « consommacteurs » mobiles, « crawlers » du web & du monde physique ex. Wikimapia, OpenStreetMap , etc. © Medialab Prado © GeoSensor
  93. 93. Image,T. Berners-Lee, RuleML kickoff, 2005 une toile de données multiples entre différents barreaux de l’échelle des sphères « small data & big data »
  94. 94. web…devices … Web Phone … Web TV … Web Radio … Web Car … Web Tablet … Web eBook … Web Watch … Web GPS … [Web of Devices]
  95. 95. cintre Facebook chez C&A Brésil
  96. 96. nouvelles topologies du web ex. « near field communication »
  97. 97. Open Street Map dans le métro
  98. 98. navigateur web = interface universelle ex. domotique
  99. 99. Web 2.0 & Web Physique
  100. 100. RFID&URI ex. Live Social Semantics fabien
  101. 101. Janet Echelman, “Her Secret is Patience”, Civic Space Park, Phoenix, AZ, USA, 2009
  102. 102. plusieurs évolutions concourantes • explosion multimédia et multi-modalité • toile de ressources computationnelles liées • ressources comme locus de calcul • assimilation de tous les objets à des ressources web
  103. 103. l’effet diligenceJacques Perriault
  104. 104. (méta) web
  105. 105. liens d’association du mémex entre les informations qui nous importent [Vannevar Bush, 1945]
  106. 106. hypertexte, hypermédia une structure de fichier pour l’information complexe, changeante et indéterminée [Ted Nelson, 1965]
  107. 107. à travers le réseau liens utilisant des références http://www. [Tim Berners-Lee, 1989]
  108. 108. hypertexte et document sur le Web : de la nécessité de les reconstruire par assemblages Hypertexte : Google Document : Scenari Le Web à la base n’est pas un hypertexte : il ne relie pas des documents. mais il peut le devenir ou accueillir des documents car c’est aussi une plateforme ouverte… …
  109. 109. structuré vers un web
  110. 110. séparer forme et contenu
  111. 111. 2008 XML a eu dix ans <balise>…</balise> XML en 10 points http://www.w3.org/XML/1999/XML-in-10-points.fr.html structurer des données en utilisant des balises dans un format textuel construction modulaire une famille de langages un format ouvert non propriétaire
  112. 112. XMLbien formé <racine>...</racine> <x>...</x> ou <x/> <a><b></a></b> <x> <X> <1an> <xmla> <bla bla> <a b='c'></a> ou <a b='c'/>
  113. 113. de langages Scalable Vector Graphics (SVG) XML Topic Maps (XTM) Synchronized Multimedia Integration Language (SMIL) eXtensible Access Control Markup Language (XACML) OpenOffice Schemas MusicML MathML Financial products Markup Language (FpML) GPS Exchange format (GPX) NewsML WSDL Chemical Markup Language (CML)XHTML famille
  114. 114. namespace • espaces de nommage • éviter les collision de noms • associer un préfixe de balise à un URI • exemple • définitions héritées dans l’arbre XML • namespace par défaut xmlns="…" <ugb:note xmlns:ugb='http://www.ugb.sn/'>18</ugb:note> <bla:note xmlns:bla='http://www.ugb.sn/'>18</bla:note>
  115. 115. ontos logos être / êtres discours / science “JacobLorhard's"OgdoasScholastica"(1606)containsthefirstoccurrenceoftheterm ‘ontologia’”RaulCorazzononformalontology.it
  116. 116. -> Ontologie ontologie
  117. 117. votre réponse est basée sur une ontologie partagée je peux comprendre vous pouvez raisonner
  118. 118. Document Book Novel Short story sous type
  119. 119. sous type #12 #21 #47 #48 "document" "book" "livre" "novel" "roman" "short story" "nouvelle" #21  #12 #48  #21#47  #21
  120. 120. #21  #12 #48  #21#47  #21 connaissanceontologique formalisée #12 #21 #47 #48
  121. 121. ontologie n’est pas un synonyme de taxinomie
  122. 122. la connaissance taxinomique est une connaissance ontologique parmi d’autres
  123. 123. partie de carbone hydrogèneoxygène dioxyde de carbone dioxygène ozone dihydrogène méthane éthane méthanol éthanol eauphénol méthyle
  124. 124. combiner différents types de connaissances ontologiques Hierarchical model of the shape of the human body. D. Marr and H.K. Nishihara, Representation and recognition of the spatial organization of three-dimensional shapes, Proc. R. Soc. London B 200, 1978, 269-294). LimbIndividual Cat Organic object
  125. 125. couverture dans quelle mesure les primitives mobilisées par les scénarios sont couvertes par l’ontologie
  126. 126. spécificité dans quelle mesure les primitives sont précisément déclarées dans l’ontologie
  127. 127. granularité dans quelle mesure les primitives sont détaillées
  128. 128. exemple granularité [Charlet - RFIA 2002] 1. Patient-Masculin Patient-Féminin 2. [Patient]  (chrc)  [Masculin] [Patient]  (chrc)  [Féminin] 3. [Patient]  (attr)  [Sexe]  (val)  [Masculin] [Patient]  (attr)  [Sexe]  (val)  [Féminin]
  129. 129. dans quelle mesure les primitives sont décrites dans un langage formel formalité
  130. 130. méthodes ex. rigidité dans Onto Clean [Guarino & Welty] Rigid +R  is a necessary property for all its instances Anti-Rigid ~R  is an optional property for all its instances Person is y+R, Student is ~R Constraint: ~R can't subsume y+R
  131. 131. structurer une “folksonomie” folksonomies platesweb 2.0 pollution pollution des sols has narrower polluant énergie related related thesaurus ? SKOS
  132. 132. combinaison espaces métriques distances d’édition Monge-Elkan Soundex, JaroWinkler, asymétrie Monge-Elkan Qgram métrique contextuelle cosinus vecteur de cooccurrences de tags métriques sociales inclusion de communautés d’intérêt
  133. 133. 83 027 relations / 9 037 tags  68 633 related  11 254 hyponyms  3 193 spelling variants ex. ademe TheseNet
  134. 134. recherches & retours
  135. 135. ex. propagation sémantique sel, eau poivre, vin moutarde rugby, foot foot, ciné hockey sport sport sport condiment condiment condiment from RAK/LP to SemTagP
  136. 136. ex. Ademe 1 pollution ; 2 développent durable ; 3 énergie ; 4 chimie ; 5 pollution de l’air ; 6 métaux ; 7 biomasse ; 8 déchets.
  137. 137. langages de formalisation d’ontologies
  138. 138. exemple (define-class humain (?humain) :def (animal ?humain)) subsomption dans les frames
  139. 139. exemple (defprimconcept MALE) (defprimconcept FEMELLE) (disjoint MALE FEMELLE) classes disjointes en logiques de description
  140. 140. exemple [Concept: Directeur]->(Def)-> [LambdaExpression: [Personne: ]->(Dirige)->[Groupe]] classe définie en graphes conceptuels
  141. 141. sémantique vers un web
  142. 142. le web originel liens typés…
  143. 143. web sémantique mentionné par Tim BL en 1994 à WWW [Tim Berners-Lee 1994, http://www.w3.org/Talks/WWW94Tim/]
  144. 144. RDF, toute connaissance est décomposée en triplets ( sujet , prédicat , objet ) arcs ( nœud, arête , nœud )
  145. 145. ex : doc.html a pour auteur Fabien et a pour thème la Musique
  146. 146. doc.html a pour auteur Fabien doc.html a pour thème Musique
  147. 147. Fabien auteur doc.html thème Musique
  148. 148. <RDF/> une syntaxe XML pour mieux échanger ces graphes
  149. 149. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22- rdf-syntax-ns#" xmlns:inria="http://inria.fr/schema#" > <rdf:Description rdf:about="http://inria.fr/rr/doc.html"> <inria:author rdf:resource= "http://inria.fr/~fabien#me" /> <inria:theme>Music</inria:theme> </rdf:Description> </rdf:RDF>
  150. 150. nœuds anonymes (blank nodes) http://bu.ch/l23.html auteur "Les zélés faons roses" titre "Laurent" nom "Trichard" prenom quantification existentielle il existe une ressource telle que… {  r ; …} <rdf:Description rdf:about="http://bu.ch/123.html "> <auteur> <rdf:Description> <nom>Trichard</nom> <prenom>Laurent</prenom> </rdf:Description> </auteur> <titre>Les zélés faons roses</titre> </rdf:Description>  x ; auteur(http://bu.ch/123.html,x) nom(x,"Trichard") prenom(x,"Laurent")
  151. 151. interroger avec SPARQL SPARQL Protocol and RDF Query Language
  152. 152. exemple personne ayant au moins 18 ans PREFIX ex: <http://inria.fr/schema#> SELECT ?person ?name WHERE { ?person rdf:type ex:Person ?person ex:name ?name . ?person ex:age ?age . FILTER (?age > 17) }
  153. 153. web de données première vague de déploiement du web sémantique (RDF, SPARQL)
  154. 154. May 2007 April 2008 September 2008 March 2009 September 2010 Linking Open Data Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/ September 2011 0 100 200 300 400 10/10/2006 28/04/2007 14/11/2007 01/06/2008 18/12/2008 06/07/2009 22/01/2010 10/08/2010 26/02/2011 14/09/2011 01/04/2012
  155. 155. e.g. DBpedia
  156. 156. CORESE/ KGRAM
  157. 157. contenus et thématiques Domaines Nombre de jeux de données Triplets % Liens sortants % Media 25 1 841 852 061 5,82 % 50 440 705 10,01 % Géographique 31 6145 532 484 19,43 % 35 812 328 7,11 % Gouvernement 49 13 315 009 400 42,09 % 19 343 519 3,84 % Publications 87 2 950 720 693 9,33 % 139 925 218 27,76 % Inter-domaine 41 4 184 635 715 13,23 % 63 183 065 12,54 % Sciences de la vie 41 3 036 336 004 9,60 % 191 844 090 38,06 % Contenu utilisateur 20 134 127 413 0,42 % 3 449 143 0,68 % 295 31 634 213 770 503 998 829 42% 20% 13% 10% 9% 6% 0% Gouvernement Géographique Inter-domaine Sciences de la vie Publications Media Contenu utilisateur
  158. 158. data.ratatouille.com
  159. 159. principes  utiliser le format RDF  utiliser des URI pour nommer  utiliser des URI HTTP (URL) pour que l’on puisse les suivre  lorsqu’un URI est suivi donner des informations (HTML, RDF)  inclure dans ces informations des liens vers d’autres données
  160. 160. DNScelui qui contrôle le nom de domaine contrôle le déréférencement. ex. bit.ly & Lybie .fr * .inria isicil
  161. 161. (June 2012)
  162. 162. le cas de la France mouvement d'ouverture des données mais… • redondance des identifiants • hétérogénéité des formats • diversité des vocabulaires • hétérogénéité des accès
  163. 163. publication processus démo • installation en un click • import de données trouvées en ligne • transformation en RDF • publication sur le web • interrogation directe
  164. 164. RDFS pour définir les classes de ressources, leurs propriétés, et organiser leur hiérarchie Document Rapport créateur auteur Document Personne
  165. 165. OWLin one… par énumération par intersection par union par complément  la disjonction par restriction! par cardinalité 1..1 prop. algébriques par équivalence [>18] union disjointe restrict. valeur prop. disjointes cardinalité qualifiée 1..1 ! négation prop. indiv prop. chainées   clefs …
  166. 166. alignements et liage ontologies et entités nommées • « Ontology Alignment Evaluation Initiative » • reconnaissance d’entités nommées • liage de ressources
  167. 167. OKKAM et owl:sameAs 1 “The logical consequences are the heart of the conceptual problem raised by the use of owl:sameAs. In fact, suppose one wants to answer the query: where does John teach and what? One will make the following query on the merge of the two datasets: < x , y >: http : // U NI1 / resource / John @ : af f iliation x ∧ http : // U NI1 / resource / John @ : teaching y Certainly, if the query is processed on the merge of the two datasets of John’s academic profiles, one would get the expected results, i.e., that John teaches philosophy of language at UNI1 and logic at UNI2. 22 The problem is that one would also get the unwanted results that John teaches logic at UNI1 and philosophy of language at UNI2.” (Web of Data and Web of Entities: Identity and Reference in Interlinked Data in the Semantic Web Paolo Bouquet · Heiko Stoermer · Massimiliano Vignolo)
  168. 168. OKKAM et owl:sameAs 2
  169. 169. « when owl:sameAs is not the same » (H. Halpin, I. Herman, P. Hayes) des représentations de ressources jugées identiques peuvent néanmoins diverger. ex. : si ma ressource est l’élément sodium… • OpenCyc : un élément est l’ensemble de tous les fragments de cet élément à l’état pur • DBpedia : inclut en outre les isotopes de sodium (nombre de neutrons différent)  deux vue sur la même chose ou deux objets différents ?
  170. 170. chaine GATE : exemple en biologie…
  171. 171. thesaurus, classifications, sujets, taxinomies, folksonomies, ... vocabulaires contrôlés
  172. 172. expression naturelle pour dénoter un concept inria:CorporateSemanticWeb skos:prefLabel "corporate semantic web"@en; skos:prefLabel "web sémantique d'entreprise"@fr; skos:altLabel "corporate SW"@en; skos:altLabel "CSW"@en; skos:hiddenLabel "web semantique d'entreprise"@fr. labels
  173. 173. entre conceptsinria:CorporateSemanticWeb skos:broader w3c:SemanticWeb; skos:narrower inria:CorporateSemanticWiki; skos:related inria:KnowledgeManagement. relations
  174. 174. inria:CorporateSemanticWeb skos:scopeNote "only within KM community"; skos:definition "a semantic web on an intranet"; skos:example "Nokia's internal use of RDF gateway"; skos:historyNote "semantic intranet until 2006"; skos:editorialNote "keep wikipedia def. uptodate"; skos:changeNote "acronym added by fabien".
  175. 175. beaucoup de données dans beaucoup de pages
  176. 176. R2RML une transformation standard d’une base relationnelle en RDF schéma mapping
  177. 177. Triplets produits : • cellules d’une ligne  sujet commun • noms des colonnes  prédicats • une cellule  un objet • liens entre tables nom prenom age filar alain 34 seger thomas 45 #s1 :nom "filar" #s1 :prenom "alain" #s1 :age "34" #s2 :nom "seger" #s2 :prenom "thomas" #s2 :age "45" #s3 …
  178. 178. exemple de mapping ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com http://…isbn/000651409X Ghosh, Amitav http://www.amitavghosh.com The Glass Palace 2000 a:name a:homepage a:author I. Herman, W3C
  179. 179. (1) transformation table personnes ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com http://…isbn/000651409X Ghosh, Amitav http://www.amitavghosh.com The Glass Palace 2000 a:name a:homepage a:author :P_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:termtype "BlankNode" ; rr:column "ID" ; ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:name ]; rr:objectMap [ rr:column "Name" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:homepage ]; rr:objectMap [ rr:column "Homepage" ; rr:termtype "IRI" ] ] ; I. Herman, W3C
  180. 180. (2) transformation table livres ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com http://…isbn/000651409X Ghosh, Amitav http://www.amitavghosh.com The Glass Palace 2000 a:name a:homepage a:author I. Herman, W3C :B_Table rdf:type rr:TriplesMap ; rr:subjectMap [ rr:template "http://...isbn/{ISBN}"; ]; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:title ]; rr:objectMap [ rr:column "Title" ] ] ; rr:predicateObjectMap [ rr:predicateMap [ rr:predicate a:year ]; rr:objectMap [ rr:column "Year" ; ] ] ;
  181. 181. (3) lier les tables ISBN Author Title Year 0006511409X id_xyz The Glass Palace 2000 ID Name Homepage id_xyz Ghosh, Amitav http://www.amitavghosh.com http://…isbn/000651409X Ghosh, Amitav http://www.amitavghosh.com The Glass Palace 2000 a:name a:homepage a:author I. Herman, W3C :B_Table a rr:TriplesMap ; ... rr:refPredicateObjectMap [ rr:refPredicateMap [ rr:predicate a:author ]; rr:refObjectMap [ rr:parentTriplesMap :P_Table ; rr:joinCondition "{child}.Author = {parent}.ID" ] ] ].
  182. 182. RDFa signifie RDF dans des attributs de HTML <div xmlns:dc="http://purl.org/dc/elements/1.1/"> <h2 property="dc:title">The trouble with Bob</h2> <h3 property="dc:creator">Alice</h3> ... </div>
  183. 183. provenance, confiance, explication, “At the toolbar (menu, whatever) associated with a document there is a button marked "Oh, yeah?". You press it when you loses that feeling of trust. It says to the Web, "so how do I know I can trust this information?". The software then goes directly or indirectly back to metainformation about the document, which suggests a number of reasons.” Tim Berners-Lee, Consistent User Interface, W3C Design Issues, 1997 Oh,yeah?
  184. 184. en insérant des étiquettes émises par des autorités dans les pages protéger les enfants <meta http-equiv="pics-label" content='(PICS-1.1 "http://www.icra.org/ratingsv02.html" labels for "http://mm.256.com/" generic true ratings (cz 1 la 1 lb 1 lc 1 nz 1 oz 1 vz 1) "http://www.rsac.org/ratingsv01.html" labels for "http://mm.256.com/" generic true ratings (n 0 s 0 v 0 l 4) )' />
  185. 185. VoID: décrire des sources de données schéma pour annoter des jeux de données :DBpedia a void:Dataset . et des jeux de liens :DBpedia_Geonames a void:Linkset .
  186. 186. :DBpedia a void:Dataset; void:sparqlEndpoint <http://dbpedia.org/sparql>; void:feature :RDFXML ; void:subset :DBpedia2Geonames ; void:uriLookupEndpoint <http://lookup.dbpedia.org/api/search.asmx/KeywordSearch? QueryString=> ; dcterms:modified "2008-11-17"^^xsd:date; dcterms:title "DBPedia"; dcterms:description "RDF data extracted from Wikipedia"; dcterms:publisher :DBpedia_community; dcterms:license <http://creativecommons.org/licenses/by-sa/3.0/>; dcterms:source <http://dbpedia.org/resource/Wikipedia>. :Geonames a void:Dataset; void:sparqlEndpoint <http://geosparql.appspot.com/query>; void:triples "107983838"^^xsd:integer ; dcterms:subject <http://dbpedia.org/resource/Location> . :DBpedia2Geonames a void:Linkset ; void:linkPredicate owl:sameAs ; void:target :DBpedia ; void:target :Geonames . ex. DBpedia dataset
  187. 187. provenance & traçabilité[Provenance WG]
  188. 188. PROV-DM & PROV-O OWL2 ontology décrire les entités et activités impliquées dans la production, livraison, etc. d’un objet ex1:aggregated prov:used ex1:dataSet2, ex1:regionList2 . ex1:aggregate2 prov:wasGeneratedBy ex1:aggregated . ex1:illustrated prov:used ex1:aggregate2 . ex1:chart2 prov:wasGeneratedBy ex1:illustrated . ex1:aggregated prov:wasControlledBy ex1:derek . ex1:dataSet2 prov:wasRevisionOf ex1:dataSet1 . ++
  189. 189. description authentifiée plusieurs ressources listes domaines, chemins expressions régulières
  190. 190. grouping mechanisms... ... list URIs ... domain names, paths ... regular expressions on URIs
  191. 191. exemple de description POWDER « toute ressource dont l’URI commence par http://www-sop.inria.fr/fr/ concerne le centre de recherche de l’INRIA géographiquement situé à Sophia Antipolis et est en français » certifié par inria.fr
  192. 192. préjugés, fausses idées
  193. 193. boite noire éviter de construire une
  194. 194. explicites rendre les conceptualisations
  195. 195. à base d’ontologie ne signifie pas que l’on a besoin d’un moteur d’inférence.
  196. 196. de l'intérêt d'un à peu près… ma montre n'a qu'une aiguille mais elle n'est pas cassée.
  197. 197. sens et position d’une taxonomie à une vue ar a=120° 360°0°
  198. 198. “semantic web” and not “semanticweb” [C. Welty, ISWC 2007] “a lightweight ontology allows us to do lightweight reasoning” [J. Hendler, ISWC 2007]
  199. 199. 66 FOAF primitives 3 475 908 348 references (2) x 52 millions “a small tree ruling a big graph”(1) (1) Franck Van Harmelen, ISWC 2011 (2) Libby Miller, 2009
  200. 200. le piège du domaine le domaine d’application n’est pas forcément celui de l’ontologie
  201. 201. universelle je n’ai jamais vu une ontologie
  202. 202. Trouble dans la classification (F. Rastier)
  203. 203. la vache folle ou l’ontologue végétarien s:MadCow rdfs:subClassOf s:Cow
  204. 204. gestion besoin conception diffusion utilisationévaluer évolution cycle vie
  205. 205. modèle changeant brique de construction vs.
  206. 206. tri sélectif sémantique le web est une poubelle, le web sémantique sera une poubelle sémantique.
  207. 207. et pour nous
  208. 208. hyper-documentaire de l’article scientifique à l’hyper-article multi-public plus vieille facette, mais encore sous exploitée
  209. 209. donnez des URL aux contenus une URL est un nom, sans URL pas de nom, sans nom je ne peux pas en parler • référence • granularité • vues
  210. 210. nouvelles formes de rédaction… • systématiquement enrichir de liens • identifier des cibles internes et externes • identifier les persona de notre public • permettre des parcours multimédias idoines « produire une hyper-ressource, c’est hyper long… c’est même jamais vraiment fini. »
  211. 211. forme / fond, structure, sémantique • jeux de données scientifiques entrées et sorties • des schémas de données développer http://ns.inria.fr • Ex en biologie: HCLS IG • SPARQL: recherche de liens, motifs et chaines • référentiels métiers et domaines nos termes, nos définitions, nos thésaurus, ... ex. SHOINQ < ALC < Logique de Description < Langage Logique <XML/>
  212. 212. utilités ? scénarios ? • reproductibilité et comparatifs • permettre d’autres expérimentations / algo • ex. OAEI: – Visibilité et citation – Alignement de domaines, sources, résultats, etc. • journalisme de données • génération de liens, restructuration, ranking
  213. 213. le web comme écriture collective • ouverture en écriture... collective – ne plus centraliser la rédaction: distribuer, aider, … – « utilisacteur »: nos lecteurs peuvent aider à vulgariser, reformuler, enrichir • ouverture en écriture collective ... – ne plus centraliser la rédaction: animer, solliciter – participer à d’autres sites: ex. wikipedia (édition, ref.)
  214. 214. nouvelles formes de publication… • soumissions immédiatement publiques • revues sollicitées et processus rendus publics • ouvert aux commentaires et revues spontanés • éditeur scientifiques vs. web ouvert • nouveaux modes opératoires, nouveaux critères
  215. 215. nouvelles conférences • suivre l’ensemble de la conférence • percevoir les avis, réactions, questions • interroger, réagir • compléter, traduire, augmenter
  216. 216. socialité centrée ressource • objets cristallisant une activité sociale et vice-versa • bis repetita placent… « online or invisible » • e.g. médiathèque sociale (vidéos, images, etc.) – commentaires, tagging, etc. site ouvert à tous – contributions ouvertes en interne • e.g. « e-CRDP » – cartographie intervenants et matériels pédagogiques – ex. un compte slideshare, service interne… + animation • interstice socialisé: réactions, tagging, etc. …
  217. 217. au-delà du Buzz • orchestrer la communication et sa contagion • gérer notre présence en ligne • faire explicitement appel au peuple (sondages, campagnes de test, etc.) • faire implicitement appel au peuple (tagging, bookmarking, etc.) • cartographie interne et externe de nos réseaux
  218. 218. nos algorithmes en ligne • fournisseurs de services de haut niveau (bibliothèque, QoS, certification, etc.) • démonstrateurs / testeurs ex. traitement d’image • services, API et widgets • galerie, maintenance, serveur application HTTP HTTP application navigateur HTTP ex. « pseudo haptic »…
  219. 219. label sur des ressources web • authentifier des ressources • valider des données • sécuriser des accès • certifier des services …
  220. 220. interfaces et utilisateurs partout • HTML5: de la page à l’application nouvelles formes de production et consultation • consommation opportuniste, contextuelle, etc. • contenus multi-formats (ex. podcasts interstices) • Accessibilité ? • App. INRIA ?
  221. 221. doggy-bags
  222. 222. web 1, 2
  223. 223. price convert? person homepage? more info? web 1, 2, 3
  224. 224. lier le monde lier les données
  225. 225. webrecommandations html http url html httpurl uri iri ataguaagwcag aria mwbpearlra cc/pp assxcss ddrsa xml eve. exi geo apidom xform grddl inkml its cmwww ruby an.xhtml rdfa ets omr m. ok emma p3pmath ml mf pics qa rif sec cont. sawsdlpng powder sml soap wsdl svg awwwttml smile rdf owlrdfssparql etc. woff webcgm xbl xkms xlinkwscdl wsp skos ns canon. x dtxml xproc xfragxml xbase xschema xml:id xpath xpointer xqueryxsignat. xbop xslt xslfo …
  226. 226. Leçon 1: faire une application web o HTML 5 o CSS 2.1 o CSS 3 Selectors o CSS 3 Media Queries o CSS 3 Text o CSS 3 Backgrounds and Borders o CSS 3 Colors o CSS 3 2D Transformations o CSS 3 3D Transformations o CSS 3 Transitions o CSS 3 Animations o CSS 3 Multi-Columns o CSS Namespaces o SVG 1.1 o WAI-ARIA 1.0 o MathML 2.0 o ECMAScript 5 o 2D Context o WebGL o Web Storage o Indexed Database o Web Workers o Web Sockets Protocol/API o Geolocation o Server-Sent Events o Element Traversal o DOM Level 3 Events o Media Fragments o XMLHttpRequest o Selectors API o CSSOM View Module o File API o RDFa o Microdata o WOFF o HTTP 1.1 o TLS 1.2 (updated) o IRI (updated) o … W3C
  227. 227. i=j;réplication et bien anti-rival… à l’échelle du monde.
  228. 228. socialisation intensive de nos activités.
  229. 229. WEBscience 263
  230. 230. informel formel usage représentation un et un seul web… données personnes documents programmes un espace unique dans tous les sens du terme, une toile hybride metadata gestion-orientée métadonnée • diversité de ressources (données ou non) • métadonnées & schéma pour leur gestion • importance du web sémantique dans ce contexte
  231. 231. demain,celui qui contrôlera les métadonnées, contrôlera le web.

×