• Like
Présentation du web de données
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

Présentation du web de données

  • 1,424 views
Published

Présentation donnée pour le secteur "Coopération et Développement" de l'ADBS, à l'occasion d'un atelier intitulé "Web sémantique et développement durable", à l'UNESCO, le 31 janvier 2011.

Présentation donnée pour le secteur "Coopération et Développement" de l'ADBS, à l'occasion d'un atelier intitulé "Web sémantique et développement durable", à l'UNESCO, le 31 janvier 2011.

Published in Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
1,424
On SlideShare
0
From Embeds
0
Number of Embeds
2

Actions

Shares
Downloads
28
Comments
0
Likes
2

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Introduction au Web de données : L’importance des URIs et de la confiance
    Alexandre Monnin
    Secteur Coopération et développement de l’ADBS.
    Atelier « Web sémantique et développement durable »
    UNESCO, 31 janvier 2011
  • 2. Le Web « 2.0 » : La fin des ontologies ?
  • 3. Des visions du monde opposées : le choix du descripteur n’est pas neutre
    Clay Shirky(Ontology is Overrated: Categories, Links, and Tags)
  • 4. Des lieux de savoir et de pouvoir.
    Library of Congress
  • 5. Les sujets correspondent parfois à une réalité d’une autre âge (en particulier dans le domaine politique ou celui des mœurs) :
    Ne correspondant pas à la réalité contemporaine, les listes d’autorités n’en couvrent qu’une partie (passent sous silence les phénomènes nouveaux, la réévaluation de phénomènes déjà connus, etc.)
    “Homosexuality” was, until 1946, a subtopic of “Sexual perversion,” and even after it moved to stand as its own heading, a ‘see also’ from “Sexual perversion” (which changed to “Sexual deviance”) remained until 1972.  Although LC is supposed to use common or popular rather than medical or scientific terms, Greenblatt emphasizes that the Library of Congress did not adopt the term “Gay” for “Homosexual” until 1987, although this change was in the literature came several years after The New York Times adopted the usage of the term “Gay.” (CyndeMoya)
  • 6. Quelles solutions ?
  • 7. a) Réformer les institutions.
  • 8. Sanford Berman
  • 9. LCSH Scorecard
  • 10. De nouvelles entrées
    50 ans après l’apparition du mouvement !
  • 11. Les travaux de CyndeMoya* ont montré que l’information contenue dans les bibliothèques, touchant à des sujet ayant trait à la sexualité, n’était guère accessible. Faute de volonté, faute également d’un ensemble approprié de métadonnées.
     
    (*"Talking About "Pornography": A Comparative Subject Analysis of Sexually Explicit Materials“)
  • 12. b) Autre solution :
    Photo : http://www.behance.net/Gallery/Do-It-Yourself/48520
  • 13. S’organiser pour faire du descripteur (des métadonnées en général) un enjeu politique :
    • Des communautés s’organisent pour créer leurs thesaurus, classifications, etc.
    • 14. Le recours au taggings’impose également comme une solution immédiatement accessible.
  • La multiplication des classifications = leur disparition ?
    Photo : http://www.flickr.com/photos/27670134@N05/3964189052/ Photo : http://www.hyperorg.com/speaker/photos.html
  • 15. Prise des bibliothèques ?
  • 16. De nouvelles Bastilles du savoir ?
    Image : http://www.flickr.com/photos/szjason/1741964043/
  • 17. Quid du Web de données dans tout ça ?
  • 18. Du point de vue des standards… un Web de ressourcesidentifiées par des URIs
  • 19. DynamicWeb sites
    L’accès à une « page » Web
    Schéma : Nicolas Delaforge
    Content generation
    First instability cause :
    A (potential) content generationateveryrequest
  • 20. On ne parlera pas de pages mais de HTTP représentations
  • 21. Ressources v.s représentations
    “Four years later (après la RFC 1630) , in 2396, we have the fully articulated position --anything can be a resource, and representationsare what is retrieved, not resources.  Resources whose representation is time-varying are explicitelyacknowledged (I'm guessing this comes from Roy's interest in this case as discussed in his PhD).”
    (Henry S. Thompson)
    Journée d'étude PraTIC : Spatialités et Temporalités du Web.
  • 22. Variations diachroniques
    “The distinction between resource and representation was something that I added to the definitions (…)The observations demonstrated that people were not identifying documents, but rather the conceptual mapping over time [nous soulignons] -- what TimBL later called the "sameness" of resources.”
    (Roy Fielding)
    Journée d'étude PraTIC : Spatialités et Temporalités du Web.
  • 23. J’accède à une représentation (au sens du protocole HTTP) de cette ressource à un moment t.
  • 24. 11th October
    12th October
  • 25. Négociation de contenu (variations synchroniques)
    “The distinction between the abstract document and its representation in a network transaction was a firm principle of System 33 (developed in the late 80s, with the ideas primarily developed by Mark Weiser). (…)
    “I've always thought that the ideas of content negotiation and the separation of the abstract 'information resource' from its concrete representation in a file format [nous soulignons]made their way into HTTP (…) and that the elaboration of the idea that a URI might point to a service rather than any 'document' at all was also first demonstrated by Steve Putz in the PARC map browser.”
    (Larry Masinter)
  • 26. = « Conneg »
    La vrai question n’est pas : « toutes ces représentations sont-elles identiques ? » mais, « sont-elles le représentations d’une même ressource ? » (identité inter-représentation v.s fidélité des représentations à une même ressource).
    http://www.w3.org/QA/2006/02/content_negotiation.html
    Journée d'étude PraTIC : Spatialités et Temporalités du Web.
  • 27. Je n’accède jamais à une ressource
    Je n’accède qu’à ses représentations
    Ex. : la page d’accueil du Monde vs ses représentations, hier, aujourd’hui, demain.
  • 28. Des « adresses » d’objets inaccessibles ?
    “Locators may apply to resources that are not always or not ever network accessible.  
    Examples of the latter include human beings and physical objects that have no electronic instantiation (that is, objects without an existence completely defined by digital objects such as disk files).”
    (RFC 1736)
  • 29. On parlera de ressources informationnelles ou non informationnelles.
  • 30. Au final…
  • 31. La ressource n’est pas un objet au sens traditionnel.
    Elle correspond à une entité quelconque (« ma ressource est Tim Berners-Lee ») et permet d’en générer des représentations plus ou moins fidèles.
    Faisant l’objet d’une publication, elle est également soumise à un processus éditorial qui garantit l’acuité de la description et la fidélité des représentations.
  • 32. Ces descriptions peuvent diverger.
    Ex. : Si ma ressource est l’élément Sodium…
    OpenCyc: un élément est l’ensemble de tous les fragments de cet élément à l’état pur
    Dbpedia: inclut en outre les isotopes de sodium (nombre de neutrons différent)
    Cf. Harry Halpin & Patrick Hayes, Whenowl:sameAsisn’t the same : An Analysis of Identity Links on the Semantic Web
  • 33. Toutes les ressources ne se donc valent pas !
    La confiance est donc un enjeu essentiel du
    Web de données étant donné que les assertions y sont a priori tenues pour vraies (le faux n’existe pas du point de vue de RDF).
    Il n’existe donc pas de mécanismes pour établir leur vérité, uniquement leurs conséquences logiques.
    Leur correspondance avec la réalité, leur vérité, est l’affaire, en amont, de ceux qui les publient sous forme de triplets RDF, en aval, de ceux qui les réutilisent.
    Tim Berners-Lee, 2005
  • 34. URI
    Resource : la règle/description grâce à laquelle on va identifier une entité, y faire référence et en donner des représentation. L’adéquation de la ressource repose sur l’acuité de sa description/règle et sur la confiance en la personne/institution qui la publie.
    Uniform/Universal : l’identifiant universel (d’une ressource) qui permet d’accéder à ses représentations (variables) et à ses projections (locales)
    A la base du système…
  • 35. Chacun est libre de créer une URI pour n’importe quelle entité (pace Shirky).
    Mais on ne peut faire également confiance à tout le monde.
  • 36. Conclusion : A qui faire confiance ?
    Quelles représentations du monde ?
    Qui les produit ?
    A qui se fier (grandes institutions, communautés d’intérêts, individus…) ?
    A qui se fier selon les contextes ?
  • 37. Merci !