Le web sémantique - Sylvie Fayet

497

Published on

Après une 1re journée organisée le 29 mars, l'ABF Midi-Pyrénées et le CRFCB Midi Pyrénées Languedoc Roussillon on proposé une 2e journée sur les enjeux organisationnels de l'arrivée de la norme RDA dans les bibliothèques, le 27 mai à Toulouse (Amphi Cujas, Université Toulouse 1, angle rue Lautmann et rue des puits creusés)

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
497
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Le web sémantique - Sylvie Fayet

  1. 1. 1 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetLE WEB SEMANTIQUESylvie Fayet, Urfist de Toulousesylvie.fayet@univ-toulouse.frJe catalogue, tu FRBRises,il/elle googlise.L’évolution des catalogueset les bibliothécairesVendredi 29 mars 2013 – Manufacture des tabacsJournée organisée par le CRFCB Midi-Pyrénées /Languedoc-Roussillon et le groupe Midi-Pyrénées de l’ABF
  2. 2. 2 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetRappel : les évolutions du webOnt conditionné les évolutions des usages du public et entraînéde nouveaux services et pratiques dans les bibliothèquesSource : support de formation élaboré par le groupe RDA enFrance
  3. 3. 3 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetUne histoire : Web 1.0Web 1.0 = Web documentaireWeb statique 1 page = 1 document Traitement des ressources limité à leur mise en forme Navigation entre les pages avec les liens hypertexte Limites du Web statique Contenu non structuré Pas de possibilité de requête Impossibilité de renvoyer une page personnalisée selon levisiteur Impossibilité d’exploiter les ressources d’une base dedonnéesSource : support de formation du groupe RDA en France
  4. 4. 4 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetWeb statiqueTransmission de la requête HTTPTransmission de la réponse HTTPpar le serveur WebServeur WebPoste clientNavigateurPages statiquesSource : support de formation du groupe RDA en France
  5. 5. 5 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetUne évolution : le Web dynamiqueRequête httpRéponse HTTPServeur WebPoste clientNavigateurBasededonnéesDossiercontenant lespagesApplicationmétierServeurdapplicationTraitement de la requête et sélection dufichier contenant le programmeLogicielserveurSource : support de formation du groupe RDA en France
  6. 6. 6 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetLe Web 2.0Pratiquement aujourd’hui tous les sites sontdynamiques Exploitation de volumes importants d’informations(bases de données, moteurs de recherche) Personnalisation de l’accès à l’information Naissance du Web 2.0 = Web contributif Les utilisateurs font partie du processus documentaire Ajout de connaissances et de commentaires auxcontenusSource : support de formation du groupe RDA en France
  7. 7. 7 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetEvolutions actuellesLes moteurs de recherche évoluent vers de « vraies »réponses:non plus une liste de sites à interroger, mais des élémentsstructurés synthétisésexemple : Wolfram Alpha qui combine repérage de termessignifiants, exploitation de métadonnées et base deconnaissancesCommerce en ligne et téléchargement : fonctionnementdifférent des catalogues traditionnels Distance croissante entre les habitudes des internautes et leparadigme de recherche proposé par les bibliothèques
  8. 8. 8 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetVers le web 3.0L’expression « web sémantique » est de T. Berners-Lee mais ils’agit plutôt d’un web « syntaxique »Point de départ : des ressources web (pages, éléments,fichiers, données…) décrites par des métadonnéesObjectif : exploiter par des opérations de calcul ces ressourceshétérogènesOutils :• des URI pour identifier les ressources• RDF pour exprimer les métadonnées selon un modèlelogique commun
  9. 9. 9 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetLes URI(Uniform Resource Identifier)= identifiant unique et pérenne d’une ressource dans unréseau, construit selon une syntaxe normaliséeEx : mailto:sylvie.fayet@univ-toulouse.frURL (uniform resource locator) : le type d’URI le plus fréquentPas forcément le chemin qui s’affiche dans la barre d’adressedu navigateur (exemple dans le Sudoc)Alternative : les DOI (Digital Object Identifier)URN (uniform resource name) : un ISBN par exemple
  10. 10. 10 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetRDF (Resource description frame)= modèle logique de représentation de l’informationBase : un graphe de relations entre des entitésorganiseorganises’intitulea lieu àa lieu lecoopèrea lieu lea lieu à
  11. 11. 11 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetLes triplets RDFToutes ces relations s’expriment sous la forme de tripletsObjet Prédicat SujetLa ressource donton parleLa relation entre laressource et sacaractéristiqueL’attribut, la caractéristiqueLe CRFCB organise une journée d’étudesEvolutions descataloguesa lieu le 29 mars 2013URI (numéro RNEdu CRFCB , URL dela page de lajournée…)Typologie des relations(auteur, date…)Valeur variable libellée sipossible selon référentiel(« event » dans unetypologie des ressources,format AAAA/MM/JJ pour ladate…)
  12. 12. 12 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetFabriquer du RDFLes informations avec lesquelles bâtir ces triplets proviennentdes métadonnées décrivant les ressources web.Préalable = « traduire » les métadonnées métier en RDFDublin Core s’exprime en RDF (exemple en XML et en RDF)FRBR = adaptation de la logique RDF aux informationsbibliographiques
  13. 13. 13 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetVocabulaires et ontologiesRDF s’appuie sur des vocabulaires contrôlés :• Modèles de métadonnées ; par exemple :• VIAF (virtual international authority file), géré par OCLC, pouragréger les données d’autorité• FOAF (Friend of a friend) pour les personnes physiques(correspondance avec le Dublin Core)• OAI-ORE pour des ressources composites agrégeant diversesdonnées• EDM (European data model) pour les objets patrimoniaux• ontologies au format OWL (ex : Bibo http://bibliontology.com/)• thesauri exprimés en SKOS (Rameau et LCSH par exemple)Exemple d’une notice SUDOC en RDFExemple du RDF AGRIS : http://agris.fao.org/fr/agris-rdf-properties
  14. 14. 14 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetApplicationsDifficulté : l’interrogation se fait au moyen de langages spécifiquescomme SPARQL  pas ou peu de requêtes directes mais plutôtun parcours de donnéesUn des points de départ : DBPedia (http://www.dbpedia.org)Exemples de requêteApplication aux données bibliographiques : http://data.bnf.frLe linked data cloud : http://lod-cloud.net/versions/2011-09-19/lod-cloud_colored.htmlEt le linked data des bibliothèques : http://datahub.io/group/lldLinked data bibliographique : exemple par Ivan Herman du W3C(http://www.w3.org/People/Ivan/CorePresentations/SWTutorial)
  15. 15. 15 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. Fayet
  16. 16. 16 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. Fayet
  17. 17. 17 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. Fayet
  18. 18. 18 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetLe web sémantique n’est pas(forcément) :un outil de TAL ni d’extraction du sensLe tuyau sémantique (Ch. Fauré)
  19. 19. 19 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetLe web sémantique n’est pas non plus……la mise à disposition de données sous n’importe quelle forme« Ouverture des données » :• Des données en RDF (ex : l’INSEE http://rdf.insee.fr/)• Des données brutes• Des API (Application programming interface) = interfacepermettant l’interaction d’un programme informatique avecd’autres (ensemble de fonctions et de procédures)
  20. 20. 20 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetApiculture (Christian Fauré)APIculture = temps court / économie de l’attentionvsDataculture = temps long / économie de la mémoire
  21. 21. 21 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetHétérogénéité des accèsgérés par les bibliothèquesPortail documentaireBase deconnaissancesRésolveur deliensOutils d’interrogationOPACAutres interfacesgérées par labibliothèqueInterfacesextérieuresRessourcesDocumentsélectroniques acquisà l’extérieurDocumentsnumériquesproduits parlabibliothèqueDocuments nonélectroniques
  22. 22. 22 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetEnjeuxCroiser les données bibliographiques avec :• Les données des autres institutions culturelles(http://lodlam.net/)• Les données du monde académique (publicationsscientifiques, thèses…)• D’autres types de données publiquesExploiter les thesaurus et vocabulaires contrôlés / les fichiersd’autoritésAméliorer la recherche fédérée et valoriser les collectionsDifficulté inhérente aux bases de connaissances : on nemaîtrise pas les données (choix d’indexation notamment)
  23. 23. 23 Journée CRFCB / ABF – 27 mai 2013Urfist de Toulouse – S. FayetQuestionsComment maîtriser des données que nous ne produisons pas ?Inversement, quelle part « intéressante » dans les données quenous produisons ?Rentrer dans les contenus ?• Éléments d’évaluation• SélectionDépasser la difficulté techniqueSemantic web in libraries 2012 :http://swib.org/swib12/programme.php
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×