Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Moteurs de recherche et web sémantique

7,461 views

Published on

Le Web sémantique est-il un n-ième standard de représentation des données ou une nouvelle façon d’aborder la recherche d’information ?

L'utilisation du terme « Sémantique » a souvent été porteur de confusions donnant à penser que le Web sémantique visait la compréhension du langage naturel par les machines. Même si les objectifs réels du Web sémantique semblent en réalité éloignées des techniques du traitement automatique de la langue, les technologies du Web sémantique n'en restent pas moins intéressantes pour les solutions d'accès et de recherche d'information. En effet, celles-ci sont déployée dans des contextes de plus en plus complexes mêlant données structurées et données non structurées et, dans ce cadre, les technologies du Web sémantique permettent de résoudre de nombreux problèmes de par le cadre d'interopérabilité et l'écosystème de standards et d'outils qu'elles offrent.

Impliqués depuis plusieurs années dans le domaine, nous montrerons comment les technologies du Web sémantique aide les équipes Antidot à mieux gérer, traiter et valoriser les données de leurs clients. Dans cette présentation, nous parcourrons une palette assez large de manipulations des objets sémantiques pratiquées couramment dans nos réalisations et basées sur les technologies du Web sémantique.

Nous illustrerons notre exposé par des réalisations concrètes et nous montrerons en quoi l’utilisation du Web sémantique nous a épargné des heures de développements spécifiques et nous a permis d’adresser des problématiques de plus en plus complexes.

Nous aborderons notamment l’extension sémantique, la navigation par facette, la mise en relation de silos d’informations hétérogènes, l’alignement des données sur des référentiels, l’utilisation du Web des données et d’autres techniques originales que nous avons développées pour la nouvelle version d’AFS.

Published in: Technology, Education
  • DOWNLOAD THIS BOOKS INTO AVAILABLE FORMAT (2019 Update) ......................................................................................................................... ......................................................................................................................... Download Full PDF EBOOK here { https://soo.gd/irt2 } ......................................................................................................................... Download Full EPUB Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download Full doc Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download PDF EBOOK here { https://soo.gd/irt2 } ......................................................................................................................... Download EPUB Ebook here { https://soo.gd/irt2 } ......................................................................................................................... Download doc Ebook here { https://soo.gd/irt2 } ......................................................................................................................... ......................................................................................................................... ................................................................................................................................... eBook is an electronic version of a traditional print book THIS can be read by using a personal computer or by using an eBook reader. (An eBook reader can be a software application for use on a computer such as Microsoft's free Reader application, or a book-sized computer THIS is used solely as a reading device such as Nuvomedia's Rocket eBook.) Users can purchase an eBook on diskette or CD, but the most popular method of getting an eBook is to purchase a downloadable file of the eBook (or other reading material) from a Web site (such as Barnes and Noble) to be read from the user's computer or reading device. Generally, an eBook can be downloaded in five minutes or less ......................................................................................................................... .............. Browse by Genre Available eBooks .............................................................................................................................. Art, Biography, Business, Chick Lit, Children's, Christian, Classics, Comics, Contemporary, Cookbooks, Manga, Memoir, Music, Mystery, Non Fiction, Paranormal, Philosophy, Poetry, Psychology, Religion, Romance, Science, Science Fiction, Self Help, Suspense, Spirituality, Sports, Thriller, Travel, Young Adult, Crime, Ebooks, Fantasy, Fiction, Graphic Novels, Historical Fiction, History, Horror, Humor And Comedy, ......................................................................................................................... ......................................................................................................................... .....BEST SELLER FOR EBOOK RECOMMEND............................................................. ......................................................................................................................... Blowout: Corrupted Democracy, Rogue State Russia, and the Richest, Most Destructive Industry on Earth,-- The Ride of a Lifetime: Lessons Learned from 15 Years as CEO of the Walt Disney Company,-- Call Sign Chaos: Learning to Lead,-- StrengthsFinder 2.0,-- Stillness Is the Key,-- She Said: Breaking the Sexual Harassment Story THIS Helped Ignite a Movement,-- Atomic Habits: An Easy & Proven Way to Build Good Habits & Break Bad Ones,-- Everything Is Figureoutable,-- What It Takes: Lessons in the Pursuit of Excellence,-- Rich Dad Poor Dad: What the Rich Teach Their Kids About Money THIS the Poor and Middle Class Do Not!,-- The Total Money Makeover: Classic Edition: A Proven Plan for Financial Fitness,-- Shut Up and Listen!: Hard Business Truths THIS Will Help You Succeed, ......................................................................................................................... .........................................................................................................................
       Reply 
    Are you sure you want to  Yes  No
    Your message goes here

Moteurs de recherche et web sémantique

  1. 1. Web sémantiqueetmoteurs de recherche<br />http://www.antidot.net<br />Jérôme Mainka<br />SemWeb.pro<br />17 janvier 2011<br />
  2. 2. Antidot<br />Cœur de métier <br /><ul><li>Solution de recherche et d’accès à l’information</li></ul>Compétences<br /><ul><li>Editeur, hébergeur, conseil et intégrateur</li></ul>Fiche d’identité <br /><ul><li> Création en 1999
  3. 3. Implantation : Paris, Lyon, Aix en Provence
  4. 4. Forte croissance 13eme croissance française au classement</li></ul>Solutions<br /><ul><li>AFS : moteur de recherche
  5. 5. CKS : services collaboratifs</li></li></ul><li>Quelques références<br />Média<br />Entreprises<br />eCommerce<br />Institutions<br />Santé<br />
  6. 6. Moteur de recherche<br />Recherche plein-texte vs recherche structurée<br />
  7. 7. Recherche plein texte<br />Plus que faire correspondre des octets<br />
  8. 8. Synonymie<br />car@en<br />Voiture<br />Bagnole<br />char@fr_CA<br />
  9. 9.
  10. 10. Hyponymie / Méronymie<br />
  11. 11.
  12. 12. Méronymie/Holonymie<br />
  13. 13.
  14. 14. Vocabulaire SKOS<br />Des concepts : classe skos:Concept<br />Des relations sémantiques :<br />skos:broader, narrower<br />skos:exactMatch, closeMatch<br />Des libellés<br />skos:prefLabel, altLabel, hiddenLabel<br />
  15. 15. Sémantique<br />Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat. Duis aute irure dolor in reprehenderit in voluptate velit esse cillum dolore eu fugiat nulla pariatur. <br />skos:broaderTransitive<br />skos:narrower<br />skos:narrower<br />skos:broader<br />skos:broader<br />skos:prefLabel<br />skos:altLabel<br />skos:prefLabel<br />skos:altLabel<br />skos:prefLabel<br />skos:altLabel<br />Lorem ipsum <br />
  16. 16. Inférence<br />Il ne s’agit évidemment pas d’apprendre par cœur les propriétés sémantiques du vocabulaire : rdfs, owl est suffisant pour l’essentiel.<br />Exemple :<br />skos:broader rdfs:subPropertyOf skos:broaderTransitive .<br />skos:broaderTransitive a owl:TransitiveProperty .<br />skos:narrower owl:inverseOf skos:broader .<br />
  17. 17. Clés du succès<br />Les libellés peuvent être soumis à des normalisations :<br />"voyages" = "voyage"<br />"Mainka" = "MNK"<br />"Mainka" = "aiinkamank »<br />Indexation / Requête = offline / online<br />Structure de stockage<br />m taille du référentiel<br />n taille du texte à indexer :<br />Indexation en O(n log m)<br />
  18. 18. Recherche structurée<br />
  19. 19. Description des facettes<br /><PériodeHistorique> a skos:OrderedCollection ;<br /> skos:memberList ( <ÉpoqueContemporaine><br /> <ÉpoqueModerne><br /> <MoyenÂge> ) .<br /><Discipline> a skos:Collection ;<br /> skos:member <AnthropologieBiologique> ,<br /> <Démographie> ,<br /> <Droit> .<br /><Facets> a skos:OrderedCollection ;<br /> skos:memberList ( <PériodeHistorique><br /> <Discipline> ) . <br />
  20. 20. Ontologies du domaineOntologies de navigation<br />Ontologies du domaine pas forcément adaptées à une interface de navigation<br />Nécessité de transformer les ontologies du domaine pour les faire correspondre aux besoins de la navigation.<br />Prise en compte de besoins utilisateurs / besoins métiers.<br />2 approches :<br />Formules N3 : <br />{ ?doc <published> 2001 . } => { ?doc afs:subject <p2001> . } .<br />SPARQL :<br />CONSTRUCT { ?doc afs:subject <p2001> . } WHERE { ?doc <published> 2001 . }<br />
  21. 21. Annotations<br />À partir de règles<br />À partir du contenu plein texte (extraction d’entités, classification automatique)<br />Inférence <br />{ ?doc afs:subject [ skos:broaderTransitive ?c2 . ] . }=> { ?doc afs:subject ?c2 . } . <br />Une facette est une annotation particulière<br />
  22. 22. Affichage<br />Tri<br />OrderedCollection<br />Tri alphabétique<br />Tri par comptage<br />Gestion des données de grandes tailles<br />Paging des valeurs de facettes<br />Support des opérateurs AND, OR, NOT.<br />
  23. 23. Un modèle de document unifié ?<br />Pour mettre en place un service de recherche :<br />Structures molles<br />Concepts simples: Annotations, Facettes, Titre, URL, Plein texte, etc.<br />Format pivot RDF<br />Mapping des documents via une chaîne de traitements élémentaires : AFS-PaF (Pipes & Filters)<br />
  24. 24. <ul><li> Créer des chaînes de traitement par assemblage de modules</li></ul>Sources de données<br />Module connecteur<br />Modules de transformation et enrichissement<br />
  25. 25. <ul><li>Les données et enrichissements sont exportés en RDF en bout de chaine
  26. 26. Les triplets générés sont exploités</li></ul>pour retour vers les sources sous forme normalisée<br />pour traiter des requêtes complexes<br />pour une exposition dans le Web de données<br />Génération<br />Chargement de l’entrepôt<br />Entrepôt RDF<br />Fichiers de triplets<br />Corpus<br />
  27. 27. <ul><li>AFS et SPARQL sont des Web Service techniques
  28. 28. Ils sont enrobés dans une couche métier</li></ul>un Web Service applicatif qui permet la négociation de contenu<br />Description<br /> XML<br />Description<br /> RDF<br />Document<br />
  29. 29. <ul><li>Le document</li></ul>est composite<br />est dynamique<br />évolue dans le temps<br />est un objet à gérer<br />à accéder de façonunifiée <br />
  30. 30. Des données partout<br />RéférentielDisciplinesHAL-SHS<br />RéférentielAuteursHAL-SHS<br />RéférentielOrganisationHAL-SHS<br />RéférentielCatégoriesCalenda<br />RéférentielThésaurus WSIAF<br />RéférentielPactols<br />RéférentielGeonames<br />RéférentielRameau<br />RéférentielLexvo<br />ISIDORE<br />
  31. 31. Conclusion<br />Le Web sémantique : ça sert (ça marche, c’est « simple »)<br />Rester modeste :<br />Objectifs<br />Stratégie<br />Mise en œuvre<br />Plein de sujets d’évolution<br />Extraction de concepts<br />Alignement automatique d’ontologies<br />

×