Successfully reported this slideshow.
Your SlideShare is downloading. ×

Adbs 5 à 7 : une nouvelle norme pour le thesaurus

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad

Check these out next

1 of 52 Ad

More Related Content

Similar to Adbs 5 à 7 : une nouvelle norme pour le thesaurus (20)

Advertisement

Recently uploaded (20)

Adbs 5 à 7 : une nouvelle norme pour le thesaurus

  1. 1. test 03/03/11 Une nouvelle norme pour le thésaurus : modèles et perspectives à l’ère du web sémantique 5 à 7 du 15 février 2011 Hélène Rabault - chef de projet chez Lexis-Nexis – [email_address] Hélène Zysman – consultante ECM chez Smile – [email_address]
  2. 2. Sommaire <ul><li>1- Le contexte </li></ul><ul><li>2 - Eléments constitutifs </li></ul><ul><li>3 - Principes d’interopérabilité </li></ul><ul><li>4 - Mise en œuvre de la norme </li></ul><ul><li>5 - Conclusion </li></ul><ul><li>6- Questions / réponses </li></ul>03/03/11
  3. 3. <ul><li>Le Contexte : normes en vigueur </li></ul><ul><li>Des normes anciennes </li></ul><ul><ul><li>NF Z47-100:1981 (monolingue) ; NF Z47-101:1990 (multilingue) </li></ul></ul><ul><ul><li>ISO 2788:1986 (monolingue) ; ISO 5964:1985 (multilingue) </li></ul></ul><ul><li>Réactualisées par les anglo-saxons </li></ul><ul><ul><li>ANSI/NISO Z39.19:2005 : “ Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies ” </li></ul></ul><ul><ul><li>BS 8723 2004/2008 : “Structured vocabularies for information retrieval”. </li></ul></ul><ul><li>IFLA </li></ul><ul><ul><li>Guidelines for multilingual thesauri, 2005 et 2008 </li></ul></ul><ul><li>SKOS (W3C) </li></ul><ul><ul><li>1ere version en 2003 </li></ul></ul><ul><ul><li>Langage modulaire et extensible permettant l’exploitation sur le Web de schémas de concepts comme les thesaurus </li></ul></ul><ul><ul><ul><ul><ul><li> Proposition en 2006 par la Grande-Bretagne d’élaborer </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>une nouvelle norme internationale </li></ul></ul></ul></ul></ul>03/03/11
  4. 4. <ul><li>Le Contexte : Processus de normalisation </li></ul>http://www.iso.org/iso/fr/standards_development/processes_and_procedures/stages_description/stages_table.htm 03/03/11 Stade préliminaire Proposition de projet Proposition de norme Approbation de la mise au vote Stade proposition nouvelle question (NP) <ul><li>Approbation du projet de norme </li></ul><ul><li>5 membres minimum s’engagent à travailler sur la norme </li></ul><ul><li>Désignation du chef de projet </li></ul>Stade préparation WD = Working Draft Mise à l'étude du projet de travail et Observations Stade comité CD = Committee Draft Observations et vote CD renvoyé au Groupe de travail Stade enquête DIS = Draft international Standard = projet de norme 5 mois pour voter le DIS Observations publiques Stade approbation FDIS = Projet final de norme 2 mois pour voter le FDIS Stade de publication Norme ISO
  5. 5. <ul><li>Le Contexte : Processus pour l’ISO 25964 </li></ul><ul><li>Vote de 5 pays en 2007 (USA, DE, ES, FR et UK) </li></ul><ul><li>WD basé sur la norme anglaise </li></ul><ul><li>Décision de faire la norme en 2 parties </li></ul>03/03/11 Partie 1 Partie 2 WD Juillet 2008 Juillet 2009 CD Décembre 2008 Avril 2011 DIS Octobre 2009 Appel à commentaire jusqu’à Mars 2010 FDIS Novembre 2010 Approuvé le 23 décembre 2010 Norme ISO Au plus tard mai 2011 2012
  6. 6. <ul><li>Le Contexte : Processus pour l’ISO 25964 </li></ul><ul><li>Instances normatives </li></ul><ul><ul><li>l’ISO TC46/SC9/WG8 : Information et documentation / &quot;Identification and description&quot;  / &quot;Structured vocabularies&quot;  </li></ul></ul><ul><ul><li>Equivalent Afnor : CG46/CN357/GE10 : INFORMATION ET COMMUNICATION / Modélisation, production et accès aux document / Vocabulaires contrôlés </li></ul></ul><ul><li>Composition du groupe international </li></ul><ul><ul><li>Canada (2 personnes), Australie (1), France (2), Allemagne (3), Danemark (2), Royaume Uni (4), Etats-Unis (1), Espagne (1) - Auditeur hors WG : Chine (1) </li></ul></ul><ul><ul><li>Chef de projet : Stella Dextre Clarke (UK) </li></ul></ul><ul><li>Composition du groupe France </li></ul><ul><ul><li>Représentant France : Sylvie Dalbin </li></ul></ul><ul><ul><li>Dominique Chichereau ; Odile Contat ; Sylvie Dalbin ; Danièle Dégez ; Alina Deniau ; Francois Feyler ; Thierry Guillotin; Dominique Ménillet ; Michel Mingam ; Hélène Rabault; Bernard Vatant ; Virginie Triboulin ; Nathalie Yakovleff, Hélène Zysman </li></ul></ul>03/03/11
  7. 7. <ul><li>Le Contexte : Couverture de la norme ISO 25964 </li></ul><ul><li>Centrée sur le thesaurus </li></ul><ul><ul><li>Inclut les problématiques d’interopérabilité avec d’autres vocabulaires contrôlés </li></ul></ul><ul><li>Gestion électronique de thesaurus pour retrouver tout type de ressource </li></ul><ul><li>Modèle conceptuel (métier) et non technique </li></ul><ul><ul><li>Ne dit pas comment l’implémenter </li></ul></ul><ul><li>La norme n’est pas </li></ul><ul><ul><li>Un manuel pédagogique </li></ul></ul><ul><ul><li>Un guide d’indexation </li></ul></ul><ul><ul><li>Un cadre rigide </li></ul></ul>03/03/11
  8. 8. <ul><li>Le Contexte : La Norme ISO 25964 </li></ul><ul><li>Titre </li></ul><ul><ul><li>Thesauri and interoperability with other vocabularies = Thésaurus et interopérabilité avec d’autres vocabulaires </li></ul></ul><ul><li>Partie 1 </li></ul><ul><ul><li>Thesauri for information retrieval </li></ul></ul><ul><ul><li>= Thésaurus pour la recherche d’information </li></ul></ul><ul><ul><li>Traite de la création et la maintenance des thesaurus monolingues et multilingues, en incluant les formats et protocoles pour l’échange de données </li></ul></ul><ul><li>Partie 2 </li></ul><ul><ul><li>Interoperability with other vocabularies </li></ul></ul><ul><ul><li>= Interopérabilité avec d’autres vocabulaires </li></ul></ul><ul><ul><li>Traite de l’interopérabilité avec des thesaurus ou d’autres vocabulaires contrôlés </li></ul></ul>03/03/11
  9. 9. <ul><li>Le Contexte : La Norme ISO 25964-1 </li></ul><ul><li>Un ensemble de définitions </li></ul><ul><li>Principes généraux </li></ul><ul><ul><li>Concept / termes </li></ul></ul><ul><ul><li>Equivalence entre termes </li></ul></ul><ul><ul><li>Relations entre concepts </li></ul></ul><ul><ul><li>Regroupements de concepts </li></ul></ul><ul><li>Recommandations de construction et mise à jour </li></ul><ul><li>Recommandations pour l’implémentation d’un thesaurus </li></ul><ul><ul><li>Recommandations pour l’outil de gestion </li></ul></ul><ul><ul><li>Modélisation UML </li></ul></ul><ul><ul><li>Formats d'échange / protocoles de communication </li></ul></ul><ul><ul><li>Exemples de modèles de présentation </li></ul></ul>03/03/11
  10. 10. <ul><li>Le Contexte : La Norme IS025964-2 </li></ul><ul><li>Un ensemble de définitions, y compris celles de la partie 1 </li></ul><ul><li>Les modèles de mapping </li></ul><ul><li>Spécificités d’interopérabilité avec chacun des vocabulaires </li></ul><ul><li>Modes de présentation </li></ul>03/03/11
  11. 11. 2. Le modèle de données <ul><li>Le modèle de données = support pour définir un modèle de base de données ou un format d’échange </li></ul><ul><li>Fonction générique de définition de la structure et de la sémantique du thesaurus </li></ul><ul><ul><li>UML : Unified Modeling language : langage graphique de modélisation des données </li></ul></ul><ul><ul><li>pour proposer une représentation graphique appréhendable rapidement du modèle métier </li></ul></ul><ul><li>Les possibilités offertes par la norme ne sont pas toutes visibles sur le diagramme UML </li></ul><ul><li>Les implémentations techniques sont laissées libres </li></ul><ul><li>Diagramme UML : de classes uniquement, et non de traitements </li></ul>03/03/11
  12. 12. 2. Comment lire le diagramme <ul><li>Vocabulaire utilisé pour le diagramme UML : </li></ul><ul><li>0..1 optionnel et non répétable (zéro ou un) </li></ul><ul><li>0..* optionnel et répétable (zéro ou plus) </li></ul><ul><li>1 obligatoire, non répétable (un seulement) </li></ul><ul><li>1..* obligatoire et répétable (un et plus) </li></ul><ul><li>est un (is-a ; « généralisation »- « type de » entre deux classes) </li></ul><ul><li>a un (has-a ; « agrégation » - relation partie/tout entre instances) </li></ul>03/03/11
  13. 13. 2. Le modèle métier 03/03/11
  14. 14. 2. Le thesaurus : définition générale <ul><li>Définition 2.62 : Thesaurus </li></ul><ul><li>controlled and structured vocabulary in which concepts are represented by terms, organized so that relationships between concepts are made explicit, and preferred terms are accompanied by lead-in entries for synonyms or quasi-synonyms </li></ul>03/03/11
  15. 15. 2. Le thesaurus : propriétés <ul><li>Possède ses propriétés propres </li></ul><ul><li>Ces propriétés sont exprimées sous forme d’attributs DublinCore </li></ul><ul><li>Seuls l’identifiant et la langue sont des propriétés obligatoires </li></ul><ul><li>Le thesaurus est constitué d’un ensemble de concepts. Un concept est obligatoirement attaché à un thesaurus. </li></ul>03/03/11
  16. 16. 2. Les concepts <ul><li>Propriétés </li></ul><ul><li>Identifiant </li></ul><ul><li>CustomConceptAttribute </li></ul><ul><li>Classes associées à Concept </li></ul><ul><li>Regroupement de concepts </li></ul><ul><li>Relations entre concepts </li></ul><ul><li>Notes </li></ul><ul><li>Représentation (termes) </li></ul>03/03/11
  17. 17. 2. Les relations sémantiques entre concepts <ul><li>Hierarchical relationship </li></ul><ul><li> Genre/Espèce, Tout/Partie, Instance </li></ul><ul><li>Associative relationship </li></ul><ul><li>Top Level Relationship </li></ul><ul><li>Relation établie entre un concept et le concept situé en haut de la hiérarchie dans laquelle il se trouve </li></ul><ul><li>Relations personnalisées </li></ul><ul><li>Role : rôle de chaque composant de la relation (générique vs spécifique…) </li></ul>CG : Anatomie du corps hurmain . Squelette . . Os . . . Fémur 03/03/11
  18. 18. 2. Les regroupements de concepts <ul><li>Concepts groups (optionnel) : Regroupement de concepts par champ sémantique (thématique, par facette…) </li></ul><ul><li>constitue une liste de thèmes, </li></ul><ul><li>domaines, micro-thesaurus, ... </li></ul><ul><li>Pas de relation TG/TS entre </li></ul><ul><ul><li>un Concept et son ConceptGroup </li></ul></ul><ul><li>Groupe / Sous-groupe </li></ul><ul><li>A un libellé, </li></ul><ul><li>(ConceptGroupLabel) </li></ul><ul><li>Ne pas confondre avec le Top Level Relationship </li></ul>03/03/11
  19. 19. 2. L’exemple du thesaurus GEMET http://www.eionet.europa.eu/gemet/index_html?langcode=fr Regroupements par thèmes 03/03/11
  20. 20. 2. L’exemple du thesaurus GEMET http://www.eionet.europa.eu/gemet/groups?langcode=fr Regroupements hiérarchiques 03/03/11
  21. 21. 2. Le ThesaurusArray <ul><li>ThesaurusArray </li></ul><ul><li> Série de concepts de même niveau (« siblings ») </li></ul><ul><li> Organisation des concepts indépendante de leur organisation hiérarchique. </li></ul><ul><li>Permet de regrouper ensemble des concepts sous l’angle d’une même facette </li></ul><ul><li>NodeLabel (étiquette de noeud) </li></ul><ul><li>Explicite le principe de </li></ul><ul><li>regroupement dans la série </li></ul>03/03/11
  22. 22. 2. Exemple deThesaurusArrays <ul><li>(Figure 4 page 72 </li></ul>ISO 25964- part 1 : Figure 4, page 72 03/03/11
  23. 23. 2. Concept complexe et concept simple <ul><li>Concept complexe : management des ressources humaines </li></ul><ul><li>Un concept complexe est souvent exprimé par un terme composé </li></ul><ul><li>Un terme composé ( compound term ) n’est pas toujours le signifiant d’un concept complexe </li></ul><ul><li>Un terme composé (compound term) peut être </li></ul><ul><li>- un mot composé ( compound word : biodégradabilité, agroindustrie) </li></ul><ul><li>-un syntagme ( sécurité routière ) </li></ul><ul><li>Eléments constitutifs du concept complexe </li></ul><ul><li>voiture de sport </li></ul><ul><ul><li>Le coeur </li></ul></ul><ul><ul><li>( focus , head) </li></ul></ul><ul><ul><li>Le distinctif </li></ul></ul><ul><ul><li>(modifier, difference) </li></ul></ul>03/03/11
  24. 24. 2. Les termes <ul><li>Pour chaque concept : Un terme préférentiel par langue (au max.) </li></ul><ul><li>Syntagmes nominaux pouvant inclure des adjectifs </li></ul><ul><li>Flexibilité de la norme par rapport aux particularités de chaque langue </li></ul><ul><li>Termes d’emprunt (loan term) , et termes forgés (coined term) : autorisés </li></ul>03/03/11
  25. 25. 2. Les relations entre termes <ul><li>Relations d’équivalence entre termes </li></ul><ul><ul><li>entre « terme non préférentiel simple » ( SimpleNonPreferredTerm) et « terme préférentiel » ( PreferredTerm) </li></ul></ul><ul><ul><li>Exemple : café soluble EM café instantané </li></ul></ul><ul><li>Relation d’équivalence composée ( CompoundEquivalence ) entre termes </li></ul><ul><ul><li>un « terme non préférentiel à décomposer » ( SplitNonPreferredTerm) est décomposé ou scindé en au moins deux « termes préférentiels « ( PreferredTerm) </li></ul></ul><ul><ul><li>Exemple : transplantation de rein USE transplantation d'organe + rein </li></ul></ul><ul><li>CustomTermAttribute </li></ul><ul><ul><li>Exemple : abréviation de, formule chimique de…. </li></ul></ul>03/03/11
  26. 26. 2. Le multilinguisme <ul><li>Chaque terme est associé à une langue </li></ul><ul><li>Les termes exprimant un même concept sont en relation d’équivalence cross-lingue, pouvant être explicite </li></ul><ul><ul><ul><ul><li>aide économique </li></ul></ul></ul></ul><ul><ul><ul><ul><li>en economic aid </li></ul></ul></ul></ul><ul><ul><ul><ul><li>es ayuda económica </li></ul></ul></ul></ul><ul><li>Il n’existe pas de relation d’équivalence explicite entre les non-descripteurs pris dans différentes langues, mais il existe des relations de mapping </li></ul><ul><li>On peut envisager des niveaux de langues par ex. comme autant de langues différentes </li></ul>03/03/11
  27. 27. 2. Les degrés d’équivalence crosslingue <ul><li>(voir aussi partie 2 de la norme) </li></ul><ul><ul><li>Equivalence exacte </li></ul></ul><ul><ul><ul><ul><li>en: sun / es: sol / fr: soleil / de: Sonne </li></ul></ul></ul></ul><ul><ul><ul><ul><li>en: rail network / fr: réseau ferroviaire / de: Schienennetz / nl: spoorwegnet </li></ul></ul></ul></ul><ul><ul><li>Equivalence inexacte ou proche </li></ul></ul><ul><ul><ul><ul><li>en: information retrieval / fr: recherche d’information </li></ul></ul></ul></ul><ul><ul><ul><ul><li>fr: jeu didactique / en: learning games </li></ul></ul></ul></ul><ul><ul><li>Equivalence partielle </li></ul></ul><ul><ul><ul><ul><li>équivalence générique/spécifique </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>de: Wissenschaft / en: science </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>SN: Comprend les sciences naturelles et sociales, et la connaissance (les savoirs ?) en général. </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><li>équivalence &quot;1-à-n”, “une-à-plusieurs” </li></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>fr: sécurité / de: Sicherheit / en: safety, security </li></ul></ul></ul></ul></ul><ul><ul><li>Non-équivalence </li></ul></ul>03/03/11
  28. 28. 2. Les notes <ul><li>Note </li></ul><ul><li>Attributs : nom de la note, date de création/modification, langue </li></ul><ul><li>+ Réciprocité </li></ul><ul><li>Note personnalisable </li></ul><ul><li> CustomNote (concept +terme) </li></ul><ul><li>Note explicative : </li></ul><ul><li>ScopeNote (concept) </li></ul><ul><li>Note historique </li></ul><ul><li>HistoryNote (concept + terme) </li></ul><ul><li>Définition </li></ul><ul><li>Definition (terme) </li></ul><ul><li>Note éditoriale </li></ul><ul><li>EditorialNote (terme) </li></ul>03/03/11
  29. 29. 2. L’exemple du thesaurus Art & Architecture 03/03/11 <ul><li>Le Getty: un ensemble de 4 vocabulaires </li></ul><ul><ul><li>Thématique, géographique, objets culturels et entités nommées (artistes, musées, ressources) </li></ul></ul><ul><ul><li>Un ensemble de propriétés pour chaque concept </li></ul></ul><ul><ul><ul><li>Une information riche </li></ul></ul></ul><ul><ul><ul><li>Lien avec d’autres vocabulaires </li></ul></ul></ul><ul><ul><ul><li>Critères de recherche </li></ul></ul></ul><ul><li>Exemple des Artistes </li></ul><ul><ul><li>rôles : il est possible de rechercher par rôle </li></ul></ul><ul><ul><li>nationalité : il est possible de rechercher par nationalité </li></ul></ul><ul><ul><li>lieu de naissance et de décès : villes appartenant au thesaurus géographique </li></ul></ul><ul><ul><li>personnes ou entités en relation : liens vers d'autres personnes (assisté par / assistant, associé, père / fils, ...), sources et contributeurs </li></ul></ul><ul><ul><li>Ex Masque de recherche : h ttp://www.getty.edu/research/tools/vocabularies/ulan/index.html </li></ul></ul><ul><ul><li>Ex Picasso </li></ul></ul>
  30. 30. 2. L’exemple du thesaurus Art & Architecture 03/03/11 <ul><li>Exemple des lieux géographiques </li></ul><ul><ul><li>type de lieu : il est possible de rechercher par type de lieu </li></ul></ul><ul><ul><li>pays : il est possible de rechercher par pays </li></ul></ul><ul><ul><li>lieu associé : lien vers un autre lieu </li></ul></ul><ul><ul><li>sources et contributeurs : lien vers les entités nommées </li></ul></ul><ul><ul><li>un nom anglais et un nom en langue vernaculaire : choix de la langue d'affichage de la hiérarchie </li></ul></ul><ul><ul><li>Ex Empire byzantin : http://www.getty.edu/vow/TGNFullDisplay?find=&place=&nation=&english=Y&subjectid=7024407 </li></ul></ul><ul><ul><li>Ex Liste hiérarchique avec choix de la langue </li></ul></ul><ul><ul><li>http://www.getty.edu/vow/TGNHierarchy?find=&place=&nation=&english=Y&subjectid=7029392 </li></ul></ul>
  31. 31. <ul><li>L’exemple du thesaurus Art & Architecture </li></ul>http://www.getty.edu/research/tools/vocabularies/aat/ 03/03/11
  32. 32. 2. L’exemple du thesaurus Art & Architecture http://www.getty.edu/research/tools/vocabularies/aat/ 03/03/11
  33. 33. 2. Exemples de relations ontologiques : Agrovoc 03/03/11 http://aims.fao.org/website/Ontology-relationships/sub hasSubclass subclassOf actsUpon affects afflicts benefitsFrom causativeRelationship causes compose controls developsFrom developsInto essiveRelationship follows growsln hasComponent hasGoalOrProcess hasMember hasObjectOfActivity hasPart hasPest hasPortion hasProperty hasRelatedType hasSymptom hasTheme includesSubprocess indicates instrumentalRelationship isAchievedByMeansOf isActedUponBy isAffectedBy isAfflictedBy isAGrowthEnvironmentFor isBeneficialFor isCausedBy isComponentOf isComposedOf isControlledBy isDerivedFrom isInputFor isMadeFrom isMeansFor isMemberOf isObjectOfActivity isOutputFrom isPartOf isPerformedBy isPerformedByMeansOf isPortionOf isPreventedBy isProcessFor isProducedBy isPropertyOf isRelatedTypeOf isSourceOf isSpatiallyIncludedIn isSubprocessOf isThemeOf isUsedAs isUsedToMake isUseOf performs pestOf precedes prevents produces relatedConcept spatiallyIncludes termporalRelation usesProcess
  34. 34. 2. Un exemple d’extension des types de relations entre termes : Agrovoc <ul><li>http://aims.fao.org/website/Ontology-relationships/sub </li></ul><ul><li>http://aims.fao.org/website/Ontology-relationships/sub </li></ul>03/03/11 http://aims.fao.org/website/Ontology-relationships/sub
  35. 35. <ul><li>Interopérabilité </li></ul><ul><li>Interopérabilité entre 2 ou plusieurs thesaurus </li></ul><ul><ul><li>En général, ne partagent pas la même structure </li></ul></ul><ul><ul><li>Dans la même langue </li></ul></ul><ul><ul><li>Dans des langues différentes </li></ul></ul><ul><li>Interopérabilité entre un thesaurus et d’autres vocabulaires </li></ul><ul><ul><li>Liste non arrêtée </li></ul></ul><ul><ul><li>Classification, référentiel de classements (Records management), taxonomie, vedettes matières, ontologie, terminologie, liste de noms, anneau de synonymes </li></ul></ul><ul><ul><li>Centrée sur les spécificités du vocabulaire </li></ul></ul>03/03/11
  36. 36. <ul><li>Interopérabilité </li></ul><ul><li>Sens du mapping </li></ul><ul><ul><li>Mono-directionnel </li></ul></ul><ul><ul><ul><li>Thesaurus = vocabulaire source ou cible </li></ul></ul></ul><ul><ul><li>Bi-directionnel </li></ul></ul><ul><li>Couverture </li></ul><ul><ul><li>Tout le vocabulaire </li></ul></ul><ul><ul><li>Une partie </li></ul></ul><ul><ul><ul><li>En fonction du recouvrement sémantique </li></ul></ul></ul><ul><ul><ul><li>En fonction des concepts utilisés </li></ul></ul></ul>03/03/11
  37. 37. <ul><li>Interopérabilité </li></ul><ul><li>Implémentation principalement lors du process </li></ul><ul><ul><li>D’indexation </li></ul></ul><ul><ul><li>De recherche </li></ul></ul><ul><li>Stockage des règles d’interopérabilité </li></ul><ul><ul><li>Dans un système externe à chacun des vocabulaires </li></ul></ul><ul><ul><li>Dans la base de chaque vocabulaire </li></ul></ul><ul><ul><li>Dans la base de l’un des vocabulaires </li></ul></ul>03/03/11
  38. 38. <ul><li>Interopérabilité </li></ul><ul><li>Eléments à mapper </li></ul><ul><ul><li>Concepts </li></ul></ul><ul><ul><ul><li>De préférence à partir d’un Identifiant stable </li></ul></ul></ul><ul><ul><li>Informations environnantes minimales </li></ul></ul><ul><ul><ul><li>Vocabulaire d’appartenance </li></ul></ul></ul><ul><ul><ul><li>Type de mapping </li></ul></ul></ul>03/03/11
  39. 39. <ul><li>Interopérabilité : mapping des concepts </li></ul>03/03/11 EQ Equivalence (sans préciser la nature) Eau EQ Water Commande EQ Control = Equivalence exacte Eau =EQ Water Téléphone mobile =EQ téléphone cellulaire Eau =EQ Eau ~ Equivalence inexacte (sans préciser la nature) Commande ~ EQ Control Horticulture ~ EQ Jardinage Education secondaire ~EQ Education + Ecoles secondaires   BM Equivalence vers un concept plus vaste Roi BM monarque NM Equivalence vers un concept moins vaste monarque NM rois   RM Autre équivalence Education RM Punition  
  40. 40. <ul><li>Interopérabilité : mapping des vocabulaires </li></ul><ul><li>Mapping direct </li></ul>03/03/11
  41. 41. <ul><li>Interopérabilité : mapping des vocabulaires </li></ul><ul><li>Mapping en hub </li></ul>03/03/11
  42. 42. <ul><li>Implémentation de la norme </li></ul><ul><li>Intégration d’un thesaurus dans une application </li></ul><ul><ul><li>Contexte actuel </li></ul></ul><ul><ul><ul><li>Logiciel intégré (gestion du thesaurus, indexation et recherche) / Logiciels autonomes </li></ul></ul></ul><ul><ul><ul><li>Recherche sur une collection / recherche sur plusieurs collections simultanément </li></ul></ul></ul><ul><ul><li>Fonctions d’interopérabilité </li></ul></ul><ul><ul><ul><li>Import/export des données </li></ul></ul></ul><ul><ul><ul><li>Identification et report des modifications </li></ul></ul></ul><ul><ul><li>Gestion de tous types de caractères </li></ul></ul><ul><ul><li>Trouver facilement un concept </li></ul></ul><ul><ul><ul><li>Impression du thesaurus </li></ul></ul></ul><ul><ul><ul><li>Interface logicielle/web intuitive </li></ul></ul></ul>03/03/11
  43. 43. <ul><li>Implémentation de la norme </li></ul><ul><li>Intégration dans des applications d’indexation et de recherche </li></ul><ul><ul><li>Navigation aisée (sauf dans les systèmes complètement automatisés) </li></ul></ul><ul><ul><ul><li>Rechercher par chaine de caractères </li></ul></ul></ul><ul><ul><ul><li>Remplacer un terme non préférentiel par le terme préférentiel </li></ul></ul></ul><ul><ul><ul><li>Auto-complétion ou choix des concepts correspondant aux caractères saisis </li></ul></ul></ul><ul><ul><ul><li>Choisir ou forcer la langue d’affichage </li></ul></ul></ul><ul><ul><ul><li>Afficher les équivalents, y compris multilingue </li></ul></ul></ul><ul><ul><ul><li>Naviguer par les relations hiérarchiques et associatives </li></ul></ul></ul><ul><ul><ul><li>Déployer ou fermer une arborescence </li></ul></ul></ul><ul><ul><ul><li>Passer d’une présentation à une autre (alphabétique, hiérarchique) ou avoir les 2 en parallèle </li></ul></ul></ul><ul><ul><li>Affichage des occurrences (si présence de la collection) </li></ul></ul><ul><ul><li>Gestion des candidats </li></ul></ul>03/03/11
  44. 44. <ul><li>Implémentation de la norme </li></ul><ul><li>Plus précisément pour la recherche </li></ul><ul><ul><li>Sélectionner un ou plusieurs concepts </li></ul></ul><ul><ul><li>Aider à la construction de la requête </li></ul></ul><ul><ul><li>Expansion de recherche </li></ul></ul><ul><ul><li>Remplacement d’un terme non préférentiel par le terme préférentiel </li></ul></ul><ul><ul><li>Catégorisation pour affiner la recherche </li></ul></ul><ul><ul><li>Utilisation dans un moteur de recherche, sans exposer le thesaurus </li></ul></ul><ul><ul><ul><li>Choix parmi les concepts existants et proches de ce qui a été tapé par l’utilisateur </li></ul></ul></ul><ul><ul><ul><li>Séparation des résultats en fonctions des concepts utilisés par le moteur </li></ul></ul></ul><ul><ul><ul><li>Proposition d’expansion pour affiner ou élargir la recherche </li></ul></ul></ul><ul><ul><ul><li>Expansion automatique en cas de peu ou pas de résultat </li></ul></ul></ul><ul><ul><ul><li>… </li></ul></ul></ul><ul><ul><li>Utiliser les équivalents pour rechercher dans une collection non indexée par le thesaurus </li></ul></ul><ul><li>Plus précisément pour l’indexation automatique </li></ul><ul><ul><li>Lier à chaque concept ses règles de sélection </li></ul></ul>03/03/11
  45. 45. <ul><li>Implémentation de la norme </li></ul><ul><li>Eléments fournis </li></ul><ul><ul><li>Schéma UML </li></ul></ul><ul><ul><li>Schéma XML simple, sans personnalisation, pour l’échange de thesaurus fourni à titre indicatif http://www.niso.org/schemas/iso25964/ </li></ul></ul><ul><li>Formats d’échange évoqués </li></ul><ul><ul><li>Sont brièvement cités quelques formats (MARC, SKOS, Zthes,…) </li></ul></ul><ul><li>Protocoles de recherche </li></ul><ul><ul><li>Objectif : présenter et utiliser le thesaurus </li></ul></ul><ul><ul><li>Utilisation de protocoles existants ou développement spécifique </li></ul></ul><ul><ul><li>Citation de protocoles spécifiques aux thésaurus (SKOS API, ADL) ou orientés Web (Search Web Services, SPARQL, Z3950) </li></ul></ul>03/03/11
  46. 46. <ul><li>Implémentation de la norme </li></ul><ul><li>SKOS et la norme ISO 25964 </li></ul><ul><ul><li>Format et spécifications fonctionnelles permettant l’exploitation, sur le Web, de systèmes d’organisation de concepts (thésaurus, classification,…) </li></ul></ul><ul><ul><li>S’appuie sur la norme BSI 8723, qui est également le point de départ de la norme ISO 25964 </li></ul></ul><ul><ul><li>Publié le 18 aout 2009, fera officiellement référence à la norme ISO 25964 dans une prochaine version Va encore évoluer pour une meilleure compatibilité </li></ul></ul><ul><ul><li>Implémentation de la norme ISO 25964, sur un modèle de thésaurus simplifié pour répondre aux besoins d’exploitation du thesaurus sur le web. N’intègre pas les éléments de gestion du thesaurus, ni la classe Thesaurus, utiles pour l’administration du thesaurus </li></ul></ul>http://www.w3.org/TR/2009/REC-skos-reference-20090818/ 03/03/11
  47. 47. <ul><li>Comment se préparer </li></ul><ul><li>Occasion de vérifier et toiletter son thesaurus </li></ul><ul><ul><li>Concepts manquants / Concepts inutiles </li></ul></ul><ul><ul><li>Concepts redondants </li></ul></ul><ul><ul><li>Valider les relations hiérarchiques et associatives </li></ul></ul><ul><li>Introduire plus de sémantique </li></ul><ul><ul><li>Qualifier les relations </li></ul></ul><ul><ul><ul><li>Identifier les relations d’instances (TGI/TSI) </li></ul></ul></ul><ul><ul><ul><li>Identifier les relations partitives (TGP / TSP) </li></ul></ul></ul><ul><ul><ul><li>Définir les relations associatives qui vous semblent utiles </li></ul></ul></ul><ul><ul><ul><li>Qualifier les relations associatives </li></ul></ul></ul><ul><ul><li>Segmenter les notes </li></ul></ul><ul><ul><ul><li>Au moins notes pour les indexeurs / pour les utilisateurs </li></ul></ul></ul>03/03/11
  48. 48. <ul><li>Conclusion </li></ul><ul><li>Du travail en perspective pour les éditeurs de logiciels , mais avec la perspective d’une plus grande cohésion et homogénéité </li></ul><ul><li>L’approche du thesaurus pas modifiée, les bases restent identiques </li></ul><ul><li>La norme positionne clairement le thesaurus. Il n’a pas vocation à se transformer en un autre type de vocabulaire ou en un modèle terminologique. Par contre, il peut s’interopérer avec eux </li></ul><ul><li>(ex : interopérabilité avec les modèles TMF –terminological markup framework / ISO 12642) </li></ul>03/03/11
  49. 49. <ul><li>Conclusion </li></ul><ul><li>Une norme en phase avec le web sémantique et ses standards </li></ul><ul><ul><li>Typologie plus fine des relations </li></ul></ul><ul><ul><li>Gestion d’attributs, qui peuvent être personnalisés </li></ul></ul><ul><ul><li>Plus grand formalisme dans la description des objets métiers </li></ul></ul><ul><ul><li>Les concepts deviennent des ressources utilisables dans une optique de base de connaissance et de web sémantique </li></ul></ul><ul><ul><li>… . Un renouveau du thesaurus ? </li></ul></ul>03/03/11
  50. 50. <ul><li>Conclusion </li></ul><ul><li>Exemple du projet néerlandais </li></ul><ul><li>Mapping multilingue : </li></ul><ul><li>Thesaurus GTAA (Netherlands Institute for Sound and Vision ) </li></ul><ul><li>New York Times subject headings </li></ul><ul><li>DBpedia (base de connaissance composée d’informations structurées issues de Wikipedia) </li></ul>03/03/11
  51. 51. <ul><li>Conclusion </li></ul><ul><li>Exemple du projet néerlandais </li></ul><ul><li>Mapping multilingue : </li></ul><ul><li>Thesaurus GTAA (Netherlands Institute for Sound and Vision ) </li></ul><ul><li>New York Times subject headings </li></ul><ul><li>DBpedia (base de connaissance composée d’informations structurées issues de Wikipedia) </li></ul>03/03/11
  52. 52. <ul><li>Questions / Réponses </li></ul>Merci pour votre attention Des questions ? 03/03/11

×