NP 25964, Future norme sur les thésaurus

2,362 views

Published on

Point d'avancement au 7 novembre 2008 des travaux portant sur la future norme Thésaurus NP 2595, remplaçant les normes ISO 2788:1986 (monolingue) et 5964:1985 (multilingue).
Projet de norme paru en novembre 2009 - http://www.slideshare.net/Dalb/presentation-du-projet-de-norme-iso-dis-259641-sur-les-thsaurus

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,362
On SlideShare
0
From Embeds
0
Number of Embeds
26
Actions
Shares
0
Downloads
27
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
  • NP 25964, Future norme sur les thésaurus

    1. 1. TC46/CN 357 - GE10 NP25964 - Thésaurus Point d’avancement des travaux portant sur le projet de norme NP 25964 Présenté par Sylvie Dalbin - sylvieatd@aol.com Document validé par le GE10 Support présenté à la réunion Afnor du TC46/CN357 du 07 Novembre 2008
    2. 2. CONTEXTE
    3. 3. Documents normatifs actuels sur les thésaurus <ul><li>ISO 2788:1986 (monolingue) ; ISO 5964:1985 (multilingue) </li></ul><ul><ul><ul><ul><li>Principes directeurs pour l’établissement et du développement de thésaurus monolingues (2788) / multilingues (5964) </li></ul></ul></ul></ul><ul><li>NF Z47-100:1981 (monolingue) ; NF Z47-101:1990 (multilingue) </li></ul><ul><ul><ul><ul><li>Règles d’établissement des thésaurus monolingues / Principes directeurs pour l’établissement des thésaurus multilingues </li></ul></ul></ul></ul><ul><ul><ul><li>Ces normes sont vraiment datées ! </li></ul></ul></ul><ul><li>ANSI/NISO Z39.19:2005 </li></ul><ul><ul><ul><ul><li>Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies </li></ul></ul></ul></ul><ul><li>BS 8723, Structured vocabularies for information retrieval </li></ul><ul><ul><ul><ul><li>Norme en 5 parties produites entre 2004 à 2008 </li></ul></ul></ul></ul><ul><li>IFLA - Gui delines for multilingual thesauri, 2005 et 2008 </li></ul><ul><li>SKOS Simple Knowledge Organization Systems Reference , W3C, 2008 </li></ul>
    4. 4. PRODUCTION DU GE10 DU TC46/CN357 Entre Janvier et Novembre 2008
    5. 5. Le projet de norme : ISO 25964 <ul><li>Basée sur la norme anglaise BS 8723 </li></ul><ul><ul><ul><li>WG8 (Working Groupe) ISO à Stockholm en Mai 2008 : Redécoupage éditorial en 2 parties et nouveau titre </li></ul></ul></ul><ul><li>ISO 25964 </li></ul><ul><li>Thésaurus et interopérabilité avec d’autres vocabulaires Thesauri and interoperability with other vocabularies </li></ul><ul><ul><li>Partie 1: Thésaurus pour la recherche d’information </li></ul></ul><ul><ul><ul><li>Couvre les thésaurus mono- et multilingues </li></ul></ul></ul><ul><ul><li>Partie 2: Interoperabilité avec d’autres vocabulaires </li></ul></ul><ul><ul><ul><li>Couvre la mise en correspondance avec d’autres vocabulaires : classifications (encyclopédique et d’affaires), taxonomies, vedettes-matières, ontologies, listes d’autorité et terminologies. </li></ul></ul></ul>
    6. 6. Organisation du travail - ISO-WG8 et NF-GE10 <ul><li>Excellent travail de groupe national et international ! </li></ul><ul><ul><li>ISO WG8 - piloté par Stella Dextre Clarke (UK) </li></ul></ul><ul><ul><ul><ul><li>CA: Michèle Hudon (Multilingual sub-group), Sophie Lessard - DN: Marianne Lykke Nielsen - FR: Sylvie Dalbin - DE: Traugott Koch Daniel Kless (DK) - UK: Stella Dextre Clarke ; Leonard Will (Data Modelling sub-group); Alan Gilchrist - US: Marcia Zeng ; SP: Francisco Javier García - Anna Martin (NISO) </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Auditeur hors WG : ZH : Zhu Lijun - New Zélande:? ; Nic Cochard </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Réunions téléphoniques mensuelles + Echanges nombreux et denses par courriels et commentaires traitement de texte </li></ul></ul></ul></ul><ul><ul><li>NF GE10 - piloté par Sylvie Dalbin </li></ul></ul><ul><ul><ul><ul><li>Initié à partir du Groupe ADBS - depuis 2003 Actualité des langages documentaires - Vol. 44, N° 1, février 2007 http://www.adbs.fr/revue-docsi-volume-44-n-1-fevrier-2007-15735.htm?RH=1202382041875 </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Bosc Sonia; Chichereau Dominique ; Contat Odile ; Dalbin Sylvie; Dégez Danièle; Deniau Alina ; Dhérent Catherine ; Feyler Francois ; Guillotin Thierry ; Lénart Michèle; Ménillet Dominique ; Mingam Michel ; Hélène Rabault ; Bernard Vatant ; Triboulin Virginie; Zysman Hélène </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Réunions sur Paris : 17/12/2007; 04/2008 ; 11/04/2008; 30/06/2008; 15/09/2008. Prochaine réunion : 12/11/2008 </li></ul></ul></ul></ul>
    7. 7. Partie 1: Thésaurus pour la recherche d’information un Guide de bonnes pratiques <ul><li>Comment organiser un projet « thésaurus » </li></ul><ul><li>Comment sélectionner les concepts et les organiser </li></ul><ul><ul><ul><ul><li>Désambigu ïsation conceptuelle </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Enrichissement et personnalisation des relations </li></ul></ul></ul></ul><ul><ul><ul><ul><li>S’inscrire dans un contexte multilingue : pas de norme distincte pour le multilinguisme - prise en compte de systèmes d’écriture </li></ul></ul></ul></ul><ul><li>Comment représenter les concepts par des termes </li></ul><ul><ul><ul><ul><li>Désambigu ïsation lexicale </li></ul></ul></ul></ul><ul><li>Fonctionnalités des logiciels de gestion de thésaurus </li></ul><ul><li>Modèle de données </li></ul><ul><ul><ul><ul><li>Classes, attributs, relations et un schéma UML - Format d’échange XML </li></ul></ul></ul></ul><ul><li>Nombreux exemples </li></ul><ul><ul><ul><ul><li>concepts, termes, formats de présentation, mono/multilingue </li></ul></ul></ul></ul>
    8. 8. Equilibres à trouver <ul><li>Un outil sémantique de recherche / Un outil terminologique </li></ul><ul><ul><ul><ul><li>Une partie exclusivement dédiée aux concepts et aux relations entre concepts, indépendamment des termes </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Un (essai de) rééquilibrage du poids de tout type de termes utiles à la recherche par rapport à la logique du « terme préféré » pour l’indexation </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Se détacher des spécificités des langues française et surtout anglaise, support de développement des normes initiales </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Se positionner de normes similaires existantes : SKOS et TMF </li></ul></ul></ul></ul><ul><li>Usages humains / Usages informatiques </li></ul><ul><ul><ul><ul><li>“ ISO 25964 makes the transition needed for the world of electronic information management” </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Tout au long du document, formulation attentive à l’Ancien et au Nouveau; ne pas bloquer les situations existantes </li></ul></ul></ul></ul><ul><li>Un Guide métier / Un modèle applicatif formel </li></ul><ul><ul><ul><ul><li>Décalage entre certaines règles énoncées (travailler selon le principe de l’égalité de la représentation des langues) et un modèle formel ne pouvant suivre toutes ces règles (le modèle repose sur une structure unique du thésaurus) </li></ul></ul></ul></ul><ul><li>Intégrer mieux d’autres normes </li></ul><ul><ul><ul><ul><li>RFC 4646, Tags for identifying languages </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Normes terminologiques : rapprochement initié - Contact : Laurent Romary TC37 </li></ul></ul></ul></ul>
    9. 9. Etapes du projet Processus de normalisation prévu entre 2008 et 2010
    10. 10. Le projet aujourd’hui ? <ul><li>Etape 20.00 / 20.20 du processus de normalisation ISO </li></ul><ul><ul><li>http://www.iso.org/iso/fr/standards_development/processes_and_procedures/stages_description/stages_table.htm </li></ul></ul><ul><li>Production </li></ul><ul><ul><li>Un important travail effectué sur 10 mois </li></ul></ul><ul><ul><li>Une participation bien s ûr inégale, mais constante, diversifiée et riche </li></ul></ul><ul><ul><li>Un pilotage anglais «  experts » et  « secrétaire technique » de très grande qualité </li></ul></ul><ul><ul><ul><ul><li>Très réactif sur leur propre document initial </li></ul></ul></ul></ul><ul><ul><ul><ul><li>Sollicitant les correspondants pays, y compris de façon individuelle </li></ul></ul></ul></ul><ul><ul><ul><ul><li>À la recherche d’un consensus permanent </li></ul></ul></ul></ul><ul><ul><li>Une plateforme technique NISO efficiente </li></ul></ul><ul><li>Un WD attendu fin novembre pour la Partie 1 de la norme </li></ul>
    11. 11. Quelles sont les étapes suivantes ? <ul><li>Part 1 - Thésaurus </li></ul><ul><li> Initier la période de commentaires - Décembre 2008 </li></ul><ul><ul><ul><li>Diffusion en France à prévoir (praticiens, formateurs) </li></ul></ul></ul><ul><ul><ul><li>3 collègues Belges et un collègue Suisse déjà sollicités </li></ul></ul></ul><ul><ul><ul><li>Les participantes Canadiennes au projet s’occupent du Canada </li></ul></ul></ul><ul><ul><ul><li>Nécessité d’approcher de façon active les éditeurs de logiciels (nouveau modèle de données normalisé) </li></ul></ul></ul><ul><li>Part 2 - Interopérabilité avec d’autres vocabulaires  Initier ce deuxième chantier - Janvier 2009 (?) </li></ul><ul><ul><ul><li>Production prévue sur 2009 </li></ul></ul></ul><ul><ul><ul><li>Organisation à définir fin 2008 avec ISO-WG8 et Afnor-GE10 </li></ul></ul></ul><ul><ul><ul><li>Poursuite avec le m ême GE10 - composition à étendre en fonction des besoins formulés par le GE10 </li></ul></ul></ul>

    ×