Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?

on

  • 2,771 views

Séminaire sur les pratiques d'indexation . ...

Séminaire sur les pratiques d'indexation .
Aspect historique des index et de l’indexation (en France), Prise en compte de la fonction de recherche, Prise en compte (partielle) du contexte des CDIs pour évaluer l’impact de ces évolutions fonctionnelles et techniques

Statistics

Views

Total Views
2,771
Views on SlideShare
2,731
Embed Views
40

Actions

Likes
1
Downloads
29
Comments
0

3 Embeds 40

http://www.scoop.it 31
http://www.linkedin.com 8
https://www.linkedin.com 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

CC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike LicenseCC Attribution-NonCommercial-ShareAlike License

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment
  • 4. Les nouvelles technologies : révolution culturelle et cognitive (Durée :1h04)Conférence de Michel Serres (philosophe, de l’Académie française), http://www.in ria.fr/40ans/ forum/video.fr.php
  • Distinction entre les professionnels pour la capitalisation/l’archivage et ceux pour la diffusion
  • André Tricot - chercheur à l’UTM (Univ de Toulouse Mirail) http://pagesperso-orange.fr/andre.tricot/index.html
  • Introduction au TALN, Anne Vilnat, 2008 (cours) http://www.limsi.fr/Individu/anne/coursM2R/intro.pdf
  • Sujet - Groupe nominal et groupe verbal - Nom propre - Verbe + Groupe nominal; Déterminant et nom Analyseur
  • http://www.eau-seine-normandie.fr/index.php?id=533
  • Microformats “génériques” : iCalendat (évènement), XFN (réseaux de connaissances), hAtom (fil d’actualités), hResume (CV), Rel-tag (tags)... Familles de schémas de métadonnées de Domaines de la Formation (lom-fr,...) Des ontologies génériques et spécialisées
  • Microformats “génériques” : iCalendat (évènement), XFN (réseaux de connaissances), hAtom (fil d’actualités), hResume (CV), Rel-tag (tags)... Familles de schémas de métadonnées de Domaines de la Formation (lom-fr,...) Des ontologies génériques et spécialisées
  • Tim Berners-Lee, 2001
  • Un exemple de réexploitation du travail de référencement, grâce à un balisage plus formel et à l’usage des technologies ouvertes du web.
  • L’application Facette du MIT, récupère toutes les données sous Delicious et propose une interface de recherche par facettes
  • titre : auteur/compositeur
  • Métalangage de recherche - 8000 notions - 80000 entrées; Alignements entre plusieurs vocabulaires : Motbis, Rameau, Th. Unesco, Gemet ..... Vocabulaires contrôlés, par François Feyler, [avril 2009]; http://www.savoirscdi.cndp.fr/?id=1066
  • http://dossierdoc.typepad.com/descripteurs/2008/01/tagger-pour-la.html S'ENTHOUSIASMER De très nombreux messages pour donner son sentiment sur les photos SE SOUVENIR Les natifs s'expriment  ; un afficionado/a de la photographie évoque son v ieux P entax ] APPRENDRE Ici que lqu'un s'étonne de voir de la couleur p our un e photo de 1913. Quelqu'un d'au tre lui signale avec amusement, qu'il s'agit de l a date de naissance du photographe, la date de la photo étant 1943....  Voilà une leçon à l a "maîtrise à l'informatio n" qui profite à tous !  2 jours après , quelqu'un reconnaît qu'il s'était posé la question... SE DOCUMENTER D'au tres posent des questions sur le photographe STOCKER/CONSERVER Plusieurs personnes ont conservé cette photo dans leurs favoris ENRICHIR et ANNOTER Quelqu'un d'autre rajoute un lien sur une biographie du photogra phe (qui se trouve sur un aut re site US. Quelques mo ts-clés ont é té ajoutés, décrivant le paysage lui -même (blue sky, silo ).
  • http://dossierdoc.typepad.com/descripteurs/2007/12/publics-librs-a.html S'ENTHOUSIASMER De très nombreux messages pour donner son sentiment sur les photos SE SOUVENIR Les natifs s'expriment  ; un afficionado/a de la photographie évoque son vi eux Pe ntax ] APPRENDRE Ici quel qu'un s'étonne de voir de la couleur pou r une photo de 1 913. Quelqu'un d'autr e lui signale avec amusement, qu'il s'agit de la date de naissance du photographe, la date de la photo étant 1943....  Voilà une leçon à la "maîtrise à l'information" q ui profite à tous !  2 jours après , quelqu'un reconnaît qu'il s'était posé la question... SE DOCUMENTER D'autre s posent des questions sur le photographe STOCKER/CONSERVER Plusieurs personnes ont conservé cette photo d ans leurs favoris ENRICHIR et ANNOTER Quelqu'un d'autre rajoute un lien sur une biographie du photograp he (qui se trouve sur un autr e site US. Quelques mots- clés ont été ajoutés, décrivant le paysage lui- même (blue sky, silo) .
  • Le problème vedettes matière / thésaurus est devenu secondaire. Par contre, le principe d’une indexation au thème principal versus une annotation précise des contenus reste posé.
  • * SID = système d’information documentaire
  • Identité professionnelle : - unité de traitement : bibliothéconomie [3], [4] ; documentalistes [2], [3], [4] - méthodes et outils en cohérence avec cette unité de traitement: -> indexation au sujet principal et vedettes / tous les sujets (contenus) des documents (thésaurus spécialisé)

Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ? Presentation Transcript

  • 1. Nouvelles pratiques d’indexation, Nouveaux enjeux documentaires ?
    • Sylvie Dalbin
    • http://claimid.com/sylviedalbin
    ESEN, le 22 Septembre 2009
  • 2. Contexte de l’intervention
    • Séminaire de 2 heures
    • Sur les nouvelles pratiques de l’indexation
    • A l’attention d’un groupe de I.A.- I.P.R.
    • Orientations prises
        • Aspect historique des index et de l’indexation (en France)
        • Prise en compte de la fonction de recherche
        • Prise en compte (partielle) du contexte des CDIs pour évaluer l’impact de ces évolutions fonctionnelles et techniques.
    Sylvie Dalbin, 22 Septembre 2009
  • 3. Déroulement
    • Présentation de l’intervenante - du groupe
    • Notions d’indexation
    • Contexte actuel - principe de convergence
    • Nouvelles pratiques d’indexation
          • Indexation linguistique
          • Indexation structurée (Web de données, Web sémantique)
          • Indexation sociale
    • Enjeux documentaires - Débat
    Sylvie Dalbin, 22 Septembre 2009
  • 4. Notion d’indexation Sylvie Dalbin, 22 Septembre 2009
  • 5. Indexation - définition
    • “attribuer (à un document) une marque distinctive qui renseigne sur le contenu et qui permet de le retrouver” (1948 - Le Robert)
    • notion ancienne, techniques variées en fonction des périodes et des contextes d’usage
    • Mais on indexe toujours ... pour offrir des clés d’accès à l’information
    Sylvie Dalbin, 22 Septembre 2009
  • 6. Indexation - principes
    • créer des point d’accès à des ressources
        • quel contexte ?
          • un espace fermé : objet autonome, collection versus un espace ouvert
          • un stock (ou équivalent) versus un flux - évolution dans le temps
          • un espace éloigné des producteurs ou en proximité ?
        • quelle cible ?
          • niveau de granularité de la cible : document autonome
        • quel(s) outil(s) ?
          • un terme, une liste de termes, hiérarchisés ou non, un graphe de termes
          • contrôlé ou non
        • quel(s) usage(s)
    Sylvie Dalbin, 22 Septembre 2009
  • 7. Indexation - histoire ancienne Sylvie Dalbin, 22 Septembre 2009
  • 8. Contexte actuel principe de convergence Ressources numériques Technologies de l’information Acteurs dans la Société de l’information Modes d’accès à l’information Sylvie Dalbin, 22 Septembre 2009
  • 9. Ressources numériques
    • Traitement à la source - continuum
          • document porteur de ses méta-informations
          • tout au long de son cycle de vie
    • Production structurée et enrichie
          • grains d’information - ouverture, mashups
          • production structurée : sémantique structurelle
          • recherche intra-documents, inter-documents
    • Multitude de documents et collections, traités selon des méthodes différentes
          • recherche multi-(re)sources
    Sylvie Dalbin, 22 Septembre 2009
  • 10. Technologies de l’information
    • 50 ans après
      • “Lorsque, le matin, vous vous asseyez devant votre ordinateur, vous avez en face de vous, votre tête”, M Serres, 2008
          • les TI sont plus qu’un simple appui aux actions humaines
          • des actions sont conduites par la machine à notre place
      • Les TI du Web révolutionnent les notions de document / collection
          • “ouverture” - texte balisé, structuré - continuum
      • Les TI d’indexation et/ou de recherche permettent aujourd’hui
          • de distinguer plus formellement les phases d’indexation de celle de l’accès
          • la vue des producteurs ou des intermédiaires, de celles des utilisateurs
    Sylvie Dalbin, 22 Septembre 2009
  • 11. Acteurs dans la Société de l’information
    • Usager pour lui ou son collectif
        • est producteur - éditeur - lecteur - gestionnaire
        • les usages de l’information se sont multipliés
          • “le syndrome du Lettré”, expert du domaine ayant préparé sa recherche (requête)
          • lecture active, annotations, gestion et co-gestion
        • pratiques guidées par l’efficience et la proximité
    • Intermédiaires : multiples niveaux
        • fonction de la proximité avec les usagers
        • fonction de leur rôle : orienté ressources ou usages
          • éditeurs - gestionnaires - diffuseurs - recherchiste
        • nous devenons tous producteurs, éditeurs, gestionnaires, recherchistes
    11 Sylvie Dalbin, 22 Septembre 2009
  • 12. Modes d’accès à l’information
    • Recevoir l’information
        • automatiquement par un tiers, par un système
    • Poser une question
        • sous forme d’une requête à un système dédié
        • sous forme d’une formulation libre (orale, courriel)
    • Naviguer au sein d’un schéma structuré
        • systèmes à facettes, classification,...
    • Fouiller un “corpus”
        • ne pas passer de temps à poser une question
    • Par sérendipité
    Sylvie Dalbin, 22 Septembre 2009
  • 13. Convergence
    • l’information comme matière première
    • le numérique comme médium
    • l’ordinateur comme outil
    • les activités de production, édition, gestion, diffusion, recherche d’information
    http://www.mkbergman.com / Sylvie Dalbin, 22 Septembre 2009
  • 14. Pratiques d’indexation 1. Indexation de la langue 2. Indexation structurelle (Web sémantique) 3. Indexation sociale Sylvie Dalbin, 22 Septembre 2009
  • 15. Pratiques d’indexation 1. Indexation de la langue Sylvie Dalbin, 22 Septembre 2009
  • 16. Indexation de la langue (1)
    • TALN - traitement automatique des langues naturelles
        • ensemble des activités visant à modéliser et générer à l’aide de machines, la capacité humaine à produire et à comprendre des énoncés linguistiques dans des buts de communication (à partir de A.Vilnat)
        • pourquoi ? document numériques + acteurs protéiformes
        • 50 ans de développements intenses
    • En recherche d’information
        • amélioration des traitements “texte intégral” (chaîne de caractères)
        • langues écrites mais aussi parlées
        • investissement faible des professionnels de l’infodoc.
    Sylvie Dalbin, 22 Septembre 2009
  • 17. Indexation de la langue (2)
    • Ingénierie linguistique
      • découpage du texte en phrases, puis en mots
      • analyse syntaxique : arbre
      • des ressources dédiées
    • Apport en recherche d’info.
      • groupes nominaux
      • extraire les “thématiques” des textes
        • Fouille de données
    Sylvie Dalbin, 22 Septembre 2009
  • 18. Synomia - index automatique
    • De nombreuses applications
    • Ici un index de site Web créé automatiquement
      • Analyse syntaxique
      • Suppose des corpus textuels
    http://www.synomia.com/fr/ Sylvie Dalbin, 22 Septembre 2009
  • 19. Pratiques d’indexation 2. Indexation structurelle Sylvie Dalbin, 22 Septembre 2009
  • 20. Indexation structurelle (1)
    • Des méthodes et outils spécifiques -- orienté “Domaine”
      • modélisation informatique (voir page suivante)
      • outils
          • schémas de métadonnées
          • ontologies informatiques
      • finalités : donner la main à la machine
          • structurent et exposent les données
          • permettent des inférences (des calculs)
      • Evolution
          • de la notice / thésaurus => Bases de connaissance / référentiels
    20 Sylvie Dalbin, 22 Septembre 2009
  • 21. Indexation structurelle (2)
    • Schémas de métadonnées
      • “ données structurées portant sur des données”
    • Ontologies informatiques
      • quoi : représentation conceptuelle d'un domaine - modèle formel qui décrit les objets du domaine et les relations qui les unissent
      • pourquoi : objectif de partager des connaissances entre agents du domaine, humains ou logiciels
    • Ces structures apportent de la sémantique aux systèmes
    Sylvie Dalbin, 22 Septembre 2009
  • 22. Indexation structurelle (3)
    • Le Web sémantique” ou “Web de données” A/
    • Ici un texte accessible par les moteurs de recherche
    Sylvie Dalbin, 22 Septembre 2009 Dès “A bout de souffle” (1959), son premier long métrage, Jean-Luc Godard s'impose par un trait novateur, en rupture totale avec les formes du cinéma traditionnel : Jean-Paul Belmondo y vole une voiture, tue un motard, .... Le but de Godard n'est pas de raconter une histoire, mais d'en proposer la lecture critique du genre, en l'occurrence le thriller américain . Ce film devient l'oeuvre phare du cinéma de la Nouvelle Vague. (Cinémathèque Française)
  • 23. Indexation structurelle (4)
    • Le Web sémantique” ou “Web de données” A/
      • donner du sens aux données qui circulent en les balisant
      • pour optimiser l’accès et l’interopérabilité entre machines
    Dès <tit-f> A bout de souffle <tit-f> (1959), son premier long métrage, <act:au> Jean-Luc Godard <act:au> s'impose par un trait novateur, en rupture totale avec les formes du cinéma traditionnel : <act:com> Jean-Paul Belmondo <act:com> y vole une voiture, tue un motard, .... Le but de Godard n'est pas de raconter une histoire, mais d'en proposer la lecture critique du genre, en l'occurrence le <genre> thriller américain <genre> . Ce film devient l'oeuvre phare du <sujet> cinéma <sujet> de la <genre> Nouvelle Vague <genre> <source> (Cinémathèque Française) <source>
  • 24. Ex. - Delicious et Facette du MIT les mots-clés sont accompagnés de leur classes de métadonnées
  • 25. Ex. - Delicious et Facette du MIT
  • 26. Indexation structurelle (5) Schémas de métadonnées orientés ressources Des référentiels terminologiques communs
  • 27. Ex. - Indexation structurell e (4) identifiant relation instance de la classe Oeuvre instance de la classe Personne attribut entités Les machines vont pouvoir exploiter automatiquement toutes ces données => le web sémantique des données Ontologie du domaine de la musique (très partielle)
  • 28. Architecture des SID Autre exemple : Métalangage OTAREN (Outil Thématique d’Aide à la Recherche pour l’Education Nationale), François Feyler
  • 29. Pratiques d’indexation 3. Indexation sociale
  • 30. Indexation sociale (1)
    • Indexation orientée usage
        • clé d’accès, non contrôlé
    • Tim Berners-Lee, 2007
        • Internet = relation entre machines
        • Web = relation entre documents
        • Web social = relations entre personnes
    • Crowdsourcing
        • Contenu généré par les utilisateurs
    30 http://dossierdoc.typepad.com/descripteurs/2008/01/tagger-pour-la.html
    • Etude des traces (indexation) laissées par les internautes - Projet de la Library of Congress (2007)
    • S'ENTHOUSIASMER
    • SE SOUVENIR
    • et retrouver
    • APPRENDRESE DOCUMENTER
    • STOCKER/CONSERVER
    • ENRICHIR et ANNOTER
  • 31. Indexation sociale (2)
    • Portail du Musée McCord
      • exploitation libre des données documentaires des SID
      • portail de l’Utilisateur
        • Ma sélection d'images courantes
        • Mes images personnelles
        • Mes tags
        • Mes images annotées
        • Mes commentaires
        • Mes commandes photographiques
        • Mes dossiers
        • Mes duos
    http://dossierdoc.typepad.com/descripteurs/2007/12/publics-librs-a.html
  • 32. Synthèse : méthodes et outils Document de travail, Dalbin, version 2009 Période Ressource Processus Outils Public Usage 1 Antiquité Un manuscrit ou corpus d’un auteur annotation du contenu d’un texte notes marginales au texte, de toute nature; table de concordance accès rapide à un passage pour compréhension => mémorisation 2 Moyen Age Manuscrit papyrus - parchemin - codex note externe - lien au texte; regroupement des notes Table - Index symbole de repérage idem + extension aux encyclopédies 3 Renaissance Imprimé un manuscrit des collections indexation fine contenu du document (et de collections) Index de fin de livre recherche sujet avec accès direct au passage du texte ; langues vernaculaires 4 Fin XIXe siècle Périodiques, Livres industrialisation indexation thématique de collections, contrôlée Index de collection Vocabulaire contrôlé vedettes - thésaurus repérage sujet avec accès indirect au texte 5 Après 2ème Guerre Mondiale Variétés de “documents” Support numérique indexation fine du contenu de collections + Hypertexte automates exploitant des ressources linguistiques repérage info avec accès direct au texte 6 Fin XXè - Début XXI Web annotation .sociale, ..sémantique ontologie, taxonomie compréhension pour accès à un grain d’info + lecture num. Société
  • 33. Adapter nos pratiques professionnelles Du point de vue du métier de Documentaliste
  • 34. Indexation - quel modèle ? (rappel)
    • quel contexte ?
          • un espace fermé versus ouvert (accès unique à des multicollections)
          • un stock (ou équivalent) versus un flux - évolution dans le temps
          • un espace éloigné des producteurs ou en proximité ?
    • quelle cible ?
          • niveau de granularité de la cible
          • annotation - indexation au plus fin - indexation au thème principal - classement
    • quel(s) outil(s) ?
          • thésaurus, index et lexique, référentiels variés, nomenclatures, taxonomie,..
          • investir les automates, les langages de recherche (type Otaren)
    • quels usages ?
    34
  • 35. Identité prof. : à ré-évaluer
    • Fondée sur des missions : fournir ? former ?
        • fournir des documents => fournir des informations ? répondre aux besoins ? (cf. référentiel Fadben, 2006)
        • former à la recherche => à la gestion, l’organisation, le partage ?
        • prendre en compte tous les besoins informationnels des Usagers ?
    • Fondée sur des unités de traitements et des outils adaptés
        • livres et collections => granularité et continuum des espaces doc.
    • Fondée sur un statut d’exclusivité
        • Accepter que tout le monde indexe, même la machine
        • Logique de co-partenariat et de services avec les utilisateurs et autres intermédiaires, dont l’informatique
  • 36. Merci !
  • 37. Références Histoire Chronologie des supports, des dispositifs et des outils de repérage de l'information , Sylvie FAYET-SCRIBE, décembre 1997, http://biblio-fr.info.unicaen.fr/bnum/jelec/Solaris/d04/4fayet_1tab.html Concevoir l’index d’un livre. Théorie et pratique, Jacques Maniez, Dominique Maniez, ADBS Editions (à paraître en 2009/2010) Nouvelles pratiques d'indexation, nouveaux enjeux documentaires ?, Muriel Amar, 2008 (manuscrit) Technologies de l’information Les nouvelles technologies : révolution culturelle et cognitive (Durée :1h04) - Conférence de Michel Serres (philosophe, de l’Académie française), http://www.inria.fr/40ans/forum/video.fr.php Giant Global Graph, Tim Ber ners-Lee, nov. 2007 - http://dig.csail.mit.e du/breadcrumbs/node/215 Inde xation de la langue Introduction au TALN, An ne Vilnat, 2008 (cours ) - http://www.limsi.fr/Individu/anne/coursM2 R/intro.pdf Recherche d’information et traitement de la langue : fondem ents linguistiques et applications. Lallich-B oidi n, G. et Maret , D., Presses de l’ENSSIB, 2005. (ISB N: 2-910227-60-X). (analyse - Documentaliste - Sciences de l’information 2006, vol. 43, n° 2, p166- http://ww w.cairn.info/revue-documentaliste-sciences-de-l-info rmation-2006-2-page-158.htm ) Indexation structure (Web sémantique) Sur la légitimité des contenus générés par les utilisateurs, Patrick Peccatte, 30 jui n 2009 http://blog.tuquoque.com/post/2009/06/30/Sur-la-legitimite-des-contenus-generes-p ar-les-utilisateurs Exemples en ligne Index automatique / Agence de l’Eau Seine Normandie : http://www.eau-seine-normandie.fr /index .php?id =533 Les utilisateurs indexent / http://dossierdoc.typepad.com/descripteurs/2008/ 0 1/tagger-pour-la.html Outiller les utilisateurs / Musée McCord - http://dossierdoc.typepad.com/desc ripteurs/2007/12/publics-librs-a.html Compétences Métiers et compétence en InfoDoc, S.Dalbin, (weblogue) - http://referentieleninfodoc.wordpress.com /