Your SlideShare is downloading. ×
Oe Abes Mai2008
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Oe Abes Mai2008

8,199
views

Published on

Folksonomies et indexation sociale : le monde comme catalogue. Intervention aux journées ABES. 21 Mai 2008

Folksonomies et indexation sociale : le monde comme catalogue. Intervention aux journées ABES. 21 Mai 2008

Published in: Technology

0 Comments
7 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
8,199
On Slideshare
0
From Embeds
0
Number of Embeds
16
Actions
Shares
0
Downloads
100
Comments
0
Likes
7
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Transcript

    • 1. Indexation sociale et folksonomies : le monde comme catalogue. .Olivier ERTZSCHEID. Maître de conférences en sciences de l’information Université de Nantes / IUT La Roche sur Yon http://www.affordance.info Journées ABES. Montpellier. 20 et 21 Mai 2008
    • 2. Le Pitch
      • A l'heure du web 2.0, les technologies d'indexation sociale prennent de plus en plus de place dans le repérage, le classement, la hiérarchisation et l'accès à l'information et aux documents.
      • Les pratiques professionnelles se dissolvent dans les usages amateurs .
      • Quelles sont les frontières et les enjeux de cette nouvelle bibliothéconomie de masse pour la société de la connaissance ?
    • 3. Demandez le programme Chapitre 1 er : Définitions & Exemples Chapitre 2 nd : Folksonomistes : qui sont-ils ? Chapitre 3 ième : Pourquoi ça marche ? Chapitre 4 ème : Quelles pratiques ? Chapitre 5 ème : Quel avenir ? Chapitre 6 ème : Le monde comme pan-catalogue.
    • 4. L’indexation sociale ou « Folksonomie » Définitions & Exemples
    • 5. « Ce n’est pas sale ! »
    • 6. Définition
      • «  Folksonomies désignent
        • un processus de classification collaborative
        • par des mots-clés librement choisis
        • Ou le résultat de cette classification.  » (Wikipédia)
    • 7. ≠ thesaurus
      • « vocabulaire normalisé sur la base de termes génériques et de termes spécifiques à un domaine »
    • 8. ≠ ontologie
      • « ensemble structuré de concepts. (…)
      • organisés dans un graphe (…)
      • relations sémantiques et de composition ou d'héritage. »
    • 9. Folksonomie ≠ thesaurus ≠ ontologie
      • «  Folksonomies désignent
        • un processus de classification collaborative
        • par des mots-clés librement choisis
        • Ou le résultat de cette classification.  »
      • Vocabulaire non-normalisé,
      • non-structuré,
      • non-spécifique à un domaine,
      • sans relations sémantiques ou hiérarchiques.
    • 10. Le petit folksonomiste illustré Source : Agnès de Saxcé BBF 2007 - Paris, t. 52, n° 4. Compte-rendu du colloque évaluation et validation de l’information.
    • 11. 5 étapes d’indexation Web <META> Communauté de pratique Web Sémantique FOLKSONOMIES Communauté D’usage DUBLIN-CORE OAI-PMH Communauté Métier / Ressources ONTOLOGIES Communauté compétences (Outils + métier) ? ? Standardisation Linguistique de corpus GOOGLE PageRank « Indexeurs sans le savoir »
    • 12.
    • 13.
    • 14. Dél.icie.uses folksonomies
    • 15. FolsonomiSTES Martiens ? Visionnaires ? Gourous ? Une secte ? Indexeurs du troisième type ? ? Pour ou contre ?
    • 16. Qui indexe ?
      • Usagers,
      • Consommateurs,
      • Producteurs,
      • Auteurs,
      • Novices,
      • Experts.
      Textes Docs de travail Articles scientifiques Billets de blogs Photos Vidéos A moi Aux autres A la volée En surface En profondeur (deep tagging) En connaissance de cause Au hasard Pour moi (tags privés) Pour les autres (tags publics) Organiser, Partager, Chercher, Retrouver Associer, « Participer » Quoi ? Pourquoi ? Comment ?
    • 17. Digital Natives / Digital immigrants La loi de (rupert) Murdoch
      • Sites pratiquant/proposant l’indexation sociale/communautaire sont
        • Majoritairement créés par de jeunes entrepreneurs (start-up)
        • Majoritairement utilisés par un public « jeune »
        • Majoritairement rachetés par des « digital immigrants »
    • 18. ? Avantages = Inconvénients ?
      • Indexation humaine, à la volée, instantanée, cumulative, simple, rapide, gratuite
      • Intérêt d’un filtrage collaboratif
      • gain de temps, gain d’échelle, économie d’expertise (masse critique des indexeurs) …
      • Couverture documentaire totale (documents, livres, photos, couriels, cartes géographiques …)
      • Conforme aux usages (onebox, oneword)
      • Trop simple, trop peu d’expertise, trop d’hétérogénéité
      • Confusion entretenue entre pertinence (autorité) et popularité (photos les plus vues les plus tagguées et réciproquement)
      • polysémie, synonymie, lemmatisation, orthographe, langue, redondance, univers de référence (« peinture » et/ou « louvre », etc.)
      • = Méta-bruit
    • 19. ? Avantages = Inconvénients ?
      • « Folksonomist are confusing cataloging structure with personal opinions (…). These are not the same thing and they need to be separated. »
      • Non. Ils se servent (à dessein) de leurs opinions personnels comme d’une structure d’indexation.
      • Sur le processus de classification : oui, sont plus floues, plus polysémiques, plus imprécises.
      • Mais sur les objets ?
        • Qui va se lancer dans une entreprise de classification aristotélicienne des photos de vacances de 100 000 personnes sur FlickR ?
        • Doit-on décider qu’elles sont inclassables ??
    • 20. Pourquoi ça marche ?? « Si l'on tague &quot;A la recherche du temps perdu&quot;, dans son édition de 1947 en 15 volumes (disponible en téléchargement ici), on trouve 442 occurrences du prénom &quot;Odette&quot; sur les quelques 5000 pages de l'ouvrage. Et pourtant Proust ne l'a pas appelé &quot;A la recherche d'Odette ». (à noter qu'on ne trouve que 24 &quot;madeleine&quot;). Comme quoi les tags c'est de la merde. Et les taguers des branleurs. » Commentaire d’un billet publié sur Embruns.net (blog de Laurent Gloaguen)
    • 21. Une image vaut 1000 mots (clés ?) Graphic by Elliancet in Search Engine Land.
    • 22. Les raisons du succès
      • Temporalité réunifiée entre interface et indexation
      • La fonction symbolique plutôt que la vocation analytique.
      • Sagesse des foules
      • Auto-régulation
      • Faible coût cognitif
      • (enfin une) Indexation orientée-tâche
      1 2 3 4 5 6
    • 23. Les raisons du succès (1/5) : Une temporalité (ré?)unifiée entre interface et indexation
      • Temps consultation ≈ temps de l’accès ≈ temps de l’indexation
      • Micro-temporalités successives, parfois simultanées, jamais contraintes, sans préalables.
      • Langages documentaires & formels (Thésaurus & ontologies) pour l’accès à l’information :
        • Interfaces asynchrones.
        • Nbre textes > nbre d’indexeur = temporalité interfaçage longue
        • Acculturation difficile
      • Folksonomies
        • Interface synchrone. Le temps de l’indexation est le même que celui de l’accès et du repérage.
        • Nbre documents < = nbre d’indexeurs = temporalité interfaçage courte (simultanée)
        • Acculturation a priori.
    • 24. Les raisons du succès (2/5) : La fonction symbolique plutôt que la vocation analytique.
      • Vocation analytique des langages documentaires & formels :
        • classer physiquement et/ou conceptuellement selon la nature de l’objet
        • Univers de référence « construit » par l’indexeur, l’expert et l’état des connaissances au moment de l’indexation
        • Approche « objective », logique ou logiciste
      • Fonction symbolique Folksonomies :
        • Repérer sémantiquement pour accéder et/ou représenter l’objet.
        • Univers de référence induit par l’objet lui-même et le rapport objet/indexeur (affordance)
        • Approche « subjective », empirique, « essai et erreur »
    • 25. Les raisons du succès (3/5) : la sagesse des foules
      • «  (…) N'importe qui peut déposer n'importe quel tag sur n'importe quelle photo. Mais - et c'est la clé - Flickr offre un retour sur les tags les plus utilisés et les plus populaires, et les gens souhaitant attirer l'attention sur leurs photos (...) apprennent rapidement à utiliser ce lexique si celui-ci fait sens. Cela rend le système étonnamment stable . Del.icio.us fait la même chose. Le succès de Google pour rendre les recherches plus pertinentes reposait sur la puissance de cette sagesse populaire (PageRank)...  » Adam Bosworth, VP ingénierie chez Google.
      • Postule l’existence pour tout élément donné (texte, image, document) d’une série de mots et termes composant le plus petit lexique commun (concensus) permettant de décrire l'objet ou le document.
    • 26. Les raisons du succès (4/5) : un faible coût cognitif
      • Marquage élimine la phase de décision (choix de la bonne catégorie)
      • Dissipe la phase de paralysie d’analyse (choix du mot-clé)
      • Permet l’ancrage en contexte socio-cognitif immédiat.
        • Google image labeller : http://images.google.com/imagelabeler/
      • Hiérarchie centrée document VS anarchie centrée utilisateur MAIS …
      • Confirmation de l’axiomatique du memex :
        • « human mind doesn’t work that way »
        • « association »
    • 27. Les raisons du succès (5/5) : Auto-régulation ?
      • Golder Scott A. & Huberman Bernardo A., « The Structure of Collaborative Tagging Systems », Information Dynamics Lab, HP Labs , 2005.
      • Méthodologie
        • Site Del.icio.us sur une période donnée (5 jours)
        • Corpus :
          • Les plus populaires (212 URL présents dans 19422 signets)
          • Échantillon aléatoire de 229 usagers ayant partagé durant période test + tous leurs signets y compris hors-période (68 668 signets)
    • 28. Les lois folksonomiques
      • Loi de caractérisation
        • 7 types de tags : Thématiques (orientés sujet) / Nature de l’objet (article, blog, livre) / Propriétaire (auteur du signet) / adjectifs de caractérisation (drôle, stupide, horreur) / auto-référence (messignets, monnom …) / orientés tâche (à lire, recherche d‘emploi)
      • Loi de partage
        • Plus on possède (= partage), plus on taggue (avec fortes variations selon individus)
      • Loi de Feedback positif
        • Motifs stables dans la proportion et le choix des tags.
        • Plus une ressource est partagée, plus le nombre de tags la décrivant se stabilise ainsi que leur nature.
    • 29. Folksonomies & Pratiques
    • 30. Librarything : la communauté comme indexeur
      • Site communautaire à vocation bibliothéconomique : www.librarything.com
        • Février 2006: 1.5 millions de références => Juin 2006: 3.2 millions => Nov 2006: 6.2 millions => Juin 2007 : 14 millions => Mai 2008 : 26 Millions
    • 31. Le meilleur des deux mondes ?
      • Indexation « standard » :
        • notice au format MARC,
        • indexation DEWEY,
        • LC « subjects headings »,
      • Indexation sociale :
        • tags associés,
        • fiches de lecture et revues de la communauté,
        • système de recommandation
      Modèle collaboratif, auto-régul, ouvert en lecture et en écriture, « Amazon-ifié », « OPAC-ifié »
    • 32. Les musées … aussi !
      • Metropolitan Museum of Art indique que :
        • &quot; sur 30 oeuvres d'art indexées par les usagers, plus de 80% des tags ne figuraient pas dans le vocabulaire documentaire utilisé par le musée. &quot;
      • Outil collaboratif de tagging à destination des musées
        • http://www.steve.museum/
      « Nécessité fait loi. »
    • 33. Les musées … aussi !
      • Musée McCord de Montréal.
      • Usagers créent et ajoutent :
        • des tags pour annoter les fonds existants,
        • des commentaires,
        • des images personnelles,
        • Peuvent visionner l'ensemble des &quot;circuits publics&quot;.
      « Nécessité fait loi. »
    • 34. Les bases de données scientifiques … aussi !! hubmed.org
    • 35. Le catalogue … aussi !! http://orlabs.oclc.org/Identities
    • 36. Le moteurs … aussi !!!
      • Plusieurs « écoles »
        • Moteurs dédiés (technorati.com)
        • Fonctionnalité intégrée (MyYahoo)
        • Illusion folksonomique (cloud.clusty.com)
    • 37. Les communautés scientifiques : aussi !!!
      • Postgenomic.com, CiteUlike (Repérage de signets IST) …
      • Folksonomies présentes partout : accès, repérage, commentaire.
    • 38. Et les bibliothèques ? Aussi !
      • Bibliothèque & Catalogue http://tags.library.upenn.edu/
      • Intégration dans SIGB (open source ou propriétaires) : Étagères virtuelles de PMB
      Rapport Calhoun pour la LoC (Mars 2006) Déclencheur pour le monde des bibliothèques www.loc.gov/catdir/calhoun-report-final.pdf
    • 39. Et les bibliothèques ? Aussi !!
      • Library of Congress sur FlickR :
        • http://flickr.com/photos/library_of_congress/
      • Boston Public Library sur FlickR :
        • http://flickr.com/photos/boston_public_library/
      • Pourquoi ?
        • « Pour partager ces collections photographiques avec ceux qui ne visitent pas notre site
        • Pour mieux comprendre en quoi l'indexation sociale pour nous apporter des idées d'amélioration de nos services et de nos fonds
        • Pour accroître notre expérience et notre implication dans des communautés web partageant des centres d'intérêts communs avec les collections de bibliothèques. »
          • Source : http://www.loc.gov/rr/print/flickr_pilot_faq.html
      • RÉSULTAT ??
    • 40. Résultat …
      • 392,000 views on the photostream
      • 650,000 views of photos
      • Adding in set and collection page views, there were about 1.1 million total views on our account
      • All 3,100+ photos have been viewed
      • 420 of the photos have comments
      • 1,200 of the photos have been favorited
      En une nuit !! http://www.loc.gov/blog/?p=237
    • 41. http://flickr.com/photos/library_of_congress/alltags/
    • 42.
    • 43. C’est déjà demain Où comment « concilier l’inconciliable » ?
    • 44. Intérêt « fusionnel »
      • Exporter …
      • Vers un site collaboratif communautaire (del.icio.us)
      • Des (méta)données documentaires (HubMed)
      • Fertilisation croisée
      • Ouverture des catalogues
      http://hublog.hubmed.org/
    • 45. L’hybridation comme modèle ?
      • Amazon : Amapedia
      • « Collaborative structured tagging »
      • Tags factuels
        • TagFactuel : valeur1, Valeur2, Valeur3 ...
      • Tags catégoriels
        • Relation « is a »
        • Relation « like … »
        • Relation « partage des attributs essentiels »
    • 46. Vers des modèles hybrides
      • FlickR (& bientôt) Del.icio.us : « Machine Tags »
      • Nom : attribut = valeur.
      • flickr:user=straup
      • flora:tree=coniferous
      • medium:paint=oil
      • geo:cartier=&quot;plateau mont royal&quot;
      • geo:neighbourhood=geo:cartier
    • 47. Quel avenir ? Penser une bibliothéconomie « à l’échelle » des transformations en cours, et « en mouvement ». Une bibliothéconomie de masse .
    • 48. Quels mouvements ? Tectonique documentaire : Cinq continents réunifiés
    • 49. Dérive des continents documentaires : le monde comme Pan-catalogue 1995 2005 2015 ? Web public Web privé Web personnel (Desktop) Web intime (Mail) indexé non-indexé Web public Web privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs) Web public Web privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs) ? Pourquoi ?
    • 50. Quelle échelle ? Celle des nouvelles cultures , des nouvelles pratiques , des nouveaux besoins des natifs digitaux
    • 51. Bouillon de cultures
      • Culture du fragment : Homogénéisation des savoirs
      • Culture de l’accès : Économie de l’attention
      • Culture du service, de la proximité, du «  service de proximité  »
        • Librairie, bibliothèque, pizzéria « près de chez vous » : « caRtalogue »
      • Culture de « l’économie »
        • d’expertise ( sagesse des foules )
        • de temps ( immédiateté )
        • d’argent (culture du gratuit )
      • Culture de l’ouverture : Open Access, Open Archives, Open Office, Open Data …
      • Culture de la synchronicité
        • Accès, repérage, recherche, certification, indexation, navigation, partage
      Réflexion sur « l’offre » documentaire Doit intégrer cette économie de la demande
    • 52. Quelles transformations ? Celle des pratiques
    • 53. Confusion des pratiques ? chercher communiquer Tagger / indexer organiser s’orienter partager google talk earth print orkut API’s Web/documenet public Web/document` privé Web personnel (Desktop) Web intime (Mail) Web extime (blogs)
    • 54. Mathématiques bibliothéconomiques
      • Années 90 : industrialisation de l’indexation (moteurs de recherche)
      • Années 2000 : marchandisation de l’indexation (liens sponsorisés)
      • Aujourd’hui : « indexabilité » de l’actuelle masse documentaire :
        • Totale : nos mails, nos documents de travail, nos « recherches », nos amis, nos préférences sexuelles, politiques, religieuses …
        • En temps réel : à la volée
        • Transparente : visible par tous (surtout par les moteurs) et de partout (interopérabilité)
      • Bibliothéconomie de masse = industrialisation + marchandisation + indexabilité
      • Horizon de l’indexation :
        • Question n’est plus celle de l’autorité (qui a autorité pour indexer)
        • ni même de l’expertise (qui a compétence pour indexer)
        • mais celle de l’usage (qui a besoin d’indexer)
      • IL EST URGENT DE SE SAISIR DE CES OUTILS !
    • 55. Il y a urgence. ? Sinon ? Modèle marchand de la bib. Autarcithécaires Bibliothèques ?
    • 56. Conclusion …
      • « It is neither Pandora’s box not panacea. Social tagging highlights the interstices of authorship, intertextuality, and context in indexing, and asks us to fill in the gaps. It is a catalyst for improvement and innovation in indexing.  »
        • Joseph T. Tennis. Social tagging and the next stpe for indexing. 17th SIG/CR Classification Research Workshop, Novembre 4, 2006.
      • La communauté comme indexeur a son rôle à jouer.
      • Pour aller vers un juste milieu entre folksonomie débridée et rigidité taxonomique
    • 57. … MeRci … ? QuEsTioNs ? ? QuEsTioNs ?