Dicen Tagging Mars2010

651
-1

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
651
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
9
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Dicen Tagging Mars2010

  1. 1. Approche collaborative et assistée à l'enrichissement des folksonomies: entre ergonomie et algorithmie DICEN – Séminaire tagging & folksonomies – 26 mars 2010 Freddy Limpens, Edelweiss, INRIA Sophia-Antipolis [email_address] Edelweiss
  2. 2. Objectifs -> Ancrage dans un contexte d’usage -> Synergie entre automatisme et contribution des utilisateurs
  3. 3. 1. problématique
  4. 4. limites des folksonomies
  5. 5. Variation d'écriture des tags: newyork = new_york ademe = ADEME musique = music
  6. 6. Ambiguité des tags: RDF =? Ressource Description Framework RDF =? Rwanda Defense Force RDF =? Reality Distortion Field
  7. 7. Manque de liens sémantiques entre les tags:
  8. 8. Une ontologie = une vue sur le monde
  9. 10. Limites des ontologies: -> coût d 'acquisition -> intégrer toute l'expertise de la communauté -> goulet d' étranglement à la formalisation
  10. 11. Scenario Ademe -> ingénieurs experts : distribués -> gestion documentaire : centralisée Comment structurer folksonomie contrôlée en capturant un maximum de l’expertise ?
  11. 12. Scenario Ademe Comment tirer partie de l’activité ? -> documentalistes : structuration concertée d’une liste d’autorité -> Ingé-experts : navigation dans la base documentaire
  12. 13. 2. Notre approche
  13. 14. Exploiter : -> dynamique et simplicité du social tagging  -> traitements automatiques sur les tags -> expertises des utilisateurs
  14. 15. En proposant: -> modèle supportant les divergences   -> cycle de vie s’appuyant sur une analyse des usages -> interfaces ergonomiques pour faciliter la contribution
  15. 16. car pollution skos:related 2.A Supporter les divergences
  16. 17. car pollution skos:related 2.A Supporter les divergences John agrees
  17. 18. car pollution skos:related 2.A Supporter les divergences John agrees Paul disagrees
  18. 19. 2.A Supporter les divergences
  19. 20. 2.A Supporter les divergences
  20. 21. 2.A Supporter les divergences
  21. 22. 2.B Cycle de vie de la folksonomie structurée
  22. 23. 3. Combiner traitements auto & contributions des utilisateurs
  23. 24. -> Tags comme « candidats-concepts » -> lien tag-ressource de type « is about » Hypothèses et modèle de tagging
  24. 25. -> Evaluation des distances d’éditions* -> Variations orthographique: pollution <-> pollutions -> Hyponymes : pollution <-> pollution des sols -> Termes associés : pollution <-> détection de polluants * http://sourceforge.net/projects/simmetrics/ 3.A analyse des labels de tags
  25. 26. 3.A analyse des labels de tags <ul><li>-> Jeu de test Ademe </li></ul><ul><li>1 ensemble / type de relation </li></ul><ul><li>2 types de métriques simples + combinées </li></ul>
  26. 27. Cas <ul><li>Détecter related </li></ul><ul><li>MongeElkan_Soundex </li></ul><ul><li>seuil 0.8 / rappel > 0.5 </li></ul>
  27. 28. Cas <ul><li>Distinguer spelling variant </li></ul><ul><li>Jaro-Winkler </li></ul><ul><li>seuil > 0.9 </li></ul>
  28. 29. Cas <ul><li>Distinguer hyponymes </li></ul><ul><li>MongeElkan-QGram </li></ul><ul><li>différence entre d(t1,t2) et d(t2,t1) > 0.39 </li></ul>
  29. 30. Cas <ul><li>Méthode heuristique </li></ul><ul><li>confirme intuitions </li></ul><ul><li>Nécessité d’autres méthodes </li></ul>
  30. 31. 3.B analyse de la structure des folksonomies
  31. 32. <ul><li>-> Calcul de la similarité entre tags (Mika, 2005; Cattuto et al., 2008) </li></ul><ul><li>-> Différents contextes d’associations </li></ul><ul><ul><ul><ul><ul><li>ressources </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>utilisateurs </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>taggings </li></ul></ul></ul></ul></ul>3.B analyse de la structure des folksonomies
  32. 33. tags tags 3.B analyse de la structure des folksonomies tag1 tag2 tag3 tag1 freq cooc cooc tag2 cooc freq cooc tag3 cooc cooc freq
  33. 34. (données delicious.com) 3.B analyse de la structure des folksonomies Tag &quot;Most related&quot; tags environnement développement_durable, énergie environment france, green, ecology, sustainable, energy déchets administration, EEDD, renouvelable développementdurable ecologie , EEDD, france, climat ,imported
  34. 35. Calcul automatiques 3.C Contribution des utilisateurs
  35. 36. Interface d’édition (SRTags Editor) 3.C Contribution des utilisateurs
  36. 37. 3.C Contribution des utilisateurs
  37. 38. 3.C Contribution des utilisateurs
  38. 39. 3.D Détection de conflits et vue consensuelle
  39. 40. 3.D Détection de conflits et vue consensuelle
  40. 41. 3.D Détection de conflits et vue consensuelle
  41. 42. 3.E Combinaison des points de vue <ul><li>Point de vue « consensuel » du ReferentUser </li></ul><ul><li>Sans conflits </li></ul><ul><li>Utilisé par documentalistes pour </li></ul><ul><li>maintenir un thésaurus </li></ul>
  42. 43. 3.E Combinaison des points de vue <ul><li>Points de vue individuels: </li></ul><ul><li>Coexistent même si divergents </li></ul><ul><li>Aide à former un point de vue consensuel </li></ul>
  43. 44. 3.E Combinaison des points de vue <ul><li>Règles de priorité pour une navigation cohérente: </li></ul><ul><li>Utilisateur courant </li></ul><ul><li>ReferentUser </li></ul><ul><li>ConflictSolver </li></ul><ul><li>Autre utilisateur </li></ul><ul><li>Automate </li></ul>
  44. 45. 4. Conclusion
  45. 46. Nos contributions : -> Système socio-technique ancré dans les usages -> Modèle supportant les points de vue divergents (SRTag) -> Complémentarité des traitements automatiques (labels + structure) -> Combinaison des traitements auto + contribution des utilisateurs -> Coexistence des points de vue + élaboration d’un point de vue consensuel
  46. 47. Travaux en cours et futurs -> Amorçage : intégration ressources terminologiques (docs, ontologies, thesaurus, etc.) -> Services &quot;sémantiques«  pour l’exploitation des données de tagging et de structuration sémantiques -> ISICIL : Evaluation & Tests Ademe & Orange Labs
  47. 48. fin. [email_address]
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×