Approche collaborative et assistée à l'enrichissement des folksonomies: entre ergonomie et algorithmie DICEN – Séminaire t...
Objectifs ->  Ancrage dans un contexte d’usage ->  Synergie entre automatisme et contribution des utilisateurs
1. problématique
limites  des  folksonomies
Variation d'écriture  des tags: newyork = new_york  ademe = ADEME musique = music
Ambiguité  des tags: RDF  =?  Ressource Description Framework  RDF  =?  Rwanda Defense Force  RDF =? Reality Distortion Fi...
Manque  de   liens  sémantiques  entre les tags:
Une  ontologie  = une  vue  sur le monde
 
Limites  des ontologies: ->  coût  d 'acquisition ->  intégrer  toute l'expertise  de  la  communauté ->  goulet d' étrang...
Scenario Ademe ->   ingénieurs experts : distribués ->   gestion documentaire : centralisée Comment structurer folksonomie...
Scenario Ademe Comment tirer partie de l’activité ? ->   documentalistes :  structuration concertée d’une liste d’autorité...
2. Notre approche
Exploiter  : ->  dynamique et simplicité  du  social tagging  ->  traitements automatiques  sur les tags ->  expertises  d...
En proposant: ->  modèle supportant les divergences   ->  cycle de vie s’appuyant sur  une analyse des usages  ->  interfa...
car pollution skos:related 2.A Supporter les divergences
car pollution skos:related 2.A Supporter les divergences John agrees
car pollution skos:related 2.A Supporter les divergences John agrees Paul disagrees
2.A Supporter les divergences
2.A Supporter les divergences
2.A Supporter les divergences
2.B Cycle de vie  de la folksonomie structurée
3. Combiner traitements auto & contributions des utilisateurs
->   Tags comme  « candidats-concepts » ->  lien tag-ressource de type « is about » Hypothèses et modèle de tagging
->  Evaluation des distances d’éditions* ->   Variations orthographique:  pollution  <-> pollutions ->   Hyponymes :  poll...
3.A analyse des labels de tags <ul><li>->  Jeu de test Ademe </li></ul><ul><li>1 ensemble / type de relation  </li></ul><u...
Cas  <ul><li>Détecter related </li></ul><ul><li>MongeElkan_Soundex </li></ul><ul><li>seuil 0.8 / rappel > 0.5 </li></ul>
Cas  <ul><li>Distinguer spelling variant </li></ul><ul><li>Jaro-Winkler </li></ul><ul><li>seuil > 0.9 </li></ul>
Cas  <ul><li>Distinguer hyponymes </li></ul><ul><li>MongeElkan-QGram  </li></ul><ul><li>différence entre d(t1,t2) et d(t2,...
Cas  <ul><li>Méthode heuristique </li></ul><ul><li>confirme intuitions </li></ul><ul><li>Nécessité d’autres méthodes </li>...
3.B analyse de la structure des folksonomies
<ul><li>->   Calcul de la similarité entre tags  (Mika, 2005; Cattuto et al., 2008) </li></ul><ul><li>->   Différents cont...
tags tags 3.B analyse de la structure des folksonomies tag1 tag2 tag3 tag1 freq cooc cooc tag2 cooc freq cooc tag3 cooc co...
(données delicious.com) 3.B analyse de la structure des folksonomies Tag &quot;Most related&quot; tags environnement dével...
Calcul  automatiques 3.C Contribution des utilisateurs
Interface d’édition (SRTags Editor) 3.C Contribution des utilisateurs
3.C Contribution des utilisateurs
3.C Contribution des utilisateurs
3.D Détection de conflits et vue consensuelle
3.D Détection de conflits et vue consensuelle
3.D Détection de conflits et vue consensuelle
3.E Combinaison des points de vue <ul><li>Point de vue « consensuel » du ReferentUser </li></ul><ul><li>Sans conflits </li...
3.E Combinaison des points de vue <ul><li>Points de vue individuels: </li></ul><ul><li>Coexistent même si divergents </li>...
3.E Combinaison des points de vue <ul><li>Règles de priorité pour une navigation cohérente: </li></ul><ul><li>Utilisateur ...
4. Conclusion
Nos contributions : ->  Système socio-technique ancré dans les usages ->   Modèle supportant les points de vue divergents ...
Travaux en cours et futurs ->   Amorçage : intégration ressources  terminologiques (docs, ontologies, thesaurus, etc.)  ->...
fin. [email_address]
Upcoming SlideShare
Loading in...5
×

Dicen Tagging Mars2010

584

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
584
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
9
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Dicen Tagging Mars2010

  1. 1. Approche collaborative et assistée à l'enrichissement des folksonomies: entre ergonomie et algorithmie DICEN – Séminaire tagging & folksonomies – 26 mars 2010 Freddy Limpens, Edelweiss, INRIA Sophia-Antipolis [email_address] Edelweiss
  2. 2. Objectifs -> Ancrage dans un contexte d’usage -> Synergie entre automatisme et contribution des utilisateurs
  3. 3. 1. problématique
  4. 4. limites des folksonomies
  5. 5. Variation d'écriture des tags: newyork = new_york ademe = ADEME musique = music
  6. 6. Ambiguité des tags: RDF =? Ressource Description Framework RDF =? Rwanda Defense Force RDF =? Reality Distortion Field
  7. 7. Manque de liens sémantiques entre les tags:
  8. 8. Une ontologie = une vue sur le monde
  9. 10. Limites des ontologies: -> coût d 'acquisition -> intégrer toute l'expertise de la communauté -> goulet d' étranglement à la formalisation
  10. 11. Scenario Ademe -> ingénieurs experts : distribués -> gestion documentaire : centralisée Comment structurer folksonomie contrôlée en capturant un maximum de l’expertise ?
  11. 12. Scenario Ademe Comment tirer partie de l’activité ? -> documentalistes : structuration concertée d’une liste d’autorité -> Ingé-experts : navigation dans la base documentaire
  12. 13. 2. Notre approche
  13. 14. Exploiter : -> dynamique et simplicité du social tagging  -> traitements automatiques sur les tags -> expertises des utilisateurs
  14. 15. En proposant: -> modèle supportant les divergences   -> cycle de vie s’appuyant sur une analyse des usages -> interfaces ergonomiques pour faciliter la contribution
  15. 16. car pollution skos:related 2.A Supporter les divergences
  16. 17. car pollution skos:related 2.A Supporter les divergences John agrees
  17. 18. car pollution skos:related 2.A Supporter les divergences John agrees Paul disagrees
  18. 19. 2.A Supporter les divergences
  19. 20. 2.A Supporter les divergences
  20. 21. 2.A Supporter les divergences
  21. 22. 2.B Cycle de vie de la folksonomie structurée
  22. 23. 3. Combiner traitements auto & contributions des utilisateurs
  23. 24. -> Tags comme « candidats-concepts » -> lien tag-ressource de type « is about » Hypothèses et modèle de tagging
  24. 25. -> Evaluation des distances d’éditions* -> Variations orthographique: pollution <-> pollutions -> Hyponymes : pollution <-> pollution des sols -> Termes associés : pollution <-> détection de polluants * http://sourceforge.net/projects/simmetrics/ 3.A analyse des labels de tags
  25. 26. 3.A analyse des labels de tags <ul><li>-> Jeu de test Ademe </li></ul><ul><li>1 ensemble / type de relation </li></ul><ul><li>2 types de métriques simples + combinées </li></ul>
  26. 27. Cas <ul><li>Détecter related </li></ul><ul><li>MongeElkan_Soundex </li></ul><ul><li>seuil 0.8 / rappel > 0.5 </li></ul>
  27. 28. Cas <ul><li>Distinguer spelling variant </li></ul><ul><li>Jaro-Winkler </li></ul><ul><li>seuil > 0.9 </li></ul>
  28. 29. Cas <ul><li>Distinguer hyponymes </li></ul><ul><li>MongeElkan-QGram </li></ul><ul><li>différence entre d(t1,t2) et d(t2,t1) > 0.39 </li></ul>
  29. 30. Cas <ul><li>Méthode heuristique </li></ul><ul><li>confirme intuitions </li></ul><ul><li>Nécessité d’autres méthodes </li></ul>
  30. 31. 3.B analyse de la structure des folksonomies
  31. 32. <ul><li>-> Calcul de la similarité entre tags (Mika, 2005; Cattuto et al., 2008) </li></ul><ul><li>-> Différents contextes d’associations </li></ul><ul><ul><ul><ul><ul><li>ressources </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>utilisateurs </li></ul></ul></ul></ul></ul><ul><ul><ul><ul><ul><li>taggings </li></ul></ul></ul></ul></ul>3.B analyse de la structure des folksonomies
  32. 33. tags tags 3.B analyse de la structure des folksonomies tag1 tag2 tag3 tag1 freq cooc cooc tag2 cooc freq cooc tag3 cooc cooc freq
  33. 34. (données delicious.com) 3.B analyse de la structure des folksonomies Tag &quot;Most related&quot; tags environnement développement_durable, énergie environment france, green, ecology, sustainable, energy déchets administration, EEDD, renouvelable développementdurable ecologie , EEDD, france, climat ,imported
  34. 35. Calcul automatiques 3.C Contribution des utilisateurs
  35. 36. Interface d’édition (SRTags Editor) 3.C Contribution des utilisateurs
  36. 37. 3.C Contribution des utilisateurs
  37. 38. 3.C Contribution des utilisateurs
  38. 39. 3.D Détection de conflits et vue consensuelle
  39. 40. 3.D Détection de conflits et vue consensuelle
  40. 41. 3.D Détection de conflits et vue consensuelle
  41. 42. 3.E Combinaison des points de vue <ul><li>Point de vue « consensuel » du ReferentUser </li></ul><ul><li>Sans conflits </li></ul><ul><li>Utilisé par documentalistes pour </li></ul><ul><li>maintenir un thésaurus </li></ul>
  42. 43. 3.E Combinaison des points de vue <ul><li>Points de vue individuels: </li></ul><ul><li>Coexistent même si divergents </li></ul><ul><li>Aide à former un point de vue consensuel </li></ul>
  43. 44. 3.E Combinaison des points de vue <ul><li>Règles de priorité pour une navigation cohérente: </li></ul><ul><li>Utilisateur courant </li></ul><ul><li>ReferentUser </li></ul><ul><li>ConflictSolver </li></ul><ul><li>Autre utilisateur </li></ul><ul><li>Automate </li></ul>
  44. 45. 4. Conclusion
  45. 46. Nos contributions : -> Système socio-technique ancré dans les usages -> Modèle supportant les points de vue divergents (SRTag) -> Complémentarité des traitements automatiques (labels + structure) -> Combinaison des traitements auto + contribution des utilisateurs -> Coexistence des points de vue + élaboration d’un point de vue consensuel
  46. 47. Travaux en cours et futurs -> Amorçage : intégration ressources terminologiques (docs, ontologies, thesaurus, etc.) -> Services &quot;sémantiques«  pour l’exploitation des données de tagging et de structuration sémantiques -> ISICIL : Evaluation & Tests Ademe & Orange Labs
  47. 48. fin. [email_address]
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×