An Exploratory Study on Using Social Information Networks for Flexible Litera...
Un modèle de recherche d’information sociale dans les microblogs : cas de Twitter
1. Un modèle de recherche d’information sociale
dans les microblogs : cas de Twitter
Lamjed Ben Jabeur, Lynda Tamine et Mohand Boughanem
IRIT, Université Paul Sabatier
1
2. Plan
Un Modèle de Recherche d’information Sociale dans les Microblogs
1. Les services de Microblogage
2. Recherche des tweets : la RI dans les
microblogs
3. Un modèle Social pour la Recherche des
Tweets
4. Evaluation expérimentale
5. Conclusion
2
3. 1.
Les Services de Microblogage
“
Un service de microblogage est à la fois un moyen de communication et un
système de collaboration qui permet le partage et la diffusion des messages
textuels. Il permet aux utilisateurs de communiquer des informations sur
”
leurs statuts, activités, pensées et opinions [Java et al.2009].
• Articles des microblogs
Courts En temps réel Dispositif mobile Point de vue personnel
• Objectifs
– diffusion de l’information
– communication
– Collaboration
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 3
4. 1.
Le Service de Microblogage
1
““
Tilda1980 16 Mai 2010
2
“
La famille Smith a un nouveau-né! France24 18 May 2010
La marée noire se dirige vers la Floride
“
3
Twitter API 30 Juin 2010
Nouvelle version de Twitter API
“
4
Kacunq 20 Mars 2010
5 Très triste :’(
“
Tim2812 14 Mars 2010
La Lune est l'unique satellite naturel de la Terre
6
“ “
Tilda1980 13 Janvier 2010 7
Tilda1980 4 Juillet 2010
Quand on veut, on peut Mes nouvelles photos sur flickr http://...
“
8
MythInBlack 17 Avril 2010
“
@SpirDev Firefox ne le supporte pas 9
Tilda1980 7 Mars 2010
Problème de mémoire avec la JVM!
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 4
5. 1.1 Le Service de Microblogage
Twitter : Caractéristiques et utilisations
• Spécificités du réseau:
– Principe d’abonnement
1 milliards tweets par semaine
– Cibler une audience
+3 ans 1ier milliards de tweets
– Rediffuser un message
• Bloggeurs 50 millions tweets par jour
– Medias et Journaux 177 million twets en mars 2011
– Célébrités et Politiciens
+106 millions utilisateurs
– Entreprises et Organisations
– Sites Web et Communautés 460 milles inscrits par jour
– Particuliers et Professionnels
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 5
6. 1.2 Le Service de Microblogage
Twitter : Caractéristiques et utilisations
1
“
CORIA11 16 mars 2010
Début de la conférence #CORIA11
2
“
CORIA11 16 mars 2010
CORIA 2011 : Université d'Avignon #CORIA11 http://yfrog.com/h3y
“
3
CORIA11 16 mars 2010
Un modèle de RI agrégée #Agrégation par @Kopliku @karenatw @MohBoughanem
“
4 5
“
MohBoughanem 17 Mars 2010 MohBoughanem CORIA11 17 Mars 2010
bien visualisé, vite trouvé bien visualisé, vite trouvé
6
“
CORIA11 17 mars 2010
@ MohBoughanem Dans le même style : mieux décrire pour mieux interpréter ;)
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 6
8. 2
Recherche des tweets : la RI dans les microblogs
• Informations générées par les microblogs
– Flux soutenu des publications
– Enorme quantité de données
– Diverses sources d’information
Un accès difficile aux dernières actualités et aux sujets favoris
• Les tâches de la RI dans les microblogs
– Recherche des personnes
– Suggestion d’abonnements
– Extraction des tendances
– La recherche des opinions
– La recherche de tweets
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 8
9. 2.1 Recherche des tweets : la RI dans les microblogs
Recherche des tweets
“
La recherche des tweets est une tâche de recherche d’information
ad-hoc dont l’objectif est de sélectionner les articles des microblogs
pertinents en réponse à une requête Q [Ounis et al.2010].
• Rechercher de tweets
– Obtenir une information crédible et précise
– Suivre les dernières actualités en temps réel
– Assister aux événements à travers des témoins.
– Collecter les diverse de point de vue sur un sujet actuel
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 9
10. 2.1 Recherche des tweets : la RI dans les microblogs
Recherche des tweets
• Problématiques liées à la recherche des tweets:
– Indexation de flux
– Style d’écriture et spammes
– Information redondante
– Qualité des microbloggeurs
• Facteurs de la pertinence de tweets
– Similarité textuelle
– Le contexte de microblogage
– Qualité des microbloggeurs
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 10
11. 2.2 Recherche des tweets : la RI dans les microblogs
Travaux sur RI dans les microblogs
• Accéder aux microblogs
– Intégration des caractéristiques des tweets
• URLS, hashtags, liens [Duan & al, 2010]
– Intégration du contexte temporal (géographique)
• [Sankaranarayanan & al, 2009] {Grinev & al,2009]
– Intégration du réseau social
• [Nagmoti & al, 2010]
• Importance des microbloggeurs
– Expertise au sujet de la requête
• [Balog et al 2009], [Zhang et al.2007] et [Noll et al.2009]
– Influence dans le réseau social
• [Kwak et al.2010], [Agarwal et al.2008] et [Weng et al.2010]
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 11
12. 3.
Un modèle Sociale pour la recherche des tweets
• Combiner les facteurs de pertinence sociale
– La pertinence thématique
– L’importance social des tweets
• Estimer l’importance des microbloggeurs
– Influence sur le réseau social
– Expertise au sujet de la requête
• Modéliser le réseau social des microbloggeurs
– Réseau social de rediffusion
– Pondérer les relations
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 12
13. 3.1 Un modèle Sociale pour la recherche des tweets
Le réseau social de l’influence
• Rediffusion d’un article
– Un message important
– Une information crédible et précise
– Une opinion partagée
La rediffusion d’un article indique l’importance de son bloggeur
• Réseau social de l’influence
– Les microbloggeurs
– Relations d’influence
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 13
14. 3.1 Un modèle Sociale pour la recherche des tweets
Le réseau social de l’influence
nb tweets publiés par uj et rediffusés par ui
nb tweets rediffusés par ui
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 14
15. 3.2 Un modèle Sociale pour la recherche des tweets
Estimation de la pertinence des tweets
• Combinaison linéaire
– Pertinence thématique
– L’importance sociale du microbloggeur
Requête Normalisation
Tweet
Réseau social
Microbloggeur
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 15
16. 3.3 Un modèle Sociale pour la recherche des tweets
Importance Sociale du microbloggeur
• Importance Sociale du microbloggeur
– Position dans le réseau social
– Affiliation au sujet de la requêtes
• Microbloggeurs influents & experts
– Influence locale dans le sous-réseau des experts
– Eviter la dominance de certaines influences globales
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 16
17. 3.3 Un modèle Sociale pour la recherche des tweets
Importance Sociale du microbloggeur
• Influence sociale
– PageRank pondéré appliqué le réseau d’influence sociale
– Microbloggeur autoritaire dans le réseau d’influence
• Expertise de microbloggeur
– Représenter un Microbloggeur par l’ensemble de son blog
– Un modèle de langue pour trier les blogs
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 17
18. 4
Evaluation expérimentale
• Objectifs de l’évaluation
1. Comparer les facteurs d’importance sociale
• Influence Sociale
• Expertise du microbloggeur
2. Etudier l’impact de la combinaison
• Score thématique
• Score social
• Cadre d’évaluation
– Absence d’un cadre standard pour l’évaluation de RI dans
les microblogs
– Collecter des tweets et monter un cadre expérimentale
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 18
19. 4.1 Evaluation expérimentale
Cadre d’évaluation
1. Microbloggeurs
– Annuaire des microbloggeur WeFollow
– Catégorie « Technologies d’Internet »
– Compte actifs et accessibles au public
– 2384 bloggeurs
2. Microblogs
– 100 derniers tweets de chaque microbloggeur (Twitter API)
– 237497 tweets
3. Requêtes
– 5 utilisateurs
– 25 requêtes (actualités technologiques)
– Jugement des 100 articles retourné par modèle thématique
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 19
22. 4.3 Le Service de Microblogage
Evaluation de l’efficacité du module
Thématique Influence Expertise Influence & Expertise
0.3286
0.3186
0.3143
0.3027
MAP
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 22
23. 4.3 Le Service de Microblogage
Evaluation de l’efficacité du module
Ex. BM Inf. Exp. Inf. & Exp. BM25 VSM BM (Temps)
0.4465
0.3027 0.3143 0.3186 0.3286
0.0673
0.013
MAP
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 23
24. 5.
Conclusion
• Modèle social pour la recherche des tweets
– Intégrer la pertinence thématique et sociale
– Combinaison de l’influence et de l’expertise
– Réseau social de rediffusion
• Expérimentation sur une collection des tweets
– Amélioration du modèle « Influence & Expertise »
• Perspectives
– TREC Microblogs 2011
– Comparer le modèles avec d’autres modèles de recherche
des tweets.
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 24
25. Un modèle de recherche d’information sociale
dans les microblogs : cas de Twitter
Meri pour votre attention !
25