SlideShare a Scribd company logo
1 of 25
Un modèle de recherche d’information sociale
dans les microblogs : cas de Twitter

Lamjed Ben Jabeur, Lynda Tamine et Mohand Boughanem
IRIT, Université Paul Sabatier




                                                      1
Plan
Un Modèle de Recherche d’information Sociale dans les Microblogs


1. Les services de Microblogage
2. Recherche des tweets : la RI dans les
   microblogs
3. Un modèle Social pour la Recherche des
   Tweets
4. Evaluation expérimentale
5. Conclusion



                                                                   2
1.
 Les Services de Microblogage


   “
        Un service de microblogage est à la fois un moyen de communication et un
        système de collaboration qui permet le partage et la diffusion des messages
        textuels. Il permet aux utilisateurs de communiquer des informations sur


                                                                                    ”
        leurs statuts, activités, pensées et opinions [Java et al.2009].



  • Articles des microblogs
       Courts           En temps réel            Dispositif mobile            Point de vue personnel

  • Objectifs
        – diffusion de l’information
        – communication
        – Collaboration

Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion           3
1.
  Le Service de Microblogage
                                                      1

““
   Tilda1980 16 Mai 2010
                                                                                                           2


                                                            “
La famille Smith a un nouveau-né!                                France24 18 May 2010
                                                            La marée noire se dirige vers la Floride


“
                                                 3
   Twitter API 30 Juin 2010
Nouvelle version de Twitter API


                                                                              “
                                                                                                           4
                                                                                     Kacunq 20 Mars 2010
                                                                        5     Très triste :’(


“
   Tim2812 14 Mars 2010
La Lune est l'unique satellite naturel de la Terre

                                             6

“                                                    “
    Tilda1980 13 Janvier 2010                                                                              7
                                                          Tilda1980 4 Juillet 2010
 Quand on veut, on peut                              Mes nouvelles photos sur flickr http://...




“
                                                      8
   MythInBlack     17 Avril 2010




                                                             “
@SpirDev Firefox ne le supporte pas                                                                            9
                                                                  Tilda1980          7 Mars 2010
                                                              Problème de mémoire avec la JVM!


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion               4
1.1        Le Service de Microblogage
 Twitter : Caractéristiques et utilisations
  • Spécificités du réseau:
        – Principe d’abonnement
                                                                  1 milliards      tweets par semaine
        – Cibler une audience
                                                                       +3 ans      1ier milliards de tweets
        – Rediffuser un message
  • Bloggeurs                                                      50 millions tweets par jour

        –   Medias et Journaux                                      177 million twets en mars 2011
        –   Célébrités et Politiciens
                                                                +106 millions utilisateurs
        –   Entreprises et Organisations
        –   Sites Web et Communautés                               460 milles inscrits par jour
        –   Particuliers et Professionnels


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion                  5
1.2       Le Service de Microblogage
 Twitter : Caractéristiques et utilisations
                                                                                           1


                                       “
                                           CORIA11 16 mars 2010
                                       Début de la conférence #CORIA11

                                                                                                       2

           “
                CORIA11 16 mars 2010
            CORIA 2011 : Université d'Avignon #CORIA11 http://yfrog.com/h3y




“
                                                                                                                   3
   CORIA11 16 mars 2010
Un modèle de RI agrégée #Agrégation par @Kopliku @karenatw @MohBoughanem




“
                                            4                                                                  5

                                                      “
    MohBoughanem 17 Mars 2010                              MohBoughanem         CORIA11 17 Mars 2010
bien visualisé, vite trouvé                            bien visualisé, vite trouvé

                                                                                                           6

“
    CORIA11 17 mars 2010
@ MohBoughanem Dans le même style : mieux décrire pour mieux interpréter ;)


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion                   6
1.2       Le Service de Microblogage
 Le réseau d’information sociale de Twitter




                                                                                               2011© Jabeur et al.
Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion                         7
2
 Recherche des tweets : la RI dans les microblogs
  • Informations générées par les microblogs
        – Flux soutenu des publications
        – Enorme quantité de données
        – Diverses sources d’information

     Un accès difficile aux dernières actualités et aux sujets favoris

  • Les tâches de la RI dans les microblogs
        –   Recherche des personnes
        –   Suggestion d’abonnements
        –   Extraction des tendances
        –   La recherche des opinions
        –   La recherche de tweets


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   8
2.1        Recherche des tweets : la RI dans les microblogs
 Recherche des tweets



   “
        La recherche des tweets est une tâche de recherche d’information
        ad-hoc dont l’objectif est de sélectionner les articles des microblogs
        pertinents en réponse à une requête Q [Ounis et al.2010].



  • Rechercher de tweets
        –   Obtenir une information crédible et précise
        –   Suivre les dernières actualités en temps réel
        –   Assister aux événements à travers des témoins.
        –   Collecter les diverse de point de vue sur un sujet actuel



Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   9
2.1        Recherche des tweets : la RI dans les microblogs
 Recherche des tweets
  • Problématiques liées à la recherche des tweets:
        –   Indexation de flux
        –   Style d’écriture et spammes
        –   Information redondante
        –   Qualité des microbloggeurs



  • Facteurs de la pertinence de tweets
        – Similarité textuelle
        – Le contexte de microblogage
        – Qualité des microbloggeurs


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   10
2.2       Recherche des tweets : la RI dans les microblogs
 Travaux sur RI dans les microblogs
  • Accéder aux microblogs
        – Intégration des caractéristiques des tweets
              • URLS, hashtags, liens [Duan & al, 2010]
        – Intégration du contexte temporal (géographique)
              • [Sankaranarayanan & al, 2009] {Grinev & al,2009]
        – Intégration du réseau social
              • [Nagmoti & al, 2010]
  • Importance des microbloggeurs
        – Expertise au sujet de la requête
              • [Balog et al 2009], [Zhang et al.2007] et [Noll et al.2009]
        – Influence dans le réseau social
              • [Kwak et al.2010], [Agarwal et al.2008] et [Weng et al.2010]


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   11
3.
 Un modèle Sociale pour la recherche des tweets
  • Combiner les facteurs de pertinence sociale
        – La pertinence thématique
        – L’importance social des tweets
  • Estimer l’importance des microbloggeurs
        – Influence sur le réseau social
        – Expertise au sujet de la requête
  • Modéliser le réseau social des microbloggeurs
        – Réseau social de rediffusion
        – Pondérer les relations



Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   12
3.1       Un modèle Sociale pour la recherche des tweets
 Le réseau social de l’influence
  • Rediffusion d’un article
        – Un message important
        – Une information crédible et précise
        – Une opinion partagée

      La rediffusion d’un article indique l’importance de son bloggeur


  • Réseau social de l’influence
        – Les microbloggeurs
        – Relations d’influence

Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   13
3.1       Un modèle Sociale pour la recherche des tweets
 Le réseau social de l’influence




                                                                 nb tweets publiés par uj et rediffusés par ui
                                                                        nb tweets rediffusés par ui




Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion                     14
3.2       Un modèle Sociale pour la recherche des tweets
 Estimation de la pertinence des tweets
  • Combinaison linéaire
        – Pertinence thématique
        – L’importance sociale du microbloggeur




        Requête                                                   Normalisation
        Tweet
        Réseau social
        Microbloggeur



Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   15
3.3       Un modèle Sociale pour la recherche des tweets
 Importance Sociale du microbloggeur




  • Importance Sociale du microbloggeur
        – Position dans le réseau social
        – Affiliation au sujet de la requêtes
  • Microbloggeurs influents & experts
        – Influence locale dans le sous-réseau des experts
        – Eviter la dominance de certaines influences globales



Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   16
3.3       Un modèle Sociale pour la recherche des tweets
 Importance Sociale du microbloggeur
  • Influence sociale
        – PageRank pondéré appliqué le réseau d’influence sociale
        – Microbloggeur autoritaire dans le réseau d’influence




  • Expertise de microbloggeur
        – Représenter un Microbloggeur par l’ensemble de son blog
        – Un modèle de langue pour trier les blogs




Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   17
4
 Evaluation expérimentale
  • Objectifs de l’évaluation
        1. Comparer les facteurs d’importance sociale
              • Influence Sociale
              • Expertise du microbloggeur
        2. Etudier l’impact de la combinaison
              • Score thématique
              • Score social
  • Cadre d’évaluation
        – Absence d’un cadre standard pour l’évaluation de RI dans
          les microblogs
        – Collecter des tweets et monter un cadre expérimentale


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   18
4.1        Evaluation expérimentale
 Cadre d’évaluation
  1. Microbloggeurs
        –   Annuaire des microbloggeur WeFollow
        –   Catégorie « Technologies d’Internet »
        –   Compte actifs et accessibles au public
        –   2384 bloggeurs
  2. Microblogs
        – 100 derniers tweets de chaque microbloggeur (Twitter API)
        – 237497 tweets
  3. Requêtes
        – 5 utilisateurs
        – 25 requêtes (actualités technologiques)
        – Jugement des 100 articles retourné par modèle thématique

Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   19
4.2       Evaluation expérimentale
 Baselines
                                                             Ex. BM        BM25        VSM

                                                         0.3027
 NESTOR
 Microblogging Search Engine




                                                                               0.0673

                                                                    0.013


                                                                     MAP


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   20
4.2       Evaluation expérimentale
 Comparaison des facteurs de pertinence
                         Influence        Expertise         Influence & Expertise
                                                              0.0718

                                                 0.0613



                                    0.0389




                                                  MAP

Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   21
4.3       Le Service de Microblogage
 Evaluation de l’efficacité du module

                 Thématique           Influence        Expertise        Influence & Expertise

                                                                 0.3286


                                                     0.3186
                                         0.3143


                             0.3027




                                                MAP


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion    22
4.3       Le Service de Microblogage
 Evaluation de l’efficacité du module
             Ex. BM        Inf.     Exp.      Inf. & Exp.       BM25        VSM        BM (Temps)

                                                                                 0.4465



                      0.3027 0.3143 0.3186 0.3286




                                                                       0.0673
                                                              0.013

                                                     MAP

Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion        23
5.
 Conclusion
  • Modèle social pour la recherche des tweets
        – Intégrer la pertinence thématique et sociale
        – Combinaison de l’influence et de l’expertise
        – Réseau social de rediffusion
  • Expérimentation sur une collection des tweets
        – Amélioration du modèle « Influence & Expertise »
  • Perspectives
        – TREC Microblogs 2011
        – Comparer le modèles avec d’autres modèles de recherche
          des tweets.


Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion   24
Un modèle de recherche d’information sociale
dans les microblogs : cas de Twitter

  Meri pour votre attention !


                                               25

More Related Content

Viewers also liked

Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information Sociale
Ismail BADACHE
 
Strarsbourg recherche d'information medicale
Strarsbourg recherche d'information medicaleStrarsbourg recherche d'information medicale
Strarsbourg recherche d'information medicale
whatsnewdoc
 
Quels facteurs de pertinence pour la recherche de produits e-commerce ?
Quels facteurs de pertinence pour la recherche de produits e-commerce ?Quels facteurs de pertinence pour la recherche de produits e-commerce ?
Quels facteurs de pertinence pour la recherche de produits e-commerce ?
Lamjed Ben Jabeur
 
Soutenance de thèse valentin
Soutenance de thèse valentinSoutenance de thèse valentin
Soutenance de thèse valentin
Jérémie34
 

Viewers also liked (20)

Reseau social d'entreprise #RSE
Reseau social d'entreprise #RSEReseau social d'entreprise #RSE
Reseau social d'entreprise #RSE
 
MICROBLOGGING CONTENT PROPAGATION MODELING USING TOPIC-SPECIFIC BEHAVIORAL FA...
MICROBLOGGING CONTENT PROPAGATION MODELING USING TOPIC-SPECIFIC BEHAVIORAL FA...MICROBLOGGING CONTENT PROPAGATION MODELING USING TOPIC-SPECIFIC BEHAVIORAL FA...
MICROBLOGGING CONTENT PROPAGATION MODELING USING TOPIC-SPECIFIC BEHAVIORAL FA...
 
Poster Recherche d'Information Sociale
Poster Recherche d'Information SocialePoster Recherche d'Information Sociale
Poster Recherche d'Information Sociale
 
Diachronic Analysis of the Italian Language exploiting Google Ngram
Diachronic Analysis of the Italian Language exploiting Google NgramDiachronic Analysis of the Italian Language exploiting Google Ngram
Diachronic Analysis of the Italian Language exploiting Google Ngram
 
Rethinking Microblogging: Open Distributed Semantic
Rethinking Microblogging: Open Distributed SemanticRethinking Microblogging: Open Distributed Semantic
Rethinking Microblogging: Open Distributed Semantic
 
UNIBA: Exploiting a Distributional Semantic Model for Disambiguating and Link...
UNIBA: Exploiting a Distributional Semantic Model for Disambiguating and Link...UNIBA: Exploiting a Distributional Semantic Model for Disambiguating and Link...
UNIBA: Exploiting a Distributional Semantic Model for Disambiguating and Link...
 
Semantic Microblogging
Semantic MicrobloggingSemantic Microblogging
Semantic Microblogging
 
Master Minds on Data Science - Maarten de Rijke
Master Minds on Data Science - Maarten de RijkeMaster Minds on Data Science - Maarten de Rijke
Master Minds on Data Science - Maarten de Rijke
 
Social Life 2015 – Baromètre annuel des usages des réseaux sociaux en France
Social Life 2015 – Baromètre annuel des usages des réseaux sociaux en FranceSocial Life 2015 – Baromètre annuel des usages des réseaux sociaux en France
Social Life 2015 – Baromètre annuel des usages des réseaux sociaux en France
 
Strarsbourg recherche d'information medicale
Strarsbourg recherche d'information medicaleStrarsbourg recherche d'information medicale
Strarsbourg recherche d'information medicale
 
RSE : Réseaux Sociaux d'Entreprise, nouveaux outils collaboratifs
RSE : Réseaux Sociaux d'Entreprise, nouveaux outils collaboratifsRSE : Réseaux Sociaux d'Entreprise, nouveaux outils collaboratifs
RSE : Réseaux Sociaux d'Entreprise, nouveaux outils collaboratifs
 
Web-scale semantic search
Web-scale semantic searchWeb-scale semantic search
Web-scale semantic search
 
(Micro)Blog : un sujet de recherche actuel [08/02/2011]
(Micro)Blog : un sujet de recherche actuel [08/02/2011](Micro)Blog : un sujet de recherche actuel [08/02/2011]
(Micro)Blog : un sujet de recherche actuel [08/02/2011]
 
Barometre RegionsJob/Bringr : les conversations "emploi" sur les réseaux sociaux
Barometre RegionsJob/Bringr : les conversations "emploi" sur les réseaux sociauxBarometre RegionsJob/Bringr : les conversations "emploi" sur les réseaux sociaux
Barometre RegionsJob/Bringr : les conversations "emploi" sur les réseaux sociaux
 
Social Media Attitude 2013 : les comportements des Français sur les réseaux s...
Social Media Attitude 2013 : les comportements des Français sur les réseaux s...Social Media Attitude 2013 : les comportements des Français sur les réseaux s...
Social Media Attitude 2013 : les comportements des Français sur les réseaux s...
 
Avancement de mon doctorat (Damien Clauzel, janvier 2009)
Avancement de mon doctorat (Damien Clauzel, janvier 2009)Avancement de mon doctorat (Damien Clauzel, janvier 2009)
Avancement de mon doctorat (Damien Clauzel, janvier 2009)
 
Quels facteurs de pertinence pour la recherche de produits e-commerce ?
Quels facteurs de pertinence pour la recherche de produits e-commerce ?Quels facteurs de pertinence pour la recherche de produits e-commerce ?
Quels facteurs de pertinence pour la recherche de produits e-commerce ?
 
Moederpresentatie Cross Media Cafe - Uit het Lab
Moederpresentatie Cross Media Cafe - Uit het LabMoederpresentatie Cross Media Cafe - Uit het Lab
Moederpresentatie Cross Media Cafe - Uit het Lab
 
HUB REPORT Social Media : Quelles perspectives pour les Marques en 2015 ?
HUB REPORT Social Media : Quelles perspectives pour les Marques en 2015 ?HUB REPORT Social Media : Quelles perspectives pour les Marques en 2015 ?
HUB REPORT Social Media : Quelles perspectives pour les Marques en 2015 ?
 
Soutenance de thèse valentin
Soutenance de thèse valentinSoutenance de thèse valentin
Soutenance de thèse valentin
 

Similar to Un modèle de recherche d’information sociale dans les microblogs : cas de Twitter

Nouvelles perspectives de médiation par les réseaux sociaux : quelles évoluti...
Nouvelles perspectives de médiation par les réseaux sociaux : quelles évoluti...Nouvelles perspectives de médiation par les réseaux sociaux : quelles évoluti...
Nouvelles perspectives de médiation par les réseaux sociaux : quelles évoluti...
Vaissaire-Agard Clotilde
 
Istia Intervention 20102401
Istia Intervention 20102401Istia Intervention 20102401
Istia Intervention 20102401
cambdm
 
Bordeauxreseauxsociaux1 091103075039-phpapp02
Bordeauxreseauxsociaux1 091103075039-phpapp02Bordeauxreseauxsociaux1 091103075039-phpapp02
Bordeauxreseauxsociaux1 091103075039-phpapp02
Valérian Van Impe
 
La Ruche / Wiki-Rennes / Le Jardin des savoirs
La Ruche / Wiki-Rennes / Le Jardin des savoirs La Ruche / Wiki-Rennes / Le Jardin des savoirs
La Ruche / Wiki-Rennes / Le Jardin des savoirs
Régis Chatellier
 

Similar to Un modèle de recherche d’information sociale dans les microblogs : cas de Twitter (20)

Conférence web2 & réputation - IAE Aix
Conférence web2 & réputation - IAE AixConférence web2 & réputation - IAE Aix
Conférence web2 & réputation - IAE Aix
 
Culture des réseaux sociaux
Culture des réseaux sociauxCulture des réseaux sociaux
Culture des réseaux sociaux
 
Finance2
Finance2Finance2
Finance2
 
Utiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communicationUtiliser Twitter pour la veille et la communication
Utiliser Twitter pour la veille et la communication
 
Nouvelles perspectives de médiation par les réseaux sociaux : quelles évoluti...
Nouvelles perspectives de médiation par les réseaux sociaux : quelles évoluti...Nouvelles perspectives de médiation par les réseaux sociaux : quelles évoluti...
Nouvelles perspectives de médiation par les réseaux sociaux : quelles évoluti...
 
Istia Intervention 20102401
Istia Intervention 20102401Istia Intervention 20102401
Istia Intervention 20102401
 
Les Réseaux Sociaux
Les Réseaux SociauxLes Réseaux Sociaux
Les Réseaux Sociaux
 
Bordeauxreseauxsociaux1 091103075039-phpapp02
Bordeauxreseauxsociaux1 091103075039-phpapp02Bordeauxreseauxsociaux1 091103075039-phpapp02
Bordeauxreseauxsociaux1 091103075039-phpapp02
 
Actualités des réseaux sociaux : Panoramas et usages informationnels
Actualités des réseaux sociaux : Panoramas et usages informationnelsActualités des réseaux sociaux : Panoramas et usages informationnels
Actualités des réseaux sociaux : Panoramas et usages informationnels
 
Twitter: le phénomène (II)
Twitter: le phénomène (II)Twitter: le phénomène (II)
Twitter: le phénomène (II)
 
La Ruche / Wiki-Rennes / Le Jardin des savoirs
La Ruche / Wiki-Rennes / Le Jardin des savoirs La Ruche / Wiki-Rennes / Le Jardin des savoirs
La Ruche / Wiki-Rennes / Le Jardin des savoirs
 
La génération internet
La génération internetLa génération internet
La génération internet
 
Medias sociaux
Medias sociauxMedias sociaux
Medias sociaux
 
Réseaux sociaux - Association féminine d’éducation et d’action sociale
Réseaux sociaux - Association féminine d’éducation et d’action socialeRéseaux sociaux - Association féminine d’éducation et d’action sociale
Réseaux sociaux - Association féminine d’éducation et d’action sociale
 
Incubateur hec | acquérir du trafic et fidéliser son audience - utiliser les ...
Incubateur hec | acquérir du trafic et fidéliser son audience - utiliser les ...Incubateur hec | acquérir du trafic et fidéliser son audience - utiliser les ...
Incubateur hec | acquérir du trafic et fidéliser son audience - utiliser les ...
 
E-tourisme et web 2.0 par Influenza
E-tourisme et web 2.0 par InfluenzaE-tourisme et web 2.0 par Influenza
E-tourisme et web 2.0 par Influenza
 
s'informer au temps d'internet
s'informer au temps d'internets'informer au temps d'internet
s'informer au temps d'internet
 
Les 12 chiffres internet les plus époustouflants de l'année 2010
Les 12 chiffres internet les plus époustouflants de l'année 2010Les 12 chiffres internet les plus époustouflants de l'année 2010
Les 12 chiffres internet les plus époustouflants de l'année 2010
 
Panorama des réseaux sociaux en 2015
Panorama des réseaux sociaux en 2015 Panorama des réseaux sociaux en 2015
Panorama des réseaux sociaux en 2015
 
Communiquer avec les publics
Communiquer avec les publicsCommuniquer avec les publics
Communiquer avec les publics
 

More from Lamjed Ben Jabeur

Leveraging social relevance: Using social networks to enhance literature acce...
Leveraging social relevance: Using social networks to enhance literature acce...Leveraging social relevance: Using social networks to enhance literature acce...
Leveraging social relevance: Using social networks to enhance literature acce...
Lamjed Ben Jabeur
 

More from Lamjed Ben Jabeur (6)

Accès à l’information dans les réseaux sociaux : quelles formes de collaborat...
Accès à l’information dans les réseaux sociaux : quelles formes de collaborat...Accès à l’information dans les réseaux sociaux : quelles formes de collaborat...
Accès à l’information dans les réseaux sociaux : quelles formes de collaborat...
 
IRIT at clef 2015: A product search model for head queries
IRIT at clef 2015: A product search model for head queriesIRIT at clef 2015: A product search model for head queries
IRIT at clef 2015: A product search model for head queries
 
Challenges of managing Data Science Project
Challenges of managing Data Science ProjectChallenges of managing Data Science Project
Challenges of managing Data Science Project
 
Leveraging social relevance: Using social networks to enhance literature acce...
Leveraging social relevance: Using social networks to enhance literature acce...Leveraging social relevance: Using social networks to enhance literature acce...
Leveraging social relevance: Using social networks to enhance literature acce...
 
A social model for Literature Access: Towards a weighted social network of au...
A social model for Literature Access: Towards a weighted social network of au...A social model for Literature Access: Towards a weighted social network of au...
A social model for Literature Access: Towards a weighted social network of au...
 
An Exploratory Study on Using Social Information Networks for Flexible Litera...
An Exploratory Study on Using Social Information Networks for Flexible Litera...An Exploratory Study on Using Social Information Networks for Flexible Litera...
An Exploratory Study on Using Social Information Networks for Flexible Litera...
 

Un modèle de recherche d’information sociale dans les microblogs : cas de Twitter

  • 1. Un modèle de recherche d’information sociale dans les microblogs : cas de Twitter Lamjed Ben Jabeur, Lynda Tamine et Mohand Boughanem IRIT, Université Paul Sabatier 1
  • 2. Plan Un Modèle de Recherche d’information Sociale dans les Microblogs 1. Les services de Microblogage 2. Recherche des tweets : la RI dans les microblogs 3. Un modèle Social pour la Recherche des Tweets 4. Evaluation expérimentale 5. Conclusion 2
  • 3. 1. Les Services de Microblogage “ Un service de microblogage est à la fois un moyen de communication et un système de collaboration qui permet le partage et la diffusion des messages textuels. Il permet aux utilisateurs de communiquer des informations sur ” leurs statuts, activités, pensées et opinions [Java et al.2009]. • Articles des microblogs Courts En temps réel Dispositif mobile Point de vue personnel • Objectifs – diffusion de l’information – communication – Collaboration Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 3
  • 4. 1. Le Service de Microblogage 1 ““ Tilda1980 16 Mai 2010 2 “ La famille Smith a un nouveau-né! France24 18 May 2010 La marée noire se dirige vers la Floride “ 3 Twitter API 30 Juin 2010 Nouvelle version de Twitter API “ 4 Kacunq 20 Mars 2010 5 Très triste :’( “ Tim2812 14 Mars 2010 La Lune est l'unique satellite naturel de la Terre 6 “ “ Tilda1980 13 Janvier 2010 7 Tilda1980 4 Juillet 2010 Quand on veut, on peut Mes nouvelles photos sur flickr http://... “ 8 MythInBlack 17 Avril 2010 “ @SpirDev Firefox ne le supporte pas 9 Tilda1980 7 Mars 2010 Problème de mémoire avec la JVM! Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 4
  • 5. 1.1 Le Service de Microblogage Twitter : Caractéristiques et utilisations • Spécificités du réseau: – Principe d’abonnement 1 milliards tweets par semaine – Cibler une audience +3 ans 1ier milliards de tweets – Rediffuser un message • Bloggeurs 50 millions tweets par jour – Medias et Journaux 177 million twets en mars 2011 – Célébrités et Politiciens +106 millions utilisateurs – Entreprises et Organisations – Sites Web et Communautés 460 milles inscrits par jour – Particuliers et Professionnels Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 5
  • 6. 1.2 Le Service de Microblogage Twitter : Caractéristiques et utilisations 1 “ CORIA11 16 mars 2010 Début de la conférence #CORIA11 2 “ CORIA11 16 mars 2010 CORIA 2011 : Université d'Avignon #CORIA11 http://yfrog.com/h3y “ 3 CORIA11 16 mars 2010 Un modèle de RI agrégée #Agrégation par @Kopliku @karenatw @MohBoughanem “ 4 5 “ MohBoughanem 17 Mars 2010 MohBoughanem CORIA11 17 Mars 2010 bien visualisé, vite trouvé bien visualisé, vite trouvé 6 “ CORIA11 17 mars 2010 @ MohBoughanem Dans le même style : mieux décrire pour mieux interpréter ;) Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 6
  • 7. 1.2 Le Service de Microblogage Le réseau d’information sociale de Twitter 2011© Jabeur et al. Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 7
  • 8. 2 Recherche des tweets : la RI dans les microblogs • Informations générées par les microblogs – Flux soutenu des publications – Enorme quantité de données – Diverses sources d’information Un accès difficile aux dernières actualités et aux sujets favoris • Les tâches de la RI dans les microblogs – Recherche des personnes – Suggestion d’abonnements – Extraction des tendances – La recherche des opinions – La recherche de tweets Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 8
  • 9. 2.1 Recherche des tweets : la RI dans les microblogs Recherche des tweets “ La recherche des tweets est une tâche de recherche d’information ad-hoc dont l’objectif est de sélectionner les articles des microblogs pertinents en réponse à une requête Q [Ounis et al.2010]. • Rechercher de tweets – Obtenir une information crédible et précise – Suivre les dernières actualités en temps réel – Assister aux événements à travers des témoins. – Collecter les diverse de point de vue sur un sujet actuel Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 9
  • 10. 2.1 Recherche des tweets : la RI dans les microblogs Recherche des tweets • Problématiques liées à la recherche des tweets: – Indexation de flux – Style d’écriture et spammes – Information redondante – Qualité des microbloggeurs • Facteurs de la pertinence de tweets – Similarité textuelle – Le contexte de microblogage – Qualité des microbloggeurs Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 10
  • 11. 2.2 Recherche des tweets : la RI dans les microblogs Travaux sur RI dans les microblogs • Accéder aux microblogs – Intégration des caractéristiques des tweets • URLS, hashtags, liens [Duan & al, 2010] – Intégration du contexte temporal (géographique) • [Sankaranarayanan & al, 2009] {Grinev & al,2009] – Intégration du réseau social • [Nagmoti & al, 2010] • Importance des microbloggeurs – Expertise au sujet de la requête • [Balog et al 2009], [Zhang et al.2007] et [Noll et al.2009] – Influence dans le réseau social • [Kwak et al.2010], [Agarwal et al.2008] et [Weng et al.2010] Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 11
  • 12. 3. Un modèle Sociale pour la recherche des tweets • Combiner les facteurs de pertinence sociale – La pertinence thématique – L’importance social des tweets • Estimer l’importance des microbloggeurs – Influence sur le réseau social – Expertise au sujet de la requête • Modéliser le réseau social des microbloggeurs – Réseau social de rediffusion – Pondérer les relations Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 12
  • 13. 3.1 Un modèle Sociale pour la recherche des tweets Le réseau social de l’influence • Rediffusion d’un article – Un message important – Une information crédible et précise – Une opinion partagée La rediffusion d’un article indique l’importance de son bloggeur • Réseau social de l’influence – Les microbloggeurs – Relations d’influence Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 13
  • 14. 3.1 Un modèle Sociale pour la recherche des tweets Le réseau social de l’influence nb tweets publiés par uj et rediffusés par ui nb tweets rediffusés par ui Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 14
  • 15. 3.2 Un modèle Sociale pour la recherche des tweets Estimation de la pertinence des tweets • Combinaison linéaire – Pertinence thématique – L’importance sociale du microbloggeur Requête Normalisation Tweet Réseau social Microbloggeur Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 15
  • 16. 3.3 Un modèle Sociale pour la recherche des tweets Importance Sociale du microbloggeur • Importance Sociale du microbloggeur – Position dans le réseau social – Affiliation au sujet de la requêtes • Microbloggeurs influents & experts – Influence locale dans le sous-réseau des experts – Eviter la dominance de certaines influences globales Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 16
  • 17. 3.3 Un modèle Sociale pour la recherche des tweets Importance Sociale du microbloggeur • Influence sociale – PageRank pondéré appliqué le réseau d’influence sociale – Microbloggeur autoritaire dans le réseau d’influence • Expertise de microbloggeur – Représenter un Microbloggeur par l’ensemble de son blog – Un modèle de langue pour trier les blogs Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 17
  • 18. 4 Evaluation expérimentale • Objectifs de l’évaluation 1. Comparer les facteurs d’importance sociale • Influence Sociale • Expertise du microbloggeur 2. Etudier l’impact de la combinaison • Score thématique • Score social • Cadre d’évaluation – Absence d’un cadre standard pour l’évaluation de RI dans les microblogs – Collecter des tweets et monter un cadre expérimentale Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 18
  • 19. 4.1 Evaluation expérimentale Cadre d’évaluation 1. Microbloggeurs – Annuaire des microbloggeur WeFollow – Catégorie « Technologies d’Internet » – Compte actifs et accessibles au public – 2384 bloggeurs 2. Microblogs – 100 derniers tweets de chaque microbloggeur (Twitter API) – 237497 tweets 3. Requêtes – 5 utilisateurs – 25 requêtes (actualités technologiques) – Jugement des 100 articles retourné par modèle thématique Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 19
  • 20. 4.2 Evaluation expérimentale Baselines Ex. BM BM25 VSM 0.3027 NESTOR Microblogging Search Engine 0.0673 0.013 MAP Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 20
  • 21. 4.2 Evaluation expérimentale Comparaison des facteurs de pertinence Influence Expertise Influence & Expertise 0.0718 0.0613 0.0389 MAP Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 21
  • 22. 4.3 Le Service de Microblogage Evaluation de l’efficacité du module Thématique Influence Expertise Influence & Expertise 0.3286 0.3186 0.3143 0.3027 MAP Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 22
  • 23. 4.3 Le Service de Microblogage Evaluation de l’efficacité du module Ex. BM Inf. Exp. Inf. & Exp. BM25 VSM BM (Temps) 0.4465 0.3027 0.3143 0.3186 0.3286 0.0673 0.013 MAP Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 23
  • 24. 5. Conclusion • Modèle social pour la recherche des tweets – Intégrer la pertinence thématique et sociale – Combinaison de l’influence et de l’expertise – Réseau social de rediffusion • Expérimentation sur une collection des tweets – Amélioration du modèle « Influence & Expertise » • Perspectives – TREC Microblogs 2011 – Comparer le modèles avec d’autres modèles de recherche des tweets. Microblogage | Recherche des tweets | Modèle sociale | Evaluation expérimentale | Conclusion 24
  • 25. Un modèle de recherche d’information sociale dans les microblogs : cas de Twitter Meri pour votre attention ! 25