Les concepts de base de l'analyse de réseaux, réseaux sociaux réels, problématiques de l'analyse de grands graphes réels, pistes d'application au emarketing
1. Analyse de réseaux sociaux
Tour d’horizon
Pistes d’application pour le
eMarketing
Cécile Bothorel, Département LUSSI
18/01/10
2. Quel point commun ?
Réseau physique d'Internet
Graphe du Web qui modélise la structure
hypertextuelle du Web
Réseaux sociaux en ligne
Graphe de contact en épidémiologie
Graphes d'échange en économie
Graphe d'interactions protéines
Réseaux sémantiques
Réseau de co-auteurs
Réseau de co-utilisation de tags
page 2 Département LUSSI Cécile Bothorel
3. Quel point commun ?
http://complexnetworks.fr/
page 3 Département LUSSI Cécile Bothorel
4. Graphes réels
Graphes réels, grands graphes terrain, complex
networks
Propriétés structurelles communes
• faible densité en arcs,
• en moyenne des chemins courts (effet petit monde),
• existence de zones denses en arcs,
• incidence des sommets en loi de puissance.
Structure de graphe rare d’un point de vue
probabiliste → un domaine de recherche jeune
→puise ses concepts dans l'analyse
de réseaux sociaux
page 4 Département LUSSI Cécile Bothorel
6. Qu’est-ce qu’un réseau social ?
Point de vue utilisateur
Point de vue analyste
page 6 Département LUSSI Cécile Bothorel
7. Qu’est-ce qu’un réseau social ?
Entités sociales
• individus,
• organisations…
Liens créés lors
d’interactions sociales
• relation d’amitié,
• partenariat,
• communication,
• intérêt commun,
• transmission de
maladie…
page 7 Département LUSSI Cécile Bothorel
8. Analyse de réseaux sociaux
Décrire une population
• non par les traits qui marquent ses membres (age, sexe,
revenu, niveau d'étude, etc.)
• mais par les relations entre eux
Comprendre et interpréter la structure et le
comportement d’un réseau
Structure du point de vue performance
Position opportunités
Émergence de communautés
page 8 Département LUSSI Cécile Bothorel
10. Analyse de réseaux sociaux
L’analyse des réseaux sociaux n’est
pas une discipline nouvelle
• 1933 : sociogramme de Jacob Levy Moreno
pour objectiver la dynamique du groupe
• 1954 : John A. Barnes introduit le terme
« réseau social »
• 1967 : Stanley Milgram : effet du « petit
monde », six degrés de séparation
• 1973 : Mark L. Granovetter : la force des
contacts faibles
• 1998 : PageRank de Google : mesure de
pertinence dans l’ordonnancement des
réponses aux requêtes
http://fr.wikipedia.org/wiki/Fichier:Six_degrees_of_separation.png
page 10 Département LUSSI Cécile Bothorel
11. Analyse de réseaux sociaux
Une multitude de représentations
• Différents types de relations
- Relation directionnelle ou non (flux d’information)
- Relation pondérée ou non (fréquence des interactions)
- Relation unique ou multiple
• Différents types d’entités
- Un seul type d’entités pour décrire un réseau d’amis, ou un réseau de blogs
ou de pages webs
- Deux types d’entités pour décrire des relations médiatées : auteurs – articles,
acteurs - films
page 11 Département LUSSI Cécile Bothorel
12. Analyse de réseaux sociaux
Des concepts de bases simples
- Degré
- Chemins (intermédiaires pour relier
deux nœuds, sans répéter les nœuds)
- Longueur (nombre de liens séparant
deux nœuds)
- Distance (longueur du plus court
chemin) = « distance géodésique »
- Composantes (ensemble de nœuds
où chacun peut atteindre chacun des
autres)
- Pont / cutpoint
- Clique / quasi-clique
- …
page 12 Département LUSSI Cécile Bothorel
13. Analyse de réseaux sociaux
(1) Analyse de l’ensemble du réseau
(2) Analyse de positions
(3) Analyse de sous-groupes
18/01/10
14. Analyse de réseaux sociaux
(1) Analyse de l’ensemble du réseau
(2) Analyse de positions
(3) Analyse de sous-groupes
18/01/10
15. (1) Analyse de l’ensemble du réseau
Formes connues de graphes
• Graphe aléatoire (Erdös et Rényi, 1959)
• Scale-free : attachement préférentiel (A.-L. Barabasi & R.
Albert, 1999)
• Réseau hiérarchique : scale-free dans les clusters (A.-L.
Barabasi et al., 2002)
• Petit-monde (D. Watts and S. Strogatz, 1998)
Barabasi & Oltvai, vol.5, p101 (february 2004)
page 15 Département LUSSI Cécile Bothorel
16. (1) Analyse de l’ensemble du réseau
Graphe aléatoire (Erdös et Rényi, 1959)
• N = 10 et p = 0.2. Le réseau croît de façon homogène (pN (N-1)/2 liens)
• La plupart des noeuds ont le même degré (proche de la moyenne)
• Petit monde
page 16 Département LUSSI Cécile Bothorel
17. (1) Analyse de l’ensemble du réseau
Scale-free : attachement préférentiel (A.-L. Barabasi & R. Albert, 1999)
• Modèle largement utilisé, trop ?
• Décrit une dynamique et une structure
page 17 Département LUSSI Cécile Bothorel
18. (1) Analyse de l’ensemble du réseau
Scale-free : attachement préférentiel (A.-L. Barabasi & R. Albert, 1999)
• La distribution des degrés en loi de puissance
• Présence de hubs rouges qui ont attiré un grand nombre de voisins verts
page 18 Département LUSSI Cécile Bothorel
19. (1) Analyse de l’ensemble du réseau
• Réseau hiérarchique : scale-free dans
les clusters (A.-L. Barabasi et al., 2002)
• Petit-monde : petit diamètre de l'ordre de
log(N) et fort coefficient de clustering (D.
Watts and S. Strogatz, 1998)
Barabasi & Oltvai, vol.5, p101 (february 2004)
page 19 Département LUSSI Cécile Bothorel
20. (1) Analyse de l’ensemble du réseau
Comprendre la structure
globale
• Taille
• Distance moyenne, diamètre
• Connectivité, densité des
relations
• Distribution des degrés, la
variance des degrés
• Transitivité – coefficient de
clustering
• La centralité du graphe Réseau très central qui peut
« tourner » autour d’un
nœud. Si ce nœud
disparaît…
page 20 Département LUSSI Cécile Bothorel
21. (1) Analyse de l’ensemble du réseau
Comprendre la structure
globale
• Core/periphery
• Cliques : nombre, taille des
cliques
page 21 Département LUSSI Cécile Bothorel
22. Analyse de réseaux sociaux
(1) Analyse de l’ensemble du réseau
(2) Analyse de positions
(3) Analyse de sous-groupes
18/01/10
23. (2) Analyse de positions
page 23 Département LUSSI Cécile Bothorel
24. (2) Analyse de positions
Positions clés, rôles
• Localement
exemple : fort degré – beaucoup de voisins
immédiats prestigieux
influent
• Globalement
exemple : PageRank : être connecté à des pertinence
nœuds importants me donne plus
d’importance que d’être connecté à des
nœuds peu importants
page 24 Département LUSSI Cécile Bothorel
25. (2) Analyse de positions
1 0.473
1 0.733
10 0.000
10 0.423
11 0.000
11 0.423
12 0.000
12 0.423
2 0.009
2 0.478
3 0.009
3 0.478
4 0.009
4 0.478
5 0.009
5 0.478
6 0.009
6 0.478
7 0.100
7 0.611
8 0.618
8 0.688
9 0.000
9 0.423
Accès rapide à
l’information
d’où qu’elle Médiateur
parte
Closeness centrality est Betweenness centrality est le
l’inverse de la somme des nombre de fois qu’un nœud se
distances entre ce nœud et trouve sur le plus court chemin
chacun des autres entre deux autres noeuds
page 25 Département LUSSI Cécile Bothorel
26. (2) Analyse de positions
Centralité(s)
• Basée sur les calculs de plus courts chemins
- Degree centrality (popularité, comportement grégaire)
- Betweenness centrality (médiateur ou goulot d’étranglement)
- Closeness centrality (proximité, sera informé plus rapidement)
- Flow betweenness (contribution à augmenter le flot)
• Basée sur les marches (on peut repasser par un
nœud ou un lien plusieurs fois)
- Bonacich power = eigenvector centrality (version itérative
de la centralité de degré) (importance, haut-risque d’infection)
- Katz, Hubbel (influence, « qui a entendu ce qu’il a dit ? ») PageRank
(être pointé par
des sites
importants rend
important)
Liste de calculs disponibles dans l’outil UCINET
page 26 Département LUSSI Cécile Bothorel
27. (2) Analyse de positions
Liens faibles
• Lien hors « triangle »
• Liens d’ouverture qui donnent accès
à une variété d’information -> force
des liens faibles (Granovetter, 1973)
• Exemple : 4 clusters (liens rouges)
interconnectés par des liens faibles
(gris)
– Plusieurs « hubs » ont tendance à se
connecter : maximiser les échanges
d’information
– Certains liens faibles vont donc se retrouver
au centre de communautés plus large
– Pourtant certains liens faibles doivent rester
faibles : ponts inter communautés, ils
apportent de l’innovation
page 27 Département LUSSI Cécile Bothorel
28. (2) Analyse de positions
• Trous structuraux
- Mesure la redondance des ego-networks (les « triangles »
incluant ego) (Burt, 1992)
- Séparation entre deux contacts non redondants
- Zones peu denses confèrent du pouvoir au centre
- Proche de la betwenness et de la densité des ego-network
• Equivalence structurelle
- Nœuds de même voisinage, même centralité…
• Equivalence Régulière
- Les voisinages sont eux-même équivalents, assurent le
même rôle
- Comme deux médecins, deux chefs d’équipe.
• …
page 28 Département LUSSI Cécile Bothorel
29. (2) Analyse de positions
Et puis de nouvelles métriques inventées tous les
jours
• Calcul d'influence dans twitter : RetweetRank
• Détection de spam : SpamRank
• Calculs de confiance : TrustRank, TidalTrust
• Calculs de similarités : SimRank
• ...
page 29 Département LUSSI Cécile Bothorel
30. Analyse de réseaux sociaux
(1) Analyse de l’ensemble du réseau
(2) Analyse de positions
(3) Analyse de sous-groupes
18/01/10
31. (3) Analyse de sous-groupes
La délimitation en groupes n'est pas un a
priori
• On ne cherche pas qui appartient à une famille,
communauté ethnique ...
• Mettre en évidence une catégorie émergente,
basée sur l'analyse de la topologie
En pratique, existence de
zones denses
page 31 Département LUSSI Cécile Bothorel
32. (3) Analyse de sous-groupes
Recherche de groupes
• Cliques (ou 1-cliques), k-
cliques : ensemble max de
nœuds tous reliés à une
distance k.
• K-plex (ensemble de n
nœuds où chacun a un lien
avec au moins n-k nœuds)
Clique et 2-clique
2-plex
page 32 Département LUSSI Cécile Bothorel
33. (3) Analyse de sous-groupes
Détection de communautés
• Formes plus lâches
• Gros volumes de données
• Thématique connaît un
renouveau avec l'étude de
grands graphes réels
Karate Club in an American
University [Zachary 1977]
page 33 Département LUSSI Cécile Bothorel
34. (3) Analyse de sous-groupes
Quatre types d’approches
(thèse P. Pons, 2007)
• Classiques
• Séparatives
• Agglomératives
• Marches aléatoires
P. Pons, 2007
Trouver la partition
P = {C1, . . . , Ck} qui optimise la
fonction de qualité Q(P)
page 34 Département LUSSI Cécile Bothorel
35. (3) Analyse de sous-groupes
Approches classiques
• Partitionnement de graphe en k groupes
- Bissection spectrale (Spectral clustering)
– théoriquement solide, basée sur le calcul de vecteur propre
– Très coûteuse
- Méthode de Kernighan et Lin
– Bissection en utilisant la coupe minimisant le nombre d’arêtes tombant
entre deux coupes
• Clustering hiérarchique
- Mesure de similarité entre communauté (distance min, max ou
moyenne, ou des membres au centroïd de l’autre communauté)
- Partant avec n communautés, méthode itérative où l’on fusionne des
communautés les plus proches
- ou kmeans si on peut fixer k
page 35 Département LUSSI Cécile Bothorel
36. (3) Analyse de sous-groupes
Approches séparatives
• On part d’une communauté unique puis à chaque étape, on
retire une relation provoquant un découpage en sous-
communautés
- Relation la plus centrale par exemple (Girwan et Newman, 2002)
• Critère d’évalutation de la division en communautés
- La modularité Q cherche à produire un découpage où le nombre
d’arêtes reliant les groupes est plus petit que le nombre « attendu »,
i.e. si on avait découpé aléatoirement.
page 36 Département LUSSI Cécile Bothorel
37. (3) Analyse de sous-groupes
Approches agglomératives
• On part de n communautés composées d’un seul nœud
• Itérativement, on regroupe les nœuds en communautés, puis
les communautés entre elles, jusqu’à obtenir une seule
communauté.
• Critère d’évalutation de la division en communautés
- La modularité Q cherche à produire un découpage où le nombre
d’arêtes reliant les groupes est plus petit que le nombre « attendu »,
i.e. si on avait découpé aléatoirement.
page 37 Département LUSSI Cécile Bothorel
38. (3) Analyse de sous-groupes
Marches aléatoires
• Intuition : les marcheurs
vont se faire piéger dans
des zones denses
• Un marcheur va avoir
tendance à rester dans sa
communauté si marche
courte
• Distance : deux marcheurs
proches vont voir le même
voisinage
• Clustering hiérarchique par
fusions successives de
communautés
Computing Communities in Large Networks Using Random Walks
Pascal Pons and Matthieu Latapy, Journal of Graph Algorithms and Applications
http://jgaa.info/ vol. 10, no. 2, pp. 191–218 (2006)
page 38 Département LUSSI Cécile Bothorel
39. Analyse de réseaux sociaux
Cas d’application : le eMarketing
Cécile Bothorel, Laboratoire LUSSI
18/01/10
40. Buzz
du Buzz
au Marketing viral
page 40 Département LUSSI Cécile Bothorel
41. Examples de Buzz positif (1)
Effet geyser de l'association
2006. L’association des deux
Mentos et Coca cola light produits aurait provoqué la mort
d’un jeune brésilien.
Documents powerpoint circulent
par email.
Coca Cola s’est montré assez
distant au départ vis à vis de
l’affaire tandis que Mentos l’a
pleinement exploité.
Mentos : économie d’au moins dix
millions en pub et +15% de ventes.
Coca Cola : doublé son trafic web
Fritz Grobe & Stephen Voltz
http://eepybird.com/history.html
page 41 Département LUSSI Cécile Bothorel
42. Examples de Buzz positif (2)
Vidéos virales 2009
Evian : 55 millions de vues
certifiées par Visible Measures
T-mobile : opération « Live for
Sharing » pour le lancement du
téléphone G1 (Google Phone) en
Grande Bretagne ? un vrai
événement terrain
Samsung : « Sheep LED Art ».
Volkswagen : « FunTheory »
Lu sur http://www.mediassociaux.com/
page 42 Département LUSSI Cécile Bothorel
43. Examples de buzz négatif (1)
Kryptonite et ses cadenas que l'on ouvre avec un stylo Bic
• Un simple post sur un forum spécialisé en 2004, une vidéo et
3 jours après, plus d'un million d'internautes étaient au
courant
• coût estimé pour la société : 10 millions de $
John Mac Cain malmené sur YouTube pendant la
campagne présidentielle en 2008
• Vidéo « John McCain vs John McCain » montrant des
incohérences de discours à propos de l'Irak, de la religion,
des mariages gays
• Vidéo toujours commentée depuis le 26/01/07
http://intelligenceeconomiquealgerie.blogspot.com/2010/01/e-reputation-12-cas-significatifs.html
Lu le 5 janv 2010
page 43 Département LUSSI Cécile Bothorel
44. Examples de buzz négatif (2)
Les 3 suisses et la TV bradée (90% de réduction) a
emflammé le web
• Groupes FB
• « google bombing » : la marque sort en tête à la
requête « inadmissible incompétence »
• Résultat obtenu grâce à (à cause ) d'une dizaine de
bloggueurs
Dominos Pizza réagit efficacement
• « garniture très spéciale» de pizzas en vidéo.
• Excuses publiques, compte Twitter Corporate
http://intelligenceeconomiquealgerie.blogspot.com/2010/01/e-reputation-12-cas-significatifs.html
Lu le 5 janv 2010
page 44 Département LUSSI Cécile Bothorel
45. Buzz
Bad buzz ou Stratégie bien
ficelée ?
Tentant mais
• difficilement maîtrisable car
fonctionne par bouche à
oreille, le message peut être
déformé
• durée de vie limitée, un buzz
en chasse un autre
Les recettes pour faire du
bu$$ : un marché à part
entière
page 45 Département LUSSI Cécile Bothorel
46. Marketing viral
A la différence du buzz, il
s’agit d’une vraie
campagne marketing
Un vrai message
Particularité, ce sont les
clients qui véhiculent ce
message
Actuellement, beaucoup de
marques « utilisent » les
médias sociaux
page 46 Département LUSSI Cécile Bothorel
47. Réseaux sociaux et Marketing viral
Viadeo, le réseau social, vient de conclure un
partenariat avec Hotel Reservation Service (HRS)
• HRS : nouveaux clients par “recommandation”,
sans campagne publicitaire, en faisant juste un
effort financier sur le prix des hôtels
• Viadeo vend des abonnements, fidélise ses
membres, qui vont attirer leurs relations…
Mais aussi partenariat avec
• Msn Messenger,
• Club IGR (association des diplômés de l’IAE de
Rennes),
• Partenariat avec l'Apec démarre en janv. 2010 :
communauté Apec, consultation du profil viadéo
des candidats par les recruteurs
• ...
page 47 Département LUSSI Cécile Bothorel
48. Réseaux sociaux et Marketing viral
Facebook met
en avant des
marques
La marque vous
invite à parrainer
le message, à
commenter et à
propager.
page 48 Département LUSSI Cécile Bothorel
49. Réseaux sociaux et eMarketing
Enjeu : Maîtriser le Bouche à oreille
Comprendre la structure des sites communautaires,
mais également des réseaux de sites
Comment choisir le blogguer qui pourra mieux
parler d'un produit/service ?
Par quel utilisateur twitter se faire suivre ?
A quels clients proposer un produit en beta-test ?
page 49 Département LUSSI Cécile Bothorel
50. Réseaux sociaux et eMarketing
Analyse de réseaux sociaux
• Déterminer les individus par qui la compagne doit
démarrer/passer
- Les leaders d’opinions (calcul de popularité – centralité de degré,
pageRank)
- Les médiateurs (calcul de centralité « stress », « betwenness ») : les
acteurs qui contrôlent la propagation de l’information en tant que
passages obligés
- Les points de référence (calcul de centralité « closeness ») :
individus les plus proches de tous
page 50 Département LUSSI Cécile Bothorel
51. Réseaux sociaux et eMarketing
Analyse de réseaux sociaux
• Prédire la vitesse, la couverture de la diffusion
- Calcul de plus courts chemins, de flots maximum
- Une rumeur sera plus efficace si elle provient de plusieurs sources
différentes
• Social contagion
- Simulation sociale
- Outils Repast, NetLogo...
Démo
page 51 Département LUSSI Cécile Bothorel
52. Réseaux sociaux et eMarketing
Avec une analyse sémantique, on peut délimiter
des communautés thématiques
• Cibler les campagnes
• Détecter les tendances
• Les membres situés à la périphérie des communautés
peuvent servir de passerelle inter-communautés
page 52 Département LUSSI Cécile Bothorel
53. Réseaux sociaux et eMarketing
Mais ...
• Collecte des données pour faire
l'analyse du réseau...
• Peut-on intervenir sur la
structure pour la rendre plus
efficace ?
• Comprendre, modéliser le
réseau de confiance/opinions :
un calcul de force des liens ?
Un TrustRank ?
Networks, Crowds, and Markets: Reasoning About a Highly Connected
World By David Easley and Jon Kleinberg, à paraître en 2010
page 53 Département LUSSI Cécile Bothorel
54. Réseaux sociaux et eMarketing
Et puis surtout
• Créer un vrai contenu, en faciliter la réplication
• Surprendre
• Mobiliser un réseau social, valoriser les clients qui se
prêtent au jeu. Le client est ROI...
• Mesure de succès ?
page 54 Département LUSSI Cécile Bothorel
56. Domaines d’application
Marketing … mais aussi :
Recherche d’information
• Ordonnancement des résultats d’une requête, désambiguïsation
linguistique, nuage de tags contextuels à une requête…
Recommandation
• Prédiction d’opinion pour le cinéma, musique…
Terrorisme
• Acteurs clés dans un réseau d’interaction
Médecine – épidémiologie
• Prédiction de contamination
Transport, Biologie…
page 56 Département LUSSI Cécile Bothorel
57. Les travaux actuels
Actuellement
• On sait analyser
finement des petits
graphes (quelques
centaines de nœuds)
• Des données TIC
maintenant accessibles
et volumineuses
→ Grands graphes réels
page 57 Département LUSSI Cécile Bothorel
58. Les travaux actuels
Grands graphes réels
• On sait décrire globalement et statiquement ces graphes
- difficulté à décrire la dynamique, travaux sur la prédiction de liens
- difficulté de calculer les métriques riches issues de l'analyse des réseaux
sociaux
• On commence à faire des approximations des mesures pour des très
grands graphes simples
- Exemple : approximation de la distance moyenne ou le diamètre
• Algorithmique empirique
- Revisite les algorithmes pour les graphes « réels » pour tirer partie des
propriétés observées
- Problèmes spécifiques à des jeux de données : exemple hypergraphes
pour les folksonomies
page 58 Département LUSSI Cécile Bothorel
59. Les travaux actuels
Problèmes
• comment collecter des données fidèles ? Vues partielles en pratique
• comment les modéliser pour ne pas perdre trop d’information ?
• comment analyser/prédire la dynamique ?
- Au sens flux (probabilité d’être touché par une maladie ?)
- Au sens structure (formation, fusion, dissolution de communautés)
• comment visualiser les grands réseaux ?
• comment savoir si les communautés découvertes sont pertinentes ?
comparer les résultats de méthodes différentes ?
Vers une théorie de la complexité
• des propriétés statiques communes mises en évidence
• trouver des caractéristiques communes de la dynamique des systèmes
complexes (Barabasi, www.sciencemag.org, Science, Vol 325, 24 july 2009)
page 59 Département LUSSI Cécile Bothorel