Social Network Analysis

1,211 views

Published on

Social network analysis. Graph structure and communities. Lecture at HSE in Russian

Published in: Technology
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,211
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
17
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Social Network Analysis

  1. 1. Математические модели интернет-технологий:от интернет рекламы до социальных сетей Леонид Жуков (ГУ ВШЭ) 1
  2. 2. План докладаTalk outline Социальные сети нахождение сообществ Поисковая реклама сегментация рынка Интернет радио рекомендационная система Математическая модель: Граф Кластеризация (алгоритмы на графах)2
  3. 3. Социальные сетиSocial networks Социальная сеть (social network) — социальная структура, состоящая из группы узлов, которыми являются социальные объекты (люди или организации), и связей между ними (социальных взаимоотношений) - Wikipedia Интернет (2000 - ...) MySpace (300 млн), FaceBook, (50 млн), Friendster, ... Одноклассники (11 млн), В контакте (7 млн), Мой Круг ... Математическое представление – граф G( V, E) Множество вершин | V | – “люди” Множество ребер | E | – “отношения” Направленный / ненаправленный3
  4. 4. Возможные исследованиеStudy topics Анализ структуры идентификации ролей пользователей развитие и рост сети нахождение сообществ Процессы в сети распостранение информации распостранение влияния сетевая экономика Реклама и монетизация4
  5. 5. Социальная сеть FlickrFlickr social network5
  6. 6. Графическое представлениеFlickr graph6
  7. 7. Матрица смежностиAdjacency matrix 7
  8. 8. Матрица смежностиAdjacency matrix8 580,000 users, 3,500,000 links
  9. 9. Сортировка Cuthill-McKeeReverse Cuthill-McKee ordering9 580,000 users, 3,500,000 links
  10. 10. Flickr: статистикаFlickr stats количество узлов (пользователей)= 584,207 количество ребер (связей) = 3,555,115 максимальная входящая степень узла = 3531 максимальная выходящая степень узла = 8976 < входящая степень узла > = < выходящая степень узла > = 6 диаметр графа = 18 средняя длина пути = 5.3 число сильно связанных компонент = 152,324 наибольшие сильно связанные комп = 274,649 : 374 : 186 :155 : … число связанных компонент = 43,189 наибольшие связанные компоненты = 404,893 : 378 : 112 : 108 : … максимальное ядро (core number) = 249 (size 668)10
  11. 11. Безмасштабные сети Scale-free (complex) networks Степенной закон распределения степеней узлов (power law) Медленно растущее среднее расстояние между узлами (small world) Высокий коэффициент кластеризации Наличие гигантской связанной компоненты11
  12. 12. Безмасштабные сети Scale free Функция вероятности распределения Кумулятивная функция распределенияPDF CDF CDF Node degree Node degree12
  13. 13. Безмасштабные сети Scale free Node degreeNodes sortedby in-degrees Node number Node degreeNodes sortedby out-degrees 13 Node number
  14. 14. K - ядраK - core15 2-core, 7,815 nodes
  15. 15. K - ядраK - core 5-core, 2,233 nodes16
  16. 16. K - ядраK - core17 10-core, 819 nodes
  17. 17. Разделение графаGraph partitioning18
  18. 18. Разделение графаGraph partitioning 1 2 3 4 5 6 7 8 A B Graph separators: Normalized cut:19 J. Shi and J. Malik, 2000
  19. 19. Спектральное разделение графаSpectral graph partitioning 2 M. Fielder, 1973 1 3 4 5 6 7 8 assign each node indicator , p= {-1,-1,-1,-1, +1, +1, +1} smallest cut: combinatorial optimization, NP hard, relax:20
  20. 20. РешениеSolutionQuadratic optimization:Eigenvalue problem:Rounding off p= {-1,-1,-1,-1, +1, +1, +1} 21
  21. 21. Пример: нормированное разделениеExample: normalized cuts 1 2 3 4 5 6 7 8 -1 +1L = x= p=22
  22. 22. Спектральное разделение графаSpectral graph cut node layout Eigenvector – sorted Cut valuesx=23
  23. 23. Спектральная сортировкаSpectral ordering Eigenvector Eigenvector – sorted perm = [1 2 6 7 3 8 4 5] Adjacency matrix Adjacency matrix – re-ordered24
  24. 24. Спектральная сортировкаSpectral ordering 2^N vs N25
  25. 25. КластеризацияClustering26
  26. 26. Рекурсивное деревоRecursive partitioning tree27
  27. 27. Спектральная сортировка ядра FlickrFlickr: “10-core” spectral ordering28
  28. 28. Иерархическая кластеризация (таксономия)Hierarchical clustering29

×