Introdução à Redes Complexas e Visualização de Dados com Gephi

4,931 views
4,695 views

Published on

Slides da apresentação realizada no MediaLab Week SP, ocorrido na PUC-SP em Julho/2013.

Atualização: Slides incrementados para apresentação no TIDD - PUC/SP, 2014.

Published in: Data & Analytics
0 Comments
24 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,931
On SlideShare
0
From Embeds
0
Number of Embeds
163
Actions
Shares
0
Downloads
275
Comments
0
Likes
24
Embeds 0
No embeds

No notes for slide

Introdução à Redes Complexas e Visualização de Dados com Gephi

  1. 1. INTRODUÇÃO À REDES COMPLEXAS E VISUALIZAÇÃO DE DADOS com gephi Newton Calegari, TIDD PUC-SP Maio 2014
  2. 2. REDES COMPLEXAS 2
  3. 3. sistemas complexos 3 Interação entre Proprie dade emergente TGS, Re des, Cibernética... Auto -organização, Evolução, Adaptação elementos co n e cta d o s diversas re laçõ e s po dem ser mapeados por redes
  4. 4. para cada sistema complexo 4 existe uma rede que mostra as relações dos elementos
  5. 5. REDES 5 usamos para estudar o comportamento dos SISTEMAS COMPLEXOS
  6. 6. 6 grafos e redes
  7. 7. 7 Grafos e Redes Euler, 1735 “7 pontes de Königsberg” Vértice Aresta
  8. 8. 8 Grafos e Redes rede Nó (node) Link Rede (network) Refere-se aos sistemas reais (redes sociais, neurônios...) grafo Vértice Aresta Grafo É um modelo, uma representação matemática
  9. 9. 9 Grafos e Redes Grafo G = (V, E) V: conjunto de vértices E: conjunto de pares de V, arestas ! Arestas não direcionadas Grafo Arestas direcionadas Digrafo (grafo orientado) [1: https://pt.wikipedia.org/wiki/Ficheiro:6n-graf.svg] [1]
  10. 10. 10 Grafos e Redes conceitos de redes Node degree número de links conectados ao nó in-degree out-degree número links de entrada ou saída de um nó em grafos orientados a soma de in e out resulta no grau do nó Average degree L (links), N (nodes) não-orientado <k> = 2L÷N orientado <k> = L÷N
  11. 11. 11 Grafos e Redes conceitos de redes in-degree 4 out-degree 2 Node degree 6
  12. 12. in-degree 4 out-degree 2 Node degree 6 12 Grafos e Redes conceitos de redes Average degree 2.2 N: 10 L: 22
  13. 13. 13 Grafos e Redes Grafo completo vértices arestas Average degree 5 n(n-1)÷2 n-1
  14. 14. 14 Grafos e Redes representação Lista de arestas {(1, 2), (1, 3), (1, 4) (2, 3), (3, 4)} Lista de adjacências 1: 2, 3, 4 2: 1, 3 3: 1, 2, 4 4: 1, 3 Matriz de adjacências ⎡ 0 1 1 1 ⎤ | 1 0 1 0 | | 1 1 0 1 | ⎣ 1 0 1 0 ⎦ 1 2 4 3
  15. 15. 15 Grafos e Redes grafo e digrafo ⎡ 0 1 1 1 ⎤ | 1 0 1 0 | | 1 1 0 1 | ⎣ 1 0 1 0 ⎦ 1 2 4 3 matriz simétrica ⎡ 0 0 1 1 ⎤ | 1 0 0 0 | | 0 1 0 1 | ⎣ 0 0 0 0 ⎦ 1 2 4 3 matriz não simétrica
  16. 16. 16 Grafos e Redes grafo e digrafo ⎡ 0 0 2 4 ⎤ | 3 0 0 0 | | 0 2 0 1 | ⎣ 0 0 0 0 ⎦ 1 2 4 3 Peso nas arestas 3 2 2 1 4
  17. 17. 17 Grafos e Redes caminhos A B D C E I F G H Qual a distância entre os vértices A e I? A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta
  18. 18. 18 Grafos e Redes caminhos D E G H A B C F I Qual a distância entre os vértices A e I? A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta A, B, C, F, I 4 arestas
  19. 19. 19 Grafos e Redes caminhos A B D C E I F G H Qual a distância entre os vértices A e I? A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta A, B, C, F, I 4 arestas A, B, E, G, H, F, I 6 arestas
  20. 20. 20 Grafos e Redes caminhos A B D C E I F G H Qual a distância entre os vértices A e I? A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta A, B, C, F, I 4 arestas A, B, E, G, H, F, I 6 arestas A, D, C, F, I 4 arestas
  21. 21. 21 Grafos e Redes caminhos A B D C E I F G H Qual a distância entre os vértices A e I? A distância entre dois vértices é definida pelo número de arestas do menor caminho que os conecta A, B, C, F, I 4 arestas A, B, E, G, H, F, I 6 arestas A, D, C, F, I 4 arestas A, C, F, I 3 arestas
  22. 22. 22 Grafos e Redes caminhos ‣ Caminho (path) ‣ Distância (shortest path) ‣ Diâmetro do grafo (maior distância no grafo) ‣ Distância média (average path length) ‣ Ciclo (N início = N fim) ‣ Caminho euleriano (cada aresta uma vez) ‣ Caminho hamiltoniano (cada vértice uma vez)
  23. 23. 23 Grafos e Redes conectividade dos grafos ‣ Grafo não orientado ‣ connected dois vértices quaisquer são alcançáveis por um caminho ‣ disconnected formado por dois ou mais componentes não conectados entre si
  24. 24. 24 Grafos e Redes conectividade dos grafos ‣ Grafo orientado ‣ strongly connected cada vértice qualquer possui um caminho para outro vértice (e vice-versa) Ex, A->B e B->A. ‣ weakly connected é conectado se não considerarmos a direção das arestas
  25. 25. 25 Grafos e Redes componentes Conectados ‣ strongly connected components B, C, D, E A F G, H ‣ weakly connected components A B C D E G H F
  26. 26. 26 Grafos e Redes componentes Conectados ‣ giant component componente que, geralmente, ocupa a maior fração da rede
  27. 27. redes 27
  28. 28. 28 ciência das redes Erdós e Renyi, 1959 Modelo de Redes Randômicas ! Adicionando links de maneira aleatória, quase todos os nós terão graus próximos
  29. 29. 29 ciência das redes Stanley Milgran, 1967 “Six degrees” ! Os seis graus de separação
  30. 30. 30 ciência das redes Mark Granovetter, 1973 Clusters ! Pequenos grupos fortemente conectados ! Vínculos fortes e vínculos fracos
  31. 31. 31 ciência das redes Watts e Strogatz Coeficiente de clusterização ! Hubs
  32. 32. 32 redes randômicas { ... } ciência das redes rede livre sem escala
  33. 33. 33 ciência das redes redes randômicas •Modelo de Erdös-Renyi •Rede democrática (probabilidade de conexão igual para todos os nós) •Randômica •Estática
  34. 34. 34 ciência das redes rede livre sem escala •Modelo de Barabási •Exponencial •Lei de Pareto (80-20) •Permite crescimento dinâmico •Muitos nós são conectados à rede por ligações com nós que possuem muitos links, os hubs
  35. 35. 35 ciência das redes rede livre sem escala ‣A rede se expande com a adição de novos nós com m links ‣Novos nós adicionados à rede preferem se conectar com outros nós altamente conectados ‣Hubs se originam do crescimento e da conexão preferencial
  36. 36. 36 modelo de rede randômica Modelo de Erdös-Renyi ciência das redes
  37. 37. 37 modelo de rede randômica 80 nós 162 arestas Grafo não-orientado ciência das redes
  38. 38. 38 ciência das redes modelo de rede randômica
  39. 39. 39 modelo de rede livre sem escala Modelo de Barabási ciência das redes
  40. 40. 40 modelo de rede livre sem escala 80 nós 79 arestas Grafo não-orientado ciência das redes
  41. 41. 41 ciência das redes modelo de rede livre sem escala
  42. 42. 42 modelo de rede livre sem escala Hubs Nós que concentram grande número de conexões ciência das redes
  43. 43. aplicações Identificação de Comunidades Organizações: encontrar grupos e comunidades Biologia: locating funciontal modules (Ex: Se na análise de uma rede molecular há determinados hubs, possivelmente esses hubs são módulos que podem até desempenhar papel de maior importância no organismo, requerem maior atenção) 43 ciência das redes
  44. 44. 44 ciência das redes aplicações Localização de Caminho Ótimo Organizações: networking, logística, encontrando vínculos sociais (redes sociais) Biologia: diseases pathway
  45. 45. 45 ciência das redes aplicações Viral (Viral Process) Organizações: marketing viral, buzz Computação/Epidemiologia: erradicando vírus, identificando como vírus se espalham
  46. 46. visualização de dados 46
  47. 47. 47 Visualização de dados Visualização das redes
  48. 48. 48 Visualização de dados Visualização das redes
  49. 49. 49 Visualização de dados Visualização das redes
  50. 50. 50 Visualização de dados Visualização das redes
  51. 51. 51 gephi www.gephi.org
  52. 52. 52 introdução ao gephi
  53. 53. 53 introdução ao gephi
  54. 54. 54 introdução ao gephi
  55. 55. 55 Tamanho do nó Cor Centralizar grafo na tela Mostrar/Esconder texto do nó Mostrar/Esconder arestas introdução ao gephi
  56. 56. 56 introdução ao gephi
  57. 57. 57 Detectando comunidades na rede introdução ao gephi
  58. 58. 58 introdução ao gephi Plugins
  59. 59. 59 introdução ao gephi Plugins [https://marketplace.gephi.org/]
  60. 60. 60 introdução ao gephi Layouts ARF
  61. 61. 61 introdução ao gephi Layouts Circular Layout
  62. 62. 62 introdução ao gephi Layouts Concentric Layout
  63. 63. 63 introdução ao gephi Layouts Dual Circle Layout
  64. 64. 64 introdução ao gephi Layouts Fruchterman-Reingold
  65. 65. 65 introdução ao gephi Layouts Radial Axis Layout
  66. 66. 66 introdução ao gephi Principais formatos de arquivos suportados • GEFX (XML; mais recursos; surgiu em 2007 com o Gephi) • GraphML (XML; utilizado no NodeXL, Sonivus, NetworkX, Sonivus) • PajekNET (Arquivo texto; um elemento por linha; reconhecido no Pajek, NodeXL, NetworkX) • GDF (Parecido com tabela de BD ou arquivo CSV, possui definição de tipo; usado no GUESS) • GML (Graph Modeling Language; Graphlet, Pajek, yEd, LEDA, NetworkX) • CSV (Simples, pode ser usado com , ; | “espaço”; Ideal para raw data, dados exportados de BD e Excel)
  67. 67. introdução ao gephi Principais formatos de arquivos suportados [https://gephi.org/users/supported-graph-formats/] 67
  68. 68. 68 introdução ao gephi Datasets ✓ Stanford Large Network Dataset Collection http://snap.stanford.edu/data/ ! ✓ Gephi Wiki - Datasets http://wiki.gephi.org/index.php/Datasets

×