Apresentação I WPOSINFO - UFABC - Identificação de grupos em grafos

  • 833 views
Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
833
On Slideshare
0
From Embeds
0
Number of Embeds
3

Actions

Shares
Downloads
1
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Identificação de presença de grupos em grafos por níveis de distribuição de grau de centralida de Dalton MartinsDoutorando em Ciência da Informação Universidade de São Paulo dmartins@gmail.com Http://daltonmartins.blogspot.com I WPOSINFO Universidade Federal do ABC 2011
  • 2. Introdução● O uso de grafos para modelar e visualizar relações de nós em uma configuração de rede, tem sido uma tendência na análise de problemas computacionais na última década. ● Exemplos: cadeia alimentar, rede imunitária, rede metabólica, rede neural, sistema financeiro, rede de citações, rede de sinônimos, WWW, árvore genealógica, coautoria de artigos, participação em filmes, rede de amizades, contatos, rede internet física, rede de distribuição de energia elétrica, telecomunicações, transporte, etc.● No entanto, grafos podem apresentar padrões complexos de difícil percepção visual, exigindo, portanto, formas de agrupamento e redução de objetos visualizados como modo de facilitar a identificação de tendências e padrões.
  • 3. Introdução● Os nós possuem número de conexões que em redes reais não apresentam distribuições homogêneas, seguindo, em geral, padrões de distribuição regulados por uma lei de potência, indicando poucos nós com muitas conexões e muitos nós com poucas conexões.● A distribuição das conexões também apresenta um padrão que não é global, ou seja, há grandes concentrações para um grupo específico de nós e poucas para outros grupos (Fortunato, 2010).● A descoberta desses padrões de distribuição pode levar a identificação de grupos de nós, permitindo maior capacidade de síntese, novos modos de visualização e exploração dos recursos disponíveis nas conexões em uma rede (Girvan & Newman, 2002).
  • 4. Introdução● Outro modo de produzir síntese melhorando os modos de visualização de padrões em redes é remover as conexões mais fracas do grafo, reduzindo o número de informações disponíveis, facilitando a identificação das relações e posições estruturais dos nós mais centrais na rede (Persson, 2011).● Observa-se que o ponto central desses dois modos de identificar grupos e simplificar a complexidade informacional dos grafos consiste na análise de como se distribuem as conexões entre os nós, seja identificando as mais intensas e recorrentes, seja identificando as mais fracas e periféricas.
  • 5. Objetivo● Apresentamos neste trabalho um primeiro estudo indicando que a análise da distribuição do grau de centralidade dos nós de uma rede pode ser utilizada para a identificação automática de níveis de conexões dos nós em um grafo, facilitando a identificação da presença de grupos.
  • 6. Metodologia● Utilizamos para a realização deste primeiro trabalho experimental um banco de dados de um sistema de ensino à distância, utilizado por aproximadamente 1.400 alunos de um curso de formação para inclusão digital em todo o território brasileiro.● Os dados coletados representam 6 meses de interação entre os participantes.● Utilizamos apenas os dados das conversas no módulo de mensagens instantâneas do sistema. ● o módulo fica visível o tempo todo para os alunos, indicando quem está online e disponível para conversar em qualquer momento do curso; ● o módulo é utilizado de forma espontânea, ou seja, não há nenhuma atividade do curso que promova ou incentive seu uso específico.● Os alunos foram modelados em cor verde e os tutores, responsáveis pela aplicação da formação, em cor amarela. Não identificados são representados em vermelho.
  • 7. Resultados Distribuição do grau de centralidade 1000 f(x) = 473,9 x^-1,34 R² = 0,85 100 Contagem 10 1 1 10 100 1000 Grau de centralidade> =Grau de centralidade 10 15 20Número de nós 447 269 192% do total de nós 34,23% 20,60% 14,70%
  • 8. Resultados >= 10 (grau de centralidade dos nós)
  • 9. Resultados >= 15 (grau de centralidade dos nós)
  • 10. Resultados >= 20 (grau de centralidade dos nós)
  • 11. Conclusões● O uso de níveis de centralidade a partir da análise da distribuição de seus graus parece indicar um procedimento que reduz a complexidade da informação em grafos de redes, facilitando a identificação da presença de grupos e análise de padrões.
  • 12. Referências● Fortunato, S. Community detection in graph. Phys. Rep., 2010. 486: 75-174.● Girvan, M., Newman, M. E. J. Community structure in social and biological networks. PNAS., 2002. vol. 99 no. 12: 7821-7826.● Persson, O. Short, strong and simple mapping of research fields. Proceedings of ISSI 2011 - Durban, July 4-7, 2011.