Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Si508 f08-week2.en.es

SI 508 - Redes: Teoría y Aplicación
OPEN MICHIGAN
Si508 f08-week2
CONTENIDO:
Metricas de red

  • Be the first to comment

  • Be the first to like this

Si508 f08-week2.en.es

  1. 1. School of Information University of Michigan A menos que se indique lo contrario, el contenido de este material del curso es bajo licencia 3.0 Licencia Creative Commons Atribución. http://creativecommons.org/licenses/by/3.0/ Copyright 2008, Lada adamic Usted asume toda la responsabilidad por el uso y la posible responsabilidad asociada con cualquier uso del material. Material contiene contenido con derechos de autor, se utiliza de acuerdo con la legislación estadounidense. Los titulares de derechos de autor de contenidos incluidos en este material deben comunicarse open.michigan@umich.edu con cualquier pregunta, correcciones o aclaraciones relacionadas con el uso de los contenidos. Los Regentes de la Universidad de Michigan no autorizar el uso de los contenidos de terceros publicados en este sitio a menos que dicha licencia se concede específicamente en relación con determinados objetos de contenido. Los usuarios de contenido son responsables de su cumplimiento con la ley aplicable. La mención de productos específicos en esta grabación sólo representa la opinión del orador y no representa un respaldo por parte de la Universidad de Michigan. Para obtener más información acerca de cómo citar estos materiales visitan http://michigan.educommons.net/about/terms-of-use.
  2. 2. School of Information University of Michigan Conceptos básicos de red y algunas herramientas Lada adánica
  3. 3. Contorno  ¿Qué es una red?  un grupo de nodos y bordes  ¿Cómo lo caracterizan?  con algunos indicadores básicos de la red  ¿Cómo comenzó el análisis de redes  fueron los matemáticos  ¿Cómo analiza las redes de hoy en día?  con pajek u otro software
  4. 4. ¿Cuáles son las redes?  Las redes son colecciones de puntos unidos por líneas. "Red" ≡ "Gráfico" puntos líneas vértices bordes, arcos matemáticas nodos enlaces ciencias de la computación sitios bonos física actores corbatas, las relaciones sociología nodo borde
  5. 5. Elementos de la red: bordes  Dirigida (también llamados arcos)  A -> B  Una talla B, A hizo un regalo al B, A es hijo de B  Sin dirección  A <-> B o A - B  A y B se gustan  A y B son hermanos  A y B son co-autores  Atributos Edge  peso (por ejemplo, la frecuencia de la comunicación)  rango (mejor amigo, segundo mejor amigo ...)  Tipo (amigo, familiar, compañero de trabajo)  propiedades dependiendo de la estructura del resto de el grafo: por ejemplo, intermediación
  6. 6. Redes dirigidas 2  1  1 2  1 2 1 2 1  2 2 1 1  2 1  2 1  2  1 2 1 2 1  2 1 2 1  2 1  2  1  2 1 2 1 2 1  2  12 1  2 1 2 1 2 1  2  1 2 1  2 Ada Cora Louise Vaquero Helen Martha Alicia Petirrojo Marion Maxine Lena Avellano Hilda Frances Eva RuthEdna Adele Jane Anna María Betty Ella Ellen Laura Irene  dormitorio de la escuela socios de comedor de mesa niñas (Moreno, El lector sociometría, 1960)  primera y segunda opción mostrados
  7. 7. Pesos de las aristas pueden tener valores positivos o negativos  Un gen se activa / inhibe otra  Una persona de confianza / desconfiando otro  Desafío de investigación: ¿Cómo se puede "propagar" sentimientos negativos en una red social? ¿Es el enemigo de mi enemigo mi amigo? Transcripción reglamentario red en la levadura de panadero Fuente: indeterminado
  8. 8. Matrices de adyacencia  En representación de los bordes (que se encuentra junto a los cuales) como una matriz  Laij = 1 si el nodo i tiene una ventaja al nodo j = 0 si el nodo i no tiene una ventaja a j  Laii = 0 a menos que la red tiene la libre bucles  Laij = Aji Si se dejaría en la red, o si iyj comparten un borde correspondido yo j yo yo j 1 2 3 4 Ejemplo: 5 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 0 0 0 0 1 1 1 0 0 0 A =
  9. 9. Listas de adyacencia  Lista Edge  2 3  2 4  3 2  3 4  4 5  5 2  5 1  Lista de Adyacencia  es más fácil trabajar con si la red es  grande  escaso  recuperar rápidamente todos los vecinos de un nodo  1:  2: 3 4  3: 2 4  4: 5  5: 1 2 1 2 3 4 5
  10. 10. Contorno  ¿Qué es una red?  un grupo de nodos y bordes  ¿Cómo lo caracterizan?  con algunos indicadores básicos de la red  ¿Cómo comenzó el análisis de redes  fueron los matemáticos  ¿Cómo analiza las redes de hoy en día?  con pajek u otro software
  11. 11. Caracterización de las redes: ¿Quién es más central? ? ? ?
  12. 12. Nodos  Propiedades de la red de nodos  de conexiones inmediatas  indegree cuántas aristas dirigidas (arcos) inciden en un nodo  grado de salida cuántas aristas dirigidas (arcos) se originan en un nodo  grado (dentro o fuera) número de aristas incidentes en un nodo  de todo el grafo  centralidad (intermediación, cercanía) grado de salida = 2 indegree = 3 grado = 5
  13. 13. Grado Nodo de valores de la matriz  Outdegree o Grado de salida = 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 0 0 0 0 1 1 1 0 0 0 A = ∑= n j ijA 1 ejemplo: grado de salida para el nodo 3 es 2, lo que se obtiene sumando el número de entradas que no son cero en el 3rd fila :  Indegree o Grado de entrada = 0 0 0 0 0 0 0 1 1 0 0 1 0 1 0 0 0 0 0 1 1 1 0 0 0 A =∑= n i ijA 1 ejemplo: el grado de entrada para el nodo 3 es 1, que se obtiene sumando el número de entradas que no son cero en el 3rd columna : ∑= n i iA 1 3 ∑= n j jA 1 3 1 2 3 4 5
  14. 14. Métricas de red: secuencia de grado y grado de distribución  Secuencia Grado: Una lista ordenada de la (in, out) el grado de cada nodo  En grados secuencia:  [2, 2, 2, 1, 1, 1, 1, 0]  Secuencia Out-grado:  [2, 2, 2, 2, 1, 1, 1, 0]  (No dirigida) secuencia de grado:  [3, 3, 3, 2, 2, 1, 1, 1]  Distribución Grado: Un conteo de frecuencia de ocurrencia de cada grado  En grados distribución:  [(2,3) (1,4) (0,1)]  Fuera grado de distribución:  [(2,4) (1,3) (0,1)]  (No dirigida) Distribución:  [(3,3) (2,2) (1,3)] 0 1 2 0 1 2 3 4 5 indegree frequency
  15. 15. Caracterización de las redes: Todo está conectado?
  16. 16. Métricas de red: los componentes conectados  Componentes fuertemente conectados  Cada nodo dentro del componente se puede llegar desde cualquier otro nodo en el componente siguiendo los enlaces dirigidos  Componentes fuertemente conectados  B C D E  La  G H  F  Débilmente componentes conectados: cada nodo se puede llegar desde cualquier otro nodo siguientes enlaces en cualquier dirección La B C D E F G H La B C D E F G H  Componentes débilmente conectados  A B C D E  G H F  En las redes no dirigidos se habla simplemente de "componentes conectados '
  17. 17. métricas de red: tamaño de componente gigante(giant component)  si el componente más grande abarca una fracción significativa de el grafo, se llama la componente gigante (giant component)
  18. 18. métricas de red: modelo de corbata de moño de la web  La Web es un grafo dirigido:  páginas enlazan a otras páginas web  Los componentes conectados nos dicen qué conjunto de páginas se puede acceder desde cualquier otro sólo por el surf (no "saltar" en torno al escribir una URL o usando un motor de búsqueda)  Broder et al. 1999 - rastreo de más de 200 millones de páginas y 1,5 mil millones de enlaces.  SCC - 27.5%  IN y OUT - 21.5%  Zarcillos y tubos - 21.5%  Disconnected - 8%
  19. 19. Caracterización de las redes: ¿A qué distancia están las cosas?
  20. 20. Métricas de red: rutas más cortas  Camino más corto (también llamado un camino geodésico o geodesic path)  La secuencia más corta de enlaces que conecta dos nodos  No siempre es único  A y C están conectados por 2 caminos más cortos  A - E - B - C  A - E - D - C  Diámetro: la distancia geodésica más grande de la gráfica A B C D E  La distancia entre A y C es la distancia máxima para el grafo: 3  Atención: algunas personas usan el término "diámetro" ser la distancia media del camino más corto, en esta clase vamos a utilizar sólo para referirse a la distancia máxima 1 2 2 3 3
  21. 21. Caracterización de las redes: Cómo densa son?
  22. 22. métricas de red: densidad grafo  De las conexiones que puedan existir entre los n nodos  grafo dirigido emax = N * (n-1) cada uno de los n nodos puede conectarse a (n-1) otros nodos  grafo no dirigido emax = N * (n-1) / 2 ya que los bordes no son dirigidas, cuente cada uno una sola vez  ¿Qué fracción están presentes?  densidad = e / emax  Por ejemplo, de 12 posibles conexiones, este grafo tiene 7, lo que supone una densidad de 7/12 = 0,583  ¿Sería esta medida será útil para redes que comparan de diferentes tamaños (diferentes números de nodos)?
  23. 23. (Two-Mode) redes bipartitas  bordes se producen sólo entre dos grupos de nodos, no dentro de esos grupos  por ejemplo, podemos tener los individuos y eventos  directivos y consejos de administración  los clientes y los artículos que compran  metabolitos y las reacciones en que participan
  24. 24. pasando de una a un gráfico bipartito de un modo de  Un modo de proyección  dos nodos del primer grupo están conectados si se ligan al mismo nodo en el segundo grupo  cierta pérdida de información  naturalmente alta  Red de dos modos grupo 1 grupo 2
  25. 25. Contorno  ¿Qué es una red?  un grupo de nodos y bordes  ¿Cómo lo caracterizan?  con algunos indicadores básicos de la red  ¿Cómo comenzó el análisis de redes  fueron los matemáticos  ¿Cómo analiza las redes de hoy en día?  con pajek u otro software
  26. 26. Historia: La teoría de grafos  Euler Siete Puentes de Königsberg - Uno de los primeros problemas en la teoría de grafos  ¿Existe una ruta que atraviesa cada puente una sola vez y vuelve al punto de partida? Fuente: http://en.wikipedia.org/wiki/Seven_Bridges_of_Königsberg Imagen 1 - v1.2 GNU: Bogdan, Wikipedia; http://commons.wikimedia.org/wiki/Commons:GNU_Free_Documentation_License Image 2 - GNU v1.2: Booyabazooka, Wikipedia; http://commons.wikimedia.org/wiki/Commons:GNU_Free_Documentation_License Imagen 3 - GNU v1.2: Riojajar, Wikipedia; http://commons.wikimedia.org/wiki/Commons:GNU_Free_Documentation_License
  27. 27. Caminos de Euler  Si el punto de partida y el punto final son los mismos:  sólo es posible si no hay nodos tienen un grado impar  cada ruta debe visitar y dejar a cada orilla  Si no es necesario volver a punto de partida  puede tener 0 o 2 nodos con un grado impar Ciclo euleriano: travesía cada borde exactamente una vez Camino de Hamilton: visita cada vértice exactamente una vez
  28. 28. Bi-camarillas (camarillas en grafos bipartitos)  Km, n es el grafo bipartito completo con m y n vértices de los dos tipos diferentes  K3,3 mapas a la gráfica de utilidad  ¿Hay una manera de conectar tres utilidades, por ejemplo, gas, agua, electricidad a tres casas sin tener ninguna de las tuberías cruzan? K3,3 Utilidad gráfica
  29. 29. Grafos planos  Un grafo es planar si se puede dibujar en un plano sin ningún cruce bordes
  30. 30. Cuando gráficos no son planas  Dos gráficos son homeomorfo si se puede hacer uno en el otro mediante la adición de un vértice de grado 2
  31. 31. Camarillas y gráficos completos  Knes el grafo completo (pandilla) con vértices K  cada vértice está conectado a cada otro vértice  hay n * (n-1) / 2 bordes no dirigidos K5 K8 K3
  32. 32. Gráfico Peterson  Ejemplo de uso de contracciones de vanguardia para mostrar un gráfico no es plana
  33. 33. Contracciones borde definido  Un gráfico finito G es plano si y sólo si no tiene subgrafo que es homeomorfo o de punta contráctil a la gráfica completa en cinco vértices (K5) O el gráfico bipartito completa K3, 3.(Teorema de Kuratowski)
  34. 34. #s de grafos planos de diferentes tamaños 1: 1 2: 2 3: 4 04:11 Cada grafo plano tiene una línea recta incrustar
  35. 35. Árboles  Los árboles son grafos no dirigidos que no contienen ciclos
  36. 36. ejemplos de árboles  En la naturaleza  El hombre hizo  Ciencias de la Computación  El análisis de redes
  37. 37. Contorno  ¿Qué es una red?  un grupo de nodos y bordes  ¿Cómo lo caracterizan?  con algunos indicadores básicos de la red  ¿Cómo comenzó el análisis de redes?  fueron los matemáticos  ¿Cómo analiza las redes de hoy en día?  con pajek u otro software
  38. 38. visión general de las herramientas de análisis de red Pajek análisis de redes y la visualización, menús, adecuado para grandes redes plataformas: Windows (en Linux a través del vino) descargar Netlogo modelado basado en agentes Recientemente añadido capacidades de modelado de red plataformas: cualquier (Java) descargar GUESS análisis de redes y la visualización, extensible, guión impulsado (jython) plataformas: cualquier (Java) descargar herramientas de software que nosotros no vamos a utilizar pero que pueden serle de utilidad: zación y análisis: - Fácil de usar visualización de la red social y el software de análisis (redes más pequeñas adecuadas) H - Si usted está familiarizado con R, se puede utilizar IGRAPH como un módulo para analizar o crear redes de gran tamaño, o puede utilizar directamente las funci Amplia biblioteca de Java de las rutinas de análisis de redes, creación y visualización e de gráficos para Matlab (No probado?) - Si Matlab es el entorno en el que se sienta más cómodo en, aquí hay algunas rutinas básicas - Para p * modelos y análisis longitudinal e SNA para R - Todo tipo de análisis + pesados estadísticas para arrancar​​ kX - Python basado paquete gratuito para el análisis de grandes gráficos Ciberinfraestructura - Gran aglomeración de análisis de redes herramientas / rutinas, en parte a través de menús visualización: Viz - Software de visualización de la red de código abierto (puede manejar grandes redes / especializados) Graph - Necesidad de crear rápidamente una visualización interactiva para la web? Visualización gráfica libre y edición software alizada: mo hallazgo comunidad de rápido s con motivos eca CLAIR - PNL y la biblioteca IR (Perl Based) incluye las rutinas de análisis de redes finalmente: INSNA larga lista de paquetes S
  39. 39. herramientas usaremos  Pajek: amplia funcionalidad basada en menús, incluyendo muchas, muchas métricas de red y manipulaciones  pero ... no extensible  Guess: extensibles, herramientas de secuencias de comandos de análisis exploratorio de datos, pero la selección más limitada de métodos incorporados en comparación con Pajek  NetLogo: plataforma general agente basado en la simulación con el apoyo de modelado excelente red  muchos de los demos en este curso fueron construidos con NetLogo  IGRAPH: utilizado en la versión de nivel de doctorado de este curso. bibliotecas se puede acceder a través de R o Python. Rutinas escalan a millones de nodos.
  40. 40. otras herramientas: herramienta de visualización: Gephi  http://gephi.org  principalmente para la visualización, tiene algunos toques agradables
  41. 41. herramienta de visualización: GraphViz  Toma descripciones de gráficos en los lenguajes de texto simples  Genera imágenes en formatos útiles  Opciones de formas y colores  Independiente o utilizar como una biblioteca  dot: dibujos jerárquicos o capas de grafos dirigidos, evitando los cruces de borde y la reducción de longitud de borde  neato (Kamada-Kawai) y el FDP (Fruchterman-Reinhold con la heurística para manejar gráficos de mayor tamaño)  DosPi - diseño radial  circo - diseño circular http://www.graphviz.org/
  42. 42. GraphViz: lenguaje dot digrafo G { ranksep = 4 nodesep = 0,1 size = "8,11" ARCH531_20061 [label = "ARCH531", style = negrita, color = amarillo, style = lleno] ARCH531_20071 [label = "ARCH531", gstyle = negrita, color = amarillo, style = lleno] BIT512_20071 [label = "BIT512", gstyle = negrita, color = amarillo, style = lleno] BIT513_20071 [label = "BIT513", gstyle = negrita, color = amarillo, style = lleno] BIT646_20064 [label = "BIT646", gstyle = negrita, color = amarillo, style = lleno] BIT648_20064 [label = "BIT648", gstyle = negrita, color = amarillo, style = lleno] DESCI502_20071 [label = "DESCI502", gstyle = negrita, color = amarillo, style = lleno] ECON500_20064 [label = "ECON500", gstyle = negrita, color = amarillo, style = lleno] ... ... SI791_20064->SI549_20064[weight=2,color=slategray,style="setlinewidth(4)"]SI791_20064- >SI596_20071[weight=5,color=slategray,style=bold,style="setlinewidth(10)"]SI791_20064- >SI616_20071[weight=2,color=slategray,style=bold,style="setlinewidth(4)"]SI791_20064- >SI702_20071[weight=2,color=slategray,style=bold,style="setlinewidth(4)"]SI791_20064- >SI719_20071[weight=2,color=slategray,style=bold,style="setlinewidth(4)"]
  43. 43. Dot (GraphViz)
  44. 44. Escuela, por supuesto, la información de recomendación de Lada (GraphViz) LaRCH531BYOT545 BYOT645BYOT750YOOE491 MO501 SYO512SYO514SYO543SYO551 SYO554SYO557 SYO575SYO605SYO622SYO650SYO654 SYO663SYO684SYO688SYO884 COMM810EECS492YOOE536 MKT501SYO504 SYO539SYO553 SYO599 SYO625SYO627 SYO628SYO644SYO647 SYO649SYO653SYO658 SYO668SYO681 SYO682SYO689 SYO699SYO702 ELYO321 SYO622 SYO690 RLaCKHLaM998 SYO512 SYO539 SYO607 SYO540 SYO543 SYO605 SYO702SYO615 SYO625 SYO654 SYO658 SYO670 SYO682 SYO688 SYO689 SYO702SYO791
  45. 45. MHS663 RLaCKHLaM575SYO502 SYO515 SYO581SYO596SYO615SYO616 SYO620 SYO621SYO626SYO643SYO646SYO655 SYO690 SYO692SYO696SYO702 SYO792 COMM810 EDCURYONS575EDUC601 ENGLYOSH516 HYOSTORY698MHS663 SYO540SYO575 SYO579SYO596SYO624 SYO629SYO637SYO665SYO666 SYO690 SYO791SYO901 SYO501 SYO502SYO503 SYO504 SYO515 SYO557 SYO575 SYO580 SYO581 SYO632 SYO655SYO692 SYO596 SYO626SYO643 SYO596SYO601 SYO620 SYO624 SYO792 SYO640SYO647 SYO674 SYO663 SYO665SYO667SYO690 Escuela, por supuesto, la información de recomendación de Lada (GraphViz)
  46. 46. Neato (Graphviz)
  47. 47. Otras herramientas de visualización: Morsa  desarrollado en CAIDA disponible bajo la GNU GPL.  "... El más adecuado para la visualización de gráficos de tamaño moderado que son casi los árboles. Un gráfico con unos pocos cientos de miles de nodos y sólo ligeramente mayor número de enlaces es probable que sea cómodo para trabajar con ".  Basada en Java  Características implementadas  la prestación a una velocidad garantizada, independientemente del tamaño gráfico  nodos para colorear y enlaces con un color fijo, o por valores RGB almacenados en los atributos  nodos de etiquetado  recoger los nodos para examinar los valores de atributos  mostrar un subconjunto de nodos o enlaces basado en un atributo booleano suministrada por el usuario  poda interactivo de la gráfica para reducir temporalmente el desorden y la oclusión  zoom dentro y fuera Fuente: CAIDA, http://www.caida.org/tools/visualization/walrus/
  48. 48. herramientas de visualización: YED - Java ™ del editor de gráficos http://www.yworks.com/en/products_yed_about.htm (Bueno sobre todo para los diseños, tal vez gratis)
  49. 49. yEd y 26.000 nodos (tarda unos segundos)
  50. 50. herramientas de visualización: Prefuse  (Gratis) conjunto de herramientas de interfaz de usuario para la visualización interactiva de información  construido en Java usando Java2D biblioteca de gráficos  estructuras de datos y algoritmos  arquitectura de canalización que ofrece, módulos componibles reutilizables  animación y apoyo renderizado  técnicas arquitectónicas de escalabilidad  requiere conocimientos de programación Java  página web: http://prefuse.sourceforge.net/  Papel CHI http://guir.berkeley.edu/pubs/chi2005/prefuse.pdf
  51. 51. Visualizaciones Prefuse simples Fuente: Prefuse, http://prefuse.sourceforge.net/
  52. 52. Ejemplos de las aplicaciones Prefuse: mapas de flujo Un mapa de flujo de la migración desde California a partir de 1995-2000, generado automáticamente por nuestro sistema mediante el enrutamiento de borde pero no el ajuste de maquetación.  http://graphics.stanford.edu/papers/flow_map_layout/
  53. 53. Ejemplos de las aplicaciones Prefuse: vizster  http://jheer.org/vizster/
  54. 54. Contorno  Métricas de red pueden ayudar a caracterizar las redes  Esto tiene es raíces en la teoría de grafos  Hoy en día existen muchas herramientas de análisis de red para elegir  aunque la mayoría de ellos están en fase beta!  En el laboratorio: análisis de redes exploratorio con Pajek

×