Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Redes complejas maidana

260 views

Published on

excelente

Published in: Education
  • Be the first to comment

  • Be the first to like this

Redes complejas maidana

  1. 1. Redes Complejas: Estructura, Din´mica y Evoluci´n a o Maximino Aldana (Dated: Diciembre 2011)“La materia no s´lo interact´a, tambi´n se organiza. o u e II. ALGUNAS DEFINICIONESConocemos b´sicamente todas las leyes de interacci´n a ode la materia, pero no sabemos casi nada sobre susleyes de organizaci´n”. o A. Sistemas complejosAlbert L. Lehninger (1917-1986) Comenzemos nuestro estudio describiendo qu´ son los e sistemas complejos. Como ocurre con la gran mayor´ de ıa los conceptos cient´ ıficos, no podemos definir los sistemas complejos en un simple enunciado. En lugar de ´sto, va- e mos a enumerar las caracter´ ısticas m´s importantes que a I. ´ INTRODUCCION son comunes a todos los sistemas complejos: 1. Est´n compuestos de muchas partes que inter- a En los ultimos 11 a˜os hemos sido testigos de una ex- ´ n act´an entre s´ De hecho, el adjetivo “Complejo” u ı.plosi´n en el estudio de las propiedades estructurales y o en este contexto no significa solamente que el siste-din´micas de las redes complejas. Durante este tiempo a ma sea complicado, sino tambi´n que est´ compues- e ase han publicado cientos de art´ ıculos sobre este tema en to de muchas partes, como un complejo industrial.revistas de investigaci´n cient´ o ıfica internacionales de dife-rentes disciplinas, que abarcan f´ısica, biolog´ sociolog´ ıa, ıa, 2. Cada parte tiene su propia estructura interna yneurolog´ econom´ medicina, por mencionar algunos ıa, ıa, est´ encargada de llevar a cabo una funci´n espec´ a o ıfi-ejemplos. Este inter´s en las redes complejas radica en e ca.que nos hemos dado cuenta de que dichas redes abundanen la naturaleza, son parte de nuestra vida diaria y se 3. Lo que ocurra a una parte del sistema afecta depresentan a diferentes niveles de organizaci´n. Por ejem- o manera altamente no lineal a todo el sistema.plo, algunas redes biol´gicas que encontramos en el nivel o 4. Presentan comportamientos emergentes, de talmicrosc´pico son las redes de regulaci´n gen´tica, redes de o o e manera que el el todo no es la simple suma de susprote´ınas, redes neuronales, redes metab´licas. Por otro o partes.lado, a un nivel de organizaci´n mucho mayor, encontra- omos redes de comunicaci´n e inform´ticas (la red inter- o a Como un ejemplo t´ ıpico de sistema complejo conside-net, la red www, redes telef´nicas, etc.), redes sociales o remos a la c´lula. Evidentemente la c´lula est´ compues- e e a(amistades, contactos sexuales, colaboradores cient´ ıficos, ta de muchas partes (ribosomas, mitocondrias, n´cleo, upropagaci´n de enfermedades, etc.), redes ecol´gicas (in- o o membrana, ret´ ıculo endoplasm´tico, ADN, ARN, etc.), ateracciones tr´ficas en un ecosistema). Las redes com- o y cada una de estas partes se encarga de realizar algu-plejas son ubicuas, est´n por todos lados. Incluso se ha a na funci´n espec´ o ıfica dentro de la c´lula. Las partes de eestudiado la red de super h´roes en el Universo de Mar- e la c´lula responden de forma no lineal ante perturbacio- evel, siendo el hombre ara na el super h´roe m´s popular e a nes externas. Por ejemplo, algunas veces una mutaci´n ocon la mayor conectividad [1]. Es un hecho sobresalien- en el ADN no tiene ning´n efecto en la c´lula, mientras u ete el que todas estas redes, tan diferentes en naturaleza que otras veces una s´la mutaci´n puede ser fatal[14]. o oy en tama no, tengan muchas propiedades estructurales Adem´s, la c´lula presenta comportamientos emergentes a esimilares. Este hecho, tan simple como sorprendente, ha- que no pueden explicarse en t´rminos de las propiedades ece posible que podamos formular modelos matem´ticos a de sus partes individuales. As´ podemos hablar de una ı,para entender y explicar las propiedades estructurales (y c´lula enferma, pero no podemos decir que un ribosoma een algunos casos tambi´n las propiedades din´micas) de e a o una prote´ est´n enfermos. La enfermedad es una ına elas redes complejas. propiedad que emerge como resultado de la organizaci´n o En estas notas presento algunas de las herramientas colectiva de todos los constituyentes de la c´lula. ematem´ticas y conceptuales que se han desarrollado a alo largo de varios a nos para analizar la estructura ydin´mica de las redes complejas. Los que est´n intere- a e B. Redes Complejassados podr´n encontrar un estudio mucho m´s completo a adel que presento aqu´ en las referencias [2–5], las cuales ı Las redes complejas son conjuntos de muchos nodosson trabajos de revisi´n excelentes que sirven como pun- o conectados que interact´an de alguna forma. A los no- uto de partida para adentrarse en el fascinante mundo de dos de una red tambi´n se les llama v´rtices o elementos e elas redes complejas. y los representaremos por los s´ ıimbolos v1 , v2 , ..., vN ,
  2. 2. 2donde N es el n´mero total de nodos en la red. Si un u Redes socialesnodo vi est´ conectado con otro nodo vj , esta conexi´n a o Dos personas est´n conectadas ase representa por una pareja ordenada (vi , vj ). La defini- Sexuales si han tenido por lo menos una relaci´n sexual oci´n matem´tica de una red (tambi´n llamada grafo por o a e Dos actores est´n conectados si alos matem´ticos) es la siguiente: a Actores han aparecido en la misma pel´ ıculaDefinici´n 1 Una red R consiste de un conjunto de no- o Dos personas est´n conectadas si a Amistades son amigasdos V = {v1 , v2 , . . . , vN }, y un conjunto de parejas Dos cient´ıficos est´n conectados si han aordenadas E = {(vi , vj )} ⊂ V × V. Cada pareja ordenada Cient´ıficos sido coautores en alg´n art´ u ıculo(vi , vj ) se llama conexi´n dirigida del nodo vi al nodo o Dos personas est´n conectadas si avj . La red R se llama no dirigida si para cada pareja Familiares son familiares cercanos(vi , vj ) ∈ E tambi´n existe la pareja (vj , vi ) ∈ E. De lo e Dos personas est´n conectadas si una acontrario, la red se denomina dirigida. Llamaremos a Enfermedades contagi´ de una enfermedad a la otra otodos los nodos que est´n conectados directamente a un e Redes inform´ticas anodo vi , los vecinos de vi . Finalmente, el n´mero ki de u Dos computadoras est´n conectadas si a Internetvecinos del nodo vi (es decir, el n´mero de conexiones u hay un cable que las conectade vi ) se llama la conectividad de vi , y el promedio de Dos p´ginas web est´n conectadas si a a ∑N WWWestas conectividades, ⟨k⟩ = N −1 i=1 ki , es la conecti- hay un hiperv´ ınculo de una a la otravidad de la red. Dos palabras est´n conectadas si en a Palabras el diccionario una aparece en la definici´n o Aunque la definici´n formal de una red es util en el o ´ de la otradesarrollo matem´tico de la teor´ para nuestros prop´si- a ıa, o Dos palabras est´n conectadas si son a Palabrastos basta con considerar que una red es un mont´n de o sin´nimos o Redes biol´gicas onodos entre los que existen coneciones. En la naturale- Dos prote´ ınas est´n conectadas si aza se pueden encontrar muchos tipos de redes, es decir, Prot´icas e participan en la misma reacci´n qu´ o ımicamuchos tipos de nodos y conexiones. Por ejemplo, en una Dos genes est´n conectados si uno ared social los nodos son las personas y las conexiones pue- Gen´ticas e regula la expresi´n del otro oden ser los lazos de amistad que existan entre ellas: dos Dos especies est´n conectadas apersonas est´n conectadas si son amigos. En la misma a Ecol´gicas o si una se come a la otrasociedad podemos definir las conexiones de forma distin- Dos neuronas est´n conectadas si existe a Neuronalesta, por ejemplo, dos personas est´n conectadas si han a una conexi´n sin´ptica entre ellas o atenido relaciones sexuales. Claramente, la red definida atrav´s de amistades es diferente a la red definida a trav´s e e Cuadro I. Diferentes tipos de redes.de contactos sexuales, ya que el hecho de que dos perso-nas sean amigas no significa que hayan tenido relacionessexuales, y viceversa. de mi p´gina hacia la de la jornada, pero no hay una a Notemos entonces que incluso en un mismo conjunto conexi´n de regreso. ode nodos podemos definir redes diferentes dependiendo Intuitivamente, una red no dirigida puede pensarse co-de como hayamos definido las conexiones, lo cual, por mo aquella en la que las conexiones entre los nodos siem-supuesto, depende del fen´meno que nos interese estu- o pre son sim´tricas (si A est´ conectado con B, entonces B e adiar. Por ejemplo, si estuvi´semos interesados en analizar e est´ conectado con A), mientras que en una red dirigida acomo se propaga una enfermedad como el SIDA en una no todas las conexiones son sim´tricas, es decir, siempre esociedad, claramente nos convendr´ estudiar la red de in- ıa existen conexiones asim´tricas (A est´ conectado con B e ateracciones sexuales, mientras que si estamos interesados pero B no est´ conectado con A). aen encontrar a un asesino, lo que nos conviene es estudiar Otro concepto importante es el de islas (o sub redes) dela red de amistades, ya que son sus amigos los que pue- una red. Notemos que la definici´n de red que dimos arri- oden darnos informaci´n sobre su paradero. El Cuadro I o ba no dice que todos los nodos deben estar conectadosmuestran diferentes tipos de redes que se encentran en la unos con otros. Ni siquiera dice que todos los nodos de-naturaleza. ben tener conexiones. La definici´n matem´tica nos dice o a En los ejemplos anteriores hay redes dirigidas y redes que una red es un conjunto de nodos entre los que exis-no dirigidas. Por ejemplo, la red de contactos sexuales es ten algunas conexiones. Esto quiere decir que en la redno dirigida, ya que si A tuvo relaciones con B, entonces pueden existir nodos que no tengan conexiones, es decir,evidentemente B tuvo relaciones con A. Pero la red de nodos aislados. Tambi´n pueden existir grupos de nodos etransmisi´n de la gripe es dirigida, ya que si A contagi´ de o o que est´n conectados entre s´ pero que no est´n conec- e ı egripe a B, no necesariamente B contagi´ tambi´n a A. o e tados con el resto de la red. Como un ejemplo concretoOtra red dirigida es la World Wide Web (WWW). En mi pensemos en una red social en la que dos individuos est´n ap´gina web yo tengo una liga a la p´gina del peri´dico la a a o conectados sin son familiares cercanos (espec´ ıficamente,jornada, pero en la p´gina de la jornada no hay ninguna a hermanos, medios hermanos, primos, padres, hijos, espo-liga a mi p´gina web. En este sentido, hay una conexi´n a o sos, t´ ıos, sobrinos, abuelos y nietos). Esta es evidente-
  3. 3. 3 . REDES COMPLEJAS Estructura Dinamica Distribucion de conexiones Sincronizacion Coeficiente de agrupamiento Transiciones de fase . . Longitud promedio Aprendizaje Componente gigante Procesos difusivos ... ... . Figura 2. El estudio de las redes complejas puede dividirse en dos partes: (a) el estudio de sus propiedades estructurales y (b) el estudio de sus propiedades din´micas. aFigura 1. Una red puede estar compuesta de varias islas, como enel ejemplo mostrado en esta figura. La isla m´s granda se denomina ala isla gigante. III. ESTUDIO DE LAS REDES COMPLEJAS Ejemplos de redes dirigidas y no dirigidas abundan en la naturaleza. Ahora ustedes pueden comenzar a pensar en la red que m´s les guste, ya sea una red biol´gica, so- a omente una red no dirigida, ya que si A es familiar de B, cial, inform´tica o cualquier otra. Las redes se presentan aentonces B tambi´n es familiar de A. Sin embargo, muy e en diferentes tamaos, colores y sabores. Pero, ¿qu´ hace- eprobablemente en una sociedad grande esta red estar´ ıa mos con las redes? ¿C´mo las estudiamos? ofracturada en islas o sub redes, debido a que claramen- El estudio general de las redes complejas puede divi-te no todas las personas en una sociedad son familiares dirse en dos campos diferentes y complementarios: Es-cercanos de todos los dem´s. En mi caso particular, mi a tructura y Din´mica (ver la Fig. 2). En el primer campo aapellido es “Aldana Gonz´lez”, por lo que es natural pen- a de estudio uno est´ interesado en determinar las propie- asar que estoy conectado directamente con algunas de las dades estructurales (o topol´gicas) de la red, es decir, en ofamilias Aldana y algunas las familias Gonz´lez en M´xi- a e las propiedades que nos dicen c´mo est´n conectados los o aco. Pero muy probablemente ning´n miembro de mi fa- u nodos unos con otros. Algunas de las propiedades m´s amilia est´ conectado con alguien de la familia Azc´rraga, a a importantes que determinan la estructura (o topolog´ ıa)o con la familia Zabludovsky. Por lo tanto, los miem- de una red son las siguientes:bros de mi familia conforman una isla o sub red dentrode la cual estamos conectados entre nosotros, pero esta 1. La distribuci´n de conexiones (o vecinos) oisla est´ desconectada de otras familias de la sociedad. a P (k): Es la probabilidad de que un nodo escogidoLa Fig. 1 muestra un ejemplo de una red compuesta de al azar tenga k conexiones (o vecinos). Por ejemplo,varias islas. en una red de contactos sexuales P (k) es la proba- bilidad de que una persona escogida al azar en una Las islas en una red pueden tener diferentes tama nos, sociedad haya tenido k parejas sexuales distintas aque van desde 1 (un s´lo nodo que no est´ conectado a o a lo largo de su vida.nadie) hasta el tama no de toda la red (todos los nodosest´n conectados con todos), en cuyo caso la red consiste a 2. El coeficiente de agregaci´n C: Es la probabi- ode una s´la isla, que es ella misma. Es importante en- o lidad de que dos nodos conectados directamente afatizar que el hecho de que una isla no est´ conectada e un tercer nodo, est´n conectados entre s´ (ver la e ıal cuerpo principal de la red no significa que dicha is- Fig. 3(a)). Por ejemplo, en una red de amistades,la no pertenezca a la red. La red no est´ determinada a es la probabilidad de que dos de mis amigos seans´lo por las conexiones, sino tambi´n por los nodos que o e ellos mismos amigos uno del otro.conforman al sistema. Esto puede parecer poco intuitivo,pero desde el punto de vista matem´tico es conveniente a 3. La longitud m´ ınima Lij entre dos nodos vi yconsiderar que todos los nodos del sistema pertenecen a vj : Es el n´mero m´ u ınimo de “brincos”que se tienenla red, independientemente de que haya o no conexiones que dar para llegar de un nodo vi de la red a otroentre ellos. Como veremos m´s adelante, las islas juegan a nodo vj de la red. Por ejemplo, en la red mostradaun papel importante en la teor´ de redes. ıa en la Fig. 3(b), aunque existen varios caminos para
  4. 4. 4 cada d´ aparcen m´s y m´s art´ ıa a a ıculos en la literatura v1 v2 cient´ ıfica donde se estudian nuevos procesos din´micos a vi v3 sobre redes complejas. En estas notas introductorias nos enfocaremos m´s al a v4 estudio de las propiedades estructurales de las redes com- vj plejas. Sin embargo, en el ultimo cap´ ´ ıtulo veremos un poco las propiedades din´micas de redes neuronales. a (a) (b) IV. ESTRUCTURA DE LAS REDES COMPLEJASFigura 3. (a) Los nodos v1 , v2 y v3 est´n conectados al nodo v4 . Sin a A. Distribuci´n de vecinos oembargo, los nodos v1 y v2 no est´n conentados entre s´ mientras a ı,que los nodos v2 y v3 s´ lo est´n. Esto significa que no todos los ı a Tal vez la propiedad m´s importante que caracteriza a“amigos” de v4 son amigos entre s´ lo cual disminuye el coeficiente ı, la estructura de una red compleja es la distribuci´n deode agregaci´n. (b) A´ n cuando existen varios caminos para llegar o udel nodo vi al nodo vj , el camino de longitud m´ ınima consiste de vecinos P (k), que nos d´ la probabilidad de que un nodo atres pasos, indicados con l´ ıneas gruesas en la figura. escogido al azar tenga k conexiones (o vecinos). En los trabajos recientes que se han llevado a cabo para carac- terizar a las redes complejas se ha encontrado que existen llegar de vi a vj , el camino m´ ınimo consiste de tres tres tipos de distribuciones P (k) importantes, las que de- pasos (indicado con l´ ıneas gruesas). terminan tres estructuras o topolog´ ıas[15] diferentes: 4. La longitud promedio de la red L: Es el pro- zk medio de las longitudes m´ ınimas Lij entre todas las Topolog´ de PoissonP (k) = e−z ıa , (1) posibles parejas de nodos (vi , vj ) de la red. k! 5. La distribuci´n de tama nos de islas P (s): Es o Topolog´ ExponencialP (k) = Ce−αk , ıa (2) la probabilidad de que una isla est´ compuesta por e s nodos. Topolog´ Libre de Escala P (k) = Ck −γ . ıa (3) 6. El tama no de la isla m´s grande, al que de- a Las redes con topolog´ de Poisson son importantes ıa notaremos por S∞ . principalmente por razones hist´ricas, ya que dichas re- o des fueron las primeras que se analizaron matem´tica-a En una red, los nodos adem´s de estar conectados a mente. Este an´lisis lo llevaron a cabo los matem´ticos a atambi´n interactuan, y las interacciones pueden dar lu- e h´ngaros Paul Erd¨s (1913-1996) y Alfr´d R´nyi (1921- u o e egar a fen´menos din´micos muy interesantes. Por lo tan- o a 1970) en la d´cada de los 50s. Ellos tambi´n reportaron e eto, adem´s de estudiar las propiedades estructurales de a la primera transici´n de fase topol´gica observada en re- o ouna red tambi´n es importante estudiar sus propieda- e des con topolog´ de Poisson. Por lo tanto, a estas redes ıades din´micas una vez que sabemos de qu´ manera in- a e tambi´n se les conoce como redes tipo Erd¨s-R´nyi. Sin e o eteractuan los nodos. Por ejemplo, las enfermedades en embargo, a pesar de su importancia hist´rica, las redes ouna sociedad no son est´ticas, sino que se propagan por a con topolog´ de Poisson est´n lejos de ser una represen- ıa atoda la poblaci´n dando lugar a epidemias. Las neuro- o taci´n realista de las redes reales observadas en la natu- onas en el cerebro est´n conectadas f´ a ısicamente unas con raleza. No fue sino hasta 1998 que se comenz´ el estudio ootras por medio de las uniones entre dendritas y axones. sistem´tico de las propiedades topol´gicas de las redes a oA trav´s de dichas uniones las neuronas se transmiten e complejas reales. En este estudio participaron principal-se nales el´ctricas que se propagan por todo el cerebro e mente y de forma independiente Albert L´sl´-Barab´si, a o ay que dan lugar a una serie de fen´menos din´micos in- o a Ricard Sol´ y Mark J. Newman. Ellos encontraron que la eteresant´ ısimos, entre los cuales destacan el reconocimien- topolog´ exponencial aparece algunas veces en las redes ıato de im´genes y sonido, la motricidad de los m´sculos, a u reales. Pero el resultado m´s sorprendente de sus estudios ael lenguage, el pensamiento y finalmente la consciencia. fue la ubicuidad de las redes con topolog´ libre de escala, ıaOtros ejemplos son la propagaci´n de virus inform´ticos o a la cual aparece pr´cticamente en todos lados, desde las aen la red internet, o la comunicaci´n entre los peces que o peque nas redes metab´licas dentro de la c´lula, hasta o eda lugar a grupos enormes de peces moviendose todos las grandes redes inform´ticas como la red Internet. En aen la misma direcci´n. En fin, existen tantos fen´menos o o el Cuadro II se listan algunas de las redes con topolog´ıasdin´micos en redes complejas como interacciones f´ a ısicas, libres de escala que se han encontrado en los ultimos 10 ´qu´ımicas, inform´ticas, o sociales se puedan imaginar, y a a˜os. n
  5. 5. 5 Red N´ m. de nodos N´ m. de conexiones u u γi dominio www.nd.edu 325,729 1,469,680 2.1 P´ginas de WWW a 2,711 × 109 2,130 × 109 2.1 encontradas por Altavista Dominos en 2,60 × 105 —– 1.9 la WWW Nivel de inter-dominio 4,389 8,256 2.2 de la Internet Sistemas aut´nomos o 6,374 13,641 2.2 en la Internet Nivel de ruteador 150,000 200,000 2.3 en la Internet Citas en la base 783,339 6,716,198 3.0 de datos ISI Citatas de la revista 24,296 351,872 2.3 Phys. Rev. D Red de colaboraciones 212,250 61,085,555 2.3 de actores de Hollywood Red de colaboradores en 1,388,989 1,028 × 107 2.5 las revistas Medline Colaboradores en las 70,975 1,32 × 105 2.1 revistas de matem´ticas a Colaboradores an las 209,293 1,21 × 106 2.4 revistas de neurociencias Red de interacciones 778 ∼ 1500 − 3000 2.2 metab´licas en (E. coli) o Red de interacciones 1,870 2,240 2.5 prot´icas en levadura e Co-ocurrencia de palabras 470,000 17,000,000 2.7 Red de palabras sin´nimas o 22,311 —– 2.8 Circuitos digitales 2 × 104 4 × 104 3.0 Llamadas telef´nicas o 47 × 106 8 × 107 2.1 Red de interacciones 2,810 —– 3.4 sexuales en humanos Redes alimenticias 154 405 1.0 (interacciones tr´ficas) oCuadro II. Algunas de las redes libres de escala que se han encontrado en la naturaleza. S´lo se muestra el exponente de entrada opara las redes dirigidas. Los cuadros con l´ıneas “—–¨ ındican que yo no ten´ el dato correspondiente al momento de escribir ıaestas notas. Seguramente se estar´n preguntando qu´ es lo sorpren- a e buciones de Poisson o distribuciones exponenciales, perodente respecto a la topolog´ libre de escala. Bueno, por ıa existen muy pocos procesos conocidos que generan distri-un lado sorprende que esta topolog´ se encuentre en re- ıa buciones libres de escala como la dada en la Eq. (3)[16].des tan diferentes y de tan gran variedad como las lista- De hecho, el trabajo de Erd¨s y R´nyi demostr´ que las o e odas en el Cuadro II. El hecho de que la topolog´ libre de ıa redes que se construyen a nadiendo nuevos nodos y co-escala aparezca por todos lados sugiere que podr´ exis- ıa nexiones al azar presentan topolog´ de Poisson o ex- ıastir un mecanismo simple que genera este tipo de redes ponenciales. Y ´sta es precisamente la paradoja, que la ea diferentes niveles de organizaci´n, desde las peque nas o red internet, la red de colaboraciones cient´ıficas y la redredes intracelulares hasta las grandes redes sociales o in- de contactos sexuales, por ejemplo, son redes que se for-form´ticas. ¿Podr´ ser esto posible? ¿Ser´ cierto que la a ıa a maron aleatoriamente a nadiendo nuevos nodos y nuevasformaci´n de redes tan diferentes como la red de interac- o conexiones a lo largo del tiempo. Entonces, ¿c´mo es po- ociones prot´icas de S. cerevisiae (levadura), la red Inter- e sible que estas redes que se formaron al azar no presentennet y la red de colaboraciones cient´ ıficas en las revistas topolog´ de Poisson o topolog´ exponenciales como lo ıas ıasde neurociencias, est´ governada por la misma ley funda- e hab´ predicho Erd¨s y R´nyi? ıan o emental? No lo sabemos a´n.u Las redes con topolog´ de Poisson son muy diferen- ıa Por otro lado, la topolog´ libre de escala es sorpren- ıa tes estructuralmente a las redes con topolog´ libre de ıadente porque no se esperaba que existiera. En la naturale- escala. La Fig. 4 muestra una red de Poisson (arriba) yza existen muchos procesos aleatorios que generan distri- una red libre de escala (abajo). Como puede observarse,
  6. 6. 6 V. ¨ ´ REDES DE TIPO ERDOS-RENYI Imaginemos un conjunto de N botones de pantal´n dis- o tribu´ ıdos aleatoriamente sobre una mesa e inicialmente desconectados. Al tiempo t = 0 escogemos aleatoriamen- te una pareja de botones y los hilvanamos con un hilo. Despu´s de haber enlazado a esta pareja, la dejamos so- e bre la mesa y escogemos aleatoriamente otra pareja para hilvanar. Podemos escoger botones que est´n conectados a con otros botones, pero si la pareja que escogemos ya est´ conectada entre s´ la descartamos y escogemos otra a ı, pareja. Lo que no se vale es hilvanar m´s de una vez a la a misma pareja de botones. Repetimos este proceso sucesi- vamente M veces, escogiendo aleatoriamente una pareja de botones cada vez. Al final del proceso habremos esta- blecido M enlaces entre M parejas diferentes de botones, generando as´ una red de botones. Intuitivamente es claro ı que si M (el n´mero total de enlaces) es peque no compa- u rado con N (el n´mero total de botones), entonces la red u resultante estar´ desmembrada en varias islas peque nas. a Dentro de cada isla los botones estar´n hilvanados en- a tre s´ pero estar´n desconectados de las otras islas. Sin ı, a embargo, si M es muy grande comparado con N , termi- naremos con casi todos los botones hilvanados unos conFigura 4. La figura superior muestra una red aleatoria con topo- otros. Probablemente haya islas muy peque nas desco-log´ de Poisson. La red mostrada en el panel inferior es la red ıa nectadas de la red principal, pero seguramente la granInternet al nivel de ruteadores, la cual es una red con topolog´ ıa mayor´ de botones formar´n parte de una isla principal: ıa alibre de escala. la isla gigante. Despu´s de haber hilvanado M parejas en un conjunto e total de N botones, ¿cu´l es la distribuci´n de conexiones a o P (k) en la red resultante? Como veremos en un momento, la red que resulta de este proceso tiene una distribuci´n ola red de Poisson se ve m´s aleatoria y m´s homog´nea a a e P (k) de Poisson. Pero antes de dar la prueba de esteque la red libre de escala[17]. En las redes de Poisson to- resultado, vale la pena mencionar que durante muchosdos los nodos tienen m´s o menos el mismo n´mero de a u a nos se pens´ que este mecanismo de formaci´n de redes o oconexiones. Algunos nodos estar´n m´s conectados que a a en el cual parejas de nodos se enlazan aleatoriamente, eraotros, pero en promedio todos tienen la misma conec- adecuado para describir el origen de ciertas redes socia-tividad, es decir, las conexiones en una red de Poisson les como las redes de amistades o las redes de contactosest´n distribuidas homog´neamente entre sus nodos. Por a e sexuales. Despu´s de todo, las amistades o los contactos eel contrario, la caracter´ ıstica m´s importante de las redes a sexuales se dan por el encuentro casual y aleatorio de laslibres de escala es su alta heterogeneidad, ya que existen personas que viven en una sociedad. Por lo tanto, eranodos con muy pocas conexiones, nodos medianamen- natural pensar que el mecanismo de “hilvanar parejas dete conectados y nodos extremadamente conectados. Los botones escogidas al azar” reproduc´ lo que realmente ıanodos altamente conectados se denominan los n´cleos o u ocurre en las redes sociales. S´ era “natural”pensarlo, ı,centros de la red[18]. Con una red libre de escala uno pero era incorrecto.no puede decir que todos los nodos tienen “m´s o me- a Calculemos ahora la probabilidad P (k) para nuestranos” la misma conectividad. Por el contrario, hay nodos red de botones hilvanados. Para comenzar notemos quecon una s´la conexi´n y tambi´n hay nodos con miles de o o e el n´mero total Np de parejas que se pueden formar en uconexiones. un conjunto de N botones es 1 Todav´ no sabemos cu´les son los procesos que con- ıa a Np = N (N − 1)ducen a la formaci´n de redes libres de escala. Sin em- o 2bargo, en los ultimos 8 a nos se han llevado a cabo avan- ´ Como enlazamos M parejas de botones, la probabili-ces sustanciales en la comprensi´n de estas redes. En las o dad pe de que una pareja arbitraria seleccionada al azarsecciones que siguen veremos algunos de los formalismos est´ enlazada es ematem´ticos de crecimiento de redes que se han desarro- allado para generar las tres topolog´ mencionadas con ıas M 2M pe = = (4)anterioridad (Poisson, exponencial y libre de escala). Np N (N − 1)
  7. 7. 7 . Ahora enfoquemos nuestra atenci´n sobre un nodo par- oticular vj de la red, escogido al azar. El n´mero total de u t=0 t=1parejas que podr´ contener a vj es N − 1, ya que vj se ıan v0 v0 v1podr´ haber hilvanado con los N − 1 nodos restantes de ıala red. Sin embargo, en los M enlaces que se llevaron acabo, no necesariamente escogimos al nodo vj todas lasveces posibles que se podr´ haber escogido. Supongamos ıa t=2 t=3entonces que de las M parejas que se escogieron, el nodovj estaba solamente en k de ellas. La probabilidad de que . v0 v1 v0 v1 .vj est´ contenido en k parejas de las N − 1 posibles es e ( ) v2 v3 v2 N −1 P (k) = (pe )k (1 − pe )N −1 (5) k .Esta es una distribuci´n binomial para N y M finitas. oPero si consideramos ahora que la red es muy grande y Figura 5. Crecimiento de redes. Al tiempo t = 0 hay un s´lo o nodo v0 . En cada paso de tiempo subsecuente a nadimos un nuevotomamos el l´ımite N → ∞ y M → ∞ de tal forma que nodo que se conectar´ a alguno de los nodos ya existentes con una ala cantidad probabilidad Π(k, t) que depende de la conectividad k al tiempo t del nodo con el que se pretende establecer la conexi´n. o 2M z= Npermanezca finita, entonces la distribuci´n (5) se trans- o el hecho de que nuevos nodos y nuevas conexiones se pue-forma en den a nadir a la red. Tambi´n debe tomarse en cuenta el e que nodos y conexiones ya existentes pueden eliminarse. zk En el modelo m´s simple de crecimiento de redes a na- a P (k) = e−z (6) k! dimos un nuevo nodo en cada paso de tiempo. Este nue- vo nodo puede conectarse con alguno de los nodos yalo cual es la distribuci´n de Poisson con promedio z. En o existentes. Cada uno de los nodos ya existentes puedenel ap´ndice A muestro los pasos algebr´icos que conducen e a ser seleccionados para la conexi´n con una probabilidad ode la ecuaci´n (5) a la ecuaci´n (6). o o Π(ki , t), siendo ki la conectividad al tiempo t del i-´simo e nodo ya existente. El proceso comienza con un unico nodo inicial v0 al ´ VI. CRECIMIENTO DE REDES tiempo t = 0 (ver la Fig. 5). Al tiempo t = 1 a nadimos un nuevo nodo v1 , que se conectar´ al unico nodo ya a ´ En la secci´n anterior supon´ o ıamos que ten´ ıamos una existente v0 con probabilidad 1. Despu´s, al tiempo t = 2 epoblaci´n fija de N nodos y un n´mero fijo M conexio- o u a nadimos el nodo v2 que se conectar´ con cualquiera de anes a nadidas aleatoriamente. Sin embargo, en la realidad los nodos ya existentes v1 y v2 con la misma probabilidadesto no ocurre, las redes no est´n fijas. Por el contrario, a 1/2. En este momento los nodos v0 , v1 y v2 ya no tienenlas redes complejas evolucionan y crecen en el tiempo a todos la misma conectividad: alguno de ellos tendr´ dos atrav´s de la adici´n simult´nea tanto de conexiones co- e o a conexiones mientras que los otros dos nodos tendr´n s´lo a omo de nodos. Pensemos por ejemplo en la red internet. una conexi´n. Al tiempo t = 3 a nadimos al nodo v3 , oEn octubre de 1969 la “red¨ ınternet consist´ de s´lo dos ıa o que se conectar´ con alguno de los nodos ya existentes acomputadoras, una en la Universidad de California en v0 , v1 o v2 con una probabilidad que es funci´n de susoLos Angeles (UCLA) y la otra en el Instituto de Inves- conectividades k0 , k1 y k2 . Continuando con este proceso,tigaciones de Stanford (SRI). El primer mensaje que se al tiempo t + 1 a nadimos al nodo vt+1 que se conectar´ a atransmitieron estas computadoras fue “LOGWIN”[19]. A cualquiera de los nodos ya existentes v0 , v1 , . . . , vt , el cuallo largo de los a nos m´s y m´s computadoras se suma- a a ser´ seleccionado con una probabilidad Π(ki , t), siendo ki aron a la red internet, y para el a no 2000, las primeras la conectividad al tiempo t del nodo seleccionado.dos computadoras de la UCLA y el SRI que se dijeron Denotemos por P (k, t) a la probabilidad de que al tiem-“LOGWIN”, se hab´ convertido ya en sistemas que co- ıan po t un nodo arbitrario de la red tenga k conexiones. Esnectaban a 170 pa´ y a m´s de 300 millones de perso- ıses a claro que esta probabilidad depende del tiempo. Sin em-nas. bargo, si continuamos a nadiendo nodos por un tiempo As´ como la red internet naci´ siendo peque na y des- ı o suficientemente largo esperamos que la funci´n P (k, t)opu´s creci´ con el paso del tiempo, tambi´n las redes e o e alcance un estado estacionario independiente del tiem-metab´licas y las redes gen´ticas dentro de la c´lula, y o e e po. Esto no significa que la red alcance un estado es-muchas otras redes en la naturaleza, han crecido y evolu- tacionario. La red sigue creciendo mientras continuemoscionado a lo largo del tiempo. Por lo tanto, es importante a nadiendo nodos. Es unicamente la distribuci´n de co- ´ oque nuestros modelos de formaci´n de redes incorporen o nectividades P (k, t) la que llega a un estado estacionario
  8. 8. 8en el cual P (k, t + 1) = P (k, t) = P (k)[20]. Como el nodo vn “naci´” al tiempo t = n con una s´la o o Existen varios m´todos para calcular la distribuci´n de e o conexi´n, la condici´n inicial para resolver la ecuaci´n o o oconectividades P (k, t). En estas notas veremos el m´to- e anterior esdo de la ecuaci´n maestra, pero existen por lo menos ootros dos m´todos distintos: el m´todo continuo, inven- e e P (n, k, t)|t=n = δk,1 . (9)tado por Barab´si, y el m´todo cin´tico, introducido por a e eKrapivsky, Redner, y Leyvraz [2]. Los tres m´todos dan e Sumando sobre n en la Eq. (8) desde n = 0 hasta n = tresultados equivalentes. y tomando en consideraci´n la Eq. (7), obtenemos o Para aquellos que no conocen el formalismo de la ecua-ci´n maestra, en el ap´ndice B doy una breve introduc- o e ∑ t {ci´n al planteamiento de dicha ecuaci´n, la cual es muy o o P (n, k, t + 1) = N (t) P (k − 1, t)Π(k − 1, t)f´cil de escribir pero, la mayor´ de las veces, muy dif´ a ıa ıcil n=0 }de resolver. +P (k, t) [1 − Π(k, t)] (10) Denotemos por P (n, k, t) la probabilidad de que el no-do vn tenga k conexiones al tiempo t. Notemos que estaprobabilidad est´ asociada al nodo espec´ a ıfico vn . Sin em- Ahora bien, como en cada paso de tiempo a nadimos unbargo, podemos obtener la probabilidad P (k, t) de que un nuevo nodo (comenzando con el nodo v0 al tiempo t = 0),nodo arbitrario tenga k conexiones al tiempo t a trev´s e entonces N (t) = t + 1. Por lo tanto, la ecuaci´n anterior ode la siguiente ecuaci´n: o puede escribirse como ∑ t { 1 ∑ t P (k, t) = P (n, k, t), (7) P (n, k, t + 1) = (t + 1) P (k − 1, t)Π(k − 1, t) N (t) n=0 n=0 } +P (k, t) [1 − Π(k, t)] (11)donde N (t) es el n´mero total de nodos de la red al tiem- upo t. La ecuaci´n que determina la evoluci´n temporal de o o En el lado izquierdo de la ecuaci´n anterior podemos oP (n, k, t) se obtiene notando que en cada paso de tiempo completar la suma hasta t + 1 de la siguiente manera:hay dos contribuciones a dicha probabilidad: ∑ t ∑ t+1 1. Al tiempo t el nodo vn ten´ k − 1 conexiones y ıa P (n, k, t + 1) = P (n, k, t + 1) − P (t + 1, k, t + 1) fue seleccionado (con probabilidad Π(k − 1, t)) para n=0 n=0 conectarse con el nuevo nodo a nadido a la red. ∑ t+1 Por lo tanto, al tiempo t + 1 el nodo vn tendr´ ka = P (n, k, t + 1) − δk,1 conexiones. n=0 = N (t + 1)P (k, t + 1) − δk,1 2. El nodo vn ya ten´ k conexiones al tiempo t y ıa = (t + 2)P (k, t + 1) − δk,1 no fue seleccionado para conectarse con el nuevo nodo a nadido (lo cual ocurre con probabilidad 1 − donde hemos utilizado el hecho de que Π(k, t)). Por lo tanto, al tiempo t + 1 el nodo vn seguir´ teniendo k conexiones. a P (t + 1, k, t + 1) = δk,1Tomando en cuenta estas dos contribuciones, la ecua- tal y como lo establece la Eq. (9). Tambi´n utilizamos eci´n maestra que determina la evoluci´n temporal de o o la Eq. (7) (evaluada en t + 1) y el hecho de que N (t +P (n, k, t) es 1) = t + 2. Sustituyendo estos resultados en la Eq. (11) obtenemos vn f ue seleccionado { (t + 2)P (k, t + 1) − δk,1 = (t + 1) P (k − 1, t)Π(k − 1, t) P (n, k, t + 1) = P (n, k − 1, t) Π(k − 1, t) } +P (k, t) [1 − Π(k, t)] (12) k−1 conexiones al tiempo t Notemos que para poder resolver la Eq. (12) necesi- vn no f ue tamos conocer expl´ ıcitamente la funci´n Π(k, t), que es o seleccionado la probabilidad de que un nodo ya existente con conec- + P (n, k, t) [1 − Π(k, t)] . (8) tividad k sea seleccionado para conectarse con el nuevo nodo que se a nade al tiempo t. Como veremos en las k conexiones siguientes secciones, diferentes formas de la probabilidad al tiempo t Π(k, t) conducen a topolog´ diferentes. ıas
  9. 9. 9 VII. TOPOLOG´ EXPONENCIAL IA Para incorporar este comportamiento, Barab´si sugi- a ri´ que la probabilidad de enlace Π(k, t) debe tomar la o En el caso en que cualquiera de los nodos ya existente formapueda escogerse con la misma probabilidad para conec-  −1tarse con el nuevo nodo a nadido, la probabilidad Π(k, t) ∑ N (t)es independiente de k y queda dada por Π(k, t) =  kn  k (15) n=0 1 1 Π(k, t) = = N (t) t+1 donde kn es la conectividad del n-´simo nodo ya existen- e (∑ )−1 N (t)donde N (t) = t + 1 es el n´mero total de nodos al tiempo u te al tiempo t. El factor n=0 kn es simplementet. Sustituyendo esta forma de Π(k) en la Eq. (12) obte- para garantizar que la probabilidad Π(k, t) est´ norma- enemos lizada. Al hacer que Π(k, t) sea proporcional a k, como lo propuso Barab´si, tenemos enlace preferencial, ya que a (t + 2)P (k, t + 1) − δk,q = P (k − 1, t) + tP (k, t) de esta forma, entre m´s grande sea la conectividad k de a un nodo, mayor ser´ la probabilidad de conectarse con aDespu´s de un tiempo muy largo, la funci´n P (k, t) alcan- e o ´l. Como en cada paso de tiempo a nadimos un nuevo eza un estado estacionario en el que P (k, t+1) = P (k, t) = nodo con una conexi´n, comenzando con cero conexiones oP (k). En dicho estado estacionario la ultima ecuaci´n se ´ o al tiempo t = 0, entonces para cualquier tiempo t > 0 setransforma en tiene 1( ) P (k) = P (k − 1) + δk,1 . (13) ∑ N (t) 2 kn = 2t,Como todos los nodos de la red tienen por lo menos una n=0conexi´n, es claro que P (0) = 0. Con esta condici´n ini- o ocial, la ecuaci´n de recurrencia anterior tiene la soluci´n o o y por lo tanto P (k) = 2−k (14) k Π(k, t) = (16) 2tque no es m´s que la distribuci´n exponencial. Es impor- a otante se nalar que esta distribuci´n aparece en el contexto o Substituyendo este resultado en la Eq. (12) obtenemos t + 1{del crecimiento de redes como el resultado de lo que sellama enlace igualitario, es decir, en una situaci´n en la o (t + 2)P (k, t + 1) − δk,q = (k − 1)P (k − 1, t)cual cada nodo nuevo que se a nade a la red se puede en- 2t }lazar a cualquiera de los nodos ya existentes con la misma + [2t − k] P (k, t)probabilidad. En este sentido el nuevo enlace que se for-ma es igualitario, porque no discrimina entre los nodos ımite t → ∞ el sistema alcanza el estado esta- En el l´ya existentes. cionario. Por lo tanto, la distribuci´n de conexiones esta- o cionaria P (k) se obtiene de la ecuaci´n anterior tomando o ımite t → ∞, lo que conduce a el l´ VIII. TOPOLOG´ LIBRE DE ESCALA IA 1[ ] P (k) + kP (k) − (k − 1)P (k − 1) = δk,1 (17) En la vida real las conexiones entre diferentes nodos no 2se dan de manera igualitaria. Por ejemplo, si tenemos una Como todos los nodos tienen por lo menos una conexi´n, ocomputadora nueva y queremos conectarla a internet, no para resolver la ecuaci´n (17) utilizamos la condici´n ini- o ovamos a contratar el servicio de internet de alguna com- cial P (0) = 0, lo cual nos da la soluci´n opa nia elegida al azar, sino que buscaremos la compa niaque ofrezca el mejor servicio y al mejor precio, y proba- 4blemente ser´ esta compa nia la que tenga m´s clientes. a a P (k) = (18) k(k + 1)(k + 2)En una escuela los varones no buscan a su pareja al azar,sino que buscar´n salir con la chica m´s bonita, o tal vez a a Aun cuando esta no es una ley de potencias “perfec-con la m´s inteligente, y ser´ esta muchacha la que tenga a a ta”(ver la Fig. 6), para valores grandes de k la distribu-m´s pretendientes. Por esta raz´n, Barab´si invent´ el a o a o ci´n P (k) se comporta como P (k) ∼ k −3 . Por un lado, es- oconcepto de enlace preferencial en el cual los nuevos no- te es un resultado muy interesante: el enlace preferencialdos que se a naden a la red se conectar´n preferentemente a genera distribuciones de conectividades con colas librescon los nodos ya existentes que tengan el mayor n´me- u de escala. Son estas colas largas las responsables de quero de conexiones. Intuitivamente podemos pensar que el existan elementos altamente conectados. Por otro lado,enlace preferencial consiste en que uno siempre trata de este resultado tambi´n es desalentador ya que el proceso eestar conectado con los nodos m´s “populares”, es decir, a de enlace preferencial siempre da el exponente γ = 3,con los nodos de mayor conectividad. el cual no se encuentra frecuentemente en la naturaleza

×