Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Notasredes PDF
Notasredes PDF
Maximino Aldana
Noviembre 2006
1. Introduccion
En los ultimos 7 anos hemos sido testigos de una explosion en el estudio
de las propiedades estructurales y dinamicas de las redes complejas. Du-
rante este tiempo se han publicado cientos de artculos sobre este tema en
revistas de investigacion cientfica internacionales de diferentes disciplinas,
que abarcan fsica, biologa, sociologa, neurologa, economa, medicina, por
mencionar algunos ejemplos. Este interes en las redes complejas radica en
que nos hemos dado cuenta de que dichas redes abundan en la naturaleza,
son parte de nuestra vida diaria y se presentan a diferentes niveles de orga-
nizacion. Por ejemplo, algunas redes biologicas que encontramos en el nivel
microscopico son las redes de regulacion genetica, redes de protenas, redes
neuronales, redes metabolicas. Por otro lado, a un nivel de organizacion mucho
mayor, encontramos redes de comunicacion e informaticas (la red internet,
la red www, redes telefonicas, etc.), redes sociales (amistades, contactos se-
xuales, colaboradores cientficos, propagacion de enfermedades, etc.), redes
ecologicas (interacciones troficas en un ecosistema). Las redes complejas son
ubicuas, estan por todos lados. Incluso se ha estudiado la red de super heroes
en el Universo de Marvel, siendo el hombre arana el super heroe mas popular
con la mayor conectividad [1]. Es un hecho sobresaliente el que todas estas
redes, tan diferentes en naturaleza y en tamano, tengan muchas propiedades
1
estructurales similares. Este hecho, tan simple como sorprendente, hace po-
sible que podamos formular modelos matematicos para entender y explicar
las propiedades estructurales (y en algunos casos tambien las propiedades
dinamicas) de las redes complejas.
En estas notas presento algunas de las herramientas matematicas y con-
ceptuales que se han desarrollado a lo largo de varios anos para analizar la
estructura de las redes complejas. Los que esten interesados podran encon-
trar un estudio mucho mas completo del que presento aqu en las referencias
[2, 3, 4, 5], las cuales son trabajos de revision excelentes que sirven como
punto de partida para adentrarse en el fascinante mundo de las redes com-
plejas.
2. Algunas definiciones
2.1. Sistemas complejos
Comenzemos nuestro estudio describiendo que son los sistemas complejos.
Como ocurre con la gran mayora de los conceptos cientficos, no podemos
definir los sistemas complejos en un simple enunciado. En lugar de esto,
vamos a enumerar las caractersticas mas importantes que son comunes a
todos los sistemas complejos:
2
y cada una de estas partes se encarga de realizar alguna funcion especfica
dentro de la celula. Las partes de la celula responden de forma no lineal
ante perturbaciones externas. Por ejemplo, algunas veces una mutacion en
el ADN no tiene ningun efecto en la celula, mientras que otras veces una
sola mutacion puede ser fatal1 . Ademas, la celula presenta comportamientos
emergentes que no pueden explicarse en terminos de las propiedades de sus
partes individuales. As, podemos hablar de una celula enferma, pero no po-
demos decir que un ribosoma o una protena esten enfermos. La enfermedad
es una propiedad que emerge como resultado de la organizacion colectiva de
todos los constituyentes de la celula.
3
Redes sociales
Dos personas estan conectadas si han
Sexuales
tenido por lo menos una relacion sexual
Dos actores estan conectados si
Actores
han aparecido en la misma pelcula
Dos personas estan conectadas si
Amistades
son amigas
Dos cientficos estan conectados si han
Cientficos
sido coautores en algun artculo
Dos personas estan conectadas si
Familiares
son familiares cercanos
Dos personas estan conectadas si una
Enfermedades
contagio de una enfermedad a la otra
Redes informaticas
Dos computadoras estan conectadas si
Internet
hay un cable que las conecta
Dos paginas web estan conectadas si
WWW
hay un hipervnculo de una a la otra
Dos palabras estan conectadas si en el diccionario
Palabras
una aparece en la definicion de la otra
Dos palabras estan conectadas si son
Palabras
sinonimos
4
Redes biologicas
Dos protenas estan conectadas si
Proteicas
participan en la misma reaccion qumica
Dos genes estan conectados si uno
Geneticas
regula la expresion del otro
Dos especies estan conectadas
Ecologicas
si una se come a la otra
Dos neuronas estan conectadas si existe
Neuronales
una conexion sinaptica entre ellas
5
Figura 1: Una red puede estar compuesta de varias islas, como en el ejemplo
mostrado en esta figura. La isla mas granda se denomina la isla gigante.
un conjunto de nodos entre los que existen algunas conexiones. Esto quiere
decir que en la red pueden existir nodos que no tengan conexiones, es decir,
nodos aislados. Tambien pueden existir grupos de nodos que esten conecta-
dos entre s pero que no esten conectados con el resto de la red. Como un
ejemplo concreto pensemos en una red social en la que dos individuos estan
conectados sin son familiares cercanos (especficamente, hermanos, medios
hermanos, primos, padres, hijos, esposos, tos, sobrinos, abuelos y nietos).
Esta es evidentemente una red no dirigida, ya que si A es familiar de B, en-
tonces B tambien es familiar de A. Sin embargo, muy probablemente en una
sociedad grande esta red estara fracturada en islas o sub redes, debido a que
claramente no todas las personas en una sociedad son familiares cercanos de
todos los demas. En mi caso particular, mi apellido es Aldana Gonzalez,
por lo que es natural pensar que estoy conectado directamente con algunas
de las familias Aldana y algunas las familias Gonzalez en Mexico. Pero muy
probablemente ningun miembro de mi familia esta conectado con alguien de
la familia Azcarraga, o con la familia Zabludovsky. Por lo tanto, los miem-
6
bros de mi familia conforman una isla o sub red dentro de la cual estamos
conectados entre nosotros, pero esta isla esta desconectada de otras familias
de la sociedad. La Fig. 1 muestra un ejemplo de una red compuesta de varias
islas.
Las islas en una red pueden tener diferentes tamanos, que van desde 1
(un solo nodo que no esta conectado a nadie) hasta el tamano de toda la red
(todos los nodos estan conectados con todos), en cuyo caso la red consiste
de una sola isla, que es ella misma. Es importante enfatizar que el hecho
de que una isla no este conectada al cuerpo principal de la red no significa
que dicha isla no pertenezca a la red. La red no esta determinada solo por
las conexiones, sino tambien por los nodos que conforman al sistema. Esto
puede parecer poco intuitivo, pero desde el punto de vista matematico es
conveniente considerar que todos los nodos del sistema pertenecen a la red,
independientemente de que haya o no conexiones entre ellos. Como veremos
mas adelante, las islas juegan un papel importante en la teora de redes.
7
.
REDES COMPLEJAS
Estructura Dinamica
Distribucion de conexiones Sincronizacion
Coeficiente de agrupamiento Transiciones de fase
.
...
...
Figura 2: El estudio de las redes complejas puede dividirse en dos partes: (a)
el estudio de sus propiedades estructurales y (b) el estudio de sus propiedades
dinamicas.
8
v1 v2
vi
v3
v4
vj
(a) (b)
9
nuevos procesos dinamicos sobre redes complejas.
En estas notas introductorias nos enfocaremos mas al estudio de las pro-
piedades estructurales de las redes complejas, dejando un poco de lado sus
propiedades dinamicas.
zk
Topologa de Poisson P (k) = ez , (1)
k!
10
Red Num. de nodos Num. de conexiones i
dominio www.nd.edu 325,729 1,469,680 2.1
Paginas de WWW 2,711 109 2,130 109 2.1
encontradas por Altavista
Dominos en 2,60 105 1.9
la WWW
Nivel de inter-dominio 4,389 8,256 2.2
de la Internet
Sistemas autonomos 6,374 13,641 2.2
en la Internet
Nivel de ruteador 150,000 200,000 2.3
en la Internet
Citas en la base 783,339 6,716,198 3.0
de datos ISI
Citatas de la revista 24,296 351,872 2.3
Phys. Rev. D
Red de colaboraciones 212,250 61,085,555 2.3
de actores de Hollywood
11
Red Num. de nodos Num. de conexiones i
Red de colaboradores en 1,388,989 1,028 107 2.5
las revistas Medline
Colaboradores en las 70,975 1,32 105 2.1
revistas de matematicas
Colaboradores an las 209,293 1,21 106 2.4
revistas de neurociencias
Red de interacciones 778 1500 3000 2.2
metabolicas en (E. coli)
Red de interacciones 1,870 2,240 2.5
proteicas en levadura
Co-ocurrencia de palabras 470,000 17,000,000 2.7
Red de palabras sinonimas 22,311 2.8
Circuitos digitales 2 104 4 104 3.0
Llamadas telefonicas 47 106 8 107 2.1
Red de interacciones 2,810 3.4
sexuales en humanos
Redes alimenticias 154 405 1.0
(interacciones troficas)
todos lados sugiere que podra existir un mecanismo simple que genera este
tipo de redes a diferentes niveles de organizacion, desde las pequenas redes
intracelulares hasta las grandes redes sociales o informaticas. Podra ser esto
posible? Sera cierto que la formacion de redes tan diferentes como la red de
interacciones proteicas de S. cerevisiae (levadura), la red Internet y la red
de colaboraciones cientficas en las revistas de neurociencias, este governada
por la misma ley fundamental? No lo sabemos aun.
Por otro lado, la topologa libre de escala es sorprendente porque no se
esperaba que existiera. En la naturaleza existen muchos procesos aleatorios
que generan distribuciones de Poisson o distribuciones exponenciales, pero
existen muy pocos procesos conocidos que generan distribuciones libres de
escala como la dada en la Eq. (3)3 . De hecho, el trabajo de Erdos y Renyi de-
mostro que las redes que se construyen anadiendo nuevos nodos y conexiones
al azar presentan topologas de Poisson o exponenciales. Y esta es precisa-
3
A las distribuciones libres de escala tambien se les llama distribuciones de potencia.
12
Figura 4: La figura de la izquierda muestra una red aleatoria con topologa
de Poisson. La red de la derecha es la red Internet al nivel de ruteadores, la
cual es una red con topologa libre de escala.
13
conexion y tambien hay nodos con miles de conexiones.
Todava no sabemos cuales son los procesos que conducen a la formacion
de redes libres de escala. Sin embargo, en los ultimos 8 anos se han llevado a
cabo avances sustanciales en la comprension de estas redes. En las secciones
que siguen veremos algunos de los formalismos matematicos de crecimiento
de redes que se han desarrollado para generar las tres topologas mencionadas
con anterioridad (Poisson, exponencial y libre de escala).
14
o los contactos sexuales se dan por el encuentro casual y aleatorio de las
personas que viven en una sociedad. Por lo tanto, era natural pensar que el
mecanismo de hilvanar parejas de botones escogidas al azarreproduca lo
que realmente ocurre en las redes sociales. S, era naturalpensarlo, pero
era incorrecto.
Calculemos ahora la probabilidad P (k) para nuestra red de botones hil-
vanados. Para comenzar notemos que el numero total Np de parejas que se
pueden formar en un conjunto de N botones es
1
Np = N (N 1)
2
Como enlazamos M parejas de botones, la probabilidad pe de que una pareja
arbitraria seleccionada al azar este enlazada es
M 2M
pe = = (4)
Np N (N 1)
Ahora enfoquemos nuestra atencion sobre un nodo particular vj de la
red, escogido al azar. El numero total de parejas que podran contener a vj es
N 1, ya que vj se podra haber hilvanado con los N 1 nodos restantes de la
red. Sin embargo, en los M enlaces que se llevaron a cabo, no necesariamente
escogimos al nodo vj todas las veces posibles que se podra haber escogido.
Supongamos entonces que de las M parejas que se escogieron, el nodo vj
estaba solamente en k de ellas. La probabilidad de que vj este contenido en
k parejas de las N 1 posibles es
N 1
P (k) = (pe )k (1 pe )N 1 (5)
k
Esta es una distribucion binomial para N y M finitas. Pero si consideramos
ahora que la red es muy grande y tomamos el lmite N y M de
tal forma que la cantidad
2M
z=
N
permanezca finita, entonces la distribucion (5) se transforma en
zk
P (k) = ez (6)
k!
lo cual es la distribucion de Poisson con promedio z. En el apendice A muestro
los pasos algebraicos que conducen de la ecuacion (5) a la ecuacion (6).
15
6. Crecimiento de redes
En la seccion anterior suponamos que tenamos una poblacion fija de N
nodos y un numero fijo M conexiones anadidas aleatoriamente. Sin embargo,
en la realidad esto no ocurre, las redes no estan fijas. Por el contrario, las
redes complejas evolucionan y crecen en el tiempo a traves de la adicion
simultanea tanto de conexiones como de nodos. Pensemos por ejemplo en
la red internet. En octubre de 1969 la redinternet consista de solo dos
computadoras, una en la Universidad de California en Los Angeles (UCLA)
y la otra en el Instituto de Investigaciones de Stanford (SRI). El primer
mensaje que se transmitieron estas computadoras fue LOGWIN6 . A lo
largo de los anos mas y mas computadoras se sumaron a la red internet, y
para el ano 2000, las primeras dos computadoras de la UCLA y el SRI que
se dijeron LOGWIN, se haban convertido ya en sistemas que conectaban
a 170 pases y a mas de 300 millones de personas.
As como la red internet nacio siendo pequena y despues crecio con el paso
del tiempo, tambien las redes metabolicas y las redes geneticas dentro de la
celula, y muchas otras redes en la naturaleza, han crecido y evolucionado
a lo largo del tiempo. Por lo tanto, es importante que nuestros modelos
de formacion de redes incorporen el hecho de que nuevos nodos y nuevas
conexiones se pueden anadir a la red. Tambien debe tomarse en cuenta el
que nodos y conexiones ya existentes pueden eliminarse.
En el modelo mas simple de crecimiento de redes anadimos un nuevo
nodo en cada paso de tiempo. Este nuevo nodo puede conectarse con alguno
de los nodos ya existentes. Cada uno de los nodos ya existentes pueden ser
seleccionados para la conexion con una probabilidad (ki , t), siendo ki la
conectividad al tiempo t del i-esimo nodo ya existente.
El proceso comienza con un unico nodo inicial v0 al tiempo t = 0 (ver la
Fig. 5). Al tiempo t = 1 anadimos un nuevo nodo v1 , que se conectara al unico
nodo ya existente v0 con probabilidad 1. Despues, al tiempo t = 2 anadimos
el nodo v2 que se conectara con cualquiera de los nodos ya existentes v1 y v2
con la misma probabilidad 1/2. En este momento los nodos v0 , v1 y v2 ya no
tienen todos la misma conectividad: alguno de ellos tendra dos conexiones
mientras que los otros dos nodos tendran solo una conexion. Al tiempo t = 3
anadimos al nodo v3 , que se conectara con alguno de los nodos ya existentes
v0 , v1 o v2 con una probabilidad que es funcion de sus conectividades k0 , k1
6
LOGWIN es la concatenacion de log(conectarse) y win(ganar).
16
.
t=0 t=1
v0 v0 v1
t=2 t=3
.
v0 v1 v0 v1 .
v2 v3 v2
.
17
ten por lo menos otros dos metodos distintos: el metodo continuo, inventado
por Barabasi, y el metodo cinetico, introducido por Krapivsky, Redner, y
Leyvraz [2]. Los tres metodos dan resultados equivalentes.
Para aquellos que no conocen el formalismo de la ecuacion maestra, en el
apendice B doy una breve introduccion al planteamiento de dicha ecuacion,
la cual es muy facil de escribir pero, la mayora de las veces, muy difcil de
resolver.
Denotemos por P (n, k, t) la probabilidad de que el nodo vn tenga k cone-
xiones al tiempo t. Notemos que esta probabilidad esta asociada al nodo
especfico vn . Sin embargo, podemos obtener la probabilidad P (k, t) de que
un nodo arbitrario tenga k conexiones al tiempo t a treves de la siguiente
ecuacion:
t
1 X
P (k, t) = P (n, k, t), (7)
N (t) n=0
donde N (t) es el numero total de nodos de la red al tiempo t.
La ecuacion que determina la evolucion temporal de P (n, k, t) se obtiene
notando que en cada paso de tiempo hay dos contribuciones a dicha proba-
bilidad:
vn f ue vn no f ue
seleccionado seleccionado
z }| { z }| {
P (n, k, t + 1) = P (n, k 1, t) (k 1, t) + P (n, k, t) [1 (k, t)] . (8)
| {z } | {z }
k1 conexiones k conexiones
al tiempo t al tiempo t
18
Como el nodo vn nacioal tiempo t = n con una sola conexion, la condicion
inicial para resolver la ecuacion anterior es
P (n, k, t)|t=n = k,1 . (9)
Sumando sobre n en la Eq. (8) desde n = 0 hasta n = t y tomando en
consideracion la Eq. (7), obtenemos
t
X
P (n, k, t + 1) = N (t) P (k 1, t)(k 1, t) + P (k, t) [1 (k, t)] (10)
n=0
Ahora bien, como en cada paso de tiempo anadimos un nuevo nodo (comen-
zando con el nodo v0 al tiempo t = 0), entonces N (t) = t + 1. Por lo tanto,
la ecuacion anterior puede escribirse como
t
X
P (n, k, t+1) = (t+1) P (k 1, t)(k 1, t)+P (k, t) [1 (k, t)] (11)
n=0
19
7. Topologa exponencial
En el caso en que cualquiera de los nodos ya existente pueda escogerse
con la misma probabilidad para conectarse con el nuevo nodo anadido, la
probabilidad (k, t) es independiente de k y queda dada por
1 1
(k, t) = =
N (t) t+1
20
que tenga mas clientes. En una escuela los varones no buscan a su pareja al
azar, sino que buscaran salir con la chica mas bonita, o tal vez con la mas
inteligente, y sera esta muchacha la que tenga mas pretendientes. Por esta
razon, Barabasi invento el concepto de enlace preferencial en el cual los nue-
vos nodos que se anaden a la red se conectaran preferentemente con los nodos
ya existentes que tengan el mayor numero de conexiones. Intuitivamente po-
demos pensar que el enlace preferencial consiste en que uno siempre trata de
estar conectado con los nodos mas populares, es decir, con los nodos de
mayor conectividad.
Para incorporar este comportamiento, Barabasi sugirio que la probabili-
dad de enlace (k, t) debe tomar la forma
1
N (t)
X
(k, t) = kn k (15)
n=0
y por lo tanto
k
(k, t) = (16)
2t
Substituyendo este resultado en la Eq. (12) obtenemos
t+1
(t + 2)P (k, t + 1) k,q = {(k 1)P (k 1, t) + [2t k] P (k, t)}
2t
En el lmite t el sistema alcanza el estado estacionario. Por lo tanto,
la distribucion de conexiones estacionaria P (k) se obtiene de la ecuacion
21
0
10
-2
10
-4
P(k) 10
-6
10
-8
10
0 1 2
10 10 10
k
22
ley de potencias, es incapaz de reproducir la gran variedad de exponentes
encontrados en la naturaleza. Por esta razon, se han propuesto diferentes
formas de la funcion (k, t) que corresponden a diferentes tipos de enlace
preferencial. Por ejemplo, Krapivsky, Redner, y Leyvraz propusieron una
funcion de enlace (k, t) no lineal (ver la referencia [6]), de la siguiente
forma 1
N (t)
X
(k, t) = kn k (19)
n=0
23
Figura 7: (A) Grafica log-log de la distribucion de conectividades P (k) para
una red WWW consistente en 260,000 paginas. (B) Conectividad k de los
nodos de la red como funcion de su edad. Las figuras fueron tomadas (sin
permiso) de la referencia [7].
24
Probablemente el contra ejemplo mas contundente que contradice los re-
sultados de las Eqs. (20) y (21) es Google, el robot buscador de la red WWW.
Recordemos que Altavista y Yahoo ya existan y estaban bien establecidos en
1998, ano en que aparecio Google. Rapidamente Google tomo la delantera,
convirtiendose en el robot buscador mas popular en el mundo informatico.
A que se debio este exito repentino de Google? Probablemente a que es-
taba mejor disenado, era mas rapido y mas eficiente que sus competidores
Altavista y Yahoo. En otras palabras, Google nacio con caractersticas que
lo hacan un robot mejor adaptadoque sus competidores.
Esta observacion hizo que Barabasi propusiera el concepto de adaptabi-
lidad en el contexto de las redes complejas. As, cada uno de los nodos vn ,
ademas de tener una conectividad kn , tambien tenia un parametro de adap-
tabilidad asociado wn . Este parametro es una medida de que tan bien estaba
adaptado el nodo vn a su entorno: entre mas grande es el valor de wn , mayor
es el grado de adaptabilidad de vn . Especficamente, lo que Barabasi hizo
fue proponer una funcion de enlace preferencial (k, w, t) que, ademas de
ser proporcional a la conectividad k de los nodos ya existentes, tambien es
proporcional a su adaptabilidad w (ver la referencia [8]). De esta forma, la
probabilidad de que un nuevo nodo anadido a la red se conecte con el nodo
vn ya existente, cuya conectividad es kn y cuya adaptabilidad es wn , queda
dada por
(kn , wn , t) = Cwn kn
donde C es una constante de normalizacion. Las adaptabilidades wn aso-
ciadas a los nodos de la red son variables aleatorias que se escogen de una
distribucion A(w). Cada nodo nace con su propia adaptabilidad, la cual no
cambia en el tiempo.
Un resultado sorprendente del modelo de enlace preferencial con adap-
tabilidad es que puede ser mapeado exactamente a un gas de Bose-Einstein.
En este mapeo cada nodo de la red representa un nivel energetico del gas,
mientras que las conectividades de los nodos representan los numeros de
ocupacion de los respectivos niveles de energa. El mapeo entre el modelo
de red y el gas de Bose-Einstein es mas que una simple matafora. Es un
mapeo matematico preciso y, bajo ciertas condiciones, la red en crecimiento
puede presentar condensacion de Bose-Einstein, lo cual significa que re-
pentinamente un nodo puede adquirir la mayora de las conexiones de la red,
independientemente de su edad (como sucedio con Google). Los que esten
interesados podran encontrar los detalles de este trabajo en la referencia [8].
25
Hasta donde yo se, no existe acuerdo cuantitativo entre los resultados del
modelo de enlace preferencial con adaptabilidad, y los datos experimentales
que se tienen de redes reales. Sin embargo, la condensacion de Bose-Einstein
predicha en este modelo podra ser el primer paso para entender mejor el
fenomeno Google.
26
1
0.8
0.6
p
0.4
0.2
0
0 0.5 1 1.5 2
z
p = 1 ezp (23)
27
p para cada valor de z. La Fig. 8 muestra p como funcion de z. Notemos
que para z < 1 la probabilidad de pertenecer a la isla gigante es cero. En
otras palabras, no hay isla gigante para z < 1. Conforme aumentamos el
valor de z (lo cual es equivalente a anadir mas conexiones a la red), la isla
gigante comienza a formarse y justo en z = 1 aparece. Este es un resultado
interesante: se necesita, en promedio, solo una conexion por nodo para que
aparezca la isla gigante. Si seguimos aumentando el valor de z, el tamano de
la isla gigante aumenta mas y mas, como se puede observar en la Fig. 8, la
cual muestra el comportamiento caracterstico de una transicion de fase de
segundo orden que ocurre en z = 1.
Consideremos ahora el caso de las redes con topologa libre de escala,
para las que la distribucion P (k) toma la forma
1
P (k) = k
()
X
donde () = k es la funcion zeta de Riemman la cual, en este ca-
k=1
so simplemente juega el papel de la constante de normalizacion. Para esta
distribucion la ecuacion de consistencia Eq. (22) se convierte en
1 X qk
q =
() k=1 k
1
= Li (q)
()
P k
donde Li (q) = k=1 k q es la funcion poli-logartmica de orden . En
terminos de la probabilidad p = 1 q, la ecuacion anterior queda como
1
p=1 Li (1 p)
()
28
El resultado anterior puede tener implicaciones importantes en la propa-
gacion de epidemias en una sociedad, en la que podemos considerar que la
isla gigante es el conjunto de personas que se han contagiado de alguna en-
fermedad. Los resultados presentados en esta seccion muestran que en redes
con topologa de Poisson siempre podemos vacunar a un numero suficiente
de personas para garantizar que la conectividad promedio z de la red de in-
dividuos infectados se mantenga inferior a 1. En tal caso podemos detener
la epidemia, ya que no habra isla gigante, solo pequenas islitas de personas
infectadas.
Sin embargo, las redes sociales no tienen topologa de Poisson, sino que
exhiben topologas libres de escala. Para tales topologas siempre existe una
isla gigante, y la probabilidad de pertenecer a ella es p = 1. Por lo tanto,
en redes libres de escala las enfermedades tarde o temprano se propagan a
todas las personas que no hayan sido vacunadas. Es decir, la unica forma de
detener la propagacion de una epidemia en redes libres de escala es vacunando
a todas las personas de la sociedad. Los efectos aterradores del resultado
anterior pueden observarse claramente en Africa, donde comunidades enteras
han desaparecido a causa del SIDA.
Mas informacion sobre la propagacion de epidemias en redes sociales pue-
de encontrarse en las referencias [9, 10].
11. Eplogo
La teora de redes complejas es un campo de gran actividad cientfica en
la actualidad. Basta con hacer una busqueda en Google con la frase Com-
plex Networkspara darnos cuenta de la gran cantidad de investigadores que
se encuentran trabajando en este campo. En estas notas introductorias he-
mos visto solo algunas de las propiedades importantes de las redes complejas,
pero la teora no se termina aqu. Actualmente uno de los principales desa-
fios es caracterizar las propiedades dinamicas de las redes complejas dado
que conocemos su topologa. Por ejemplo, la estructura de la red de regula-
cion genetica de Escherichia coli es conocida. Sin embargo, aun no podemos
predecir los diferentes fenotpos que resultan de la dinamica de dicha red.
Probablemente la persona que resuelva este problema se ganara el premio
Nobel. Pero lo que nos interesa ultimadamente es encontrar las leyes de or-
ganizacion de la materia, si es que tales leyes existen. El hecho de que redes
tan diferentes presenten el mismo tipo de topologa libre de escala sugiere
29
que puede existir una ley fundamental que determine este tipo de estructu-
ras. Dicha ley no se ha encontrado aun y tal vez nunca se encuentre, pero
el viaje hacia su descubrimiento ha resultado mas que divertido. Espero con
estas notas haberlos motivado para que se unan al estudio del fascinante
mundo de las redes complejas y a la busqueda de las leyes de organizacion
de la materia. En hora buena!
30
Apendices
A. Distribucion de Poisson como lmite de
una distribucion binomial
En este apendice mostramos como obtener la Eq. (6) a partir de la Eq. (5),
tomando el lmite N y M . Para esto utilizaremos dos resultados
bien conocidos: la formula de Stirling y la definicion de ea :
n! en nn para n grande,
a n
ea = lm 1+
n n
Utilizando la formula de Stirling, el coeficiente binomial Nk1 que aparece
en la ecuacion (5) puede escribirse, para N grande, como
N 1 (N 1)!
=
k k!(N 1 k)!
e(N 1) (N 1)N 1
k! e(N 1k) (N 1 k)N 1k
N 1
ek (N 1 k)k N 1
=
k! N 1k
Por lo tanto, la distribucion binomial (5) queda, para N grande, como
N 1
ek (N 1 k)k N 1
P (k) = (pe )k (1 pe )N 1 (24)
k! N 1k
Para continuar, notemos que la cantidad z = 2M/N es la conectividad pro-
medio de cada nodo en la red. En terminos de esta cantidad, la probabilidad
pe puede escribirse como pe = z/(N 1), con lo cual la ecuacion (24) queda
como
N 1 k N 1
ek (N 1 k)k N 1 z z
P (k) = 1
k! N 1k N 1 N 1
lo cal, despues de arreglar algunos terminos, puede escribirse como
k N 1
ek k k 1 z/(N 1)
P (k) = z 1
k! N 1 1 k/(N 1)
31
tomando el lmite N y M de tal forma que la conectividad
promedio z = 2M/N permanezca constante, y utilizando el hecho de que
ea = lmn (1 + a/n)n , obtenemos finalmente
zk
P (k) = ez
k!
Por lo tanto, para una red muy grande, el proceso de hilvanarparejas de
botones escogidas al azar genera una distribucion de conexiones de Poisson.
B. Ecuacion Maestra
Supongamos que tenemos un sistema que puede estar en cualquiera de
los estados E1 , E2 , . . . , EN . Sea Wmn (t) la probabilidad condicional de que
el sistema, dado que estaba en el estado Em al tiempo t, brinqueal estado
En . Las probabilidades Wmn (t) se denominan probabilidades de transicion.
Sea P (n, t) la probabilidad de que el sistema se encuentre en el estado En
al tiempo t. Esta probabilidad puede cambiar en el tiempo por dos factores:
1. El sistema estaba en el estado En al tiempo t y brinco a otro estado Em ,
lo cual claramente disminuye la probabilidad P (n, t + 1) de encontrar
al sistema en el estado En al tiempo t + 1.
2. El sistema estaba en algun estado Em al tiempo t y brinco al estado
En , lo cual aumenta la probabilidad P (n, t + 1) de encontrar al sistema
en el estado En al siguiente instante de tiempo.
Tomando en cuenta estos dos factores, la probabilidad de que el sistema se
encuentre en el estado En al tiempo t + 1 esta dada por
N
X N
X
P (n, t + 1) = P (m, t)Wmn (t) P (n, t)Wnm (t) (25)
m=1 m=1
El primer termino del lado derecho nos dice que al tiempo t el sistema pudo
estar en el estado Em y brincar al estado En , aumentando as la probabilidad
de estar en En al tiempo t + 1. El segundo termino toma en cuenta el hecho
de que al tiempo t el sistema pudo estar en el estado En y salirse de all,
brincando al estado Em y disminuyendo la probabilidad de estar en En al
tiempo t + 1. Las sumas sobre m toman en cuenta todos los posibles estados
hacia o desde los que puede brincar el sistema.
32
La ecuacion (25) es la ecuacion maestra del sistema. El objetivo es re-
solverla para encontrar P (n, t). Si las probabilidades de transicion Wmn
son independientes del tiempo, la ecuacion se puede resolver mas o menos
facilmente. Pero la cosa se complica enormemente si las probabilidades de
transicion dependen del tiempo. Afortunadamente, las ecuaciones maestras
que aparecen en la teora de crecimiento de redes, al menos en los casos
sencillos presentados en estas notas, son relativamente faciles de resolver.
Referencias
[1] En la red del universo de Malvel, dos super heroes estan conectados
si han aparecido por lo menos una vez en el mismo comic. De este
estudio, que puede encontrarse en http://dmi.uib.es/joe/marvel.html,
resulta que es el hombre arana el super heroe con el maximo numero de
conexiones.
[3] The Structure and Function of Complex Networks. Mark E.J. Newman.
SIAM Review 45(2):167-256 (2003).
[5] Evolution of Networks: From Biological Nets to the Internet and WWW.
S.N. Dorogovtsev and J.F.F. Mendes. Oxford University Press, Oxford.
ISBN: 0198515901. (2003). Este libro puede encontrarse GRATIS en
http://www.fyslab.hut.fi/sdo/
33
[9] Epidemic Spreading in Scale-Free Networks. Romualdo Pastor-Satorras
y Alessandro Vespignani. Phys. Rev. Lett. 86:3201-3203 (2001).
34