Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Emergence of Scaling in Random Networks - En.es
Emergence of Scaling in Random Networks - En.es
Los sistemas tan diversos como las redes genéticas o la red mundial se describen mejor como
arXiv: cond-mat / 9910332v1 [cond-mat.dis-nn] 21 de octubre de 1999
redes con topología compleja. Una propiedad común de muchas redes grandes es que el
Las conectividades de vértice siguen una distribución de ley de potencia sin escala. Se encuentra que esta característica es
una consecuencia de los dos mecanismos genéricos que las redes expanden continuamente por el
adición de nuevos vértices y nuevos vértices se unen preferentemente a los que ya están bien conectados
sitios. Un modelo basado en estos dos ingredientes reproduce la escala estacionaria observada.
distribuciones gratuitas, lo que indica que el desarrollo de grandes redes se rige por robustas
fenómenos de autoorganización que van más allá de los detalles de los sistemas individuales.
∗ alb@nd.edu
1
La incapacidad de la ciencia contemporánea para describir sistemas compuestos de elementos no idénticos.
elementos que tienen interacciones diversas y no locales actualmente limitan los avances en muchos
disciplinas, que van desde la biología molecular hasta la informática ( 1) La dificultad para describir
estos sistemas residen en parte en su topología: muchos de ellos forman redes bastante complejas,
cuyos vértices son los elementos del sistema y los bordes representan las interacciones entre
ellos. Por ejemplo, los sistemas vivos forman una gran red genética, cuyos vértices son proteínas.
y genes, los bordes que representan las interacciones químicas entre ellos ( 2) En una diferencia
A nivel organizacional, el sistema nervioso forma una gran red, cuyos vértices son
las células nerviosas, conectadas por axones ( 3) Pero las redes igualmente complejas ocurren en la ciencia social.
ence, donde los vértices son individuos u organizaciones, y los bordes caracterizan lo social
interacción entre ellos ( 4), o describa la red mundial (www), cuyos vértices son
Documentos HTML conectados por enlaces que apuntan de una página a otra ( 5, 6). Debido a sus
De gran tamaño y la complejidad de las interacciones, la topología de estas redes es en gran medida
desconocido.
Tradicionalmente, las redes de topología compleja se han descrito utilizando el gráfico aleatorio
Las predicciones de la teoría ER rara vez se probaron en el mundo real. Sin embargo, impulsado por el
informatización de la adquisición de datos, dicha información topológica está cada vez más disponible,
redes.
En este artículo informamos sobre la existencia de un alto grado de autoorganización que caracteriza
Las propiedades a gran escala de redes complejas. Explorando varias bases de datos grandes que describen
La topología de grandes redes que abarcan campos tan diversos como www o los patrones de citas.
probabilidad P (k) que un vértice en la red interactúa con k otros vértices decae como un
ley de poder, siguiendo P (k) ∼ k - γ. Este resultado indica que las grandes redes se autoorganizan
en un estado sin escala, una característica inesperada por todos los modelos de red aleatorios existentes. A
entiendo el origen de esta invariancia de escala, mostramos que los modelos de red existentes no pueden
2
incorporar crecimiento y apego preferencial, dos características clave de las redes reales. Usando un
modelo que incorpora estos dos ingredientes, mostramos que son responsables del poder-
Escala de ley observada en redes reales. Finalmente, argumentamos que estos ingredientes juegan fácilmente
papel identificable e importante en la formación de muchos sistemas complejos, lo que implica que
nuestros resultados son relevantes para una gran clase de redes observadas en la naturaleza.
Si bien hay una gran cantidad de sistemas que forman redes complejas, la topografía detallada
Los datos lógicos solo están disponibles para unos pocos. El gráfico de colaboración de actores de cine representa
Un ejemplo bien documentado de una red social. Cada actor está representado por un vértice, dos
un actor tiene k los enlaces (que caracterizan su popularidad) tienen una cola de ley de poder para grandes
k, siguiendo P (k) ∼ k - γ actor dónde γ actor = 2.3 ± 0.1 (Fig. 1A). Una red mas compleja
con más de 800 millones de vértices ( 8) es el www, donde un vértice es un documento y los bordes
son los enlaces que apuntan de un documento a otro. La topología de este gráfico determina
el www ( 5) Información sobre P (k) se puede obtener usando robots ( 6) Indicando que
la probabilidad de que k los documentos apuntan a que una página web determinada sigue una ley de poder, con
γ www = 2.1 ± 0.1 (Fig. 1B) ( 9) Una red cuya topología refleja los patrones históricos.
del desarrollo urbano e industrial es la red eléctrica del oeste de EE. UU., los vértices
líneas de transmisión de voltaje entre ellas ( 10) Debido al tamaño relativamente modesto de la red,
trabajo, que contiene solo 4941 vértices, la región de escala es menos prominente, pero no obstante
aproximado con una ley de poder con un exponente γ poder ≃ 4 (Fig. 1C). Finalmente, un lugar
La red grande y compleja está formada por los patrones de citas de las publicaciones científicas.
vértices que representan artículos publicados en revistas arbitradas, los bordes representan enlaces a
Los artículos citados en un artículo. Recientemente Redner ( 11) ha demostrado que la probabilidad de que un
se cita papel k veces (que representa la conectividad de un documento dentro de la red) sigue
Los ejemplos anteriores ( 12) demostrar que muchas redes aleatorias grandes comparten la comunicación
3
Mon característica que la distribución de su conectividad local es libre de escala, después de un
ley de poder para grandes k, con un exponente γ entre 2.1 y 4, lo cual es inesperado dentro del
marco de los modelos de red existentes. El modelo de gráfico aleatorio de ER ( 7) asume que
comenzamos con norte vértices, y conecta cada par de vértices con probabilidad pags. En el modelo
la probabilidad de que un vértice tenga k bordes sigue una distribución de Poisson P (k) = e - λ λ k / k !,
• •
• norte - 1 •
dónde λ = N • • pags k ( 1 - pags) norte - 1 - k. En el modelo de mundo pequeño introducido recientemente por
• •
k
Watts y Strogatz (WS) ( 10) norte los vértices forman una red unidimensional, cada vértice es
conectado a sus dos vecinos más próximos y próximos. Con probabilidad pags cada borde es
reconectado a un vértice elegido al azar. Las conexiones de largo alcance generadas por esto
el proceso disminuye la distancia entre los vértices, lo que lleva a un fenómeno de mundo pequeño
( 13) a menudo referido como seis grados de separación ( 14) por p = 0 la distribución de probabilidad
celosía, mientras que para finito p, P (k) todavía está en su punto máximo z, pero se hace más amplio 15). Una común
La característica de los modelos ER y WS es que la probabilidad de encontrar una versión altamente conectada
tex (es decir, un gran k) disminuye exponencialmente con k, así vértices con gran conectividad
están prácticamente ausentes. En contraste, la cola de la ley de poder que caracteriza P (k) para los estudiados
redes indica que altamente conectado (grande k) los vértices tienen una gran posibilidad de ocurrir,
dominando la conectividad.
Hay dos aspectos genéricos de las redes reales que no están incorporados en estos modelos.
Primero, ambos modelos suponen que comenzamos con un número fijo ( NORTE) de vértices, que son entonces
conectado al azar (modelo ER), o reconectado (modelo WS), sin modificar NORTE. En
Por el contrario, la mayoría de las redes del mundo real están abiertas, se forman mediante la adición continua de nuevas
vértices al sistema, por lo tanto, el número de vértices, NORTE, aumenta a lo largo de la vida
En el sistema, el www crece exponencialmente en el tiempo mediante la adición de nuevas páginas web ( 8)
La característica común de estos sistemas es que la red se expande continuamente mediante la adición
44
de nuevos vértices que están conectados a los vértices ya presentes en el sistema.
En segundo lugar, los modelos de red aleatorios suponen que la probabilidad de que dos vértices sean
conectado es aleatorio y uniforme. En contraste, la mayoría de las redes reales exhiben preferencial
conectividad Por ejemplo, un nuevo actor probablemente tenga un papel secundario, con más
actores establecidos y bien conocidos. En consecuencia, la probabilidad de que un nuevo actor sea elegido
uno establecido es mucho más alto que el casting con otros actores menos conocidos. Del mismo modo, un
La página web recién creada probablemente incluirá enlaces a documentos conocidos y populares con
Ya hay una alta conectividad, o es más probable que un nuevo manuscrito cite un bien conocido y, por lo tanto,
papel mucho más citado que sus pares menos citados y, en consecuencia, menos conocidos. Estos ejemplos
indica que la probabilidad con la que un nuevo vértice se conecta a los vértices existentes no es
uniforme, pero hay una mayor probabilidad de estar vinculado a un vértice que ya tiene un gran
Número de conexiones.
A continuación mostramos que un modelo basado en estos dos ingredientes conduce naturalmente a lo observado
con un pequeño número ( metro 0) de vértices, en cada paso de tiempo agregamos un nuevo vértice con metro( ≤ metro 0)
bordes que vinculan el nuevo vértice a metro diferentes vértices ya presentes en el sistema. A
Π ( k i) = k yo/ ∑ j k j. Después t pasos de tiempo el modelo conduce a una red aleatoria con t + m 0 0
vértices y monte bordes Esta red evoluciona a un estado invariante de escala con la probabilidad
que tiene un vértice k bordes siguiendo una ley de potencia con un exponente γ modelo = 2.9 ± 0.1 (Fig. 2A).
Como la ley de poder observada para redes reales describe sistemas de tamaños bastante diferentes en
distribución cuyas características principales son independientes del tiempo. De hecho, como lo demuestra la figura 2A,
P (k) es independiente del tiempo (y, posteriormente, independiente del tamaño del sistema metro 0 + t),
indicando que a pesar de su continuo crecimiento, el sistema se organiza en una escala libre
estado estacionario
55
El apego diferencial juega un papel importante en el desarrollo de la red. Para verificar que ambos
los ingredientes son necesarios, investigamos dos variantes del modelo. El modelo A mantiene el
que un nuevo vértice está conectado con igual probabilidad a cualquier vértice en el sistema (que
es, Π ( k) = const = 1 / ( metro 0 + t - 1)). Tal modelo (Fig. 2B) conduce a P (k) ∼ Exp( - βk),
la distribución. En el modelo B comenzamos con norte vértices y sin aristas. En cada paso, nosotros
sistema. Mientras que en los primeros tiempos el modelo exhibe una escala de ley de poder, P (k) no es estacionario:
ya que norte es constante y el número de aristas aumenta con el tiempo, después T ≃ norte 2 pasos de tiempo
el sistema alcanza un estado en el que todos los vértices están conectados. El fracaso de los modelos A y
Debido al apego preferencial, un vértice que adquirió más conexiones que otro
uno aumentará su conectividad a una tasa más alta, por lo tanto, una diferencia inicial en la conectividad
entre dos vértices aumentará aún más a medida que la red crezca. La velocidad a la que un vértice
adquiere bordes es ∂k yo/ ∂t = k yo/ 2 t, lo que da k yo( t) = m (t / t yo) 0.5, dónde t yo es el momento en que
vértice yo fue agregado al sistema (ver Fig. 2C), una propiedad de escala que podría ser probada directamente
una vez que los datos resueltos en el tiempo sobre la conectividad de red estén disponibles. Así mayor (más pequeño t yo)
los vértices aumentan su conectividad a expensas de los más jóvenes (más grandes t yo) unos, liderando
con el tiempo a algunos vértices que están altamente conectados, un fenómeno de "rico se enriquece" que
se puede detectar fácilmente en redes reales. Además, esta propiedad se puede usar para calcular γ
analíticamente. La probabilidad de que un vértice yo tiene una conectividad más pequeña que k, P (k yo( t) <k),
Se puede escribir como P (t i> metro 2 t / k 2) Suponiendo que agreguemos los vértices a intervalos de tiempo iguales
La densidad de probabilidad P (k) se puede obtener de P (k) = ∂P (k yo( t) <k) / ∂k, que, en
66
largos tiempos, conduce a la solución estacionaria
P (k) = 2 metro 2
k 3,
No se puede esperar que el modelo propuesto explique todos los aspectos de las redes estudiadas. por
esto necesitamos modelar estos sistemas con más detalle. Por ejemplo, en el modelo asumimos
apego preferencial lineal, es decir Π ( k) ∼ k. Sin embargo, mientras que en general Π ( k) podría tener
una forma arbitraria no lineal Π ( k) ∼ k α, las simulaciones indican que la escala solo está presente
para α = 1. Además, los exponentes obtenidos para las diferentes redes están dispersos
entre 2.1 y 4. Sin embargo, es fácil modificar nuestro modelo para tener en cuenta los exponentes.
diferente de γ = 3. Por ejemplo, si suponemos que una fracción pags de los enlaces está dirigido,
obtenemos γ (p) = 3 - pags, que es compatible con simulaciones numéricas ( dieciséis). Finalmente algunos
las redes evolucionan no solo agregando nuevos vértices, sino agregando (y a veces eliminando)
conexiones entre vértices establecidos. Si bien estas y otras características específicas del sistema
podría modificar el exponente γ, nuestro modelo ofrece el primer mecanismo exitoso que representa
sistemas, incluidas las redes empresariales ( 17, 18) redes sociales (que describen individuos o
estado invariante, observado en todos los sistemas para los cuales se dispone de datos detallados,
es una propiedad genérica de muchas redes complejas, su aplicabilidad va mucho más allá de
ejemplos citados Una mejor descripción de estos sistemas ayudaría a comprender otros
sistemas complejos también, para los cuales hasta ahora hay menos información topológica disponible, incluyendo
ejemplos tan importantes como las redes genéticas o de señalización en sistemas biológicos. Nosotros a menudo
No piense en los sistemas biológicos como abiertos o en crecimiento, ya que sus características son genéticamente
codificado Sin embargo, las posibles características sin escala de las redes genéticas y de señalización podrían reflejarse
que conduce de moléculas simples a organismos complejos. Con los rápidos avances en mapeo
77
fuera de las redes genéticas, las respuestas a estas preguntas podrían no estar demasiado lejos. Mecanismos similares
podría explicar el origen de las disparidades sociales y económicas que rigen los sistemas competitivos,
ya que las inhomogeneidades sin escala son la consecuencia inevitable de la autoorganización debida
a las decisiones locales tomadas por los vértices individuales, en base a información sesgada
hacia los vértices más visibles (más ricos), independientemente de la naturaleza y el origen de este
visibilidad.
referencias y notas
80 (1999).
Cambridge, 1994).
6. R. Albert, H. Jeong y A.-L. Barab´asi, Naturaleza 401, 130 (1999), ver también
http://www.nd.edu ∼ redes.
7. P. Erd˝os y A. R´enyi, Publ. Matemáticas. Inst. Colgado. Acad. Sci 5, 17 (1960); B. Bollob´as,
9. Tenga en cuenta que, además de la distribución de enlaces entrantes, www muestra un número
de otras funciones sin escala, que caracterizan la organización de las páginas web dentro de un dominio
12. También estudiamos la red neuronal del gusano Caenorhabditis elegans ( 3, 10) y
8
(http://vlsicad.cs.ucla.edu/ ∼ queso / ispd98.html). Encontramos que P (k) para ambos es consistente
con colas de ley de poder, a pesar del hecho de que para C. elegans el tamaño relativamente pequeño de la
sistema (306 vértices) limita severamente la calidad de los datos, mientras que para el diagrama de cableado de la
Los vértices de chips con más de 200 aristas han sido eliminados de la base de datos.
13. S. Milgram, Psychol Hoy 2, 60 (1967); M. Kochen (ed.) El pequeño mundo ( Ablex
14. J. Guare, Seis grados de separación: una obra de teatro ( Vintage Books, Nueva York, 1990).
16. Tenga en cuenta que para la mayoría de las redes la conectividad metro de los vértices recién agregados no es
constante. Sin embargo, eligiendo metro aleatoriamente no cambiará el exponente γ [ Y. Tu, privado
comunicación].
18. Tenga en cuenta que el apego preferencial también se utilizó para modelar correlaciones entre existencias
20. Agradecemos a DJ Watts por proporcionar C. elegans y los datos de la red eléctrica, BC
Tjaden por suministrar los datos del actor, H. Jeong por recopilar los datos en www y LA
N. Amaral por sus útiles discusiones. Este trabajo fue parcialmente apoyado por NSF Career Award
DMR-9710998.
99
CIFRAS
10- 1
10 0 0 10 0 0
UNA si C
10- 2
10- 2 10- 1
10- 3
P (k)
10- 4 4 10- 2
10- 4 4
10- 6 6 10- 3
10- 5 5
10- 8 10- 4 4
10- 6 6
10 0 0 10 1 10 2 10 3 10 0 0 10 1 10 2 10 3 10 4 4 10 0 0 10 1
k
HIGO. 1. La función de distribución de conectividades para varias redes grandes. ( UNA) Actor col-
gráfico de trabajo con N = 212, 250 vértices y conectividad promedio 〈 k 〉 = 28,78; ( SI) En todo el mundo
web, N = 325, 729, 〈 k 〉 = 5.46 ( 6); ( C) Datos de la red eléctrica, N = 4, 941, 〈 k 〉 = 2,67. Las líneas discontinuas
10
10 0 0
10 0 0 10 3
UNA si C
10- 2
10- 2 10 2
k yo( t)
P (k)
P (k)
10- 4 4
10- 4 4 10 1
10- 6 6
10- 8 10- 6 6 10 0 0
10 0 0 10 1 10 2 10 3 00 20 40 60 60 80 10 0 0 10 1 10 2 10 3 10 4 4 10 5 5
k k t
HIGO. 2. ( UNA) La distribución de conectividad de power-law en t = 150, 000 (o) y t = 200, 000 ( 2) como
obtenido del modelo (ver texto), utilizando metro 0 = m = 5. La pendiente de la línea discontinua es γ = 2.9. ( SI)
11