Está en la página 1de 11

Aparición de escala en redes aleatorias

Albert-L´aszl´o Barab´asi ∗ y R´eka Albert

Departamento de Física, Universidad de Notre-Dame, Notre-Dame, IN 46556

Los sistemas tan diversos como las redes genéticas o la red mundial se describen mejor como
arXiv: cond-mat / 9910332v1 [cond-mat.dis-nn] 21 de octubre de 1999

redes con topología compleja. Una propiedad común de muchas redes grandes es que el

Las conectividades de vértice siguen una distribución de ley de potencia sin escala. Se encuentra que esta característica es

una consecuencia de los dos mecanismos genéricos que las redes expanden continuamente por el

adición de nuevos vértices y nuevos vértices se unen preferentemente a los que ya están bien conectados

sitios. Un modelo basado en estos dos ingredientes reproduce la escala estacionaria observada.

distribuciones gratuitas, lo que indica que el desarrollo de grandes redes se rige por robustas

fenómenos de autoorganización que van más allá de los detalles de los sistemas individuales.

∗ alb@nd.edu

1
La incapacidad de la ciencia contemporánea para describir sistemas compuestos de elementos no idénticos.

elementos que tienen interacciones diversas y no locales actualmente limitan los avances en muchos

disciplinas, que van desde la biología molecular hasta la informática ( 1) La dificultad para describir

estos sistemas residen en parte en su topología: muchos de ellos forman redes bastante complejas,

cuyos vértices son los elementos del sistema y los bordes representan las interacciones entre

ellos. Por ejemplo, los sistemas vivos forman una gran red genética, cuyos vértices son proteínas.

y genes, los bordes que representan las interacciones químicas entre ellos ( 2) En una diferencia

A nivel organizacional, el sistema nervioso forma una gran red, cuyos vértices son

las células nerviosas, conectadas por axones ( 3) Pero las redes igualmente complejas ocurren en la ciencia social.

ence, donde los vértices son individuos u organizaciones, y los bordes caracterizan lo social

interacción entre ellos ( 4), o describa la red mundial (www), cuyos vértices son

Documentos HTML conectados por enlaces que apuntan de una página a otra ( 5, 6). Debido a sus

De gran tamaño y la complejidad de las interacciones, la topología de estas redes es en gran medida

desconocido.

Tradicionalmente, las redes de topología compleja se han descrito utilizando el gráfico aleatorio

teoría de Erd˝os y R´enyi (ER) ( 7) pero en ausencia de datos en grandes redes el

Las predicciones de la teoría ER rara vez se probaron en el mundo real. Sin embargo, impulsado por el

informatización de la adquisición de datos, dicha información topológica está cada vez más disponible,

aumentando la posibilidad de comprender la estabilidad dinámica y topológica de grandes

redes.

En este artículo informamos sobre la existencia de un alto grado de autoorganización que caracteriza

Las propiedades a gran escala de redes complejas. Explorando varias bases de datos grandes que describen

La topología de grandes redes que abarcan campos tan diversos como www o los patrones de citas.

en ciencia mostramos que, independientemente del sistema y la identidad de sus constituyentes, el

probabilidad P (k) que un vértice en la red interactúa con k otros vértices decae como un

ley de poder, siguiendo P (k) ∼ k - γ. Este resultado indica que las grandes redes se autoorganizan

en un estado sin escala, una característica inesperada por todos los modelos de red aleatorios existentes. A

entiendo el origen de esta invariancia de escala, mostramos que los modelos de red existentes no pueden

2
incorporar crecimiento y apego preferencial, dos características clave de las redes reales. Usando un

modelo que incorpora estos dos ingredientes, mostramos que son responsables del poder-

Escala de ley observada en redes reales. Finalmente, argumentamos que estos ingredientes juegan fácilmente

papel identificable e importante en la formación de muchos sistemas complejos, lo que implica que

nuestros resultados son relevantes para una gran clase de redes observadas en la naturaleza.

Si bien hay una gran cantidad de sistemas que forman redes complejas, la topografía detallada

Los datos lógicos solo están disponibles para unos pocos. El gráfico de colaboración de actores de cine representa

Un ejemplo bien documentado de una red social. Cada actor está representado por un vértice, dos

actores conectados si fueron elegidos juntos en la misma película. La probabilidad de que

un actor tiene k los enlaces (que caracterizan su popularidad) tienen una cola de ley de poder para grandes

k, siguiendo P (k) ∼ k - γ actor dónde γ actor = 2.3 ± 0.1 (Fig. 1A). Una red mas compleja

con más de 800 millones de vértices ( 8) es el www, donde un vértice es un documento y los bordes

son los enlaces que apuntan de un documento a otro. La topología de este gráfico determina

mina la conectividad de la web y, en consecuencia, nuestra eficacia en la localización de información sobre

el www ( 5) Información sobre P (k) se puede obtener usando robots ( 6) Indicando que

la probabilidad de que k los documentos apuntan a que una página web determinada sigue una ley de poder, con

γ www = 2.1 ± 0.1 (Fig. 1B) ( 9) Una red cuya topología refleja los patrones históricos.

del desarrollo urbano e industrial es la red eléctrica del oeste de EE. UU., los vértices

representando generadores, transformadores y subestaciones, los bordes correspondientes a la alta

líneas de transmisión de voltaje entre ellas ( 10) Debido al tamaño relativamente modesto de la red,

trabajo, que contiene solo 4941 vértices, la región de escala es menos prominente, pero no obstante

aproximado con una ley de poder con un exponente γ poder ≃ 4 (Fig. 1C). Finalmente, un lugar

La red grande y compleja está formada por los patrones de citas de las publicaciones científicas.

vértices que representan artículos publicados en revistas arbitradas, los bordes representan enlaces a

Los artículos citados en un artículo. Recientemente Redner ( 11) ha demostrado que la probabilidad de que un

se cita papel k veces (que representa la conectividad de un documento dentro de la red) sigue

una ley de poder con exponente γ citar = 3)

Los ejemplos anteriores ( 12) demostrar que muchas redes aleatorias grandes comparten la comunicación

3
Mon característica que la distribución de su conectividad local es libre de escala, después de un

ley de poder para grandes k, con un exponente γ entre 2.1 y 4, lo cual es inesperado dentro del

marco de los modelos de red existentes. El modelo de gráfico aleatorio de ER ( 7) asume que

comenzamos con norte vértices, y conecta cada par de vértices con probabilidad pags. En el modelo

la probabilidad de que un vértice tenga k bordes sigue una distribución de Poisson P (k) = e - λ λ k / k !,
• •

• norte - 1 •
dónde λ = N • • pags k ( 1 - pags) norte - 1 - k. En el modelo de mundo pequeño introducido recientemente por
• •
k
Watts y Strogatz (WS) ( 10) norte los vértices forman una red unidimensional, cada vértice es

conectado a sus dos vecinos más próximos y próximos. Con probabilidad pags cada borde es

reconectado a un vértice elegido al azar. Las conexiones de largo alcance generadas por esto

el proceso disminuye la distancia entre los vértices, lo que lleva a un fenómeno de mundo pequeño

( 13) a menudo referido como seis grados de separación ( 14) por p = 0 la distribución de probabilidad

la noción de las conectividades es P (k) = δ (k - z) dónde z es el número de coordinación en el

celosía, mientras que para finito p, P (k) todavía está en su punto máximo z, pero se hace más amplio 15). Una común

La característica de los modelos ER y WS es que la probabilidad de encontrar una versión altamente conectada

tex (es decir, un gran k) disminuye exponencialmente con k, así vértices con gran conectividad

están prácticamente ausentes. En contraste, la cola de la ley de poder que caracteriza P (k) para los estudiados

redes indica que altamente conectado (grande k) los vértices tienen una gran posibilidad de ocurrir,

dominando la conectividad.

Hay dos aspectos genéricos de las redes reales que no están incorporados en estos modelos.

Primero, ambos modelos suponen que comenzamos con un número fijo ( NORTE) de vértices, que son entonces

conectado al azar (modelo ER), o reconectado (modelo WS), sin modificar NORTE. En

Por el contrario, la mayoría de las redes del mundo real están abiertas, se forman mediante la adición continua de nuevas

vértices al sistema, por lo tanto, el número de vértices, NORTE, aumenta a lo largo de la vida

de la red. Por ejemplo, la red de actores crece al agregar nuevos actores a

En el sistema, el www crece exponencialmente en el tiempo mediante la adición de nuevas páginas web ( 8)

La literatura de investigación crece constantemente por la publicación de nuevos artículos. En consecuencia, un

La característica común de estos sistemas es que la red se expande continuamente mediante la adición

44
de nuevos vértices que están conectados a los vértices ya presentes en el sistema.

En segundo lugar, los modelos de red aleatorios suponen que la probabilidad de que dos vértices sean

conectado es aleatorio y uniforme. En contraste, la mayoría de las redes reales exhiben preferencial

conectividad Por ejemplo, un nuevo actor probablemente tenga un papel secundario, con más

actores establecidos y bien conocidos. En consecuencia, la probabilidad de que un nuevo actor sea elegido

uno establecido es mucho más alto que el casting con otros actores menos conocidos. Del mismo modo, un

La página web recién creada probablemente incluirá enlaces a documentos conocidos y populares con

Ya hay una alta conectividad, o es más probable que un nuevo manuscrito cite un bien conocido y, por lo tanto,

papel mucho más citado que sus pares menos citados y, en consecuencia, menos conocidos. Estos ejemplos

indica que la probabilidad con la que un nuevo vértice se conecta a los vértices existentes no es

uniforme, pero hay una mayor probabilidad de estar vinculado a un vértice que ya tiene un gran

Número de conexiones.

A continuación mostramos que un modelo basado en estos dos ingredientes conduce naturalmente a lo observado

Distribución invariante a escala. Para incorporar el carácter creciente de la red, comenzando

con un pequeño número ( metro 0) de vértices, en cada paso de tiempo agregamos un nuevo vértice con metro( ≤ metro 0)

bordes que vinculan el nuevo vértice a metro diferentes vértices ya presentes en el sistema. A

incorporamos el apego preferencial, suponemos que la probabilidad Π de que un nuevo vértice

se conectará al vértice yo depende de la conectividad k yo de ese vértice, de modo que

Π ( k i) = k yo/ ∑ j k j. Después t pasos de tiempo el modelo conduce a una red aleatoria con t + m 0 0

vértices y monte bordes Esta red evoluciona a un estado invariante de escala con la probabilidad

que tiene un vértice k bordes siguiendo una ley de potencia con un exponente γ modelo = 2.9 ± 0.1 (Fig. 2A).

Como la ley de poder observada para redes reales describe sistemas de tamaños bastante diferentes en

En diferentes etapas de su desarrollo, se espera que un modelo correcto proporcione un

distribución cuyas características principales son independientes del tiempo. De hecho, como lo demuestra la figura 2A,

P (k) es independiente del tiempo (y, posteriormente, independiente del tamaño del sistema metro 0 + t),

indicando que a pesar de su continuo crecimiento, el sistema se organiza en una escala libre

estado estacionario

El desarrollo de la escala de la ley de poder en el modelo indica que el crecimiento y la preferencia

55
El apego diferencial juega un papel importante en el desarrollo de la red. Para verificar que ambos

los ingredientes son necesarios, investigamos dos variantes del modelo. El modelo A mantiene el

Carácter creciente de la red, pero el apego preferencial se elimina asumiendo

que un nuevo vértice está conectado con igual probabilidad a cualquier vértice en el sistema (que

es, Π ( k) = const = 1 / ( metro 0 + t - 1)). Tal modelo (Fig. 2B) conduce a P (k) ∼ Exp( - βk),

indicando que la ausencia de apego preferencial elimina la función sin escala de

la distribución. En el modelo B comenzamos con norte vértices y sin aristas. En cada paso, nosotros

seleccione aleatoriamente un vértice y conéctelo con probabilidad Π ( k i) = k yo/ ∑ j k j al vértice yo en el

sistema. Mientras que en los primeros tiempos el modelo exhibe una escala de ley de poder, P (k) no es estacionario:

ya que norte es constante y el número de aristas aumenta con el tiempo, después T ≃ norte 2 pasos de tiempo

el sistema alcanza un estado en el que todos los vértices están conectados. El fracaso de los modelos A y

B indica que se necesitan ambos ingredientes, a saber, crecimiento y apego preferencial

para el desarrollo de la distribución estacionaria de la ley de potencia observada en la figura 1.

Debido al apego preferencial, un vértice que adquirió más conexiones que otro

uno aumentará su conectividad a una tasa más alta, por lo tanto, una diferencia inicial en la conectividad

entre dos vértices aumentará aún más a medida que la red crezca. La velocidad a la que un vértice

adquiere bordes es ∂k yo/ ∂t = k yo/ 2 t, lo que da k yo( t) = m (t / t yo) 0.5, dónde t yo es el momento en que

vértice yo fue agregado al sistema (ver Fig. 2C), una propiedad de escala que podría ser probada directamente

una vez que los datos resueltos en el tiempo sobre la conectividad de red estén disponibles. Así mayor (más pequeño t yo)

los vértices aumentan su conectividad a expensas de los más jóvenes (más grandes t yo) unos, liderando

con el tiempo a algunos vértices que están altamente conectados, un fenómeno de "rico se enriquece" que

se puede detectar fácilmente en redes reales. Además, esta propiedad se puede usar para calcular γ

analíticamente. La probabilidad de que un vértice yo tiene una conectividad más pequeña que k, P (k yo( t) <k),

Se puede escribir como P (t i> metro 2 t / k 2) Suponiendo que agreguemos los vértices a intervalos de tiempo iguales

para el sistema, obtenemos que P (t i> metro 2 t / k 2) = 1 - P (t yo ≤ metro 2 t / k 2) = 1 - metro 2 t / k 2 ( t + m 0).

La densidad de probabilidad P (k) se puede obtener de P (k) = ∂P (k yo( t) <k) / ∂k, que, en

66
largos tiempos, conduce a la solución estacionaria

P (k) = 2 metro 2
k 3,

dando γ = 3, independiente de metro. Si bien reproduce la distribución sin escalas observada, el

No se puede esperar que el modelo propuesto explique todos los aspectos de las redes estudiadas. por

esto necesitamos modelar estos sistemas con más detalle. Por ejemplo, en el modelo asumimos

apego preferencial lineal, es decir Π ( k) ∼ k. Sin embargo, mientras que en general Π ( k) podría tener

una forma arbitraria no lineal Π ( k) ∼ k α, las simulaciones indican que la escala solo está presente

para α = 1. Además, los exponentes obtenidos para las diferentes redes están dispersos

entre 2.1 y 4. Sin embargo, es fácil modificar nuestro modelo para tener en cuenta los exponentes.

diferente de γ = 3. Por ejemplo, si suponemos que una fracción pags de los enlaces está dirigido,

obtenemos γ (p) = 3 - pags, que es compatible con simulaciones numéricas ( dieciséis). Finalmente algunos

las redes evolucionan no solo agregando nuevos vértices, sino agregando (y a veces eliminando)

conexiones entre vértices establecidos. Si bien estas y otras características específicas del sistema

podría modificar el exponente γ, nuestro modelo ofrece el primer mecanismo exitoso que representa

La naturaleza invariante de la escala de las redes reales.

El crecimiento y el apego preferencial son mecanismos comunes a una serie de complejos

sistemas, incluidas las redes empresariales ( 17, 18) redes sociales (que describen individuos o

organizaciones), redes de transporte ( 19) etc. En consecuencia, esperamos que la escala

estado invariante, observado en todos los sistemas para los cuales se dispone de datos detallados,

es una propiedad genérica de muchas redes complejas, su aplicabilidad va mucho más allá de

ejemplos citados Una mejor descripción de estos sistemas ayudaría a comprender otros

sistemas complejos también, para los cuales hasta ahora hay menos información topológica disponible, incluyendo

ejemplos tan importantes como las redes genéticas o de señalización en sistemas biológicos. Nosotros a menudo

No piense en los sistemas biológicos como abiertos o en crecimiento, ya que sus características son genéticamente

codificado Sin embargo, las posibles características sin escala de las redes genéticas y de señalización podrían reflejarse

La historia evolutiva dominada por el crecimiento y la agregación de diferentes componentes.

que conduce de moléculas simples a organismos complejos. Con los rápidos avances en mapeo

77
fuera de las redes genéticas, las respuestas a estas preguntas podrían no estar demasiado lejos. Mecanismos similares

podría explicar el origen de las disparidades sociales y económicas que rigen los sistemas competitivos,

ya que las inhomogeneidades sin escala son la consecuencia inevitable de la autoorganización debida

a las decisiones locales tomadas por los vértices individuales, en base a información sesgada

hacia los vértices más visibles (más ricos), independientemente de la naturaleza y el origen de este

visibilidad.

referencias y notas

1. R. Gallagher y T. Appenzeller, Ciencias 284, 79 (1999); Servicio de RF, Ciencias 284,

80 (1999).

2. G. Weng, US Bhalla, R. Iyengar, Ciencias 284, 92 (1999).

3. C. Koch y G. Laurent, Ciencias 284, 96 (1999).

4. S. Wasserman y K. Faust, Análisis de redes sociales, ( Prensa de la Universidad de Cambridge,

Cambridge, 1994).

5. Miembros de la Inteligente proyecto, Sci. A.m 280, 54 (junio de 1999).

6. R. Albert, H. Jeong y A.-L. Barab´asi, Naturaleza 401, 130 (1999), ver también

http://www.nd.edu ∼ redes.

7. P. Erd˝os y A. R´enyi, Publ. Matemáticas. Inst. Colgado. Acad. Sci 5, 17 (1960); B. Bollob´as,

Gráficos aleatorios ( Academic Press, Londres, 1985).

8. S. Lawrence y CL Giles, Ciencias 280, 98 (1998); Naturaleza 400, 107 (1999).

9. Tenga en cuenta que, además de la distribución de enlaces entrantes, www muestra un número

de otras funciones sin escala, que caracterizan la organización de las páginas web dentro de un dominio

[BA Huberman y LA Adamic, Naturaleza 401, 131 (1999)], la distribución de búsquedas

[BA Huberman, PLT Pirolli, JE Pitkow y RJ Lukose, Ciencias 280, 95 (1998)],

o la cantidad de enlaces por página web ( 6)

10. DJ Watts y SH Strogatz, Naturaleza 393, 440 (1998).

11. S. Redner, European Physical Journal B 4, 131 (1998).

12. También estudiamos la red neuronal del gusano Caenorhabditis elegans ( 3, 10) y

el diagrama de referencia de un chip de computadora

8
(http://vlsicad.cs.ucla.edu/ ∼ queso / ispd98.html). Encontramos que P (k) para ambos es consistente

con colas de ley de poder, a pesar del hecho de que para C. elegans el tamaño relativamente pequeño de la

sistema (306 vértices) limita severamente la calidad de los datos, mientras que para el diagrama de cableado de la

Los vértices de chips con más de 200 aristas han sido eliminados de la base de datos.

13. S. Milgram, Psychol Hoy 2, 60 (1967); M. Kochen (ed.) El pequeño mundo ( Ablex

Norwood, NJ, 1989).

14. J. Guare, Seis grados de separación: una obra de teatro ( Vintage Books, Nueva York, 1990).

15. M. Barth´el´emy y LAN Amaral, Phys. Rev. Lett. 82, 15 (1999).

16. Tenga en cuenta que para la mayoría de las redes la conectividad metro de los vértices recién agregados no es

constante. Sin embargo, eligiendo metro aleatoriamente no cambiará el exponente γ [ Y. Tu, privado

comunicación].

17. WB Arthur, Ciencias 284, 107 (1999).

18. Tenga en cuenta que el apego preferencial también se utilizó para modelar correlaciones entre existencias

precios [LAN Amaral y M. Barth´el´emy, comunicación privada].

19. JR Banavar, A. Maritan y A. Rinaldo, Naturaleza 399, 130 (1999).

20. Agradecemos a DJ Watts por proporcionar C. elegans y los datos de la red eléctrica, BC

Tjaden por suministrar los datos del actor, H. Jeong por recopilar los datos en www y LA

N. Amaral por sus útiles discusiones. Este trabajo fue parcialmente apoyado por NSF Career Award

DMR-9710998.

99
CIFRAS

10- 1
10 0 0 10 0 0

UNA si C
10- 2
10- 2 10- 1

10- 3
P (k)

10- 4 4 10- 2
10- 4 4

10- 6 6 10- 3
10- 5 5

10- 8 10- 4 4
10- 6 6
10 0 0 10 1 10 2 10 3 10 0 0 10 1 10 2 10 3 10 4 4 10 0 0 10 1
k

HIGO. 1. La función de distribución de conectividades para varias redes grandes. ( UNA) Actor col-

gráfico de trabajo con N = 212, 250 vértices y conectividad promedio 〈 k 〉 = 28,78; ( SI) En todo el mundo

web, N = 325, 729, 〈 k 〉 = 5.46 ( 6); ( C) Datos de la red eléctrica, N = 4, 941, 〈 k 〉 = 2,67. Las líneas discontinuas

tener pendientes ( UNA) γ actor = 2.3, ( SI) γ www = 2.1 y ( C) γ poder = 4)

10
10 0 0
10 0 0 10 3
UNA si C
10- 2
10- 2 10 2

k yo( t)
P (k)
P (k)

10- 4 4

10- 4 4 10 1
10- 6 6

10- 8 10- 6 6 10 0 0
10 0 0 10 1 10 2 10 3 00 20 40 60 60 80 10 0 0 10 1 10 2 10 3 10 4 4 10 5 5

k k t

HIGO. 2. ( UNA) La distribución de conectividad de power-law en t = 150, 000 (o) y t = 200, 000 ( 2) como

obtenido del modelo (ver texto), utilizando metro 0 = m = 5. La pendiente de la línea discontinua es γ = 2.9. ( SI)

La distribución de conectividad exponencial para el modelo A, en el caso de metro 0 = m = 1 (o), metro 0 = m = 3

( 2), metro 0 = m = 5 ( 3) y metro 0 = m = 7 ( △). ( C) Evolución temporal de la conectividad para dos

vértices agregados al sistema en t 1 = 5 y t 2 = 95. La línea discontinua tiene pendiente 0.5.

11

También podría gustarte