Está en la página 1de 20

Redes sociales: una introduccin o

Juan Julin Merelo Guervs, jj@merelo.net, a o


Depto. Arquitectura y Tecnolog de Computadores a Universidad de Granada (Spain)

1.

Introduccin o

Las redes no son slo eso que se echa al mar para coger aced ni siquiera o as, eso que se usa para chatear con los coleguis. Una red es una forma abstracta de visualizar una serie de sistemas, y, en general, casi todos los sistemas complejos. Las redes, al n y al cabo, estn compuestas de nudos, que se llaman habia tualmente nodos, y de enlaces entre ellos; que se llaman aristas, si es que son echas que van de un nodo al otro, con un sentido denido, o bien arcos, si es que la relacin es rec o proca, o por decirlo de otro modo, las echas tiene puntas en los dos extremos. Efectivamente, Internet es una red. Simplicando un poco, los arcos son los diferentes medios que sirven para enlazar dos ordenadores conectados a la red (inalmbricos o almbricos), mientras que los nodos son, efectivamente, los a a diferentes chismes computacionales conectados a la red. Pero tambin es una red e un grupo de pginas web, que usen hiperenlaces para referirse unas a otras. En a general, en este caso se tratar de aristas, porque los hiperenlaces tienen una a direccin denida (de la pgina que enlaza a la enlazada). o a Si esas pginas web estn escritas por una sola persona, o son directamente a a pginas web personales, los enlaces pueden reejar una relacin social entre los a o creadores de la web, que se podr expresar vagamente como conoce-a, el escritor a de una web que ha incluido un enlace a la segunda web conoce-al autor de esa segunda web. Las redes sociales son tambin redes complejas, aunque usan una e terminolog ligeramente diferente: los nodos son agentes, porque hacen algo, a mientras que las aristas o arcos expresan, habitualmente, una relacin social tal o como conoce-a, es-amigo-de, o han-comido-spaghetis-juntos.

2.

Calculando relaciones sociales

El reducir las relaciones sociales a un grafo (es decir, un conjunto de nodos con unas relaciones expl citas entre ellos) permite hacer una serie de estudios sobre esa maraa, de la cual se pueden extraer conclusiones desde simples (cuntas pern a sonas intermedias har falta para conseguir el nmero de mvil de Beckham) an u o hasta complejas (quin es el agente con ms inuencia dentro de una red social). e a Veamos una red relativamente simple: la de algunos jugadores de ftbol, con la u relacin han jugado en el mismo equipo en la siguiente gura 1. o

Figura1. Red de relaciones entre 6 jugadores de ftbol: Figo, Van Nistelrooy, Beu ckham, Ronaldo y Rivaldo. Algunos han jugado juntos en el Real Madrid, otros en el Manchester United, y otros en el Barcelona. Supongo que, esperando suciente tiempo, todos habrn jugado en el mismo equipo que todos, porque Rivaldo anda ahora en a no s qu equipo griego, Kluiwert en el Valencia, y Figo ya no est en el Madrid. Se e e a excluye tambin la diagonal, porque el hecho de que se relacionen consigo mismo no es e interesante.

Lo primero que hay que hacer para analizar esta red es expresarla como una matriz de contacto, que tenga como las y columnas los actores o agentes de esta red social; esta matriz se muestra en la tabla 1. Esa tabla se puede introducir en una hoja de clculo, o en un chero CSV a (comma separated value, valores separados por comas (u otro separador, tal como el punto y coma), es decir, cada la de la matriz en una l nea, sus valores separados por comas), de esta forma: Van Nistelrooy ; 0 ; 1 ; 0 ; 0 ; 0 ; 0 y usarla en alguno de los programas de anlisis de redes sociales que permitirn, a a para empezar, visualizarla, tal como se ve en la gura 2. Entre otras cosas que permite apreciar la gura 2 es el hecho de que la red (o grafo; en realidad se trata de eso) est conectada; es decir, siguiendo v a nculos puedes ir de cualquier jugador a cualquier otro jugador. Si quisieras el mvil de o

Van Nistelrooy Beckham Figo Ronaldo Rivaldo Kluiwert Van Nistelrooy 0 1 0 0 0 0 Beckham 0 0 1 1 0 0 Figo 0 0 0 1 1 1 Ronaldo 0 0 0 0 1 1 Rivaldo 0 0 0 0 0 1 Kluiwert 0 0 0 0 0 0 Cuadro1. Matriz de relaciones entre los diferentes jugadores de la red social futbol stica. Si existe un enlace entre un jugador y otro, el elemento correspondiente de la matriz tendr el valor 1. Se muestra (convencionalmente) slo el tringulo superior de la maa o a triz, aunque se entiende que, tratndose de una matriz simtrica, los elementos por a e debajo de la diagonal tienen el mismo valor que los que hay por encima de la diagonal.

Figura2. Red futbol stica representada por el programa Pajek a partir de un chero tal como el anterior. La simple representacin de la red de forma ptima (es decir, de o o forma que el c rculo que representa a cada agente est ms cercano a aquellos con los a a que est unido, y ms lejos de aquellos con los que no tiene ninguna relacin) permite a a o apreciar estructuras tales como el cuadrado que forman Kluiwert, Ronaldo, Rivaldo y Figo.

Van Nistelrooy, no tendr ms que preguntar a cualquiera de ellos, y acabar as a an dndotelo, antes o despus. Pero evidentemente, el nmero de pasos intermedios a e u variar dependiendo de a quin le preguntes. Cunto variar? En media, un a e a a programa de anlisis tal como el Pajek [Batagelj and Mrvar, 2003] o UCINET a [Borgatti et al., 2002] dar un resultado tal como el siguiente: a Average distance (among reachable pairs) = 1.533 Distance-based cohesion = 0.389 Es decir, que la distancia media entre dos agentes cualesquiera es de 1.533; habr que usar entre una y dos conexiones para alcanzar a un futbolista cualesa quiera (siempre que seas uno de los otros, claro). Se supone, claro est, que se sigue el camino ms corto. A este camino ms a a a corto se le denomina geodsica, por similitud a las geodsicas que son las curvas e e

que siguen el camino ms corto entre dos puntos del mapa. Esa distancia media a es la media de las distancias ms cortas entre todos los elementos de la red, a tomados uno por uno. Para calcularlo habr que hacer una matriz similar a la a anterior, lo que queda como ejercicio para el lector. Otra cantidad interesante es el dimetro de la red. Qu tamao tiene? As a e n , a ojo de buen cubero, ser 4: la distancia mayor entre dos elementos de la red a (siempre que se siga una de esas geodsicas, claro). Esta cantidad es interesante, e porque reeja lo grande que es la red. Ms que tomada de forma aislada, lo que a interesa es ver cmo evoluciona el dimetro de la red cuando se aaden nuevos o a n nodos. Podr pensarse que siempre que se aada un nodo nuevo aumentar el a n a dimetro; pero, mirando esta red, slo aumentar de dimetro si se aade un a o a a n nodo que est unido solo a Van Nistelrooy (pongamos, por ejemplo, Michael e Owen). Tambin es interesante ver cmo se agrupan los enlaces de la red. En el e o caso de Figo y Ronaldo se puede decir aquello de los amigos de mis amigos son tus amigos: todos los que reciben un enlace de uno, reciben un enlace de otro; es decir, el enlazado es transitivo. Si Ronaldo enlaza a Kluiwert, y Figo enlaza a Ronaldo, Figo tambin enlaza a Kluiwert. Sin embargo, no siempre es e as Beckham ha estado en un equipo con Figo, y Van Nistelrooy con Beckham, : pero evidentemente, y por la presente, Van Nistelrooy no ha coincidido con Figo (aunque acabarn coincidiendo en algn equipo de Qatar antes de retirsrse, a u seguro). Esta tendencia a agruparse se denomina coeciente de clustering, y representa la tendencia natural de la gente a transmitir relaciones. Un grafo con un coeciente de clustering alto tendr relaciones sociales muy tupidas, con a todos ms o menos relacionados con todos; por el contrario, un coeciente de a clustering bajo representar relaciones de un tipo particular, generalmente no a transmisibles.

3.

Grafos bipartitos

En realidad, el grco con el que hemos estado tratando anteriormente est coma a puesto de dos tipos de actores: los futbolistas y los equipos de ftbol. Cada futu bolista estar relacionado con el equipo de ftbol en el que ha estado, y slo a u o habr enlaces entre futbolistas y equipos, pero no de los futbolistas o de los a equipos entre si. A Este tipo de grafos se les llama grafos bipartitos. Los grafos bipartitos tienen dos tipos de nodos, tal como aparece en la gura 3 Los grafos bipartitos, sin embargo, son ms fciles de estudiar convirtindolos a a e en unipartitos o grafos modo-uno: para ello simplemente se proyectan, eliminando los nodos de uno de los dos tipos, y sustituyndolos por la relacin estar e o conectados al mismo nodo: dos nodos rojos estarn enlazados si, y solo si, estn a a enlazados al mismo nodo en el grafo bipartito. El grco 3 se convierte en el a grafo que aparece en la gura 4, de modo 1: La distincin entre los grcos de uno u otro tipo es importante, sobre todo, o a a la hora de calcular un grco aleatorio que tuviera las mismas propiedades a que el grafo estudiado. Por ejemplo, el coeciente de clustering, mencionado

Figura3. Grafo bipartito con nodos de tipo azul y nodos de tipo rojo. Los enlaces van solamente de los nodos azules a los rojos.

Figura4. Grafo unipartito, o de modo 1, generado a partir del grco bipartito reprea sentado en la gura 3.

anteriormente, de un grafo generado aleatoriamente ser diferente si procede de a un grafo bipartito que si procede de uno con nodos de un solo tipo; en el caso del grafo bipartito, evidentemente, ser mayor. a

4.

Mundo peque o n

La casualidad de que dos futbolistas que han jugado en los juveniles del Racing se encuentren de repente jugando en un equipo de la segunda divisin o china hace que se hable de que el mundo es un pauelo, lo que corresponde a n la expresin inglesa Its a small world. Quin no se ha montado en un avin, o o e o un autobs, y descubierto que el que est sentado al lado de uno es primo del u a cuado del barbero del pueblo donde hizo la mili, o algo as lo que conduce a la n , creencia popular de que todo el mundo est a 6 grados de separacin, 6 apretones a o de manos de cualquier otra persona, sea un masai de Kenya o un Hmong de las montaas del Yemen. n Al parecer, fue Guglielmo Marconi, el inventor del telgrafo, el que dijo (y e esto es posiblemente apcrifo) que dos personas cualesquiera en el mundo estaban o separadas por una media de 5 estaciones de telgrafo. Y alguien, en los aos 83 e n

sesenta, se puso a probar si tal cosa era cierta. Fue Stanley Milgram, en el primero del que acab siendo una serie de experimentos [Milgram, 1967], el que o intent medir cuntas personas, efectivamente separaban a todo el mundo de un o a agente de Bolsa que resid en una ciudad de Masachussets, por el procedimiento a de dar a un grupo de personas una carta, y pedir que se la hicieran llegar a ese agente de bolsa de la forma ms corta posible, con la condicin de que ten a o an que entregarla en mano. Y vio que, efectivamente, la moda estad stica, es decir, el nmero de personas por las que hab pasado la carta en la mayor parte de u a los casos, era (ms o menos) cinco (vase gura 5, lo que corresponder a seis a e a grados de separacin. De ah la expresin de los 6 grados de separacin, que o o o se convertir posteriormente en una obra de teatro y pel a cula (con Will Smith, Donald Sutherland y Stockard Channing), y en una pgina web. 6 grados de a separacin hasta Kevin Bacon. o

Figura5. Histograma del nmero de personas por las que pas la carta en uno de los u o experimentos de Milgram. De los que efectivamente llegaron a su destino, la moda fue 4 personas, correspondiente a 5 grados de separacin. o

En este ultimo juego se usaba el grafo bipartito de pel culas y actores, proyectado al grafo homogneo de actores y la relacin ha participado en la misma e o pel cula. El dimetro de este grafo es bastante mayor que los clebres 6 grados, a e pero Kevin Bacon tiene una posicin relativamente buena dentro del mismo: su o grado medio de separacin a todo el resto del grafo est entre 3 y 4; por lo que, o a en media, slo harn falta 3 o 4 pel o a culas para encontrar la relacin entre Kevin o Bacon y cualquier otro actor, sea John Travolta o Tita Merelo1 . Las redes pequeas son un pauelo. Pero redes muy grandes (como la de n n actores, por ejemplo, o la Internet) pueden serlo tambin. Partiendo de una red e regular, Watts y Strogatz [Watts and Strogatz, 1998] probaron que, aadiendo n unos pocos enlaces, el dimetro de la red disminu drsticamente, mientras que a a a el coeciente de clustering no variaba sustancialmente; sin embargo, el coeciente de clustering de una red mundo pequeo es mayor que en una red aleatoria; de n forma que, si no se pueden hacer mediciones a gran escala de la red, partiendo del coeciente (conocido) de clustering de una red aleatoria con el nmero de u nodos y enlaces de la red que se est midiendo, y comparndolo con el coeciente a a
1

La pgina est en la direccin http://oracleofbacon.org, y Tita Merello (o Merelo) a a o est separada de Kevin Bacon por tres grados de separacin solamente a o

de clustering de esta, se puede tener una primera aproximacin a si la red es de o tipo mundo pequeo o no. n Este tipo de medidas se pueden aplicar tambin a mundos paralelos. Es e un mundo pequeo la red de conocimientos de los superhroes (entendindon e e se como tal haber aparecido en el mismo nmero de un cmic)? Mir et al u o o [Alberich et al., 2002] hicieron diferentes medidas sobre el universo Marvel (que aparece en los cmics de este sello), y encontr que, a pesar de tratarse de un o o mundo pequeo, su coeciente de clustering era relativamente pequeo, aunque n n hab ciertas super-estrellas sociomtricas: el Capitn Amrica y Spiderman, que a e a e hab aparecido en cientos de team-up con otros superhroes. Especialmente el an e Capi, que ha sido miembro de los Vengadores desde que era cabo. Las redes mundo pequeo tienen una caracter n stica importante: cuando aumentan de tamao, su dimetro aumenta lentamente. Cmo de lentamente? Si n a o pensamos que aumenta linealmente con el nmero de nuevos nodos, ya nos estau mos pasando de rpidos. Incluso si pensamos en la mitad, o en la ra cuadrada. a z Aumento lento, en este caso, signica que aumenta logar tmicamente. Bastante lento: si se aaden 1000 nuevos nodos, el dimetro podr aumentar en 3. n a a A las redes sociales les suele suceder esto; casi todas son de tipo mundo pequeo. Otras redes tienden a serlo: por ejemplo, la red de conexiones areas n e de un pa como los Estados Unidos, o la red de carreteras de Espaa. Y como s n en estas, claro est, hay atascos. a En los nodos de las redes mundo pequeo se suele producir un efecto den nominado canalizacin. Todos los nodos estn conectados a todos los dems a o a a partir de unas pocas conexiones, pero su alcance al resto del mundo no est rea partido de forma equitativa entre todas ellas. Hay una, o unas pocas, a travs e de las cuales pasan la mayor de las geodsicas. De hecho, en el experimento a e de Milgram se vio algo similar: la mayor de las cartas le llegaron al agente de a Bolsa a travs de un colega suyo. e Otra red que se suele someter a estudios habitualmente es la denominada red de coautor en trabajos cient as cos, en las que los nodos son personas, y los enlaces representan coautor en un trabajo cient a co publicado; todos los cient cos autores de un trabajo tendrn enlaces entre ellos [Kretschmer, 1997]. a Pues bien, en esta red de coautor de trabajos cient as cos sucede algo similar: Newman [Newman, 2001] hall que la mayor parte de los contactos le llegaban o a travs de un coautor suyo. Y seguramente t mismo, lector, si piensas como e u conociste a tu c rculo de amistades te dars cuenta que la mayor te los presena a taron slo una o dos personas. Este fenmeno lleva a personas como Malcolm o o Gladwell de hablar del fenmeno de los conectores en su libro The Tipping Point o [Gladwell, 2003]: estos conectores efectivamente unen a gran parte de su red social con el resto del mundo (por el simple hecho de que tienen ms conexiones a que nadie).

5.

Evolucin de las redes o

Sin embargo las redes se hacen, no nacen, y dependiendo de cmo vayan o creciendo, el tipo de red y sus propiedades sern diferentes. Por eso, se han a propuesto diferentes modelos de crecimiento de redes. El ms antiguo es el de a Erds-Renyi, que es un modelo de crecimiento de redes aleatorias, en el que o cada vez que se aade un nodo nuevo, se enlaza a uno aleatorio. Como moden lo, no est mal, y tiene propiedades interesantes, pero hay pocas redes en el a mundo real que se comporten as siempre hay nodos ms chulos que otros. Por , a eso, Barabsi [Barabsi and Albert, 1999,Barabsi, 2002] y otros propusieron un a a a modelo denominado de enlazado preferencial: los nodos mejores se enlazan con ms probabilidad que los peores; aunque en realidad, slo se sabe si son los mea o jores por el nmero de enlaces que ya tienen; por lo tanto, es un modelo poco u equitativo: da a los que tiene ms, aunque por lo menos no quita a los que tienen a menos. Las redes que resultan de estos dos modelos se diferencian, al menos, en lo que se denomina el componente gigante, es decir, un grupo de nodos enlazados entre si, y que agrupan a la mayor de los nodos de la red. Se produce tambin un a e efecto percolacin: llega un punto en el que los diferentes componentes aislados o se unen. Sin embargo, en las redes con enlace preferencial el componente gigante aparece con muchos menos nodos, ya que los nodos entrantes se conectan con ms a probabilidad a los nodos que ya tienen muchas conexiones, que, evidentemente, estarn conectados al resto del componente. a En grafos dirigidos se produce una situacin similar, la que se muestra en la o gura 6 El componente gigante aparece tambin en casi todas las redes sociales. Por e ejemplo, en el estudio de Newman de las redes de coautor [Newman, 2001] as todos los campos tienen un componente gigante que agrupa ms del 50 % de a los autores; en algunos campos, agrupa casi al 50 % de los mismos. En cuanto a la web, los estudios de Huberman han descubierto que el componente principal gran parte de los sitios web.

6.

Leyes de potencias

El que los ricos se hagan ms ricos, una situacin habitual en muchas redes a o sociales, lleva a la denominada Ley de Pareto, que se suele enunciar como El 20 % de la poblacin tiene el 80 % de las riquezas. En realidad, la situacin o o se puede generalizar a lo que se denomina una ley de potencias: si la variable independiente y la dependiente se representan en escala logar tmica, la l nea que mejor se adapta a los puntos es una l nea recta. En el caso de que la variable dependiente sea el orden en el que aparecen las cantidades que se representan, se le suele denominar ley de Zipf. Por ejemplo, muchas redes siguen una ley de Zipf en el nmero de enlaces. u Los enlaces del nodo ms enlazado son un mltiplo jo del segundo ms enlazado a u a

Figura6. Esquema de un grafo dirigido maduro. Aparte del componente gigante o principal (en el centro, etiquetado con main), hay una parte que slo enlaza o es o enlazado desde l (las asas, pequeos componentes que enlazan o son enlazados, pero e n que estn fuera del componente principal, islas y tentculos o tneles que enlazan a a u componentes lejanos.

(digamos, 2 veces ms), ste a su vez del tercero ms enlazado, y as sucesivaa e a mente. El primero ms enlazado tendr, por tanto, 8 enlaces ms que el cuarto a a a ms enlazado. a Esto provoca a su vez una serie de fenmenos: nodos ms enlazados sern o a a ms conocidos, y en pginas webs, o espec a a camente en bitcoras2 , el nmero de a u visitas (de las cuales muchas proceden de las otras bitcoras que le enlazan, o a proceden de un buscador y son causadas por el pagerank de Google elevado debido a esos mismos enlaces) tambin seguir una ley de Zipf, tal como se muestra e a en la gura 7, extraida de la primera encuesta sobre lectores/autores de bitcoras a en la blogosfera (http://tintachina.com/archivo/los weblogs mas leidos.php). Pero tambin aparecen leyes de potencias en otros sitios: en la distribucin e o de nodos con un nmero de enlaces determinado. Representando en abcisas el u nmero de enlaces, y en ordenadas el nmero de nodos con ese nmero de enlaces, u u u en las redes con enlazado preferencial, y en muchas redes sociales (por ejemplo, en la blogosfera) se sigue una ley de potencias: habr muchos nodos con ningn a u enlace, menos (en una proporcin ja) con un enlace, y as sucesivamente. Pero o una caracter stica importante de las leyes de potencias es que su valor disminuye ms lentamente que una exponencial, lo que da lugar a una cola larga, o fat tail. a Esta cola larga, al contrario de lo que se suele pensar habitualmente, lo que dice es que sucesos extremos (en este caso, nodos con un nmero extremo de enlaces) u suceden con una probabilidad no nula. La forma habitual de verlo es darle la
2

Para una introduccin ms completa a las bitcoras, ver en este mismo volumen los o a a cap tulos escritos por Jos Luis Orihuela y Fernando Tricas e

Figura7. Grco que representa el nmero de lectores de un grupo de blogs frente al a u lugar que ocupan, puestos por orden. Los datos experimentales se representan con un rombo (de color rojo, si ve en color), y el ajuste a una ley de potencias se representa mediante una l nea verde. Los datos estn extraidos de la Primera encuesta de lectoa res/escritores de blogs, preparada por Tintachina (http://tintachina.com) y Blogpocket (http://blogpocket.com).

vuelta a esta grca, y mostrar en abscisas el nmero de nodos y en ordenadas a u el nmero de enlaces: la cola larga nos dir que hay muchos nodos con ningn u a u o pocos enlaces, pero, lo ms importante, que si tomamos en consideracin el a o nmero total de enlaces (o de compras, o de visitas) en los nodos ms enlazados, u a ste ser mayor que el nmero de enlaces total de los nodos ms enlazados. Sin e a u a embargo, eso depende del exponente de la ley de potencias. Como se ve en la gura 8, las leyes de potencias se comportan de forma muy diferente dependiendo del exponente. En esta gura se presenta la suma acumulativa de los valores de una funcin, para x menor que el valor de la o abscisa representado. Por ejemplo, se ve que los valores de x < 100 acumulan el 5 % del valor (aproximadamente) para la grca inferior (en la que el exponente a es 1/2), aproximadamente el 20 % para la siguiente, pero casi el 100 % para las dos siguientes (que son leyes de potencias con exponentes mayores que uno). Lo que implica que el fenmeno de la cola larga funciona slo para leyes de o o potencias con exponente menor que uno: los primeros nodos acumulan slo un o porcentaje pequeo del valor. Por ejemplo, en el caso de un exponente igual a n 3/4, los valores mayores que 100 acumulan aproximadamente el 80 % del valor total. Una medida no demasiado reciente [Merelo, 2003] da el resultado que se muestra en la gura 9. Esos puntos experimentales se pueden ajustar segn una ley de potencias u con un exponente menor que uno: 338x0,58 , por lo que cabr suponer que en a la blogosfera espaola s se produce ese fenmeno de colas largas mencionado n o anteriormente. En la blogosfera americana, el exponente negativo es 0.8309, al-

Figura8. Representacin de leyes de potencias con diferente exponente, f (x) = xp . o En ordenadas se representa la suma acumulativa de los valores f (x), para x < x0 . Los dos grcos que aparecen en la parte baja de la grca corresponden a vaa a lores de p menores que 1, y los dos en la parte alta, a valores mayores que 1. Una explicacin ms completa en el sitio donde apareci publicado originalmente, o a o http://atalaya.blogalia.com/historias/22196.

go superior. Es un mundo ms cruel, sin lugar a dudas. Con plutcratas ms a o a plutcratas. o Por eso es interesante ver segn qu ley de potencias se comporta redes tau e les como la blogosfera. Si el exponente es mayor que uno, aparecern esas colas a largas, la blogosfera ser igualitaria, y valdr ms ser cola de len que cabeza de a a a o ratn. Sin embargo, si el exponente es mayor que uno, los plutcratas blogosfrio o e cos acumularn la mayor parte de prcticamente todo: enlaces, visitas y Nokias a a enviados para que se hable de ellos3 . Esos plutcratas son los incluidos en la o denominada lista A, o grupo de bitcoras acaparadoras que estn siempre en los a a top de todo. Lo que est bien, pero no hay que olvidar que cualquier medida de a la red da una idea esttica de la red en cada momento, y que quien tiene ms a a enlaces, o visitas, o comentarios hoy, puede dejar de tenerlos maana. As que n a nimo, que entrar en la blogosfera es fcil, y cada uno tiene derecho a sus 5 minua tos/5000 visitas/500 comentarios de fama (la cola larga proveer). En todo caso, a no est tan claro que la blogosfera, al menos la espaola, siga una ley de potena n cias. Ms o menos la sigue, y se acerca cada vez ms [Tricas and Merelo, 2004]. a a
3

En marzo de 2004, Nokia envi terminales Nokia 7710 a varios autores de bitcoras o a en Espaa, Francia y Finlandia; entre los espaoles, estn varios de los autores de n n a este volumen: Pedro Jorge Romero, Jos Luis Orihuela, y al autor de este texto. e

Figura9. Grca de puesto vs. nmero de enlaces entrantes, en la blogosfera espaola a u n hace un ao. Los datos fueron tomados del Blogmetro (http://blogometro.blogalia.com) n o [Tricas et al., 2003], y por lo tanto, en aquella poca, eran los ms exhaustivos dispoe a nibles. El ajuste segn una ley de potencias no es demasiado bueno. u

Lo que tampoco est nada claro es que las redes que aparentemente siguen a una ley de potencias la sigan de verdad. Y lo es porque en el Mundo RealT M es muy dif tener todos los enlaces posibles; es dif ser exhaustivo a la hora cil cil de hacer un mapa incluso de los hiperenlaces en un grupo de pginas web. Para a empezar, porque un enlace es algo ef mero: puede desaparecer en un momento determinado, o puede desaparecer el destino del enlace, o haber cambiado de direccin, o, como mucho, podrs abarcar un grupo nito de pginas web. Todo o a a ello introduce sesgos en el muestreo, y hay quien arma que muchas de las leyes de potencias medidas son en realidad exponenciales submuestreadas; es decir, que si se usan sucientes nodos y se toman en consideracin todos los enlaces, o las leyes de potencias desaparecern. En realidad, el enlazado preferencias no a se da en el Mundo RealT M . Para empezar, un pobre nodo que entre en una red no suele tener una visin completa de la misma, por lo tanto no puede o enlazar preferencialmente al que ms enlaces tenga; o puede que, simplemente, a no pueda ver el nmero de enlaces (lo que es totalmente cierto con el nmero u u de enlaces entrantes: es prcticamente imposible calcularlo de forma precisa). Y a para seguir, los enlaces desaparecen y se transforman, por lo que, lo que tenemos en un momento determinado, es algo casi totalmente diferente de una red con ley de potencias. Por ejemplo, aparecen leyes log-normales (es decir, distribuciones en las que el logaritmo de la variable sigue una distribucin normal, la clsica o a campana de Gauss: visitar la denicin en MathWorld para una explicacin ms o o a detallada y ver las grcas) o simplemente exponenciales. a Las redes que siguen una ley de potencias se suelen denominar libres de escala, por alguna razn recndita que indica que no hay una escala preferida, o o o nmero de enlaces preferido, con respecto a los dems. Las redes aleatorias siguen u a una distribucin de Poisson en cantidades tales como el nmero de enlaces; sin o u

embargo, las redes libres de escala siguen una ley de potencias en la que la moda estad stica seguida es, en realidad, el nmero m u nimo de enlaces medido (0 o 1), y la media depende del exponente de la ley de potencias, aunque no es un lugar ni una escala destacada dentro de la red. En resumen, que las redes complejas, y entre ellas las redes sociales, estn a cubiertas casi por doquier por leyes de potencias, especialmente en el nmero de u enlaces y cantidades relacionadas con los mismos. Pero esas leyes de potencias nunca estn claras, y en algunos casos, pueden aparecer ciertas desviaciones con a respecto a la ley de potencias perfecta.

7.

Cul es tu red preferida? a

Que es como preguntar a quin se quiere ms, si al padre o a la madre. e a Qu redes son ms interesantes: las mundo pequeo o las libres de escala? e a n En principio, las libres de escala. Muchas redes son mundo pequeo, y eso n no las hace especialmente interesantes. Es cuestin slo de poner unos cuantos o o enlaces bien dirigidos, unas cuantas circunvalaciones, y casi cualquier red se puede convertir en una red mundo pequeo. n Sin embargo, las redes que siguen una ley de potencias son bastante ms ina teresantes, porque hablan de unos procesos de evolucin algunas veces evidentes, o pero en otros caso dif ciles de encontrar. Si adems tienen la propiedad de ser a mundos pequeos, se convierten en doblemente interesantes. Las redes sociales n que aparecen en la blogosfera son habitualmente de este tipo, y eso las hace ms a o menos interesantes. Estas redes son tambin interesantes desde otro punto de vista: la vulnerabie lidad a ataques. Una red ley de potencias es bastante ms vulnerable: eliminando a sistemticamente los nodos ms conectados, se acaba rpidamente con la coneca a a tividad global de la vez, y con menos rapidez, va aumentando el dimetro de a la red. Sin embargo, en una red mundo pequeo ese aumento del dimetro es n a mucho ms lento, y hay que eliminar muchos nodos para notar una disminucin a o notable en el dimetro. Por ejemplo, se ha sugerido que para librar a una red de a virus [Dezs and Barabsi, 2002] basta con desinfectar y mantener desinfectados o a los nodos ms conectados, es decir, aquellos que tengan ms gente en la libreta a a de direcciones. Sin embargo, la efectividad de esa medida es relativamente pequea si, adems de tratarse de una red libre de escala (como es el caso), es una n a ley de potencias. Lo mismo ocurre con la red de carreteras: su vulnerabilidad es relativamente grande, dado que se trata generalmente de una red libre de escala. Si se produce una congestin en alguno de los nodos ms conectados, la red se o a viene abajo rpidamente. a

8.

Buscando el ombligo

Se cree como se cree una red, hay nodos de una red que son ms iguales a que otros. Los que tienen ms enlaces, entrantes, salientes o indiferentes, estn a a destacados, pero no siempre tienen porqu ser los ms importantes. Imaginemos e a

una red como una red viaria, por donde tienen que pasar cosas (lo que sucede bastante a menudo). Los nodos con ms importancia sern los ms inevitables, a a a es decir, aquellos por los que hay que pasar ms inevitablemente cuando se vaya a de un punto a otro de la red. Lo mismo ocurrir con los enlaces: los ms inevitaa a bles tendrn, forzosamente, ms importancia, porque, en caso de ser eliminados, a a dividirn o incomunicarn una parte mayor de la red. a a A esta inevitabilidad se le suele denominar centralidad o betweenness (lo que cabr traducir ms literalmente como enmediedad o juevidad, si es que tal paa a labro existiera en castellano) [Freeman, 1977]. La denicin de enmediedad, o o betweenness centrality, es la proporcin de geodsicas (recordarlas de 2) que o e pasan por el nodo o arista.

Figura10. Mapa zonal de cercan en Madrid. Las estaciones con mayor trco son as a tambin las que tienen ms enlaces: las de Atocha y la de Chamart Y de hecho, esas e a n. son las estaciones con mayor centralidad.

La centralidad es una cantidad bastante intuitiva; sobre todo si hay efectivamente alguna forma de percibir esos ujos que pasan por la red. En centro de la ciudad, habitualmente, es la zona con una mayor inmediatez. Y tambin e sucede en las redes de ferrocarriles, tal como se ve en la gura 10. Calculando la centralidad de las estaciones de cercan tambin denominada centralidad de as, e Freeman, se obtiene la gura 11.

Figura11. Grco de betweenness de Freman no normalizada para las estaciones con a ms valor. Sobresale Chamart pero tambin Atocha y, curiosamente, las estaciones a n, e ms cercanas a Atocha y Chamart que a su vez actan como conexin entre varias a n, u o l neas, tales como Villaverde Alto y Bajo y Villalba.

En la gura anterior se muestran los valores de betweenness para las diferentes estaciones. Atocha es la que mayor valor tiene, seguido por Chamart n. Posiblemente por eso los ataques terroristas del 11-M fueron dirigidos a la estacin de Atocha, porque intuitivamente es la que mayor trco tiene, y adems, o a a al cerrarse, paraliza una parte mayor de la red (la l nea amarilla o C5, azul o C4, moradao C3... pero tambin la roja o C7, la verde o C2: prcticamente todas las e a l neas se ver afectadas por su paralizacin). Teniendo en cuenta que Atocha an o es, adems, una estacin de metro y de ferrocarril, su centralidad con respecto a o a otras redes es tambin bastante alta. e En cuanto a personas, la centralidad a veces se suele igualar con popularidad, pero tambin con esos conectores de los que hemos hablado anteriormente (en e la seccin 4). Haciendo una pequea encuesta en el curso de Nuevas Tecnolog o n as en Internet, en el que se imparti por primera vez este tutorial, se encontr que o o la red de conexiones es la que aparece en la gura 12. Y esa gura da lugar al siguiente grco, que conrma la impresin de que a o hay una persona que est enmedio: es la estrella que aparece en la grca 12 y, a a adems, une partes separadas de la red. Suprimiendo ese nodo, cinco nodos (que a son un porcentaje considerable de la red) se quedar aislados, y otra zona (por an ejemplo, Eduardo Snchez) perder un atajo a gran parte de la red. Y eso se ve a a reejado en el clculo de la centralidad, que es el que aparece en la gura 13 a Lo de ser inevitable puede ser interesante en caso de que a alguien le interese montar una estacin de servicio o un bar de carretera, pero en muchas redes o

Figura12. Red social del curso de Nuevas Tecnolog en Internet, donde los nodos as son el alumnado y profesorado del mismo, y los enlaces representan la relacin conoce o a (previo al curso). Por pura casualidad, los profesores son los que tienen el nombre en minsculas y los alumnos estn en maysculas. En redes tan pequeas es dif u a u n cil apreciar de qu tipo es, pero s se aprecian ciertos grupos (como el que forman los e profesores) y una estrella centrada en Pablo Garc Tahoces. a

lo que interesa es colocarse cerca de la mayor parte de la red posible. En este caso el s mil de las carreteras nos falla (porque en las carreteras s interesa la distancia y en las redes, habitualmente, no), y tendremos que recurrir a redes de contactos personales o a redes de comunicaciones. Por ejemplo, a una empresa le puede interesar colocar un centro de datos data center lo ms cerca posible a de sus potenciales clientes, que pueden ser un pa o una regin completa. En s o la internet no interesa tanto lo largo que sea el cable sino los saltos que tenga que darse para llegar de un punto a otro: habr, por tanto, que minimizar el a nmero de saltos medio del centro de datos a todos los clientes. A ese nmero u u de saltos medio se le denomina cercan en trminos de redes, o centralidad de a e cercan (closeness centrality), y es simplemente la distancia media de un nodo a al resto de los nodos de la red. El nodo con una mxima cercan estar, por a a a decirlo as en el centro de la red, y aunque esta cantidad es dif de percibir si , cil uno est dentro de la red, es ms fcil de apreciar en un grco que la represente. a a a a Adems, en redes dirigidas (como en el caso de la red del curso) los resultados a de cercan van en contra de la intuicin, porque hay que tener en cuenta la a o direccin del enlace (una persona puede conocer a otra, pero no al contrario). o Sin embargo, en la red de trenes cercan de Madrid ms o menos la intuias a cin funciona: Atocha y Chamart son las ms cercanas, y, curiosamente, estn o n a a a la misma distancia media del resto de la red. Y aparte de las tres que hemos mencionado anteriormente, se cuela en el ranking Mndez Alvaro, que se sita e u

Figura13. Betweenness de Freeman de la red social del curso de Nuevas Tecnolog as de Internet.

en un nudo de comunicaciones para conectar sobre todo con el sur, y est sua cientemente cerca de Atocha como para estar slo a un enlace ms de distancia o a que sta del resto de la red. e En grafos bipartitos se dan otro tipo de relaciones, y no slo importa la o posicin dentro de la red, sino hacia dnde apuntan las echas. Se habla habio o tualmente de hubs, que son personas que lanzan muchas echas (el hub es el cubo de las ruedas, de donde salen los radios), o autoridades, que son a las que llegan las echas. La terminolog viene de la web o de la red de trabajos cient a cos, donde las pginas ms apuntadas o los trabajos ms citados son los que son a a a considerados autoridades en un tema determinado; por otra parte, los hubs citan todo lo que debe ser citado. Puede darse en cierto tipo de redes que la hubidad y la autoridad se den en un mismo nodo (sucede muy a menudo en pginas web, a por ejemplo). Este tipo de personas son a las que se denominan conectores en The Tipping Point, aunque un valor de autoridad alto corresponder tambin a a e quien Gladwell denomina en ese libro mavens. Aunque Gladwell hace una clara diferenciacin, en realidad no tienen que ser conceptos separados, aunque pueo de suceder: en el grco 14 aparece la parte contigua del sociograma del curso, a con las personas que actan como hubs y autoridades. El grupo de autoridau des se corresponde prcticamente con el profesorado, que se conoc entre s y a an , conoc a pocos alumnos del curso; aunque en este grupo entra tambin Lluis an e Guiu, un alumno; y se sale Eduardo Snchez, el organizador del curso, que apaa rece como un hub o conector, con un papel esencial en la conexin entre alumnos o y profesores, y de los profesores entre si. Dependiendo de la red, la autoridad y la hubidad pueden signicar cosas diferentes. Por ejemplo, en la red de los equipos de ftbol durante la Eurocopa u 2004 [Lee et al., ], los hubs deber ser los medios-punta o los defensas centrales, an y las autoridades los delanteros. Sin embargo, como se ve en la gura 15, si el hub es un defensa central y la autoridad un extremo como Xabi Alonso (lo que indica que los pases le llegan, pero no salen de l), en vez de un delantero como e

Figura14. Grco hecho usando Pajek que representa la red social contigua del curso a NTI. Diferentes colores (o diferentes tonalidades) representan la cualidad de hub (azul) y autoridad (verde); el tamao indica el valor de esa cantidad. El profesorado son los n ms conocidos (junto con Lluis Guiu), y por eso aparecen abajo a la izquierda y con a c rculos de color verde; entre el resto, Eduardo Snchez que es parte del profesorado, a acta tambin como hub, labor en la que es ayudado por Claudia Herrero, una alumna. u e

Fernando Torres o Morientes, el equipo tiene un serio problema que explica su eliminacin fulminante en la primera fase de la Eurocopa. o

9.

Resumen

En resumen, el estudio de las redes nos permite comprender cosas totalmente diferentes, desde el hecho de que surjan guras en la blogosfera hasta la eliminacin de la Eurocopa (a posteriori, claro). Estudiar de qu tipo es una red es o e interesante, porque puede explicar su origen y comportamiento, pero incluso en redes pequeas estudiar la posicin de cada nodo dentro de la misma nos puede n o ayudar a entender mucho mejor la dinmica de un grupo. Y en el ftbol, ya a u se sabe que son 11 contra 11, pero si lo miras a travs del prisma de una red, e puedes leer mejor que Ben un partido de ftbol. tez u

Agradecimientos
Agradezco a Eduardo Snchez su invitacin a impartir clase en este curso y a o su nimo a la hora de escribir este tutorial; a Pedro Jorge Romero su presencia a continua en Internet y la parte que le corresponda en la invitacin, y a los o lectores de mis blogs (Atalaya y BloJJ) sus comentarios en las historias que han sido origen de parte de los datos y los grcos de este texto. Tambin a a e Jos Luis Molina la idea de estudiar los equipos de la Eurocopa usando redes e

Figura15. Grco hecho usando Pajek que representa la red de pases del equipo a espaol en el encuentro Espaa-Portugal en la eurocopa 2004. En color diferenciado se n n representan los jugadores con el mayor valor de hub (rojo, corresponde a Puyol) y de autoridad (amarillo, corresponde a Xabi Alonso)

sociales. Tambin agradezco a Fernando Tricas la revisin de un borrador, y sus e o sugerencias.

Referencias
[Alberich et al., 2002] Alberich, R., Miro-Julia, J., and Rossello, F. (2002). Marvel universe looks almost like a real social network. Available from URL: Arxiv. [Barabsi, 2002] Barabsi, A.-L. (2002). Linked-The new science of networks. Perseus a a Publishing, Cambridge, MA. [Barabsi and Albert, 1999] Barabsi, A.-L. and Albert, R. (1999). Emergence of scaa a ling in random networks. Science, 286:509512. [Batagelj and Mrvar, 2003] Batagelj, V. and Mrvar, A. (2003). Pajek. Program for Large Network Analysis. University of Ljubljana, Slovenia, Ljubljana. To download from http://vlado.fmf.uni-lj.si/pub/networks/pajek/doc/pajekman.htm. [Borgatti et al., 2002] Borgatti, S., Everett, M., and Freeman, L. (2002). Ucinet for Windows: Software for Social Network Analysis. Analytic Technologies, Harvard, MA. [Dezs and Barabsi, 2002] Dezs, Z. and Barabsi, A.-L. (2002). Halting viruses in o a o a scale-free networks. Physical Review E, 65. 055103. [Freeman, 1977] Freeman, L. (1977). A set of measures of centrality based upon betweenness. Sociometry, 40:3541. [Gladwell, 2003] Gladwell, M. (2003). The Tipping Point. Espasa. Cmo pequeas o n cosas pueden provocar una gran diferencia. [Kretschmer, 1997] Kretschmer, H. (1997). Patterns of behaviour in coauthorship networks of invisible colleges. Scientometrics, 40(3):579591. [Lee et al., 2005] Lee, J., Borgatti, S. P., Molina, J. L., and Guervos, J. J. M. (2005). Who passes to whom: Analysis of optimal network structure in soccer matches. Poster at the Sunbelt XXV conference,.

[Merelo, 2003] Merelo, J. J. (2003). Mapeando la blogosfera hispana II: Ley de potencias. URL: http://atalaya.blogalia.com/historias/7861. [Milgram, 1967] Milgram, S. (1967). The small world problem. Psychology Today, 2:6067. [Newman, 2001] Newman, M. (2001). Who is the best connected scientist? A study of scientic coauthorship networks. Physics Review, 64(4). Available from http://arxiv.org/abs/cond-mat/0011144/. [Tricas and Merelo, 2004] Tricas, F. and Merelo, J. J. (2004). The Spanish-speaking blogosphere: Towards the power law? In Kommers, P., Isa P., and Nunes, M. B., as, editors, Web Based Communities 2004, Proceedings of the IADIS International Conference, Lisbon, Portugal, 24-26 March 2004, pages 430433. IADIS. Available from http://webdiis.unizar.es/ ftricas/Articulos/tricasMereloWBC2004.pdf. [Tricas et al., 2003] Tricas, F., Merelo, J. J., and Ru V. R. (2003). z, Do we live in a small world? Measuring the Spanish-speaking blogosphere. In Burg, T.N., editor, Blogtalks, Proceedings of BlogTalk A European Conference on Weblogs, Viena, Austria, May 23-24, 2003, pages 158173. Available from http://www.blogalia.com/pdf/20030506blogtalk.pdf. [Watts and Strogatz, 1998] Watts, D. J. and Strogatz, S. H. (1998). Collective dynamics of small-world networks. Nature, 393:440442.

También podría gustarte