Está en la página 1de 106

Universidad Nacional del Sur

Tesis de Doctor en Matemtica


Estadstica de Procesos Estocsticos y Aplicaciones a las Redes Sociales
Melina Valeria Guardiola

Baha Blanca
Agosto, 2013

Argentina

Para mis padres.

Prefacio
Esta tesis es presentada como parte de los requisitos para optar al grado acadmico de Doctor en Matemtica de la Universidad Nacional del Sur y no ha sido presentada previamente para la obtencin de otro ttulo en esta Universidad u otras. La misma contiene resultados obtenidos en investigaciones llevadas a cabo en el Departamento de Matemtica de la Universidad Nacional de Sur durante el perodo comprendido entre los meses de junio de 2008 y agosto de 2013, bajo la direccin del Dr. Gonzalo Perera, Profesor Titular Grado 5 de la Universidad de la Repblica, Uruguay, y la supervisin de la Dra. Ana Tablar, Profesora Adjunta del Departamento de Matemtica de la Universidad Nacional del Sur. Este trabajo fue nanciado con una beca otorgada por ANPCyT y UNS en el marco del Proyecto de Formacin de Doctores en reas Tecnolgicas Prioritarias (PFDT) del Programa de Recursos Humanos (PRH 2007 - cdigo 37).

iii

Agradecimientos
Antes de comenzar esta tesis, quisiera agradecer a toda la gente que me acompa durante la realizacin de la misma.

En primer lugar, a mi director Dr. Gonzalo Perera, por su dedicacin, apoyo y comprensin. Por ser adems un excelente docente, por su hospitalidad y generosidad en mis estadas en Uruguay. Su paciencia y conanza hicieron posible la culminacin de este trabajo.

Tambin quiero agradecer a Ana Tablar, Jos Bavio y Beatriz Marrn, por el compaerismo, los buenos consejos, los aportes y la colaboracin en el desarrollo de esta tesis.

Agradezco el apoyo y la predisposicin brindados por las autoridades y personal del Departamento de Matemtica de la UNS y tambin a la Agencia Nacional de Promocin Cientca y Tecnolgica por su nanciacin mediante la beca otorgada.

Finalmente, un agradecimiento de otra ndole va dirigido a mis padres por estar siempre y apoyarme en cada etapa y a mis hermanas por aconsejarme y acompaarme.

A todos, muchas gracias!

7 de Agosto de 2013 Departamento de Matemtica. UNIVERSIDAD NACIONAL DEL SUR

iv

Resumen
Las redes sociales en internet tales como Facebook, Twitter o Linkedin se han transformado en uno de los medios de comunicacin ms utilizados por millones de personas en el mundo generando una combinacin entre elementos virtuales y componentes del mundo real, razn por al cual es interesante su estudio. Comenzamos este trabajo planteando un modelo probabilstico para describir el comportamiento a largo plazo de Facebook. Debido al importante nivel de interactividad existente en la red, para simplicar el modelo utilizamos una dinmica Markoviana. Introducimos el concepto de Transversalidad Completa en una red social y proponemos estimadores para medir la interaccin entre los usuarios. Luego, realizamos test de hiptesis sobre la transversalidad en la comunicacin con los estimadores propuestos. Por otro lado, proponemos segmentar la red para estudiar comportamientos entre los segmentos y encontrar ndices de performance adecuados para medir la calidad en la segmentacin. Nuestro objetivo nal consiste en analizar la viabilidad de la Teora de Mundo Pequeo en Facebook, mediante un estimador que nos permitir estudiar la conectividad en la red y, tomando resultados sobre trazas de potencias de matrices de Wigner, hallaremos su distribucin asinttica bajo cierto contexto comunicacional. Formulamos adems, una denicin rigurosa del grado medio de separacin entre dos perles y realizamos su clculo suponiendo distintos modos de comunicacin, para poder as concluir acerca de la presencia del fenmeno de mundo pequeo en la red social.

Abstract
Virtual social networks such as Facebook, Twitter or Linkedin have become one of the means of communication most used by million of people worldwide generating combination of virtual elements and components of the real world, that is the reason for study them. We begin this work suggesting a probabilistic model to describe the long-term behavior of Facebook. Due to the high level of interactivity on the web, to simplify the model we use a Markovian dynamics. We introduce the concept of Complete Transversal Comunication in a social network, we propose estimators to measure the interaction between users and we make hypotesis testing on transversality in communication with the proposed estimators. On the other hand, we propose to segment the network, study behaviors between the segments and nd suitable performance indices to measure the quality of segmentation. Our ultimate goal is to analyze the viability of Small World Theory on Facebook by an estimator to study the network connectivity and, by results of power traces of Wigner matrices, we obtain its asymptotic distribution under certain communicative context. Also, we formulate a rigorous denition of the average degree of separation between two proles and we perform the calculation for dierent communication modes that allows us to conclude about the small world phenomenon in the social network.

vi

ndice general
Prefacio Agradecimientos Resumen Abstract Introduccin 1. Redes Sociales
1.1. 1.2. 1.3. Denicin y caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . . . Historia del SNA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Conceptos bsicos del SNA . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1. 1.3.2. 1.3.3. 1.4. 1.5. 1.6. Medidas generales de la estructura de la red . . . . . . . . . . . . .

iii iv v vi

9 11
11 16 17 17 18 19 20 22 24 24 26 29 31

Medidas de centralidad de los actores de la red . . . . . . . . . . . . Medidas de cohesin de la red . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Estado del arte

Redes sociales en Internet

La red social Facebook . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1. 1.6.2. 1.6.3. Orgenes y expansin . . . . . . . . . . . . . . . . . . . . . . . . . . Funcionamiento y caractersticas . . . . . . . . . . . . . . . . . . .

Facebook a largo plazo . . . . . . . . . . . . . . . . . . . . . . . . .

1.7.

Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2. Modelo: Dinmica de Facebook a Largo Plazo


2.1. 2.2. 2.3. Modelos Markovianos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Descripcin del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Transversalidad Completa 2.3.1. 2.3.2. Homogeneidad de Ergodicidad de . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34
34 41 52 52 54

{At } {At } .

vii

3. Estimacin y Test de Hiptesis


3.1.

57
57 57 59 60 61 62 68 70 71 73 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

U -Estadsticos
3.1.1. 3.1.2. 3.1.3.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Denicin y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . Varianza de un Distribucin

U -Estadstico: . . . . . . . asinttica de un U -Estadstico

3.2.

Estimacin y test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1. 3.2.2. Promedio de la comunicacin en la muestra . . . . . . . . . . . . . . . .

Desviacin media cuadrtica de la comunicacin entre perles

3.3.

Transversalidad Segmentada . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1. 3.3.2.

TC entre segmentos

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Calidad en la segmentacin

4. Conectividad y Teora de Mundo Pequeo


4.1. Redes mundo pequeo 4.1.1. 4.1.2. 4.1.3. 4.2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . El fenmeno de mundo pequeo . . . . . . . . . . . . . . . . . . . . Origen y experimentos . . . . . . . . . . . . . . . . . . . . . . . . .

75
75 75 76 78 79 80

Mundo pequeo y Facebook . . . . . . . . . . . . . . . . . . . . . .

Ciclos y conectividad en muestras de perles de Facebook de gran tamao 4.2.1. 4.2.2. 4.2.3. Elementos de la teora de grafos . . . . . . . . . . . . . . . . . . . .

Distribucin asinttica de la traza de potencias de matrices de Wigner 82 Convergencia dbil del estadstico

TN (r)

. . . . . . . . . . . . . . . . . . . . . . . .

85 94

4.3.

Grado medio de separacin entre dos perles de Facebook 4.3.1.

Segmentacin dbil . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 . . . . . . . . . . . . . . . . . . . . . . . . . 100

4.4.

Conclusiones y trabajo futuro

Bibliografa

103

viii

Introduccin
Los avances tecnolgicos han sido determinantes en las nuevas formas de interaccin humana permitiendo que la comunicacin sea ms eciente y supere barreras de espacio y tiempo antes limitadas. Las nuevas tecnologas de comunicacin como Internet han derivado en distintas formas, entre ellas las redes sociales que se han revelado en los ltimos aos como una herramienta comunicacional de un impacto inesperado. El contacto frecuente entre las personas a travs de estas redes da origen a relaciones virtuales que se van desarrollando de acuerdo a sus intereses. Los temas de conversacin dominantes, las noticias ms votadas, las marcas con ms me gusta, los personajes pblicos con ms seguidores o los videos ms vistos, constituyen en su conjunto un extraordinario sistema de deteccin de tendencias sociales en tiempo real. El gran desafo en la actualidad consiste en desarrollar herramientas lo sucientemente precisas para reconocer a los usuarios ms inuyentes por sectores y mercados y entender mejor las nuevas dinmicas de circulacin de informacin. A su vez, difcilmente una red social pueda ser observada en su totalidad, por lo que adquieren gran importancia los problemas estadsticos y de modelizacin probabilstica. Por otra parte, muchas veces las redes sociales aportan ejemplos de situaciones estadsticas de modelos no identicables o de datos censurados, lo cual los hace particularmente desaantes. En denitiva, nos encontramos con una amplia gama de inquietudes como las que hemos mencionado y esta tesis intenta brindar un aporte en este sentido, restringiendo el anlisis a la red social Facebook o similar en cuanto a reglas de uso. Para ello desarrollamos un modelo que, si bien no describe la realidad en su totalidad, resultar de gran utilidad como una aproximacin al estudio de la dinmica de la red. Para el desarrollo del mismo utilizamos herramientas matemticas y de estadstica de procesos estocsticos, tratando de responder interrogantes como el de la existencia de transversalidad en la comunicacin, el de encontrar la mejor forma de segmentar la red para llegar a un pblico objetivo o el del anlisis del fenmeno de mundo pequeo. A continuacin, detallamos la forma en que fue organizado este trabajo y dejamos constancia de que el tema considerado es slo un pequeo ngulo del amplio panorama que el concepto de red social ofrece a la matemtica y en particular a la probabilidad y

estadstica, esperando que resulte de inters y genere nuevas inquietudes para continuar la investigacin en esta lnea. En el primer Captulo, hacemos una descripcin de los orgenes, evolucin y caractersticas de las redes sociales desde una perspectiva general y presentamos algunos conceptos y medidas de representacin para su modelizacin. Concluimos el captulo haciendo hincapi en la gran difusin de las redes sociales virtuales y en particular en el funcionamiento y crecimiento en el largo plazo de Facebook. El segundo Captulo aborda el modelado de Facebook y para ello presentamos previamente herramientas sobre Cadenas de Markov necesarias para el desarrollo del modelo. Introducimos el concepto de Transversalidad Completa en la comunicacin e intentamos dentro de este contexto hallar la distribucin de las funciones aleatorias que intervienen en el modelo. El tercer Captulo propone dos test de hiptesis para probar Transversalidad Completa en la red y Transversalidad Completa entre Segmentos de la red. Presentamos herramientas de la teora de

U -Estadsticos

necesarias para hallar la distribucin asinttica de los

estimadores que utilizamos para realizar los test mencionados. Adems, intentamos estudiar la relacin entre distintos segmentos para luego denir un ndice de performance de utilidad para medir la calidad en la segmentacin. En el cuarto Captulo abordamos el fenmeno de mundo pequeo en Facebook. En primer lugar, intentamos medir el nivel de conectividad proponiendo un estimador de la proporcin de ciclos de cierta longitud en muestras de perles y estudiamos su distribucin asinttica bajo la hiptesis de Transversalidad Completa. Resultados como los obtenidos sobre trazas de potencias de matrices de Wigner sern fundamentales para el desarrollo de esta tarea. Por ltimo, podremos calcular bajo dos contextos comunicacionales extremos, el grado medio de separacin entre dos perles cualesquiera de Facebook y concluir sobre la viabilidad de la Teora de Mundo Pequeo en la red, dejando como inquietud a partir de estos resultados el estudio de este fenmeno en contextos comunicacionales intermedios.

10

Captulo 1 Redes Sociales


Esta tesis aborda problemas que son de inters en el campo de las redes sociales. Por consiguiente, en este Captulo introducimos algunas ideas fundamentales que nos permitirn tener una perspectiva general de sus orgenes, evolucin y caractersticas, profundizando en el caso de la red social Facebook. Adems presentamos algunos conceptos bsicos de gran utilidad para su modelizacin matemtica y probabilstica. Existe una vasta literatura para el tratamiento del tema por lo que slo heremos mencin de los principales textos en que nos basamos para denir y caracterizar tanto al Anlisis de Redes Sociales como a las Redes Sociales. Entre ellos, contamos con las deniciones de Wasserman S. y Faust K. (1994) [45]; White H., Wellman B. y Nazer N. (2004)

[50];

Wetherell C., Plakans A. y Wellman B. (1994)

[24]

y principalmente con el enfoque de Freeman L. (2006)

[49]; [20].

Granovetter M.(1973) Por otro lado, para el

tratamiento de las redes sociales virtuales contamos con informacin obtenida en internet. El Captulo se organiza de la siguiente manera. En la primera Seccin discutimos la denicin y las caractersticas principales del Anlisis de Redes Sociales y en la siguiente, proporcionamos un resumen sobre su origen y evolucin. En la Seccin 3, presentamos algunos conceptos bsicos y medidas de representacin de las redes sociales. La Seccin 4 muestra una sntesis en materia de la investigacin en redes realizada hasta el momento. Finalmente, en la Seccin 5 hacemos hincapi en la utilidad y el crecimiento vertiginoso de las Redes Sociales en Internet para concluir en la Seccin 6 con la descripcin de la historia, funcionamiento y comportamiento a largo plazo de la red social Facebook.

1.1. Denicin y caractersticas


Una Red Social es formalmente denida como un conjunto de actores sociales conectados por uno o ms tipos de relaciones, segn Wasserman S. y Faust K. [45]. De acuerdo con Boorman S.A. y White H.D. [7], y con Zhu J. [53], los miembros de la red social son unidades y las relaciones mediante las que se conectan, siguen patrones que son objeto de

11

estudio de los investigadores sociales. Estas unidades son comunmente individuos, grupos u organizaciones, pero en principio cualquier unidad que tenga conexin con otra puede estudiarse como miembro de una red, tal como pginas web, blogs, e-mails, mensajes de texto, familias, artculos, vecinos o naciones. White H.D. y colaboradores [50], sealan que los investigadores de diversos campos acadmicos han demostrado que las redes sociales funcionan en varios niveles, desde las familias hasta el nivel de las naciones, y juegan un papel fundamental en la determinacin de la forma en que se resuelven problemas, la forma en que funcionan las organizaciones y el grado en que los individuos alcanzan el xito en sus objetivos. La corriente principal de la investigacin social tradicional se centra exclusivamente en el comportamiento de los individuos. Segn Freeman L. [20], este enfoque deja de lado la parte social o la estructura de la conducta humana, es decir, la parte relacionada con la forma en que interactan los individuos y la inuencia que tienen unos sobre otros. Sin embargo, los analistas de redes sociales toman dichas partes como base de construccin fundamental del mundo social, no slo recogen los tipos de datos particulares, tambin comienzan su anlisis desde una perspectiva distinta a la adoptada por los individualistas. El Anlisis de Redes Sociales, (Social Network Analysis,

SN A

de aqu en ms), tam-

bin llamado anlisis estructural, es el estudio de la interaccin entre los actores sociales, Freeman L. [20]. Las relaciones que estudian los analistas de redes sociales son aquellas que vinculan a los seres humanos individuales, pues estos investigadores sostienen que adems de las caractersicas individuales, los vnculos relacionales y la estructura social son necesarios para comprender por completo los fenmenos sociales. Wetherell y colaboradores

[49]

consideran que el

SN A:

-Conceptualiza la estructura social como una red con vnculos que conectan a sus miembros y canalizan recursos. -Se focaliza en las caractersticas de los vnculos en lugar de focalizarse en las caractersticas de los actores individuales. -Considera a las comunidades como comunidades personales, es decir, como redes de relaciones individuales que las personas conservan y utilizan a lo largo de su vida. Como ha sealado Freeman L. [20], el enfoque estructural no se limita al estudio de las relaciones sociales humanas, sino que tambin est presente en casi todos los campos de la ciencia, por ejemplo, los qumicos moleculares examinan cmo interactan los distintos tipos de tomos para formar diferentes tipos de molculas, los ingenieros elctricos estudian cmo las interacciones de ciertos componentes electrnicos tienen inuencia en el ujo de corriente a travs de un circuito, como as tambin los bilogos estudian las formas en que cada especie del ecosistema interacta e incide en los dems. Podemos mencionar distintos tipos de redes. En general, los analistas de redes sociales

12

distinguen las siguientes: - Redes modo-uno versus redes modo-dos: Las primeras involucran relaciones entre un conjunto de actores similares, mientras las segundas se basan en relaciones entre dos conjuntos distintos de actores. Un ejemplo de red modo-dos puede ser el anlisis de una red formada por una organizacin privada y sus vnculos con agencias sin nes de lucro en una comunidad, segn Hawe P. y colaboradores [26]. Adems las redes modo-dos, tambin llamadas redes de aliacin, se usan por ejemplo para investigar relaciones entre un conjunto de actores y una serie de eventos, es decir, aunque las personas no tengan lazos directos entre ellos pueden tener inters en eventos similares o actividades en la comunidad y esto permite la formacin de lazos dbiles, como seala Granovetter M. en [24]. - Redes sociocntricas versus redes egocntricas: Segn Wellman B. y colaboradores [48], las primeras consisten en un mapa de todos los lazos relevantes entre todos los nodos estudiados, por ejemplo, lazos relacionales entre todos los profesores de un colegio secundario. Las redes egocntricas, en cambio, se reeren a los lazos que tiene una persona especca en los distintos contextos en los que interacta. La forma que tiene una red social permite determinar la utilidad para los individuos que la componen. Las redes ms abiertas con lazos dbiles tienen mayor probabilidad de introducir nuevas ideas y oportunidades a sus miembros que las redes cerradas con muchos lazos redundantes. Para el xito individual es mejor estar conectado con varias redes que tener muchas conexiones dentro de una misma red. Adems, los individuos pueden inuir o actuar de intermediarios en sus redes sociales haciendo de puente entre dos redes que no estn directamente vinculadas, esto es, segn Scott J. [43], rellenar agujeros estructurales. Las redes sociales han sido tambin utilizadas para examinar cmo las organizaciones interactan unas con otras, caracterizando las conexiones ms informales que ligan a los ejecutivos entre s y las asociaciones y conexiones entre los empleados de las distintas organizaciones. Juegan un rol clave en la contratacin, en el xito en los negocios y en la performance del trabajo. Les da a las compaas formas de obtener informacin, disuadir a la competencia y reunirse para jar precios o polticas, de acuerdo con Wasserman S. y Faust K. [45]. Por ltimo, haremos mencin de las caractersticas ms importantes en que se basa el

SN A

desde el punto de vista de la investigacin social, segn Freeman L. [20]:

1) El

SN A es el estudio de la estructura, ya que el enfoque de redes sociales se basa en la

nocin intuitiva de que el patrn de los vnculos sociales en los que estn involucrados

13

los actores tiene consecuencias importantes para ellos. Esta es la caracterstica ms importante del

SN A. Freeman L. argumenta que socilogos como Auguste Comte, Ferdinand To nnies, Emile Durkheim, Sir Hebert Spencer, trataron de especicar los

distintos tipos de vnculos sociales que ligaban a los individuos en distintas formas de colectividades sociales y que debido a que estaban interesados en los vnculos sociales, todos compartan una perspectiva estructural. 2) Siendo la intuicin estructural el motor del

SN A,

ste se basa en datos empricos

sistemticos especialmente relacionales o de red. Los datos relacionales se usan para explicar las relaciones entre dos o ms actores sociales, digamos

i y j . Estos dieren

de los datos de atributos que describen las relaciones entre dos o ms atributos de un solo actor social

j. SN A
se basa en la Teora de Grafos. Cuando un grafo

3) La tercer caracterstica del

es utilizado como modelo de una red social, los nodos o vrtices representan a los actores y las relaciones que los conectan son los enlaces o aristas. Existen dos tipos de grafos, dirigidos y no dirigidos. Los dirigidos consisten en un conjunto de vrtices y un conjunto de aristas y en este tipo de grafos la arista e, es un par ordenado siendo

(i, j )

representando la conexin de un vrtice

a un vrtice

j,

el vrtice inicial y

el nal. Si la direccin de una arista no es importante,

o equivalentemente, la existencia de una arista de arista de

implica necesariamente una

a i, decimos que esa red es un grafo no dirigido. El grado de un vrtice es

el nmero de vrtices adyacentes a l. El dimetro de un grafo es la mayor distancia entre dos nodos del mismo. Un camino de un vrtice distintos este

i a uno j es una sucesin de links (i, u1 )(u1 , u2 )...(uk , j ). La longitud de ese camino es el nmero de aristas, en caso k + 1. Un bucle es una arista con extremos idnticos. Dos aristas paralelas

son aristas que tienen los mismos extremos. Un grafo simple es un grafo sin bucles ni aristas paralelas. Un ciclo consiste en un camino cerrado en el que no se repite ningn vrtice a excepcin del primero que aparece dos veces como principio y n del camino. Un grafo conexo, es un grafo tal que para toda particin de su conjunto de vrtices en dos conjuntos no vacos, existe una arista con un extremo en uno de esos conjuntos y el otro extremo en el otro conjunto. Un rbol es un grafo conexo que no contiene ciclos. Aunque los grafos constituyen una manera muy til de representar informacin sobre redes sociales, cuando existen muchos actores y/o muchas clases de relaciones stos pueden hacerse tan visualmente complicados que se hace muy difcil identicar estructuras. En su lugar, tambin es posible representar la informacin sobre redes sociales en forma matricial. La forma ms comn de matriz en el anlisis de redes sociales es una matriz simple

14

compuesta por tantas las y columnas como actores existan en el conjunto de datos y donde los elementos representan los vnculos entre los actores. La ms simple y comn de las matrices es la matriz binaria si existe un vnculo entre los vrtices

A = (aij ),

donde

aij

toma el valor 1

j,

y 0 si no lo hay. Este tipo de matriz

es el punto de partida de casi todos los anlisis de redes y se denomina matriz de adyacencia. Luego, un grafo no dirigido puede representarse por una matriz de adyacencia simtrica

A = (aij ).

La Tabla 1.1 nos muestra una matriz de relaciones

y la Figura 1.1 es el grafo que describe esta matriz de datos.

A B C D E F
Tabla 1.1

A B C D E F
0 1 0 0 0 1 1 0 0 0 1 1 0 0 0 0 1 0 0 1 0 0 0 1 1 0 0 0 1 1 -

Figura 1.1

Por ejemplo, hay una lnea imaginaria que conecta

A (vrtice inicial) con B

(vrtice

nal), y esta lnea muestra una relacin de orden. Estas dos formas equivalentes de representacin nos permiten determinar tanto las caractersticas de la estructura como las propiedades de la posicin de cada actor de la red. 4) Otra caracterstica importante del

SN A

es el uso de modelos matemticos y/o

modelos computacionales. A diferencia de muchos otros enfoques de la investigacin social, el anlisis de redes se ha apoyado sistemticamente en diversas ramas de la matemtica tanto para aclarar sus conceptos como para explicar sus consecuencias en trminos ms precisos.

15

1.2. Historia del


el

SNA

En esta seccin, presentamos un breve resumen de la evolucin de las redes sociales y

SN A

siguiendo el texto de Linton Freeman [20].

A comienzos del siglo XX, Georg Simmel (1858-1918) fue el primer estudioso que pens directamente en trminos de red social. Sus ensayos apuntan a la naturaleza del tamao de la red sobre la interaccin y a la probabilidad de interaccin en redes ramicadas.

En la dcada del 30, Jacob Levy Moreno (1889-1974), psiclogo social, inici el registro sistemtico y el anlisis de la interaccin social en pequeos grupos, en especial en aulas y grupos de trabajo, dando lugar a la llamada Sociometra. En forma paralela en Harvard, W. Lloyd Warner y Elton Mayo exploraron las relaciones interpersonales en el trabajo.

El perodo comprendido entre 1940 y 1960 se suele considerar como una era oscura en el

SN A.

Hubo aportes sustantivos como los de la escuela de Manchester, por

ejemplo los estudios de parentesco de Elizabeth Bott en Inglaterra en los aos 50 y entre 1950 y 1960 los estudios de urbanizacin de Max Gluckman, J. Clyde Mitchell et al. sobre las redes comunitarias en el sur de frica, India y el Reino Unido. En particular en 1954, el antroplogo de Manchester, J.A. Barnes comenz a estudiar sistemticamente el trmino red social para mostrar patrones de lazos, abarcando conceptos ms tradicionales como tribus, clanes, familias, gnero, etnia, clase social, etc.

Entre los aos 1960 y 1970 varios acadmicos trabajaron para incluir bajo la denominacin

SN A una amplia gama de temticas. Entre ellos podemos citar a Harrison

White, Ivan Chase, Bonnie Erickson, Harriet Friedmann, Mark Granovetter, Nancy Howell, Joel Levine, Nicholas Mullins, John Padgett, Michael Schwartz, Barry Wellman, Charles Tilly y Stanley Milgram, quien desarroll la tesis de los Seis Grados de Separacin. A partir de 1970, al menos en los departamentos de ciencias sociales de las grandes universidades el sistemticos.

SN A

era ya un tema instalado y objeto de cursos

En la dcada del 80, un nmero de socilogos comenz a utilizar el

SN A

como

una tcnica analtica para examinar el fenmeno socioeconmico. A mediados de los 80's, Mark Granovetter, propuso el concepto de arraigo orientando al enfoque del

SN A

en la corriente principal del campo de la investigacin social. Argument que

el funcionamiento de la economa est sumergido en la estructura social, pero que sin embargo la estructura social central son las redes sociales de los individuos.

16

Despus de 1990, el

SN A

fue asociado en forma gradual con el capitalismo social,

llamando la atencin de los estudiosos del campo de la sociologa, la poltica, la economa, las ciencias de la comunicacin y otras disciplinas. El libro de Ronald Burt, Structural Holes [11], representa este perodo. Burt argumenta que el capital social no tiene relacin con la longitud de los lazos, pero s con la existencia de agujeros estructurales. Otro de los que estudi el capital social fue Lin Nan

SN A

desde la perspectiva del

[32].

Ms adelante, cuando tratemos la teorizacin del

SN A

en la Seccin 1.4, volveremos sobre estos dos investigadores sociales.

1.3. Conceptos bsicos del SNA


Vimos que una red social se reere a un conjunto de actores sociales, nodos o vrtices que son conectados por uno o ms tipos de relaciones. A travs de la medicin emprica de una red, se encontrarn diversos roles y grupos de actores y podemos preguntarnos: quines son los conectores, lderes, puentes, islotes?, dnde estn los agrupamientos o clusters y quienes estn en ellos?, quin est en el centro de la red y quin en la periferia? Para entender a la red y a sus miembros los investigadores debieron evaluar la ubicacin de los actores de la red. Por ejemplo, para medir la ubicacin de cada vrtice, se puede usar el concepto de Centralizacin y otros conceptos relacionados que veremos a continuacin.

1.3.1. Medidas generales de la estructura de la red

Lazos: Los lazos, enlaces o aristas conectan a dos o ms vrtices dentro de un grafo. Muchos de los comportamientos humanos, tales como intercambio de informacin o prstamo de dinero a alguien, son lazos dirigidos mientras que compaeros de membresas son ejemplos de lazos no dirigidos. Los lazos dirigidos pueden ser en dos direcciones como el caso de dos personas que se visitan o pueden existir en una direccin como cuando slo se da apoyo emocional a alguien, segn Plickert G. y colaboradores [37]. Ambos tipos de lazos, dirigidos y no dirigidos, pueden medirse como lazos binarios que existen o no dentro de cada dada o lazos que pueden ser ms o menos fuertes, transmitir ms o menos recursos, o tener contactos ms o menos frecuentes.

Densidad: Describe el nivel general de vinculacin entre los vrtices o actores de un grafo y es un indicador de la conectividad existente en el mismo. Un grafo completo es aquel en el que los puntos son adyacentes unos con otros, es decir, cada punto est conectado directamente con todos los otros.

17

La densidad es la proporcin de lazos existentes comparados con los posibles y puede denirse intuitivamente como el cociente entre el nmero de relaciones efectivas y el nmero de relaciones posibles.

Clique: Un clique es un subconjunto de actores que estn ms fuertemente conectados mutuamente que lo que lo estn con otros actores que no forman parte del grupo. Es decir, un clique en un grafo es un subgrafo en el cual cualquier vrtice est directamente conectado con cualquier otro del subgrafo. La divisin de actores en cliques o subgrupos puede ser un aspecto muy importante de la estructura social. Pueden ser importantes para comprender el comportamiento de la red en su conjunto. Saber cmo un individuo est inmerso en la estructura de grupos en una red puede ser un aspecto crtico para la comprensin de su conducta. Por ejemplo, algunos pueden actuar como puentes entre grupos (los cosmopolitas, ampliadores de fronteras). Otros pueden tener todas sus relaciones dentro de un nico clique (los locales o internos). Algunos actores pueden ser parte de una lite cerrada y densamente conectada, mientras otros estar completamente aislados de ese grupo. Tales diferencias en las formas que los individuos estn inmersos en la estructura de grupos en una red pueden tener profundas consecuencias en las maneras en que esos actores perciben su funcionamiento.

1.3.2. Medidas de centralidad de los actores de la red

Grado, intermediacin y proximidad de los actores: El grado es el nmero de lazos de un actor en la red, la intermediacin utiliza a un actor para comunicar a otros actores y la proximidad es la distancia entre un actor y el resto de la red. Qu atributo estructural se elige depende de lo que se quiera analizar. Una medida basada en el grado sirve para evaluar la capacidad de comunicacin de que dispone un actor de la red; una medida basada en la intermediacin, para control de la comunicacin y una medida basada en la proximidad, si queremos evaluar la independencia de un actor.

Centralidad: Si nos interesamos por un actor y los efectos de su posicin estructural en la red, es necesario conocer su centralidad. Nos referiremos al actor focal como ego y a los otros como alteregos. Los individuos centrales ocupan una posicin privilegiada en los intercambios, en particular por comparacin con aquellos que son rechazados a la periferia, ellos son los vrtices ms signicativos de la red y es razonable pensar que esto se traduce en trminos de poder.

18

a) Centralidad de grado Esta medida organiza a los actores por el nmero efectivo de sus relaciones directas en el conjunto de la red. Trata de la centralidad local de un actor con respecto a los actores cercanos, pero dice poco sobre la importancia del actor en la red completa, y es muy sensible a variables como el tamao del grafo. El grado de un vrtice es til como ndice de su potencial de comunicacin. b) Centralidad de intermediacin La centralidad vista como intermediacin se dene como el nivel en que otros actores deben pasar a travs de un actor focal para comunicarse con el resto de los actores. Sintetiza el control que cada uno de los actores tiene de los ujos relacionales en el conjunto de la red. Es decir, el individuo ms conectado o centralizado es el ms popular, eciente o poderoso. c) Centralidad de proximidad Una tercera manera de medir la centralidad de un vrtice consiste en medir su grado de proximidad con respecto a todos los dems individuos. Es una medida ms global, utilizando no slo las conexiones de un individuo a su vecindario sino tambin a su proximidad con los miembros de la red. Se basa en la nocin de distancia y mide independencia.

1.3.3. Medidas de cohesin de la red

Unipolaridad La unipolaridad indica el valor del grado del actor ms central en relacin al mximo de centralidad posible que podra tener ese actor. Es decir, si un actor juega un papel decisivo en la conexiones con los otros y lo hace directamente, la unipolaridad aumenta, representando el mayor grado efectivo de entre los de la red.

Integracin del grafo Corresponde a la suma del grado de todos los actores de un grafo. De modo estndar sera la razn entre la suma efectiva de los grados de todos y cada uno de los actores y el valor mximo de la suma de los grados posibles.

Centralizacin Es la aplicacin del concepto de centralidad a toda la red. Una red puede ser centralizada o descentralizada. Al igual que para la centralidad, existen tres medidas de centralizacin y cada una corresponde a una de las propiedades usadas para denir la centralidad de los actores de la red (grado, intermediacin, proximidad). Se considera que una centralizacin de grado fuerte indica comunicacin activa entre

19

todos los miembros de la red, mientras que una fuerte intermediacin o proximidad traduce el hecho de que un nmero pequeo de actores controla esta comunicacin.

1.4. Estado del arte


Antes de llevar a cabo un anlisis de una red social, en especial antes de realizar la recoleccin de datos, el investigador debe decidir qu tipo de redes querr analizar y qu tipo de relaciones est interesado en estudiar. Por ejemplo, deber diferenciar entre las dos dimensiones importantes que hemos visto, a travs de las cuales los datos de la red varan: redes unimodales vs. redes bimodales y redes completas vs. redes egocntricas. Una vez tomada esta decisin debe seleccionar el mtodo de recoleccin de datos que puede ser por observacin, archivos, material histrico, resmenes, entrevistas, experimentos, etc. El objetivo bsico, como en todos los campos de investigacin de las ciencias sociales, es la teorizacin del de investigacin

SN A. Segn Marin A. y Wellman B. [33], como perspectiva o paradigma el SN A toma como punto de partida la premisa de que la vida social se

genera principalmente por las relaciones y los patrones que las componen y proporciona una manera de estudiar un problema pero no predice qu es lo que va a suceder. Sin embargo, en la etapa de diseo de la investigacin los acadmicos deben hacer todo lo posible para llevar a cabo su trabajo con la aplicacin de teoras relacionadas que apuntan a extender y modicar las teoras sociales, siendo varias de las teoras famosas reveladas bajo la perspectiva de las redes sociales. El

SN A se ha utilizado en epidemiologa para ayudar a comprender cmo los patrones

de contacto humano favorecen o impiden la propagacin de enfermedades como el HIV en una poblacin. A veces la evolucin de una red social puede modelarse usando modelos basados en agentes, proporcionando informacin sobre la interaccin de reglas de comunicacin, propagacin de rumores y estructuras sociales. La teora de Difusin de Innovaciones explora las redes sociales y su rol en la inuencia de la difusin de nuevas ideas y prcticas. El cambio en los agentes y en la opinin del lder a menudo tienen un papel importante en el estmulo a la adopcin de innovaciones, aunque tambin intervengan factores inherentes a las innovaciones. Por su parte, Robin Dunbar sugiri que el tamao tpico en una red egocntrica est limitado a unos 150 miembros, debido a los posibles lmites de la capacidad del canal de comunicacin humano. Esta norma surge de los estudios transculturales de la sociologa y especialmente de la antropologa sobre el nmero mximo de individuos de una aldea (en el lenguaje moderno mejor entendido como una ecoaldea). Esto est teorizado en la psicologa evolutiva, que sostiene que este nmero puede ser una suerte de lmite o

20

promedio de la habilidad humana para reconocer miembros y del seguimiento de hechos emocionales sobre todos los miembros de un grupo. Sin embargo, este puede deberse a la intervencin de la economa y la necesidad de seguir a los polizones, lo que hace que sea ms fcil en grandes grupos sacar ventaja de los benecios de vivir en una comunidad sin contribuir a ella. Usando una perspectiva de redes, Granovetter M.

[24]

puso de maniesto la teora

de la fuerza de los lazos dbiles. Encontr que un gran nmero de lazos dbiles puede ser til para la bsqueda de informacin e innovacin. Los cliques tienen una tendencia a tener opiniones ms homogneas, as como a compartir rasgos comunes, por lo que esta tendencia homoflica es la razn por la cual los miembros de los cliques se atraen en principio y adems cada uno conoce en cierto modo lo que conocen los dems. Para encontrar nueva informacin o ideas, las personas con frecuencia miran ms all del clique a otros amigos y conocidos. Sin embargo, el cientco chino Bian Y. [8] revela la teora de los lazos fuertes, encontrando que en China las redes personales se utilizan para inuenciar a las autoridades a asignar trabajo a sus contactos, y esta actividad ilegal es facilitada por los lazos fuertes caracterizados por conanza y obligacin. Otro ejemplo de teorizacin de la investigacin de redes sociales es el fenmeno de mundo pequeo. Este fenmeno ser abordado en mayor profundidad en el Captulo 4 y se reere a la hiptesis sobre que la cadena de conocidos sociales necesaria para conectar a una persona arbitraria con otra persona arbitraria en cualquier parte del mundo, es generalmente corta. El concepto dio lugar a la famosa frase de seis grados de separacin a partir de los resultados del experimento de un mundo pequeo hecho en 1967 por el psiclogo social Stanley Milgram. En el mismo, a una muestra de individuos en Estados Unidos se les pidi que hicieran llegar un mensaje a una persona objetivo en particular, pasndolo a lo largo de una cadena de conocidos. La duracin media de las cadenas exitosas result ser de unos cinco intermediarios, o seis pasos de separacin. Los mtodos, y tambin la tica, del experimento de Milgram fueron cuestionados ms tarde y algunas otras investigaciones para replicar los hallazgos de Milgram habran encontrado que los grados de conexin necesarios podran ser mayores. Investigadores continan explorando este fenmeno dado que la tecnologa de comunicacin basada en Internet ha completado la del telfono y los sistemas postales disponibles en los tiempos de Milgram. Un reciente experimento electrnico del mundo pequeo en la Universidad de Columbia, arroj que cerca de cinco a siete grados de separacin son sucientes para conectar a dos personas cualesquiera a travs de e-mail, segn Watts D. [47]. Luego de 1990 los investigadores extienden la teorizacin del

SN A

de manera impor-

tante. Entre los ms destacados se encuentran Burt R. [11] con su teora de los agujeros estructurales y Lin N. [32] con la teora del capital social. Burt argumenta que las cone-

21

xiones dbiles entre grupos son agujeros en la estructura social de mercado. Estos agujeros en la estructura social crean una ventaja competitiva para individuos cuyas relaciones se extienden a los agujeros. Adems los agujeros estructurales son una oportunidad para negociar el ujo de informacin entre las personas y controlar proyectos que renen a personas de ambos lados del agujero. Por otro lado Lin N. supone que la estructura social a nivel macro es un tipo de estructura jerrquica determinada por la asignacin de recursos como riqueza, poder o status social. Explica la importancia del uso de conexiones sociales y relaciones sociales para alcanzar sus objetivos. El capital social as como los recursos accesibles a travs de tales conexiones y relaciones son fundamentales para alcanzar metas individuales, para grupos sociales y comunidades. Los grafos de colaboracin pueden ser utilizados para ilustrar buenas y malas relaciones entre los seres humanos. Un enlace positivo entre dos vrtices denota una relacin positiva (amistad, alianza, citas) y un enlace negativo una relacin negativa (odio, ira). Estos grafos de redes sociales signados pueden ser utilizados para predecir la evolucin futura del grafo. En ellos, existe el concepto de ciclos equilibrados y desequilibrados. Los primeros son aquellos en que el producto de todos los signos es positivo. Los grafos equilibrados o balanceados representan un grupo de personas con muy poca probabilidad de cambio en sus opiniones sobre las otras personas en el grupo, mientras que los desequilibrados representan un grupo de individuos que es muy probable que cambie sus opiniones sobre los otros en su grupo. Por ejemplo, en un grupo de tres personas, A, B y C, donde A y B tienen una relacin positiva, B y C tienen una relacin positiva, pero C y A tienen una relacin negativa, es un ciclo de desequilibrio. Este grupo es muy probable que se transforme en un ciclo equilibrado, tal que B slo tenga una buena relacin con A, y tanto A como B tengan una relacin negativa con C. Al utilizar el concepto de ciclos equilibrados y desequilibrados, puede predecirse la evolucin de un grafo de red social.

1.5. Redes sociales en Internet


Las redes sociales en internet han ganado su lugar de una manera vertiginosa convirtindose en negocios promisorios para empresas, artistas, marcas, freelance y sobre todo en lugares para encuentros personales. En las redes sociales tenemos la posibilidad de interactuar con otros aunque no los conozcamos, el sistema es abierto y se va construyendo con lo que cada suscripto aporta a la red, cada nuevo miembro que ingresa transforma al grupo en otro nuevo. La red no es la misma si uno de sus miembros deja de formar parte. Intervenir en una red social nos permite relacionarnos con personas con las cuales compartir nuestros intereses, preocupaciones o necesidades. Muchas veces suelen dar al annimo popularidad, al discriminado integracin, etc. Adems, la fuerza del grupo per-

22

mite cambios sobre el individuo que de otro modo tal vez resulten difciles y genera nuevos vnculos afectivos y tambin de negocios. La causa del xito y la popularidad que han adquirido tan velozmente las redes sociales en internet se debe en su mayor medida a los benecios psicosociales que acabamos de mencionar. El origen de las redes sociales virtuales se remonta al menos, a 1995, cuando Randy Conrads crea el sitio web classmates.com. Con esta red social se pretenda que la gente pudiera recuperar o mantener el contacto con antiguos compaeros del colegio, instituto, universidad, etc. En el ao 2002 comienzan a aparecer sitios web promocionando las redes de crculos de amigos en lnea, y este concepto se hizo popular en el 2003 con la llegada de sitios tales como MySpace o Xing. Hay ms de 200 sitios de estas redes sociales, aunque Friendster ha sido uno de los que mejor ha sabido emplear la tcnica del crculo de amigos. La popularidad de estos sitios creci rpidamente y grandes compaas ingresaron en el espacio de las redes sociales en internet. Por ejemplo, Google lanz Orkut el 22 de enero de 2004. Otros buscadores como KaZaZZ! y Yahoo crearon redes sociales en el 2005. Las redes sociales continan avanzando en internet a pasos agigantados, especialmente dentro de lo que se ha denominado Web 2.0 y Web 3.0, y dentro de ellas cabe destacar un nuevo fenmeno que pretende ayudar al usuario en sus compras por internet: las redes sociales de compras que son utilizadas por marcas y empresas para darse a conocer y hacer publicidad para grupos sociales con perles determinados. De esta forma aumenta la efectividad del boca a boca y las ventas, mejoran las relaciones con los clientes, es mucho ms sencillo medir los resultados y segmentar al pblico. Adems, brindan un espacio en el que los usuarios pueden consultar dudas sobre los productos en los que estn interesados, leer opiniones y escribirlas, votar a sus productos favoritos, conocer gente con sus mismas aciones y, por supuesto, comprar ese producto en las tiendas ms importantes con un solo click. Esta tendencia se denomina Shopping 2.0. El nmero de redes que existen en la actualidad en internet es muy elevado, pero lo realmente interesante es que, debido a la ecacia de estas pginas, han aparecido muchas otras especializadas en diferentes mbitos. Las redes sociales en internet pueden denirse bsicamente como horizontales o verticales. Llamamos redes sociales horizontales a aquellas cuyos usuarios tienen intereses anes. Por ejemplo, redes sociales de msica, de ftbol o de libros. Conocemos como redes sociales verticales, a aquellas en las que los usuarios tienen intereses y motivaciones heterogneas. Aqu entran Twitter y Facebook, donde hay usuarios de todos los tipos y se habla de todo. Por otro lado, encontramos que los tipos de redes sociales que existen en internet se pueden clasicar del siguiente modo: -Las redes sociales globales, es decir, aqullas que unen a grupos heterogneos de personas con la intencin principalmente de socializacin. Entre ellas podemos destacar a Facebook, Twitter, MySpace y Google+.

23

-Las redes profesionales, que sirven para relacionar a profesionales de diferentes mbitos en la bsqueda de objetivos laborales. La red profesional ms grande del mundo es Linkedin que relaciona a ms de 42 millones de usuarios de ms de 200 pases del mundo y de los que aproximadamente la mitad son de afuera de Estados Unidos. Xing, es otra de las redes que ha absorbido las plataformas profesionales ms importantes, tiene una fuerte presencia en Alemania (su pas de origen), Espaa y China, con ms de siete millones de usuarios en total. -Las redes personales, que se caracterizan por ser la perfecta expresin de cada usuario, es decir, el usuario dene personalmente lo que desea indicar en esa red. Incluyen un conjunto de ideas innovadoras como que la tecnologa se aplica a la resolucin de necesidades personales, lo cual permite mejorar la forma en que el usuario realiza sus actividades particulares de trabajo, estudio, ocio o por ejemplo las relaciones con la administracin. - Las redes privadas, que corresponden a las redes horizontales cerradas, a las que slo se accede siendo miembro de un grupo u organizacin. Son espacios donde las personas pueden interactuar en lnea, compartir contenidos y realizar otras actividades colectivamente. Sin embargo, por ser privadas, pueden ser adaptadas y dirigidas a cumplir con los objetivos que denan las organizaciones. En la siguiente Seccin profundizamos sobre la descripcin y caractersticas de la red social Facebook, objeto de estudio en esta tesis.

1.6. La red social Facebook


1.6.1. Orgenes y expansin
Facebook es un sitio web gratuito de redes sociales. Se cre como una versin en lnea de los facebooks de las universidades americanas. Los facebooks son publicaciones que hacen las universidades al comienzo del ao acadmico, que contienen las fotografas y nombres de todos los estudiantes y que tienen como objetivo ayudar a los mismos a conocerse. Facebook llev esta idea a internet, primero para los estudiantes americanos y abri sus puertas a cualquier persona que contara con una cuenta de correo electrnico. Facebook naci en 2004 como un hobby de Mark Zuckerberg, en aqul momento estudiante de Harvard, y como un servicio para los estudiantes de su universidad. En su primer mes de funcionamiento, contaba con la suscripcin de ms de la mitad de los estudiantes de Harvard, y se expandi luego a otras universidades tales como MIT, Boston University y Boston College y las ms prestigiosas instituciones de Estados Unidos. Un ao despus, Facebook tena ms de un milln de usuarios, una ocina en Palo Alto, California y haba recibido apoyo nanciero de 500 mil dlares por parte de Peter Thiel, co-fundador de Pay-Pal. Ese mismo ao incorpor a los alumnos de ms de 25 mil

24

escuelas secundarias y dos mil universidades de Estados Unidos y el extranjero, logrando un total de 11 millones de usuarios. En 2006, Facebook introdujo ms universidades extranjeras y desarroll nuevos servicios en su plataforma, tales como Facebook Notes (una herramienta de blogging con tagging, imgenes y otras utilidades) o la importacin de blogs de servicios como Xanga, LiveJournal o Blogger, y ya en 2007 Facebook Marketplace, que compite con Craigslist. Tambin implement acuerdos comerciales con iTunes y recibi una inversin de capital adicional de 25 millones de dlares por parte de Peter Thiel, Greylock Partners y Meritech Capital Partners. Facebook se hace pblico en 2006 permitiendo que, no slo los estudiantes de determinadas universidades o escuelas americanas participaran, sino que todas las personas que tuvieran correo electrnico pudieran formar parte de su comunidad. Se convirti entonces en una comunidad de comunidades, en la que se conectaban estudiantes, empresas y gente que poda elegir participar en una o ms redes. Es una comunidad creada por y en funcin de sus miembros. En febrero de 2007 lleg a tener la mayor cantidad de usuarios registrados en comparacin con otros sitios web orientados a estudiantes de nivel superior, teniendo ms de 19 millones de miembros en todo el mundo. En julio de ese ao, Facebook anunci su primera adquisicin, Parakey, Inc. de Blake Ross y Joe Hewitt y en agosto se le dedic la portada de la prestigiosa revista Newsweek, adems de una integracin con YouTube. A nes de octubre de 2007 la red de redes vendi una parte, el 1,6 por ciento, a Microsoft a cambio de 240 millones de dlares, con la condicin de que Facebook se convirtiera en un modelo de negocio para marcas de fbrica en donde se ofrecieran sus productos y servicios. Una fuerte inyeccin de capital a Facebook (27,5 millones de dlares) fue liderada por Greylock Venture Capital. Uno de los socios de Greylock es Howard Cox que, segn el diario The Guardian, pertenece al fondo de inversin en capital de riesgo de la CIA. En 2008 lanz su versin en francs, alemn y espaol para impulsar su expansin fuera de Estados Unidos, ya que sus usuarios se concentraban en Estados Unidos, Canad y Gran Bretaa. La mayor cantidad de usuarios de Iberoamrica, proviene de Colombia, superando a pases con mayor poblacin como Mxico, Brasil y Argentina. Facebook compite por abrirse espacio entre empresas de xito como Google y MySpace, por lo que se enfrenta a grandes desafos para lograr crecer y desarrollarse. Una de las estrategias de Zuckerberg ha sido abrir la plataforma Facebook a otros desarrolladores. La propuesta econmica es que quienes construyan algo sobre Facebook se quedarn con el dinero generado por la publicidad o por las transacciones. Lo ms importante es la dimensin viral del sistema: cuando un amigo agrega una aplicacin aparece en su pgina y en su perl. Cliquear lleva a la aplicacin y permite interactuar directamente con ella. Todos los amigos ven la eleccin y la consideran como

25

un voto a favor, lo cual los alienta a probarla ellos tambin. As lo demuestran, adems, los hechos. A los 10 das de lanzamiento, el nmero de aplicaciones disponibles haban pasado de 85 a ms de 300. iLike, la ms popular, comenz con mil abonados a la maana siguiente del lanzamiento y a los dos das ya eran 300.000. En Facebook la informacin es ltrada por los amigos y las redes. El modelo no descansa sobre un motor de bsqueda, sino sobre las redes sociales. Casi cualquier persona con conocimientos informticos bsicos puede tener acceso a todo este mundo de comunidades virtuales. Facebook est prohibido en Irn, Birmania y Butn. En julio de 2009 Mark Zuckerberg, hizo pblico que Facebook haba alcanzado los 250 millones de usuarios. En julio de 2010, Facebook declara 500 millones de usuarios, y traducciones a 70 idiomas y en mayo de 2011, 600 millones. Su infraestructura principal est formada por una red de ms de 50.000 servidores sobre GNU/Linux . Los nmeros para el segundo cuatrimestre de 2012 indicaban que 955 millones de usuarios entraban al menos una vez al mes en la plataforma, lo que mostr un crecimiento del 29 por ciento respecto al ao anterior y a nes de 2012 este nmero haba alcanzado los 1.060 millones de usuarios. En la actualidad, a pesar de las especulaciones sobre una supuesta baja de actividad en Facebook, la red social hizo pblicos sus resultados del primer trimestre de 2013 y las cifras son bastante positivas. No slo no han perdido usuarios sino que han conseguido an ms, llevando el total a 1.110 millones de usuarios activos cada mes. Con respecto a la cantidad total de usuarios en Argentina, sta asciende a 20.501.120 y, de acuerdo a las estimaciones de Socialbakers, se encuentra entre los 12 pases con mayor cantidad de usuarios. En cuanto a usuarios que acceden a la red social desde dispositivos mviles, la cifra ascendera a 751 millones, lo que sigue conrmando la tendencia de que el futuro de Facebook est en el mvil.

1.6.2. Funcionamiento y caractersticas


El funcionamiento de Facebook es similar al de cualquier otra red social. Los usuarios se registran y publican informacin en su perl (una pgina web personal dentro de Facebook). All pueden subir textos, videos, fotografas y cualquier otro tipo de archivo digital. El usuario tiene la posibilidad de compartir dichos contenidos con cualquier otro usuario o slo con aquellos que forman parte de su red de contactos o amigos.

Principales servicios:

Lista de amigos: En ella el usuario puede agregar a cualquier persona que conozca y est registrada,

26

siempre que acepte su invitacin, hasta un lmite de cinco mil amigos. En Facebook se pueden localizar personas con quienes se perdi el contacto o agregar otros nuevos con quienes intercambiar fotos o mensajes. Para ello, el servidor de la red posee herramientas de bsqueda y de sugerencia de amigos.

Grupos y pginas: Es una de las utilidades de mayor desarrollo. Se trata de reunir personas con intereses comunes. En los grupos se pueden aadir fotos, videos, mensajes, etc. Las pginas se crean con nes especcos y, a diferencia de los grupos, no contienen foros de discusin ya que estn encaminadas hacia marcas o personajes especcos y no hacia algn tipo de convocatoria. Adems, los grupos tambin tienen su normativa, entre la cual se incluye la prohibicin de grupos con temticas discriminatorias o que inciten al odio y falten al respeto y la honra de las personas. Si bien esto no se cumple en muchas ocasiones, existe la opcin de denunciar y reportar los grupos que vayan contra esta regla y, para tal n, Facebook incluye un enlace en cada grupo que se dirige hacia un cuadro de reclamos y quejas.

Muro: Es un espacio en cada perl de usuario que permite que los amigos escriban mensajes para que el usuario los vea. Solamente es visible para usuarios registrados. Se puede reproducir en el muro propio contenidos del muro de un amigo: compartir, o hacer aparecer en el muro de un amigo algo que se difunde en el propio: etiquetar.

Fotos y videos: Cada usuario puede agregar a su cuenta lbumes fotogrcos, digitales y videos.

Regalos: Son pequeos conos con un mensaje. Los regalos dados a un usuario aparecen en el muro con el mensaje del donante, a menos que el donante decida dar el regalo en privado, en cuyo caso el nombre y el mensaje del donante no se exhibe a otros usuarios.

Aplicaciones: Son pequeas aplicaciones o cuestionarios utilizados nicamente con el n de entretener. Por ejemplo, descubrir cosas de la personalidad, averiguar quin es el mejor amigo, etc.

Juegos: La mayora de las aplicaciones encontradas en Facebook se relacionan con juegos de rol, juegos de trivias o juegos de habilidades.

27

Chat: Facebook tiene una plataforma de chat que, si bien no es competitiva frente a otras, brinda un servicio bastante completo.

Polmicas sobre Facebook:


1) Una fuertsima inyeccin de capital a Facebook de 27,5 millones de dlares, pudo vericarse que fue realizada por Greylock Venture Capital (fondo de inversin con fuerte vnculo con la CIA). Dichos fondos de inversin estn desde el principio vinculados a Facebook. 2) No hay ninguna seguridad de privacidad. Hay compaas de marketing global que han accedido a contenidos an de chat, comprando el acceso a Facebook. 3) En el momento de aceptar el contrato de trminos de uso de la comunidad, el usuario cede la propiedad exclusiva y perpetua de toda la informacin e imgenes que agregue a la red social. 4) Nadie sabe realmente cuantas personas lo usan, lo que motiv a desarrollar el modelo que presentaremos en el siguiente Captulo de la tesis. Se producen las siguientes situaciones: a) Una misma persona puede tener varios perles de Facebook, los cuales no son distinguibles ya que lo que identica a un perl es una direccin de e-mail que puede utilizarse una sola vez. Es decir, muchos perles pueden corresponder a una misma persona. b) Ncleos sociales pequeos (por ejemplo, la juventud de determinado grupo poltico, social o deportivo de determinada ciudad) suelen compartir el uso de un mismo perl compartiendo la contrasea. Por lo tanto, un perl puede corresponder a muchas personas. En cualquier contexto comunicacional, lo que cuentan son las personas, no sus perles. En la actualidad, el gran desafo consiste en reconocer a los usuarios ms inuyentes por sectores y mercados y comprender la dinmica de circulacin de informacin entre los mismos. Se pretende llegar, y con eco favorable, a las personas o pblico objetivo. Podemos observar que los fenmenos a. y b., claramente contrapuestos, y cuyo balance es completamente desconocido, generan un modelo de red en dos pisos, que es fuertemente no-identicable donde lo que realmente interesa es lo que llamamos el nivel inferior, nivel en el que se encuentran las personas, a partir de lo que es observable, o sea los perles, que se encuentran en lo que llamamos el nivel superior.

28

5) Las teoras sociolgicas sobre las Redes Sociales como las que plantea De Ugarte D. en [16] ven en Facebook una revolucin cultural, social y comunicacional, sugiriendo la transversalizacin de la intercomunicacin, punto muy polmico y que fue otra motivacin de estudio en esta tesis.

1.6.3. Facebook a largo plazo


Cmo crece una red social?
Aunque hasta el momento no hemos observado ciclos de vida completos de una red social de xito, los datos que hasta ahora tenemos nos permiten establecer un crecimiento en forma de curva logstica (o en forma de S) en tres etapas: inicio, explosin y cima (an por llegar para la mayora). En la Figura 1.2 vemos un posible ejemplo de aplicacin al crecimiento de una red social.

Figura 1.2 En la etapa de inicio, perodos 1-5 en la Figura 1.2, los usuarios comienzan a invitar a potenciales usuarios, con una tasa de xito importante que conlleva un crecimiento exponencial. Aunque es importante contar con una buena fuente de usuarios, no es algo denitivo. Por ejemplo, mientras Facebook surgi prcticamente de la nada, MySpace cont con una fuente tan importante como eUniverse, que en aquel momento dispona de unos 20 millones de usuarios y suscriptores por e-mail. En este punto, la tasa de abandono de los usuarios suele ser baja. La etapa de explosin, perodos 6-10 en la Figura 1.2, viene marcada por una bajada de la tasa de xito, escondida por el gran nmero de usuarios ya disponibles. El crecimiento en este perodo deja de ser exponencial para convertirse en lineal. Su duracin depende del nivel de saturacin de la red y de la tasa de abandono de los usuarios. En los casos de Facebook y MySpace, el comienzo de la saturacin se vio disipado por una gran expansin a nivel internacional. No sabemos an si se ha llegado a la cima en cuanto al nmero de

29

usuarios registrados, pero puede ser que s estemos asistiendo a esta fase en lo que a nmero de usuarios activos (usuarios que acceden al menos una vez al mes) se reere.

Se puede prever el radio de crecimiento?


Segn publica Carrero F. [13], cuando se lanza una red social se realizan estimaciones sobre su crecimiento, ms concretamente, sobre cuntos usuarios se espera tener en las diferentes fases. Se pueden construir modelos para justicar de alguna manera el rpido crecimiento que se ha observado de determinados momentos, con el objeto de prevenir situaciones de riesgo. Sin embargo, al comienzo de la vida de la red es muy difcil determinar cul ser la tasa de crecimiento en las primeras fases y cul ser el valor que determinar su saturacin, y no ser hasta entrar en la fase de la explosin cuando se pueda prever con mayor precisin dnde est el techo. Existen mltiples razones para querer predecir el crecimiento de una red social. Una de ellas es determinar si se est en el camino de alcanzar las expectativas iniciales y, si no es as, buscar un remedio para potenciar el crecimiento; ver si se podrn sobrepasar esas expectativas; anticipar el momento en que podemos empezar a llegar a la saturacin de la red y buscar alternativas para no abandonar la fase de explosin. Y an si se llega a entrar en fase de cima, esto no debe tomarse como un lmite mximo, ya que podran darse situaciones en las que la red se estabiliza un tiempo en la cima y posteriormente vuelve a crecer (por ejemplo, por una mejora del producto, una expansin de mercado, una fusin o adquisicin de otra empresa, etc.).

Ciclo de vida de Facebook


Facebook sigue creciendo, aunque a un ritmo ms lento de lo que lo haca al principio. Si bien hemos visto que al momento la cantidad de usuarios fue registrada en 1.110 millones de usuarios activos, la curva de crecimiento ha tendido a suavizarse en estos ltimos aos y la red social parece respetar un crecimiento en forma de curva logstica a lo largo del tiempo como el que hemos expuesto. De acuerdo con lo publicado en el 2011 por Closa G. [14], en marketing y economa, el ciclo vital de un producto tiene cuatro fases:

introduccin/lanzamiento crecimiento madurez declive

Sin embargo, Facebook no funciona as, parece tener su propio ciclo de vida. Mientras el resto de los productos gozan de cuatro fases, en esta red social parece que la fase

30

de introduccin/lanzamiento reaparece cuando la fase de la madurez alcanza un estado avanzado. Esto es posible manteniendo a los usuarios en vilo con pequeos cambios en su interfaz en perodos de tiempo estudiados. Cualquier actualizacin de diseo o nueva caracterstica de la red es vlida para hacer de ello un relanzamiento del producto. En el mundo 2.0 se sabe que en un perodo de tiempo aparecer un producto que mejorar al que estaba anteriormente. En Facebook, en cambio, parece lgico que con tanta actualizacin, aunque el crecimiento no sea exponencial, se tardar ms en llegar a la fase de declive. Por su parte, los representantes de Facebook justican la falta de crecimiento en los mercados ms importantes con el argumento de que en Estados Unidos y el Reino Unido todos aquellos que deseaban abrir una cuenta en Facebook ya lo han hecho. Los usuarios estadounidenses no slo tienen actualmente menos tendencia a revisar sus perles, sino que tambin pasan menos tiempo en la pgina, ya que preeren las nuevas aplicaciones para telfonos inteligentes. Sin embargo, los ltimos datos indican que Facebook ha obtenido un benecio neto de 219 millones de dlares en los tres primeros meses de 2013, lo que supone un aumento del 6,8 por ciento respecto al mismo perodo del ao anterior, segn ha anunciado la propia empresa. El benecio total de Facebook ha alcanzado los 1.458 millones de dlares, una subida interanual de un 37,8 por ciento, de los cuales un 49 por ciento se originaron en Estados Unidos y Canad, y otro 29 por ciento en Europa. Tratando de hacer frente a la nueva competencia, Mark Zuckerberg se ha centrado en los smartphones. A principios de abril de 2013 Facebook present la nueva interfaz, Facebook Home, para el sistema operativo Android. Facebook Home permite a sus usuarios intercambiar mensajes en la pantalla del telfono, incluso cuando la aplicacin no est activada. Esta novedad ha contribuido a que 751 millones de usuarios hayan entrado al servicio a travs de su smartphone, un 54 por ciento ms que hace un ao. As mismo, la popular aplicacin fotogrca Instagram, adquirida por Facebook por 1.000 millones de dlares en 2012, alcanz la cifra de 100 millones de usuarios activos. Con el n de sacar ms rendimiento de la red social, la compaa de Zuckerberg estren tres nuevos servicios destinados a departamentos comerciales de empresas para facilitar que las marcas encuentren su pblico objetivo dentro de la plataforma. En conclusin, si bien Facebook hace unos aos que no tiene el crecimento vertiginoso que supo tener en su fase de expansin, con las actualizaciones mencionadas parece estar lejos de la fase de declive.

1.7. Conclusiones

El

SN A

es el estudio de la estructura social. Los analistas de redes sociales estn

interesados en cmo los individuos estn sumergidos dentro de una estructura y

31

cmo la estructura emerge de las relaciones micro entre partes individuales.

La gran ventaja del

SN A es que considera cmo la estructura de red comunicacional

de un grupo inuye en el conocimiento y comportamiento individual.

Como una aproximacin a la investigacin social, el

SN A

muestra caractersticas

tales como: intuicin estructural, datos relacionales sistemticos, imgenes grcas y modelos matemticos o computacionales.

En ms de 70 aos de historia los analistas de redes sociales revelaron un gran nmero de maneras precisas y formales de denir trminos tales como relacin, densidad, centralidad, clique, entre otros, que pueden aplicarse sin ambigedad a los datos en poblaciones de individuos.

Reconociendo que estamos todos conectados como una red que no podemos ver, segn Mickenberg R. y Dugan J.

[36],

el

SN A

se hace ms y ms popular entre

investigadores de varios campos como sociologa, matemtica, ciencias de la computacin, economa, ciencias de la comunicacin y psicologa alrededor del mundo.

En ciencias sociales, la teorizacin del

SN A

ha mejorado en las dos dcadas re-

cientes, a pesar de haber sido criticada antes de los 80's. Sin embargo, las nuevas tecnologas (internet, telefona mvil, transmisin digital, etc.) han hecho la recoleccin de datos sociales ms fcil a mayor escala y a costos ms bajos que los mtodos convencionales, mejorando as problemas relacionados con el anlisis e interpretacin de los datos.

Las tcnicas existentes parecen ser inadecuadas para manejar los nuevos tipos de datos de redes sociales que son continuos, dinmicos y multinivel. Gracias a la situacin actual, el desarrollo y bsqueda de nuevas tcnicas, las herramientas que resuelven estos problemas deben estar en las agendas de investigacin de los cientcos sociales.

Las redes sociales en internet han ganado velozmente un lugar, conjugando pluralidad y comunidad. Las herramientas informticas para potenciar la ecacia de las redes sociales online (software social), operan en tres mbitos: la comunicacin, la comunidad y la cooperacin. Las redes sociales continan avanzado en internet, por ejemplo convirtindose en un sitio de consulta y compra, dando lugar a la tendencia Shopping 2.0.

Desde sus comienzos la red social Facebook ha crecido de manera vertiginosa hasta convertirse en una de las redes sociales ms importantes con 1.110 millones de usuarios activos hasta el momento. En la actualidad, si bien sigue creciendo, lo hace

32

a un ritmo ms lento de lo que lo haca al principio. Este comportamiento a lo largo del tiempo, permite representar a su evolucin en forma de curva logstica. Sin embargo, cabe destacar que debido a las constantes actualizaciones y mejoras parece estar lejos de la etapa de declive. Por otra parte, las polmicas que ha generado en cuanto a la falta de privacidad, la transversalidad de la comunicacin o la incertidumbre sobre cuntas personas son las que realmente estn detrs de cada perl, resultaron la principal motivacin para su anlisis y modelado en esta tesis.

33

Captulo 2 Modelo: Dinmica de Facebook a Largo Plazo


En este Captulo presentamos un modelo probabilstico para estudiar la dinmica a largo plazo de Facebook. Proporcionamos previamente algunos conceptos sobre Cadenas de Markov, que sern de utilidad para el desarrollo del mismo. Nuestro inters se centrar en estudiar el comportamiento comunicacional de los usuarios de la red social que estarn representados por los perles e identicados por una direccin de e-mail. Incorporamos adems, el concepto de Transversalidad Completa y su aplicacin en el modelo.

2.1. Modelos Markovianos


Las cadenas de Markov y los procesos de Markov son un tipo especial de procesos estocsticos que poseen la siguiente propiedad:

Propiedad de Markov:

Conocido el estado del proceso en un momento dado, su

comportamiento futuro no depende del pasado. Dicho de otro modo, dado el presente, el futuro es independiente del pasado.

Denicin 2.1
tocstico

Una cadena de Markov a tiempo discreto (CM T D ) es un proceso esque toma valores en un espacio discreto

{Xt : t = 0, 1, 2, . . . }

S,

llamado espacio

de estados, y que satisface la propiedad de Markov, esto es, para cualquier y para cualquier conjunto de estados

t = 0, 1, 2, . . .

{x1 , . . . , xt } S ,

se cumple:

P (Xt+1 = xt+1 |Xt = xt , . . . , X0 = x0 ) = P (Xt+1 = xt+1 |Xt = xt ).


Cuando el espacio de estados que la cadena es nita.

de una cadena de Markov es un conjunto nito se dice

34

Probabilidades de Transicin: La probabilidad P (Xt+s = j |Xs = i), denotada por


Pij (s, t+s), representa la probabilidad de pasar del estado i a tiempo s al estado j a tiempo t + s. Estas probabilidades se conocen como las probabilidades de transicin en t pasos. Cuando P (Xt+s = j |Xs = i) = P (Xt = j |X0 = i) decimos que la CM T D es homognea en el tiempo y expresamos a estas probabilidades como Pij (t). La probabilidad P (Xt+1 = j |Xt = i), denotada por Pij (t, t + 1) representa la probabilidad de transicin del estado i a tiempo t, al estado j a tiempo t +1. Estas probabilidades se conocen como las probabilidades de transicin en un paso y, si la CM T D es homognea en el tiempo, las denotamos por Pij .
De aqu en ms, los resultados que presentaremos supondrn que las homogneas el tiempo. Comenzando en el estado de que

CM T D

son

la

CM T D
j S

ir a algn estado

(incluyendo la posibilidad

j = i), por lo que se deduce que Pij

Pij = 1, con 0 Pij 1. Las probabilidades de

transicin en un paso es decir, una matriz

P tal que la suma de los elementos de cada la es uno:


P00 P01 P = (Pij ) = P10 P11 .
. . . . . .

se resumen usualmente en una matriz de transicin estocstica,

Grcamente, una

CM T D

con espacio de estados nito se representa mediante un

diagrama de transicin de estados, es decir, un grafo nito dirigido donde el estado


la cadena es representado por un vrtice y la transicin en un paso del estado

de

al estado

j,

por una arista marcada por la probabilidad de transicin

Pij .

Ejemplo 2.2

Sea

{ Xt }

una

CM T D

con dos estados 0 y 1, con matriz de probabilidades

de transicin en un paso dada por:

P=

0.7 0.2

0.3 0.8

(2.1)

el correspondiente diagrama de transicin de estados es:

Partiendo del estado 0, se realiza una transicin desde el mismo al estado 1 con probabilidad 0.3, y con probabilidad 0.7 la cadena permanece en 0 en el siguiente paso. Del mismo
35

modo, se produce una transicin del estado 1 al 0 con probabilidad 0.2, y con probabilidad 0.8 la cadena permanece en el estado 1 en el siguiente paso.

Ecuacin de Chapman-Kolmogorov: La transicin del proceso del estado i a tiempo

al estado

a tiempo

t + s,

puede descomponerse en subtransiciones del estado digamos

a tiempo

tiempo

s a un estado intermedio, t + s, donde s < r < t + s.

h,

a tiempo

y de all al estado

Esta condicin viene dada por la denominada

Ecuacin de Chapman-Kolmogorov:

Pij (s, t + s) =
hS
con

Pih (s, r) Phj (r, t + s),

0 s < r < t + s. Para CM T D homogneas

en el tiempo las Ecuaciones de Chapman-Kolmogorov se

simplican de la siguiente manera:

Pij (t) =
hS
con

Pih (r) Phj (t r), r < t,

(2.2)

0 < r < t. Debido a que particular r = 1 obtenemos

la ecuacin (2.2) se verica para todo

tomando en

Pij (t) =
hS
Adems, siendo

Pih Phj (t 1).

P(t)

la matriz de probabilidades de transicin en t pasos, la ecuacin

(2.2) puede ser reescrita en forma matricial para el caso particular en que (t) (t1) = y, aplicando este procedimiento en forma recursiva, resulta

PP

r = 1 como P(t) = Pt .

Distribucin de Probabilidad de una


i (t) = P (Xt = i)
babilidad en de que la

CMTD :

Es de inters calcular la fun-

cin de masa de probabilidad de la variable aleatoria

Xt ,

es decir, las probabilidades

CM T D

se encuentre en el estado

Dada la matriz de probabilidades de transicin en

pasos

i,

en el instante t. t , la distribucin de pro-

pasos:

(t) = (0 (t), 1 (t), . . . ),


puede obtenerse de la siguiente manera:

(t) = (t 1) P = (0) Pt ,
donde

t = 0, 1, 2, . . . ,

(2.3)

(0) = (0 (0), 1 (0), . . . )

es la distribucin de probabilidad inicial.

De esta forma se obtiene una sucesin

(0), (1), (2), . . .

de distribuciones de probabi-

lidad en donde cada una de ellas, excepto la primera, se obtiene de la anterior multiplicada

36

a derecha por la matriz de probabilidades de transicin en un paso. Es natural preguntarse si tal sucesin converge a una distribucin lmite. Ms adelante estudiaremos este problema y enunciaremos las condiciones bajo las cuales existe un nico lmite para la misma.

Clasicacin de las
cacin de sus estados.

CMTD :

Las

CM T D

se categorizan de acuerdo a la clasi-

Denicin 2.3

Un estado

se dice accesible desde otro estado

i,

con

i, j S ,

si es

posible pasar del estado decimos que los estados desde

i i

al y

en una cantidad nita de pasos de acuerdo a la matriz

de probabilidades de transicin dada. Es decir, para algn

estn comunicados si

es

t N, Pij (t) > 0. accesible desde i e i es

Adems, accesible

j.

La comunicacin es una clase de equivalencia y en consecuencia induce una particin del espacio de estados, es decir, dos estados pertenecen a la misma clase de equivalencia si y slo si tales estados estn comunicados.

Denicin 2.4 Denicin 2.5

Una

CM T D

se dice irreducible si todos los estados se comunican entre

s, esto es, si existe slo una clase de comunicacin. El estado

mismo ningn otro estado


Observemos que una ser irreducible.

i S se dice absorbente si y slo si una vez que se accede al de la CM T D puede ser alcanzado desde l, es decir, si Pii = 1.
que contiene al menos un estado absorbente no puede

CM T D

Denicin 2.6
estado fuera de y

Una coleccin de estados no vaca

de una

es accesible desde algn estado dentro de

CM T D es cerrada si ningn C . Es decir, i C y j / C, i

no estn comunicados. Dado un estado

Denicin 2.7

i S,

la probabilidad de recurrencia en

pasos,

fi

(t)

se dene como la probabilidad del primer retorno al mismo en exactamente despus de haberlo dejado. Luego, la probabilidad (t) fi = fi . t=1

tN

pasos

fi

de regresar al estado

est dada por:

Denicin 2.8

Cualquier estado

iS

al que la

se llama estado recurrente; en otro caso, si

CM T D retorne con probabilidad fi = 1 fi < 1, i se llama estado transitorio.

37

Denicin 2.9
del estado

Dado cualquier estado recurrente

i,

el tiempo medio de recurrencia

mi ,

de una

CM T D

est dado por:


(t)

mi =
t=1

t fi . mi = , i
se dice

Si

mi < , i

se dice recurrente positivo o no nulo; en otro caso, si

recurrente nulo.

Denicin 2.10

Se dene el perodo del estado recurrente

comn divisor del conjunto de enteros positivos Un estado recurrente se dice aperidico si

t, tal que di = 1, y peridico

i S , di , Pii (t) > 0.


de perodo

como el mximo

di

si

di > 1.

Feller W. [19] demostr que todos los estados que pertenecen a una misma clase son del mismo tipo, es decir, todos son peridicos, aperidicos, transitorios, recurrentes positivos o recurrentes nulos.

Denicin 2.11
CM T D

Si uno de los estados

entonces lo son todos los dems se dice aperidica. Una

i S de una CM T D irreducible es aperidico, estados j S , es decir dj = 1, para todo j S , y la

Denicin 2.12

CM T D

irreducible, aperidica con todos sus estados recurrentes

positivos se dice ergdica.

Observacin 2.13
CMTD

Los estados de una

CM T D

irreducible nita son todos recurrentes

positivos, en consecuencia una

CM T D

irreducible, aperidica y nita es ergdica.

en el Largo Plazo: Para estudiar las propiedades de las CM T D en el largo


i
hasta otro estado

plazo nos basamos especcamente en las puede ir de un estado de un estado en

CM T D ergdicas. En este tipo de cadenas se j en t pasos aunque no exista un arco dirigido

i a un estado j , es decir, hay libertad de pasar de un estado a cualquier otro

pasos.

Denicin 2.14
todo

Una distribucin de probabilidad

= (0 , 1 , . . . )

de una

CM T D

se

dice estacionaria si cualquier transicin de acuerdo con la matriz de probabilidades de transicin en un paso

P = (Pij )

no tiene efecto sobre esas probabilidades, es decir, si para

j S,

se cumple que

j =

En trminos matriciales,

i Pij . i S es estacionaria si verica: = P.


(2.4)

38

= P tiene como consecuencia el hecho de que para cualquier t N t t se cumpla que = P , es decir, es tambin una distribucin estacionaria para P . Esto signica que si la variable aleatoria inicial X0 tiene esa distribucin , entonces la distribucin de Xt tambin es pues P (Xt = j ) = i (Pt )ij , es decir, esta distribucin
La condicin

i S

no cambia con el paso del tiempo.

Observaciones:
1) El vector de ceros cumple la condicin de distribucin de probabilidad. 2) Para encontrar una posible distribucin estacionaria de una probabilidades de transicin ecuaciones (2.4). 3) Pueden darse slo tres situaciones sobre la existencia de distribuciones estacionarias para una innitas. Cuando existe una distribucin estacionaria, sta tiene como soporte el conjunto de estados recurrentes positivos. Esto se resume en la siguiente proposicin.

pero no corresponde a una

P, un primer mtodo consiste en resolver el sistema de

CM T D

con matriz de

CM T D

cualquiera: o no existe ninguna, o existe una y es nica o existen

Proposicin 2.15
recurrente nulo

una distribucin entonces i = 0.


Sea

estacionaria. Si

es un estado transitorio o

Presentamos ahora sin demostracin dos condiciones que en su conjunto garantizan la existencia y unicidad de una distribucin estacionaria.

Proposicin 2.16

Toda

CM T D

que es irreducible y recurrente positiva tiene una nica

distribucin estacionaria dada por:

j =
con

1 > 0, mj j.

mj

el tiempo medio de recurrencia del estado

En particular, toda cadena nita e irreducible tiene una nica distribucin estacionaria.

Denicin 2.17

La distribucin de probabilidad lmite de una

CM T D

se dene por:
(2.5)

() = l m (t) = l m (0)Pt = (0) l m Pt = (0) P() .


t t t

Supongamos que bajo ciertas condiciones la sucesin de distribuciones de probabilidad

(0), (1), (2), . . .

converge a una distribucin de probabilidad lmite

().

Entonces

esta distribucin lmite vericar las siguientes propiedades:

39

1)

()

no depender de la distribucin inicial y estar dada por el lmite de las () potencias de , , pues si se toma como distribucin inicial a aquella concen-

P P

trada en el i-simo estado, entonces el j-simo elemento de la distribucin lmite es j = l m ( t )ij . t

2) El lmite de las potencias de

es una matriz con todas las las idnticas, siendo

esta la la distribucin lmite. 3) De la ecuacin (2.3) tenemos que para

(t) = (t 1)

P,

por lo que si existe el lmite

(t)

cuando

t ,

resulta:

() = l m (t) = l m (t 1) P = () P.
t t
Por lo tanto, si existe la distribucin lmite, sta es estacionaria. La armacin inversa no es necesariamente cierta. En espacios de estados nitos o innitos, si existen los lmites de las probabilidades cuando

(Pt )ij ,

t , y no dependen de i, la distribucin lmite podra ser una distribucin esta-

cionaria. Esto es slo una posibilidad ya que los lmites podran ser todos cero. Sin embargo, en el caso nito tales lmites conforman una distribucin de probabilidad verdadera. La siguiente proposicin reeja estas ideas.

Proposicin 2.18
lmites i)
j S t t

Sea la

CM T D

con probabilidades de transicin

Pij

tales que los

j = l m (P )ij j 1

existen para cada

y no dependen de i. Entonces

ii)

j =
iS

i (Pt )ij . i)
obtenindose

Cuando el espacio de estados es nito se cumple la igualdad en el inciso una distribucin de probabilidad verdadera.

El siguiente resultado es el recproco del anterior, supone la existencia de una distribucin estacionaria para concluir que los lmites de las probabilidades existen.

irreducible, aperidica y con distribucin estacionaria . Entonces para cualquier par de estados i y j , l m (Pt )ij = j . t
Finalmente establecemos las condiciones sucientes para la existencia del lmite de las probabilidades de transicin, asegurando adems que se trata de una distribucin de probabilidad.

Teorema 2.19

Dada una

CM T D

40

irreducible, aperidica y recurrente positiva (es decir, 1 ergdica), las probabilidades lmite j = l m (Pt )ij = m existen y constituyen la nica j t solucin al sistema de ecuaciones

Teorema 2.20

Dada una

CM T D

j =
iS

i Pij ,

(2.6)

sujeto a las condiciones

j 0,

y
j S

j = 1. CM T D
tenemos que:

Resumiendo los resultados principales para la clasicacin de 1) Dada una

CM T D

aperidica, los lmites

() = l m (t)
t

existen.

2) Para cualquier lmite

()

CM T D irreducible y aperidica existe la distribucin de probabilidad es independiente de la distribucin de probabilidad inicial (0).
ergdica, la distribucin de probabilidad lmite

3) Para una

CM T D

()

existe y

comprende el nico vector de probabilidades estacionarias

2.2. Descripcin del modelo


Como hemos mencionado en el Captulo 1 cuando nos referimos a las polmicas sobre Facebook, en cualquier contexto comunicacional lo que realmente interesa es estudiar el comportamiento de los usuarios. En Facebook estos usuarios son representados por los perles y por lo tanto resulta difcil saber cuntas personas hay detrs de un perl o cuntos perles tiene una misma persona. Hemos sealado que estos fenmenos contrapuestos generan un modelo de red en dos niveles que es fuertemente no-identicable, y en el que el inters se centra en el nivel inferior representado por las personas o usuarios a partir de lo observable que es el nivel superior y est representado por los perles. Comenzaremos por denir algunos conjuntos y funciones que utilizaremos para describir las ideas mencionadas. Trabajaremos a tiempo discreto

t,

es decir,

ser un nmero natural. Llamaremos

Pt

al conjunto de usuarios de internet en el instante

Ft

al conjunto de perles de

Facebook en el instante t. Es claro que

Pt Pt+1 . Adems, supondremos que una vez que

un perl es creado en Facebook no puede darse de baja ya que borrar toda la informacin que el mismo tiene incorporada en la red, nombre, fotos, videos, mensajes, direccin de e-mail, etc., no es tan fcil como abrir una cuenta y, por ser sta una opcin denitiva, est bastante oculta en Facebook, luego Notaremos como

Ft Ft+1 .

P y F a los conjuntos P =
t=0

Pt y F =
t=0

Ft respectivamente.

41

Para denir el instante en que nace un perl

f F ,

haremos uso de un conjunto de

variables aleatorias independientes e idnticamente distribuidas {t (f )} con 2 E (t (f )) = 2 y soporte no acotado, es decir, P (t (f ) < ) > 0, para todo

E (t (f )) = , .

Denicin 2.21

N > 0, denimos el tiempo de nacimiento de un perl f F como el menor instante s N tal que s > N . Esto equivale a que f / Ft , f Fs , para todo s t + 1 t+1 (f ) > N .
Sea
Es decir, a tiempo posterior a

el perl

todava no ha sido creado, pero se crear a tiempo

s,

t,

si y slo si la variable

supera cierto umbral establecido

N .

Observacin 2.22
f / Ft(f,w) , f Fs ,
el perl ser creado.

Para todo para todo

f F , existe una variable aleatoria t(f, w) tal que s t(f, w) + 1. Esto es, para todo perl por nacer existe

un tiempo que depende de dicho perl y es aleatorio, tal que para todo tiempo posterior,

Esta forma de denir el nacimiento de un perl nos permitir modelar la creacin de los perles y el crecimiento de la red desde una perspectiva aleatoria. Dados los conjuntos de usuarios y de perles de Facebook en el instante t, Pt y Ft (k) (k) respectivamente, notaremos con Pt y Ft , k N, a la familia de todos los subconjuntos con k elementos de Pt y Ft respectivamente. Adems, notaremos con Pt y Ft a los (k) (k) Ft {}. Luego, un elemento de Pt o es el Pt {} y Ft = conjuntos Pt = k=1 k=1 conjunto vaco o es un subconjunto de usuarios de internet con k elementos en el instante t, donde k es un nmero natural. Anlogamente, un elemento de Ft o es el conjunto vaco o es un subconjunto de perles de Facebook con nmero natural. Vamos a denir ahora las funciones que modelarn los dos niveles en que ser representada la red.

elementos en el instante

t,

con

un

Denicin 2.23
,

Denimos la funcin que a cada usuario de internet asocia el conjunto de perles que administra en el instante t, como la funcin t : Pt Ft dada por: si si

t (p) =

no tiene perl de Facebook, son los perles de Facebook que administra

{f1 , . . . , f k }

f1 , . . . , f k

p.

Denicin 2.24

Denimos la funcin que a cada perl de Facebook asigna los usuarios que lo co-administran en el instante t, como la funcin t : Ft Pt dada por:

t (f ) = {p1 , . . . , pn },

con

p1 , . . . , p n

los usuarios que co-administran el perl

f.

Trivialmente se verican las siguientes Ecuaciones de Consistencia:

42

1) Si

t (p) = p t (t (p)). f Ft , f t (t (f )).

2) Para todo

Debido a que nuestro anlisis se centrar en el comportamiento de los perles, deniremos la siguiente funcin que nos permitir estudiar la dinmica entre pares de perles.

Denicin 2.25
tante

como la

f, g Ft . Denimos la funcin funcin t : Ft Ft {0, 1}, tal que:


Sean

aleatoria de amistad en el ins-

t (f, g ) =

1, 0,

si si

f f

y y

g g

son amigos en el instante

t, t. t
es

no son amigos en el instante

Observacin 2.26
simtrica.

La amistad es una relacin simtrica, por lo que la funcin

Nuestro siguiente objetivo consiste en estudiar el comportamiento de todos los posibles pares de perles que integran la red. Para ello, deniremos una matriz en la que cada elemento reeje el comportamiento del correspondiente par de perles que representa.

M = card{F } al cardinal del conjunto de perles de Facebook a tiempo innito y con MM M al conjunto de las matrices binarias simtricas de orden M .
Notaremos con

Denicin 2.27
matriz par de

Denimos la matriz aleatoria de amistad en el instante valores que toma la funcin

como la

At MM M cuyos elementos son los perles (f, g ) F F . Es decir, At = t (f, g )

para cada

.
(f,g )F F

Propiedades de At
At
es simtrica, ya que la funcin

lo es.

Los elementos diagonales tomarn el valor ya ha sido creado y

si a tiempo

el perl correspondiente

si no. Es decir,

t (f, f ) =
con lo cual a tiempo

1, 0,

para todo si

f Ft ,

f F Ft ,

todo perl ya ha sido creado.

43

Debido a que en redes sociales existe un importante nivel de interactividad, es habitual suponer markovianidad. Luego, supondremos que Markov matricial nita de dimensin comportamiento de la cadena

{At }

es una cadena de

M M.

Esto signica que para conocer el

{At }

en el estado actual, basta conocer su compor-

tamiento en el instante anterior. Calcularemos para la cadena ello, tendremos en cuenta que al

{At }, las probabilidades de transicin en un paso. Para ser At simtrica, bastar con calcular las probabilidades fi , fj F ,

de transicin de los elementos correspondientes a la subdiagonal inferior.

Denicin 2.28
si

Dado

i<j

y escribimos

F = {f1 , . . . , fM }, fi fj .

si

decimos que

fi

precede a

fj

Introducimos a continuacin las siguientes notaciones de utilidad para el clculo de las probabilidades mencionadas:

Si

At = A, por A.

entonces el estado de amistad de la cadena

{At }

a tiempo

est dado

A MM M , SD(A) = {Ai,j : i > j } subdiagonal inferior de A.


Si

representa el conjunto de elementos de la

{At }, A y B, y considerando que la matriz B corresponde a un estado de amistad a tiempo posterior al que corresponde la matriz A, queremos calcular las siguientes probabilidades de transicin en un paso de A a B, calculando las probabilidades de que la subdiagonal inferior de la cadena a tiempo t +1 sea la subdiagonal inferior de B dado que a tiempo t el estado correspondiente a la subdiagonal inferior de la cadena sea la subdiagonal inferior de A. Es decir,
Luego, dados dos estados de

,B pA t,t+1 = P (At+1 = B/At = A)

(2.7)

= P [SD(At+1 ) = SD(B)/SD(At ) = SD(A)] .


Pueden darse las siguientes posibilidades para los elementos de la subdiagonal inferior en la transicin de

B:
caso en el que los perles no son amigos a tiempo

Ai,j = 0 Ai,j = 0 Ai,j = 1

Bi,j = 0, Bi,j = 1, Bi,j = 0,

y no se

hacen amigos en el siguiente instante. y caso en el que los perles no son amigos en el instante

pero

pasan a serlo en el siguiente instante. y caso en el que los perles son amigos a tiempo

pero rompen

amistad en el siguiente instante.

44

Ai,j = 1 y Bi,j = 1, caso en el que los perles son amigos a tiempo t y siguen sindolo
en el instante siguiente.

Observacin 2.29
A
a

Si

Ai,i = 1

Bi,i = 0,

para algn

i,

la probabilidad de transicin de

es cero, ya que como hemos mencionado, una vez que un perl ingresa a Facebook

no puede darse de baja.


Para describir cmo cambian de un instante al siguiente los elementos de

At ,

denire-

mos ciertos ndices que medirn el nivel de anidad entre pares y ternas de perles. Sea

un conjunto cualquiera. Notaremos por

A A D(A A) = {(a, a ) : a, a A, a = a },
al conjunto de pares de elementos de

distintos, y por

A A A D(A A A) = {(a, a , a ) : a, a , a A, a = a , a = a , a = a },
al conjunto de ternas de elementos de

distintos dos a dos.

Denicin 2.30
con

Sea

el conjunto de usuarios a tiempo innito, y sean

p = p . Denimos el ndice de imagen del usuario p sobre el funcin X : P P D (P P ) I R tal que: X (p, p ) > 0, si p tiene una imagen favorable de p , X (p, p ) = 0, X (p, p ) < 0,
si

p, p P , usuario p como la

es indiferente a

p,

si

tiene una imagen desfavorable de

p.

Es decir,

asigna a cada par de usuarios distintos un nmero positivo, un cero o un

nmero negativo segn la imagen que tenga el primero con respecto al segundo sea favorable, indiferente o desfavorable respectivamente.

Observaciones:
1) Suponemos que la red se encuentra en la etapa de madurez, instancia en la que la imagen que tiene una persona sobre otra a largo plazo ya est formada, razn por la cual

no depende de

t. p
con respecto a otro

2) La imagen que tiene un usuario con la que tiene

no necesariamente coincide

sobre

p,

es decir,

es no simtrica.

3) Como los usuarios no se pueden observar si no a travs de los perles, observable.

es no

45

4) Cuanto ms favorable (desfavorable) sea la imagen que tenga (menor) va a ser el valor de relacin a

sobre

p,

mayor

X (p, p ),

es decir, existe monotona en la imagen en

X. f, g F ,
vamos a denir el ndice de imagen de

Dados dos perles distintos, sobre

promediando los ndices de imagen de todos los pares posibles de usuarios que

los administran, transformados por una funcin de regresin montona desconocida, junto con un ruido blanco entre los perles que es aleatorio y depende del tiempo de la siguiente manera:

Denicin 2.31
sobre el perl

Sean

f, g F , f = g .

Denimos el ndice de imagen del perl

como la funcin

Yt : F F D(F F ) IR,
dada por

1 Yt (f, g ) = ml
con

X (pi , pj ) + t (f, g ),
i=1 j =1

(2.8)

{p1 , . . . , pm } y {p1 , . . . , pl }, los conjuntos de usuarios que administran a los perles f y g respectivamente, : IR IR una funcin de regresin montona, desconocida, y (t (f, g ))t=0,1,... una sucesin de ruido blanco, es decir, t (f, g ) variables aleatorias indepen2 2 dientes e idnticamente distribuidas con E () = 0 y E ( ) = > 0, para todo f, g F , f = g.
Ahora deniremos los ndices de imagen de ternas ordenadas de usuarios y de perles.

Denicin 2.32
da

Sean

(p, p , p )

como la

p, p , p P . Denimos el ndice de imagen de la terna ordenafuncin U : P P P D (P P P ) I R que asigna p


le sugiere a

a cada terna ordenada de usuarios distintos dos a dos un nmero real, que representa el grado de aceptacin de la accin:

el amigo

Observaciones:
1) Como hemos mencionado, suponemos que la red se encuentra en la etapa de madurez en la cual las anidades entre los usuarios ya estn formadas, razn por la cual al igual que

X, U

no depende de

t. U
es no simtrica.

2) Cada usuario en la terna tiene un rol determinado, por lo tanto 3)

es no observable, por la misma razn que no lo es

X.

46

Adems, dados tres perles distintos dos a dos imagen de la terna ordenada

f, g

h,

deniremos el ndice de

(f, g, h)

promediando los ndices de imagen de todas las

posibles ternas ordenadas de usuarios que los administran, transformados por una funcin de regresin montona desconocida, junto con un ruido blanco entre los tres perles que es aleatorio y depende del tiempo de la siguiente manera:

Denicin 2.33

Sean

de la terna ordenada

f, g, h F distintos dos (f, g, h) como la funcin

a dos. Denimos el ndice de imagen

Wt : F F F D(F F F ) IR,
dada por

Wt (f, g, h) =
con

1 mkl

U (pi , pj , pr ) + t (f, g, h),


i=1 j =1 r=1

(2.9)

{p1 , . . . , pm }, {p1 , . . . , pk } y {p1 , . . . , pl }, los conjuntos de usuarios que administran a los perles f , g y h respectivamente, : I RI R una funcin de regresin montona, desconocida, y (t (f, g, h))t=0,1,... una sucesin de ruido blanco, es decir, t (f, g, h) variables 2 2 aleatorias independientes e idnticamente distribuidas con E ( ) = 0 y E ( ) = > 0, para todo f, g, h F , distintos dos a dos. A y B MM M dos estados de la cadena {At }, B correspondiente a un estado de amistad posterior a A y, dados f, g, h F , con el objetivo de calcular las probabilidades de transicin de A a B denidas por (2.7), describiremos las acciones que puede provocar el perl particular f que tienen incidencia en dicha transicin a partir de
Entonces, siendo los ndices de imagen (2.8) y (2.9). Para ello, supondremos que existen ciertos nmeros a los que llamaremos umbrales condiciones:

B > 0, R > 0 y I > 0, tales que se verican las siguientes

i)  f provoca la ruptura de amistad con

Yt (f, g ),

resulta negativo e inferior a

g  si B .

y slo si el ndice de imagen entre

g,

Observemos que la ruptura de amistad de eliminar a

con

puede darse porque

decide

de su lista de amigos o porque cierto comportamiento de

provoca que

lo elimine de sus amigos.

ii)  f solicita con xito amistad a


supera el umbral

g

si y slo si el ndice de imagen entre

g , Yt (f, g ), g
y

R . f
solicita amistad a

La solicitud de amistad con xito se produce cuando acepta como amigo a

f.

47

iii)  f sugiere con xito a


ordenada de perles

g , el amigo h si y slo si el ndice de (f, g, h), Wt (f, g, h), supera el umbral I . f h


y

imagen de la terna

La sugerencia de amistad con xito viene dada cuando

le sugiere a

su amigo

h,

le solicita amistad a

acepta ser amigo de

g.

Observacin 2.34

Parece razonable que

R > I ,

esto es, el umbral que debe superar

el ndice de imagen necesario para que un perl solicite amistad a otro en forma directa debera ser ms alto que el umbral que debe superar el ndice de imagen de la terna de perles correspondiente a cuando este mismo perl solicita amistad a otro que le fue sugerido por un amigo suyo.
Luego, para el estudio de las acciones del perl

que inciden en la transicin de

B, debemos considerar sus acciones o intervenciones con o sin efecto en relacin con todos
los dems perles de la red, y las mismas pueden resumirse en una unin disjunta de los siguientes eventos: 1 Dt (f ):  rupturas de f , 2 Dt (f ):  no rupturas de f , 3 Dt (f ):  solicitudes de amistad de f , 4 Dt (f ):  sugerencias de amistad de f , es decir,

It (f ) =
i=1

i Dt (f ).

(2.10)

2 (f ), para Dt 1 esto expresamos a los mismos en trminos de la condicin i). De este modo, Dt (f ) representa la interseccin sobre todos los perles g que preceden al perl f tales que f y g son amigos a tiempo t pero dejan de serlo en el instante siguiente ya que el ndice de imagen entre ellos resulta negativo e inferior al umbral B , es decir,
Calcularemos en primer lugar las probabilidades de los eventos

1 (f ) Dt

1 Dt (f ) = g f : Af,g =1, Bf,g =0


y

{Yt (f, g ) < B },

2 Dt (f )

es la interseccin sobre todos los perles

que preceden a

tales que

son

amigos a tiempo

y siguen sindolo en el instante siguiente debido a que el ndice de

imagen entre ellos no alcanz a ser tan bajo como para que se produjera la ruptura, es decir,

2 Dt (f ) = g f : Af,g =1, Bf,g =1

{Yt (f, g ) B }.

48

g, g F , con g f , g f , g = g , como el ruido blanco correspondiente al ndice de imagen entre f y g , t (f, g ), es independiente del ruido blanco correspondiente al ndice de imagen entre f y g , t (f, g ), tambin son independientes {Yt (f, g ) < B } de {Yt (f, g ) < B }, y {Yt (f, g ) B } de {Yt (f, g ) B }. En consecuencia,
Entonces, si

1 (f )) = P (Dt g f : Af,g =1, Bf,g =0


y

P {Yt (f, g ) < B } ,

2 P (Dt (f )) = g f : Af,g =1, Bf,g =1

P {Yt (f, g ) B } .

3 Para el clculo de la probabilidad de Dt (f ) expresamos a dicho evento en funcin de 3 la condicin ii), siendo entonces Dt (f ) la unin sobre todos los perles g que preceden
a

tales que

no son amigos a tiempo

pero pasan a serlo en el instante siguiente

por haber superado el ndice de imagen entre ellos el umbral la unin sobre todos los perles instante

que preceden a

tales

R necesario para tal n que f y g no son amigos en el

t ni pasan a serlo en el instante siguiente debido a que el umbral establecido para

que haya anidad entre ellos y se produzca la amistad no fue superado, es decir,

3 Dt (f ) = g f : Af,g =0, Bf,g =1

{Yt (f, g ) > R }


g f : Af,g =0, Bf,g =0

{Yt (f, g ) R }.

Luego, utilizando propiedades de conjuntos tenemos que

3 P (Dt (f )) = P g f : Af,g =0, Bf,g =1

{Yt (f, g ) > R }


g f : Af,g =0, Bf,g =0

{Yt (f, g ) R }

= 1P
g f : Af,g =0, Bf,g =1
Observemos que

{Yt (f, g ) R }
g f : Af,g =0, Bf,g =0

{Yt (f, g ) > R } .

(2.11)

{Yt (f, g ) R } es independiente de


g f : Af,g =0, Bf,g =1 g f : Af,g =0, Bf,g =0

{Yt (f, g ) > R } ya que si

g {g f : Af,g = 0, Bf,g = 1} entonces g / {g f : Af,g = 0, Bf,g = 0}. Adems, son independientes {Yt (f, g ) R } de {Yt (f, g ) R } y {Yt (f, g ) > R } de {Yt (f, g ) > R }, ya que son independientes los ruidos blancos t (f, g ) y t (f, g ) correspondientes a los
49

ndices de imagen para la

Yt (f, g ) e Yt (f, g ) respectivamente. 3 probabilidad de Dt (f ) resulta


3 (f )) = 1 P (Dt g f : Af,g =0, Bf,g =1

Por lo tanto, la expresin (2.11)

P {Yt (f, g ) R }
g f : Af,g =0, Bf,g =0

P {Yt (f, g ) > R } .

4 Dt (f ) que, expresado en trminos de la condicin iii), representa la interseccin sobre todos los perles g que preceden a f tales que f y g son amigos en el instante t de la unin sobre todos los perles h que preceden a f tales que f y h son amigos a tiempo t y en el instante siguiente h y g se hacen amigos debido a que el ndice de imagen de la terna ordenada de perles (f, g, h) super el umbral I necesario para que g y h se hagan amigos por sugerencia de f , junto con la unin sobre todos los perles h que preceden a f tales que f y h son amigos en el instante t y en el instante siguiente h y g no concretan amistad ya que el ndice de imagen de la terna ordenada de perles (f, g, h) no pudo superar el umbral I para que g y h se hagan amigos por sugerencia de f , es decir,
Finalmente calcularemos la probabilidad del evento

4 Dt (f ) = g f : Af,g =1 hf : Af,h =1, Bg,h =1

{Wt (f, g, h) > I }


hf : Af,h =1, Bg,h =0

{Wt (f, g, h) I }

4 P (Dt (f )) = P g f : Af,g =1 hf : Af,h =1, Bg,h =1

{Wt (f, g, h) > I }


hf : Af,h =1, Bg,h =0

{Wt (f, g, h) I }

=
g f : Af,g =1

P
hf : Af,h =1, Bg,h =1

{Wt (f, g, h) > I }


hf : Af,h =1, Bg,h =0

{Wt (f, g, h) I }

=
g f : Af,g =1

1P
hf : Af,h =1, Bg,h =1

{Wt (f, g, h) I }
hf : Af,h =1, Bg,h =0

{Wt (f, g, h) > I }

(2.12) donde (2.12) se obtiene utilizando propiedades de conjuntos. Adems,

{Wt (f, g, h) I } es independiente de


hf : Af,h =1, Bg,h =1 hf : Af,h =1, Bg,h =0
entonces

{Wt (f, g, h) > I }, ya que

si

h {h f : Af,h = 1, Bg,h = 1}

h / {h f : Af,h = 1, Bg,h = 0}.

Por

50

f y g jos, h = h , h f , h f , son independientes {Wt (f, g, h) I } de {Wt (f, g, h ) I } y {Wt (f, g, h) > I } de {Wt (f, g, h ) > I }, ya que son independientes los ruidos blancos t (f, g, h) y t (f, g, h ) correspondientes a los ndices de imagen Wt (f, g, h) y Wt (f, g, h ) respectivamente. Por lo tanto, la expresin (2.12) para el clculo 4 de la probabilidad de Dt (f ) resulta
otro lado, para

4 P (Dt (f )) = g f : Af,g =1

1
hf : Af,h =1, Bg,h =1

P {Wt (f, g, h) I }
hf : Af,h =1, Bg,h =0

P {Wt (f, g, h) > I }

Retomando el clculo de las probabilidades de transicin en un paso del estado de amistad A al B de la cadena de Markov representada por la matriz de amistad At , ,B pA t,t+1 , (2.7) puede expresarse como la probabilidad de la interseccin sobre todos los

f F , de las acciones o intervenciones de cada la transicin de A a B, siendo estas acciones representadas i eventos descriptos Dt (f ), i = 1, 2, 3, 4, es decir,
perles

uno de ellos que inciden en por uniones disjuntas de los

,B pA t,t+1 = P f F 4
con

It (f ) ,

(2.13)

It (f ) =

i Dt (f ).

es independiente de It (f ). Como i i It (f ) e It (f ) son uniones disjuntas de los conjuntos Dt (f ) y Dt (f ) respectivamente, i i i = 1, 2, 3, 4, basta ver que Dt (f ) es independiente de Dt (f ), para i = 1, 2, 3, 4. En efecto, i en Dt (f ), la primera coordenada tanto del ndice Yt (f , g ) como del ndice Wt (f , g, h) , veremos que es ja, y es adems la primera coordenada de los ruidos blancos que intervienen en dichos ndices respectivamente. Entonces, son de

i=1 Luego, dado

f F , f = f

It (f )

t (f , g, h) independientes Yt (f , g )
y

t (f , g )

Yt (f, g ) y Wt (f , g, h) de Wt (f, g, h), puesto que son independientes los ruidos blancos i t (f , g ) de t (f, g ) y t (f , g, h) de t (f, g, h). Por lo tanto, para i = 1, 2, 3, 4, Dt (f ) es i independiente de Dt (f ) y la probabilidad (2.13) resulta
A ,B pt,t +1 = f F 4
con

P (It (f )),

(2.14)

It (f ) =

i Dt (f ),

por lo que aplicando el principio de inclusin-exclusin para los podemos expresar a (2.14) como

i=1 i eventos Dt (f ), i ,B pA t,t+1

= 1, 2, 3, 4,

4 i (f )) P (Dt

4 j i P (Dt (f ) Dt (f )) +

=
f F 4 4 i=1

i=1 j =i+1 j Dt (f )

4 i P (Dt (f )

+
i=1 j =i+1 k=j +1

k Dt (f ))

P
i=1

i Dt (f )

(2.15)

51

Veamos nalmente que los eventos para un mismo perl f . 4 Dt (f ) es independiente de

i Dt (f ), i = 1, 2, 3, 4,
de

son independientes entre s,

2 3 Dt (f ) y de Dt (f ), ya que el ruido blanco 4 t (f, g, h) correspondiente al ndice de imagen Wt (f, g, h) que interviene en Dt (f ) es independiente del ruido blanco t (f, g ) correspondiente al ndice Yt (f, g ) que interviene en 1 2 3 Dt (f ), en Dt (f ) y en Dt (f ). 1 2 3 Dt (f ) es independiente de Dt (f ) y de Dt (f ), ya que si un perl f F aporta a la 1 2 3 interseccin de Dt (f ) no aporta ni a la interseccin de Dt (f ) ni a las uniones de Dt (f ). 2 3 Por la misma razn Dt (f ) es independiente de Dt (f ). Por lo tanto, la probabilidad de transicin en un paso del estado A al B de la cadena de Markov {At } (2.15) est dada por: 4 ,B pA t,t+1 4 i P (Dt (f )) f F 4 4 i=1 4 j i k P (Dt (f )) P (Dt (f )) P (Dt (f )) i=1 j =i+1 k=j +1 i=1 4 j i P (Dt (f )) P (Dt (f )) + i=1 j =i+1 4 i P (Dt (f )) .
(2.16)

1 Dt (f ),

2.3. Transversalidad Completa


El concepto de Transversalidad Completa, (T C de aqu en ms), en una red social est asociado a un modo de comportamiento comunicacional en el que cada perl se relaciona con cualquier otro con la misma probabilidad, es decir, los perles se comunican unos con otros sin preferencias.

2.3.1. Homogeneidad de {At}


En trminos del modelo desarrollado en la Seccin anterior, el comportamiento que describe una situacin de sobre otro

T C,

queda reejado en el ndice de imagen

de un usuario

y en el ndice de imagen

de una terna ordenada de usuarios

este modo, los promedios de las funciones de regresin montonas

(p, p , p ). De desconocidas (X ) y

(U )

en las expresiones de los ndices de imagen de los perles que administran dichos

usuarios (2.8) y (2.9), asumen el mismo valor, digamos usuarios distintos y

C1

I R para todos los pares de

C2

I R para todas las ternas ordenadas de usuarios distintos dos a

dos respectivamente. Por consiguiente, los ndices de imagen dados por las frmulas (2.8) y (2.9) mencionadas se reducen a

C1 + t (f, g )

C2 + t (f, g, h). {At }


pueden calcularse y estn

Hemos visto en la Seccin anterior que las probabilidades de transicin en un paso del estado de amistad

al estado

de la cadena de Markov

dadas por la expresin (2.16). A continuacin veremos, suponiendo un contexto de

T C,

52

que dichas probabilidades no dependen del tiempo resultado.

t,

es decir, probaremos el siguiente

Teorema 2.3.1 Demostracin

(Homogeneidad)

En el contexto de

T C,

la cadena de Markov

{At }

es homognea en el tiempo.

Supongamos un contexto de

TC

en la red social Facebook. Para probar la homo-

geneidad en el tiempo de la cadena {At } basta ver que las probabilidades involucradas i en (2.16), P (Dt (f )), i = 1, 2, 3, 4, no dependen de t. Para ello, introducimos algunas notaciones tiles. Para el ruido blanco correspondiente a la frmula (2.8), funcin de distribucin de

t (f, g ),

llamaremos

a la

t que, por hiptesis de T C , no depender de t ni de los perles f y g . Esto es, P (t (f, g ) ) = F (), para todo t = 0, 1, . . . , y para todo par de perles f, g F , con F continua. De igual manera, para el ruido blanco correspondiente a la frmula (2.9), t (f, g, h), llamaremos G a la funcin de distribucin de t que, por hiptesis de T C , no depender de t ni de los perles f , g y h. Es decir, P (t (f, g, h) ) = G(), para todo t = 0, 1, . . . , y para toda terna ordenada de perles f, g, h F , con G continua. i,j i,j Adems, notaremos con cA,B (f ) y dA,B (f, g ) a los cardinales de los conjuntos: ci,j A,B (f ) = card {g f : Af,g = i, Bf,g = j ; i, j {0, 1}}
y

di,j A,B (f, g ) = card {h f : Af,h = i, Bh,g = j ; i = 1, j {0, 1}} .


En consecuencia, bajo un contexto de

T C,

tenemos que:

1 P (Dt (f )) = g f : Af,g =1, Bf,g =0

P {C1 + t (f, g ) < B }

= F (B C1 )cA,B (f ) ,

1,0

2 P (Dt (f )) = g f : Af,g =1, Bf,g =1

P {C1 + t (f, g ) B }

=
g f : Af,g =1, Bf,g =1

1 P {C1 + t (f, g ) < B }

= [1 F (B C1 )]cA,B (f ) ,
53

1,1

3 (f )) = 1 P (Dt g f : Af,g =0, Bf,g =1

P {C1 + t (f, g ) R }
g f : Af,g =0, Bf,g =0
0,1 0,0

P {C1 + t (f, g ) > R }

= 1 F (R C1 )cA,B (f ) [1 F (R C1 )]cA,B (f )
y

4 P (Dt (f )) = g f : Af,g =1

1
hf : Af,h =1, Bg,h =1

P {C2 + t (f, g, h) I }
hf : Af,h =1, Bg,h =0

P {C2 + t (f, g, h) > I }

1 G(I C2 )

,1 d1 A,B (f,g )

[1 G(I C2 )]

,0 d1 A,B (f,g )

,1 1,0 c1 A,B (f )+cA,B (f )

Luego, como las probabilidades dades de transicin en un paso

i P (Dt (f )), i = 1, 2, 3, 4, no dependen de t, las probabiliA ,B para la cadena {At }, pt,t+1 , no dependen de t por lo que

{At }

es homognea en el tiempo, esto es, la probabilidad de pasar de un estado a otro

slo depende del estado de salida y no del tiempo en que ocurre la transicin.

2.3.2. Ergodicidad de {At}


Sea

S = MM M , M < , M

el espacio de estados de la cadena de Markov

{At }

representada por la matriz de amistad binarias simtricas de orden

At ,

donde

MM M

es el espacio de matrices

denido anteriormente.

Supongamos un contexto de tiempo de la cadena

TC

en Facebook y por lo tanto homogeneidad en el

{At }.

Queremos estudiar la dinmica a largo plazo de la red social

cuando est en estado de madurez (descripcin del steady state o sistema en rgimen) suponiendo que a esta instancia todos los perles han sido creados. Notaremos con

al conjunto de estados pertenecientes a

representados por las

matrices binarias de orden

con todos unos en la diagonal, es decir, para todo

C = {A S : Ai,i = 1,

i, i = 1, 2, . . . , M }.

Proposicin 2.35 C Demostracin


Sea

es una clase de comunicacin cerrada.

S con al menos un cero en la diagonal, es para algn i, i = 1, 2, . . . , M . Esto signica que en el instante t, el estado de amistad A est indicando que t (fi , fi ) = 0, para algn i, i = 1, 2, . . . , M , es decir, el perl fi a tiempo t no existe en Facebook. Como hemos supuesto que una vez que un perl ingresa a la red no puede darse de baja, dado A C , la probabilidad de transicin de A a A es cero, esto es, un estado fuera de C no es accesible desde un estado dentro de C . Luego, C es una clase de comunicacin cerrada. 2
tal que una matriz perteneciente a 54

A S

A / C . A es decir, A i,i = 0,

Observacin 2.36
instante

Estamos suponiendo que la red est en estado de madurez y, en estas

condiciones, todos los perles de la misma ya han sido creados. Luego, si

A / C

en el

C . Por lo tanto, {At } es tal que en el largo plazo todos los estados del espacio de estados S son atrados en una cantidad nita de pasos por la clase de comunicacin cerrada C . t,
en una cantidad nita de pasos el estado

ser atrado por

Proposicin 2.37 C Demostracin


Sean

es una clase de comunicacin irreducible y aperidica.

A, B C .

Ambos estados de amistad son matrices binarias simtricas de orden

con todos unos en la diagonal, Fuera de la diagonal, un cero puede pasar a un uno

o un uno a un cero en un slo paso y en consecuencia aperidicos. Por lo tanto

es irreducible y aperidica.

AyB 2

estn comunicados y son

Teorema 2.38

(Ergodicidad)

{At } es ergdica y, bajo la distribucin ergdica (), la indicatriz de amistad entre cualquier par de perles f y g , con g f , denotada por (f, g ), es una variable aleatoria con distribucin Bernoulli de parmetro p, 0 < p < 1, con la misma distribucin e independiente de la indicatriz de otro par de perEn el contexto de

TC

la cadena de Markov

les.

Demostracin
Hemos probado que y, por ser

es una clase de comunicacin cerrada, irreducible y aperidica

un conjunto nito, todos sus estados son recurrentes positivos. Entonces,

restringiendo la cadena

{At }

al espacio de estados

C,

la misma es irreducible, aperidica

y con todos sus estados recurrentes positivos. Luego, por la Denicin 2.12,

{At }

es

ergdica y, por lo tanto, existe la distribucin lmite que comprende el nico vector de probabilidades estacionarias

En particular, si

A C,

A () = l m P (At = A)
t

= l m P
t f F

{t (f, f ) = 1}
g f g F

{t (f, g ) = Af,g }

Por otra parte, las funciones de amistad entre pares de perles

de

Ft , t ,

fueron

denidas como variables dicotmicas que tomaban valores uno o cero de acuerdo a si estos perles eran amigos o no en Facebook en el instante t. Entonces, bajo la distribucin ergdica, a tiempo innito, las variables aleatorias Bernoulli. En el contexto de

(f, g ), con f g , tienen distribucin

T C,

cada perl de

entabla amistad con cualquier otro con la

misma probabilidad, digamos

p,

por lo que las variables aleatorias

(f, g ),

con

f g,

f, g F

son adems idnticamente distribuidas.

55

Adems, estas variables aleatorias guardan relacin directa con los ndices de imagen entre pares de perles,

Yt ,

y hemos visto que estos ndices bajo

TC

quedaban reducidos

a una constante ms un ruido blanco. Estos ruidos blancos son variables aleatorias independientes para todo

f, g F , 2

con

f g,

y por esto los ndices de imagen entre pares

de perles distintos son independientes. En consecuencia, son independientes.

(f, g ),

con

f g , f, g F
la distribu-

Por lo expuesto en el teorema anterior podemos concluir que, para cin ergdica bajo

A C,

TC

es

A () =
f F g f g F

pAf,g .(1 p)1Af,g , 0 < p < 1.

56

Captulo 3 Estimacin y Test de Hiptesis


En este Captulo presentamos estimadores que involucran a dos perles de Facebook que luego utilizaremos para probar la hiptesis de

TC

en la red.

Para realizar los test de hiptesis necesitamos conocer la distribucin asinttica de dichos estimadores, para lo cual utilizaremos teoremas como los de Lindeberg y Lyapunov para arreglos triangulares. Adems, daremos a conocer una familia de estadsticos llamados U-Estadsticos, introducida por Hoeding en 1948, quien se bas en un trabajo de Halmos realizado en 1946. Veremos que esta familia admite un Teorema Central del Lmite cannico y resuelve el problema de encontrar la distribucin lmite de varios estadsticos no lineales de gran utilidad. Por ltimo, introducimos el concepto de Transversalidad Segmentada y proponemos un test para probar

TC

entre los segmentos para luego denir un ndice de performance

de utilidad para medir la calidad en la segmentacin.

3.1. U -Estadsticos
3.1.1. Denicin y ejemplos
h : Rr R es una funcin a valores reales de r argumentos x1 , . . . , xr , y que los argumentos pueden ser nmeros reales o vectores. Sean X1 , . . . , XN , N observaciones independientes idnticamente distribuidas con funcin de distribucin F . Dado r 1, queremos estimar o hacer inferencias sobre el parmetro
Supongamos que

= (F ) = E h(X1 , . . . , Xr )
suponiendo que

...

h(x1 , . . . , xr ) dF (x1 ) . . . dF (xr ),

N r.
es

Trivialmente, un estimador insesgado de

h(X1 , . . . , Xr ).

Si

N > r,

como

h(X1 , . . . , Xr )

no involucra a todas las observaciones de la muestra, este estimador de

57

puede mejorarse utilizando el Teorema de Rao-Blackwell mediante el clculo de la esperanza condicionada a un estadstico suciente, obtenindose as un estimador de menor varianza. Por ejemplo, si las variables aleatorias ticos de orden

Xi

toman valores reales, el conjunto de estads-

X(1) , . . . , X(N )

es siempre suciente y

E h(X1 , . . . , Xr )|X(1) , . . . , X(N )


y, en este caso

es

un mejor estimador insesgado de

que

h(X1 , . . . , Xr ) = 1 r CN

E h(X1 , . . . , Xr )|X(1) , . . . , X(N )


con

h(Xi1 , . . . , Xir ),
1i1 <i2 <...<ir N

(i1 , . . . , ir ) {1, . . . , N }.

una de las

r CN =

N! colecciones de r!(N r)!

enteros distintos del conjunto

Luego, tenemos la siguiente denicin:

Denicin 3.1
tribuidas, un

X1 , . . . , XN , N observaciones independientes idnticamente U-Estadstico de orden r , N r , con ncleo h se dene por: 1 U = UN = r h(Xi1 , . . . , Xir ). CN 1i <i <...<i N
Sean
1 2 r

dis-

Claramente,

UN

es un estimador insesgado de

. h
es simtrica para que

Observacin 3.2
U

Suponemos sin prdida de generalidad que

tambin tenga esa propiedad. Es decir, suponemos que

no cambia su valor cuando

permuta sus argumentos.

Ejemplo 3.3

Sea

(F ) = (F ) =

x dF (x). Para el ncleo h(x) = x, el correspondiente


N N

U-Estadstico es:

1 U ( X1 , . . . , X N ) = N
es decir, la media muestral.

Xi h(Xi ) =
i=1

i=1

= X,

Ejemplo 3.4

Sea

(F ) = 2 (F ) = ( x dF (x))2 .

Para el ncleo

h(x1 , x2 ) = x1 x2 ,

el

correspondiente U-Estadstico es:

U ( X1 , . . . , X N ) =

2 Xi Xj . N (N 1) 1i<j N )2 dF (x).
N

Ejemplo 3.5
h(x1 , x2 ) =

2 Sea (F ) = V ar (F ) = (F ) = (x 2 (x1 x2 ) , el correspondiente U-Estadstico es: 2

Para el ncleo

1 2 U (X1 , . . . , XN ) = h(Xi , Xj ) = N (N 1) 1i<j N N 1


es decir, la varianza muestral.

2 Xi2 N X
i=1

= s2 ,

58

3.1.2. Varianza de un U -Estadstico:


Consideremos un ncleo simtrico Denimos las funciones asociadas

h(x1 , . . . , xr ) que satisface E h2 (X1 , . . . , Xr )

< .

hc (x1 , . . . , xc ) = E h(x1 , . . . , xc , Xc+1 , . . . , Xr ) , c = 1, . . . , r 1 y hr h. Como h (x , . . . , xc ) dF (x1 ) . . . dF (xc ) = ARrc h(x1 , . . . , xr ) dF (x1 ) . . . dF (xr ), A c 1 c para todo Boreliaano A R , hc es la esperanza condicional de h(X1 , . . . , Xr ) dado X1 , . . . , Xc , es decir,
para cada

hc (x1 , . . . , xc ) = E h(X1 , . . . , Xr )|X1 = x1 , . . . , Xc = xc .


Adems, notemos que para

1cr1

hc (x1 , . . . , xc ) = E hc+1 (x1 , . . . , xc , Xc+1 ) .


Sean

=h h

c = hc , h

donde

= (F ) = E h(X1 , . . . , Xr ) = 0,
para

, con

1 c r.

Observemos que

c (X1 , . . . , Xc ) E h 0 = 0

1 c r.

Denicin 3.1.1

Denimos

y, para

1 c r, c 2 (X1 , . . . , Xc ) . =E h

c = V ar hc (X1 , . . . , Xc )
Puede probarse que Sean

0 = 0 1 r = V arF (h) < , [41].

{a1 , . . . , ar } y {b1 , . . . , br } dos subconjuntos de {1, . . . , N } con r enteros distintos , ya que h es y sea c el nmero de enteros comunes a ambos conjuntos. Por simetra de h simtrica, y por independencia de {X1 , . . . , XN } resulta (Xa , . . . , Xar ) h (Xb , . . . , Xbr ) E h 1 1 = c .

La cantidad de elecciones posibles de estos subconjuntos con c elementos en comn es rc r c CN Cr CN r . 1 (Xi , . . . , Xir ), tenemos: h Luego, escribiendo UN = r 1 CN c

V ar(UN ) = EF [(UN )2 ] 1 (Xa , . . . , Xar ) h (Xb , . . . , Xbr ) E h = 1 1 r 2 (CN ) c c 1 = r 2 (CN )


N rc r c CN Cr CN r c . c=0
59

Este resultado y otras relaciones tiles probadas por Hoeding en 1948, pueden resumirse en el lema que daremos a continuacin.

Lema 3.1.2

La varianza de

UN

est dada por


r rc c Cr CN r c , c=1

1 V ar(UN ) = r CN
y satisface que

V ar(UN ) =
cuando

r2 1 1 +O , N N2

N .

3.1.3. Distribucin asinttica de un U -Estadstico


Los sumandos en la denicin de un

U -Estadstico

no son independientes. Por lo tan-

to, ni la distribucin exacta ni la asinttica se deducen directamente. Sin embargo, puede realizarse una proyeccin del estadstico U sobre la familia de estadsticos lineales de la N 1 h(Xi ), resultando esta proyeccin la parte dominante que determina la disforma N i=1 tribucin lmite de U . Esta es la llamada Proyeccin de Hjek. Los teoremas principales relacionados con estas ideas pueden verse en Sering R. [41], Lee A. [30] y Lehmann E.

[31]

y son enunciados a continuacin.

La Proyeccin de Hjek Denicin 3.1.3


UN
se dene como
N

Supongamos que

E |h| < ,

la proyeccin de Hjek del

U -Estadstico

N = U
i=1
Observemos que la proyeccin de

E (UN |Xi ) (N 1) . UN

(3.1)

es exactamente una suma de variables aleatorias

independientes e idnticamente distribuidas. En trminos de la funcin tenemos que

1 = h1 , h

1 (x) = h1 (x) = E h(X1 , . . . , Xr )|X1 = x , h


y por lo tanto, la expresin (3.1) puede escribirse como

N = U
i=1

r E (UN |Xi ) = N

1 (x). h
i=1

60

A continuacin veremos la proyeccin de 2 Suponemos que EF (h ) < y como d =

UN para el caso general 0 = = c1 = 0 < c . 0, para d < c, la frmula de la varianza para

U -Estadsticos

del Lema 3.1.2 deriva en:

V ar(UN ) =
y

c 2 c!(Cr ) c 1 , + O Nc N c+1

V arF ( N )c (UN ) N . c = 1,

c 2 c! (Cr ) c ,

cuando

Esto sugiere que la variable aleatoria

( N )c (UN ) n(UN )

converge en dis-

tribucin a una variable no degenerada. Para Hoeding demuestra en 1948 que la variable

converge en dis-

tribucin a una variable gaussiana. A continuacin enunciamos el teorema correspondiente cuya demostracin puede verse en Sering R. [41].

Teorema 3.1.4
sea

Supongamos que

observaciones independientes

E (h2 (X1 , . . . , Xr )) < . Sean X1 , X2 , . . . , Xr , Y2 , . . . , Yr idnticamente distribuidas con funcin de distribucin F , y

1 = V ar(h1 (X1 )) = Cov h(X1 , X2 , . . . , Xr ), h(X1 , Y2 , . . . , Yr ) .


Supongamos que

0 < 1 < . Entonces P N ) N (UN U 0,

cuando

N ,

(3.2)

N (UN ) = N (0, r2 1 ),

cuando

N .

(3.3)

Observacin 3.6

Existen expresiones exactas para la

aproximacin y ya hemos visto que si

1 > 0,

entonces

V ar(UN ) aunque alcanza con 2 1 V ar(UN ) = r N1 + O( N 2 ).

una

3.2. Estimacin y test


En esta Seccin nuestro objetivo es estudiar la comunicacin entre dos perles de Facebook. Para ello nos valdremos de algunos estadsticos que resultarn de utilidad para probar la hiptesis de

T C.

Intentaremos hallar la distribucin asinttica de dichos

estadsticos bajo el supuesto de que se cumple la hiptesis mencionada. Recordemos que nuestro inters se centra en la dinmica de la red a largo plazo cuando est en estado de madurez y que en estas condiciones hemos probado que bajo bajo la distribucin ergdica

TC

(),

las indicatrices de si existe amistad entre los perles

61

f, g F ,

con

gf

y denotadas por

con distribucin Bernoulli de

(f, g ), son variables parmetro p, 0 < p < 1.

aleatorias independientes

Los estadsticos que enunciaremos a continuacin se basarn en muestras tomadas al azar de

perles de

F , f1 , . . . , f N .

3.2.1. Promedio de la comunicacin en la muestra


Sea

1 EN = N

i=1

1 N

(fi , fj ) ,
j =1

(3.4)

este estadstico promedia la proporcin de amigos o comunicaciones que tienen los perles de la muestra y por consiguiente mide la comunicacin de la muestra en promedio. Si suponemos que en la red social Facebook se verica la hiptesis de mo las variables aleatorias

T C,

co-

E ( (fi , fj )) = p y E (EN ) y V ar(EN ). En (fi , fi ) = 1,

( (fi , fj ))i<j son Bernoulli independientes V ar( (fi , fj )) = p(1 p). En este contexto, es

de parmetro

p,

sencillo calcular

efecto, teniendo en cuenta la simetra de las variables

(fi , fj )

y que en el largo plazo suponemos que todos los perles fueron creados y por lo tanto escribimos (3.4) de la siguiente manera:

EN

1 = 2 N2 2 = N2
N

(fi , fj ) + N
i=1 j =i+1 N

(fi , fj ) +
i=1 j =i+1

1 , N

entonces

2 E (EN ) = N2 =

E ( (fi , fj )) +
i=1 j =i+1

1 N

2 N (N 1) 1 p+ 2 N 2 N N 1 1 = p+ p, cuando N , N N
N N

4 V ar(EN ) = N4 =

V ar( (fi , fj ))
i=1 j =i+1
(3.5)

4 N (N 1) p(1 p) N4 2 2(N 1) = p(1 p). N3


62

Distribucin asinttica de EN
Para hallar la distribucin asinttica de estadstico centrado

EN

estudiaremos la distribucin asinttica del

1 EN p = N =

i=1

1 N
N

( (fi , fj ) p)
j =1

1 2 N2 2 N2
N

( (fi , fj ) p) N (1 p)
i=1 ij N

=
Notando

( (fi , fj ) p)
i=1 ij N

1p . N

(3.6)

i = YN

1 N2

( (fi , fj ) p),
ij N

la expresin (3.6) resulta

EN p = 2
i=1
donde

i YN

1p , N

(3.7)

i { YN : i = 1, 2, . . . , N }

forma un arreglo triangular.

Teorema 3.2.1
condiciones i) Para cada ii) iii)

Si el arreglo triangular

i {YN : i = 1, 2, . . . , N }

verica las siguientes

i N N, {YN : i = 1, 2, . . . , N }

son independientes;

i E (YN ) 0,

cuando

N ;

s2 N =

N i=1

i V ar(YN ) < ;

iv) Existe

>0

tal que
i 2+ E [(YN ) ] < , para todo N y para todo i,

y se verica la condicin de Lyapunov, es decir,

L(N, ) =
entonces

1
s2+ N

N i 2+ ) ] 0, E [(YN i=1

cuando

N ,

(3.8)

1 sN

N i = N (0, 1), YN i=1 w

cuando

N .

(3.9)

63

Demostracin
La hiptesis i) se verica trivialmente, ya que para es independiente de

i=i

jo,

( (fi , fj ) p)
ij N

( (fi , fj ) p).
i j N

Adems,

i E ( YN ) =

1 E N2

( (fi , fj ) p)
ij N

= =

1 E (1 p) + ( (fi , fj ) p) N2 i<j N 1 1p + N2 N2 E ( (fi , fj ) p)


i<j N
cuando

1p 0, = N2
ya que

N ,

E ( (fi , fj ) p) = 0.
N

Por otro lado,

s2 N

=
i=1

V 1 N4 1 N4

i ar(YN )

=
i=1

V ar

1 N2

( (fi , fj ) p)
ij N

V ar (1 p) +
i=1 N i<j N

( (fi , fj ) p)

= =

V ar(( (fi , fj ) p))


i=1 i<j N
(3.10)

1 N (N 1) p(1 p) < . N4 2

Entonces se cumplen las hiptesis ii) y iii). Sea

= 2.

Veamos que se verica la hiptesis iv). Para esto, calcularemos

i 4 E [(YN )]

1 = E N8 = 1 E N8

( (fi , fj ) p)
ij N 4

( (fi , fj ) p) + (1 p)
i<j N

(3.11)

Introducimos las siguientes notaciones: 4

A=
i<j N

( (fi , fj ) p)

B = (1 p)4 ,

64

C=6
i<j N

( (fi , fj ) p)
3

(1 p)2 , (1 p),
y

D=4
i<j N

( (fi , fj ) p)

E=4
i<j N

( (fi , fj ) p) (1 p)3 ,

y expresamos (3.11) del siguiente modo:

i 4 E [(YN ) ]=
Luego,

1 E (A + B + C + D + E ) N8

(3.12)

E (A) =
i<j N 2 + C4

E [( (fi , fj ) p)4 ] + E [( (fi , fj ) p)2 ] E [( (fi , fk ) p)2 ]


i<j<kN

= (N i)(3p4 + 6p3 4p2 + p) + 3(N i)[(N i) 1] p2 (1 p)2 , E ( (fi , fj ) p) = 0 y por esto, los trminos ( (fi , fj ) p)3 ( (fi , fk ) p), los 2 trminos ( (fi , fj ) p) ( (fi , fk ) p) ( (fi , fl ) p) y los trminos ( (fi , fj ) p) ( (fi , fk ) p) ( (fi , fl ) p) ( (fi , fm ) p) en la expresin A tienen esperanza cero, si j = k = l = m.
pues

E (C ) = 6(1 p) E
i<j N

( (fi , fj ) p)

= 6(1 p)2 (N i) E [( (fi , fj ) p)2 ] = 6(N i) p(1 p)3 ,


pues la esperanza de los trminos en cero si

de la forma

( (fi , fj ) p) ( (fi , fk ) p)
3

es

j = k. E (D) = 4(1 p)E


i<j N

( (fi , fj ) p)

= 4(1 p) (N i)E ( (fi , fj ) p)3 = 4(1 p)(N i)(2p3 3p2 + p),


ya que con

( (fi , fj ) p)( (fi , fk ) p)2 y ( (fi , fj ) p)( (fi , fk ) p)( (fi , fl ) p), j = k = l, tienen esperanza cero. Finalmente, E (E ) = 4(1 p)3
i<j N
65

E ( (fi , fj ) p) = 0.

Por lo tanto,

i 4 )] = E [(YN

1 (N i)(3p4 + 6p3 4p2 + p) + 3(N i)[(N i) 1]p2 (1 p)2 + N8

+ (1 p)4 + 6(N i)p(1 p)3 + 4(N i)(1 p)(2p3 3p2 + p) 1 p + (1 p)4 (N i)Cp + (N i)[(N i) 1)]C N8 1 p N [(2i + 1)C p Cp ] + [(i2 + i)C p iCp ] + (1 p)4 = N 2C N8 N2 Cp < , para todo N y para todo i, (3.13) N8 4 3 2 3 3 2 2 2 con Cp = (3p + 6p 4p + p) + 6p(1 p) + 4(1 p)(2p 3p + p) = 11p (1 p) + p = 3p2 (1 p)2 . 6p(1 p)3 + 4p(1 p)2 + p(1 p) y C Entonces vemos que se verica la condicin de Lyapunov dada por (3.8) para = 2: = 1 L(N, 2) = 4 sN
N N i 4 E [(YN )] i=1

=
i=1 N

2 N3 (N 1) p(1 p) 4 N4 N2 Cp p2 (1 p)2 N 8

2 i 4 E [(YN )]

i=1

p 4 C 0+ , p2 (1 p)2 N

cuando

N .

En consecuencia, como se verican las hiptesis i) a iv) concluimos que

1 sN 2

N i YN = N (0, 1), i=1 N w


cuando

N .

Volviendo a la expresin del estadstico centrado

EN p

en funcin de

por (3.7) y a la expresin para sN dada por (3.10), tenemos que para N 2N 1 i grande EN p y que = . Luego, = 2 YN N 1 sN p(1p) N i=1

i YN dada i=1 sucentemente

1 sN
es decir,

N i YN = i=1

N (EN p)
1 2 NN p(1 p)

= N (0, 1),

cuando

N ,

N (EN p) = N (0, 2p(1 p)),


66

cuando

N .

(3.14)

Prueba de hiptesis para la TC


EN T C,
es un estimador de la probabilidad de comunicacin de los perles y, en el caso de hemos supuesto que esta probabilidad es la misma para todos los perles. Luego, si

tomamos distintas muestras de perles, bajo el supuesto de diferencias entre las estimaciones de

T C,

no deberamos detectar

basadas en muestras distintas.

Para estudiar este fenmeno proponemos una prueba de hiptesis para comparar la comunicacin promedio que existe dentro de poblaciones independientes, suponiendo Considerando dos muestras independientes de

T C.
y

perles

de

F , f1 , . . . , fN

g1 , . . . , gN ,

con

{f1 , . . . , fN } {g1 , . . . , gN } = , EN = 1 N
N

construimos los estadsticos

i=1

1 N

(fi , fj ) ,
j =1

(3.15)

donde

N (EN p) = N (0, 2p(1 p)),


EN

cuando

N ,

1 = N

i=1

1 N

(gi , gj ) ,
j =1

(3.16)

donde

p) = N (0, 2p(1 p)), N (EN

cuando

N . 2
de una distribucin estn ligadas, es

En general cuando la media decir, del

y la varianza

= () y adems () es derivable, existe una generalizacin del Teorema Central 1 Lmite cannico que consiste en tomar una funcin g () tal que g () = , es decir, ()
1 . Luego, el Teorema Central del Lmite cannico ()

una primitiva de

implica que

w n ) = n(X N (0, 2 ),

cuandoN

w n ) g ( ) = n g (X N 0, 2 ()g ()2 = N (0, 1),

cuando

N .

Si queremos entonces, realizar un test aproximado para comparacin de medias de dos poblaciones

independientes entre s con el mismo tipo de distribucin y de modo

que al tomar muestras de tamao grandes, la funcin

de las poblaciones, con

sucientemente

= ()

es la misma para ambas, la regin crtica a nivel

resulta

R = {|E | z/2 },
con

E=

mn m+n

m ) g (Y n ) g (X

, siendo

g (x) =

x 1 dt. 0 (t)

Volviendo a nuestro caso, como

= E (EN ) = E (EN ) = p (0, 1),


67

2 = V ar(EN ) = V ar(EN ) = 2p(1 p),


vemos que

= ()

()

es derivable. Entonces, tomando

g ( ) = g ()
verica que

2 arc sen( ),

g ( ) =

1 y por lo tanto () w
cuando

N (g (EN ) g (p)) = N (0, 2 (p) g (p)2 ) = N (0, 1),


y

N ,

(3.17)

N (g (EN ) g (p)) = N (0, 2 (p) g (p)2 ) = N (0, 1),

cuando

N .

(3.18)

En consecuencia, para realizar el test aproximado de comparacin de las comunicaciones promedio, el estadstico de la prueba suponiendo que se cumple la hiptesis de T C resulta N (g (EN ) g (p)) N (g (EN ) g (p)) = N (g (EN ) g (EN )) y, segn (3.17) y (3.18), w N (g (EN ) g (EN )) = N (0, 2), cuando N . (3.19) Luego, para un nivel de signicacin

contamos con la siguiente regin crtica

R =

N |g (EN ) g (EN )| z/2 . 2

Se realiz un experimento sobre una red de amigos de un perl real particular, tomando dos muestras independientes y disjuntas de tamao N = 75 y se obtuvo que EN = 0,69 y N = 0,57 y el valor del estadstico fue )| = 2,1. Por consiguiente a un EN |g (EN ) g (EN 2 nivel de signicacin

= 0,05

el test rechaza la hiptesis de

T C.

Este resultado estara indicando que la red social Facebook es una plataforma en la que la comunicacin entre las personas o grupos de personas no es transversal.

3.2.2. Desviacin media cuadrtica de la comunicacin entre perles


Presentamos ahora un estadstico que mide la desviacin promedio cuadrtica de la comunicacin entre perles con respecto a su media.

TN

1 = 2 CN 1 = 2 CN

i=1 j =i+1 N N

1 (fi , fj ) 2 CN
2

(fk , fl )
k=1 l=k+1 N N 2

i=1 N

1 (fi , fj ) 2 CN j =i+1
N N N

(fk , fl )
k=1 l=k+1

1 = 2 2 (CN )

i=1

( (fi , fj ) (fk , fl ))2 . 2 j =i+1 k=1 l=k+1


68

Distribucin asinttica de TN
Podemos ver que

TN

es un

U -estadstico

de orden 2 y ncleo

h(v (fi ), v (fk )) =


con

( (fi , fj ) (fk , fl ))2 , 2 (fk , fh )


hF
.

v (fi ) =

(fi , fh )

v (fk ) =

hF Adems, bajo el supuesto de

T C,

= E [h(v (fi ), v (fk ))] = =

1 E ( (fi , fj ) (fk , fl ))2 2

1 E [ (fi , fj )2 2 (fi , fj ) (fk , fl ) + (fk , fl )2 ] 2 1 = (p 2p2 + p) = p(1 p), 2

1 = Cov h(v (f1 ), v (f3 )); h(v (f1 ), v (f5 )) ( (f1 , f2 ) (f3 , f4 ))2 ( (f1 , f2 ) (f5 , f4 ))2 ; 2 2 2 ( (f1 , f2 ) (f5 , f4 ))2 ( (f1 , f2 ) (f3 , f4 )) = E 2 2 2 1 = p(1 p) (p(1 p))2 . 4 = Cov
Observemos que

p = 0,5. Sin embargo, a los efectos del modelo de Facebook con el que estamos tratando p = P ( (fi , fj ) = 1) es la probabilidad
si y slo si o de que dos perles cualesquiera sean amigos en el largo plazo, y este es un nmero entre 0 y 1, probablemente menor que 0,5 debido al gran tamao de la red completa. Luego, como

1 = 0

p = 0, p = 1

0 < 1 < ,
w

por el Teorema 3.1.4,

N (TN p(1 p)) = N 0, p(1 p) 4 (p(1 p))2 ,

cuando

N .

(3.20)

Si notamos

= p(1 p)

p(1 p) 4(p(1 p))2 ,

tenemos que

= ()

()

es

derivable. Luego, tomando

g () = arc sen(2 ), g ( ) =
1 y en consecuencia la expresin del lmite en ()

resulta que

g ( )

verica que

(3.20) equivale a

69

N g (TN ) g (p(1 p))

= N (0, 2 () g ()2 ) = N (0, 1),

cuando

N .

Prueba de hiptesis para la TC


Podemos tambin, realizar el test de

TC

comparando las desviaciones medias cuadrti-

cas para dos poblaciones independientes de perles, de manera similar a la comparacin de las comunicaciones promedio realizada en la subseccin anterior. Es decir, podemos tomar una muestra de que

N perles de F , g1 , . . . , gN , independiente {f1 , ..., fN } {g1 , ..., gN } = , construir el estadstico


TN

de la anterior

f1 , . . . , f N ,

tal

1 = 2 CN

i=1 j =i+1

1 (gi , gj ) 2 CN

(gk , gl )
k=1 l=k+1

y concluir que

N g (TN ) g (p(1 p))

= N (0, ()2 g ()2 ) = N (0, 1),

cuando

N .

Luego, el estadstico para la comparacin de las desviaciones medias cuadrticas

w N (g (TN ) g (TN )) = N (0, 2),


y la regin crtica a nivel de signicacin es

cuando

N .
utilizando este estadstico

para el test de

TC

R =

N |g (TN ) g (TN )| z/2 2

Del mismo modo que expusimos para el test de comparacin de la proporcin media de la comunicacin entre perles, hemos tomando el mismo perl particular real y calculado el estadstico y la regin crtica llegando a la conclusin de que se rechaza la hiptesis de

T C.

3.3. Transversalidad Segmentada


Hemos utilizado el supuesto de

TC

en Facebook para el modelado de la red social y la

obtencin de la distribucin asinttica de los estadsticos que presentamos en la seccin anterior propuestos para testear dicha hiptesis. Sin embargo, un contexto comunicacional como el de

TC

en una red social con ms de mil millones de usuarios est muy

alejado de la realidad, como lo demuestran las conclusiones de los dos test realizados. Es razonable pensar que los perles tienden a agruparse en segmentos de acuerdo a distintos

70

criterios sociales como ideologas polticas, intereses econmicos, gustos musicales, edades, deportes, etc, y que estos segmentos tambin se relacionen entre s. En esta Seccin, introducimos el concepto de Transversalidad Segmentada, (T S ), es de-

T C entre segmentos. En un contexto de estas caractersticas, lo que dejar de cumplirse es la homogeneidad del parmetro p de las variables aleatorias Bernoulli ( (f, g ))g f que
cir, representan la comunicacin entre perles pero se mantiene la independencia entre dichas variables. Podemos realizar una segmentacin a priori en la red considerando mentos distintos formando una particin de cribir a la matriz de amistad

S1 , . . . , Sk , k segy, reordenando los elementos de F , reesS1 , el segundo bloque a los que pertenez-

At

como una matriz de bloques, donde el primer bloque co-

rresponda a los perles que integran el segmento can a

S2 ,

y as sucesivamente. Luego de la segmentacin, podemos realizar un test de

TC

dentro de cada segmento como los que hemos visto en la seccin anterior y tambin

podemos construir un estadstico que represente la comunicacin entre pares de segmentos con el n de probar la hiptesis de

TC

entre los perles de dichos segmentos. Adems,

podemos estar interesados en medir la calidad en la segmentacin mediante ndices de performance adecuados. A continuacin detallamos estas ideas.

3.3.1.
Sea

TC

entre segmentos
una particin en segmentos de

S1 , . . . , Sk ,

y sea

ai =

card{Si } , card{F }

i = 1, 2, . . . , k .

k
Es claro que cada

ai = 1. i=1 Realizamos un muestreo estraticado al azar por segmentos, es decir, los perles
son elegidos al azar dentro del segmento

ai > 0,

f1 , . . . , f[a1 N ] f
k1

S1 , los perles f[a1 N ]+1 , . . . f[(a1 +a2 )N ] Sk ,


donde

son elegidos al azar dentro del segmento

S2 ,

y as sucesivamente hasta que los perles

,...,f
ai N +1

son elegidos al azar dentro de

[ x]

es la parte en-

ai N
i=1

i=1

tera de

x,

es decir

[x] = m ax{k N : k x},

para

x > 0.

Sean los conjuntos:

I1 = {1, . . . , [a1 N ]}, con card{I1 } = [a1 N ], I2 = {[a1 N ] + 1, . . . , [(a1 + a2 )N ]}, con card{I2 } = [(a1 + a2 )N ] [a1 N ],
. . .

k1

k 1

Ik =
i=1
Dados

ai N + 1 , . . . ,
i=1

ai N

con

card{Ik } =
i=1

ai N
i=1

ai N .

Sr y St , con r, t {1, . . . , k }, dos segmentos de la particin en k segmentos de F , para fi Sr y fj St , con i Ir , j It . Notaremos con qij a la probabilidad de que los perles fi y fj sean amigos, es decir, P ( (fi , fj ) = 1) = qij . Observemos que las funciones aleatorias de amistad (fi , fj ) siguen siendo variables
71

Bernoulli aunque el parmetro de su distribucin ahora depende de la intensidad con que se relacione el par de perles considerado. Sin embargo, puede ocurrir que dado un par de segmentos distintos haya homogeneidad en cuanto a la comunicacin entre los perles de un segmento y el otro. En este sentido, formulamos la siguiente denicin.

Denicin 3.7

Sr y St , decimos que existe T C entre ellos si dados fi Sr y fj St , con i Ir y j It , (fi , fj ) tiene distribucin Bernoulli de parmetro qrt , para todo fi Sr y para todo fj St .
Dados dos segmentos
Es decir,

TC

entre segmentos indica un comportamiento comunicacional homogneo

distintivo entre los mismos. A continuacin presentamos un estadstico que promedia la proporcin de amigos del segmento

St

que tienen los perles del segmento

Sr :
(3.21)

E (r, t) =

1 card{Ir }

iIr

1 (fi , fj ), card{It } j I
t

luego, si suponemos un contexto de

TC

entre

Sr

St ,

E (E (r, t)) = qrt ,


y

V ar(E (r, t)) =


y el estadstico (3.21) centrado queda

qrt (1 qrt ) , card{Ir } card{It }

E (r, t) qrt =
iIr
Por lo tanto, notando

1 (fi , fj ) qrt . card{Ir } j I card{It }


t

(3.22)

i Ycard {Ir } =

1 (fi , fj ) qrt card{Ir } j I card{It }


t

resulta que

r 1 Ycard {Ir } , . . . , Ycard{Ir }

card{I }

es un arreglo triangular que verica las hiptesis del

Teorema 3.2.1. En consecuencia,

1 scard{Ir }
con

i N (0, 1), Ycard {Ir } = iIr

cuando

N ,

s2 card{Ir } =

iIr

i V ar(Ycard {Ir } ) =

qrt (1qrt ) . Es decir, card{Ir } card{It } w

card{Ir } card{It } (E (r, t) qrt ) = N (0, qrt (1 qrt )),


72

cuando

N .

(3.23)

Luego, podemos realizar una prueba de hiptesis para la existencia de tre un par de segmentos de una particin de

TC

en-

F .

El procedimiento para obtener

la regin crtica es anlogo al que utilizamos en la Seccin anterior, esto es, se realiza otro muestreo estraticado al azar por segmentos, independiente del anterior

g1 , . . . , g[a1 N ] son elegidos al azar dentro del segmento S1 con {g1 , . . . , g[a1 N ] } {f1 , . . . , f[a1 N ] } = , los perles g[a1 N ]+1 , . . . g[(a1 +a2 )N ] son elegidos al azar dentro S2 con {f[a1 N ]+1 , . . . f[(a1 +a2 )N ] } {g[a1 N ]+1 , . . . g[(a1 +a2 )N ] } = , y as sucesivamente hasta que los perles g k1 ,...,g k son elegidos al azar dentro de
en el cual los perles

ai N +1
i=1 i=1

ai N

Sk

con

k 1

,...,f
ai N +1

g
ai N

k1

,...,g
ai N +1

= .
ai N

i=1

i=1

i=1

i=1

Luego, para el par de segmentos

Sr

St ,

con

r, t {1, . . . , k },

el estadstico (3.24)

E (r, t) =
bajo

1 card{Ir }

i Ir

1 (gi , gj ), card{It } j I
t

qrt (1qrt ) y al igual card{Ir } card{It } que para el estadstico centrado de la expresin (3.22) obtenemos la distribucin asinttica de E (r, t) qrt , cuando N :

TC

entre

Sr

St ,

tiene

E (E (r, t)) = qrt

V ar(E (r, t)) =

card{Ir } card{It } (E (r, t) qrt ) = N (0, qrt (1 qrt )),


Como los estadsticos

cuando

N .

(3.25)

E (r, t) y E (r, t) verican que la varianza es funcin de la espe ranza , es decir, () = (1 ), con = qrt , tomando g () = 2 arc sen( ), se cumple 1 y, procediendo en forma anloga que en la Seccin anterior, podemos que g () = ()
concluir que

card{Ir } card{It } (g (E (r, t) g (E (r, t)))) = N (0, 2),


y la regin crtica para probar en ambos segmentos es

cuando

N ,

TC

a nivel de signicacin

entre los perles involucrados

R =

card{Ir } card{It } |g (E (r, t) g (E (r, t)))| z 2 2 TC

. Sr
y

Luego, si el test nos conduce al rechazo de la hiptesis de

entre los segmentos

St ,

podemos concluir con una probabilidad de error

que dichos segmentos no tienen un

comportamiento comunicacional homogneo distintivo.

3.3.2. Calidad en la segmentacin


Contando con el test de dividido a la red en

TC

entre segmentos que acabamos de exponer, si hemos

segmentos disjuntos, podemos tomar todos los posibles pares de

73

segmentos de esos

segmentos,

2 2 Ck , y realizar una cantidad Ck

de test, uno para cada par

y probar si los segmentos que componen el par tienen un comportamiento comunicacional 2 homogneo distintivo o no. Estos Ck test pueden representarse en una matriz binaria simtrica de orden

k, S ,

en la que cada elemento

Sij

es cero si los segmentos

Si

Sj

no

tuvieron homogeneidad en cuanto a la comunicacin, esto es, si el test correspondiente rechaza la hiptesis de

TC

y, en caso contrario, indicamos con un uno al elemento

Sij .

Luego, si notamos al cardinal del conjunto de unos en la subdiagonal de

como

g (d) = card{1 s en SD(S )},


podemos denir el siguiente ndice de performance de utilidad para medir la Calidad en la Segmentacin:

Cp =
Si tomamos

g (d) 100 %. 2 Ck k
segmentos, con

(3.26)

un nmero sucientei mente grande, podemos calcular para cada segmentacin el ndice denido en (3.26), Cp , con

segmentaciones al azar de

i = 1 , . . . , m,

y visualizar el histograma que representa la distribucin de la Cali-

dad en la Segmentacin. Si para la mayora de las segmentaciones esta medida result, por ejemplo, mayor que la media de las observaciones, continuamos segmentando segn el criterio que se vena utilizando, caso contrario es conveniente modicar el criterio de segmentacin.

74

Captulo 4 Conectividad y Teora de Mundo Pequeo


En este Captulo tratamos el fenmeno de mundo pequeo y su viabilidad en los distintos contextos comunicacionales que se pueden presentar en la red social Facebook, es decir, en los contextos de

TC

y distintos tipos de segmentacin. En la primera Sec-

cin, proporcionamos una sntesis de los estudios y experimentos ms relevantes que se realizaron para abordar el problema. Con el objetivo de analizar el fenmeno mencionado, en la segunda Seccin introducimos un estadstico de utilidad en la medicin de la conectividad entre los usuarios y estudiamos su distribucin asinttica en el contexto particular de

T C,

cuando el tamao de la muestra es sucientemente grande. Otra forma de

evaluar la conectividad consiste en el clculo de las distancias entre pares de perles que componen la red y para ello, en la tercera Seccin damos una denicin formal del grado medio de separacin entre dos perles y, segn el contexto, podremos calcularlo y realizar el anlisis. La ltima Seccin, se reere a conclusiones y planteos futuros sobre el tema.

4.1. Redes mundo pequeo


4.1.1. El fenmeno de mundo pequeo
El estudio de las redes de mundo pequeo, de amplia repercusin tanto en el campo de las ingenieras telemtica e informtica como en otras reas de las ciencias sociales y la naturaleza, ha permitido entre otros logros esclarecer la dinmica de propagacin de virus (biolgicos o virtuales) como as tambin la reduccin del planeta en materia de vnculos o la posibilidad de disminuir el dimetro de las grandes redes telemticas. Una red social presenta el fenmeno de mundo pequeo si, en trminos generales, dos individuos cualesquiera en la red pueden ser conectados a travs de una cadena corta de intermediarios.

75

La medicin de este fenmeno en una red es sencilla, consiste en hallar las distancias entre pares de vrtices que la componen y calcular su distancia media. Uno de los mtodos ms conocidos es el de la bsqueda de anchura. En una red social, una distancia de un grado es la que conecta a un individuo con un amigo o conocido, la relacin es directa y sin intermediarios. Una distancia de dos grados, conecta a un individuo con un amigo de su amigo; una de tres, a un individuo con el amigo del amigo del amigo, y as sucesivamente. En particular, la teora de los Seis Grados de Separacin conjetura que cualquier persona puede estar conectada con cualquier otra, a travs de una cadena de no ms de cinco intermediarios en promedio que se conocen mutuamente dos a dos, conectando a ambas personas con slo seis enlaces o saltos.

4.1.2. Origen y experimentos


La idea del fenmeno de mundo pequeo fue planteada por primera vez en los aos 20 por el escritor hngaro Frigyes Karinthy y convertido en un problema de investigacin en los aos 50 por el matemtico austraco Manfred Kochen (1928-1989), el socilogo estadounidense Ithiel de Sola Pool (1917-1984) y el psiclogo social estadounidense Stanley Milgram (1933-1984). A principios de los 50, Kochen M. y Pool, I. [39] escriben un manuscrito que circul por ms de 20 aos entre los investigadores antes de ser publicado en 1978. El trabajo articula formalmente la mecnica de las redes sociales, y explora sus consecuencias matemticas (incluyendo sus grados de conectividad), adems de dejar el interrogante sobre el nmero de grados de separacin en las redes sociales reales. En 1967, Stanley Milgram inici un experimento en la Universidad de Harvard en Cambridge, Massachussets, orientado a profundizar en los planteos de Kochen y Pool. Su trabajo Small World Phenomenon [35] es una de las publicaciones cientcas ms citadas en el estudio de las redes sociales. Su idea fue conocer la probabilidad de que dos personas al azar estn conectadas a travs de conocidos comunes. El experimento consisti en enviar una carta a una muestra al azar de personas de una ciudad de Estados Unidos, solicitndoles a cada una de ellas remitirla a cierta persona objetivo. El destinatario tambin fue elegido al azar pero resida en otra ciudad, por lo que era de esperar que entre los emisores y receptores no hubiera relacin. Los participantes tenan cierta informacin sobre el destinatario, aunque no podan enviar la carta directamente a la persona objetivo, sino que deban enviarla a un amigo o conocido con mayor probabilidad de conocerla. De este modo, se fueron generando cadenas de intermediarios que permitieron el anlisis de ciertas propiedades de la estructura social. La experiencia arroj un promedio de cinco intermediarios antes de alcanzar el destino nal, lo que signica una distancia nal igual a seis, por lo que los investigadores concluyeron que la poblacin de Estados Unidos estaba separada por seis grados o saltos

76

en promedio. Por otra parte, prcticamente la mitad de las cadenas llegaron a su destino (en el ltimo paso) a travs de las mismas tres personas, por lo que pudo demostrarse la presencia de una red de relaciones densa, y que la cadena de intermediarios para contactar a dos personas cualesquiera era relativamente corta. Posteriormente Milgram reanud el experimento con una modicacin, el destinatario y el emisor fueron elegidos entre miembros de distintas comunidades raciales, con la intuicin de que el trayecto se alargara. No obstante, la distancia media fue otra vez igual a seis dando pie a la hiptesis de los Seis Grados de Separacin. Aunque Milgram nunca utiliz esta frase, la misma se populariz a raz de su uso por parte del dramaturgo americano John Guare J. [25], en su libro Six Degrees of Separation publicado en 1990. Los resultados obtenidos por Milgram muestran las propiedades de las redes de mundo pequeo que luego son formalizadas por Watts D. y Strogatz S. en 1998 [46], quienes argumentan que se trata de una estructura que puede representarse con un grafo caracterizado por un alto agrupamiento y una corta distancia promedio, justicando que el universo social estara constituido por conglomerados de individuos altamente interconectados entre s, pero que no llegan a conformar islas separadas, en la medida en que se enlazan a travs de vrtices que disminuyen considerablemente la distancia geodsica promedio. Para analizar el fenmeno de mundo pequeo, partieron de redes regulares donde cada vrtice tena el mismo nmero de enlaces, como puede observarse en la Figura 4.1, distribuyendo los vrtices sobre un crculo y unindolos con los ms prximos tanto por la derecha como por la izquierda. Estos grafos, presentan un alto grado de agrupamiento y un dimetro elevado. Luego, a estas redes les fueron aplicando alteraciones en forma sucesiva hasta convertirlas en redes aleatorias, con bajo agrupamiento y dimetro reducido como en la Figura 4.3, llegando a la conclusin de que las redes de mundo pequeo, es decir, redes con un dimetro pequeo y un agrupamiento alto ocupaban un lugar en medio del espectro entre las redes regulares y las redes aleatorias, como puede verse en la Figura 4.2.

Figura 4.1

Figura 4.2

Figura 4.3

Entre los ejemplos de redes de mundo pequeo encontramos, en el universo del cine, el llamado juego de Bacon que consiste en determinar la distancia de cualquier actor a Kevin Bacon. Se sospecha que ningn actor de Hollywood tiene distancia a Bacon mayor a seis.

77

La comunidad matemtica, por ejemplo, cuenta con un epicentro: el matemtico hngaro Paul Erds. La produccin de Erds es tan grande, computada en el nmero de publicaciones, que en la literatura se habla de la distancia a Erds. Un matemtico tiene distancia a Erds 1 si ha publicado un artculo en colaboracin con l, distancia 2 si ha publicado con un matemtico a distancia Erds 1, y as sucesivamente. Entre otros ejemplos de redes de mundo pequeo, encontramos el mapa de propagacin de epidemias de un rea geogrca o la red de suministro de una compaa elctrica. Cualquiera de las redes descriptas anteriormente puede ser representada por un grafo simple, es decir un grafo sin bucles ni aristas paralelas. As, en el llamado grafo de colaboracin de Erds, los vrtices designan matemticos y las aristas, las colaboraciones. Igualmente puede esbozarse un grafo descriptivo de la sociedad de actores, indicando las aristas como intervenciones en un mismo lm. El mundo puede ser representado por un grafo con pautas de regularidad. As, para un individuo dado puede aproximarse, dentro de su crculo de amistades, un dominio de cien personas. Si cada uno de estos individuos conoce a cien personas y volvemos a multiplicar por cien tendremos, despus de una cadena de seis eslabones, un nmero de personas igual a cien a la sexta, es decir, un billn, nmero que abarca la supercie entera del planeta. Sin embargo, en la realidad, los amigos de nuestros amigos suelen ser nuestros amigos, o al menos caer en el crculo de nuestros allegados, de tal manera que la cadena no se multiplica cada vez por cien sino por un factor ms pequeo. Por otro lado, el crculo puede encerrar saltos a zonas remotas, en el sentido de amistades poco probables. Existen mltiples detractores de la Teora de Mundo Pequeo, considerndola nicamente como el reejo del dicho popular de que el mundo es un pauelo. No obstante, sta s podra tener plena validez aplicada a poblaciones con ciertos rasgos o patrones bsicos comunes: de comportamiento, indicadores sociodemogrcos o perles descriptivos, acotando la teora a un escenario posible y plausible.

4.1.3. Mundo pequeo y Facebook


Un estudio realizado en Estados Unidos en el ao 2011 por Ugander J., Karrer B., Backstrom L. y Marlow C. [44] analiz el fenmeno de mundo pequeo en Facebook. Por primera vez, la distancia entre individuos de todo el mundo se ha podido medir a partir de datos del mundo real provenientes de una enorme poblacin, ya que al momento del estudio, Facebook contaba con 720 millones de usuarios activos (ms del 10 por ciento de la poblacin mundial) y con 69 mil millones de amistades entre ellos. En dicho estudio, se midi en primer lugar el nmero de amigos que tena cada usuario y se encontr que esta distribucin difera signicativamente de los estudios previos realizados sobre redes sociales a gran escala. Luego se mostr que dos usuarios de Facebook elegidos al azar de cualquier parte del mundo estaran separados por una distancia media

78

de 4.7 grados o relaciones, poco ms de tres individuos. Si se consideraban slo los usuarios de un mismo pas la distancia era menor (3 grados). Este hallazgo fue signicativo ya que disminuy la distancia tradicional de seis pasos hallada por Milgram en los aos 50, posteriormente un fenmeno universal. Adems, pudo observarse que los amigos de un usuario eran ms propensos a ser de la misma edad y proceder del mismo pas. En la Figura 4.4 podemos ver la distribucin acumulada del grado que muestra en el eje de absisas el nmero de amigos y en el de ordenadas el porcentaje de personas que tiene menos de un determinado nmero de amigos.

Figura 4.4 Se observ que slo el 10 por ciento de la poblacin tena menos de 10 amigos, el 20 por ciento menos de 25, mientras que el 50 por ciento tena ms de 100. Adems se obtuvo que la distribucin era sesgada y que el nmero promedio de amigos por usuario era de 190. Un importante hallazgo en este estudio fue sin embargo que la distribucin no era tan sesgada como sugeran estudios anteriores sobre redes sociales. En consecuencia, los autores concluyen que Facebook es a la vez una red social global y local, conecta a gente que est apartada pero tambin tiene una estructura local densa como vemos en las pequeas comunidades. Ha crecido rpidamente en estos ltimos aos, representando una proporcin cada vez mayor de la poblacin mundial y por lo tanto el mundo se ha vuelto ms conectado.

4.2. Ciclos y conectividad en muestras de perles de Facebook de gran tamao


En esta Seccin, presentamos un estimador de utilidad para analizar el nivel de conectividad en la red social Facebook. Hemos visto que cualquier red social puede ser modelada por un grafo donde los vrtices son los actores y las relaciones que los conectan estn representadas por las aristas. En particular, Facebook puede representarse por un grafo cuyos vrtices son los perles y las relaciones de amistad, las aristas. Luego, para poder analizar la conectividad entre los perles, y por lo tanto el fenmeno de mundo pequeo en

79

la red, resulta de utilidad estimar la proporcin de ciclos de cierta longitud que se presentan en muestras de perles, como as tambin estudiar la distribucin asinttica de dicho estimador cuando el tamao de la muestra tiende a innito, lo cual implica considerar a todos los perles creados en la red.

AN = (ij )i,j {1,...,N } la matriz de amistad que corresponde a una muestra de N perles de F , con ij := (fi , fj ). Vimos que bajo la hiptesis de T C , ij tiene distribucin Bernoulli de parmetro p. Para r = 1, 2, . . . , N 1, sea
Sea

C=

i = (i1 , . . . , ir ) :
l=1

il il+1 = 1, con i1 , . . . , ir {1, . . . , N }, ir+1 := i1 r y, utilizando i1 , . . . , ir {1, . . . , N },


N N

el conjunto de caminos que forman ciclos de longitud para la suma sobre cada uno de los ndices

la siguiente notacin

:=
i1 ,i2 ,...,ir =1
sea

i1 =1

,
ir =1

TN (r) =

1 Nr

i1 i2 i2 i3 . . . ir i1 ,
i1 ,i2 ,...,ir =1

(4.1)

la proporcin de ciclos de longitud Luego, dada una muestra de

en una muestra de perles de tamao

perles, el cardinal del conjunto indica card {C } su proporcin. Por lo tanto, el nmero de ciclos que se producen en esa muestra y Nr mediante esta cantidad podremos inferir acerca del nivel de conectividad existente en la muestra de perles. Por ejemplo, si para un valor de r grande en relacin a N obtenemos card {C } un valor pequeo de , este resultado estara indicando un nivel de conectividad Nr bajo en la red. Hallaremos, suponiendo un conexto de de ciclos de longitud

N. C , card {C },

T C , la distribucin asinttica de la proporcin

en muestras de perles sucientemente grandes. Para ello, uti-

lizaremos elementos de la teora de matrices aleatorias y grafos aleatorios basndonos en Domnguez Molina, J. y Rocha Arteaga, A. [18] y Diestel, R. [17], como as tambin los resultados obtenidos por Wigner E. P.

([52], [51]), Girko V. L. [23] y Sinai Ya. y Soshnikov

A.[42] sobre la traza de potencias de matrices aleatorias.

4.2.1. Elementos de la teora de grafos


En el primer Captulo hemos presentado algunos conceptos sobre la teora de grafos que ahora ampliaremos debido a su utilidad como herramienta en las demostraciones que siguen.

80

Representamos a un grafo junto de vrtices y

como un par ordenado

E (G)

el conjunto de aristas,

(V (G), E (G)), con V (G) el consiendo card{V (G)} y card{E (G)} los

cardinales de los respectivos conjuntos. Enunciamos el siguiente lema cuya demostracin puede verse en el trabajo de Bondy Z. y Murty U. [6].

Lema 4.2.1

Si

G = (V (G), E (G))

es un grafo conexo entonces

card{V (G)} card{E (G)} + 1.


Adems,

card{V (G)} = card{E (G)} + 1

si y slo si

es rbol.

Es decir, los grafos conexos no pueden tener ms vrtices que aristas y, si el grafo conexo es rbol, el nmero de vrtices supera en uno al nmero de aristas. Un rbol con raz es un rbol al que se le ha especicado un vrtice al que llamaremos

raz y un rbol orientado con raz es un rbol con raz inmerso en un plano, cuyo contorno
se recorre sobre el plano siempre en un mismo sentido previamente convenido, de la siguiente manera: el recorrido inicia y termina en la raz, al trmino del recorrido se recorre la misma cantidad de aristas de ida que de vuelta y en cada paso del recorrido no se tienen ms aristas recorridas de vuelta que de ida. La siguiente proposicin, cuya demostracin puede verse en el Captulo 6 de Koshy, T.

[29], es de especial relevancia para la demostracin de uno de los teoremas ms importantes


utilizados en este Captulo.

Proposicin 4.1

El nmero de rboles orientados con raz que se pueden formar con

aristas coincide con el

k -simo

nmero de Catalan

Ck =
con
k C2 k =

1 k C2 , k = 1, 2, ..., k+1 k

(2k)! , el nmero de subconjuntos con k elementos tomados de un conjunto con k! k! 2k elementos.


Es decir, los nmeros de Catalan cuentan el total de rboles orientados con raz que se pueden formar con un nmero jo de aristas. A cada grafo dirigido

G se le asocia un grafo con el mismo conjunto de vrtices simpleG.


Un grafo dirigido es conexo si

mente reemplazando cada arista dirigida por una arista con los mismos extremos. A este grafo se lo denomina grafo subyacente del grafo dirigido y slo si su grafo subyacente es conexo. El esqueleto del grafo dirigido al eliminar las aristas paralelas.

es el grafo que se obtiene del grafo subyacente de

81

4.2.2. Distribucin asinttica de la traza de potencias de matrices de Wigner


Uno de los principales objetivos de la teora de matrices aleatorias es el estudio de la convergencia de la distribucin espectral emprica de ciertas matrices aleatorias cuadradas cuando su dimensin tiende a innito.

AN 1 , . . . , N ,
Sea

una matriz aleatoria simtrica de orden

y las variables aleatorias reales

sus autovalores. La funcin de distribucin espectral emprica de

AN ,

FAN () =

1 N

card

{i : i = 1, . . . , N }, R,

(4.2)

es una funcin de distribucin aleatoria que representa la proporcin de autovalores de

AN

menores o iguales que En 1958, Wigner E.

. [52]

introdujo los clsicos conjuntos de matrices aleatorias

AN = (Aij )i,j {1,...,N } , comunmente llamadas matrices matrices reales y simtricas de orden N , Aij = Aji =
i)

de Wigner. Las componentes de las ij , son tales que: N

{ij }1ij N

son variables aleatorias independientes;

ii) Las leyes de distribucin para iii) Cada momento


de

ij

son simtricas; con

r E [ij ]

existe y

r Cr , E ij

Cr

una constante que depende slo

r; ij
son iguales a

iv) Los segundos momentos de


acotados si

1 si 4

i < j,

y estn uniformemente

i = j.
La condicin ii) implica que todos los momentos de orden impar se

Observacin 4.2
anulan.

AN , FAN (), Wigner ([52], [51]) prob convergencia en probabilidad de los momentos de FAN () a los momentos
Estudiando la funcin de distribucin espectral emprica de de la funcin de distribucin no aleatoria

2 F () =

siendo

1 x2

1 I[1,1] (x)

dx,

(4.3)

F ()

la funcin de distribucin del semicrculo. Su trabajo estuvo motivado en la

mecnica cuntica, donde logr explicar el comportamiento estadstico de los niveles de energa de un sistema fsico en trminos de los autovalores cuando la dimensin de las matrices es grande.

82

Por un lado, los momentos de la distribucin espectral emprica verican que

dFAN () =
j =1

(j )r [FAN (j ) FAN (j )] 1 N
N

(j )r
j =1

(4.4)

1 = tr(Ar N ), N
para

r = 0, 1, 2, . . . ,

donde

tr(Ar N)

es la traza de la potencia

Por otro lado la funcin de distribucin del semicrculo est nicamente determinada por sus momentos

r-sima de la matriz AN . F () tiene soporte acotado

dF () =

con

1 2

1 I[1,1] ()

d,

si si

r = 2s,
(4.5)

0, r
2

r = 2s + 1,
1 s+1 s C2 s
los nmeros

s = 0, 1, 2, . . . , y

1 2

1 I[1,1] ()

d = Cs , siendo Cs =

de Catalan. Observemos que los momentos impares de cin. Lo que Wigner

F () son cero por la simetra de la distribu-

([52], [51])

prueba entonces es que

1 Pr tr(Ar N ) r := N
cuando

Cs ( 1 )s , 4 0,

si si

r = 2s, r = 2s + 1,

(4.6)

N . ([2], [23])
prueban

Ms tarde, bajo condiciones ms generales Arnold L. y Girko V. L. convergencia casi segura en (4.6), es decir,

1 cs tr(Ar N ) r , N
cuando

(4.7)

y a esto se lo llam la Ley del Semicrculo de Wigner.

Existen varias versiones de este resultado, dependiendo de las condiciones que se consideren sobre las matrices aleatorias. Dominguez Molina J. y Rocha Arteaga A. (4.7) probando para esto que

[18]

dan una demostracin detallada de

1 tr(Ar N ) r , N
83

(4.8)

cuando

N ,

utilizando el enfoque combinatorio de grafos. Argumentan que la clave

es que la traza presenta una estructura cclica que permite asociarle grafos conexos, de manera que al tomar lmite en (4.8), quedarn slo aquellos grafos conexos correspondientes a los rboles orientados con raz que se pueden formar con coincide con el

aristas, y esta cantidad

r-simo nmero de Catalan Cr . Segn Girko V. L [23] debido a la fuerte correlacin entre autovalores, las uctuaciones r i r
son del orden de

1 N

N i=1

1 y N

r r tr(Ar N ) E (tr (AN )) N 0, V ar (tr (AN )) ,

(4.9)

N , con r jo, pudindose hallar una expresin explcita para la V ar(tr(Ar N )) que depender del segundo y el cuarto momento de ij . En 1998, Sinai Ya. y Soshnikov A. [42] demuestran el siguiente teorema que extiende los resultados anteriores al caso de potencias r -simas de AN , que crecen con N .
cuando

Teorema 4.2.2

Consideremos los conjuntos de matrices aleatorias simtricas de Wigner

que verican las condiciones i) a iv) antes enunciadas, con el supuesto adicional de que
2k E (ij ) (C.k )k ,

uniformemente en

i,j

esto que los momentos

1 << r <<

k , con k = 1, 2, . . . y C una de ij crecen pero no ms rpido


1 N s3/2

constante positiva, signicando que los gaussianos. Entonces si

N, E (tr(Ar N )) = (1 + o(1)),
si si

r = 2s, r = 2s + 1

0,

(4.10)

y
r tr(Ar N ) E (tr (AN )) N 0, w

1 ,

(4.11)

cuando

N .
Sinai Ya. y Soshnikov A. [42] remarcan que la tcnica que utilizan para

Observacin 4.3
variables aleatorias

la demostracin de este resultado puede ser modicada para extender el mismo al caso de

ij , i j , no necesariamente simtricamente distribuidas, imponiendo


k E (ij ) (C.k )k ,

la siguiente condicin:
(4.12)

con

k = 1, 2, . . .

una constante positiva.

84

4.2.3. Convergencia dbil del estadstico TN (r)


Nuestro objetivo ahora consiste en obtener la distribucin asinttica de

1 TN (r) = r N
en el contexto de

i1 i2 i2 i3 . . . ir i1 ,
i1 ,i2 ,...,ir =1

(4.13)

T C.

Para ello, nos sern de utilidad los resultados presentados sobre la

distribucin asinttica de la traza de potencias de matrices de Wigner. Considerando la regla del producto de dos matrices N-compatibles

D,

(CD)ij =
k=1

Cik Dkj , N
cualquiera

podemos expresar a la traza de la r-sima potencia de una matriz de orden

AN

como:

N 1 Ai1 i2 Ar i2 i1

tr(Ar N)

=
i1 =1

Ar i 1 i1

=
i1 ,i2 =1

= =
i1 ,...,ir =1

Ai1 i2 Ai2 i3 . . . Air i1 .

Sea el estadstico

1 TN (r) = r N
con

i1 i2 i2 i3 . . . ir i1 ,
i1 ,i2 ,...,ir =1

(4.14)

las funciones aleatorias de amistad centradas, es decir ij := ij p. ij ij , podemos hallar la distribucin asintLuego, tomando Aij = , con ij = N 2 p(1p)

ij

tica de

TN (r).
Supongamos que

Teorema 4.2.3

ij

verica las condiciones i), iii) y iv) enunciadas en

la subseccin anterior, con el supuesto adicional de que


r E (ij ) (C.r)r ,
(4.15)

para

r = 1, 2, . . . , N 1 TN (r) N
w

una constante positiva. Entonces, si


r

1 << r << N ,
(4.16)

p(1 p) N

E (tr(Ar N )), 4 1 0,
N (r )3/2 2

p(1 p) N r r

V ar(tr(Ar N )) ,
par, impar,

cuando

N ,

con

E (tr(Ar N )) N .

(1 + o(1)),

cuando

V ar(tr(Ar N ))

1 , cuando

85

Demostracin
i)

{ij }1ij N

son variables aleatorias independientes, ya que las variables

{ij }1ij N = Cr ,

son independientes;

iii) Cada momento


con

r E (i,j ) =

(1p)(p)r +p(1p)r 2r

p(1p)

existe y

r E ( ij )

2r

1 p(1p)

Cr

una constante que depende slo de

r;
1 si 4

iv) Los segundos momentos de


Adems, para

ij

son iguales a

i < j,

y si

2 i = j , E (ii )= 1 ( 1 1). 4 p

r = 1, 2, . . . , N 1,
r E (ij )

|(1)r pr (1 p)|
r

+ 2r
r

|p(1 p)r |
r

2r 1 2 <

p(1 p) 1 2 p(1 p) 1
r

p(1 p)
(4.17)

2 p(1 p)

.r

= (C.r)r , C > 0.
Luego, si

1 << r <<

N,

por el Teorema 4.2.2

r r tr(Ar N ) N E (tr (AN )), V ar (tr (AN )) ,


cuando

(4.18)

N ,

siendo

tr(Ar N)

1 = ( N )r

i1 i2 i2 i3 . . . ir i1
i1 ,i2 ,...,ir =1

1 = ( N )r 2r = 1 ( N )r 2r

1
r

p(1 p) 1 p(1 p)

i1 i2 i2 i3 . . . ir i1
i1 ,i2 ,...,ir =1 r

(4.19)

rN

TN (r).

Observemos que (4.17) es la condicin necesaria para extender la demostracin que realiza Sinai Ya. y Soshnikov A.

[42]

al caso de variables aleatorias cuyas leyes no son

necesariamente simtricas como es el caso de Por lo tanto,

ij ,

segn indica la frmula (4.12).

TN (r) N

p(1 p) N

E (tr(Ar N )),
86

p(1 p) 4 N

V ar(tr(Ar N )) ,

r
cuando

N ,

ya que

TN (r) =

p(1p) N

tr(Ar N ).
y

Para estudiar el comportamiento de

E (tr(Ar N ))

V ar(tr(Ar N ))

cuando

dare-

mos la idea de la demostracin que puede verse en detalle en el trabajo de Domnguez Molina J. y Rocha Arteaga A. [18]. En efecto, sea Luego,

i := (i1 , . . . , ir ) {1, . . . , N }r , ir+1 := i1 1 1 E (tr(Ar r N )) = N N 2 +1 2r 1


r

Q(i) := E (i1 i2 i2 i3 . . . ir i1 ).

Q(i).
i

(4.20)

p(1 p)

Identicamos cada ndice

i := (i1 , . . . , ir ) de la suma anterior con un grafo conexo dirigido G(i) = (V (i), E (i)),

con

V (i) = {i1 , . . . , ir }
Luego, a cada grafo

el conjunto de vrtices y

E (i) = {(i1 , i2 ), . . . , (ir , i1 )}

el conjunto

de aristas dirigidas.

G(i)

le asociamos su esqueleto

G(i) = (V (i), E (i)),


que corresponde al grafo subyacente de

G(i)

sin aristas paralelas.

Descomponemos (4.20) segn el nmero de vrtices que tienen los esqueletos correspondientes a los grafos

G(i)

G(i)

1 N
r +1 2

Q(i)
r i

= Q(i)
r

(4.21)

2r 1
r +1 2

p(1 p) +
G(i) card{V (i)}[ r +2 2]

Q(i)
r

G(i) 1card{V (i)}[ r +1 2]

2r

p(1 p)

2r

p(1 p)

El segundo sumando es igual a cero, ya que la suma se realiza sobre los ndices de grafos que tienen aristas que no son paralelas a ninguna otra y por lo tanto

Q(i) = E (il il+1 )E (i1 i2 . . . il1 il il+1 il+2 . . . ir i1 ) = 0.


Entonces la expresin (4.20) se reduce a

1 1 E (tr(Ar r N )) = N N 2 +1

Q(i)
r G(i) 1card{V (i)}[ r +1 2]
87

2r

p(1 p)

y en consecuencia,

1 1 E (tr(Ar r N )) N N 2 +1

|Q(i)|
G(i) +1 1card{V (i)}[ r 2]

r.

(4.22)

2r

p(1 p)
r

r Por hiptesis, de la desigualdad (4.17) tenemos que |E (ij )|

1 .r 2 p(1p)

, es decir,

2r

r )| |E (ij

r
r

p(1p)

1 .r p(1p)

, por lo que reemplazando en (4.22)

1 E (tr(Ar N )) N

1 N 2 +1
r

1
G(i) 1card{V (i)}[ r +1 2] +1 [r 2]

2 p(1 p)

.r

1 N 2 +1 1 N 2 +1
1 y 2
r r

1
G(i) card{V (i)}=j

j =1

p(1 p) 1 2

.r
r

Luego, si

r +1 2

r N [ 2 ]+1

p(1 p)

.r

es impar,

r 2

r 2

r 1 (2 +2 ) 1 E (tr(Ar )) N N N
cuando

1 2 p(1 p)

.r

0,

N . r
es par,

r r 2

Por otro lado, cuando descomponemos

r y 2

1 E (tr(Ar N )) N

r (2

+ 1)

1 .r 2 p(1p)

. Si

1 E (tr(Ar N )) de la siguiente manera N

1 E (tr(Ar N )) = S1 + S2 , N
con

S1 =

1 r N 2 +1

G(i) 1card{V (i)} r 2

2r (

Q(i)

p(1p))r

S2 =
r

1 r N 2 +1

G(i) card{V (i)}= r +1 2

2r (

Q(i)

p(1p))r

podemos deducir que comportamiento de

|S1 |

r N2 2Nr 2 +1

1 .r p(1p)

0,

cuando

y estudiar el

S2 . En efecto, si card{V (i)} = r card {E (i)} > 2 , Q(i) es cero,

r r + 1, por el Lema 4.2.1 card{E (i)} 2 . Por un lado, si 2 ya que en este caso E (i) tendra por lo menos una arista
88

que no es paralela a ninguna otra. Por otro lado, si

G(i)
2r (

es rbol y a cada arista de

E (i)
r 2

r , por el Lema 4.2.1, 2 le corresponde una arista paralela en E (i), siendo

card {E (i)} =
r 2

Q(i) p(1p))r

= E

22 (

2 ij

p(1p))2

2 ) = E (ij

r 2

1 4

Adems, Domnguez Molina J. y Rocha Arteaga A.

[18],

prueban que el nmero de

rboles orientados con raz que pueden formarse con una cantidad cualquiera r de aristas (2r)! 1 r r coincide con el r -simo nmero de Catalan, Cr = C2 r , con C2r = r!r! . Por lo expuesto, r+1 obtienen que

S2
es decir,

1 4

r 2

Cr , 2

cuando

N ,

1 E (tr(Ar N )) N
cuando

Cs 0,

1 s 4

si si

r = 2s, r = 2s + 1,

N . [42],
sealando adems que

La misma conclusin obtienen Sinai Ya. y Soshnikov A. s 1 1 (1 + o(1)) y por lo tanto, Cs 1 = 4 s3/2

E (tr(Ar N ))
cuando La

N 1 (1 s3/2

+ o(1)),

si si

r = 2s, r = 2s + 1,

0,

(4.23)

N .
est dada por la siguiente expresin:

V ar(tr(Ar N ))

2 r 2 (E (tr(Ar V ar(tr(Ar N )) = E tr (AN ) N ))) 2 1 1 = E r i1 i2 . . . ir i1 N 2 2r ( p(1 p))r i 2 1 1 r E (i1 i2 . . . ir i1 ) N 2 2r ( p(1 p))r i

1 Nr 22r ( p(1 p))2r


i,i

[Q(i, i ) Q(i)Q(i )],

siendo do a

i = (i1 , . . . , ir ), i = (i1 , . . . , ir ), Q(i, i ) = E (i1 i2 . . . ir i1 i1 i2 . . . ir i1 ) e identicani, i con el grafo G(i, i ) = (V (i, i ), E (i, i )) de 2r vrtices y 2r aristas.

89

Para el anlisis de los trminos de la suma anterior, se los agrupa segn el nmero de vrtices de los esqueletos nico aporte a la

G(i, i ) de los grafos G(i, i ) y se llega a la conclusin de que V ar(tr(Ar N )) se da en el caso que card{V (i, i )} r . Por lo tanto, 1 Nr 22r ( p(1 p))2r 1 N r 22r ( p(1 p))2r
r G(i,i ) 1card{V (i,i )}r G(i,i ) 1card{V (i,i )}r

el

V ar(tr(Ar N )) =

[Q(i, i ) Q(i)Q(i )]

[|Q(i, i )| + |Q(i)||Q(i )|]

1 Nr

[|Q(i, i )| + |Q(i)||Q(i )|]


G(i) card{V (i)}=j

j =1

22r ( 1

p(1 p))2r
r

para todo

r 2r ( p(1 p))r

2 p(1 p)

.r

+r

1 2 p(1 p)

2r

.r

N,

en virtud de (4.17).

N , el Del mismo modo Sinai Ya. y Soshnikov A. [42], sealan que si 1 << r << r aporte a la V ar (tr (AN )) viene dado por el nmero de ndices en los cuales en la unin de 1 i con i cada arista aparece dos veces y concluyen que ese nmero es N r 22r (1 + o(1)) y
que

l m V ar(tr(Ar N )) =

1 .

2
Finalmente, bajo ciclos de longitud

T C,

podemos obtener la distribucin asinttica de la proporcin de

N perles, representada por el estadstico TN (r) dado r por la expresin (4.13), cuando r , N y 0. Para esto, desarrollamos N el estadstico TN (r ) dado por (4.14) en trminos de las funciones de amistad ij de la
en muestras de siguiente manera:

1 TN (r) = Nr 1 = Nr

i1 i2 . . . ir i1
i1 ,...,ir =1 N

(i1 i2 p) . . . (ir i1 p)
i1 ,...,ir =1

(4.24)

= TN (r) + RN (r),

90

con

1 r 1 RN (r) = r Cr p N 1 2 r1 + p Cr Nr i

i1 i2 i2 i3 . . . ir1 ir +
i1 ,...,ir =1 N N

i1 i2 i2 i3 . . . ir2 ir1 +
1 ,...,ir 1 =1

r 2 ( Cr

r1 Cr ) i1 ,...,ir =1

i1 i2 i3 i4 . . . ir1 ir

+ (1)r1

1 C 1 pr1 Nr r i

i1 i2 + (1)r pr .
1 ,i2 =1

Adems, utilizaremos los resultados obtenidos por Arnold L. y Girko V.L.

([2], [23]) dados

por las expresiones (4.7) y (4.9) respectivamente. Es decir, utilizaremos que

2 E (TN (r)) 0,
cuando

r p(1p) N

N Cr (1)2 , 2 4

si si

r r

es par, es impar,

(4.25)

N ,

con

Cr =

1 C r , los nmeros de Catalan, y que para r+1 2r w

jo,

TN (r) E (TN (r))) N 0, V ar(TN (r)) ,


cuando

(4.26)

N . r=2
tenemos

Comenzando con el caso

TN (2) = TN (2) + RN (2),


con

TN (2) =

1 N2

i1 i2 i2 i1
i1 ,i2 =1 N i1 ,i2 =1

la proporcin de ciclos de longitud 2 en muestras de

perles y

2 RN (2) = N 2 p

2 i1 i2 + p 2 = N 2 p

i1 i2 + N
i1 ,i2 =1 i1 = i2

+ p2 .

Por la simetra de las funciones aleatorias de amistad

i1 i2 ,

escribimos

i1 i2 = 2
i1 ,i2 =1 i1 =i2
siendo

i1 i2 ,
1i1 <i2 N

i1 i2
1i1 <i2 N

una suma de

N (N 1) variables Bernoulli independientes con parmetro 2 N (N 1) y 2

p,

es decir,

i1 i2

es Binomial de parmetros

p.

Luego, para

sucien-

1i1 <i2 N N temente grande, i1 i2 i1 ,i2 =1 i1 =i2

= 2
1i1 <i2 N

i1 i2

se aproxima a una variable Normal con

91

E
i1 ,i2 =1 i1 = i2

i1 i2

= N (N 1)p

V ar
i1 ,i2 =1 i1 = i2

i1 i2

= 2N (N 1)p(1 p).

Por lo tanto,

RN (2)

se aproxima a una Normal con

E (RN (2)) =

2 p (N (N 1)p + N ) + p2 N2 2 2 = p2 (N 1) p + p2 N N 2 = p(1 p) p2 . N

Luego, como

TN (2) = TN (2) RN (2) y, por (4.26), TN (2) es asintticamente Normal con media dada por (4.25), cuando N , resulta que TN (2) converge en distribucin a una
variable Normal y

E (TN (2)) = E (TN (2))

2 p(1 p) p2 N 2 p(1 p) p2 , p(1 p)C1 N

cuando

N ,

es decir,

E (TN (2))
cuando

2 p(1 p) + p2 , N

(4.27)

N . Para el caso r = 3, TN (3) = TN (3) + RN (3),


N

con

TN (3) =

1 N3

i1 i2 i2 i3 i3 i1
i1 ,i2 ,i3 =1

la proporcin de ciclos de longitud 3 en muestras de

perles y

3 RN (3) = 3 p N i 3 = 3 p N 3 = 3 p N

i1 i2 i2 i3
1 ,i2 ,i3 =1

3 + 3 p2 N i
N

i1 i2 p3
1 ,i2 =1

i1 i2 i2 i3 +
i1 ,i2 ,i3 =1 i1 = i3 N i1 ,i2 =1

i1 i2 i2 i1

3 + 3 p2 N

i1 i2 + N p3
i1 ,i2 =1 i1 =i2

i1 i2 i2 i3 + N 2 TN (2) +
i1 ,i2 ,i3 =1 i1 = i3

3 2 N2 2 p ( R (2) p ) p3 . N N3 2p

92

Hemos visto que para Normal, cuando

r = 2 tanto TN (2) como RN (2) tienen distribucin aproximadamente N . Adems,


N N N

i1 i2 i2 i3 =
i1 ,i2 ,i3 =1 i1 =i3 i1 ,i2 ,i3 =1 i1 =i3 i2 =i1 ,i2 =i3 N

i1 i2 i2 i3 +
i1 ,i2 ,i3 =1 i1 = i3 i2 = i1 N

i1 i2 i2 i3 +
i1 ,i2 ,i3 =1 i1 =i3 i2 =i3

i1 i2 i2 i3

=
i1 ,i2 ,i3 =1 i1 = i3 i2 =i1 ,i2 =i3

i1 i2 i2 i3 + 2
i1 ,i3 =1 i1 = i3

i1 i3 ,

(4.28)

donde el primer sumando de (4.28) es una suma de N (N 1)(N 2) variables con 2 distribucin Bernoulli de parmetro p y el segundo una suma de N (N 1) variables independientes Bernoulli de parmetro

p. Por lo tanto, cuando N

es sucientemente grande,

ambos sumandos tienen distribucin es aproximadamente Normal. En consecuencia, (4.28) N es Normal y E i1 i2 i2 i3 = N (N 1)(N 2)p2 + 2N (N 1)p. Concluimos eni1 ,i2 ,i3 =1 i1 = i3 tonces que

RN (3)

converge en distribucin a una variable Normal con

E (RN (3)) +
cuando

3 p N (N 1)(N 2)p2 + 2N (N 1)p + N 2 E (TN (2)) + 3 N 3 2 N2 2 p p3 , ( E ( R (2)) p ) N N3 2p TN (3)

puede escribirse en trN i1 i2 i2 i3 minos de las variables asintticamente Normales TN (3), TN (2), RN (2) y i1 ,i2 ,i3 =1 i1 = i3 de la siguiente manera

N . Como TN (3) = TN (3) RN (3),

podemos observar que

3 TN (3) = TN (3) + 3 p N
Por lo tanto,

i1 i2 i2 i3 + N 2 (TN (2) RN (2))


i1 ,i2 ,i3 =1 i1 = i3
(4.29)

3 2 N2 2 p ( R (2) p ) + p3 . N 3 N 2p

TN (3) converge en distribucin a una variable Normal, cuando N , con E (TN (3)) E (RN (3)), ya que E (TN (3)) 0, cuando N , en virtud de (4.25). Repitiendo el procedimiento, podemos deducir que el estadstico TN (r ) puede expresarse como combinacin lineal de sumas de variables aleatorias Bernoulli y las variables aleatorias

TN (r), TN (r 1),

...,

TN (2), RN (2)
93

de quienes conocemos que su distribucin

asinttica es Normal. Luego, do

TN (r) converge en distribucin a una variable Normal, cuandel Teorema 4.2.3, la

y pueden hallarse de manera recursiva su esperanza y su varianza. Adems,

si suponemos que normalidad de

1 << r << N , como TN (r) verica las hiptesis TN (r) sigue valiendo para r creciendo con N .

4.3. Grado medio de separacin entre dos perles de Facebook


En esta seccin, nos centramos en el anlisis de la viabilidad de la teora de mundo pequeo en Facebook. Daremos una denicin del grado medio de separacin entre dos perles

fi , fj F

y, mediante su clculo en los contextos de

TC

y distintos tipos de

segmentacin, podremos sacar conclusiones sobre la viabilidad de la teora mencionada.

Denicin 4.4
i = j,

Sea

decimos que

{f1 , . . . , fN } una muestra de N perles de F . Dados i, j {1, . . . , N }, i est conectado con j mediante k enlaces si
k 1

(fil , fil+1 ) = 1,
l=0

con i0

= i, ik = j ; il = il

si

l=l.

Luego, el conjunto

Dk (i, j ) = {i = (i0 , i1 , . . . , ik1 , ik ) : i0 = i, ik = j, il = il


representa a todos los caminos posibles con al sitio

si

l = l },

(4.30)

enlaces y

con el

y, para los perles

fi

fj

de la

k 1 intermediarios que conectan muestra correspondientes a los sitios i y

j,

tenemos la siguiente denicin.

Denicin 4.5

Denimos el grado de separacin entre

fi

fj

como

GN (fi , fj ) =
Entonces,

m n{k : Dk (i, j ) = }, 0,

si si

i = j, i = j.

(4.31)

GN (fi , fj ) = k indica que k es el menor nmero de saltos necesarios para conectar fi con fj , con k 1 intermediarios. Observemos adems que la cadena ms larga que puede existir entre dos perles pertenecientes a una muestra de tamao N tendr N 1 enlaces y N 2 intermediarios. Cuando los perles fi y fj son inalcanzables entre s, deniremos el grado de separacin como GN (fi , fj ) = N .
94

k pasos no son sucientes para conectar fi con fj , es decir, en trminos del conjunto Dk (i, j ) signica que la suma sobre todos los posibles caminos con k enlaces y k 1 intermediarios que conectan a i con j es cero, esto
El evento indica que es,

{GN (fi , fj ) k + 1}

{GN (fi , fj ) k + 1} =

k 1

iDk (i,j ) l=0

(fil , fil+1 ) = 0 . fi
y

(4.32)

Denicin 4.6

Denimos el grado medio de separacin entre

fj

como
(4.33)

i,j = l m E [GN (fi , fj )].


N

Por lo tanto, utilizando la denicin anterior, probaremos el siguiente resultado que nos permitir analizar el nivel de conectividad entre los perles mencionados segn el contexto comunicacional en que se relacionen y cuando el tamao de la muestra tiende a innito, esto es, cuando consideramos a todos los perles que integran la red.

Teorema 4.3.1

(Grado medio de separacin)

i) Bajo el supuesto de TC,

i,j = 2 p. fi S i fj Sj , Si Sj

ii) Bajo Segmentacin Fuerte, es decir, cuando hay al menos dos segmentos no conectados entre s,

i,j = +,

siendo

segmentos disjuntos.

Demostracin
Sean

fi , fj F ,

i) Supongamos que se cumple la hiptesis de

T C en la red. Como el grado de separacin es una variable aleatoria con rango en el conjunto {1, . . . , N 1}, podemos calcular
su esperanza de la siguiente manera:

N 1

E [GN (fi , fj )] =
n=1

P ({GN (fi , fj ) n})


N 1

(4.34)

= P (GN (fi , fj ) = 1) + 2 P (GN (fi , fj ) 2) +


n=3

P (GN (fi , fj ) n).

El primer y segundo sumando de (4.34) son fciles de deducir. En efecto, la probabilidad de que el grado de separacin entre dos perles sea uno equivale a que dichos perles sean amigos, es decir, a que la funcin aleatoria de amistad distribucin Bernoulli de parmetro

(fi , fj )

con

tome el valor uno. Por lo tanto,

P (GN (fi , fj ) = 1) = P ( (fi , fj ) = 1) = p.


95

Adems, la probabilidad de que el grado de separacin entre dos perles sea al menos dos equivale a la probabilidad de que dichos perles no sean amigos, es decir, a que

(fi , fj )

tome el valor cero. Luego,

P (GN (fi , fj ) 2) = P ( (fi , fj ) = 0) = 1 p.


Para el tercer sumando de (4.34), si tomamos que:

k+1 = n

en (4.30) y (4.32) tenemos

Dn1 (i, j ) = {i = (i0 , i1 , . . . , in2 , in1 ) : i0 = i, in1 = j, il = il


es el conjunto de todos los caminos posibles con que conectan al sitio

si

l=l}

n 1 enlaces y n 2 intermediarios fi
con

con el

y que

{GN (fi , fj ) n} =
es el evento que indica que Sea

n2

(fil , fil+1 ) = 0
iDn1 (i,j ) l=0

n1
n2

pasos no son sucientes para conectar

fj .

HN,n (fi , fj ) =
iDn1 (i,j ) l=0

(fil , fil+1 ). HN,n (fi , fj ) son cero o uno, por lo que HN,n (fi , fj ) lo tanto P (HN,n (fi , fj ) = 0) = P (HN,n (fi , fj ) 0).
(4.35)

Observemos que los sumandos en es mayor o igual que cero y por Luego,

P (GN (fi , fj ) n) = P (HN,n (fi , fj ) = 0) = P (HN,n (fi , fj ) 0)

= P HN,n (fi , fj ) E (HN,n (fi , fj )) E (HN,n (fi , fj )) P |HN,n (fi , fj ) E (HN (fi , fj ))| E (HN,n (fi , fj )) .

Aplicando la desigualdad de Chebyshev en (4.35) resulta:

P (GN (fi , fj ) n)
Resta calcular portamiento

V ar(HN,n (fi , fj )) . E (HN,n (fi , fj ))2

(4.36)

E (HN,n (fi , fj )) y V ar(HN,n (fi , fj )) para completar y estudiar el comde (4.36), cuando N .

Dn1 (i, j ), card{Dn1 (i, j )}, es el nmero de subconjuntos con n 2 elementos que se pueden tomar de un conjunto con N 2 elementos (N 2)! n2 sin repeticin, es decir, VN 2 = , es claro que [(N 2)(n2)]!
Como el cardinal del conjunto

n2 n1 E (HN,n (fi , fj )) = VN 2 p

= (N 2) [(N 2) 1] . . . [(N 2) (n 3)] pn1 = N n2 pn1 .


96

(4.37)

Por otro lado, podemos descomponer a la

V ar(HN,n (fi , fj ))
n2

de la siguiente manera:

V ar(HN,n (fi , fj )) =
iDn1 (i,j )

V ar
l=0

(fil , fil+1 )
n2

+
n2

(4.38)

+
i,i Dn1 (i,j )
y, como

Cov
l=0
resulta

(fil , fil+1 ),
l=0

(fi , fi l+1 ) ,
l

n2 card{Dn1 (i, j )} = VN 2 , n2

V ar
iDn1 (i,j ) l=0

(fil , fil+1 )

n2 n1 = VN (1 pn1 ) 2 p

(4.39)

= N n2 pn1 (1 pn1 ).
Para el segundo sumando de (4.38), notando

(fil , fil+1 ) := il il+1 )


l+1

tenemos

n2

n2

Cov
i,i Dn1 (i,j ) l=0

(fil , fil+1 ),
n2

l=0

(fi , fi
l

=
n2

n2

n2

=
i,i Dn1 (i,j )

E
l=0

il il+1
l=0

i i

E
l=0

l l+1

il il+1 i

E
l=0

i i

l l+1

Dejando jo i, contabilizamos el nmero de caminos plican al primer camino

de longitud

que no tengan enlaces en comn con

n1 con i.

que multi-

Dichos caminos no aportan a las covarianzas y el nmero de tales caminos es

(N 3) (N 4) . . . (N n).
En consecuencia, el aporte a la suma de las covarianzas vendr dado por aquellos caminos

que tienen al menos un enlace en comn con i. Podemos contabilizar esta

cantidad por diferencia entre el nmero total de caminos

y el nmero de caminos

que no aportan a las covarianzas. Es decir,

(N 2) [(N 2) 1] . . . [(N 2) (n 3)] (N 3) (N 4) . . . (N n).


Sea la funcin

(x) = (N x) [(N x) 1] . . . [(N x) (n 3)],


con

(4.40)

x > 0. es continua en el intervalo [2,3] y derivable en el intervalo (2,3), entonces por el Teorema del Valor Medio, existe z (2, 3) tal que (z ) = (3) (2). Luego, para z (2, 3), (z ) = (2) (3)
(4.41)

= (N 2) (N 3) . . . [N (n 1)] (N 3) (N 4) . . . (N n).
97

Por otro lado, calculando la derivada primera de la funcin plicndola por menos uno tenemos

en (4.40) y multi-

(x) = [(N x) 1] [(N x) 2] . . . [(N x) (n 3)] + + (N x) [(N x) 2] . . . [(N x) (n 3)] + + + (N x) [(N x) 1] . . . [(N x) (n 4)],
por lo que acotando cada uno de los n 2 trminos de esta suma por n3 resulta (x) (N 2) (n 2). En particular, para z (2, 3),

(N 2)n3

(z ) (n 2)(N 2)n3 .
De (4.41) y (4.42) podemos concluir que

(4.42)

(N 2)(N 3) . . . [N (n 1)] (N 3) . . . (N n) (n 2)(N 2)n3 ,


es decir, el nmero de caminos comn con lo sumo

i Dn1 (i, j )

que tienen al menos un enlace en

i Dn1 (i, j ) y (N 2)n3 (n 2).

por lo tanto aportan a la suma de las covarianzas es a

Entonces,

n2

n2

Cov
i,i Dn1 (i,j ) l=0

(fil , fil+1 ),
l=0

(fi , fi
l

)
l+1

(n 2)(N 2)n3 pn1 (1 pn1 ).


(4.43)

Retomando el clculo de

V ar(HN,n (fi , fj )

en (4.38), por (4.39) y (4.43) resulta

V ar(HN,n (fi , fj )) N n2 pn1 (1 pn1 ) + (n 2)(N 2)n3 pn1 (1 pn1 ) (4.44) = N n2 pn1 (1 pn1 ).
Volviendo a la desigualdad (4.36), con los resultados para

E (HN,n (fi , fj ))

V ar(HN,n (fi , fj ))

dados por (4.37) y (4.44), obtenemos que

P (GN (fi , fj ) n)

V ar(HN,n (fi , fj )) E (HN,n (fi , fj ))2 N n2 pn1 (1 pn1 ) N 2(n2) p2(n1) 1 1 = n2 . n 2 n 1 N p N

(4.45)

98

Luego,

N 1

N 1

P (GN (fi , fj ) n)
n=3 n=3 N 4

1 n N 2 pn1 1 N r+1 1 p2 pr+2


N 4

N 1

1 N n2 1 N r+1
N 4 r

n=3 N 4

=
r=0

r=0 r

=
N 4
Como las series

1 N

r=0

1 Np

r=0 N 4 r=0

1 N
1 Np

.
r

(4.46)

r=0
tiende a

1 Np

r
y

N 4 r=0

1 1 r son convergentes y 2 N p

N 4

r=0

1 r N

1 p2

1,

cuando

N ,

(4.46) tiende a cero cuando en (4.34) resulta

N .

Entonces tomando lmite para

i,j = l m E (GN (fi , fj )) = p + 2(1 p) = 2 p.


N

ii) Estudiaremos ahora el caso de Segmentacin Fuerte. Este contexto comunicacional


se caracteriza por la presencia de al menos dos segmentos no conectados entre s en la red. Sean y

S1 , S2 F dos segmentos disjuntos tales que S1 S2 = F y sean a =

card{S1 } card{F }

card{S2 } 1 a = card . Suponemos que dentro de cada segmento se verica la hiptesis de {F } T C pero entre ellos no existe interaccin alguna y tomamos un muestreo estraticado al azar por segmento con S1 = {f1 , . . . , f[aN ] } y S2 = {f[aN ]+1 , . . . , fN }. Luego, si fi S1 y fj S2 fi S2 y fj S1 , los perles son inalcanzables entre s y, por lo
tanto, de acuerdo a cmo denimos el grado de separacin entre dos perles, resulta que

GN (fi , fj ) = N .

En consecuencia,

i,j = l m E (GN (fi , fj )) = +.


N

2
Los resultados anteriores nos indican que cuando estamos bajo la hiptesis de

T C,

donde la probabilidad de que cualquier par de perles sean amigos en Facebook es la misma, digamos

p, hallamos que a medida que el tamao de la muestra crece hasta considerar 2 p.


Por consiguiente, para el par de perles

la red completa, el grado medio de separacin entre dos perles cualesquiera depende de

p, ms

precisamente es

fi , fj F , cuanto

mayor probabilidad haya de que stos sean amigos ms cercano a uno ser el grado medio de separacin entre ellos reejando que con slo un enlace pueden conectarse. Por otro lado, cuanto menos probable sea la amistad entre los perles, son sucientes dos enlaces y

99

un intermediario para conectarlos. En conclusin, bajo la Teora de Mundo Pequeo.

TC

hemos vericado que es viable

En el caso de existir en la red al menos dos segmentos entre los que no haya ninguna interaccin, tomando un perl de cada segmento, el grado medio de separacin entre ellos tender a innito cuando el tamao de la muestra crezca. Por lo tanto, en el contexto comunicacional de Segmentacin Fuerte queda invalidada la Teora de Mundo Pequeo, ya que hay perles que son inalcanzables entre s.

4.3.1. Segmentacin dbil


En captulos anteriores presentamos un modelo para estudiar la dinmica a largo plazo de la red social Facebook basado en el hecho de que los clicks, es decir, las funciones de amistad entre pares de perles, Bernoulli, con parmetro

, son variables aleatorias indepedientes con distribucin constante (caso de T C ) o parmetro dependiendo del esquema

de segmentacin. Otra caracterstica del modelo es la no restriccin en el nmero de amigos que puede tener un perl. En la realidad, podemos observar que los perles se conectan con perles de caractersticas similares e intereses comunes de diversa ndole, agrupndose en segmentos y que adems existe interaccin entre los segmentos. Llamaremos a este contexto comunicacional, el contexto de Segmentacin Dbil.

Si y Sj dos segmentos de perles de F , Si Sj = , con fi , fj F y tales que fi Si , fj Sj , el grado medio de separacin entre fi y fj , i,j = l m E (GN (fi , fj )), podra ser nito o eventualmente innito, dependiendo N de la intensidad con que se relacionen los segmentos a los que pertenecen fi y fj .
En este contexto podemos intuir que, dados

4.4. Conclusiones y trabajo futuro


Si estudiamos el fenmeno de mundo pequeo en cualquier red social que no est muy agrupada y en la que los individuos tengan relaciones fuera de su crculo ntimo, es probable que en dicha red sea viable la Teora de Mundo Pequeo y esto depender de la fuerza con que se relacionen los perles de segmentos distintos. En este Captulo, hemos hecho referencia a los trabajos de Watts D. y Strogatz S. [46] y Watts D. [47]. En ellos se muestran dos situaciones extremas: a) Un mundo social caracterizado por un agrupamiento extremo, en el que las personas slo se relacionan con aquellas con las que las une un vnculo familiar o de amistad muy cercano. En este contexto, la distancia entre dos individuos del planeta elegidos al azar ser muy grande. Por ejemplo, el caso de un individuo que desarrolla toda su vida en una tribu aislada. La densidad relacional que tendr con los miembros de su tribu, ser muy

100

alta. Sin embargo, le sern inaccesibles otras personas que habiten en otras tribus a miles de kilmetros de la suya. b) En el otro extremo, en una red social en la que todos sus individuos establecen relaciones aleatorias fuera de su crculo ntimo la distancia media entre ellos ser pequea. Por ejemplo, si un individuo tiene 50 contactos y sus contactos tienen a su vez 50 contactos en promedio, en slo dos pasos el individuo podra contactarse con 2.500 personas, en tres pasos podra llegar a los 125.000 contactos, en cuatro a 6.250.000 y en cinco a 312.500.000. Si estos contactos se establecieran en forma aleatoria, por ejemplo como cuando entablamos una relacin con un desconocido que comparte un viaje con nosotros al ir a trabajar en mnibus, en muy pocos pasos una persona podra alcanzar a cualquier otra del planeta ya que su informacin no se agotara a su crculo ntimo como sucede en las redes muy aglomeradas. En nuestro anlisis, al contexto comunicacional descripto por la situacin a) lo hemos denominado el contexto de Segmentacin Fuerte y pudimos comprobar que dados dos perles cualesquiera de distintos segmentos, el grado medio de separacin entre ellos, result innito, lo cual hace inviable la Teora de Mundo Pequeo. Por otro lado, observamos que el contexto de la situacin extrema desarrollada en b), se asemeja al contexto de

i,j

TC

en el que todo induviduo se relaciona con los dems en

forma aleatoria y con la misma probabilidad. Sin embargo, el mundo real es evidente que propone un escenario intermedio en donde los individuos se relacionan con aquellos que presentan caractersticas similares, es decir, se agrupan en segmentos, pero que simultneamente existe interaccin entre los segmentos. A este contexto lo hemos denominado el contexto de Segmentacin Dbil. En este marco, todo parece indicar que dados dos perles de dos segmentos distintos cualesquiera del planeta, el grado medio de separacin entre ellos depender de la intensidad con que se relacionen los distintos segmentos. La propuesta a futuro es abordar en profundidad este caso a travs de la modelizacin matemtica y probabilstica aplicada en particular a la red social Facebook, y el anlisis del fenmeno de mundo pequeo mediante el clculo formal del grado medio de separacin entre perles. Sumamos a esta propuesta el desafo del modelado y estudio de la red restringiendo la cantidad de amigos que pueda tener cada perl de la misma. El hecho de Facebook parezca mostrar una distancia corta entre individuos como lo indica el estudio realizado por Ugander J., Karrer B., Backstrom L. y Marlow C.

[44],

podra deberse a varios factores, como por ejemplo que en general los usuarios tienen un gran nmero de contactos superciales con los que ni siquiera mantiene una conversacin o nunca vio en persona, aunque an as, en muchos casos Facebook ha facilitado el encuentro de personas que de otro modo no se hubiera llevado a cabo y mantener contactos. Otro factor que podemos destacar es que no todo el mundo es usuario en Facebook, por ejemplo, un anciano de un pueblo del norte del pas que no tiene acceso a internet es prcticamente

101

improbable que tenga una cuenta de Facebook, aunque si este anciano tuviera un nieto en la capital conectado a 100 individuos, ste podra conectarlo con slo un paso a la red social. De todos modos, podemos concluir que en Facebook la teora de que el mundo es pequeo es de considerable viabilidad. El mundo est cada vez ms conectado, debido en gran medida a la tecnologa de la informacin. Las personas se relacionan de modo virtual y real de manera progresiva con personas fuera de su crculo familiar o ntimo, ya sea por cuestiones laborales, de estudio, de recreacin, polticas, econmicas, compra de artculos, etc. Adems, las ciudades han crecido y el mundo esta cada vez ms diversicado y urbanizado. La homolia, es decir, la tendencia de la gente a relacionarse con personas de caractersticas similares a las suyas, persistir siempre ya que est en la naturaleza humana. Sin embargo, por todo lo expuesto, todo parece indicar que el mundo es cada vez ms pequeo.

102

Bibliografa
[1] Airoldi E., Blei D.M., Fienberg S.E., Goldenberg A., Xing E.P. and Zheng A.X. (Eds). (2007). Statistical Networks Analysis: Models , Issues, and New Directions. Springer. [2] Arnold L. (1967). On the Asymptotic Distribution of the Eigen Values of Random

Matrices. Journal Mathematical Analysis and Applications, Vol. 20, pp. 262-268.
[3] Bandyopadhyay S., Rao A.R. and Sinha B.K. (Eds). (2010). Models for Social Net-

works with Statistical Applications. SAGE.


[4] Billignsley P. (1968). Convergence of Probability Measures. New York. Wiley and Sons. [5] Billignsley P. (1979). Probability and Measures. New York. Wiley and Sons. [6] Bondy J.A. and Murty U.S.R. (2008). Graph Theory. Springer. Graduate Texts in Mathematics, Vol. 224. [7] Boorman S. and White H. (1976). Social Structure from Multiple Networks. II. Role

Structures. American Journal of Sociology, Vol. 81, No. 6, pp. 1384-1446.


[8] Bian Y. J. (1997). Bringing Strong Ties Back in: Indirect Ties, Network Bridges and

Job Searches in China. American Sociological Review, Vol. 62, No. 3, pp. 366-385.
[9] Bolch G., Greiner S., De Meer H. and Trivedi K. (2006). Queueing Networks and

Markov Chains: Modeling and Performance Evaluation With Computer Science Applications. New Jersey. Wiley and Sons.
[10] Breiger R., Carley K. and Pattison P. (Eds). (2003). Dynamic Social Network Mode-

lling and Analysis: Workshop Summary and Papers. National Research Council.
[11] Burt R. (1995). Structural Holes: The Social Structure of Competition. Harvard University Press. [12] Carrington P., Scott J. and Wasserman S. (2005). Models and Methods in Social

Network Analysis. Cambridge University Press.


103

[13] Carrero F. (2008). http://franciscocarrero.com/2008/06/13/cual-es-el-techo-de-lasredes-sociales-2. [14] Closa G. (2011). www.elogia.net/blog/autor/ciclo-vital-facebookiano. [15] DasGupta A. (2008). Asymptotic Theory of Statistics and Probability. Springer, New York. [16] De Ugarte D. (2011). El poder de las redes. Manual ilustrado para ciberactivistas. Coleccin Biblioteca de las Indias Electrnicas. http://lasindias.org. [17] Diestel R. (2000). Graph Theory. Springer. [18] Dominguez Molina J. y Rocha Arteaga A. (2009). El Teorema de Wigner para ma-

trices aleatorias. Comunicacin del CIMAT. No. I-09-08/15-10-2009 (PE/CIMAT).


[19] Feller W. (1968). An Introduction to Probability Theory and its Applications, Vol. 1. John Wiley, New York, 3rd edition, 15, 51, 63. [20] Freeman L.C. (2006). The Development of Social Network Analysis: A Study in The

Sociology of Science. Vancouver: Empirical Press.


[21] Freeman L.C. (2008). What is Social Network Analysis? Last Update Friday, Available at: http://www.insna.org/sna/what.html. [22] Furht B. (Ed). (2010). Handbook of Social Network Technologies and Applications. Springer. [23] Girko V. L. (1988). Spectral Theory of random matrices. Nauka. Moscow. [24] Granovetter M. (1973). The Strength of Weak Ties. American Journal of Sociology, Vol. 78, pp. 1360-1380. [25] Guare J. (1990). Six Degrees of Separation: A Play. (First edition ed.). New York: Random House. [26] Hawe P., Webster C. and Shiell A. (2004). A Glossary of Terms for Navigating the

Field of Social Network Analysis. Journal of Epidemiology and Community Health,


Vol. 58, pp. 971-975. [27] Hoel P.G., Port S.C. and Stone C.J. (1972). Introduction to Stochastic Processes. Houghtoun Miin. [28] Jones G. (2004). On the Markov Chain Central Limit Theorem. Prob. Surveys, 1, 299-320.

104

[29] Koshy T. (2009). Catalan Numbers with applications. Oxford University Press, Inc. [30] Lee A. J. (1990). U-Statistics: Theory and Practice. Marcel Dekker, New York. [31] Lehmann E.L. (1999). Elements of Large Sample Theory. Springer, New York. [32] Lin N. (2002). Social Capital: A theory of Social Structure and Action. Cambridge University Press, First Edition. [33] Marin A. and Wellman B. (2010). Social Network Analysis: An Introduction. Carrington P. and Scott J. (Eds). Handbook of Social Network Analysis. London: SAGE. [34] Meyn S.P. and Tweedie R.L. (1993). Markov Chains and Stochastic Stability. Springer, New York. [35] Milgram S. (1967). The Small-World Problem. Psychology Today, 1 (1), 61-67. [36] Mickenberg R. and Dugan J. (1995). Taxi Driver Wisdom. San Francisco: Chronicle. [37] Plickert G., Cot R. and Wellman B. (2007). It's Not Who You Know. It's How You

Know Them: Who Exchanges What with Whom? Social Networks, Vol. 29, No. 3,
pp. 405-429. [38] Polanco X. (2006). Anlisis de Redes: Introduccin. Author manuscript, published in Redes de conocimiento: Construccin, dinmica y gestin, Albornoz M. y Alfaraz C. (Ed). 77-112. [39] Pool I. and Kochen M. (1978). Contacts and Inuence. Social Networks, 1, pp.5-51. Elsevie Sequoia S.A., Lausanne. [40] Rincn L. (2012).

Introduccin a los Procesos Estocsticos. Departamento de

Matemticas, Facultad de Ciencias UNAM, Circuito Exterior de CU, Mxico DF. [41] Sering R. (1980). Approximation Theorems of Mathematical Statistics. John Wiley and Sons. New York. Chichester. Brisbane. Toronto. [42] Sinai Y. and Soshnikov A. (1998). Central Limit Theorem for Traces of Large Ran-

dom Symmetric Matrices with Independent Matrix Elements. Bulletin of Brazilian


Mathematical Society. Vol. 29, Nro. 1, pp. 1-24. [43] Scott J. (1991). Social Network Analysis. London: SAGE. [44] Ugander J., Karrer B., Backstrom L. and Marlow C. (2011). The Anatomy of Facebook

Social Graph. http://arxiv.org/abs/1111.4503.

105

[45] Wasserman S. and Faust K. (1994). Social Networks Analysis: Methods and Applica-

tions. Cambridge: Cambridge University Press.


[46] Watts D. and Strogatz S. (1998). Collective Dynamics of Small-World Networks. Nature, Vol. 393, No. 6684, pp. 440-442. Nature Publishing Group. [47] Watts D. (2003). Six Degrees: The Science of a Connected Age. W. W. Norton and Company. [48] Wellman B. and Berkowitz S.D. (Eds). (1988). Social Structures: A Network Ap-

proach. Cambridge: Cambridge University Press.


[49] Wetherell C., Plakans A. and Wellman B. (1994). Social Networks, Kinship, and

Community in Eastern Europe. Journal of Interdisciplinary History, Vol. 24, No. 1,


pp. 639-663. [50] White H.D., Wellman B. and Nazer N. (2004). Does Citation Reect Social Structure?

Longitudinal Evidence from the `Globenet' Interdisciplinary Research Group. Journal


of the American Society for Information Science and Tecnology, Vol. 55, No. 2. pp. 111-126. [51] Wigner E. P. (1955). Characteristic Vectors of Bordered Matrices With Innte Di-

mensions. Annals of Mathematics, Vol. 62, 548-564.


[52] Wigner E. P. (1958). On the Distributions of the Roots of Certain Symmetric Matri-

ces. Annals of Mathematics, Vol. 67, No. 2, pp. 325-327.


[53] Zhu J. (2007). Opportunities and Challenges for Network Analysis of Social and

Behavioral Data. Seminar Series on Chaos, Control and Complex Networks City
University of Hong Kong, Poly U University of Hong Kong and IEEE Hong Kong R and A/CS Joint Chapter.

106

También podría gustarte