Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CAPÍTULO PRIMERO
Este documento está traducido para la lista REDES con permiso del autor a partir de
la versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html< [Fecha de consulta:
Octubre de 2000].
2
SOBRE ESTE LIBRO
Este libro introduce muchos de los enfoques del análisis formal de las redes sociales,
proporcionando breves referencias y ejemplos de la mayoría de sus áreas de
desarrollo más importantes. El texto se apoya en las obras de Freeman, Borgatti y
Everett (los autores del programa UCINET). Los materiales y su organización, están
inspirados en el texto de Wasserman y Faust, y en un seminario de postgrado dirigido
por el profesor Phillip Bonacich en la UCLA en 1998. Los errores y omisiones, por
supuesto, son responsabilidad del autor.
TABLA DE CONTENIDOS
6. Centralidad y poder.
7. Camarillas y subgrupos.
9. Equivalencia estructural.
3
CAPÍTULO I . LOS DATOS DE LAS REDES SOCIALES.
SOCIALES?
Sin embargo, a menudo los datos que los investigadores en redes sociales estudian
resultan muy distintos de la tradicional matriz rectangular tan familiar para los
investigadores y el análisis estadístico. Las diferencias son importantes porque nos
llevan a observar los datos de una manera distinta –y también a pensar de manera
distinta-- sobre cómo aplicar los procedimientos estadísticos.
Los datos sociológicos “convencionales” están compuestos por una matriz rectangular
con mediciones. Las filas de la matriz son los casos, sujetos u observaciones. Las
columnas son las puntuaciones (cuantitativas o cualitativas) de los atributos, variables
o mediciones. Entonces, cada celda de la matriz describe la puntuación de algún actor
con respecto a algún atributo. En algunos casos, estas matrices pueden tener una
tercera dimensión que representa los cuadros de observaciones de múltiples grupos.
Bob Hombre 32 2
Carol Mujer 27 1
Ted Hombre 29 1
Alice Mujer 28 3
4
La estructura de datos fundamental es aquella que permite comparar qué tan
parecidos o diferentes son los actores entre sí en base a los atributos (comparando
las filas). O quizá más frecuentemente, examinemos qué tan parecidas o diferentes
son las variables entre sí (comparando las columnas).
Los datos de la “red” (en su forma más pura), constituyen una matriz cuadrada de
mediciones. Las filas de la matriz son los casos, sujetos y observaciones. Las
columnas son el mismo conjunto de casos, sujetos y observaciones –allí está la
diferencia clave con los datos convencionales. En cada celda de la matriz se describe
una relación entre los actores.
Elección
Bob --- 0 1 1
Carol 1 --- 0 1
Ted 0 1 --- 1
Alice 1 0 0 ---
Podemos observar esta estructura de datos de la misma forma que los datos
atributivos. Comparando las filas de la matriz, podemos observar qué actores se
parecen a otros en la persona que han escogido. Mirando a las columnas, podemos
ver quién es parecido a quién en términos de haber sido escogido por los demás.
Estas formas son muy útiles para observar los datos, puesto que sirven para ver
aquellos actores que tienen posiciones similares en la red. Este es el primer punto
importante del análisis de redes: buscar qué actores está ubicados o insertados en la
red.
5
de preferencias. También puede comparar las celdas que están por encima y por
debajo de la diagonal para mirar si hay reciprocidad entre las opciones (por ejemplo:
Bob escogió a Ted pero … ¿Ted escogió a Bob?). Éste es el segundo punto
importante del análisis de redes: buscar cómo la estructura de las opciones
individuales se abstrae en patrones más generales.
Es posible pensar en los datos de la red social en los mismos términos que los “datos
convencionales”. Uno puede pensar que las filas son simplemente una lista de casos,
y las columnas atributos de cada actor (por ejemplo, las relaciones con otros actores
podrían verse como “atributos” de cada actor). De hecho, muchas de las técnicas
utilizadas por los analistas de redes (como el cálculo de correlaciones y distancias) se
aplican exactamente de la misma forma en datos de red y en datos convencionales.
Sin embargo, mientras pueden considerarse los datos de la red como una forma
especial de datos convencionales (y de hecho lo son), los analistas de redes observan
los datos de redes de forma diferente. Más que pensar en cómo la relación de un
actor con los demás describe el atributo de su “ego”, los analistas de redes observan
la estructura de conexiones en la que el actor se encuentra involucrado. Los actores
se describen a través de sus relaciones, no de sus atributos. Y las relaciones en sí
mismas son tan fundamentales como los actores que se conectan a través de ellas.
La mayor diferencia entre los datos convencionales y los reticulares, es que los datos
convencionales se centran en actores y atributos mientras los datos de red se centran
en actores y relaciones. La diferencia en el énfasis es muy importante para las
opciones que el investigador debe tomar en el diseño de la investigación, en el
muestreo controlado, el desarrollo de mediciones y en el manejo de los datos
resultantes. No se trata que las herramientas de investigación sean distintas entre los
analistas de redes y los científicos sociales (a menudo no lo son). Se trata de que los
propósitos específicos y el énfasis de la investigación de redes sociales implican
consideraciones diferentes.
En este capítulo, estudiaremos algunos de los temas que han surgen en el diseño,
muestreo y medición de redes sociales. Nuestra discusión se centrará en los dos
aspectos de los datos de la red: los nodos (o actores) y las líneas (o relaciones).
Trataremos de mostrar algunas de las formas en las que los datos de redes son
similares o diferentes de los datos de actores y sus atributos más familiares.
Introduciremos algunos términos nuevos que facilitan la descripción de las
características especiales de los datos reticulares. Finalmente, discutiremos con
6
brevedad cómo las diferencias entre los datos reticulares y los de actor-atributo son
importantes en la aplicación de las herramientas estadísticas.
NODOS
Los datos de red se definen por actores y por relaciones (o por nodos y por vínculos).
La parte de los datos de la red correspondiente a nodos o actores debería ser
bastante precisa. Otros enfoques empíricos en ciencias sociales también trabajan en
términos de casos, sujetos o elementos representativos y semejanzas. Sin embargo,
existe una diferencia en la mayoría de los datos de redes –de hecho se convierte en
una gran diferencia— y es la forma en la que los datos son recogidos comúnmente – y
en la que son estudiadas las poblaciones y muestras.
El análisis de redes se centra en las relaciones entre los actores, y no en los actores
individuales y sus atributos. Esto significa que los actores a menudo no son
muestreados de forma independiente, como en muchos otros tipos de estudios (más
frecuentemente en encuestas). Supongamos que estudiamos los vínculos de amistad,
por ejemplo. John ha sido escogido para estar en nuestra muestra. Cuando le
preguntamos a él, John identifica siete amigos. También necesitamos rastrear a cada
uno de esos siete amigos, y preguntarles sobre sus vínculos de amistad. Los siete
amigos están en nuestra muestra en tanto que John lo está (y viceversa). Por tanto,
los “elementos de la muestra” no son en absoluto “independientes”.
Los nodos o actores incluidos en estudios que no son de redes, tienden a ser el
resultado de un muestreo probabilístico independiente. Los estudios de redes intentan
incluir todos los actores que se muestran en un límite (que a menudo se muestra de
forma natural). Con frecuencia los estudios de redes no utilizan “muestras” en
absoluto, al menos en el sentido convencional. Al contrario, intentan incluir todos los
actores en una población o poblaciones determinada(s). Por supuesto, las poblaciones
incluidas en un estudio de red pueden ser una muestra de un conjunto grande de
poblaciones. Por ejemplo, cuando estudiamos los patrones de interacción entre
estudiantes en las clases, incluimos todos los niños que están en el salón de clases
(es decir, estudiamos la totalidad de la población del aula). El aula en sí misma, debe
seleccionarse a través de métodos probabilísticos dentro de una población de aulas
(todas las de una escuela)
7
El uso de poblaciones completas como forma de seleccionar observaciones en
muchos estudios de redes, hace que sea importante para el analista tener claros los
límites de cada población que vaya a ser estudiada y la forma en la que se
seleccionarán, de entre esa población, las unidades individuales de observación. El
análisis de redes frecuentemente implica diferentes niveles de análisis, con actores
agrupados en un nivel inferior (por ejemplo, la red puede describirse de forma
“anidada”).
Como hemos dicho, rara vez los analistas de redes sociales diseñan muestras. Muy a
menudo, identifican una población y dirigen un censo (por ejemplo, incluyen todos los
elementos de la población como unidades de observación). Un analista puede
examinar todos los sustantivos y objetos presentes en un texto, todas las personas en
una fiesta de cumpleaños, todos los miembros de un grupo de parientes, de una
organización, de un vecindario o una clase social (por ejemplo, los propietarios de
tierras en una región, o reino).
Debido a que los métodos de redes se centran en las relaciones entre los actores,
éstos no pueden ser muestreados independientemente para incluirlos como
observaciones. Si un actor llega a ser seleccionado, han de incluirse todos los actores
con los cuales éste tiene (o puede tener) relaciones. Como resultado, los enfoques de
red intentan estudiar poblaciones totales a través del censo, más que a través de la
muestra (discutiremos brevemente algunas excepciones de esto en el apartado de
muestreo de relaciones).
Las poblaciones que los analistas de redes estudian son notablemente diversas. En
un extremo, pueden constar de símbolos en textos o sonidos en pronunciaciones; en
el otro, naciones en el mundo y sistemas de estados pueden constituir la lista de
nodos. Quizás las mas comunes, por supuesto, son aquellas formadas por personas
8
individuales. En cada caso, sin embargo, los elementos de la población a ser
estudiada se definen a través de algún límite.
Los límites de las poblaciones estudiadas por los analistas de redes pueden ser,
básicamente, de dos tipos. El primero de ellos, probablemente el más común, es el
que viene creado o impuesto por los propios actores. Todos los miembros de una
aula, organización, club, vecindario o comunidad pueden constituir una población de
este tipo. Son esto grupos o redes articuladas de manera natural. Por tanto, los
estudios de redes sociales trazan a menudo en cierto modo los límites alrededor de
una población que se sabe, a priori, que es una red. Alternativamente, un analista de
redes puede asumir un enfoque más “demográfico” o “ecológico” para definir los
límites de la población. Podemos diseñar observaciones contactando toda la gente
que se encuentra en un área espacial delimitada, o a quienes poseen un cierto rasgo
(por ejemplo, tener un ingreso familiar de alrededor de un millón de dólares al año). En
este caso hay motivos para sospechar que la red existe, pero la entidad a ser
estudiada es una agregación abstracta impuesta por el investigador –más que un
patrón de acción social institucionalizada que haya sido identificado y etiquetado por
sus participantes.
Los analistas de redes pueden expandir los límites de sus estudios haciendo réplicas
de las poblaciones. Más que estudiar un vecindario, a menudo se estudian varios.
Este tipo de diseño (que puede utilizar métodos de muestreo para seleccionar las
poblaciones), permite la replicación y la verificación de hipótesis a través de la
comparación de poblaciones. Una segunda, y también muy importante forma en la
que los estudios de redes expanden su ámbito es a través de la inclusión de múltiples
niveles o modalidades de análisis.
9
sociedades son, con variedad de grados, entidades sociales en sí mismas. Y, como
entidades sociales, pueden formar lazos con los individuos inmersos con ellas y con
otras entidades sociales.
A menudo, los conjuntos de datos de redes describen los nodos y las relaciones entre
éstos para una sola población delimitada. Si se estudian los patrones de amistad entre
los estudiantes en una aula, estaríamos haciendo un estudio de este tipo. Pero un
aula está dentro de una escuela –que puede ser vista como una red de clases
relacionadas entre sí y otros actores (directores, administradores, bibliotecarios,
etcétera). Y estas escuelas existen en distritos escolares, los cuales pueden verse a
su vez como redes de escuelas y otros actores (comités escolares, grupos de
investigación, departamentos de personal y adquisiciones). Puede incluso, haber
patrones de relaciones entre los distritos escolares (a través de intercambio de
escolares, profesores, materiales curriculares, etcétera).
La mayor parte de quienes trabajan con redes ven a las personas como enlazadas a
redes, que están enlazadas a redes que a su vez están también enlazadas a redes.
Describen tales estructuras como “multimodales”. En nuestra escuela del ejemplo, los
estudiantes individuales y los profesores forman un modo, las aulas de clases otro
modo, las escuelas un tercer modo, y así sucesivamente. Un conjunto de datos que
contiene información sobre dos tipos de entidades sociales (por ejemplo personas y
organizaciones) es una red de dos modos.
Habiendo afirmado que los métodos de redes sociales son particularmente adecuados
para trabajar con múltiples niveles de análisis y estructuras de datos multimodales,
10
debe admitirse que los analistas de redes rara vez aprovechan esta característica. La
mayoría de los análisis de red no se mueven más allá del simple micro o macro
reduccionismo – y es correcto. Pocos análisis en todo caso de redes han intentado
trabajar con más de dos modos simultáneamente. Y, aún cuando ha sido así, la
estrategia más común ha sido examinarlos de forma más o menos separada (una
excepción es el análisis conjunto de redes de dos modos)
RELACIONES
La otra parte de la investigación de datos reticulares tiene que ver con qué lazos o
relaciones serán medidas en los nodos seleccionados. En este punto hay dos temas
importantes que discutir. En muchos estudios de redes se estudian todos los lazos, o
un tipo específico entre todos los nodos seleccionados – es decir, se realiza un censo.
Pero, a veces se utilizan diferentes enfoques (porque son menos costosos o porque
es necesario generalizar), es decir, un muestreo de relaciones. A veces en los datos
de la red también hay otro tipo de muestreo de relaciones. Cualquier conjunto de
actores puede estar conectado con diferentes tipos de lazos y relaciones (por ejemplo,
los estudiantes en un aula de clases pueden gustar o no de los demás, pueden o no
jugar juntos, pueden o no compartir la misma comida, etcétera). Cuando se recogen
los datos de la red, con frecuencia se seleccionan, o muestrean, los tipos de
relaciones que serán medidos entre un conjunto de tipos de relaciones.
MUESTREO DE RELACIONES
Dado un conjunto de actores o nodos, hay algunas estrategias para decidir cómo
actuar en la recolección de medidas de las relaciones existentes. Al final de la gama
de enfoques, se encuentran los métodos de “redes completas”. Este enfoque aporta el
máximo de información, pero también es costoso y difícil de utilizar y puede ser de
difícil generalización. En el otro extremo se encuentran métodos muy parecidos a los
utilizados en la investigación empírica convencional. Estos enfoques aportan
considerablemente menos información sobre la estructura de la red, pero a menudo
son menos costosos y también facilitan la generalización desde las observaciones en
la muestra hacia el total de la población. Sin embargo, no existe un método “correcto”
para todos los problemas y preguntas de investigación.
11
Los Métodos de redes completas requieren que se recoja información acerca de los
lazos de cada actor con los demás. En esencia, este enfoque utiliza un censo de los
lazos en una población de actores –más que un muestreo de éstos. Por ejemplo,
podemos recoger datos sobre el comercio de cobre entre pares de naciones-Estado
en el sistema mundial, tomándolos de los datos del FMI; podemos examinar las juntas
directivas de todas las corporaciones públicas superponiendo a los directivos;
podemos examinar el número de vehículos que transitan entre pares de ciudades;
podemos mirar el flujo de correos electrónicos entre todos las pares de empleados de
una compañía; podemos decirle a cada niño en un grupo de juegos que identifique a
sus amigos entre los demás.
Ya que recolectamos información sobre lazos entre pares o díadas, los datos de redes
completas aportan una fotografía completa de las relaciones en la población. La
mayoría de los enfoques y métodos especiales de análisis de redes que discutiremos
a lo largo de este texto, fueron desarrollados para utilizarse con datos de redes
completas. Los datos de estas redes son necesarios para definirla apropiadamente y
para medir muchos de los conceptos estructurales del análisis de red (por ejemplo el
grado de intermediación)
En muchos casos, los problemas no son tan graves como puede pensarse. La
mayoría de las personas, grupos y organizaciones, tienden a tener un número limitado
de lazos –o al menos un número limitado de lazos fuertes. Esto probablemente se
deba a que los actores sociales tienen recursos limitados, energía, tiempo y capacidad
cognitiva –y no pueden mantener un gran número de lazos fuertes. También es cierto
que las estructuras sociales pueden desarrollar un grado considerable de orden y
solidaridad con relativamente pocas conexiones.
12
Los métodos de “bola de nieve” comienzan focalizando un actor o conjunto de
actores, a cada uno de los cuales se les pregunta por algunos de sus lazos con otros
actores. Entonces, se toman todos los actores mencionados (que no sean parte de la
lista original) y se les pregunta de nuevo por algunos de sus lazos. El proceso
continúa hasta que no se identifiquen nuevos actores o hasta que se decida detenerlo
(a menudo por motivos de tiempo y recursos, o porque los nuevos actores
identificados son muy marginales con respecto del grupo que se intenta estudiar).
El método de bola de nueve puede ser muy útil para el seguimiento de poblaciones
“especiales” (a menudo subconjuntos de gente numéricamente pequeños, mezclados
con otros más grandes). Las redes de contactos de negocios, élites de la comunidad,
subculturas desviadas, filatélicos ávidos, redes de parentesco y muchas otras
estructuras pueden ser efectivamente ubicadas y descritas a través de métodos de
bola de nieve. A veces no es difícil alcanzar la completitud en “muestreos” de bola de
nieve. Las limitaciones en los números de lazos fuertes que tienen la mayoría de los
actores, y la tendencia de los lazos a ser recíprocos, a menudo facilitan la búsqueda
de límites.
Los enfoques de bola de nieve pueden reforzarse pensando con cuidado cómo
seleccionar los nodos iniciales. En muchos estudios puede haber un punto de partida
natural. En estudios sobre el poder en comunidades, por ejemplo, es común comenzar
con los jefes ejecutivos de las organizaciones económicas, culturales y políticas más
grandes. Mientras este enfoque no pretenda considerar la mayor parte de la
comunidad (aquellos individuos que están “aislados” de la élite de la red), el enfoque
identificará probablemente la élite social con bastante eficiencia.
13
Redes ego-céntricas (con conexiones a otros) . En muchos casos no será posible
(o necesario) trazar la totalidad de las redes comenzando con nodos focales (como en
el método de bola de nieve). Un enfoque alternativo es comenzar con una selección
de nodos focales (egos), e identificar los nodos con los que ellos están conectados.
Entonces determinamos cuáles de los nodos identificados en la primera fase están
conectados con los demás. Esto puede hacerse contactando cada uno de los nodos; a
veces podemos pedir a ego que nos informe qué nodos con los que está conectado
tienen lazos con otros.
Este tipo de enfoque puede resultar muy efectivo para obtener un formulario de datos
relacionales de poblaciones grandes y puede combinarse con enfoques basados en
los atributos. Por ejemplo, podemos tomar una muestra simple aleatoria de
estudiantes universitarios varones, y pedirles que identifiquen a sus amigos más
cercanos y cuáles de éstos conocen a otros. Este tipo de enfoque puede darnos una
imagen buena y fiable de los tipos de redes (o al menos de los vecindarios locales) en
los cuales se encuentra insertos los individuos. Podemos obtener resultados tales
como cuántos nodos de conexiones tienen y hasta qué puntos esos nodos forman
núcleos fuertes. Tales datos pueden ser muy útiles para entender las oportunidades y
restricciones que tienen los individuos, como resultado de la forma en la que están
insertos en sus redes.
14
redes afectan a los individuos, y ellos también proporcionan una fotografía
(incompleta) del entramado de la red como un todo.
Supongamos, sin embargo, que obtenemos información de los vínculos del individuo
con los otros, pero no sobre las conexiones entre esos otros individuos. Datos de este
tipo no constituyen realmente datos de una “red” como tal. Es decir, no pueden
representarse como una matriz cuadrada de lazos actor * actor. Pero no significa que
los datos egocéntricos sin conexiones entre los otros no sirvan para que los analistas
utilicen un enfoque estructural o de red para entender a los actores. Podemos saber,
por ejemplo, que algunos actores tienen muchos amigos muy cercanos y parientes y
que otros tienen pocos. Sabiendo esto, podemos entender algo acerca de las
diferencias en la localización de los actores en la estructura social, y hacer algunas
predicciones sobre cómo esos puestos limitan su comportamiento. Lo que no
podemos saber con ninguna certeza, partiendo de datos egocéntricos, es la
naturaleza de la estructura marco de la red en su totalidad.
RELACIONES MÚLTIPLES
En un conjunto de datos convencional del tipo actor * atributo, cada actor es descrito a
través de muchas variables (y cada variable es atribuida a varios actores). En el tipo
más común de conjunto de datos de redes sociales sobre actor * relación, sólo se
describe un tipo de relación. En tanto estemos interesados en múltiples atributos de
15
los actores, estaremos interesados en múltiples tipos de relaciones que conectan a
éstos en la red.
¿Si no sabemos qué relaciones estudiar, cómo podemos decidirnos? Existen algunos
enfoques conceptuales que pueden ayudarnos. La teoría de sistemas, por ejemplo,
sugiere dos dominios el material y el informacional.
16
nodos. Sin embargo, hay que tener la precaución de no confundir la simple posesión
de un atributo común (por ejemplo el género) con la presencia de un lazo (por ejemplo
el intercambio de puntos de vistas entre dos personas acerca de temas de género).
Las metodologías para trabajar con datos multirelacionales no están tan desarrolladas
como aquellas que trabajan con relaciones simples. Muchas áreas de trabajo
interesantes tal como la correlación de redes, escalado y agrupación multidimensional,
y álgebra de roles se han desarrollado para trabajar con datos multirelacionales. La
mayor parte de estas temáticas están más allá del espacio cubierto por este texto y es
mejor abordarlos una vez se ha desarrollado el análisis básico de redes de relaciones
simples.
ESCALAS DE MEDIDA
Como otros tipos de datos, también la información que se recoge sobre los lazos entre
los actores puede ser medida en diferentes “niveles de medición” (podemos por
ejemplo asignar puntuaciones a nuestras observaciones). Los diferentes niveles de
medición son importantes, ya que limitan los tipos de preguntas que el investigador
puede plantearse. Las escalas de medida también son importantes ya que cada tipo
de escala tiene diferentes propiedades matemáticas y exige la utilización de
algoritmos diferentes para describir patrones y ensayar inferencias sobre ellos.
17
La mayor parte del desarrollo de la teoría de grafos en matemáticas y muchos
algoritmos para la medición de propiedades de actores y redes, han sido desarrollados
a través de datos binarios. Los datos binarios son ampliamente utilizados en análisis
de redes, así que no es poco frecuente encontrar datos medidos en el nivel “más alto”
transformados en puntuaciones binarias antes de proceder al análisis. Para hacer
esto, uno simplemente selecciona algún “punto de corte” y vuelve a recodificar los
casos por debajo de ese punto (con cero) o por encima de él (con uno). Los datos
binarios implican desperdicio de información. El analista necesita considerar qué es
relevante (por ejemplo ¿a qué se refiere la hipótesis? ¿se refiere a la presencia de
estructuras de relaciones, o a la fortaleza de éstos?), y qué algoritmos deben aplicarse
para decidir si es razonable recodificar los datos. Muy a menudo, el poder y
simplicidad del análisis de datos binarios compensa la pérdida de información.
18
“agradan”, “desagradan” o les son “indiferentes”. El resultado es una escala ordinal
agrupada (por ejemplo, puede haber más de una persona que “agrade” y las
categorías reflejan una línea importante en el orden de intensidad). A menudo, este
tipo de escala de tres puntos ha sido codificada: -1, 0 y +1, para reflejar el agrado
negativo, indiferencia y agrado positivo. Cuando se puntúa de esta forma, los signos
positivos y negativos, hacen más fácil escribir algoritmos que tendrán en cuenta y
describirán diferentes propiedades de la red (por ejemplo el equilibrio estructural del
grafo).
Las medidas ordinales agrupadas pueden utilizarse para reflejar una gran cantidad de
diferentes aspectos cuantitativos de las relaciones. Los analistas de redes a menudo
están involucrados en la descripción de la “fuerza” de los lazos. Pero “fuerza” puede
significar muchas tipos de cosas diferentes. Una dimensión es la frecuencia de la
interacción - ¿los actores tienen contacto diariamente, semanalmente, mensualmente,
etcétera. Otra dimensión es la “intensidad”, lo cual a menudo refleja el grado de
implicación emocional asociado con la relación (por ejemplo, los lazos de parentesco
pueden ser infrecuentes, pero implican una “carga emocional” debido a la expectativas
altamente ritualizadas e institucionalizadas). Las relaciones pueden ser más fuertes si
involucran muchos contextos diferentes o tipos de lazos. Totalizando los datos
nominales en función la presencia o ausencia de múltiples tipos de relaciones, surge
una escala ordinal (de hecho, un intervalo) de una dimensión que mide la fuerzade la
relación. Las relaciones recíprocas también parecen ser más fuertes. Normalmente
podemos valorar la reciprocidad pidiendo a cada actor de una díada que nos diga sus
preferencias sobre los demás. Sin embargo, también se puede preguntar a cada actor
acerca de sus percepciones del grado de reciprocidad en una relación: “¿Quiere decir
que ustedes no se agradan mutuamente, que a usted le agrada más X que usted a él,
que a X le agrada usted más que él a usted, o que se agradan mutuamente?”
Las escalas ordinales de medición contienen más información que las nominales. Es
decir, las puntuaciones reflejan sutiles diferencias de la fortaleza del lazo más que una
simple “presencia o ausencia”. Esto debe verse como algo positivo. Sin embargo con
frecuencia es difícil aprovechar los datos ordinales. Los algoritmos más comúnmente
usados para el análisis de redes sociales han sido diseñados para datos binarios.
Muchos han sido adaptados para datos contínuos – pero para escalas de intervalo
más que para escalas ordinales de medición. Los datos ordinales, en consecuencia, a
menudo son convertidos en binarios escogiendo algún punto de corte y
recodificándolos. De forma alternativa, los datos ordinales a veces son tratados como
19
si ellos fueran realmente intervalos. La primera estrategia, sin embargo, tiene el riesgo
de la adecuada selección de los puntos de corte; la última estrategia también tiene
riesgos ya que los intervalos de puntos separados en una escala ordinal pueden
resultar muy heterogéneos.
Las medidas ordinales del ranking de relaciones son poco frecuentes en la literatura
de análisis de redes sociales, así como también en la mayoría de las demás
orientaciones. En consecuencia, hay relativamente pocos métodos, definiciones y
algoritmos que se beneficien específica o totalmente de la información de tales
escalas. Muy a menudo, las medidas ordinales del ranking de relaciones son tratadas
como si fuesen intervalos. Existe la posibilidad de que sea menos arriesgado tratar las
medidas ordinales del ranking de relaciones (comparadas con las medidas ordinales
agrupadas) como si fuesen un intervalo, aunque tal suposición es discutible. Por
supuesto, también es posible agrupar las puntuaciones del ranking de posiciones (por
ejemplo produciendo una escala ordinal agrupada), binarizar los datos (por ejemplo
las tres primeras elecciones serán tratadas como lazos, y las restantes como ausencia
de lazos). En la combinación de información de múltiples tipos de lazos con
frecuencia es necesario simplificar las escalas de ranking de posiciones. Pero si
tenemos varias escalas de ranking que deseamos combinar para formar una escala
(por ejemplo posiciones de los gustos de las personas hacia los demás, frecuencia de
interacción , etcétera), la suma de tales escalas en un índice puede ser
razonablemente tratado como una verdadera medida de intervalo.
20
valorados en escalas en las que la diferencia entre un “1” y un “2” refleja la misma
diferencia real que entre “23” y “24”.
Aún cuando es una buena idea medir la intensidad de la relación en el nivel más
refinado posible, la mayoría de los análisis de redes no trabajan en este nivel. La
comprensión más importante de los análisis de redes, y de muchos de las
herramientas matemáticas y gráficas utilizadas por los analistas de redes, fueron
desarrolladas para grafos simples (por ejemplo, binarios, indirectos). Muchas de las
descripciones de la inserción de los actores en sus redes, y de las redes en sí
mismas, son pensadas en la literatura de redes comúnmente en términos discretos.
Como resultado, a menudo se busca reducir incluso los datos de intervalo al nivel
binario escogiendo un punto de corte y codificando la fortaleza del lazo por encima de
él con un “1”, y con un “0” si está por debajo. Desafortunadamente, no hay una forma
”correcta” de escoger un punto de corte. La teoría y los propósitos del análisis
proporcionan la mejor guía para ello. A veces el examen de los datos puede ayudar
21
(quizás la distribución de la fuerza de las relaciones es realmente bimodal discreta, y
muestra un punto de corte claro; quizás la distribución está fuertemente sesgada y la
característica principal es la distinción entre la presencia y la ausencia de relación).
Cuando se escoge un punto de corte, es sensato considerar también valores
alternativos más altos o más bajos, y repetir el análisis con diferentes puntos de corte
para ver si se afecta el sentido de los resultados. Esto puede ser tedioso, pero es muy
necesario. De otro modo, uno puede equivocarse al pensar que se ha encontrado un
patrón real, cuando sólo se ha observado la consecuencia del punto en que hemos
decidido insertar el punto de corte.
En los capítulos que siguen en este texto, nos vincularemos más con el lado
“matemático” del análisis de redes que con el “estadístico” (de nuevo, es importante
recordar que expongo las diferencias en esta discusión). Antes de seguir con ello,
debemos mencionar un par de puntos importantes sobre la relación entre el material
que se estudiará aquí y los enfoques estadísticos principales en sociología.
Por un lado, hay una pequeña diferencia aparente entre los enfoques estadísticos
convencionales y los enfoques de redes. Las herramientas estadísticas descriptivas
22
univariables, bivariables o incluso multivariables, se utilizan comúnmente en la
descripción, exploración y modelado de datos de redes sociales. Los datos de redes
sociales, como hemos dicho antes, se representan fácilmente como matrices de
números –al igual que otros tipos de datos sociológicos. Como resultado, los mismos
tipos de operaciones pueden hacerse con datos de redes y con los demás tipos de
datos. Los algoritmos de estadística se utilizan con frecuencia para describir las
características de las observaciones individuales (por ejemplo, la fortaleza de lazo
mediana de un actor X con todos los demás en una red) y la red como un todo (por
ejemplo, la media de toda la fuerza de los lazos para todos los actores en la red). Los
algoritmos estadísticos se utilizan mucho en la evaluación del grado de similaridad
entre los actores y si se encuentra patrones en los datos de la red (por ejemplo,
análisis factorial, análisis de clusters, escalado multidimensional). Incluso las
herramientas del modelado predictivo son aplicadas con frecuencia a los datos de
redes (por ejemplo, la correlación y la regresión).
Las herramientas estadísticas descriptivas son de hecho algoritmos para sumariar las
características de las distribuciones de frecuencias. Es decir, son operaciones
matemáticas. Donde la estadística es realmente “estadística”, es en el lado inferencial.
Es decir, cuando nuestra atención se gira hacia la valoración de la capacidad de
reproducción o la probabilidad del patrón que describimos. La estadística inferencial
puede ser, y de hecho es, aplicada al análisis de datos reticulares. Pero hay algunas
diferencias muy importantes entre la esencia de la estadística inferencial utilizada en
los datos de redes y aquella más comúnmente utilizada en los cursos básicos de
análisis estadístico en sociología.
23
menor interés para los investigadores de redes. En muchos casos, se encuentran
estudiando una red en particular o un conjunto de éstas, y no tienen interés en
generalizar una población de tales redes (bien porque no hay tal población o porque
no interesa generalizarla de forma probabilística). En otros casos, podemos tener
interés en generalizar, pero la muestra no ha sido extraída por métodos estadísticos.
El análisis de redes, a menudo confía en herramientas como la observación directa,
experimentos de laboratorio y documentos como archivos de datos – y
frecuentemente no hay formas plausibles de identificar poblaciones y extraer muestras
a través de métodos de probabilidad.
24
usualmente resultarán en subestimaciones de la variabilidad real del muestreo, y
demasiada confianza en nuestros resultados.
25
cuando los mecanismos causales no-aleatorios que se cree causa el grupo no operan
de hecho.
Esto puede parecer extraño, y es ciertamente un gran trabajo (la mayoría del cual,
afortunadamente, puede ser hecho por ordenador). Pero realmente, no es muy
diferente de la lógica de la prueba de hipótesis con datos que no sean reticulares. Los
datos de redes sociales tienden a diferir de los datos de encuestas más
“convencionales”, en algunas formas claves: los datos de redes a menudo no son
muestras probabilísticas, y las observaciones de los nodos individuales no son
independientes. Estas diferencias son importantes para las preguntas sobre la
generalización de los hallazgos y sobre los mecanismos de contrastación de hipótesis.
Sin embargo, no hay nada sustancialmente distinto sobre la lógica del uso de la
estadística descriptiva e inferencial para datos de redes sociales.
26
INTRODUCCIÓN A LOS MÉTODOS
MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.
SOCIALES.
CAPÍTULO SEGUNDO
Este documento está traducido para la lista REDES con permiso del autor a partir de
la versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html< [Fecha de consulta:
Octubre de 2000].
2
CAPÍTULO I I. ¿POR QUÉ UTILIZAR MÉTODOS
MÉTODOS
FORMALES EN EL ANÁLISIS
ANÁLISIS DE REDES
SOCIALES?
Para entender acertadamente una red social es necesario realizar una descripción
completa y rigurosa de la estructura de sus relaciones como punto de partida para el
análisis. De manera ideal, deberíamos conocer todas las relaciones entre cada par de
actores en la población estudiada.
Supongamos, por ejemplo, que tenemos información acerca de los flujos de comercio
de 50 mercancías (café, azúcar, té, copra, bauxita, etc.) entre las 170 o más naciones
3
del sistema mundial para un año determinado. Aquí, las 170 naciones pueden ser
vistas como actores o nodos y el monto de cada mercancía exportada de una nación
a otra puede ser pensada como la intensidad de un lazo dirigido desde una nación a
otra. Un investigador podría estar interesado, por ejemplo, en saber si las
“estructuras” del comercio de productos minerales son más similares entre ellas que,
por ejemplo, el comercio entre productos minerales y vegetales. Para responder esta
pregunta aparentemente simple (pero importante) es necesario manejar una cantidad
enorme de información. Literalmente, podría llevar años realizarlo a mano. Un
ordenador puede hacerlo en pocos minutos.
Podríamos también describir este patrón de lazos vinculantes con un matriz, donde
las filas representen las elecciones realizadas por cada actor. Pondremos “1” si a un
actor le gusta otro y "0" si no. Este sería el resultado:
Bob --- 1 1 0
Carol 0 ---- 1 0
Ted 1 1 --- 1
4
Alice 0 0 1 ---
Al utilizar matrices surge inmediatamente una pregunta: la diagonal central está vacía
(por ejemplo: a Bob le gusta Bob, a Carol le gusta Carol). ¿Es esto razonable? ¿O
nuestra descripción del patrón de relaciones debería incluir algunas consideraciones
acerca de las “auto-relaciones”? No existe ninguna respuesta para correcta para esta
pregunta. Nos limitaremos a sostener que utilizar una matriz para representar lazos
entre actores permite ver patrones con mayor facilidad y puede motivar preguntas
(incluso preguntas útiles) que una descripción verbal no generaría.
Esto es muy útil, ya que el análisis sistemático de una red puede ser extremadamente
tedioso si el número de actores o de tipos de relaciones entre los actores es grande.
Gran parte de ese trabajo es lento, repetitivo y poco interesante, pero requiere
5
precisión. Ese es exactamente el tipo de cosas que los ordenadores hacen bien y
nosotros no.
A veces son las reglas y las convenciones las que permiten que nos comuniquemos
con claridad. También las reglas y convenciones del lenguaje matemático y de grafos
en sí mismas permiten ver matices en la información que podríamos pasar por alto si
sólo la hubiésemos descrito con palabras.
6
INTRODUCCIÓ N A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.
Este documento está traducido para la lista REDES con permiso del autor a partir de
la versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html< [Fecha de consulta:
Octubre de 2000].
2
CAPÍTULO III. REPRESENTACIÓ N DE REDES
SOCIALES MEDIANTE GRAFOS.
INTRODUCCIÓ N
Los analistas de redes sociales utilizan dos tipos de herramientas matemáticas para
representar información sobre los patrones de relaciones entre actores sociales: grafos
y matrices. En este capítulo, aprenderemos lo suficiente sobre grafos como para
entender cómo representar los datos de redes sociales. En el siguiente capítulo
introduciremos las representaciones matriciales de las relaciones sociales. Utilizando
esas dos herramientas podremos entender la mayor parte de las operaciones que los
analistas de redes sociales realizan esta información (por ejemplo, calcular medidas
precisas de la “densidad relativa de relaciones”).
Sobre estos temas hay muchísima más información que la que presentaremos aquí:
las matemáticas disponen de subdisciplinas dedicadas completamente a la teoría de
grafos y al álgebra de matrices. Los científicos sociales han tomado prestadas
simplemente unas cuantas cosas que piensan que pueden ser útiles para describir y
analizar las estructuras de las relaciones sociales.
GRAFOS Y SOCIOGRAMAS
3
Existen muchas variaciones en los sociogramas, pero todos ellos comparten la
característica común del uso de un círculo etiquetado para cada actor en la población
que describimos y segmentos de línea entre pares de actores para representar el
hecho que existe un vínculo entre ellos. Supongamos que estamos interesados en
saber quién nombra a quién como “amigo” en un grupo de cuatro personas (Bob,
Carol, Ted y Alice). Comenzaremos representando cada actor como un “nodo” con
una etiqueta (a veces los nodos se representan con etiquetas en círculos o cuadrados).
B C
T A
Recogemos nuestros datos sobre lazos de amistad preguntando a cada miembro del
grupo (privada y confidencialmente) quiénes consideran sus “amigos cercanos”de una
lista de los otros miembros del grupo. Cada una de las cuatro personas podría
simplmente escoger a una de las otras tres como “amigo/a cercano/a”. Suponiendo
que sesto hay ocurrido, en nuestro caso ficticio, Bob escogió a Carol y Ted, pero no a
Alice; Carol escogió sólo a Ted; Ted escogió a Bob, Carol y Alice; y Alice escogió sólo a
Ted. Podemos representar esta información dibujando una flecha desde quién escoge
hasta el que es escogido en el grafo siguiente:
B C
T A
4
TIPOS DE GRAFOS
Ahora necesitamos introducir alguna terminología para describir los distintos tipos de
grafos. El ejemplo anterior en particular es binario y orientado (en contraposición
contraposición al grafo con signos, ordinal o ponderado, con presencia simultánea de
vínculos). Las relaciones sociales descritas aquí también son simples (opuestas a las
múltiples o multiplexadas).
En la descripción del patrón de quién señala a quién como un amigo cercano, pudimos
haber hecho nuestra pregunta de muchas formas. Si preguntamos a cada entrevistado
“¿esta persona es o no un amigo cercano?”, estamos pidiendo una respuesta binaria:
cada persona es o no escogida por cada entrevistado. Muchas relaciones sociales
pueden ser descritas de esta forma: lo único que importa es si existe o no el vínculo.
Cuando nuestros datos se recogen de esta forma, podemos rerpesentarlos de una
manera simple: una flecha representa que se hizo una nominación y ninguna
representa la inexistencia de una nominación.
Pero pudimos haber hecho la pregunta de otra forma: “para cada una de las personas
en esta lista, indique si le gusta, desagrada o no le importa”. Podemos asignar un +
para indicar “agrado”, cero para indicar “no importa” y un – para indicar “desagrado”.
Esta clase de datos se llama datos “con signos”. El grafo con datos orientados utiliza
un + en la flecha para indicar una nominación positiva, un – para indicar una
nominación negativa y ninguna flecha para indicar una posición neutral o indiferente.
Sin embargo, puede realizarse la pregunta desde un enfoque diferente: “ordene tres
personas de esta lista según le agrade más, regular o menos”. Esto nos dará un
“orden de posiciones” o datos “ordinales”, que describen la fortaleza de cada
nominación de amistad. Finalmente, hemos podido preguntar “en una escala de menos
100 a más 100 –dónde –100 indica que se odia a esa persona, cero significa que se
siente neutral y +100 indica que se ama a esa persona- cómo se siente hacia ...”. Esto
nos dará información acerca del valor de cada nominación en un (al menos supuesto)
nivel proporcional de medición. Tanto en un grafo ordinal como en uno ponderado,
podremos colocar la medida de la fortaleza de la relación en la flecha del diagrama.
5
Vínculos orientados o “recíprocos”en el grafo
En nuestro ejemplo pedimos a cada miembro del grupo que escogiese a quiénes del
grupo consideraba como amigos cercanos. En este caso, a cada persona (ego) se le ha
preguntado sobre los vínculos o relaciones que ellos mismos dirigen hacia otros
(alters). Las personas nominadas no sienten necesariamente de igual forma acerca de
cada relación que ego: Bob puede señalarse a sí mismo como buen amigo de Alice,
pero Alice no necesariamente señala a Bob como buen amigo. Es muy útil describir
muchas estructuras sociales como formadas por vínculos “orientados”(que pueden ser
binarios, con signos, ordenados o ponderados). De hecho, la mayoría de los procesos
sociales incluyen secuencias de acciones dirigidas. Por ejemplo, supóngase que la
persona A hace un comentario a B, entonces B devuelve otro comentario a A y así
sucesivamente. Podemos desconocer el orden en el que sucedieron las acciones (por
ejemplo, quién comenzó la conversación), o puede que no nos importe. En este
ejemplo, podríamos querer saber solamente que “A y B tienen una conversación”. En
este caso, el vínculo o relación “conversando con”, incluye necesariamente ambos
actores A y B. Los dos actores, A y B, están “presentes” o son “concurrentes” en la
relación de “tener una conversación”. O también podemos describir la situación como
un ejemplo del tipo de institución social denominada “conversacion”, la cual, por
definición, involucra a dos (o más) actores “conectados” en una interacción
(Berkowitz).
Los grafos “orientados” utilizan la convención de que los actores o nodos se conectan
a través de líneas que tienen punta de flecha para indicar quién orienta el vínculo
hacia quién. Esto es lo que hicimos en los grafos anteriores, donde los individuos
(egos) dirigieron sus nominaciones hacia los otros (alters). Los grafos de
“concurrencia”, “presencia” o “recíprocos”, utilizan la convención de que los actores
involucrados en la relación se conectan con un segmento de línea simple (sin punta de
flecha). Aquí hay que ser muy cuidadosos. En un grafo dirigido, Bob pudo escoger a
Ted y Ted escoger a Bob. Esto podría ser representado por flechas con punta yendo
desde Bob hacia Ted y viceversa, o por una doble flecha. Pero esto tiene un sentido
distinto a un grafo que muestre a Bob y Ted conectados por un único segmento de
línea sin puntas de flecha. Tal grafo querría indicar que “hay una relación llamada
amistad cercana que une a Bob y a Ted”. La distinción puede ser sutil, pero en algunos
análisis es importante.
6
Relaciones simples o múltiples en el grafo
Podemos ver que el segundo tipo de vínculo, “el parentesco”, acentúa la fortaleza de
las relaciones entre Bob y Ted y entre Ted y Alice (o quizás, la presencia de un vínculo
de parentesco explique la nominación mutua como buenos amigos). El vínculo
recíproco de amistad entre Carol y Ted, sin embargo, es distinto, ya que no está
reforzado por un vínculo familiar.
7
RESUMEN
Un grafo (a veces llamado sociograma) está compuesto por nodos (actores o puntos)
conectados por líneas (relaciones o vínculos). Un grafo puede representar un único
tipo de relaciones entre los actores (simple), o más de un tipo de relación (múltiple).
Cada vínculo o relación puede ser orientado (por ejemplo, se origina con un actor
fuente y alcanza a un actor objetivo), o puede ser un vínculo que representa
concurrencia, presencia o un reciprocidad entre el par de actores. Los vínculos
orientados se representan con flechas, los vínculos recíprocos se representan con
segmentos de recta. Los vínculos orientados pueden ser recíprocos (A nomina a B y
viceversa); tales vínculos pueden representarse con una flecha con doble punta. La
fortaleza de los vínculos entre actores en un grafo puede ser nominal o binaria
(representan presencia o ausencia de vínculo); con signos (representa un vínculo
negativo; un vínculo positivo o ningún vínculo); ordinales (representan si el vínculo es
fuerte, menos fuerte, etc.); o ponderada (midiendo un intervalo o nivel promedio). Al
hablar de la posición de un actor o nodo en un grafo con respecto a otros nodos o
actores en el mismo, nos referimos al actor focal como “ego” y a los otros como
“alters”.
PREGUNTAS DE ESTUDIO
1. ¿Qué son “nodos”y “líneas”? ¿Qué se utiliza para representar nodos y arcos en
un sociograma?
2. ¿Cómo se corresponden los grafos con signos, binarios y ponderados con los
niveles de medición “nominal,”ordinal”e “interválica”?
8
PREGUNTAS DE APLICACIÓ N
3. Pensar en algún grupo pequeño del cual se sea miembro (quizás un club, un
grupo de amigos, o gente viviendo en un mismo piso, etc.). ¿Qué tipos de
relaciones entre ellos podrían decirnos algo acerca de las estructuras sociales
de esta población? Intentar dibujar un grafo que represente uno de los tipos de
relaciones escogido. ¿Es posible ampliar este grafo para describir también un
segundo tipo de relación? (por ejemplo, uno podría empezar con “quién le
agrada a quién”y añadir “quién pasa más tiempo con quién”).
9
INTRODUCCIÓ N A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.
Este documento está traducido para la lista REDES con permiso del autor a partir de
la versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html> [Fecha de consulta:
Mayo de 2001].
2
CAPÍTULO IV. REPRESENTACIÓ N DE REDES
SOCIALES MEDIANTE MATRICES
INTRODUCCIÓ N
Los grafos constituyen una manera muy útil de representar información sobre
redes sociales. Sin embargo, cuando existen muchos actores y/o muchas
clases de relaciones, éstos pueden hacerse tan visualmente complicados que
se hace muy difícil identificar estructuras. En su lugar, también es posible
representar la información sobre redes sociales en forma de matrices. De esta
forma, la representación de la información permite la utilización de
herramientas matemáticas y de computación para identificar estructuras. Los
analistas de redes sociales utilizan las matrices de una variedad de formas. Es
por ello que son necesarios ciertos conocimientos matemáticos básicos sobre
el tema. En este texto revisaremos los aspectos básicos que son necesarios
para entender qué es lo que hacen los analistas de redes sociales. Para
aquellos que quieran profundizar más en el tema, existen excelentes manuales
introductorias al álgebra de matrices para científicos sociales.
3
2*4
4*2
1,1 1,2
2,1 2,2
3,1 3,2
4,1 4,2
Los científicos sociales que utilizan matrices para representar redes sociales a
menudo no utilizan las convenciones matemáticas y simplemente muestran sus
datos como una ordenación de filas y columnas etiquetadas. Las etiquetas no
son realmente parte de la matriz, sino que son utilizadas sólo para clarificar la
presentación. La matriz que se muestra a continuación, por ejemplo, es una
matiz de 4 por 4, con etiquetas adicionales:
4
Bob Carol Ted Alice
Bob - 1 0 0
Carol 1 - 1 0
Ted 1 1 - 1
Alice 0 0 1 -
LA MATRIZ DE “ADYACENCIA”
B C
T A
Ya que los vínculos se miden en el nivel nominal (es decir, los datos son datos
binarios de preferencias), se puede representar la misma información en una
matriz como la siguiente:
5
B C T A
B - 1 0 0
C 1 - 1 0
T 1 1 - 1
A 0 0 1 -
Es necesario tener presente que las filas representan el origen de los vínculos
dirigidos y las columnas los destinos: Bob escogió a Carol, pero Carol no lo
escogió a él. Éste es un ejemplo de una matriz “asimétrica” que representa
vínculos dirigidos (vínculos que van de un origen a un receptor). Es decir, el
elemento i,j no necesariamente es igual que el elemento j,i. Si los vínculos que
representamos en nuestra matriz fueran “vínculos recíprocos” (por ejemplo,
vínculos que representan la relación “es compañero de negocios de ...”), o de
“co-presencia o concurrencia”, (e.g. dónde los vínculos representan una
relación como “trabaja en el mismo grupo de directores que...”) la matriz
necesariamente sería simétrica; es decir, el elemento i,j sería igual al elemento
j,i.
6
En la representación de datos de redes sociales como matrices, la pregunta
que siempre surge es: ¿qué hago con los elementos de la matriz donde i=j? Es
decir, por ejemplo, ¿Bob se ha considerado como amigo cercano de él mismo?
A esta parte de la matriz se le conoce como la diagonal principal. A veces, el
valor de la diagonal principal carece de significado y se ignora (se deja en
blanco). A veces, sin embargo, la diagonal principal puede ser de gran
importancia, y puede tomar valores muy significativos. Esto es particularmente
cierto cuando las líneas y las columnas en nuestra matriz son “supernodos” o
“bloques”. Veremos esto en breve.
Bob - 1 0 0
7
Carol 1 - 1 0
Ted 1 1 - 1
Alice 0 0 1 -
Reorganicemos (permutemos) la matriz de forma tal que los dos hombres y las
dos mujeres sean adyacentes en la matriz. La permutación de la matriz
simplemente significa el cambio del orden de las líneas y columnas. En tanto
que la matriz es simétrica, si se cambia la posición de una línea, se debe
cambiar la posición de su columna correspondiente.
Bob - 1 1 0
Ted 1 - 1 1
Carol 0 1 - 0
Alice 0 0 1 -
8
Este tipo de agrupamiento de celdas con frecuencia se hace en análisis de
redes para entender cómo algunos conjuntos de actores se encuentran
“inmersos” en roles sociales o en entidades grandes. Aquí, por ejemplo, puede
verse que todos los ocupantes del rol social conocido como “mujer” escoge a
los demás como su amigo; que ninguna mujer escoge a otra como su amiga, y
que los hombres son más propensos a escoger mujeres (se han seleccionado
3 de cuatro posibilidades), que las mujeres a escoger hombres (se han
seleccionado sólo 2 de las cuatro posibles combinaciones). Se ha agrupado a
las mujeres juntas para crear una “partición”, “supernodo” , “rol social” o
“bloque”. A menudo se dividen matrices de redes sociales de esta forma para
identificar y probar ideas acerca de la forma en que los actores se encuentran
“involucrados” en roles sociales u otros “contextos”.
Matriz de bloques de
densidad
Hombre Mujer
9
Matriz Imagen
Hombre Mujer
Hombre 1 1
Mujer 0 0
10
correlación entre una matriz de adyacencia y la traspuesta de esa matriz es la
medida del grado de reciprocidad de los vínculos. La reciprocidad de los
vínculos puede ser una propiedad muy importante de una estructura social ya
que se refiere tanto al equilibrio como al grado y forma de la jerarquía de una
red.
Se trata de una operación matemática que origina una matriz tal que al
multiplicarla por la matriz original, produce una matriz nueva con números 1 en
la diagonal principal y cero en las demás posiciones (esto recibe el nombre de
matriz de identidad). Sin ahondar en este tema, puede pensarse que la inversa
de una matriz es un tipo “opuesto” de la matriz original. Las matrices inversas
se utilizan para hacer otros cálculos en el análisis de redes sociales. Sin
embargo, a veces también es interesante estudiarlas en sí mismas. Es algo
similar a mirar un rótulo negro sobre un papel blanco en contraste con un
rótulo en blanco sobre un papel negro: a veces pueden observarse cosas
diferentes.
Éstas son las operaciones matemáticas con matrices más fáciles. Simplemente
se suma o resta cada elemento correspondiente i,j de dos (o más) matrices.
Por supuesto, para realizar esto, las matrices deben tener el mismo número de
elementos i y j (a esto se le llama matrices “compatibles” con la adición y la
sustracción) –y los valores de i y j deben estar en el mismo orden en cada
matriz. A menudo, la suma y la resta de matrices se utilizan en análisis de
redes cuando se intenta simplificar o reducir la complejidad de múltiples datos
a formas simples.
11
intercambio de productos; y aquellos con una puntuación de “2” podrían estar
vinculados tanto por relaciones de trueque como por intercambio de productos.
12
Multiplicación y multiplicación Booleana de matrices
0 1
2 3 6 7 8
*
4 5 9 10 11
El resultado es:
13
) ) )
(2*6)+(3*9 (2*7)+(3*10 (2*8)+(3*11
) ) )
(4*6)+(5*9 (4*7)+(5*10 (4*8)+(5*11
) ) )
B C
T A
La matriz de adyacencia para los cuatro actores B, C, T y A (en ese orden) es:
0 1 1 0
0 0 1 0
1 1 0 1
0 0 1 0
Otra forma de pensar en esta matriz, es advertir qué nos dice si hay un camino
de un actor a otro. Un 1 representa la presencia de un camino, un cero
representa la ausencia de éste. La matriz de adyacencia es exactamente lo
que su nombre sugiere – nos dice cuáles actores son cercanos o tienen un
camino directo de uno a otro.
14
(1*0)+(1*0)+(0*1)+(1*0) (1*1)+(1*0)+(0*1)+(1*0) (1*1)+(1*1)+(0*0)+(1*1) (1*0)+(1*0)+(0*1)+(1*0)
(0*0)+(0*0)+(1*1)+(0*0) (0*1)+(0*0)+(1*1)+(0*0) (0*1)+(0*1)+(1*0)+(0*1) (0*0)+(0*0)+(1*1)+(0*0)
O lo que es lo mismo:
1 1 1 1
1 1 0 1
0 1 3 0
1 1 0 1
15
Finalmente, ¿a qué debe prestarse atención?
Algunas de las propiedades fundamentales de una red social tienen que ver
con cómo están conectados los actores a los demás. Las redes que tienen
pocas o débiles conexiones o actores conectados sólo por caminos de gran
longitud, pueden mostrar baja solidaridad, una tendencia a quedar apartados,
lentitud de respuesta a estímulos y otras características similares. Las redes
que poseen conexiones más fuertes con caminos pequeños entre los actores
pueden ser más robustas y más capaces de responder con rapidez y
efectividad. La medición del número y longitud de los caminos entre los
actores en una red nos permite catalogar estas tendencias importantes en toda
red.
Las posiciones de los actores individuales en las redes son también descritas
muy útilmente por el número y la longitud de los caminos que poseen con
otros actores. Los actores que tienen muchos caminos hacia otros actores
pueden ser más influyentes sobre ellos. Los actores que tienen caminos cortos
a muchos otros actores pueden ser figuras influyentes o centrales. Entonces,
el número y la longitud de los caminos en una red son muy importantes para
entender tanto las limitaciones individuales como las oportunidades y para
entender el comportamiento y potenciales de la red en su totalidad.
16
RESUMEN
Los datos de redes sociales son, a menudo, múltiples (por ejemplo, hay
múltiples tipos de vínculos entre los actores). Tales datos se representan como
series de matrices de igual dimensión con los actores en igual posición en
cada matriz. Muchas de las mismas herramientas que se utilizan para trabajar
con una matriz individual (suma y correlación de matrices, formación de
bloques, etc.), son útiles para intentar resumirlas y observar los patrones en
datos múltiples.
17
Preguntas de estudio
Preguntas aplicadas
18
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.
CAPITULO QUINTO
Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].
2
CAPÍTULO V. PROPIEDADES BÁSICAS DE LAS REDES
Y DE LOS ACTORES
En este capítulo examinaremos algunos de las más obvias y menos complejas ideas
de los métodos formales de análisis de redes. A pesar de la simplicidad de las ideas y
definiciones, hay buenas razones teóricas (y alguna evidencia empírica) para creer las
propiedades básicas de las redes sociales tienen importantes consecuencias. Tanto
para los individuos como para las estructuras una cuestión de fundamental
importancia es la de las conexiones. Normalmente, algunos actores tienen muchas
conexiones mientras que otros tienen pocas, especialmente cuando las poblaciones
se convierten en grandes y no todas las conexiones posibles están presentes –existen
“agujeros estructurales”. Hasta qué punto los individuos están conectados unos con
otros y hasta qué punto la red en su conjunto está integrada, son las dos caras de la
misma moneda.
Las diferencias en cómo los individuos están conectados puede ser extremadamente
útil para entender sus atributos y comportamiento. Muchas conexiones significa a
menudo que los individuos se exponen todavía a más y más diversa información.
Individuos bien conectados pueden ser más influyentes y pueden estar más
influenciados por otros. Las diferencias en el grado de conexión de poblaciones
completas puede tener también importantes consecuencias. La enfermedad y los
rumores se extienden muy rápidamente donde hay altas tasas de conexiones. Pero
también lo hace la información útil. Las poblaciones más conectadas puede ser más
capaces para movilizar sus recursos y también pueden disponer de múltiples y
diversas perspectivas para resolver problemas. Entre el individuo y la población hay
otro nivel de análisis –el de la “composición”. Algunas poblaciones pueden estar
compuestas de individuos que son bastantes similares en la forma en la que están
conectados. Otras poblaciones pueden ostentar claras diferencias, con una pequeña
3
elite de personas centrales y conectadas y una gran masa de personas con pocas
conexiones. Las diferencias en conexiones pueden explicarnos algo acerca de cómo
están estratificados los grupos sociales.
Los métodos de las redes sociales tienen un vocabulario para describir la conectividad
y la distancia que podría, de entrada, parecer bastante formal y abstracto. Esto no es
sorprendente ya que muchas de las ideas están tomadas directamente de las teoría
matemática de grafos. Pero vale la pena el esfuerzo de batallar con la jerga. La
precisión y el rigor de las definiciones nos permite comunicar claramente las
propiedades importantes de la estructuras sociales –ya menudo lleva a perspectivas
que no habrían sido posibles si hubiésemos usado aproximaciones menos formales.
4
UN EJEMPLO
Las propiedades básicas de las redes son fáciles de aprender y comprender con
ejemplos. Estudiar un ejemplo también proporciona aplicaciones sociológicamente
significativas de la aplicación de formalismos. En este capítulo observaremos una red
binaria dirigida simple que describe el flujo de información entre 10 organizaciones
formales preocupadas por el bienestar social en una ciudad del medio Oeste de los
Estados Unidos (Knoke and Burke). Por supuesto, los datos reticulares pueden
obtenerse de formas variadas (relaciones no dirigidas, múltiples lazos, relaciones
valoradas, etc.) y un ejemplo no puede contener todas las posibilidades. Sin embargo,
pueden ser bastante sorprendente observar cuánta información puede ser “exprimida”
de una simple matriz binaria usando los conceptos básicos de grafos.
Para redes pequeñas, es a menudo útil examinar directamente el grafo. Aquí tenemos
un dígrafo (grafo dirigido) para los datos de la red de intercambio de información de
Knoke:
5
de información). Como resultado de la variación en cómo los actores están conectados
y si los lazos son recíprocos, algunos actores pueden estar a bastante “distancia” de
otros. Parecen haber grupos de actores que difieren en este sentido ( (1, 2, 4, 5, and 6
parecen estar en el centro de la acción, 6, 9, y 10 parecen ser más periféricos).
Una cuidadosa mirada al grafo puede ser muy útil para obtener una noción intuitiva de
las importancia de las características de una red social. Con grandes poblaciones o
muchas conexiones, sin embargo, los grafos no son de mucha ayuda. Observando el
grafo podemos disponer de una buena visión intuitiva de lo que está pasando, pero
nuestras descripciones de lo que vemos son bastante imprecisas (el párrafo anterior
es un ejemplo de esto). Para ser más precisos, utilizar ordenadores que apliquen
algoritmos para calcular las medidas matemáticas de las propiedades de los grafos, es
necesario trabajar con matrices de adyacencia en lugar de con grafos.
1COUN 2COMM 3EDUC 4INDU 5MAYR 6WRO 7NEWS 8UWAY 9WELF 10WEST
1COUN --- 1 0 0 1 0 1 0 1 0
2COMM 1 --- 1 1 1 0 1 1 1 0
3EDUC 0 1 --- 1 1 1 1 0 0 1
4INDU 1 1 0 --- 1 0 1 0 0 0
5MAYR 1 1 1 1 --- 0 1 1 1 1
6WRO 0 0 1 1 1 --- 1 0 1 0
7NEWS 0 1 0 1 1 0 --- 0 0 0
8UWAY 1 1 0 1 1 0 1 --- 1 0
9WELF 0 1 0 0 1 0 1 0 --- 0
10WEST 1 1 1 0 1 0 1 0 0 ---
Hay diez filas y columnas, los datos son binarios y la matriz asimétrica. Como
mencionamos en el capítulo en el que usamos matrices para representar redes , la fila
es tratada como la fuente de información y la columna como la receptora. Haciendo
algunas operaciones muy simples sobre esta matriz es posible desarrollar un útil y
sistemático índice de números o medidas de algunas de las propiedades de la red que
identificamos a simple vista en el grafo.
6
CONEXIONES
Desde que las redes están definidas por sus actores y las conexiones entre ellos, es
útil empezar nuestra descripción de las redes examinando esas propiedades simples.
Centrándonos en primer lugar en la red en su conjunto, uno podría estar interesado en
el número de actores, el número de conexiones que son posibles y el número de
conexiones efectivamente existentes. Diferencias en el tamaño de las redes y en cómo
los actores están conectados, nos explican dos cosas acerca de las poblaciones
humanas que son críticas. Pequeños grupos difieren de los grandes grupos en
muchos sentidos importantes –además, el tamaño de la población es una de las
variables más importantes en el análisis sociológico. Las diferencias en cómo están
conectados los actores en una población pueden ser un indicador clave de la
solidaridad, la “densidad moral” y la “complejidad” de su organización social .
Los individuos, al igual que las redes, difieren en esas características demográficas
básicas. Los actores individuales pueden tener pocos o muchos lazos. Los individuos
pueden ser “fuentes” de relaciones, “agujeros” (actores que reciben pero no emiten) o
ambos. Esas clases de diferencias básicas entre las conexiones inmediatas de los
actores puede ser crítica explicando cómo ellos ven el mundo y cómo el mundo los ve
a ellos. El número de clases de lazos que los actores tienen constituyen la base para
la similitud o diferencia en relación a otros actores – y por tanto la posible
diferenciación o estratificación. El número y clase de lazos que los actores tienen son
claves para determinar has qué punto su inclusión en la red limita su conducta y el
rango de oportunidades, influencia y poder que tienen.
Es posible que una red no esté completamente conectada. Se trata de una cuestión de
accesibilidad. Pueden existir dos o más grupos desconectados en la población. Si no
es posible que todos los actores puedan alcanzar al resto de los actores, entonces
nuestra población está formada por más de un grupo. Los grupos pueden ocupar el
mismo espacio o tener el mismo nombre pero no todos los miembros están
conectados. Obviamente, tales divisiones en las poblaciones pueden ser
sociológicamente relevantes. Desde el momento que una red no está conectada
pueden darse las condiciones para estratificación y conflicto. Al nivel individual, el
grado al cuál un actor puede alcanzar otros indica hasta qué punto los individuos están
separados del conjunto, o hasta qué punto están aislados. Tal aislamiento puede tener
una significación psicosocial. Si un actor no puede alcanzar o no puede ser alcanzado
por otro, entonces puede que no exista aprendizaje, ayuda o influencia entre los dos.
7
Otra manera útil de mirar a las redes como un conjunto y la manera en la cuál los
individuos están inmersos en ella, es examinar las estructuras locales. Las
aproximaciones más comunes se han centrado en las díadas (series de dos actores) y
en las tríadas (series de tres actores).
Los teóricos de los pequeños grupos argumentan que muchas de las más interesantes
y básicas cuestiones de la estructura social se manifiestan cuando se examinan las
tríadas. Tríadas permiten un rango mucho mayor de relaciones posibles (con
relaciones dirigidas hay de hecho 64 tipologías posibles de relaciones entre tres
actores!), incluyendo las relaciones que exhiben jerarquía, igualdad, y la formación de
grupos exclusivos (e.g. el caso en el dos actores se conectan y excluyen a un tercero).
Así, un pequeño grupo de investigadores sugieren que realmente todas las formas de
relaciones sociales pueden ser observadas en tríadas. A causa de este interés,
podemos realizar un “censo de tríadas” para cada actor y para la red en su conjunto.
En particular podemos estar interesados en la proporción de tríadas que son
“transitivas” (esto es, exhiben un tipo de equilibrio en el que si A dirige un lazo a B, y B
dirige un lazo a C, entonces A también dirige un lazo a C). Estas tríadas transitivas o
equilibradas son propuestas por algunos investigadores como el “equilibrio” o el
estado natural hacia el cuál las relaciones triádicas tienden (¡no todos los teóricos
estarían de acuerdo!).
8
Por tanto, hay realmente bastante que aprender acerca de cómo los actores están
inmersos en las redes y de la estructura de la red examinando las adyacencias.
Volvamos a nuestros datos sobre organizaciones en el campo del bienestar social y
apliquemos esas ideas.
Redes completamente saturadas (por ejemplo una en la cual todos los lazos
lógicamente posibles están de hecho presentes) son empíricamente raras,
especialmente cuando existen más de unos cuantos actores en una población. Es útil
observar hasta qué punto una red está a punto de alcanzar todo su potencial. Esto
significa examinar la densidad de los lazos, la cual se define como la proporción de
9
relaciones existentes en relación a las posibles. Por esto es importante el informe de
la rutina de estadística univariada de UCINET.
Notas: La media es 0.54. Esto es, la media del conjunto de todas las relaciones posibles
(ignorando los lazos reflexivos) es 0,54. Dado que los datos son binarios esto significa que el
54% de todos los lazos posibles están presentes (o lo que es lo mismo: la densidad de la
matriz). La desviación estándar es una medida de cuánta variación hay entre elementos. Si
todos los elementos fuesen un 1 o todos un 0, la desviación estándar seria 0 –no habría
variación. Aquí, la variabilidad media de un elemento a otro es 0,50, casi tan grande como la
media. Por lo tanto, podría decirse que hay relativamente una gran cantidad de variación en las
relaciones. Con datos binarios , la máxima variabilidad en los lazos –o la máxima incertidumbre
sobre si cualquier lazo dado puede estar presente o ausente – se realiza en la densidad de
0.50. A medida que la densidad se aproxima a uno o alternativamente a cero, la desviación
estándar y la varianza entre lazos se reduce.
Dado que los datos en nuestro ejemplo son asimétricos (esto es, lazos o relaciones
dirigidas), podemos distinguir entre relaciones enviadas y relaciones recibidas.
Observando la densidad para cada fila y para cada columna, podemos saber un poco
acerca de la manera en la cuál los actores están inmersos en la densidad global. Aquí
tenemos “al modo de las filas” los estadísticos univariados de nuestro ejemplo tomado
de UCINET:
Notas: Los estadísticos de las filas nos explican el rol que cada actor juega como “fuente” de
relaciones (en un grafo no dirigido). La suma de las conexiones de un actor con el resto (e.g.
actor #1 envía información a los otros cuatro) se llama grado nodal de salida (para los datos
simétricos, por supuesto, cada nodo tiene simplemente un grado nodal y no podemos distinguir
el grado nodal del entrada del grado nodal de salida). El grado nodal de los puntos es
importante porque nos explica cuántas conexiones tiene un actor. El grado nodal de salida es
normalmente una medida de cuan influyente el actor puede ser. Podemos ver que el actor #5
envía lazos a todos los actores restantes menos uno; los actores #6, #7 y #9 envían
información a sólo tres de los actores. Actores #2, #3, #5, y #8 son similares en el sentido de
constituir fuentes de información para porciones importante de la red; los actores #1, #6, #7, y
#9 son similares desde el punto de vista que no constituyen fuentes de información. Podríamos
predecir que el primer grupo de organizaciones dispondrá de divisiones especializadas en
10
relaciones públicas, mientras que el segundo grupo podría no hacerlo. Los actores en el primer
grupo podría tener un alto potencial de influencia; los actores de “en medio” serán influyentes si
están conectados con los actores “correctos” y si no es así tendrán muy poca influencia. Por
tanto, existe variación en los roles que esas organizaciones juegan como fuentes de
información. Podemos normalizar esta información (y por lo tanto compararla con otras redes
de diferentes tamaños) expresando el grado nodal de salida como la proporción del número de
elementos en la fila. Esto es, calculando la media. El actor #10, por ejemplo, envía lazos al
56% de los restantes actores. Este dato lo podemos comparar entre redes de diferentes
tamaños.
Otro modo de pensar acerca de cada actor como fuente de información es mirar a la
varianza o la desviación estándar de las filas. Notamos que los actores con muy pocos
lazos de salida, o muchos lazos de salida tienen menos variabilidad que aquellos que
con niveles intermedios de relaciones. Esto nos dice algo: aquellos actores con lazos
hacia cualquier otro, o con lazos a casi nadie son más "predecibles" en su conducta
hacia otros que aquellos con números intermedios de relaciones. E un sentido, actores
con muchos lazos (en el centro de la red) y actores en la periferia de una red (pocos
lazos) tienen patrones de conducta que están más limitados y son más predecibles.
Actores con solo algunos lazos pueden variar más en su conducta, dependiendo con
quiénes están conectados.
Podemos también observar los datos de las columnas. Ahora, estamos mirando a los
actores como “sumideros” o receptores de información. La suma de cada columna en
la matriz de adyacencia es el grado nodal de entrada del punto. Esto es, cuántos
actores envían información o lazos al nodo que estamos estudiando. Los actores que
reciben información de muchas fuentes pueden ser prestigiosos (otros actores quieren
ser conocidos por el actor y por lo tanto le envían información). Los actores que
reciben información de muchas fuentes pueden ser también más poderosos –desde
que “conocimiento es poder”. Pero, los actores que reciben un montón de información
podrían sufrir también de “sobrecarga de información” o “ruido e interferencia” debida a
los mensajes contradictorios de muchas fuentes.
Notas: Mirando a las medias, podemos observar que hay mucha variación –más que para los
emisores de información. Nosotros vemos que los actores #2, #5, y #7 son muy importantes.
#2 y #5 también son importantes enviando información – por lo tanto ellos actúan como
“comunicadores” y “facilitadores” en el sistema. El actor #7 recibe mucha información pero no
envía demasiada. Por contra, el actor #7, es de hecho un “sumidero de información" –
colecciona hechos, pero no los crea (al menos eso esperamos dado que el actor #7 es un
periódico). Los actores #6, #8, y #10 parecen estar “fuera de juego” – esto es, no reciben
11
información de muchas fuentes directamente. El actor #6 tampoco envía mucha información –
por lo tanto #6 parece estar “aislado”. Los números #8 y #10 envían relativamente más
información de la que reciben. Uno podría sugerir que ellos son “recién llegados” que podrían
intentar ser influyentes, pero que de hecho carecen de las claves adecuadas.
ACCESIBILIDAD
RECIPROCIDAD Y TRANSITIVIDAD
En algunos casos podría ser útil clasificar las relaciones diádicas de cada actor y la
para la red en general. Hemos hecho esto en la siguiente tabla:
12
Nodos Sin lazos Lazos entrantes Lazos salientes Lazos recíprocos Tamaño del vecindario
1COUN 2 3 0 4 (58%) 7
2COMM 1 1 0 7 (88%) 8
3EDUC 3 0 2 4 (67%) 6
4INDU 3 2 1 3 (50%) 6
5MAYR 1 0 0 8 (100%) 8
6WRO 6 0 2 1 (33%) 3
7NEWS 0 5 0 4 (44%) 9
8UWAY 3 0 4 2 (33%) 6
9WELF 3 2 1 3 (50%) 6
10WEST 4 0 3 2 (40%) 5
El tamaño del vecindario para cada actor es el número de otros actores a los cuáles
son adyacentes. Cuando tabulamos los datos acerca de las adyacencias de los
actores como hemos hecho aquí, existe la tendencia a caracterizar los actores en
términos de la similaridad de sus perfiles de relaciones (hablaremos de esto más
adelante). Algunos de los actores son predominantemente “fuentes” (esto es, tienen
tendencia a enviar más que a recibir -- actores #3, #6, y #8). Algunos actores pueden
ser predominantemente “sumideros” (esto es, tienen tendencia a recibir más que a
enviar -- actores #1, #5). Otros actores pueden ser “transmisores” que tanto envían
como reciben, pero a diferentes actores. Seguramente más interesante es que los
actores difieren de forma bastante marcada en su implicación en relaciones mutuas o
recíprocas. Los actores #2 y #5 se diferencian especialmente por tener relaciones
“simétricas” o equilibradas con otros actores.
13
Es también útil examinar las conexiones en términos de relaciones triádicas. El
número de tríadas que existen con 10 actores es muy grande; y, con datos dirigidos,
cada una de las tríadas podría clasificarse en uno de los 64 tipos. Más comúnmente,
el interés se ha centrado en las tríadas transitivas. El principio de transitividad significa
que si A está enlazada a B y B está enlazada a C, entonces A tendría que estar
enlazada a C. La idea, como “equilibrio” y “reciprocidad” es que las relaciones triádicas
(cuando existen relaciones entre los actores) deberían tender hacia la transitividad o el
equilibrio. Una forma especial de esta idea se conoce como la “teoría del equilibrio”. La
teoría del equilibrio trabaja especialmente con relaciones de efecto positivo o negativo.
Se supone que si a A le gusta B y a B le gusta C, entonces a A le debería gustar C. O
también, si a A le gusta B y a B no le gusta C, entonces a A no le debería gustar C.
Para la red de información de Knoke, UCINET informa que el 20.3% de todas las
tríadas que podían ser transitivas (por ejemplo, aquéllas tríadas con tres o más lazos
conectando todos los actores) son transitivas. Esto no es un nivel especialmente alto,
y sugiere bien que la teoría hacia el equilibrio no ha podido darse en estos datos
(seguramente porque el sistema no ha funcionado demasiado tiempo), o que la teoría
no se aplica en este caso (más probablemente).
DISTANCIA
Las propiedades de la red que hemos examinado hasta el momento tienen que ver
principalmente con adyacencias –las relaciones directas de uno actor con el siguiente.
Pero la manera en la que la gente está inmersa en las redes es más compleja que
esto. Dos personas, llamémoslas A y B, pueden cada una tener cinco amigos. Pero
supongamos que ninguno de los amigos de A tiene amigos excepto A. En cambio,
cada uno de los cinco amigos de B tiene cinco amigos. La información disponible para
B y el potencial de B para influir es mucho más grande que el de A. Esto es, a veces
ser el “amigo de un amigo” puede tener bastantes consecuencias.
Para capturar este aspecto de cómo las personas están inmersas en las redes, una
aproximación importante consiste en examinar la distancia a la que está situado un
actor en relación a los demás. Si dos actores son adyacentes, la distancia entre ellos
es una (esto es, una señal necesita un paso para llegar desde el emisor hasta el
receptor). Si A habla con B, B habla con C (y A no habla con C), entonces los actores
A y C están a una distancia de dos. Cuántos actores están a diferentes distancias
unos de otros puede ser importante para entender las diferencias entre actores en las
14
limitaciones y oportunidades que tienen como resultado de su posición. A veces
estamos también interesados en de cuántas maneras se pueden conectar dos actores
con una distancia dada. Esto es, puede el actor A alcanzar al actor B en más de una
manera? A veces, conexiones múltiples pueden indicar una conexión más fuerte entre
dos actores que una sola relación.
Las distancias entre actores en una red puede ser una importante característica macro
de una red en su conjunto. Cuando las distancias son grandes, puede tomar un largo
período de tiempo a una información difundirse a través de una población. Puede ser
también que algunos actores sean bastante poco conscientes de este hecho y que
estén influenciados por otros –incluso si son técnicamente accesibles, el costo puede
ser demasiado alto para comportar intercambios. La variabilidad en las distancias que
tienen con otros actores puede constituir la base de la diferenciación e incluso de la
estratificación. Esos actores que están próximos a muchos otros pueden ser capaces
de ejercer más poder que aquellos que están más distantes. En el próximo capítulo
profundizaremos en este aspecto de la variabilidad en las distancias de los actores.
Por el momento, tenemos que aprender un poco de la jerga que es utilizada para
describir las distancias entre actores: paseos, caminos y semicaminos. Utilizando esas
definiciones básicas, podremos desarrollar algunas maneras más potentes de
describir varios aspectos entre los actores en una red.
PASEOS, ETC.
Para describir las distancias entre actores en una red con precisión, necesitamos algo
de terminología. Y, como puede imaginarse, no es lo mismo hablar de un grafo simple
o de un grafo conectado. Si A y B son adyacentes en un simple grafo, ellos tienen una
distancia de uno. En un grafo dirigido, sin embargo, A puede ser adyacente a B
mientras B no es adyacente a A – la distancia de A a B es uno, pero no hay distancia
de B a A. A causa de esta diferencia necesitamos términos ligeramente diferentes para
describir las distancias entre actores en grafos y dígrafos.
Grafos simples: La forma más general de conexión entre dos actores en un grafo se llama un
paseo. Un paseo es una secuencia de actores y relaciones que empiezan y terminan con
actores. Un paseo cerrado es uno en el cuál el principio y el punto final del camino son el
mismo actor. Los paseos no están restringidos. Un paseo puede implicar el mismo actor o la
misma relación múltiples veces. Un ciclo es un paseo especialmente restringido que se usa a
menudo para examinar los vecindarios (los puntos adyacentes) de los actores. Un ciclo es un
paseo cerrado de tres o más actores, todos los cuales son diferentes, excepto por lo que se
refiere al actor de origen-destino. La longitud de un paseo es simplemente el número de
relaciones contenidas en él. Por ejemplo, considera este grafo:
15
Hay muchos paseos en un grafo (de hecho, un número infinito si deseamos inclroducir paseos
de cualquier longitud – a pesar que, usualmente, restringimos nuestra atención a paseos de
pequeñas longitudes). Para ilustrar solo uno cuántos empecemos por el actor A y vayamos al
actor C. Hay un paseo de longitud 2 (A,B,C). Hay un paseo de longitud tres (A,B,D,C). Existen
algunos paseos de longitud 4 (A,B,E,D,C; A,B,D,B,C; A,B,E,B,C). A causa de que no están
restringidos, los mismo actores y relaciones pueden usarse más de una vez en un camino
dado. No hay ciclos que comiencen y acaben en A. Hay algunos que empiezan y acaban con el
actor B (B,D,C,B; B,E,D,B; B,C,D,E,B).
Normalmente es más útil restringir de alguna manera nuestra noción de lo que constituye una
conexión. Una posibilidad es restringir el cómputo de los paseos solamente a los paseos que
no rehúsan las relaciones. Un sendero entre dos actores es cualquier paseo que incluye una
relación dada solamente una vez (el resto de actores, sin embargo, pueden ser parte de un
sendero en múltiples ocasiones). La longitud de un sendero es el número de relaciones que
contiene. Si el sendero empieza y acaba con el mismo actor, se llama un sendero cerrado. En
nuestro ejemplo anterior, existen algunos senderos que van de A a C. Están excluidos trazados
como A,B,D,B,C (el cual es un paseo, pero no es un sendero porque la relación entre B y D se
usa más de una vez).
Seguramente, la definición más útil de una conexión entre dos actores (o entre un actor y él
mismo) es un camino. Un camino es un paseo en el cuál cada otro actor y cada otra relación
en el grafo puede usarse una sola vez. La única excepción la constituye un camino cerrado, el
cuál empieza y acaba con el mismo actor. Todos los caminos son senderos y paseos, pero
todos los paseos y senderos no son caminos. En nuestro ejemplo, hay un número limitado de
caminos conectando A y C: A,B,C; A,B,D,C; A,B,E,D,C.
Grafos dirigidos: Paseos, senderos y caminos también pueden definirse para los grafos
dirigidos. Pero existen dos modalidades de cada, dependiendo si queremos tomar en cuenta la
dirección o no. Semi-paseos, semi-senderos, y semi-caminos son los mismos que para los
datos no dirigidos. Definiendo esas distancias, la direccionalidad de las conexiones es
simplemente ignorada (esto es, flechas –o lazos dirigidos que son tratados como si fuesen
líneas – lazos no dirigidos). Como siempre, la longitud de esas distancias es el número de
relaciones en el paseo, sendero o camino. Si no queremos prestar atención a la direccionalidad
de las conexiones podemos definir paseos, senderos y caminos de la misma manera que
hicimos antes, pero con la restricción que no podemos “cambiar la dirección” a medida que nos
movemos a través de las relaciones de actor a actor. Considera un grafo dirigido:
16
En este dígrafo existe un número de paseos de A a C. Sin embargo, no existen paseos que
partan de C (o de cualquier otro) a A. Algunos de esos paseos de A a C son también senderos
(e.g. A,B,E,D,B,C). Hay, sin embargo, solo tres caminos de A a C. Un camino es de longitud 2
(A,B,C); uno es de longitud tres (A,B,D,C); uno es de longitud cuatro (A,B,E,D,C).
Las varias clases de conexiones (paseos, senderos, caminos) nos provee de diferentes
maneras de pensar acerca de las distancias entre actores. La principal razón por la que los
analistas de redes están preocupados con esas distancias es que proveen un camino para
pensar acerca de la fuerza de lazos o relaciones. Los actores que están conectados con
distancias cortas o de poca longitud pueden tener relaciones más fuertes; los actores que
están conectados muchas veces (por ejemplo teniendo muchos caminos en lugar de uno sólo)
pueden tener lazos más fuertes. Su conexión puede también estar menos sujeta a
interrupciones y, por lo tanto, ser más estable y fiable .
Observemos brevemente las distancias entre los pares de actores en los datos de Knoke sobre
flujos de información dirigida:
# paseos de longitud 1
1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 0 1 0 0 1 0 1 0 1 0
2 1 0 1 1 1 0 1 1 1 0
3 0 1 0 1 1 1 1 0 0 1
4 1 1 0 0 1 0 1 0 0 0
5 1 1 1 1 0 0 1 1 1 1
6 0 0 1 0 0 0 1 0 1 0
7 0 1 0 1 1 0 0 0 0 0
8 1 1 0 1 1 0 1 0 1 0
9 0 1 0 0 1 0 1 0 0 0
10 1 1 1 0 1 0 1 0 0 0
# paseos de longitud 2
1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 2 3 2 3 3 0 3 2 2 1
2 3 7 1 4 6 1 6 1 3 2
3 4 4 4 3 4 0 5 2 3 1
4 2 3 2 3 3 0 3 2 3 1
5 4 7 2 4 8 1 7 1 3 1
6 0 3 0 2 3 1 2 0 0 1
7 3 2 2 2 2 0 3 2 2 1
8 3 5 2 3 5 0 5 2 3 1
9 2 2 2 3 2 0 2 2 2 1
10 2 4 2 4 4 1 4 2 3 2
# paseos de longitud 3
1 2 3 4 5 6 7 8 9 10
-- -- -- -- -- -- -- -- -- --
1 12 18 7 13 18 2 18 6 10 5
2 20 26 16 21 27 1 28 13 18 7
3 14 26 9 19 26 4 25 8 14 8
4 12 19 7 13 19 2 19 6 10 5
5 21 30 17 25 29 2 31 15 21 10
6 9 8 8 8 8 0 10 6 7 3
7 9 17 5 11 17 2 16 4 9 4
8 16 24 11 19 24 2 24 10 15 7
9 10 16 5 10 16 2 16 4 8 4
10 16 23 11 16 23 2 24 8 13 6
1 2 3 4 5 6 7 8 9 10
-- -- -- -- -- -- -- -- -- --
1 14 21 9 16 21 2 21 8 12 6
2 23 33 17 25 33 2 34 14 21 9
3 18 30 13 22 30 4 30 10 17 9
4 14 22 9 16 22 2 22 8 13 6
5 25 37 19 29 37 3 38 16 24 11
6 9 11 8 10 11 1 12 6 7 4
7 12 19 7 13 19 2 19 6 11 5
8 19 29 13 22 29 2 29 12 18 8
9 12 18 7 13 18 2 18 6 10 5
10 18 27 13 20 27 3 28 10 16 8
17
El inventario del total de conexiones entre actores es útil principalmente para tener una idea de
cómo de “cerca” un par de actores está, y del grado de acoplamiento del sistema en su
conjunto. Aquí, podemos ver que usando solamente las conexiones de dos pasos (por ejemplo.
un “amigo de un amigo”), hay una gran cantidad de conexión de promedio en el grafo; nosotros
también vemos que hay grandes diferencias entre actores en su grado de conectividad y a
quién están conectados. Esas diferencias pueden ser usadas para comprender cuánta
información se mueve en la red, qué actores influirán probablemente a otros y un número
determinado de otras importantes propiedades.
Una definición determinada de la distancia entre actores en una red es usada por
muchos algoritmos para definir propiedades más complejas de las posiciones de los
individuos y de la estructura de la red en su conjunto. Esta cantidad es la distancia
geodésica. Tanto para datos dirigidos como no dirigidos, la distancia geodésica es el
número de relaciones en el caminos más corto posible de un actor a otro (o de un
actor a él mismo y, si somos cuidadosos, no deberíamos tenerla en cuenta).
18
Distancias geodésicas para intercambios de información
1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 0 1 2 2 1 3 1 2 1 2
2 1 0 1 1 1 2 1 1 1 2
3 2 1 0 1 1 1 1 2 2 1
4 1 1 2 0 1 3 1 2 2 2
5 1 1 1 1 0 2 1 1 1 1
6 3 2 1 2 2 0 1 3 1 2
7 2 1 2 1 1 3 0 2 2 2
8 1 1 2 1 1 3 1 0 1 2
9 2 1 2 2 1 3 1 2 0 2
10 1 1 1 2 1 2 1 2 2 0
Notas: A causa de que la red es densa, el camino geodésico es generalmente pequeño. Esto
sugiere que la información puede viajar bastante rápidamente en esta red. Obsérvese también
que hay una distancia geodésica para cada unos de los pares xy e yx -- esto es, el grafo está
plenamente conectado y los actores son “accesibles” por todos los otros (o lo que es lo mismo:
existe un camino de alguna longitud de cualquier actor a cualquier actor). Cuando una red no
está plenamente conectada, no podemos definir las distancias geodésicas entre los pares. la
aproximación estándar en estos casos es tratar la distancia geodésica entre actores
desconectados como la longitud mayor de todas las presentes en las distancias reales de los
datos. Para cada actor, calcularíamos la media y la desviación estándar de sus distancias
geodésicas para describir su grado de cercanía al resto de actores. Para cada actor, esa
distancia geodésica mayor se llama excentricidad – una medida de cómo de lejos un actor está
del más alejado.
A causa que la red está totalmente conectada, un mensaje que empieza en algún lugar
alcanzará eventualmente cualquier otro. A pesar que el programa no lo calcula, podría
calcularse la media (o mediana) de la distancia geodésica, y la desviación estándar de la
matriz, y para cada actor desde las filas y desde las columnas. Esto nos explicaría cómo de
lejos un actor está de otro y cómo de lejos y quién puede estar intentando influenciarlo. Esto
también nos explica qué actores tienen una conducta más predecible (en este caso, si han oido
algo o no) y menos predecible.
Mirando la red total, podemos ver que está conectada y que la distancia geodésica promedio
es bastante pequeña. Esto sugiere un sistema en el cual la información probablemente
alcanzará a cualquiera y que lo hará rápidamente. Para obtener otra noción del tamaño de una
red, podríamos pensar en su diámetro. El diámetro de una red es la distancia geodésica más
larga existente en la red (conectada). En este caso, ningún actor está situado a más de tres
pasos de cualquier otro – una red bastante "compacta". El diámetro de una red nos explica
cómo de “grande” ésta es en un sentido (esto es, cuántos pasos son necesarios para ir de un
sitio a otro). El diámetro es también una medida útil que puede servirnos para marcar el límite
superior de las longitudes de los caminos que estamos estudiando. Muchos investigadores
limitan sus exploraciones a las conexiones entre actores para incluir conexiones que no son
más largas que el diámetro de la red.
19
# de caminos geodésicos en intercambios de información
1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 - - 2 3 - 2 - 2 - -
2 - - - - - - - - - 2
3 4 - - - - - - 2 3 -
4 - - 2 - - 2 - 2 3 -
5 - - - - - - - - - -
6 9 3 - 2 3 - - 6 - -
7 3 - 2 - - 2 - 2 2 -
8 - - 2 - - 2 - - - -
9 2 - 2 3 - 2 - 2 - -
10 - - - 4 - - - 2 3 -
Notas: Podemos ver que muchas de las conexiones geodésicas entre esos actores no son
solamente de corta distancia, pero que muchas veces hay múltiples caminos más cortos de x a
y. Esto sugiere un par de cosas: el flujo de información probablemente no se interrumpirá a
causa de los múltiples caminos; y será difícil para cualquier individuo ser un “intermediario”
poderoso en esta estructura a causa de que muchos actores tienen caminos alternativos
eficientes de conexión a otros actores que pueden obviar el paso por un actor determinado.
El uso de caminos geodésicos para examinar las propiedades de las distancias entre
individuos y para la red total a menudo tiene mucho sentido. Pero hay muchos otros
casos en los que la distancia entre dos actores y la conectividad del grafo en su
conjunto se concibe mejor al implicar todas las relaciones – no sólo las más eficientes.
Si yo comienzo un rumor, pro ejemplo, éste pasará a través de la red por todos los
caminos disponibles – y no sólo por los más eficientes. El crédito que una persona de
a mi rumor puede depender de cuántas veces lo ha escuchado por diferentes lados – y
no los pronto que lo escucharon. Para usos de la distancia como éste necesitamos
tener en cuenta todas las conexiones entre actores.
Flujo máximo: Una noción de cómo cuánto están dos actores totalmente conectados (llamada
flujo máximo por UCINET) pregunta cuantos actores diferentes en el vecindario de un emisor
llevan a caminos hacia el destinatario. Si necesito transmitirte un mensaje y sólo hay una
persona a la que pueda enviárselo para retransmitirlo, mi conexión es débil – incluso si la
persona a la que envío el mensaje tiene muchas maneras de alcanzarte. Si, por otro lado, hay
cuatro personas a las cuales yo puedo enviar mi mensaje, entonces mi conexión es más fuerte.
Este aproximación al “flujo” sugiere que la fuerza de mi lazo hacia ti no es más fuerte que el
lazo más débil en las cadenas de conexiones, donde debilidad significa carecer de alternativas.
Esta aproximación a la conexión entre actores está conectada con la noción de grado de
intermediación que examinaremos en el siguiente capítulo. También es lógicamente cercana a
la idea que el número de caminos, y no su longitud, puede ser importante para conectar gente.
Para nuestros datos diseccionados, los resultados del recuento de UCINET del flujo máximo se
muestran a continuación. Debería verificarse por uno mismo que, por ejemplo, hay cuatro
20
“cuellos de botella” en los flujos del actor 1 al actor 2, pero cinco de tales cuellos en el flujo del
actor 2 al actor 1.
Flujo máximo
1
1 2 3 4 5 6 7 8 9 0
COCOEDINMAWRNEUWWEWE
- - - - - - - - - -
1 COUN 0 4 3 4 4 1 4 2 4 2
2 COMM 5 0 3 5 7 1 7 2 5 2
3 EDUC 5 6 0 5 6 1 6 2 5 2
4 INDU 4 4 3 0 4 1 4 2 4 2
5 MAYR 5 8 3 5 0 1 8 2 5 2
6 WRO 3 3 3 3 3 0 3 2 3 2
7 NEWS 3 3 3 3 3 1 0 2 3 2
8 UWAY 5 6 3 5 6 1 6 0 5 2
9 WELF 3 3 3 3 3 1 3 2 0 2
10 WEST 5 5 3 5 5 1 5 2 5 0
U C E I M N C W W
W W O D N A E O E E
R A U U D Y W M L S
O Y N C U R S M F T
1
Level 6 8 1 3 4 5 7 2 9 0
----- - - - - - - - - - -
8 . . . . . XXXXX . .
5 . . XXXXXXXXXXXXX .
2 . XXXXXXXXXXXXXXXXX
1 XXXXXXXXXXXXXXXXXXX
Notas: Como casi cualquier otra medida de las relaciones entre pares de actores, puede ser
útil ver si podemos clasificar los actores siendo más o menos similares los unos a los otros en
términos del patrón de relaciones con el resto de actores. El análisis de clusters es una útil
técnica para encontrar grupos de actores que tienen relaciones similares con otros. Tendremos
mucho que decir sobre este tema en los últimos capítulos.
En el ejemplo actual, vemos que los actores #2, 5, y 7 son relativamente similares entre sí en
términos de la distancia máxima de flujo al resto de actores. Una rápida comprobación del
grafo revela porqué esto es así. Esos tres actores tienen diferentes maneras de acceder los
unos a los otros y al resto de actores en la red. En este sentido, son muy diferentes del actor 6,
el cuál puede depender de hasta tres otros actores para establecer la conexión.
Incluso si queremos incluir todas las conexiones entre dos actores, puede ser que en muchas
ocasiones no tenga ningún sentido considerar un camino de longitud 10 tan importante como
uno de longitud 1. La aproximación de Hubbelly Katz cuenta el total de conexiones entre los
actores (lazos para datos no dirigidos, lazos que envían y reciben para datos dirigidos). Cada
conexión, sin embargo, es ponderada en relación a su longitud. Cuanto más grande sea la
longitud, más débil será la conexión. Hasta qué punto la conexión se vuelve débil
incrementando la longitud depende de un factor de “atenuación”. En nuestro siguiente ejemplo
hemos usado una factor de atenuación de 0.5. Esto es, un punto adyacente recibe el peso de
1, un paseo de longitud 2 recibe un peso de 0.5, una conexión de longitud 3 recibe un peso de
0,25, etc. La aproximación de Hubbell y Katz es muy similar. Katz incluye una matriz identidad
(una conexión de un actor consigo mismo) como la conexión más fuerte; la aproximación de
Hubbell no lo hace. Calculadas por UCINET, ambas aproximaciones “normalizan” los
resultados desde grandes distancias negativas (esto, actores que están relativamente muy
cerca de otros pares o tienen una alta cohesión) a grandes números positivos (esto es, los
actores que tienen una gran distancia relativa al resto).
21
Method: HUBBELL
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
------ ------ ------ ------ ------ ------ ------ ------ ------ ------
1 COUN -0.67 -0.67 2.00 -0.33 -0.67 2.00 0.33 -1.33 -1.33 1.33
2 COMM -0.92 -0.17 1.50 -0.08 -0.67 1.50 0.08 -0.83 -1.08 0.83
3 EDUC 5.83 3.33 -11.00 0.17 3.33 -11.00 -2.17 6.67 8.17 -7.67
4 INDU -1.50 -1.00 3.00 0.50 -1.00 3.00 0.50 -2.00 -2.50 2.00
5 MAYR 1.25 0.50 -2.50 -0.25 1.00 -2.50 -0.75 1.50 1.75 -1.50
6 WRO 3.83 2.33 -8.00 0.17 2.33 -7.00 -1.17 4.67 6.17 -5.67
7 NEWS -1.17 -0.67 2.00 0.17 -0.67 2.00 0.83 -1.33 -1.83 1.33
8 UWAY -3.83 -2.33 7.00 -0.17 -2.33 7.00 1.17 -3.67 -5.17 4.67
9 WELF -0.83 -0.33 1.00 -0.17 -0.33 1.00 0.17 -0.67 -0.17 0.67
10 WEST 4.33 2.33 -8.00 -0.33 2.33 -8.00 -1.67 4.67 5.67 -4.67
Method: KATZ
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
------ ------ ------ ------ ------ ------ ------ ------ ------ ------
1 COUN -1.67 -0.67 2.00 -0.33 -0.67 2.00 0.33 -1.33 -1.33 1.33
2 COMM -0.92 -1.17 1.50 -0.08 -0.67 1.50 0.08 -0.83 -1.08 0.83
3 EDUC 5.83 3.33 -12.00 0.17 3.33 -11.00 -2.17 6.67 8.17 -7.67
4 INDU -1.50 -1.00 3.00 -0.50 -1.00 3.00 0.50 -2.00 -2.50 2.00
5 MAYR 1.25 0.50 -2.50 -0.25 0.00 -2.50 -0.75 1.50 1.75 -1.50
6 WRO 3.83 2.33 -8.00 0.17 2.33 -8.00 -1.17 4.67 6.17 -5.67
7 NEWS -1.17 -0.67 2.00 0.17 -0.67 2.00 -0.17 -1.33 -1.83 1.33
8 UWAY -3.83 -2.33 7.00 -0.17 -2.33 7.00 1.17 -4.67 -5.17 4.67
9 WELF -0.83 -0.33 1.00 -0.17 -0.33 1.00 0.17 -0.67 -1.17 0.67
10 WEST 4.33 2.33 -8.00 -0.33 2.33 -8.00 -1.67 4.67 5.67 -5.67
Como todas las medidas de las propiedades de pares de actores se podría analizar la
información mucho más. Podríamos ver qué individuos son similares a qué otros (esto es, ¿a
qué grupos o estratos definidos por la similaridad del total de sus conexiones al resto de nodos
en la red pertenecen?). Nuestro interés podría también centrarse en la red total, dónde
podríamos examinar el grado de varianza y la forma de la distribución de las conexiones de las
díadas. Por ejemplo, una red en la cual todos los pares de actores estuviesen totalmente
conectados podría suponerse que se comportaría de manera muy diferente que una en la que
hubiesen diferencias radicales entre los actores.
La influencia de Taylor: La aproximación de Hubbell y Katz puede tener más sentido cuando
se aplica a datos simétricos, a causa de que no presta atención a las direcciones o a las
conexiones (por ejemplo, los lazos de A dirigidos a B son tan importantes como los de B
dirigidos a A a la hora de definir la distancia o solidaridad –cercanía—entre ellos). Si estamos
más específicamente interesados en la influencia de A sobre B en un grafo dirigido, la
aproximación a la influencia de Taylor propone una interesante alternativa.
La medida de Taylor, como las otras, usa todas las conexiones y aplica un factor de
atenuación. Más que estandarizar completamente la matriz resultante, sin embargo, se adopta
una aproximación diferente. Los marginales de las columnas para cada actor son sustraídos de
los marginales de las filas y el resultado es entonces normalizado. Traducido al español lo que
hacemos es mirar al equilibrio entre los actores que envían conexiones (marginales de filas) y
los actores que reciben conexiones (marginales de columnas). Los valores positivos reflejan
entonces una preponderancia en enviar sobre recibir de un actor de la pareja – o un equilibrio
de influencia entre los dos. Nótese que el periódico (#7) muestra disponer de influencia neta en
relación con la mayoría del resto de actores, mientras que la organización para la defensa de
los derechos al bienestar social (#6) tiene un balance negativo con la mayor parte de los otros
actores.
Method: TAYLOR
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
----- ----- ----- ----- ----- ----- ----- ----- ----- -----
1 COUN 0.00 -0.02 0.23 -0.07 0.12 0.11 -0.09 -0.15 0.03 0.18
2 COMM 0.02 0.00 0.11 -0.06 0.07 0.05 -0.05 -0.09 0.05 0.09
3 EDUC -0.23 -0.11 0.00 0.17 -0.36 0.18 0.26 0.02 -0.44 -0.02
4 INDU 0.07 0.06 -0.17 0.00 0.05 -0.17 -0.02 0.11 0.14 -0.14
5 MAYR -0.12 -0.07 0.36 -0.05 0.00 0.30 0.01 -0.23 -0.13 0.23
6 WRO -0.11 -0.05 -0.18 0.17 -0.30 0.00 0.19 0.14 -0.32 -0.14
7 NEWS 0.09 0.05 -0.26 0.02 -0.01 -0.19 0.00 0.15 0.12 -0.18
8 UWAY 0.15 0.09 -0.02 -0.11 0.23 -0.14 -0.15 0.00 0.28 0.00
9 WELF -0.03 -0.05 0.44 -0.14 0.13 0.32 -0.12 -0.28 0.00 0.31
10 WEST -0.18 -0.09 0.02 0.14 -0.23 0.14 0.18 -0.00 -0.31 0.00
22
Como la muchas otras medidas las diferentes aproximaciones a la distancia entre actores y en
la red en su conjunto provee de un conjunto de alternativas. Ninguna definición para definir la
distancia será la “correcta” para una propósito determinado. A veces realmente no sabemos a
priori que aproximación puede ser la mejor y normalmente tenemos que ver cómo funcionan
algunas de ellas.
RESUMEN
Existe una gran cantidad de información los individuos y la población en una simple
matriz de adyacencia. En este capítulo has aprendido mucha terminología para
describir las conexiones y distancias entre actores y también para describir las
poblaciones completas. En un análisis de redes básico se suele focalizar en el
vecindario inmediato: las díadas y las tríadas en las cuales están inmersos. El grado
de un actor, y el grado nodal de entrada y de salida (si los datos son dirigidos) nos
explica hasta qué punto un actor puede estar limitado por o limitar a otros. Esta
conocimiento puede ser útil para describir la estructura de oportunidades de un actor.
Nosotros también hemos visto que es posible describir “tipos” de actores que pueden
formar grupos o estratos sobre la base de las posiciones que ocupan en la estructura
de oportunidades -- e.g. "aislados" "emisores" etc.
La mayor parte del tiempo y esfuerzo de los actores sociales se invierte en contextos
locales –interactuando en díadas y tríadas. Buscando todas las conexiones de los
actores, hemos sugerido que el grado de “reciprocidad”, “equilibrio” y “transitividad” en
las relaciones puede ser entendido como un importante indicador de estabilidad e
institucionalización (esto es, hasta qué punto las relaciones son dadas por supuestas y
están gobernadas por normas) de las posiciones de los actores en las redes sociales.
Las conexiones locales de los actores son importantes para comprender la conducta
social del conjunto de la población y también para entender cada individuo. El tamaño
de la red, su densidad, tanto si los actores son accesibles por otros (por ejemplo, está
la población conectada o existen múltiples componentes?), como si las relaciones
tienden a ser recíprocas o transitivas y todas las otras propiedades que hemos
examinado para las conexiones individuales también son significativas para describir
el conjunto de la población. Tanto los niveles típicos de características (e.g. el grado
nodal medio de los puntos) y la cantidad de diversidad en las características (e.g. la
varianza en el grado nodal de los puntos) puede ser importante en explicar la conducta
macro. Las poblaciones con alta densidad responden de forma diferente a los desafíos
que aquéllas que tienen una baja densidad; las poblaciones con una gran diversidad
23
en las densidades individuales pueden tender a desarrollar más diferenciación y
estratificación.
En este capítulo hemos examinado también algunas propiedades acerca del modo en
el que los individuos están inmersos en las redes y de éstas en su sentido más amplio
en lugar de los vecindarios locales de los actores. Una terminología especializada ha
sido introducida para describir las distancias entre pares de actores: paseos, senderos
y caminos. Hicimos notar que existen algunas diferencias importantes entre los datos
dirigidos y los no dirigidos al aplicar esas ideas de distancia.
La distancia geodésica, sin embargo, examina sólo una simple conexión entre un par
de actores (o en algunos casos algunas si hay múltiples geodésicos conectándolos). A
veces la suma de todas las conexiones entre actores, más que la más corta conexión ,
puede ser relevante. Hemos examinado aproximaciones que miden la vulnerabilidad
de la conexión entre los actores (flujo), la solidaridad de los actores por parejas
(Hubbell y Katz), y la influencia potencial de unos actores en relación a otros (Taylor).
Otra vez, es importante recordar que las diferencias y las similitudes entre las
personas individuales en el sentido de su distancia a otros puede ser una base
estructural para la diferenciación y la estratificación. Y, como siempre, esos complejos
patrones de distancias de individuos en relación a otros constituye también una
característica de la población en su conjunto – también para describir las limitaciones y
oportunidades a las que se enfrentan los individuos. Por ejemplo, una población en la
cual la mayor parte de los actores tienen múltiples distancias geodésicas a otros se
comportará, muy probablemente, de manera bastante diferente de una en la cual hay
poca redundancia de eficientes vínculos de comunicación (piensa acerca de algunas
clases diferentes de organizaciones burocráticas – digamos un hospital clínico versus
una fábrica de coches).
Hemos visto que existe una gran cantidad de información disponible en una pocas
simples observaciones de una matriz de adyacencia. La vida, por supuesto, puede ser
24
más complicada. Podríamos disponer de múltiples capas o datos multiplexados;
podríamos datos que diesen información sobre al fortaleza de los vínculos más que su
simple presencia o ausencia. Sin embargo, los métodos que hemos usado aquí
proporcionan una buena introducción a lo que puede hacerse con datos más
complejos.
PREGUNTAS DE REPASO
1. Explica las diferencias entre los “tres niveles de análisis” de los grafos (individual,
agregados, completo).
2. ¿Cuál es el tamaño de una población? ¿Por que el tamaño de una población es
importante para el análisis sociológico?
3. Si disponemos de una red de 5 actores (y asumiendo que no existen lazos
reflexivos) ¿cuál es el número potencial de lazos dirigidos? ¿Cuál es el número
potencial de lazos no dirigidos?
4. ¿Cómo se mide la densidad? ¿Por qué la densidad es posible en el análisis
sociológico?
5. ¿Qué es el “grado de un punto”? ¿Por qué podría ser sociológicamente importante
que algunos actores tengan altos rangos nodales y otros los tengan bajos? ¿Cuál es la
diferencia entre “grado nodal de salida” y “grado nodal de entrada”?
6. Si el actor "A" es accesible por el actor "B" ¿no significa eso necesariamente que el
actor "B" es accesible por el "A?" ¿Por qué y por qué no?
7. Para pares de actores con relaciones dirigidas, existen cuatro posibles
configuraciones de lazos. ¿Cómo los podemos mostrar? ¿Qué configuraciones están
“equilibradas”? Para una tríada con relaciones no dirigidas ¿cuántas configuraciones
de lazos existen?¿Cuáles son equilibrados o transitivos?
8. ¿Cuáles son las diferencias entre paseos, senderos y caminos? ¿Por qué los
“caminos” son los usados más comúnmente para las distancias entre actores en el
análisis sociológico?
25
9. ¿Qué es una distancia “geodésica” entre dos actores? Muchas medidas de redes
sociales asumen que el camino geodésico es el más importante entre actores – por
qué es plausible esta asunción?
10. Tenemos dos poblaciones de 10 actores cada una, una tiene un diámetro de 3 y la
otra un diámetro de 6. ¿Puedes explicar la afirmación a alguien que no sepa nada de
análisis de redes?¿ Puedes explicar por qué la diferencia en diámetro puede ser
importante para entender las diferencias entre las dos poblaciones?
11. ¿Cómo las aproximaciones de “flujos ponderados” al estudio de la distancia social
difieren de las aproximaciones “geodésicas”?
12. ¿Por qué podría ser importante que dos actores tuviesen más de un geodésico u
otro camino entre ellos?
APLICACIONES
1. Piensa en las lecturas de la primera parte del curso. ¿Qué estudios usan las ideas
de conectividad y densidad? ¿Qué estudios usan las ideas de distancia? ¿Qué
aproximaciones específicas usan esos conceptos?
2. Dibuja los grafos de una “estrella”, un “círculo”, una “línea” y una “jerarquía”.
Describe el tamaño, potencial y densidad de cada grafo. Examina los grados nodales
de los puntos en cada grafo –existen diferencias entre los actores? ¿Esas diferencias
nos explican algo acerca de los “roles sociales”de los actores? Crea una matriz para
cada grafo que muestre las distancias geodésicas entre cada par de actores.¿Hay
diferencias entre los grafos en el modo en el que están conectados por múltiples
distancias geodésicas?
3. Piensa acerca de un pequeño grupo de gente que conozcas bien (posiblemente tu
familia, vecinos, un grupo de estudio, etc.). ¿Quién ayuda a quién en este grupo?
¿Cuál es la densidad de los lazos? ¿Son los lazos recíprocos? ¿Son las tríadas
transitivas?
4. Chrysler Corporation te ha contratado como consultor. Su división de investigación
está tardando mucho en diseñar nuevos modelos de coches y a menudo el trabajo de
los “creativos” no casa muy bien con el trabajo de los “ingenieros de producción” (La
gente que de hecho acaba construyendo el coche). La División de investigación de
Chrysler está organizada como una burocracia clásica con dos ramas (creativos y
producción) coordinada a través de un grupo de directivos y una jefe de División.
Analiza las razones por las cuales los resultados son pobres. Sugiere algunas
maneras alternativas de organizar que podrían mejorar el rendimiento y explica por
qué ayudarían.
26
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES
Este documento está traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html> [Fecha de consulta:
Diciembre de 2001].
NP
2
ÍNDICE
CENTRALIDAD DE GRADOS...................................................................................... 8
3
CAPÍTULO VI. CENTRALIDAD Y PODER
4
respuesta correcta y definitiva para estas difíciles preguntas. Sin embargo, el análisis
de redes ha hecho importantes contribuciones en proveer definiciones precisas y
mediciones concretas de las diferentes aproximaciones a la noción de poder que se
atribuye a las posiciones en estructuras de relaciones sociales.
Para entender las aproximaciones que el análisis de redes usa para estudiar el poder,
es útil pensar primero sobre algunos sistemas muy simples. Considera estas tres
redes, las cuales son denominadas ‘estrella’, ‘línea’ y ‘círculo’.
A primera vista, se puede sugerir que el actor A tiene una posición estructural
altamente favorable en la red estrella, si la red está describiendo una relación como un
intercambio o distribución de recursos. Pero, ¿exactamente por qué está este actor A
en una ‘mejor’ posición que el resto de nodos de la red estrella? ¿qué hay que decir
sobre la posición de A en la red línea? ¿estar en el final de la línea es una ventaja o una
desventaja? ¿Están todos los actores en la red círculo exactamente en la misma
posición estructural? Necesitamos pensar sobre por qué la ubicación estructural puede
ser ventajosa o desventajosa para los actores. Concentrémonos en el porqué el actor
A está tan obviamente en una posición ventajosa en la red estrella.
5
Grado: En primer lugar, el actor A tiene más oportunidades y alternativas que los otros
actores. Si el actor D eligiera no proveer a A con algún recurso, A tiene un número de
otros lugares dónde ir para conseguirlo; sin embargo, si D eligiera no intercambiar con
A, D no estaría en capacidad de realizar ningún intercambio. Cuantos más vínculos
tenga A, más poder podrá tener. En la red estrella, el actor A tiene grado seis, todos
los demás actores tienen grado uno. De esta lógica se desprenden las medidas de
centralidad y poder basadas en el grado del actor, lo cual discutiremos a continuación.
Los actores que tienen más vínculos tienen mayores oportunidades porque tienen más
opciones. Esta autonomía los hace menos dependientes ante cualquier otro actor
específico y por lo tanto más poderosos.
Cercanía: La segunda razón de por qué el actor A es más poderoso que los otros
actores en la red estrella es que el actor A está más cerca del resto de actores que
cualquier otro. El poder puede ser ejercido por el trato e intercambio directo. Pero el
poder también proviene de actuar como un ‘punto de referencia’ por el cual otros
actores se juzgan a sí mismos y por ser un centro de atención cuyos puntos de vista
son escuchados por un gran número de actores. Los actores que son capaces de
alcanzar a otros en longitudes de caminos más cortas, o quienes son más accesibles
por otros actores en longitudes de caminos más cortos, tienen posiciones favorables.
Esta ventaja estructural puede ser traducida en poder. En la red estrella, el actor A
está a distancia geodésica de uno de todos los otros actores, mientras cada uno de los
otros actores está a distancia geodésica de dos de los otros actores (excepto A).
Desde esta lógica de ventaja estructural se desprenden aproximaciones que enfatizan
la distribución de la cercanía y distancia como un recurso de poder.
Consideremos ahora la red círculo en términos de la cercanía del actor. Cada actor se
sitúa en longitudes de camino diferentes desde los otros actores, pero todos los
actores tienen distribuciones idénticas de cercanía y de nuevo parecerían ser iguales
6
en términos de posiciones estructurales. En la red línea, el actor de en medio (D) está
más cercano a todos los otros actores que lo que están en el grupo C, E; grupo B, F y
el grupo A, G. De nuevo, los actores al final de la línea, o en la periferia, están en
desventaja.
Grado de Intermediación: La tercera razón que hace que el actor A esté en ventaja
en la red estrella es porque el actor A está situado entre cada otro par de actores y no
existe ningún otro actor entre A y el resto de actores. Si A quiere contactar con F, A lo
hará directamente. Si F quiere contactar con B, tiene que hacerlo por medio de A.
Esto da al actor A la capacidad de negociar contactos entre los actores – para extraer
‘tarifas de servicios’ y aislar actores o prevenir contactos. El tercer aspecto de una
posición estructural ventajosa por lo tanto es encontrarse entre otros actores.
En la red círculo, cada actor está situado entre cada otro par de actores. Realmente,
existe dos caminos conectando cada par de actores, y cada tercer actor está situado
en uno, pero no en otro de ellos. De nuevo, todos los actores están igualmente en
ventaja o desventaja. En la red línea, nuestros puntos finales (A,G) no están situados
entre cualquier par y no tienen ningún poder negociador. Los actores más cercanos al
centro de la cadena aparecen en más caminos entre pares y están nuevamente en una
posición ventajosa.
7
medidas de centralidad- que medidas de poder. Pero, como hemos sugerido aquí, hay
varias razones por las cuales las posiciones centrales son posiciones poderosas.
CENTRALIDAD DE GRADO
Los actores que tienen mayores vínculos con otros actores puede que tengan
posiciones ventajosas. Debido a que tienen muchos vínculos, pueden tener formas
alternativas de satisfacer necesidades y por tanto son menos dependientes de otros
individuos. Además, dado que disponen de muchos vínculos, pueden tener acceso y
pueden conseguir más del conjunto de los recursos de la red. El hecho de tener más
vínculos les posibilita a menudo ser terceros y permitir intercambios entre otros,
pudiéndose beneficiar de esa posición. Así que una muy simple, pero a menudo
efectiva, medida de centralidad de un actor y de su poder potencial es su grado.
Con datos de relaciones recíprocas los actores difieren entre ellos sólo en cuantas
conexiones tienen. Con datos de relaciones orientadas puede ser importante distinguir
la centralidad basada en grados de entrada de la centralidad basada en grados de
salida. Si un actor recibe muchos vínculos a menudo se dice que es prominente o de
prestigio, o sea muchos otros actores buscan entablar vínculos con él, y esto puede
indicar su importancia. Los actores que inusualmente tienen un alto grado de salida
son actores que son capaces de intercambiar con muchos otros, o hacer a muchos
otros conscientes de sus punto de vista. Los actores que muestran alta centralidad de
grados de salida se dice que son actores influyentes.
8
Examinaremos los grados de entrada y de salida de los puntos como medida de quién
es ‘central’ o ‘influyente’ en esta red. UCINET ha sido usado para el recuento y otros
cálculos adicionales a partir de las sugerencias de Linton Freeman.
1 2 3 4
Grado de salida Grado de Entrada Número de Grado de Número de Grado
Salida de Entrada
ESTADÍSTICAS DESCRIPTIVAS
1 2 3 4
Grado de Grado de Entrada Número de Grado Número de Grado
salida de Salida de Entrada
Notas: Los actores #5 y #2 tienen mayor grado de salida, y pueden ser considerados
los más influyentes (aunque puedan importar a quienes mandan información, esta
medida no toma eso en cuenta). Los actores # 5 y # 2 se unen a # 7 (NEWS) cuando
examinamos los grados de entrada. Que otras organizaciones compartan información
con estos tres indicaría un deseo por parte de ellas de intentar tener influencia. Este
intento de influenciar puede ser interpretado como un acto de deferencia, o
9
reconocimiento de que las posiciones de los actores 5, 2 y 7 podrían ser valiosas. Si
nos interesara comparar redes de distinto tamaño o densidad sería útil ‘estandarizar’ la
medida de entrada y salida. En las dos últimas columnas de la primera tabla de
resultados de arriba, todos los recuentos de grados han sido expresados como
porcentajes del más grande recuento de datos en el grupo. (i.e. el # 7 tiene grado de
salida 9)
Los resultados de la tabla siguiente a la anterior tratan del nivel ‘meso’ de análisis. Esto
es, cómo se observa el grado de distribución del grado de centralidad. En promedio,
los actores tienen grados de 4.9, que es bastante alto, dado que hay sólo nueve
actores más. Vemos que el rango de los grados de entrada ligeramente más alto
(mínimo y máximo) que el grado de salida, y que hay más variabilidad a través de
actores en grado de entrada que en grado de salida (desviaciones y variaciones
estándar). El rango y grados de variabilidad ( y otras propiedades de redes) pueden
ser bastante importantes, porque describen si la población es homogénea o
heterogénea en lo que a posiciones estructurales se refiere. Uno puede examinar si la
variabilidad es alta o baja con relación a las puntuaciones clásicas calculando el
coeficiente de variación, (desviación estándar dividida por el promedio, por 100) para el
grado de entrada y de salida. Para las reglas usadas a menudo para evaluar
coeficientes de variación, los valores actuales (35 para el grado de salida y 53 para el
grado de entrada) son moderados. Claramente, sin embargo, la población es más
homogénea con relación al grado de salida (influencia) que el grado de entrada
(prominencia).
La última pieza de información dada por el informe de arriba son los “medidas de
centralización de grafo de Freeman” que describe a la población como un todo --el nivel
macro. Estos son estadísticas muy útiles, pero requieren de un poco de explicación.
10
es de 43% y el gráfico de grado de entrada es de 57%. Llegaríamos a la conclusión
que hay una cantidad sustancial de concentración o centralización en toda la red. Es
decir, el poder de los actores individuales varía substancialmente y esto significa que
en total, las ventajas posicionales se distribuyen de forma desigual en esta red.
Ahora que entendemos estas ideas básicas, podemos ser más breves al ver otros
enfoques de la centralidad y el poder.
CENTRALIDAD DE CERCANÍA
Las medidas de grados de centralidad pueden ser criticadas porque sólo toman en
cuenta los vínculos inmediatos que tiene el actor, en lugar de los vínculos indirectos
con todos los demás. Un actor puede estar vinculado con muchos otros, pero esos
otros pueden estar un tanto desconectados del conjunto de la red. En un caso como
éste, el actor puede ser bastante central, pero sólo en una área local.
Lejanía Cercanía
1 11.00 81.82
2 10.00 90.00
3 12.00 75.00
4 12.00 75.00
5 10.00 90.00
6 15.00 60.00
7 9.00 100.00
8 12.00 75.00
9 12.00 75.00
10 13.00 69.23
11
Lejanía Cercanía
Podemos ver que el actor # 7 es el más cercano o central de los actores usando este
método, porque la suma de las distancia geodésica de # 7 con otros actores (un total
de 9, a través de 9 actores) es la menor (es más, es la suma mínima de distancias
geodésicas). Dos actores más (# 2 y # 5) son más cercanos. WRO (# 6) tiene la
mayor lejanía. En una red pequeña con alta densidad, no sorprende que la centralidad
basada en la distancia es muy similar a la centralidad basada en adyacentes (dado que
muchas distancias geodésicas en esta red son adyacentes). En redes más grandes o
menos densas, los dos enfoques pueden dar imágenes distintas de quiénes son los
actores centrales.
12
CENTRALIDAD DE GRADO DE INTERMEDIACIÓN
13
Intermediación Intermediación
Normalizada
1 0.67 0.93
2 12.33 17.13
3 11.69 16.24
4 0.81 1.12
5 17.83 24.77
6 0.33 0.46
7 2.75 3.82
8 0.00 0.00
9 1.22 1.70
10 0.36 0.50
Intermediación Intermediación
Normalizada
Notas: Vemos que hay mucha variación en la intermediación del actor (desde 0 hasta
17.83), y que hay bastante variación (desviación estándar = 6.2 con relación al
promedio de intermediación de 4.8). A pesar de esto la centralidad de toda la red es
relativamente baja. Esto tiene sentido porque sabemos que por completo un medio de
todas las conexiones puede ser hecha en esta red sin la ayuda de ningún intermediario
por tanto no puede haber mucha intermediación. Tomando en cuenta la restricción
estructural, no hay mucho poder en esta red. Los actores # 2, # 3 y # 5 parecen ser
relativamente un poco más poderosos que otros de acuerdo a estas medidas.
Claramente, hay base estructural para que estos actores perciban que son ‘distintos’
de los otros en la población. Es más, no sería sorprendente que estos actores se
vieran a sí mismos como los negociantes que mueven y hacen que sucedan las
cosas. En este sentido, aunque no hay mucho poder de intermediación en el sistema,
éste podría ser importante para la formación y estratificación del grupo.
14
Cada uno de estos enfoques básicos a la centralidad y poder (grado, cercanía e
intermediación) pueden y han sido elaborados para obtener información adicional de
los grafos. Revisando algunas de estas elaboraciones podemos sugerir otras formas
de relación del poder y la posición en las redes sociales.
Para ilustrar esto hemos usado UCINET para calcular los ‘eigenvectores’ de la matriz
de distancia para información de los datos sobre intercambio de información de Knoke.
En este ejemplo, hemos medido la distancia entre dos actores como la más larga de
las distancias geodésicas dirigida entre ellas. Si nos interesara más la información de
las relaciones de intercambio que simplemente las fuentes o receptores de información
sería bueno tomar este enfoque - porque nos dice que para estar cerca, un par de
15
actores deben tener distancias cortas entre ellos en ambas direcciones. Aquí está el
resulado:
CENTRALIDAD DE BONACICH
VALORES EIGEN
9.106 100.0
1 2
vector eigen vector eigen
Normalizado
16
ESTADÍSTICAS DESCRIPTIVAS
1 2
Vector Eigen Vector Eigen
Normalizado
El primer grupo de estadísticas nos dice cuánto del patrón general de distancias entre
actores puede ser visto como reflejando el patrón global (el primer valor eigen), y más
localmente, los patrones adicionales. Estamos interesados en los porcentajes de la
variación general en las distancias que se toman en cuenta por el primer factor. Aquí
este porcentaje es 74.3% esto significa que casi ¾ de todos las distancias entre
actores son reflejo de las principales dimensiones del patrón. Si esta cantidad no es
grande (digamos más del 70%), se debe tener cuidado al usarlo para interpretar
resultados futuros, porque el patrón dominante no está haciendo un buen trabajo
describiendo los datos. El primer valor eigen debe ser considerablemente mayor que
el segundo (aquí, el radio entre el primer valor eigen y el segundo es de 5.6 a 1). Esto
significa que el patrón dominante en cierta forma es 5.6 veces tan “importante” como el
patrón secundario.
17
estándar .07) alrededor del promedio (.31). Esto sugiere que, en general, no hay
grandes desigualdades en la centralidad o poder del actor, cuando medimos de esta
forma. Comparado a la red ‘estrella’, el nivel de desigualdad o concentración de los
datos Knoke es sólo 20.9% de lo máximo posible. Esto es mucho menor que la
medida de centralización de red para la medida de cercanía ‘cruda’ (49.3), y sugiere
que algunas diferencias de poder usando el enfoque de la cercanía ‘cruda’ pueden
deberse más a aparentes desigualdades locales que globales.
CENTRALIDAD DE FLUJO
Supongamos que dos actores quieren una relación, pero el camino geodésico entre
ellos está bloqueado por un intermediario indiferente. Si existe otro camino, los dos
actores lo usarán probablemente, aunque sea más largo o ‘menos eficiente’. En
general, los actores pueden bien usar todos los vínculos que los conectan en vez de
solamente vínculos geodésicos. El enfoque de flujo a la centralidad expande la noción
de centralidad de intermediación y supone que los actores usarán todos los itinerarios
que los conectan antes que solamente caminos geodésicos. El enfoque de flujo a la
centralidad expande la noción de intermediación. Asume que los actores usarán todos
los itinerarios que los conectan. La intermediación se mide por la proporción de todo el
flujo entre dos actores (es decir, a través de todos los caminos que los conecta) que
ocurre en los caminos de los cuales el actor es parte. Para cada actor, entonces, la
18
medida suma cuán involucrado el actor está en todo el flujo entre todos los pares de
actores (¡la cantidad de cálculos con más de una par de actores puede ser
enormemente intimidatoria!). En tanto se puede esperar que la magnitud de este índice
se incremente con el tamaño y densidad de la red, es útil estandarizarlo calculando el
flujo de intermediación de cada actor en relación al flujo total de intermediación que no
involucra al actor.
Flujo de Flujo de
intermediación intermediación
Normalizado
1 10.00 7.69
2 49.00 39.20
3 17.00 12.50
4 14.00 10.53
5 48.00 37.80
6 2.00 1.34
7 23.00 16.67
8 8.00 6.06
9 9.00 6.34
10 12.00 9.09
Flujo de Flujo de
intermediación intermediación
Normalizado
19
Algunos actores claramente son más centrales que otros, y la variabilidad relativa de
flujo de intermediación de los actores es bastante grande (la desviación estándar de
intermediación del flujo normalizado es de 14.7 con relación al promedio de 12.5 dado
un coeficiente de variación relativa de 85%). A pesar de esta relativamente alta
cantidad de variación, el grado de desigualdad o concentración en la distribución de las
centralidades del flujo de intermediación entre los actores es bastante baja -en relación
a la red estrella (el índice de centralización es de 27.199). Esto es ligeramente más
alto que el índice para las medidas de intermediación que se basaba sólo en distancias
geodésicas.
Supongamos que Bill y Fred cada uno tiene 5 amigos cercanos. Los amigos de Bill sin
embargo están bastante aislados y no tienen muchos otros amigos además de Bill.
Los amigos de Fred tienen muchos amigos quienes a la vez también tienen muchos
amigos y así sucesivamente. ¿quién es más central?. Estaríamos de acuerdo que es
Fred porque la gente con la que está conectada está mejor conectada que lo amigos
de Bill. Bonacich sostiene que la centralidad es una función de cuántas conexiones
tiene uno y los actores en relación con uno.
Mientras argumentábamos que los actores más centrales son los más poderosos,
Bonacich cuestionó esta idea. Compara a Bill y a Fred de nuevo. Fred es claramente
más central, pero ¿es más poderoso?. Un argumento sería de que uno puede ser más
influyente si está conectado a otros centrales - porque uno puede rápidamente
contactarse con muchos otros actores con su mensaje. Pero si los actores con los
que estas conectado están a su vez bien conectados no son altamente dependientes
de ti – tienen muchos contactos, al igual que tú. Si por otro lado la gente con la que
contactas no está bien conectada, es dependiente de ti. Bonacich argumentaba que
estar bien conectado a otros conectados te hace central pero no poderoso. De alguna
manera, irónicamente, estar conectado a otros que no están bien conectados hace a
20
uno poderoso, porque estos otros actores dependen de ti – mientras los otros actores
bien conectados no.
Bonacich propuso que ambas nociones centralidad y poder eran funciones de las
conexiones del actor con su entorno. A más conexiones los actores tengan con tu
entorno, más central eres tú. Cuantas menos conexiones éstos tengan con tu entorno,
más poderoso eres. Parecería existir un problema para construir un algoritmo que
incorporase estas ideas: supongamos A y B están conectados; el poder y centralidad
de A está en función de sus propias conexiones y también las conexiones de B. De la
misma forma, el poder y centralidad de B depende de las de A. Así que, el poder y
centralidad de cada actor depende del poder de cada otro simultáneamente.
Hay una manera de salir de este dilema del huevo y la gallina. Bonacich mostró que
para resolver esta ecuación en sistemas simétricos, un enfoque de estimación iterativa
simultánea eventualmente convergería en una sola respuesta. Se comienza dándole a
cada actor una centralidad estimada igual a su propio grado, más un cálculo ponderado
de la función de los actores con quién está conectado. Entonces, hacemos esto de
nuevo, usando las primeras estimaciones (i.e. le damos a cada actor una centralidad
estimada igual a su primera puntuación más las primeras puntuaciones de aquéllos
con los que está conectado). Si hacemos esto numerosas veces, los tamaños
relativos (no los tamaños absolutos) de todas las puntuaciones serán iguales. A
continuación, las puntuaciones pueden ser recalculadas escalando las constantes.
21
CENTRALIDAD BONACICH
1
Centralidad
1 COUN - 2.68
2 COMM - 3.74
3 EDUC - 2.76
4 INDU - 2.95
5 MAYR - 4.05
6 WRO - 1.16
7 NEWS - 2.67
8 UWAY - 3.49
9 WELF - 2.89
10 WEST - 2.95
ESTADÍSTICAS DESCRIPTIVAS
1
Centralidad
1 Promedio - 2.93
2 Desviación Est. 0.74
3 Suma - 29.32
4 Varianza 0.55
5 Euc. Norm 9.57
6 Mínimo - 4.06
7 Máximo - 1.16
22
otros puntos con altos grados al ser una fuente para ellos y hemos contado una
relación tanto si se trata de un emisor como de un receptor.
Cuando tomamos en cuenta las conexiones de aquéllos con quienes los actores están
conectados, hay menos variación en los datos que cuando examinamos sólo
adyacentes. La desviación estándar de las centralidades del actor es pequeña en
relación a la puntuación media. Esto sugiere relativamente poca dispersión o
desigualdad en la centralidad, lo que se confirma al comparar la distribución de los
datos con la red ‘estrella’ (i.e. índice de centralidad de la red = 17.759).
Veamos el lado del poder del índice que se calcula con él mismo algoritmo, pero que
da peso negativo a conexiones con conexiones débiles.
PODER BONACICH
1
Poder
1 COUN - 1.00
2 COMM 2.00
3 EDUC 1.00
4 INDU 1.00
5 MAYR 3.00
6 WRO - 0.00
7 NEWS 3.00
8 UWAY 1.00
9 WELF 2.00
10 WEST 1.00
23
ESTADÍSTICAS
1
Poder
1 Promedio 1.30
2 Desviación Est. 1.19
3 Suma 13.00
4 Varianza 1.41
5 Euc. Norm 5.57
6 Mínimo - 1.00
7 Máximo 3.00
Notas: Como era previsible, estos resultados son muy distintos a otros que hemos
examinado. Puedo decir que no sorprende porque la mayoría de medidas que hemos
visto equiparan centralidad con poder, mientras que el índice de poder de Bonacich ve
el poder como distinto a la centralidad.
24
redes sugiere que el poder de los actores no es un atributo del individuo, sino que
surge de sus relaciones con los otros. Todas las estructuras sociales pueden también
ser vistas como desplegando altos o bajos niveles de poder como resultado de las
variaciones en los patrones de vínculos entre los actores. Además, el grado de
desigualdad o concentración de poder en la población podría ser indexado.
• ¿Puedes explicar por qué se dice que un actor que tiene una suma más
pequeña de distancias geodésicas a todos los actores es más ‘central’, usando
el enfoque de cercanía?
25
• ¿Qué significa que un actor se sitúa ‘entre’ otros dos actores? ¿Por qué la
intermediación da al actor poder de influencia?
• Piensa en las lecturas de la primera parte del curso. ¿Qué estudios usaron las
ideas de ventaja estructural, centralidad, poder e influencia? ¿qué clases de
enfoque se utilizaron para cada uno : el grado, cercanía e intermediación?
• ¿Puedes pensar en alguna circunstancia donde ser ‘central’ podría hacer a uno
menos influyente? ¿menos poderoso?
• Considera una red directa que describe una burocracia jerárquica, donde la
relación es ‘dar ordenes a’, ¿qué actores tienen el más alto grado? ¿son ellos
los más poderosos e influyentes? ¿qué actores tienen alta cercanía? ¿qué
actores tienen alta intermediación?
26
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.
CAPÍTULO SÉPTIMO
Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].
Este capítulo ha sido traducido por René Ríos, del Departamento de Sociología de la
Universidad Católica de Chile.
2
CAPÍTULO VII. GRUPOS Y SUBESTRUCTURAS
INTRODUCCIÓN
Unos de los intereses más comunes del análisis estructural radica en las
"subestructuras" que pueden estar presentes en una red. Las Díadas, Tríadas y
círculos ego-centrados, pueden ser pensadas como subestructuras. Las
combinaciones de díadas y tríadas en estructuras mayores, las cuales están
conectadas a su vez, desarrollan o constituyen las redes. Muchas de las
aproximaciones para comprender la estructura de una red enfatizan la forma en la que
las conexiones están compuestas y se extienden para desarrollar "cliques" más
grandes o subagrupaciones. Esta visión de la estructura social centra la atención en
cómo la solidaridad y la conexión de grandes estructuras pueden ser construidas a
partir de componentes pequeños y cohesionados: un tipo de aproximación de abajo
hacia arriba. Los analistas de redes han desarrollado un conjunto de definiciones y
algoritmos para identificar los componentes más pequeños en las grandes estructuras:
cliques, n-cliques, n-clans y k-plexes sirven para ver las redes desde esa perspectiva.
Saber cómo un individuo está inmerso en la estructura de grupos en una red puede
ser un aspecto crítico para la comprensión de su conducta. Por ejemplo, algunos
pueden actuar como puentes entre grupos (los cosmopolitas, ampliadores de
fronteras). Otros pueden tener todas sus relaciones dentro de un único clique (los
locales o internos). Algunos actores pueden ser parte de una elite cerrada y
densamente conectadas, mientras que otros están completamente aislados de ese
grupo. Tales diferencias en las formas que los individuos están inmersos en la
estructura de grupos en una red pueden tener profundas consecuencias en las
3
maneras que esos actores perciben su funcionamiento y en las prácticas que más
probablemente despliegan.
Para visualizar algunas de las principales ideas y examinar algunas de las principales
maneras de cómo los analistas han definido los cliques, trabajaremos con un ejemplo.
Todos los análisis se pueden realizar usando UCINET.
La mayoría de los algoritmos computacionales para definir cliques operan sobre datos
binarios simétricos. Usaremos los datos de intercambio de información de Knoke.
Cuando los algoritmos lo permitan, usaremos los datos en su forma dirigida. Cuando
los datos sean simétricos, analizaremos los vínculos fuertes. Esto es, vamos a
simetrizar los datos, de modo que sólo contaremos los lazos recíprocos, es decir, un
vínculo existe sólo si xy e yx están presentes.
1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 -
2 1 -
3 0 1 -
4 0 1 0 -
5 1 1 1 1 -
6 0 0 1 0 0 -
7 0 1 0 1 1 0 -
8 0 1 0 0 1 0 0 -
9 0 1 0 0 1 0 0 0 -
10 1 0 1 0 1 0 0 0 0 -
4
Notas: El diagrama sugiere varias cosas. Los actores # 5 y # 2 aparecen en el centro
de la acción, en el sentido de que son miembros de varias de las agrupaciones y
sirven para conectarlas por su coparticipación. La conexión de subgrafos por los
actores puede ser un rasgo importante. Podemos también ver que hay un caso (#6)
que no es miembro de ningún subgrupo (excepto de un díada). Si se examina
cuidadosamente, se verá que las díadas y tríadas son los subgrafos más comunes y
que a pesar de la substancial conectividad en el grafo, agrupaciones superiores a
éstas son pocas. De la inspección visual, se ve que la mayoría de las diversas
agrupaciones están conectadas: los grupos se yuxtaponen.
• ¿De qué tamaño son los subgrafos conectados? Hay pocos grupos grandes o
un gran número de grupos pequeños?
5
APROXIMACIONES DE ABAJO HACIA ARRIBA
CLIQUES
6
La definición más fuerte de un clique es un determinado número de actores (más de
dos, usualmente se usan tres), que tienen todos los vínculos posibles presente entre
ellos. Una agrupación de este tipo es el "Subgrafo máximo completo", el cual se
expande hasta incluir a la mayor cantidad de actores posibles. Requerimos a UCINET
encontrar todos los cliques en los datos de Knoke que satisfacen el criterio de
subgrafo máximo completo de definición de clique.
Notas: Hay siete (7) subgrafos máximos completos presente en estos datos. El
mayor está compuesto por cuatro de los diez actores y todos los integrantes de los
cliques más pequeños comparten alguna yuxtaposición con alguna parte del núcleo.
Podremos estar interesados en cuánto estas subestructuras están yuxtapuestas y en
saber qué actores son más "centrales" y en cuáles están más aislados de los cliques.
Podemos buscar respuestas analizando la coparticipación.
7
AGLOMERACIÓN JERÁRQUICA
Notas: Vemos que los actores 2 y 5 se juntan primero por estar cercanos ya que
comparten 5 participaciones. Al nivel de compartir solo dos participaciones se
incorporan los actores 1, 3 y 10. Si requerimos sólo una participación, todos los
actores, con excepción del 6, se incorporan.
Insistir que cada miembro de un clique debe estar conectado a cualquier otro miembro
es una definición muy estricta de lo que entendemos por un grupo. Hay varias
maneras de relajar esta restricción. Dos aproximaciones principales son N-clique, N-
clan y K-plex.
N-CLIQUES
Una alternativa es definir a un actor como miembro de un clique si está conectado con
todos los otros miembros del grupo a una distancia mayor que uno. Usualmente, se
usa la distancia de trayecto de dos. Esto es equivalente a ser amigo de un amigo.
Esta forma de denomina N-clique, en la que N corresponde a la longitud de la
trayectoria permitida para hacer una conexión con todos los otros miembros. Cuando
aplicamos la definición N-clique a nuestros datos, obtenemos lo siguiente.
8
Notas: Los cliques que vimos antes se han hecho más inclusivos por la definición
relajadas de participación grupal. El primer n-clique incluye a todos excepto al actor 6.
El segundo es más restrictivo e incluye al 6 (WRO), junto con dos elementos del
núcleo. Como hemos relajado la exigencia de cercanía para ser considerado
miembros, hay menos cliques máximos. Con subgrupos más grandes y menos
frecuentes, el alcalde (#5), ya no parece ser tan crítico. Con la definición más relajada
aparece ahora un "núcleo duro" de actores que son miembros de ambas agrupaciones
mayores. Esto se puede constatar en la matriz de coparticipación y por aglomeración
[clustering].
9
N-CLANES
Por esta razón, algunos analistas han sugerido restringir los N-cliques por medio de
exigir que el rango total o la distancia de la trayectoria entre cualquier par de miembros
de un N-clique también satisfagan una condición. Este tipo de restricción tiene el
efecto de forzar todos los vínculos entre miembros a que se realicen por medio de
otros miembros de un N-clique. Este enfoque es el N-clan. En el caso actual, el
enfoque N-clan no difiere del enfoque N-clique
10
Notas: Los enfoques N-clique y N-clan proveen alternativas a la definición estricta de
clique y a menudo estos enfoques más relajados tienen bastante sentido con datos
sociológicos. En esencia, el enfoque N-clique permite a un actor ser miembro de un
clique aún si no tienen lazos con todos los otros miembros pero siempre que tenga
vínculos con otro miembro y que no esté alejado más de n pasos (usualmente 2) de
todos los miembros del clique. El enfoque N-clan es una modificación relativamente
menor del enfoque N-clique, que requiere que todos los vínculos entre los actores se
realicen a través de otros miembros del grupo.
K-PLEX
Una manera alternativa de relajar los supuestos fuertes del subgrafo máximo completo
es permitir que los actores sean miembros de un clique si tienen lazos con todos
excepto con k otros miembros. Por ejemplo, si A tiene vínculos con B y C, pero no con
D; y ambos B y C tienen vínculos con D, los cuatro actores podrían constituir un clique
bajo el enfoque K-plex. Este enfoque postula que un nodo es miembro de un clique de
tamaño n, si tiene lazos directos con n-k miembros de ese clique. El enfoque K-plex
parecer tener bastante en común con el N-clique, pero el análisis basado en K-plex a
menudo arroja un cuadro bastante diferente de las subestructuras del grafo. En vez
de agrupaciones grandes y concatenadas, que a veces produce el análisis N-clique, el
análisis K-plex tiende a encontrar números relativamente grandes de pequeñas
agrupaciones. Esto tiende a llamar la atención sobre yuxtaposiciones y co-presencia
(centralización) más que en solidaridad y accesibilidad.
En el ejemplo que sigue permitimos que k sea igual a dos. Esto es, un actor es
considerado miembro de un clique si tiene vínculos con todos menos otros dos actores
en dicho clique. Con esta definición, hay muchos clique de tamaño tres (en efecto, en
nuestro grafo hay 35 K-plex cliques, pero sólo seis de ellos tienen mas de tres
miembros). Con K=2 un nodo requiere estar conectado solo con un otro miembro para
ser considerado. Pero esto no es muy satisfactorio como clique, de modo que hemos
eliminado estas agrupaciones de tres casos. Los restantes K-cliques son:
11
K-PLEXES:
COUN COMM EDUC MAYR WEST
COUN COMM EDUC WEST
COUN COMM INDU MAYR
COUN COMM MAYR NEWS
COUN COMM MAYR UWAY
COUN COMM MAYR WELF
COMM EDUC INDU MAYR
COMM EDUC MAYR NEWS
COMM EDUC MAYR UWAY
COMM EDUC MAYR WELF
COMM INDU MAYR NEWS
COMM INDU MAYR UWAY
COMM INDU MAYR WELF
COMM MAYR NEWS UWAY
COMM MAYR NEWS WELF
COMM MAYR UWAY WELF
K-NÚCLEOS
Un k-núcleo es un grupo máximo de actores, todos los cuales están ligados a algún
número (k) de otros miembros del grupo. Para ser incluido en un K-plex, un actor
debe estar ligado con todo excepto k otros actores en el grupo. El enfoque K-núcleo
es más relajado, permitiendo a los actores formar parte de un grupo si están
conectados con k miembros, siendo indiferente a cuántos otros miembros pudieran
estar conectados. Al variar el valor de k (es decir, a cuántos miembros del grupo debe
estar conectado), pueden emerger distintas imágenes. Los K-núcleos pueden ser - y
12
suelen serlo-, más inclusivos que los K-plexes. Y, a medida que k es más pequeño, el
tamaño de los grupos se agrandará.
ENFOQUES DE ARRIBA-ABAJO
Los enfoques que hemos examinado comienzan con la díada y examina si este tipo de
estructura cohesiva se puede extender hacia afuera. La estructura total de la red es
vista como emergiendo de yuxtaposiciones y apareamientos de componentes
pequeños. Ciertamente, esta es un forma válida de pensar acerca de estructuras
mayores y sus componentes.
Se podría preferir, sin embargo, comenzar con la totalidad de la red como su marco de
referencia, más que desde la díada. Enfoques de este tipo tienden a mirar la
estructura total e identificar subestructuras como partes que son localmente más
densas que el campo como un todo. En un sentido, este lente más macro, busca
agujeros o vulnerabilidades o puntos débiles en la estructura general de solidaridad de
la red. Los agujeros o puntos débiles definen líneas de división o separación en el
grupo mayor y apuntan a cómo se podría descomponer en sus unidades más
pequeñas.
13
Estas descripciones verbales de los lentes hacia arriba y hacia abajo exageran
enormemente las diferencias entre los enfoques cuando examinamos las definiciones
específicas y los algoritmos concretos que pueden usarse para localizar y estudiar la
subestructura. Aún así, la lógica y algunos de los resultados de los análisis pueden
llevar a perspectivas distintas y usualmente complementarias.
COMPONENTES
Los componentes de un grafo son partes que están internamente conectadas, pero
desconectadas entre los subgrafos. Si un grafo contiene uno o más nodos aislados,
estos actores son componentes. Más interesantes son aquellos que dividen los grafos
en partes separadas, en las que cada una tiene diversos actores que están
recíprocamente conectados (no nos importa cuán cercanamente ligados estén).
En el ejemplo que hemos estado usando, los datos sobre intercambio de información
de Knoke, hay un sólo componente. Esto es, todos los actores están conectados.
Éste suele ser a menudo el caso, aún en redes relativamente grandes con
aparentemente obvias subestructuras. De modo similar a cómo una definición estricta
de clique puede ser demasiado fuerte para capturar el significado conceptual, la
noción fuerte de componente es usualmente muy fuerte para encontrar significativos
puntos débiles, agujeros o subpartes locales densas en un grafo grande. De modo
que examinaremos algunos enfoques más flexibles.
En los datos que hemos estado examinando hay uno y solo uno, punto de corte, pero
no es muy interesante.
14
Se encontraron 2 bloques.
BLOCKS:
Block 1: EDUC WRO
Block 2: COUN COMM EDUC INDU MAYR NEWS UWAY WELF WEST
Aquí vemos que EDUC es el único punto que al ser eliminado dejaría la estructura
desconectada (esto es, WRO no podría ser alcanzable por otros actores). En este
sentido, resulta que EDUC juega el rol de conectar la que de otra forma sería una
organización (WRO) aislada de los restantes miembros de la red.
15
CONJUNTOS LAMBDA
U W C E I M C N W
W W E O D N A O E E
R A L U U D Y M W S
O Y F N C U R M S T
1
Lambda 6 8 9 1 3 4 5 2 7 0
------ - - - - - - - - - -
7 . . . . . . XXX . .
3 . . . XXXXXXXXXXXXX
2 . XXXXXXXXXXXXXXXXX
1 XXXXXXXXXXXXXXXXXXX
Notas: Este enfoque identifica a los vínculos #2 al #5 (MAYR a COMM) como los más
importantes del grafo, en el sentido de que transportan una gran cantidad de tráfico, y
si se eliminasen el grafo se perturbaría enormemente. Este resultado se confirma al
examinar la imagen 1, donde vemos que la mayoría de los actores están conectados
con la mayoría de los restantes por vía del vínculo que va del #2 al #5.
Considerablemente menos críticos son los vínculos entre los actores 2 y 5 con los
#1,#3,#4,#7 y #10. De nuevo, la imagen muestra que esas organizaciones son una
especie de círculo externo en torno al núcleo.
La idea del conjunto Lambda nos ha situado bastante lejos de la idea de componentes
estrictos. En vez de enfatizar la descomposición o separación de la estructura en
componentes desconectados, la idea del conjunto lambda, es más continua. Enfatiza
los puntos en los cuales el tejido de las conexiones es más vulnerable a la ruptura. De
nuevo, no se trata de maneras correctas o erróneas de aproximarse a la noción que
las grandes estructuras pueden ser no homogéneas y que estén más expuestas a la
división y ruptura en algunas localizaciones más que en otras. Nuestro último enfoque
combina la lógica de ambos anteriores.
FACCIONES
En términos de redes, los actores son equivalentes en la medida que tienen el mismo
perfil de relaciones con otros actores. Se sigue que podemos definir particiones de la
red sobre la base de agrupar juntos a actores por su similitud en cuanto a con quién
están vinculados. En un extremos, podríamos tener un grafo que fuese divisible en
componentes y que cada componente es un clique (esto es, en un grupo, todos están
vinculados con todos; entre grupos no hay lazos). Algunas divisiones menos estrictas
permitirían que hubiese algunos vínculos entre grupos y una densidad no completa
dentro de los grupos.
16
Usando el poder de la computadora es posible buscar particiones de un grafo en
subgrafos que maximicen la similaridad de los patrones de conexión de los actores
dentro de cada grupo. También es posible evaluar cuán buena es la participación
comparándola con el resultado de una partición típica ideal pura, donde los actores
dentro de cada grupo tienen máxima similitud y los actores entre grupos tienen
máxima disimilitud de vínculos.
El primer paso en este enfoque es tratar de decidir qué número de grupos o divisiones
proveen una cuadro más útil e interesante de los datos. Probamos con la opción de 2
a 5 grupos y nos quedamos con 4. La decisión se hizo en relación a la claridad e
interpretabilidad de la partición resultante en la matriz de adyacencia:
FACTIONS
Diagonal valid? YES
Use geodesics? NO
Method: CORRELATION
Treat data as: SIMILARITIES
Number of factions: 4
Fit: -0.503
Group Assignments:
1: EDUC WRO
2: COUN COMM INDU MAYR NEWS UWAY
3: WELF
4: WEST
Este enfoque se corresponde bien con la noción intuitiva de que los grupos en el grafo
pueden definirse por una combinación de la densidad local y la presencia de agujeros
estructurales entre algunos conjuntos de actores y otros. En este caso, se trata de
partes más fuertes y débiles del tejido, más que de agujeros. Dado que hemos usado
datos dirigidos para este análisis, debe notarse que la división se basa en quiénes
envían información a quien y en quiénes reciben de quién. La agrupación {6,3}, por
ejemplo, envía información a otros grupos, pero está separada de ellos porque los
otros grupos no les envían información. La imagen no sólo identifica facciones
17
actuales o potenciales, sino que nos dice algo acerca de las relaciones entre las
facciones, potenciales aliados y enemigos en algunos casos.
PREGUNTAS DE REPASO
2. ¿En qué sentido los n-cliques y los N-clans relajan la definición de clique?
4. ¿En qué sentido los K-plexes y los K-núcleos relajan la definición de clique?
5. Da un ejemplo en el que fuese más útil usar K-plex o K-núcleo en vez de un clique
estricto.
18
6. ¿Qué es un componente en un grafo?
8. ¿Hay algún punto de corte en una red estrella, en una red lineal y una red círculo?
PREGUNTAS DE APLICACIÓN
1. Repasa las lecturas de la primera parte del curso. ¿Qué estudios usaron las ideas
de grupos y subestructruras? ¿Qué enfoques usaron, cliques, clans, plexes, etc.?
3. ¿Cómo pueden ser afectadas las vidas de personas que están en puntos de corte
por ocupar este tipo de posición estructural? Piensa en un ejemplo.
19
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.
CAPITULO OCTAVO
Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].
2
CAPÍTULO VIII. POSICIONES EN LA RED Y ROLES
SOCIALES: LA IDEA DE EQUIVALENCIA
INTRODUCCIÓN
Hemos estado examinando algunas de las maneras en que los analistas de redes
sociales consideran los datos sobre redes. Comenzamos buscando regularidades en
la estructura de conjunto (p.e. conectividad, densidad, etc.) y el grado de inclusión
(embeddedness) de un actor (p.e. distancia geodésica, centralidad). Una segunda
perspectiva para examinar datos de redes sociales es buscar los subgrafos o grupos
de actores más cercanos entre sí que a otros grupos o actores. Por ejemplo
examinamos el significado de las cliques, los bloques y los puentes como maneras de
concebir y describir cómo los actores en una red pueden ser subdivididos en
subgrupos basándonos en sus modos de relación mutuos. Todo esto, aunque parezca
un poco técnico, es muy fácil de comprender conceptualmente. El nodo central de una
red estrella está más cerca de todos los otros miembros que cualquiera de los demás.
Esta es una idea fácil de comprender. Una clique, definida como el “máximo subgrafo
completo” suena difícil, pero de nuevo es un concepto que se entiende. Se trata
sencillamente del mayor conjunto de individuos que están conectados con todos los
otros miembros del grupo. De nuevo la idea no es difícil porque es muy concreta:
podemos ver y sentir las cliques.
Ahora vamos a dirigir nuestra atención hacia formas algo más abstractas de
comprender los modelos de relaciones entre actores sociales: el análisis de
posiciones. Es importante ser capaz de teorizar sobre las posiciones y analizar los
datos en tanto que posiciones puesto que queremos ser capaces de generalizar a
propósito de los comportamientos sociales y la estructura social. Es decir, queremos
poder afirmar principios que sean válidos para todos los grupos, todas las
organizaciones, todas las sociedades etc. Para ello tenemos que pensar en los
actores, no en tanto que individuos únicos (aunque lo sigan siendo), sino como
ejemplos de categorías. Como tarea empírica necesitamos ser capaces de agrupar los
actores más similares y de describir lo que los hace similares; y también ser capaces
de describir lo que los hace similares, en tanto que categoría, de los miembros de
otras categorías.
3
El pensamiento sociológico utiliza categorías abstractas cotidianamente. “La clase
trabajadora, la clase media, la case superior” son algunos de los conjuntos de
categorías que prescriben las posiciones sociales. “Hombres y Mujeres” son realmente
etiquetas sobre categorías de personas que son más similares dentro de la categoría
que entre categorías -al menos para comprender y predecir algunos aspectos de su
comportamiento social. Cuando categorías como estas son utilizadas como parte de
teorías sociológicas, son usadas para describir roles sociales o posiciones sociales
típicas de miembros de la categoría.
Muchos de los sistemas de categorías usados por los sociólogos están basados en
atributos que los actores tienen en común. Si afirmo que los “varones americanos-
europeos de edad entre 45 y 64 años tienden a tener salarios elevados en los Estados
Unidos” estoy hablando de un grupo de personas que son similares demográficamente
– comparten ciertos atributos (ser varones, tener antepasados europeos, edad
biológica y salario). El análisis estructural no se interesa particularmente por estos
sistemas de categorías (o variables) que se basan en descripciones de atributos
individuales similares (algunos analistas estructurales radicales incluso afirman que
tales categorías no son en absoluto sociológicas). Los analistas estructurales intentan
definir categorías y variables en términos de similitud de los modelos de relaciones
entre los actores, en lugar de definirlas respecto a los atributos de los actores. Es
decir, la definición de una categoría, o rol social o posición social depende de sus
relaciones con otra categoría. Los roles sociales y las posiciones, defienden los
analistas estructurales, son inherentemente relacionales. Esta idea es bastante
abstracta, esperemos que algunos ejemplos permitan aclararla.
¿Qué es un “trabajador”? Podríamos querer decir “una persona que trabaja” (lo cual es
un atributo compartido prácticamente por todos los seres humanos). Una definición
4
más interesante sociológicamente sería la de Marx en tanto que persona que vende el
control sobre su poder de trabajo a un capitalista. Nótese que el significado de
“trabajador” depende de un “capitalista” y viceversa. Es la relación (en este caso,
como Marx lo expresaría, la relación de explotación) entre los ocupantes de los dos
roles la que define el significado de los roles.
Puesto que definimos las posiciones o categorías sociales en tanto que las relaciones
entre actores, podemos identificar y definir empíricamente las posiciones sociales
utilizando datos de redes. De manera intuitiva, podríamos decir que dos actores
ocupan la misma posición o rol en la medida en que sus relaciones con otros actores
son las mismas. Sin embargo en esta definición intuitiva encontramos un par de cosas
molestas.
Primero, ¿qué relaciones tenemos en cuenta y entre quién para identificar qué actores
son similares y cuales no? Las relaciones que tengo con la Universidad son en cierto
modo parecidas a las relaciones que tienen los estudiantes: ambos estamos
gobernados por las mismas reglas, prácticas y procedimientos. Las relaciones que
tengo con la Universidad son muy distintas de las de los estudiantes en ciertos
aspectos (p.e. la Universidad me paga y los estudiantes pagan a la universidad). ¿Qué
5
relaciones deberían contar y cuales no al intentar describir los roles de “profesor” y de
“estudiante”? Incluso ¿por qué examinar las relaciones entre estudiantes y profesores
y la universidad en lugar de incluir, por ejemplo, miembros de la legislación del
estado? No existe una respuesta sencilla sobre cuáles son las “relaciones correctas”
que hay que examinar y no hay una respuesta sencilla sobre quiénes constituyen el
conjunto de actores relevantes. Todo depende del objetivo de la investigación, de la
perspectiva teórica utilizada y de las poblaciones a las que queramos generalizar
nuestros descubrimientos.
¿Qué queremos decir cuando decimos que dos actores tienen modelos similares de
relación y que por lo tanto ambos son miembros de un mismo rol social o posición?
Existen al menos tres maneras de entender la “similitud”. Algunos analistas han
llamado estos tipos de similitud equivalencia estructural, equivalencia automórfica y
equivalencia regular. Los tres tipos de similitud difieren en sus grados de abstracción,
siendo la equivalencia estructural la más concreta y la equivalencia regular la más
abstracta.
6
EQUIVALENCIA ESTRUCTURAL
EQUIVALENCIA AUTOMÓRFICA
7
del diagrama se modificaría. Automorfismos más interesantes incluyen conjuntos de
actores que pueden intercambiarse entre si. Piense en tres McDonalds poseídos por el
mismo propietario de la franquicia. Imagine nuestro grafo de más arriba con el
propietario (A) de los tres restaurantes, cada uno con un directivo (B, C y D) y cada
uno con uno o más trabajadores. Cada restaurante tiene un directivo particular,
trabajadores particulares y clientes particulares. Los trabajadores en los tres
restaurantes no tienen relaciones estructuralmente equivalentes. Es decir, Edna
(trabajadora en el 1º restaurante) no puede ser intercambiada por Inge (del 3º
restaurante) sin perturbar los lazos con otros actores y las distancias entre ellos. Pero
si re-etiquetamos el restaurante A como B y el restaurante B como A, no ha cambiado
nada. Si cambiamos el conjunto de actores B, E, F por el conjunto de actores D, H, I,
todas las distancias entre todos los actores son preservadas. Este cambio es una
intercambio automórfico.
La razón por la que estos conjuntos son importantes es que las estructuras sociales
(en especial las que son grandes y complicadas) a menudo tienen subconjuntos de
actores, o estructuras locales que son equivalentes funcionalmente o réplicas las unas
de las otras. Tales similitudes son muy útiles para tratar de comprender cómo grandes
conjuntos de humanos se organizan. Nos permiten dirigir la atención hacia los
modelos comunes de relaciones sociales en lugar de ver cada estructura social como
única.
EQUIVALENCIA REGULAR
Se dice que dos nodos son equivalentes regularmente si tienen el mismo perfil de
lazos con miembros de otros conjuntos de actores que también son equivalentes
regularmente. Esta es una manera complicada de decir algo que reconocemos
intuitivamente. Dos madres, por ejemplo, son equivalentes, porque cada una tiene un
cierto modelo de relaciones con un marido, hijos, parientes políticos (por ejemplo,
aunque éstas sean muy relativas culturalmente). Dos madres (habitualmente en
nuestra sociedad) no tienen relaciones con el mismo marido o con los mismos hijos o
parientes políticos. Es decir, no son estructuralmente equivalentes. Pero son similares
porque tienen el mismo tipo de relaciones con algún miembro o miembros de otro
conjunto de actores (quienes son igualmente considerados como equivalentes por su
similitud de relaciones con miembros del conjunto “madre”). Este es un concepto obvio
pero crucial. Los actores equivalentes regularmente no ocupan necesariamente las
8
mismas posiciones respecto a otros actores individuales, más bien tienen los mismos
tipos de relaciones con algunos miembros de otros grupos de actores.
9
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.
CAPÍTULO NOVENO
Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].
Estos capítulos han sido traducidos por René Ríos, Departamento de Sociología de la
Universidad Católica de Chile.
2
CAPÍTULO IX. MEDICIONES DE SIMILARIDAD Y
EQUIVALENCIA ESTRUCTURAL
INTRODUCCIÓN
En esta sección vamos a examinar algunas de las maneras en que podemos definir y
medir empíricamente el grado de equivalencia estructural o la similaridad entre actores
en razón de su posición en la red. En seguida vamos a examinar algunos de los
posibles enfoques para analizar los patrones de equivalencia estructural basados en
las medidas de similitud.
Recordemos que la equivalencia estructural significa que los actores son sustituibles.
Esto es que los actores tienen un mismo patrón de relación con todos los otros. La
equivalencia estructural exacta es rara en la mayoría de las estructuras sociales (como
ejercicio, traten de imaginar como sería una estructura social en la que la mayoría de
los actores fueren sustituibles por los demás). En consecuencia, a menudo
calculamos medidas del grado en el que los actores son similares, y las usamos como
base para identificar conjuntos de actores que son muy similares entre si y distintos de
otros actores en otros conjuntos.
Para propósitos de ilustración, vamos a analizar los datos sobre envío y recepción de
información entre burocracias de Knoke. Estos datos muestras vínculos dirigidos y
están medidos a nivel nominal, esto es binario.
3
Este es un análisis bastante restringido, y no debe ser tomado muy en serio. Pero los
datos son útiles para entregar una ilustración de los principales enfoques para medir la
equivalencia estructural y para identificar actores que tienen similares posiciones
reticulares.
Podemos intentar establecer intuitivamente qué nodos son más similares entre sí con
otros nodos mirando el diagrama. Notamos algunas cosas importantes. Parece ser
que los actores #2, #5 y #7 pueden ser estructuralmente similares en tanto tienen
lazos recíprocos y casi con todos los demás. Los actores #6, #8 y #10 son
regularmente similares por que están relativamente aislados, pero no son
estructuralmente similares porque están conectados a conjuntos distintos de actores.
Más allá de esto, sin embargo, es realmente bastante difícil establecer la similitud
estructural rigurosamente por medio de la inspección del diagrama.
Podemos ser más precisos si usamos la representación matricial. Esto además nos
permite usar el computador para realizar el tediosos trabajo involucrado en el cálculo
de índices para establecer la similitud. Se reproduce la matriz original de datos más
abajo. Muchos de los rasgos que aparecían en el diagrama son también fácilmente
captables en la matriz. si miramos en las filas y contamos los grados de salida y si
examinamos las columnas y contamos los grados de entrada podemos ver quienes
son actores centrales y quienes aislados. Pero, de manera más general, podemos ver
que dos actores son estructuralmente equivalentes en la medida que su perfil de
puntajes en sus filas y columnas son similares.
4
Se dice que dos actores son estructuralmente equivalentes si tienen similares
patrones de vínculos con otros actores. Esto significa que las entradas en las filas y
columnas de cada actor son idénticas entre sí. Si la matriz fuese simétrica, sólo
necesitaríamos examinar pares de filas o columnas. Pero como estos datos son lazos
dirigidos, debemos examinar la similaridad de los vínculos de emisión y de recepción
(por supuesto, podemos estar interesados en la equivalencia estructural de sólo los
lazos emisores o de los receptores). Podemos ver la similitud de los actores si
expandimos la matriz listando un vector de fila seguido de un vector de columna de
cada actor como columna, así:
5
Para ser estructuralmente equivalentes, dos actores deben tener los mismos vínculos
con los mismos otros actores - esto es, que las entradas en sus columnas deben ser
idénticas (con la excepción de los autovínculos, que probablemente ignoraríamos en la
mayoría de los casos). Habiendo organizado los datos de esta manera, hay algunos
aspectos bastantes obvios que podríamos hacer para proveer un índice que resuma
cuán cercano a la equivalencia estructural está cada par de actores. Con algo de
imaginación se puede llegar a otras ideas, pero los cuatro enfoques más comunes
para indexar la equivalencia estructural son la correlación, las distancias euclidianas
6
cuadradas, matches (aciertos) y aciertos positivos. Más abajo, cada uno de estos
resultados se muestra como una matriz de similitud o distancia.
La medida de similitud por correlación es particularmente útil cuando los datos de los
lazos están valorados, esto es contienen información acerca de la fortaleza del vínculo
y no sólo de su presencia o ausencia. Las correlaciones Pearson van entre -1.00 (que
significa que dos actores tiene exactamente los mismo lazos opuestos entre sí), a
través de cero (que implica que el conocimiento de los vínculos de un actor a un
tercero no nos ayuda a estimar los lazos de otro actor con ese tercero) a +1
(implicando que los dos actores tienen exactamente el mismo par de vínculos con
otros, una equivalencia estructural perfecta). Las correlaciones Pearson se usan a
menudo para sumarizar equivalencia estructural pareada, porque el estadístico "r" se
usa frecuentemente en estadística social. Si los datos no son verdaderamente
nominales o si la densidad es muy alta o muy baja, las correlaciones pueden ser
problemáticas y deberían examinarse los aciertos. Diferentes estadísticos usualmente
entregan las mismas respuestas. A continuación se presentan las correlaciones
Pearson entre los vectores concatenados de filas y columnas calculados con UCINET.
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
----- ----- ----- ----- ----- ----- ----- ----- ----- -----
1 1.00
2 0.42 1.00
3 0.10 -0.48 1.00
4 0.50 0.42 0.13 1.00
5 0.33 0.79 -0.38 0.33 1.00
6 -0.07 0.15 0.00 -0.07 0.00 1.00
7 0.40 0.29 0.22 0.42 0.10 -0.37 1.00
8 0.63 0.37 0.26 0.63 0.29 -0.00 0.05 1.00
9 0.63 0.04 0.26 0.38 -0.10 -0.10 0.59 0.49 1.00
10 0.26 0.29 0.40 0.52 0.25 0.36 -0.03 0.38 0.13 1.00
7
Una manera de llegar a una síntesis aún más clara se obtiene al realizar un análisis de
aglomerados (cluster) de la matriz de similitud. Lo que éste hace es agrupar juntos a
los nodos que son más similares primero, en este caso los actores 2 y 5. Tomando los
puntajes de cada conglomerado (cluster) que están más cerca de alguno de los otros
conglomerados (método de vínculo único o vecino más cercano), se recalculan las
similitudes, y en seguida se agrega el siguiente par más similar (podría ser otro par de
actores, o el par 2 y 5 con algún otro actor). Este proceso continúa hasta que todos
los actores estén unidos. A continuación se presenta un sumario de la matríz de
similitud o proximidad, generado por un análisis de aglomeración de vínculo único.
Notas: El resultado establece que los actores #5 y #2 son más similares (a nivel de
.787 usando el método particular de aglomeración escogido). Este par permanece
separado de todos los demás hasta bien avanzado el proceso de aglomeración. El
siguiente par más similar es el constituido por el actor #1 y el #8 (a .630); luego el par
#7, #9 (a .595). A una similaridad de .587 un grupo más grande es creado, compuesto
por los actores #4, #1 y #8; el proceso continúa hasta que todos los actores se
aglomeran. Notar que los actores #6, #3 y #10 se aglomeran en un grupo suelto, y
están bastante distante de los restantes actores.
8
Nota que en un alto nivel de similaridad (.787), los diez actores se dividen en 9 grupos
(5 y 2, y cada uno de los demás). Si permitimos que los miembros de los grupos sigan
siendo equivalentes, aún si son similares sólo a nivel .60 (.585), podemos llegar a un
cuadro bastante distinto: hay 6 grupos entre los diez actores. Si bajamos al nivel .40
de similitud, hay tres grupos con un excluido (el casi aislado WRO, # 6). Podríamos
dibujar un diagrama del número de grupos (en el eje Y) contra el grado de similaridad
al aglomerar (en el eje X). Este diagrama es uno del tipo de retornos marginales
(llamado en análisis factorial un Plot Screen). su punto de inflexión es el más eficiente
número de grupos. Más usualmente, uno busca una imagen del número de grupos
estructuralmente equivalentes que es suficientemente simple de comprender, a la vez
que sea suficientemente fuerte estadísticamente (con una relativamente alta similitud)
para ser defendible.
DISTANCIAS EUCLIDIANAS
Una medida relacionada pero menos sensibles es la distancia Euclidiana. Esta es una
medida de dis-similitud, pues es la raíz de la suma de las diferencias al cuadrado entre
los vectores de los actores, es decir, las columnas de la matriz de adyacencia. En
muchos casos, los análisis de distancias euclidianas y de correlación pearson arrojan
el mismo resultados sustantivo. No obstante es una práctica recomendable analizar
ambas.
9
EUCLIDEAN DISTANCE MATRIX
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
---- ---- ---- ---- ---- ---- ---- ---- ---- ----
1 0.00
2 2.45 0.00
3 2.65 3.32 0.00
4 2.00 2.45 2.65 0.00
5 2.65 1.00 3.16 2.65 0.00
6 3.00 3.32 2.83 3.00 3.46 0.00
7 2.24 2.24 2.45 2.24 2.45 3.46 0.00
8 1.73 2.65 2.45 1.73 2.83 2.83 2.83 0.00
9 1.73 3.00 2.45 2.24 3.16 2.83 2.00 2.00 0.00
10 2.45 2.83 2.24 2.00 3.00 2.24 3.00 2.24 2.65 0.00
Nota: El patrón es bastante similar. Los actores 2 y 5 que tienen la correlación más
fuerte (una medida de similaridad) tienen la menor distancia (una medida de dis-
similaridad). A diferencia del coeficiente de correlación, el tamaño de la distancia
euclidiana no puede interpretarte. Todas las distancias serán positivas (o al menos no
negativas), y las ideas de asociación positiva, no asociación o asociación negativa,
que tenemos con el coeficiente de Pearson, no se pueden usar con las distancias.
Noten que el rango de los valores de las distancias euclidianas es relativamente
menor que el de las correlaciones que vimos anteriormente. La distancia mayor no es
a la menor tantas veces como la correlación mayor es a la menor. Esto resulta de la
manera que se calculan, dando menos ponderación o peso a los casos extremos.
10
PORCENTAJE DE COINCIDENCIA EXACTA
En algunos casos los vínculos que examinamos pueden estar medidos al nivel
nominal. Cada par de actores puede tener una relación de uno de diversos tipos
(codificados como "a", "b" "c" o "1", "2", "3"). Aplicar distancias euclidianas o
correlaciones a ese tipo de datos puede ser erróneo. En vez, estamos interesados en
el grado en el cual una relación para el actor X es una coincidencia exacta con la
correspondiente relación del actor Y. Con datos binarios, el porcentajes de
coincidencia exacta pregunta a través de todos los actores para los que podemos
hacer comparaciones, ¿qué porcentaje de las veces X e Y tienen la misma relación
con otro actor? Esta es una medida de equivalencia estructural para datos binarios
dado que coincide mucho con nuestra noción del significado de la equivalencia
estructural.
Nota: Estos resultados muestran la similitud de otra manera pero que es bastante fácil
de interpretar. El número .63 en la celda 2,1 significa que, comparando al actor #! con
el #2, tienen el mismo vínculo (presente o ausente) a otros actore el 63% de las veces.
La medida es particularmente útil con medidas nominales multi-categoriales de
relaciones; también provee una escala para datos binarios.
11
AGLOMERACION JERARQUICA DE LA MATRIZ DE COINCIDENCIA EXACTA.
1
Level 5 2 4 1 8 7 9 6 3 0
----- - - - - - - - - - -
0.938 XXX . . . . . . . .
0.813 XXX . XXX . . . . .
0.792 XXX XXXXX . . . . .
0.750 XXX XXXXX XXX . . .
0.698 XXX XXXXXXXXX . . .
0.688 XXX XXXXXXXXX . XXX
0.625 XXX XXXXXXXXX XXXXX
0.554 XXX XXXXXXXXXXXXXXX
0.432 XXXXXXXXXXXXXXXXXXX
COEFICIENTES DE JACCARD
Un enfoque para resolver este problema consiste en calcular el número de veces que
ambos actores reportan una relación (del mismo tipo de vínculo) a los mismos terceros
actores como un porcentaje del número total de vínculos reportados. Esto es,
ignoramos los casos en que ni X o Y están ligados a Z, e inquirimos, qué porcentaje
en común tienen en relación a la totalidad de vínculos presente. Esta medida se llama
porcentaje de coincidencias positivas (por UCINET), o el coeficiente Jaccard (en
SPSS). He aquí el resultado obtenido de los datos:
12
Percent of Positive Matches (Jaccard coefficients)
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
----- ----- ----- ----- ----- ----- ----- ----- ----- -----
1 1.00
2 0.54 1.00
3 0.46 0.31 1.00
4 0.60 0.54 0.42 1.00
5 0.50 0.93 0.38 0.50 1.00
6 0.18 0.27 0.11 0.18 0.25 1.00
7 0.58 0.64 0.54 0.55 0.60 0.08 1.00
8 0.67 0.46 0.50 0.67 0.43 0.20 0.38 1.00
9 0.67 0.36 0.50 0.55 0.33 0.11 0.64 0.56 1.00
10 0.40 0.43 0.44 0.60 0.36 0.38 0.31 0.50 0.36 1.00
HIERARCHICAL CLUSTERING OF JACCARD COEFFICIENT MATRIX
1
Level 6 2 5 3 4 1 8 7 9 0
----- - - - - - - - - - -
0.929 . XXX . . . . . . .
0.667 . XXX . . XXX . . .
0.644 . XXX . XXXXX . . .
0.636 . XXX . XXXXX XXX .
0.545 . XXX . XXXXXXXXX .
0.497 . XXX XXXXXXXXXXX .
0.435 . XXXXXXXXXXXXXXX .
0.403 . XXXXXXXXXXXXXXXXX
0.272 XXXXXXXXXXXXXXXXXXX
Nota: De nuevo el cuadro básico emerge, sugiriendo que no importa mucho qué
estadístico se usa para indexar la similaridad estructural entre un par de actores - al
menos para obtener el cuadro general. La aglomeración de estas distancias esta vez,
enfatiza la singularidad del actor # 6, el cual es aún más singular por esta medición
debido al número relativamente pequeño del total de relaciones que tiene, que resulta
en un nivel de similitud aún menor debido a que se ignora la ausencia de lazos
conjuntos. Cuando los datos son ralos, y hay muy sustanciales diferencias en los
grados de los puntos, es una buena opción para datos nominales o binarios, usar el
coeficiente de coincidencia positiva.
Con algo de inventiva, se puede pensar en algunas otras formas de indexar el grado
de similitud estructural entre actores. Se puede usar la rutina "proximities" de SPSS,
que ofrece una colección grande de medidas de similitud, junto con una buena
discusión de ellas. La elección de la medida debe estar orientada por la noción
conceptual de qué es lo importante acerca de la similaridad de dos perfiles de relación
para los propósitos del análisis particular. A menudo, con franqueza, hace poca
diferencia, pero esto no es suficiente para ignorar la cuestión.
13
DESCRIPCIÓN DE CONJUNTOS DE EQUIVALENCIA
ESTRUCTURAL: MODELOS E IMÁGENES DE BLOQUES
Los enfoques que hemos examinado hasta ahora procuran proveer sumarios de cuán
similares o distintos son un par de actores usando la vara de la equivalencia
estructural. Estas matrices de similitud o proximidad (y a veces, de su opuesto,
distancia), proveen una completa descripción de parejas de estos aspectos de
posiciones en las redes. Pero es difícil ver el bosque por medio de los árboles, las
matrices de distancia y similitud a veces son tan grandes y densas como las matrices
de adyacencia o de vínculos de las que se derivan.
Un enfoque muy útil para obtener el cuadro general consiste en aplicar el análisis de
conglomerados para intentar discernir cuantos conjuntos de equivalencia estructural
hay, y cuáles actores están en cada conjunto. Vimos antes varios ejemplos acerca de
cómo se puede usar el análisis de conglomerados para presentar cuadros más
simples y sintéticos de patrones de similitud o disimilaridad de la posición estructural
de actores. El análisis de conglomerados está fuertemente afincado en
comparaciones de pares y jerárquicas. También asume la unidimensionalidad
subyacente en los datos de similitud. A menudo es útil considerar otros enfoques que
tienen distintos sesgos. Uno de ellos es el escalamiento multidimensional, que no
será discutido aquí, ya que raramente se usa para analizar datos de equivalencia
estructural. Examinaremos tres enfoques más comunes: CONCOR, análisis de
componentes principales y búsqueda de tabú.
14
CONCOR
CONCOR entonces divido los datos en dos conjuntos sobre la base de esas
correlaciones. Luego, en cada conjunto (si tienen más de dos actores) el proceso se
repite. Continúa hasta que todos los actores son separados (o hasta que perdemos
interés en el proceso). El resultado en un árbol binario que da lugar a la partición final.
Para ilustrarlo pedimos a CONCOR nos muestre los grupos que mejor satisfacen esta
propiedad cuando creemos que hay cuatro grupos. Todos los algoritmos de bloques
requieren que tengamos una idea a priori acerca de cuantos grupos hay.
Matriz de bloques
15
Nota: La matriz de bloques ha reagrupado las filas y columnas (e insertado líneas
divisorias o "particiones") para intentar poner juntos a los actores que tienen filas y
columnas similares (dada la restricción de forzar en cuatro grupos). La matriz de
bloques nos permite ver las similitudes que tienen los cuatro grupos (y también que las
agrupaciones no son perfectas). El primer grupo [1,4,8,9] no presenta un perfil
consistente de envío y recepción de información entre sus integrantes, no son un
clique. La relación de este grupo [1,4,8,9] con el próximo [7,3] es interesante. Todos
los actores del primer grupo envían información al 7 pero no a 3. Solamente un actor
del primer grupo recibe información de [7,3] y lo hace de ambos integrantes. Cada
miembro del grupo [1,4,8,9] envía y recibe información de ambos miembros de [5,2].
Finalmente el conjunto [1,4,8,9] es similar pues no envían ni reciben información de
[6,10]. Los actores 5 y 2 tienen perfiles casi idénticos de la comunicación recíproca
con todos los miembros de cualquier otro grupo, con la excepción de [6,10]. Por último
[6,10] está aislado, pero envía a ambos [7,3]; y comparten el hecho de que sólo [3] les
reciproca.
El diagrama de bloques permite ver con bastante claridad qué actores son
estructuralmente equivalentes, y , más importante, qué de los patrones de sus
relaciones define la similitud. En algunos casos desearíamos sintetizar la información
aún mas, creando una imagen del diagrama de bloques. Para ello, combinamos
elementos de las filas y columnas en grupos y caracterizamos las relaciones en la
matriz como presente si despliegan una densidad mayor a la promedio (recordemos
que en esta matriz la densidad general es .50). Si menos lazos están presente, se
introduce un cero. La imagen de los bloques es:
Nota: Esta "imagen" del diagrama de bloques tiene la virtud de una simplicidad
extrema, aunque una buena cantidad de información acerca de las relaciones entre
actores se ha perdido. Dice que los actores en el bloque 1 tienden a no enviar y
recibir recíprocamente o con el bloque 4; tienden a enviar información a los bloques 2
16
y 3 pero reciben información sólo del 3. El segundo bloque de actores aparecen como
receptores. Envían sólo al bloque 3, pero reciben información de cada uno de los
otros grupos. El tercer bloque envía y recibe con los bloques 1 y 2, pero no con el 4.
Finalmente, tal como antes, los actores del bloque 4 envían a los actores del bloque 2
pero no reciben información de ninguno de los otros bloques.
17
BÚSQUEDA DE TABÚ
18
amplias de la matriz tienen ahora varianza mínima - las entradas en las celdas son las
mismas. Esto es lo que el modelo de bloques intenta hacer: producir regiones lo más
grande posibles, con homogeneidad de puntajes. Podemos interpretar directamente
los resultados o producir una imagen de bloques:
Comentario: Esta imagen sugiere que dos de los tres bloques es algo más solidario,
en tanto que sus miembros envían y reciben información entre ellos (bloques 1 y 2).
Los actores en el bloque 3 son similares por cuanto no intercambian información entre
ellos directamente. Lo que estamos viendo es una especie de jerarquía entre bloques
1 y 2, con el bloque 3 más aislado. Estos patrones se pueden representar en un
gráfico.
19
ANÁLISIS FACTORIAL, DE COMPONENTES PRINCIPALES
20
21
Comentario: El análisis factorial identifica una clara y fuerte dimensión, y dos
adicionales que son esencialmente internas. El segundo y tercer factor se deben a la
particularidad de los patrones de las distancias de EDUC y a los patrones de las
distancias de WRO. Estas distancias no se pueden explicar por los mismas patrones
subyacentes de los otros, lo que sugiere que estas dos organizaciones no pueden ser
priorizadas en las mismas dimensiones de similitud de que las otras.
Este resultado es bastante distinto al obtenido con los otros métodos. En parte se
debe al uso de distancias en vez de adyacencias. La principal razón para la
diferencias es, sin embargo, que los métodos factoriales (y de escalamiento
multidimensional) buscan por dimensionalidades en los datos, en vez de suponer
unidimensionalidad. Los resultados sugieren que las organizaciones 3 y 6 no son
estructuralmente equivalentes a las otras y que sus lazos difieren en su significado o
función de los vínculos entre las otras organizaciones. En un sentido, el resultado
implica que el intercambio de información para estas dos organizaciones puede ser de
un tipo de vinculación distinto que el de las demás organizaciones.
Es sugerente el uso del análisis factorial para purificar las agrupaciones por medio de
la extracción y remoción de dimensiones secundarias. Como casi todos los usos del
análisis factorial, sin embargo, debería ser usado juiciosamente. Los resultados
pueden ser similares, o muy distintos a los obtenidos con métodos de escalamiento
unidimensional. Como siempre, no hay ninguno inherentemente correcto.
ESCALAMIENTO MULTIDIMENSIONAL
22
cuánta variación presentan en cada dimensión. A continuación se presentan los
resultados de la rutina no paramétrica de UCINET usada para generar un mapa
bidimensional de la matriz de adyacencia.
23
Comentario: El stress en dos dimensiones es bajo, esto es, la bondad de ajuste es
alta. Esto sugiere que la tercera dimensión identificada por el análisis factorial previo
puede no haber sido necesaria. EDUC y WRO son de nuevo identificados como
estableciendo una dimensión distinta de las similaridades, en este caso dim 1. La
aglomeración de casos en la dimensión principal, la dim 2, no corresponde muy
cercanamente a los métodos de bloques ni factorial {1,10}, {2,4,5,7,8}, {9}.
Esto puede deberse a varias razones, tales como usar distancias euclidianas en vez
de correlaciones, dos en vez de tres dimensiones, etc. Una vez mas no se trata de
que una solución sea la correcta y las demás no. El enfoque MDS está mostrandonos
24
algo diferente y adicional acerca de las equivalencias estructurales aproximadas de
estos puntos.
Aunque se puede a veces ver patrones de equivalencia estructural a ojo en una matriz
de adyacencia o en un diagrama, casi siempre debemos usar métodos numéricos.
Estos nos permiten lidiar con datos multiplejos, grandes números de actores y datos
valorizados, así como de tipo binario, como el que hemos examinado aquí.
El primer paso es producir una matriz de similitud o distancia para todo par de actores.
Esta matriz sintetiza la similaridad o disimilaridad general de cada par de actores en
términos de sus relaciones con otros. Hay varias maneras de calcular esos índices,
los mas comunes son la correlación Pearson, la distancia euclidiana, la proporción de
coincidencias (para datos binarios) la proporción de coincidencias positivas
(coeficiente Jaccard, también para datos binarios).
25
permutación y búsqueda de bloques de ceros y unos perfectos en la matriz de
adyacencia (búsqueda tabú).
26
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.
Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].
Estos capítulos han sido traducidos por René Ríos, Departamento de Sociología de la
Universidad Católica de Chile.
2
CAPÍTULO X. EQUIVALENCIA AUTOMÓRFICA.
DEFINICIÓN
3
realidad mirando las posiciones de los actores en una red en particular. Estamos
tratando de encontrar actores que son clones de substitutos.
4
comparadas se vuelve extremadamente grande. Para los grafos de muchas redes
reales, no los ejemplos soñados por los teóricos, puede no haber automorfismos
exactos. Para grafos complicados, y particularmente para grafos dirigidos o valorados,
la cantidad de capacidad computacional requerida puede ser abrumadora y se puede
asegurar queno habrá mas que unas pocas equivalencias si las hay.
Al igual que con la equivalencia estructural, puede ser útil identificar automorfismos
aproximados, los que pueden surgir cuando la medición de relaciones contiene
errores, cuando la variabilidad muestral ofrece un cuadro incompleto de la red o
cuando las relaciones que generan una red no está en equilibrio, es decir cuando los
procesos de transitividad y balance no están completos cuando se colecta los datos.
O, por supuesto, puede darse el caso de que en una red exista verdaderamente un
conjunto de actores que son similares entre sí, pero no exactamente equivalentes.
UCINET provee diversos enfoques para identificar conjuntos de actores que son
aproximadamente equivalentes automórficamente.
Una vez que la matriz de disimilitudes ha sido generada, se pueden usar análisis de
conglomerados o escalamiento dimensional para identificar particiones de actores
aproximadamente equivalentes.
5
como automórficamente equivalentes a los actores que tienen perfiles similares de
distancia. Nuevamente, el foco radica en saber si el actor u tienen un conjunto similar
de distancias, sin importar las distancias, con el actor v. El escalamiento dimensional
o aglomeración de distancias se pueden usar para identificar conjuntos de actores
aproximadamente automórficamente equivalentes.
Al revés de otros métodos mencionados aquí, la búsqueda tabú, produce una matriz
particionada, y no un matriz de disimilaridades. También provee de un estadístico de
maldad de ajuste. Ambos resultados hacen recomendable este enfoque quizás
combinado con otros métodos.
6
ALGUNOS EJEMPLOS
Comentario: Los actores están listados en las filas, el número de sus geodésicas de
distintas longitudes están en las columnas.
7
Nota: Las disimilaridades están medidas como distancias euclidianas.
Este es el producto del algoritmo Maxsim de UCINET (nodo 1 = "A", nodo 2 ="B", etc.)
Comentario: Maxsim es mas útil con datos valorizados, de modo que se analizan las
recíprocas de las distancias en vez de las adyacencias.
8
DISTANCIAS ENTRE ACTORES
1 2 3 4 5 6 7
---- ---- ---- ---- ---- ---- ----
1 0.00 3.22 3.62 3.73 3.62 3.22 0.00
2 3.22 0.00 1.16 1.37 1.16 0.00 3.22
3 3.62 1.16 0.00 0.50 0.00 1.16 3.62
4 3.73 1.37 0.50 0.00 0.50 1.37 3.73
5 3.62 1.16 0.00 0.50 0.00 1.16 3.62
6 3.22 0.00 1.16 1.37 1.16 0.00 3.22
7 0.00 3.22 3.62 3.73 3.62 3.22 0.00
El grafo presentado por Wasserman y Faust es ideal para ilustrar las diferencias entre
las equivalencias estructurales, automórficas y regular. Antes de mirar los resultados,
vea si puede escribir cuales son las posiciones automórficamente equivalentes en esta
red.
He aquí el producto del examen de UCINET para todas las permutaciones de este
grafo.
9
Comentario: El algoritmo examinó más de trescientos mil posibles permutaciones del
grafo. Vemos que dos de las ramas (B,E, F y D,H,I) son intercambiables como
subestructuras completas.
10
Al igual que con la equivalencia estructural, puede ser útil examinar aproximada
equivalencia automórfica. Para ello es útil el algoritmo de búsqueda TABU.
Seleccionamos el número de particiones a evaluar y el programa busca encontrar el
error mínimo al agrupar los casos.
He aquí los resultados del análisis de los datos de Knoke con el algoritmo de
búsqueda TABU de UCINET. Primer examinamos la bondad de ajuste de diferentes
números de particiones de los datos.
11
Comentario: Las filas y columnas de WRO tiene varianzas similares (altas), y las filas
y columnas de MAYR tienen similares varianzas (bajas). Pareciera que el algoritmo ha
funcionado bien al dividir la matriz en bloques de modo que produzca filas y columnas
con similar varianza dentro de los bloques. Una visión bastante simple, pero no tan
cruda, de los datos es que el MAYR y el WRO son bastante únicos, y tienen relaciones
similares con actores más o menos intercambiables en el resto del grupo grande.
Por supuesto que, con más particiones, podemos lograr mejor bondad de ajuste. Los
analistas tendrán que ejercer su propio juicio, dados los objetivos de su estudio,
acerca de si un mejor ajuste significa un mejor modelo o tan sólo uno que es más
complicado. He aquí el resultado para siete particiones:
12
Comentario: En este caso, particiones adicionales de los datos dan por resultado la
separación adicional de actores individuales en torno a un centro más grande. Lo cual
no es necesariamente el caso, pues podrían haber resultado facciones o divisiones de
particiones, así como la separación de actores individuales. Nos queda una visión de
la red como una en la que hay un núcleo con cerca de la mitad de los actores que son
más o menos sustituibles en sus relaciones con otras posiciones, seis, en el resultado
mostrado.
RESUMEN CAPÍTULO X
13
que cada miembro de cualquier clase tiene relaciones similares con algún miembro de
cada una de las otras.
14
CAPÍTULO XI. EQUIVALENCIA REGULAR
DEFINICIÓN
15
El enfoque de equivalencia regular de una red se puede usar entonces para ubicar y
definir la naturaleza de los roles por sus patrones de relación. La relación entre roles
que el análisis de equivalencia regular hace patente y las percepciones de los actores
o la denominación de sus roles, pueden ser problemáticos. Lo que los actores rotulan
con nombres de roles y las expectativas (o normas que van con los roles) resultantes
que tienen hacia ellos pueden influir pero no determinar completamente los patrones
reales de interacción. Estos a su vez, son regularidades de las cuales emergen roles
y normas.
La definición formal postula que dos actores son regularmente equivalentes si tienen
un patrón similar de vínculos con otros que a su vez son equivalentes entre sí.
Consideremos a dos hombres. Cada uno tiene hijos, aunque en números diferentes.
Tienen una esposa, cada una de ellas a su vez, tienen hijos y un marido, es decir tiene
vínculos con todos y cada uno de los miembros de esos conjuntos. Cada hijo tiene
vínculos con uno o más miembros del conjunto esposos y esposas.
Al identificar qué actores son maridos no nos interesan los vínculos entre miembros de
este conjunto, de hecho esperaríamos que este bloque fuese cero. Lo que es
importante es que cada marido tenga al menos un vínculo con una persona en la
categoría esposa y al menos uno en la categoría hijo. Los maridos son equivalentes
entre sí porque tienen vínculos similares con miembros de los conjuntos esposas e
hijos.
Pero pareciera haber un problema con esta bastante simple definición. Si la definición
de cada posición depende de su relación con otras posiciones, ¿por dónde se parte?
16
Consideremos una vez más, la red en el ejemplo de Wasserman-Faust. Supongamos
que es una imagen de una jerarquía simple de comando. Todos los vínculos están
dirigidos desde lo alto del diagrama hacia abajo. Encontraremos una caracterización
de equivalencia regular de este diagrama.
Primero, caracterizamos cada posición como una fuente (un actor que envía vínculos,
pero que no los recibe), un repetidor (un actor que recibe y envía) y un sumidero (un
actor que recibe pero que no envía). La fuente es A, los repetidores son B,C y D y los
sumideros son E,F,G,H e I. Hay una cuarta posibilidad lógica. Un aislado es un nodo
que ni envía ni recibe vínculos. Los aislados forman un conjunto con equivalencia
regular en cualquier red, y deberían ser excluidos del análisis de equivalencia de un
sub grafo conectado.
Ahora consideremos a los terminales (los actores E,F,G,H e I). Cada uno está
conectado a una fuente (que son distintas). Hemos establecido que, en este caso,
todas las fuentes (B,C y D) son regularmente equivalentes. De modo que E e I, están
equivalentemente conectados a otros equivalentes. Con eso termina la partición.
17
El resultado de la partición [A], [B,C,D],, [E,F,G,H,I] satisface la condición de que cada
actor en cada partición tenga el mismo patrón de conexión con actores de otras
particiones. La matriz de adyacencia permutada se ve así:
Es útil hacer bloques en la matriz para mostrar su imagen. Aquí, sin embargo,
usaremos algunas reglas especiales para determinar los bloques con 0 y con 1. Si un
bloque está compuesto por puros 0, será un bloque 0. Si cada actor en una partición
tienen un vínculo con cualquier actor de otro bloque, definiremos el bloque conjunto
como un bloque 1. La imagen usando esta regla es:
A emite a uno o más del BCD pero a ninguno del EFGHI. BCD no envía a A, pero
cada uno de BCD envía al menos uno a EFGHI. Ninguno de EFGHI envía a alguno de
A o de BCD. Esta imagen, de hecho, despliega el patrón característico de una
jerarquía estricta: unos en el vector en la primera diagonal (hacia arriba de la diagonal
principal) y ceros en todos los demás. La regla para definir un bloque 1 cuando cada
18
actor es una partición tiene un vínculo con un actor en otra partición es una manera de
operacionalizar la noción de que los actores del primer conjunto son equivalentes si
están conectados con actores equivalentes entre sí, en la otra partición, sin que se
requiera, o se impida, que estén vinculados a los mismos otros actores. Esta regla de
imagen es la base para el algoritmo de búsqueda tabú. La búsqueda en el vecindario,
es la base para el enfoque REGE para datos categóricos (discusión y ejemplos más
abajo).
19
Si no se dispone del direccionamiento, no podemos dividir los datos en fuentes,
repetidores y terminales, de modo que la idea de búsqueda vecinal se diluye. En este
caso tiene más sentido examinar la matriz de distancias geodésicas, en vez de la
matriz de adyacencia. Entonces se puede usar REGE categorial, que trata cada valor
de distancia geodésica como un vecindario cualitativamente diferente. O, se puede
usar REGE continuo, probablemente una opción más razonable, considerando el
inverso de la distancia como una medida de la fuerza del vínculo.
Veamos algunos ejemplos de estos enfoques con datos reales. Primero vamos a
ilustrar el enfoque básico de búsqueda vecinal con REGE categorial. Luego
compararemos los tratamientos categoriales y continuos de los valores de las
geodésicas en un grafo no dirigido. Finalmente, vamos a aplicar el método de
búsqueda tabu a datos binarios dirigidos.
El algoritmo REGE, cuando se aplica a datos binarios, primero categoriza a los actores
como fuentes, repetidores y terminales. Luego intenta subdividir a los actores en cada
una de esas categorías de acuerdo a los tipos de actores en el vecindario. El proceso
continúa, por no muchos pasos, hasta que todos los actores están divididos, y no hay
20
una mayor diferenciación obtenible por extensión del vecindario. He aquí los
resultados:
Comentario: Este enfoque sugiere una solución de {1,4,9}, {3,6,8,10}, {5}. Vemos
más adelante que es partición es similar aunque no idéntica con la solución producida
por la búsqueda Tabú. En este caso, los actores y sus vecindarios son bastante
similares en un sentido tosco, de ser fuentes, repetidores y terminales. Cuando los
roles de los actores son muy similares en este sentido tosco, la búsqueda vecinal
simple no puede producir resultados sosos.
Los datos sobre alianzas matrimoniales entre las familias de la elite Florentina
presentan densidades de medianas a bajas y no son dirigidas. Hay considerables
diferencias entre las posiciones de las familias.
21
El algoritmo REGE categorial se puede usar para identificar actores con equivalencia
regular tratando los elementos de la matriz de distancia geodésica como descriptores
del tipo de vínculos, de modo que distintas distancias geodésicas son tratadas como
cualitativamente diferentes. Dos nodos son equivalentes si cada uno tienen un actor
en su vecindario que es del mismo tipo, en este caso, esto significa que son similares
si cada uno tiene un actor que está a la misma distancia geodésica respecto a ellos.
Con muchos conjuntos de datos, los niveles de similitud de vecindarios pueden
resultar bastante altos, y puede ser difícil diferenciar las posiciones de los actores
sobre la base de la equivalencia regular.
22
Comentario: El uso de Rege con datos no dirigidos, puede producir resultados
inesperados, aún cuando se sustituyen las distancias geodésicas por valores binarios.
Puede ser más útil combinar el número de vínculos distintos para producir valores
continuos. El principal problema es que con datos no dirigidos la mayoría de los casos
van a aparecer muy similares unos con otros (en el sentido "regular), y ningún
algoritmo puede corregir esto. Si las distancias geodésicas se pueden usar para
representar las diferencias en los tipos de vínculo, que es la cuestión conceptual, y si
los actores tienen alguna variabilidad en sus distancias, este método produce
resultados significativos. Pero, en mi opinión, debe usado con cautela, si es que se
usa, con datos no dirigidos.
Un enfoque alternativo para los datos no dirigidos de Padgett es tratar los distintos
niveles de distancias geodésicas como medidas de (la inversa) de la fortaleza de
vínculos. Dos nodos son más equivalentes si tienen un actor de similar distancia en
su vecindario (similar en el sentido cuantitativo de que 5 es más similar a 4, que lo que
es 6). Por defecto, el algoritmo extiende la búsqueda a vecindarios de distancia 3,
aunque se pueden seleccionar menos o más.
23
EQUIVALENCIA REGULAR POR MEDIO DEL ALGORITMO REGE
DE WHITE/REITZ
24
Comentario: Una mejor opción para datos no dirigidos que el enfoque categorial, es
el algoritmo REGE continuo aplicado a las distancias geodésicas. El resultado sigue
mostrando equivalencias regulares bastante altas ente los actores, y la solución es
modestamente similar a la del enfoque categorial.
25
Comentario: El método produce un estadístico de ajuste y deben compararse las
soluciones para distintos números de particiones. En este caso, un modelo de 5
grupos se ajusta mejor que la solución de 4 grupos mostrada aquí. La solución de 4
grupos se reporta para que se pueda comparar con el resultado de búsqueda de
vecindario, presentada antes.
El método de búsqueda tabú puede ser muy útil y generalmente produce resultados
interesantes. Es un algoritmo iterativo de búsqueda, pero igualmente puede encontrar
soluciones locales. Muchas redes tienen más de una partición válida por medio de la
equivalencia regular y no hay garantías de que el algoritmo siempre encontrará la
misma solución. Debe ser ejecutado varias veces con diferentes configuraciones
iniciales.
26
RESUMEN DEL CAPÍTULO XI
El concepto de equivalencia regular es muy importante para los sociólogos que usan
métodos de análisis de red, porque es coincidente con la noción de rol social. Dos
actores son equivalentes regulares si tienen a su vez, relaciones a otros equivalentes
(no necesariamente los mismos, o en el mismo número). Las equivalencias pueden
ser exactas o aproximadas. A diferencia de definiciones estructurales o automórficas
de equivalencia, puede haber muchas maneras válidas para clasificar a los actores en
conjuntos de equivalencia regular en un grafo dado - y más de una puede ser
significativa.
27