Está en la página 1de 192

INTRODUCCIÓ N A LOS MÉTODOS DEL

ANÁLISIS DE REDES SOCIALES.

CAPÍTULO PRIMERO

Robert A. Hanneman. Departmento de Sociología de la


Universidad de California Riverside
NOTA PREVIA

Este documento está traducido para la lista REDES con permiso del autor a partir de
la versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html< [Fecha de consulta:
Octubre de 2000].

La traducción se ha realizado por bloques. En este documento se presenta el primer


capítulo, traducido por Maria Ángela Petrizzo y revisado por José Luis Molina.

Lazos y relaciones, datos de redes y datos reticulares son utilizados en la traducción


como expresiones equivalentes.

2
SOBRE ESTE LIBRO

Este libro introduce muchos de los enfoques del análisis formal de las redes sociales,
proporcionando breves referencias y ejemplos de la mayoría de sus áreas de
desarrollo más importantes. El texto se apoya en las obras de Freeman, Borgatti y
Everett (los autores del programa UCINET). Los materiales y su organización, están
inspirados en el texto de Wasserman y Faust, y en un seminario de postgrado dirigido
por el profesor Phillip Bonacich en la UCLA en 1998. Los errores y omisiones, por
supuesto, son responsabilidad del autor.

TABLA DE CONTENIDOS

1. Los datos de las redes sociales.

2. ¿Por qué métodos formales?

3. Utilizando gráficos para representar relaciones sociales.

4. Utilizando matrices para representar relaciones sociales.

5. Propiedades básicas de las redes y los actores

6. Centralidad y poder.

7. Camarillas y subgrupos.

8. Posiciones en la red y roles sociales: el análisis de la equivalencia.

9. Equivalencia estructural.

10. Equivalencia automórfica.

11. Equivalencia regular.

Bibliografía de trabajos relacionados con (o ejemplos de) métodos de redes


sociales.

3
CAPÍTULO I . LOS DATOS DE LAS REDES SOCIALES.

INTRODUCCIÓ N: ¿SON DIFERENTES LOS DATOS DE LAS REDES

SOCIALES?

De entrada, no hay nada inusual en los datos utilizados en el análisis de redes


sociales Es cierto que quienes trabajan con redes utilizan un lenguaje especializado
para describir la estructura y los contenidos de los conjuntos de observaciones
estudiados, pero los datos de redes también pueden describirse y entenderse
utilizando las perspectivas y los conceptos propios de métodos más familiares como la
investigación sociológica tradicional (cross-sectional survey research).

Sin embargo, a menudo los datos que los investigadores en redes sociales estudian
resultan muy distintos de la tradicional matriz rectangular tan familiar para los
investigadores y el análisis estadístico. Las diferencias son importantes porque nos
llevan a observar los datos de una manera distinta –y también a pensar de manera
distinta-- sobre cómo aplicar los procedimientos estadísticos.

Los datos sociológicos “convencionales” están compuestos por una matriz rectangular
con mediciones. Las filas de la matriz son los casos, sujetos u observaciones. Las
columnas son las puntuaciones (cuantitativas o cualitativas) de los atributos, variables
o mediciones. Entonces, cada celda de la matriz describe la puntuación de algún actor
con respecto a algún atributo. En algunos casos, estas matrices pueden tener una
tercera dimensión que representa los cuadros de observaciones de múltiples grupos.

Nombre Sexo Edad Grado de Inclusión

Bob Hombre 32 2

Carol Mujer 27 1

Ted Hombre 29 1

Alice Mujer 28 3

4
La estructura de datos fundamental es aquella que permite comparar qué tan
parecidos o diferentes son los actores entre sí en base a los atributos (comparando
las filas). O quizá más frecuentemente, examinemos qué tan parecidas o diferentes
son las variables entre sí (comparando las columnas).

Los datos de la “red” (en su forma más pura), constituyen una matriz cuadrada de
mediciones. Las filas de la matriz son los casos, sujetos y observaciones. Las
columnas son el mismo conjunto de casos, sujetos y observaciones –allí está la
diferencia clave con los datos convencionales. En cada celda de la matriz se describe
una relación entre los actores.

¿Quién dice relacionarse con quién?

Elección

Informante Bob Carol Ted Alice

Bob --- 0 1 1

Carol 1 --- 0 1

Ted 0 1 --- 1

Alice 1 0 0 ---

Podemos observar esta estructura de datos de la misma forma que los datos
atributivos. Comparando las filas de la matriz, podemos observar qué actores se
parecen a otros en la persona que han escogido. Mirando a las columnas, podemos
ver quién es parecido a quién en términos de haber sido escogido por los demás.
Estas formas son muy útiles para observar los datos, puesto que sirven para ver
aquellos actores que tienen posiciones similares en la red. Este es el primer punto
importante del análisis de redes: buscar qué actores está ubicados o insertados en la
red.

Pero a un analista de redes sociales también le gusta mirar la estructura de datos de


una forma distinta: globalmente. El analista puede notar que en la matriz existen
cantidades iguales de ceros y unos. Esto sugiere que hay una “densidad” moderada

5
de preferencias. También puede comparar las celdas que están por encima y por
debajo de la diagonal para mirar si hay reciprocidad entre las opciones (por ejemplo:
Bob escogió a Ted pero … ¿Ted escogió a Bob?). Éste es el segundo punto
importante del análisis de redes: buscar cómo la estructura de las opciones
individuales se abstrae en patrones más generales.

Es posible pensar en los datos de la red social en los mismos términos que los “datos
convencionales”. Uno puede pensar que las filas son simplemente una lista de casos,
y las columnas atributos de cada actor (por ejemplo, las relaciones con otros actores
podrían verse como “atributos” de cada actor). De hecho, muchas de las técnicas
utilizadas por los analistas de redes (como el cálculo de correlaciones y distancias) se
aplican exactamente de la misma forma en datos de red y en datos convencionales.

Sin embargo, mientras pueden considerarse los datos de la red como una forma
especial de datos convencionales (y de hecho lo son), los analistas de redes observan
los datos de redes de forma diferente. Más que pensar en cómo la relación de un
actor con los demás describe el atributo de su “ego”, los analistas de redes observan
la estructura de conexiones en la que el actor se encuentra involucrado. Los actores
se describen a través de sus relaciones, no de sus atributos. Y las relaciones en sí
mismas son tan fundamentales como los actores que se conectan a través de ellas.

La mayor diferencia entre los datos convencionales y los reticulares, es que los datos
convencionales se centran en actores y atributos mientras los datos de red se centran
en actores y relaciones. La diferencia en el énfasis es muy importante para las
opciones que el investigador debe tomar en el diseño de la investigación, en el
muestreo controlado, el desarrollo de mediciones y en el manejo de los datos
resultantes. No se trata que las herramientas de investigación sean distintas entre los
analistas de redes y los científicos sociales (a menudo no lo son). Se trata de que los
propósitos específicos y el énfasis de la investigación de redes sociales implican
consideraciones diferentes.

En este capítulo, estudiaremos algunos de los temas que han surgen en el diseño,
muestreo y medición de redes sociales. Nuestra discusión se centrará en los dos
aspectos de los datos de la red: los nodos (o actores) y las líneas (o relaciones).
Trataremos de mostrar algunas de las formas en las que los datos de redes son
similares o diferentes de los datos de actores y sus atributos más familiares.
Introduciremos algunos términos nuevos que facilitan la descripción de las
características especiales de los datos reticulares. Finalmente, discutiremos con

6
brevedad cómo las diferencias entre los datos reticulares y los de actor-atributo son
importantes en la aplicación de las herramientas estadísticas.

NODOS

Los datos de red se definen por actores y por relaciones (o por nodos y por vínculos).
La parte de los datos de la red correspondiente a nodos o actores debería ser
bastante precisa. Otros enfoques empíricos en ciencias sociales también trabajan en
términos de casos, sujetos o elementos representativos y semejanzas. Sin embargo,
existe una diferencia en la mayoría de los datos de redes –de hecho se convierte en
una gran diferencia— y es la forma en la que los datos son recogidos comúnmente – y
en la que son estudiadas las poblaciones y muestras.

El análisis de redes se centra en las relaciones entre los actores, y no en los actores
individuales y sus atributos. Esto significa que los actores a menudo no son
muestreados de forma independiente, como en muchos otros tipos de estudios (más
frecuentemente en encuestas). Supongamos que estudiamos los vínculos de amistad,
por ejemplo. John ha sido escogido para estar en nuestra muestra. Cuando le
preguntamos a él, John identifica siete amigos. También necesitamos rastrear a cada
uno de esos siete amigos, y preguntarles sobre sus vínculos de amistad. Los siete
amigos están en nuestra muestra en tanto que John lo está (y viceversa). Por tanto,
los “elementos de la muestra” no son en absoluto “independientes”.

Los nodos o actores incluidos en estudios que no son de redes, tienden a ser el
resultado de un muestreo probabilístico independiente. Los estudios de redes intentan
incluir todos los actores que se muestran en un límite (que a menudo se muestra de
forma natural). Con frecuencia los estudios de redes no utilizan “muestras” en
absoluto, al menos en el sentido convencional. Al contrario, intentan incluir todos los
actores en una población o poblaciones determinada(s). Por supuesto, las poblaciones
incluidas en un estudio de red pueden ser una muestra de un conjunto grande de
poblaciones. Por ejemplo, cuando estudiamos los patrones de interacción entre
estudiantes en las clases, incluimos todos los niños que están en el salón de clases
(es decir, estudiamos la totalidad de la población del aula). El aula en sí misma, debe
seleccionarse a través de métodos probabilísticos dentro de una población de aulas
(todas las de una escuela)

7
El uso de poblaciones completas como forma de seleccionar observaciones en
muchos estudios de redes, hace que sea importante para el analista tener claros los
límites de cada población que vaya a ser estudiada y la forma en la que se
seleccionarán, de entre esa población, las unidades individuales de observación. El
análisis de redes frecuentemente implica diferentes niveles de análisis, con actores
agrupados en un nivel inferior (por ejemplo, la red puede describirse de forma
“anidada”).

POBLACIONES, MUESTRAS Y LÍMITES

Como hemos dicho, rara vez los analistas de redes sociales diseñan muestras. Muy a
menudo, identifican una población y dirigen un censo (por ejemplo, incluyen todos los
elementos de la población como unidades de observación). Un analista puede
examinar todos los sustantivos y objetos presentes en un texto, todas las personas en
una fiesta de cumpleaños, todos los miembros de un grupo de parientes, de una
organización, de un vecindario o una clase social (por ejemplo, los propietarios de
tierras en una región, o reino).

Los métodos de investigación empírica a menudo utilizan un enfoque muy distinto


para decidir qué nodos estudiar. Se hace una lista de todos los nodos (a veces
estratificada o agrupada) y se seleccionan los elementos individuales por métodos
probabilísticos. La lógica del método trata a cada individuo como una réplica
separada, es decir, en cierto modo intercambiable con cualquier otro.

Debido a que los métodos de redes se centran en las relaciones entre los actores,
éstos no pueden ser muestreados independientemente para incluirlos como
observaciones. Si un actor llega a ser seleccionado, han de incluirse todos los actores
con los cuales éste tiene (o puede tener) relaciones. Como resultado, los enfoques de
red intentan estudiar poblaciones totales a través del censo, más que a través de la
muestra (discutiremos brevemente algunas excepciones de esto en el apartado de
muestreo de relaciones).

Las poblaciones que los analistas de redes estudian son notablemente diversas. En
un extremo, pueden constar de símbolos en textos o sonidos en pronunciaciones; en
el otro, naciones en el mundo y sistemas de estados pueden constituir la lista de
nodos. Quizás las mas comunes, por supuesto, son aquellas formadas por personas

8
individuales. En cada caso, sin embargo, los elementos de la población a ser
estudiada se definen a través de algún límite.

Los límites de las poblaciones estudiadas por los analistas de redes pueden ser,
básicamente, de dos tipos. El primero de ellos, probablemente el más común, es el
que viene creado o impuesto por los propios actores. Todos los miembros de una
aula, organización, club, vecindario o comunidad pueden constituir una población de
este tipo. Son esto grupos o redes articuladas de manera natural. Por tanto, los
estudios de redes sociales trazan a menudo en cierto modo los límites alrededor de
una población que se sabe, a priori, que es una red. Alternativamente, un analista de
redes puede asumir un enfoque más “demográfico” o “ecológico” para definir los
límites de la población. Podemos diseñar observaciones contactando toda la gente
que se encuentra en un área espacial delimitada, o a quienes poseen un cierto rasgo
(por ejemplo, tener un ingreso familiar de alrededor de un millón de dólares al año). En
este caso hay motivos para sospechar que la red existe, pero la entidad a ser
estudiada es una agregación abstracta impuesta por el investigador –más que un
patrón de acción social institucionalizada que haya sido identificado y etiquetado por
sus participantes.

Los analistas de redes pueden expandir los límites de sus estudios haciendo réplicas
de las poblaciones. Más que estudiar un vecindario, a menudo se estudian varios.
Este tipo de diseño (que puede utilizar métodos de muestreo para seleccionar las
poblaciones), permite la replicación y la verificación de hipótesis a través de la
comparación de poblaciones. Una segunda, y también muy importante forma en la
que los estudios de redes expanden su ámbito es a través de la inclusión de múltiples
niveles o modalidades de análisis.

MODALIDADES Y NIVELES DE ANÁLISIS

El analista de redes tiende a ver a las personas inmersas en redes de relaciones


directas con otras personas. A menudo, estas redes de relaciones interpersonales se
convierten en “hechos sociales” y toman vida propia. Una familia, por ejemplo, es una
red de relaciones cercanas entre un conjunto de personas. Pero esta red en particular,
ha sido institucionalizada y ha recibido un nombre y una realidad más allá de los
nodos que la componen. Los individuos en sus relaciones de trabajo pueden ser
observados como inmersos en organizaciones; en sus relaciones de ocio pueden
estar inmersos en asociaciones voluntarias. Los vecindarios, comunidades y aun las

9
sociedades son, con variedad de grados, entidades sociales en sí mismas. Y, como
entidades sociales, pueden formar lazos con los individuos inmersos con ellas y con
otras entidades sociales.

A menudo, los conjuntos de datos de redes describen los nodos y las relaciones entre
éstos para una sola población delimitada. Si se estudian los patrones de amistad entre
los estudiantes en una aula, estaríamos haciendo un estudio de este tipo. Pero un
aula está dentro de una escuela –que puede ser vista como una red de clases
relacionadas entre sí y otros actores (directores, administradores, bibliotecarios,
etcétera). Y estas escuelas existen en distritos escolares, los cuales pueden verse a
su vez como redes de escuelas y otros actores (comités escolares, grupos de
investigación, departamentos de personal y adquisiciones). Puede incluso, haber
patrones de relaciones entre los distritos escolares (a través de intercambio de
escolares, profesores, materiales curriculares, etcétera).

La mayor parte de quienes trabajan con redes ven a las personas como enlazadas a
redes, que están enlazadas a redes que a su vez están también enlazadas a redes.
Describen tales estructuras como “multimodales”. En nuestra escuela del ejemplo, los
estudiantes individuales y los profesores forman un modo, las aulas de clases otro
modo, las escuelas un tercer modo, y así sucesivamente. Un conjunto de datos que
contiene información sobre dos tipos de entidades sociales (por ejemplo personas y
organizaciones) es una red de dos modos.

Por supuesto, este tipo de perspectiva de la naturaleza de las estructuras sociales no


es única de los investigadores de redes. El análisis estadístico se ocupa de los mismo
temas en sus diseños “jerárquicos” o anidados. Los teóricos hablan de los niveles
macro-meso-micro de análisis, o desarrollan esquemas para identificar diferentes
niveles de análisis (el mas usual en sociología es individual, grupal, organizacional,
comunitario, institucional, social y orden global). Una ventaja de la perspectiva de
redes es que de una forma natural predispone al analista a focalizar en múltiples
niveles de análisis simultáneamente. Esto es, el analista de redes está siempre
interesado en cómo el individuo está integrado en una estructura y cómo la estructura
emerge de las micro relaciones entre partes individuales. La habilidad de los métodos
de redes para representar tal relación multimodal es, al menos potencialmente, un
paso adelante en el rigor del análisis.

Habiendo afirmado que los métodos de redes sociales son particularmente adecuados
para trabajar con múltiples niveles de análisis y estructuras de datos multimodales,

10
debe admitirse que los analistas de redes rara vez aprovechan esta característica. La
mayoría de los análisis de red no se mueven más allá del simple micro o macro
reduccionismo – y es correcto. Pocos análisis en todo caso de redes han intentado
trabajar con más de dos modos simultáneamente. Y, aún cuando ha sido así, la
estrategia más común ha sido examinarlos de forma más o menos separada (una
excepción es el análisis conjunto de redes de dos modos)

RELACIONES

La otra parte de la investigación de datos reticulares tiene que ver con qué lazos o
relaciones serán medidas en los nodos seleccionados. En este punto hay dos temas
importantes que discutir. En muchos estudios de redes se estudian todos los lazos, o
un tipo específico entre todos los nodos seleccionados – es decir, se realiza un censo.
Pero, a veces se utilizan diferentes enfoques (porque son menos costosos o porque
es necesario generalizar), es decir, un muestreo de relaciones. A veces en los datos
de la red también hay otro tipo de muestreo de relaciones. Cualquier conjunto de
actores puede estar conectado con diferentes tipos de lazos y relaciones (por ejemplo,
los estudiantes en un aula de clases pueden gustar o no de los demás, pueden o no
jugar juntos, pueden o no compartir la misma comida, etcétera). Cuando se recogen
los datos de la red, con frecuencia se seleccionan, o muestrean, los tipos de
relaciones que serán medidos entre un conjunto de tipos de relaciones.

MUESTREO DE RELACIONES

Dado un conjunto de actores o nodos, hay algunas estrategias para decidir cómo
actuar en la recolección de medidas de las relaciones existentes. Al final de la gama
de enfoques, se encuentran los métodos de “redes completas”. Este enfoque aporta el
máximo de información, pero también es costoso y difícil de utilizar y puede ser de
difícil generalización. En el otro extremo se encuentran métodos muy parecidos a los
utilizados en la investigación empírica convencional. Estos enfoques aportan
considerablemente menos información sobre la estructura de la red, pero a menudo
son menos costosos y también facilitan la generalización desde las observaciones en
la muestra hacia el total de la población. Sin embargo, no existe un método “correcto”
para todos los problemas y preguntas de investigación.

11
Los Métodos de redes completas requieren que se recoja información acerca de los
lazos de cada actor con los demás. En esencia, este enfoque utiliza un censo de los
lazos en una población de actores –más que un muestreo de éstos. Por ejemplo,
podemos recoger datos sobre el comercio de cobre entre pares de naciones-Estado
en el sistema mundial, tomándolos de los datos del FMI; podemos examinar las juntas
directivas de todas las corporaciones públicas superponiendo a los directivos;
podemos examinar el número de vehículos que transitan entre pares de ciudades;
podemos mirar el flujo de correos electrónicos entre todos las pares de empleados de
una compañía; podemos decirle a cada niño en un grupo de juegos que identifique a
sus amigos entre los demás.

Ya que recolectamos información sobre lazos entre pares o díadas, los datos de redes
completas aportan una fotografía completa de las relaciones en la población. La
mayoría de los enfoques y métodos especiales de análisis de redes que discutiremos
a lo largo de este texto, fueron desarrollados para utilizarse con datos de redes
completas. Los datos de estas redes son necesarios para definirla apropiadamente y
para medir muchos de los conceptos estructurales del análisis de red (por ejemplo el
grado de intermediación)

Los datos de redes completas nos conducen a descripciones muy potentes y a


análisis de estructuras sociales. Desafortunadamente, pueden también ser muy
costosos y difíciles de obtener. Obtener datos de cada miembro de una población y
tener cada rango o índice de cada uno de los demás, pueden ser tareas desafiantes
para cualquier grupo, excepto para los pequeños. La labor se hace más manejable
pidiendo a informantes que identifiquen un número limitado de individuos específicos
con los cuales éstos tienen relaciones. Entonces, estas listas se compilan e
interconectan. Pero, para grupos grandes (por ejemplo, todas las personas de una
ciudad) la labor es prácticamente imposible.

En muchos casos, los problemas no son tan graves como puede pensarse. La
mayoría de las personas, grupos y organizaciones, tienden a tener un número limitado
de lazos –o al menos un número limitado de lazos fuertes. Esto probablemente se
deba a que los actores sociales tienen recursos limitados, energía, tiempo y capacidad
cognitiva –y no pueden mantener un gran número de lazos fuertes. También es cierto
que las estructuras sociales pueden desarrollar un grado considerable de orden y
solidaridad con relativamente pocas conexiones.

12
Los métodos de “bola de nieve” comienzan focalizando un actor o conjunto de
actores, a cada uno de los cuales se les pregunta por algunos de sus lazos con otros
actores. Entonces, se toman todos los actores mencionados (que no sean parte de la
lista original) y se les pregunta de nuevo por algunos de sus lazos. El proceso
continúa hasta que no se identifiquen nuevos actores o hasta que se decida detenerlo
(a menudo por motivos de tiempo y recursos, o porque los nuevos actores
identificados son muy marginales con respecto del grupo que se intenta estudiar).

El método de bola de nueve puede ser muy útil para el seguimiento de poblaciones
“especiales” (a menudo subconjuntos de gente numéricamente pequeños, mezclados
con otros más grandes). Las redes de contactos de negocios, élites de la comunidad,
subculturas desviadas, filatélicos ávidos, redes de parentesco y muchas otras
estructuras pueden ser efectivamente ubicadas y descritas a través de métodos de
bola de nieve. A veces no es difícil alcanzar la completitud en “muestreos” de bola de
nieve. Las limitaciones en los números de lazos fuertes que tienen la mayoría de los
actores, y la tendencia de los lazos a ser recíprocos, a menudo facilitan la búsqueda
de límites.

Hay dos grandes restricciones y debilidades potenciales de los métodos de bola de


nieve. En primer lugar, los actores que no están conectados (es decir, “aislados”) no
se pueden describir a través de este método. Su presencia y cantidad, puede ser una
característica muy importante de las poblaciones para algunos propósitos analíticos.
El método de bola de nieve tiende a exagerar la “conectividad” y “solidaridad” de las
poblaciones de actores. En segundo lugar, no hay ninguna forma garantizada de
encontrar todos los individuos conectados dentro de la población. ¿Dónde echar a
rodar la bola de nieve? Si comenzamos en el lugar o lugares equivocado(s), podemos
perder todo los subconjuntos de actores que se encuentran conectados –pero no
anexionados a nuestros puntos de partida.

Los enfoques de bola de nieve pueden reforzarse pensando con cuidado cómo
seleccionar los nodos iniciales. En muchos estudios puede haber un punto de partida
natural. En estudios sobre el poder en comunidades, por ejemplo, es común comenzar
con los jefes ejecutivos de las organizaciones económicas, culturales y políticas más
grandes. Mientras este enfoque no pretenda considerar la mayor parte de la
comunidad (aquellos individuos que están “aislados” de la élite de la red), el enfoque
identificará probablemente la élite social con bastante eficiencia.

13
Redes ego-céntricas (con conexiones a otros) . En muchos casos no será posible
(o necesario) trazar la totalidad de las redes comenzando con nodos focales (como en
el método de bola de nieve). Un enfoque alternativo es comenzar con una selección
de nodos focales (egos), e identificar los nodos con los que ellos están conectados.
Entonces determinamos cuáles de los nodos identificados en la primera fase están
conectados con los demás. Esto puede hacerse contactando cada uno de los nodos; a
veces podemos pedir a ego que nos informe qué nodos con los que está conectado
tienen lazos con otros.

Este tipo de enfoque puede resultar muy efectivo para obtener un formulario de datos
relacionales de poblaciones grandes y puede combinarse con enfoques basados en
los atributos. Por ejemplo, podemos tomar una muestra simple aleatoria de
estudiantes universitarios varones, y pedirles que identifiquen a sus amigos más
cercanos y cuáles de éstos conocen a otros. Este tipo de enfoque puede darnos una
imagen buena y fiable de los tipos de redes (o al menos de los vecindarios locales) en
los cuales se encuentra insertos los individuos. Podemos obtener resultados tales
como cuántos nodos de conexiones tienen y hasta qué puntos esos nodos forman
núcleos fuertes. Tales datos pueden ser muy útiles para entender las oportunidades y
restricciones que tienen los individuos, como resultado de la forma en la que están
insertos en sus redes.

El enfoque egocéntrico con conexiones a otros también puede aportar alguna


información sobre la red en su totalidad, vista no ya con un enfoque de censo o de
bola de nieve. Tales datos son, de hecho, conjuntos de datos de micro redes –
muestreos de áreas locales de redes grandes. Muchas propiedades de red –distancia,
centralidad y varios tipos de equivalencia posicional-- no pueden evaluarse con datos
egocéntricos. Sin embargo, algunas propiedades tales como la densidad de toda la
red pueden estimarse de razonablemente con datos egocéntricos, mientras que otras,
como la prominencia de lazos recíprocos, las camarillas y otras similares pueden ser
estimadas bastante directamente.

Redes Ego-céntricas (sólo individuos)

Los métodos egocéntricos realmente se centran en el individuo más que en la red


como un todo. Recolectando información de los vínculos entre los actores conectados
con cada individuo, podemos incluso hacer una buena fotografía de las redes “locales”
o “vecindarios” de individuos. Esa información es muy útil para entender cómo las

14
redes afectan a los individuos, y ellos también proporcionan una fotografía
(incompleta) del entramado de la red como un todo.

Supongamos, sin embargo, que obtenemos información de los vínculos del individuo
con los otros, pero no sobre las conexiones entre esos otros individuos. Datos de este
tipo no constituyen realmente datos de una “red” como tal. Es decir, no pueden
representarse como una matriz cuadrada de lazos actor * actor. Pero no significa que
los datos egocéntricos sin conexiones entre los otros no sirvan para que los analistas
utilicen un enfoque estructural o de red para entender a los actores. Podemos saber,
por ejemplo, que algunos actores tienen muchos amigos muy cercanos y parientes y
que otros tienen pocos. Sabiendo esto, podemos entender algo acerca de las
diferencias en la localización de los actores en la estructura social, y hacer algunas
predicciones sobre cómo esos puestos limitan su comportamiento. Lo que no
podemos saber con ninguna certeza, partiendo de datos egocéntricos, es la
naturaleza de la estructura marco de la red en su totalidad.

En redes egocéntricas, los individuos identificados y conectados con cada ego


probablemente son un conjunto que no está conectado con aquellos que si lo están a
otros egos. Mientras no podamos valorar la densidad total de la conectividad de la
población, debemos movernos en un ámbito muy general. Si tenemos alguna razón
buena razón teórica para pensar acerca de los otros en términos de sus roles
sociales, más que como ocupantes individuales de tales roles, las redes egocéntricas
pueden decirnos mucho acerca de las estructuras sociales. Por ejemplo, si
identificamos cada uno de los otros conectados a un ego a través de una relación de
amistad como “pariente”, “compañero de trabajo”, “miembro de la misma iglesia”,
etcétera, podemos construir una fotografía de las redes de las posiciones sociales
(más que las redes de individuos) en las cuales se encuentran inmersos los egos. Tal
enfoque, por supuesto, asume que categorías como “pariente” son reales e
importantes para los patrones de interacción.

RELACIONES MÚLTIPLES

En un conjunto de datos convencional del tipo actor * atributo, cada actor es descrito a
través de muchas variables (y cada variable es atribuida a varios actores). En el tipo
más común de conjunto de datos de redes sociales sobre actor * relación, sólo se
describe un tipo de relación. En tanto estemos interesados en múltiples atributos de

15
los actores, estaremos interesados en múltiples tipos de relaciones que conectan a
éstos en la red.

Observando la red de relaciones en un departamento académico de una Facultad, por


ejemplo, estaremos interesados en qué profesores tienen estudiantes en común,
prestan servicios a los mismos comités, son amigos fuera del lugar de trabajo, tienen
una o más áreas de especialización en común y son coautores de artículos. Las
posiciones que tienen los actores en la red de afiliaciones de grupos tienen múltiples
facetas. Las posiciones en un conjunto de relaciones pueden reforzar o contradecir las
posiciones en otro (uno puede compartir lazos de amistad con un conjunto de
personas con los cuales no se trabaja en comités, por ejemplo). Los actores pueden
estar enlazados a otros de forma cercana en una red relacional, pero pueden estar
muy distantes de otros en una red relacional diferente. Las ubicaciones de los actores
en redes multirelacionales y la estructura de redes compuestas de múltiples
relaciones, son unas de las áreas más interesantes y aún relativamente poco
exploradas, del análisis social .

Cuando recolectamos datos de redes sociales acerca de ciertos tipos de relaciones


entre actores, estamos, en cierto modo, haciendo un muestreo de una población de
relaciones posibles. A menudo, nuestra teoría y la pregunta de investigación, indican
qué tipo de relaciones entre los actores consideramos más importantes para el
estudio. En este caso no se hace un muestreo de relaciones, sino una selección de
éstas. En un estudio vinculando la dependencia y el crecimiento económicos, por
ejemplo, se podrían recoger datos sobre el intercambio de espectáculos de músicos
entre naciones --aunque probablemente estos datos no sean los más relevantes.

¿Si no sabemos qué relaciones estudiar, cómo podemos decidirnos? Existen algunos
enfoques conceptuales que pueden ayudarnos. La teoría de sistemas, por ejemplo,
sugiere dos dominios el material y el informacional.

Las cosas materiales se “mantienen”, en el sentido en que sólo pueden ubicarse en un


nodo de la red cada vez. Los movimientos de personas entre organizaciones,
intercambio de dinero entre particulares, de automóviles entre ciudades y otros
similares, son ejemplos de cosas materiales que se mueven entre nodos y, por ello,
establecen una red de relaciones materiales. Lo informacional, para los teóricos de
sistemas “no se mantiene”, en tanto que puede estar en más de un lugar al mismo
tiempo. Si yo sé algo y lo comparto contigo, ambos lo sabremos. En cierto sentido, el
hecho de compartir información puede ser utilizado para establecer lazos entre dos

16
nodos. Sin embargo, hay que tener la precaución de no confundir la simple posesión
de un atributo común (por ejemplo el género) con la presencia de un lazo (por ejemplo
el intercambio de puntos de vistas entre dos personas acerca de temas de género).

Las metodologías para trabajar con datos multirelacionales no están tan desarrolladas
como aquellas que trabajan con relaciones simples. Muchas áreas de trabajo
interesantes tal como la correlación de redes, escalado y agrupación multidimensional,
y álgebra de roles se han desarrollado para trabajar con datos multirelacionales. La
mayor parte de estas temáticas están más allá del espacio cubierto por este texto y es
mejor abordarlos una vez se ha desarrollado el análisis básico de redes de relaciones
simples.

ESCALAS DE MEDIDA

Como otros tipos de datos, también la información que se recoge sobre los lazos entre
los actores puede ser medida en diferentes “niveles de medición” (podemos por
ejemplo asignar puntuaciones a nuestras observaciones). Los diferentes niveles de
medición son importantes, ya que limitan los tipos de preguntas que el investigador
puede plantearse. Las escalas de medida también son importantes ya que cada tipo
de escala tiene diferentes propiedades matemáticas y exige la utilización de
algoritmos diferentes para describir patrones y ensayar inferencias sobre ellos.

Generalmente se distingue tres tipos de niveles de medición: nominal, ordinal y de


intervalo (el nivel de razón puede, para cualquier propósito práctico, ser agrupado en
la categoría intervalo). Es útil, sin embargo, dividir la medida nominal en variaciones
binarias y de categoría múltiple; también es útil distinguir entre medidas ordinales de
rango completo y medidas ordinales agrupadas. Describiremos brevemente estas
variaciones y presentaremos ejemplos de cómo pueden aplicarse en estudios de
redes sociales.

Medidas binarias de relaciones. En la mayoría de ocasiones para asignar números


a relaciones es fácil distinguir entre relaciones ausentes (codificadas con un cero) y
lazos que están presentes (codificados con un uno). Si le pedimos a informantes en
una encuesta que comenten “¿con cuáles de estas otras personas de la lista
simpatiza?”, estaremos haciendo una medición binaria. Cada persona seleccionada de
la lista será codificada con uno. Los no seleccionados estarán codificados con cero.

17
La mayor parte del desarrollo de la teoría de grafos en matemáticas y muchos
algoritmos para la medición de propiedades de actores y redes, han sido desarrollados
a través de datos binarios. Los datos binarios son ampliamente utilizados en análisis
de redes, así que no es poco frecuente encontrar datos medidos en el nivel “más alto”
transformados en puntuaciones binarias antes de proceder al análisis. Para hacer
esto, uno simplemente selecciona algún “punto de corte” y vuelve a recodificar los
casos por debajo de ese punto (con cero) o por encima de él (con uno). Los datos
binarios implican desperdicio de información. El analista necesita considerar qué es
relevante (por ejemplo ¿a qué se refiere la hipótesis? ¿se refiere a la presencia de
estructuras de relaciones, o a la fortaleza de éstos?), y qué algoritmos deben aplicarse
para decidir si es razonable recodificar los datos. Muy a menudo, el poder y
simplicidad del análisis de datos binarios compensa la pérdida de información.

Medidas nominales de categoría múltiple de las relaciones En la recolección de


datos podemos pedir a nuestros informantes que miren una lista de individuos y nos
digan: “para cada persona en la lista, qué categoría que describe mejor su relación
con ella: amistad, amor, relación de negocios, parentesco o ninguna relación”.
Debemos puntuar cada persona en la lista según tenga una relación de tipo “1”, “2”
etcétera. Este tipo de escala es nominal o cualitativa –cada relación de la persona
hacia el sujeto es codificada por su tipo, más que por su fortaleza. A diferencia de los
datos binarios nominales (verdadero – falso), la medida nominal de categoría múltiple
es una selección múltiple.

El enfoque más común para analizar medidas nominales de categorías múltiples, es


utilizarlo para crear series de medidas binarias. Es decir, podemos tomar los datos a
partir de la pregunta anterior y crear conjuntos separados de puntuaciones por lazos
de amistad, por lazos sentimentales, por lazos de parentesco, etcétera. Esto se
parece mucho a una “codificación simulada”, como una forma de manejar muchos
tipos de medidas de selección múltiple en análisis estadístico. Al examinar los datos
resultantes, sin embargo, puede recordarse que, en la mayoría de las redes
resultantes, a cada nodo se le permite un solo tipo de relación. Es decir, una persona
puede tener un lazo de amistad o uno sentimental –pero no ambos- como resultado
de la forma en que hemos realizado la pregunta. Examinando las redes resultantes,
las densidades pueden bajar artificialmente, y existirá una inherente correlación
negativa entre las matrices.

Medidas ordinales agrupadas de relaciones: Una de las primeras tradiciones en el


estudio de redes sociales interroga a los informantes sobre el índice en que otros les

18
“agradan”, “desagradan” o les son “indiferentes”. El resultado es una escala ordinal
agrupada (por ejemplo, puede haber más de una persona que “agrade” y las
categorías reflejan una línea importante en el orden de intensidad). A menudo, este
tipo de escala de tres puntos ha sido codificada: -1, 0 y +1, para reflejar el agrado
negativo, indiferencia y agrado positivo. Cuando se puntúa de esta forma, los signos
positivos y negativos, hacen más fácil escribir algoritmos que tendrán en cuenta y
describirán diferentes propiedades de la red (por ejemplo el equilibrio estructural del
grafo).

Las medidas ordinales agrupadas pueden utilizarse para reflejar una gran cantidad de
diferentes aspectos cuantitativos de las relaciones. Los analistas de redes a menudo
están involucrados en la descripción de la “fuerza” de los lazos. Pero “fuerza” puede
significar muchas tipos de cosas diferentes. Una dimensión es la frecuencia de la
interacción - ¿los actores tienen contacto diariamente, semanalmente, mensualmente,
etcétera. Otra dimensión es la “intensidad”, lo cual a menudo refleja el grado de
implicación emocional asociado con la relación (por ejemplo, los lazos de parentesco
pueden ser infrecuentes, pero implican una “carga emocional” debido a la expectativas
altamente ritualizadas e institucionalizadas). Las relaciones pueden ser más fuertes si
involucran muchos contextos diferentes o tipos de lazos. Totalizando los datos
nominales en función la presencia o ausencia de múltiples tipos de relaciones, surge
una escala ordinal (de hecho, un intervalo) de una dimensión que mide la fuerzade la
relación. Las relaciones recíprocas también parecen ser más fuertes. Normalmente
podemos valorar la reciprocidad pidiendo a cada actor de una díada que nos diga sus
preferencias sobre los demás. Sin embargo, también se puede preguntar a cada actor
acerca de sus percepciones del grado de reciprocidad en una relación: “¿Quiere decir
que ustedes no se agradan mutuamente, que a usted le agrada más X que usted a él,
que a X le agrada usted más que él a usted, o que se agradan mutuamente?”

Las escalas ordinales de medición contienen más información que las nominales. Es
decir, las puntuaciones reflejan sutiles diferencias de la fortaleza del lazo más que una
simple “presencia o ausencia”. Esto debe verse como algo positivo. Sin embargo con
frecuencia es difícil aprovechar los datos ordinales. Los algoritmos más comúnmente
usados para el análisis de redes sociales han sido diseñados para datos binarios.
Muchos han sido adaptados para datos contínuos – pero para escalas de intervalo
más que para escalas ordinales de medición. Los datos ordinales, en consecuencia, a
menudo son convertidos en binarios escogiendo algún punto de corte y
recodificándolos. De forma alternativa, los datos ordinales a veces son tratados como

19
si ellos fueran realmente intervalos. La primera estrategia, sin embargo, tiene el riesgo
de la adecuada selección de los puntos de corte; la última estrategia también tiene
riesgos ya que los intervalos de puntos separados en una escala ordinal pueden
resultar muy heterogéneos.

Medidas ordinales del ranking de relaciones: A veces es posible puntuar la


fortaleza de todas las relaciones de un actor en un orden de posición desde la más
fuerte hasta la más débil. Por ejemplo, puedo pedir a cada informante que escriba un
“1” junto al nombre de la persona en la clase que más le agrada, un “2” junto al
nombre que le agrada en segundo término, etcétera. La clase de escala que resultaría
de esto, sería una “escala total del orden de posiciones”. Tales escalas reflejan las
diferencias de grado de intensidad, pero no necesariamente diferencias iguales –es
decir, la diferencia entre mi primera y segunda selecciones no necesariamente es la
misma que la diferencia entre mi segunda y tercera selecciones. Cada relación, sin
embargo, tiene una puntuación única (1era, 2da, 3era, etcétera)

Las medidas ordinales del ranking de relaciones son poco frecuentes en la literatura
de análisis de redes sociales, así como también en la mayoría de las demás
orientaciones. En consecuencia, hay relativamente pocos métodos, definiciones y
algoritmos que se beneficien específica o totalmente de la información de tales
escalas. Muy a menudo, las medidas ordinales del ranking de relaciones son tratadas
como si fuesen intervalos. Existe la posibilidad de que sea menos arriesgado tratar las
medidas ordinales del ranking de relaciones (comparadas con las medidas ordinales
agrupadas) como si fuesen un intervalo, aunque tal suposición es discutible. Por
supuesto, también es posible agrupar las puntuaciones del ranking de posiciones (por
ejemplo produciendo una escala ordinal agrupada), binarizar los datos (por ejemplo
las tres primeras elecciones serán tratadas como lazos, y las restantes como ausencia
de lazos). En la combinación de información de múltiples tipos de lazos con
frecuencia es necesario simplificar las escalas de ranking de posiciones. Pero si
tenemos varias escalas de ranking que deseamos combinar para formar una escala
(por ejemplo posiciones de los gustos de las personas hacia los demás, frecuencia de
interacción , etcétera), la suma de tales escalas en un índice puede ser
razonablemente tratado como una verdadera medida de intervalo.

Medidas de intervalo de relaciones. El nivel más “avanzado” de medida nos permite


discriminar entre las relaciones informadas de forma tal que puede validarse su
estado, por ejemplo, “este lazo es dos veces más fuerte que este otro”. Los lazos son

20
valorados en escalas en las que la diferencia entre un “1” y un “2” refleja la misma
diferencia real que entre “23” y “24”.

Verdaderas medidas de intervalo de la fuerza de muchos tipos de relaciones son


relativamente fáciles de construir con un poco de imaginación y perseverancia. Pedir a
los informantes que informen de los detalles de la frecuencia o intensidad de lazos a
través de métodos como cuestionarios o entrevistas puede ser, sin embargo, menos
fiable –particularmente si las relaciones rastreadas son poco destacables e
infrecuentes. Más que preguntar si dos personas se comunican, uno puede contar el
número de entregas de correo electrónicos, llamadas telefónicas y correo interno entre
ellos. Más que preguntar si dos naciones tienen intercambios con otra, debe
observarse las estadísticas de la balanza de pagos. En muchos casos, es posible
construir niveles de medida de intervalos de la fuerza de relaciones utilizando
herramientas de observación (por ejemplo estadísticas recogidas para otros
propósitos).

Las medidas continuas de la fuerza de las relaciones permiten la aplicación de un


amplio rango de herramientas matemáticas y estadísticas para la exploración y
análisis de datos. Muchos de los algoritmos que han sido desarrollados por los
analistas de redes sociales, originalmente pensados para datos binarios, han sido
ampliados para aprovechar la información disponible en las medidas de intervalos.
Donde sea posible, las conexiones deben medirse en el nivel del intervalo –en tanto
que siempre podemos movernos más tarde a un enfoque menos refinado; en cambio,
si los datos se recogen en el nivel nominal, es mucho más difícil moverse a un nivel
más refinado.

Aún cuando es una buena idea medir la intensidad de la relación en el nivel más
refinado posible, la mayoría de los análisis de redes no trabajan en este nivel. La
comprensión más importante de los análisis de redes, y de muchos de las
herramientas matemáticas y gráficas utilizadas por los analistas de redes, fueron
desarrolladas para grafos simples (por ejemplo, binarios, indirectos). Muchas de las
descripciones de la inserción de los actores en sus redes, y de las redes en sí
mismas, son pensadas en la literatura de redes comúnmente en términos discretos.
Como resultado, a menudo se busca reducir incluso los datos de intervalo al nivel
binario escogiendo un punto de corte y codificando la fortaleza del lazo por encima de
él con un “1”, y con un “0” si está por debajo. Desafortunadamente, no hay una forma
”correcta” de escoger un punto de corte. La teoría y los propósitos del análisis
proporcionan la mejor guía para ello. A veces el examen de los datos puede ayudar

21
(quizás la distribución de la fuerza de las relaciones es realmente bimodal discreta, y
muestra un punto de corte claro; quizás la distribución está fuertemente sesgada y la
característica principal es la distinción entre la presencia y la ausencia de relación).
Cuando se escoge un punto de corte, es sensato considerar también valores
alternativos más altos o más bajos, y repetir el análisis con diferentes puntos de corte
para ver si se afecta el sentido de los resultados. Esto puede ser tedioso, pero es muy
necesario. De otro modo, uno puede equivocarse al pensar que se ha encontrado un
patrón real, cuando sólo se ha observado la consecuencia del punto en que hemos
decidido insertar el punto de corte.

UNA NOTA SOBRE LA ESTADÍSTICA Y LOS DATOS DE REDES SOCIALES

El análisis de redes sociales en más una rama de la sociología “matemática” que un


“análisis estadístico o cuantitativo”, aún cuando los especialistas en redes de hecho
trabajan con ambos enfoques. La distinción entre ambos enfoques no está muy clara.
Los enfoques matemáticos del análisis de redes tienden a tomar los datos como
“determinísticos”. Es decir, tienden a observar las relaciones medidas y la fortaleza de
la relación, como si realmente reflejasen el estatus “real”, “final” o de “equilibrio” de la
red. Los enfoques matemáticos también tienden a asumir que las observaciones no
son una “muestra” de una población mayor de observaciones posibles, sino que las
observaciones son a menudo vistas como la población de interés. Los estadísticos
tienden a observar las puntuaciones particulares de la fuerza de las relaciones como
resultado de una tendencia real destacable, o de una distribución de probabilidad de la
fuerza de las relaciones. Los estadísticos también tienden a pensar en un conjunto
particular de datos de red como una “muestra” de una clase o población mayor de
tales redes o elementos de red –y tienen cuidado de que los resultados de su estudio
pueda reproducir en el estudio “siguiente” resultados similares.

En los capítulos que siguen en este texto, nos vincularemos más con el lado
“matemático” del análisis de redes que con el “estadístico” (de nuevo, es importante
recordar que expongo las diferencias en esta discusión). Antes de seguir con ello,
debemos mencionar un par de puntos importantes sobre la relación entre el material
que se estudiará aquí y los enfoques estadísticos principales en sociología.

Por un lado, hay una pequeña diferencia aparente entre los enfoques estadísticos
convencionales y los enfoques de redes. Las herramientas estadísticas descriptivas

22
univariables, bivariables o incluso multivariables, se utilizan comúnmente en la
descripción, exploración y modelado de datos de redes sociales. Los datos de redes
sociales, como hemos dicho antes, se representan fácilmente como matrices de
números –al igual que otros tipos de datos sociológicos. Como resultado, los mismos
tipos de operaciones pueden hacerse con datos de redes y con los demás tipos de
datos. Los algoritmos de estadística se utilizan con frecuencia para describir las
características de las observaciones individuales (por ejemplo, la fortaleza de lazo
mediana de un actor X con todos los demás en una red) y la red como un todo (por
ejemplo, la media de toda la fuerza de los lazos para todos los actores en la red). Los
algoritmos estadísticos se utilizan mucho en la evaluación del grado de similaridad
entre los actores y si se encuentra patrones en los datos de la red (por ejemplo,
análisis factorial, análisis de clusters, escalado multidimensional). Incluso las
herramientas del modelado predictivo son aplicadas con frecuencia a los datos de
redes (por ejemplo, la correlación y la regresión).

Las herramientas estadísticas descriptivas son de hecho algoritmos para sumariar las
características de las distribuciones de frecuencias. Es decir, son operaciones
matemáticas. Donde la estadística es realmente “estadística”, es en el lado inferencial.
Es decir, cuando nuestra atención se gira hacia la valoración de la capacidad de
reproducción o la probabilidad del patrón que describimos. La estadística inferencial
puede ser, y de hecho es, aplicada al análisis de datos reticulares. Pero hay algunas
diferencias muy importantes entre la esencia de la estadística inferencial utilizada en
los datos de redes y aquella más comúnmente utilizada en los cursos básicos de
análisis estadístico en sociología.

Probablemente el interés más común en la aplicación de estadística inferencial a los


datos de ciencias sociales consiste en responder a preguntas acerca de la estabilidad,
replicación o generalización de los resultados observados en un muestra. La pregunta
central es: si se repite el estudio en una muestra diferente (extraída a través del
mismo método), que probabilidad existe que obtenga la misma respuesta acerca de lo
que ocurre en la población de la cual he extraído ambas muestras? Es una pregunta
realmente importante -ya que ayuda a valorar la confianza (o la falta de ésta) así como
la información que puede obtenerse poniendo a prueba nuestras teorías.

Para la mayoría de las observaciones utilizadas en los análisis de redes extraídas de


alguna población de actores y/o lazos identificable por métodos de muestreo
probabilístico, se aplica el mismo tipo de pregunta sobre la posibilidad de
generalización de los resultados. A menudo este tipo de pregunta inferencial es de

23
menor interés para los investigadores de redes. En muchos casos, se encuentran
estudiando una red en particular o un conjunto de éstas, y no tienen interés en
generalizar una población de tales redes (bien porque no hay tal población o porque
no interesa generalizarla de forma probabilística). En otros casos, podemos tener
interés en generalizar, pero la muestra no ha sido extraída por métodos estadísticos.
El análisis de redes, a menudo confía en herramientas como la observación directa,
experimentos de laboratorio y documentos como archivos de datos – y
frecuentemente no hay formas plausibles de identificar poblaciones y extraer muestras
a través de métodos de probabilidad.

El otro uso principal de la estadística inferencial en las ciencias sociales es la


contrastación de hipótesis. En muchos casos se utilizan herramientas similares o
parecidas para la generalización y para la contrastación de hipótesis. La lógica básica
de la contrastación de hipótesis es comparar un resultado observado en una muestra,
con algún valor de la hipótesis nula, relativa a la variabilidad del resultado de la
muestra bajo la suposición de que la hipótesis nula es válida. Si el ejemplo resulta
muy distinto de lo que debería observarse bajo la suposición de que la hipótesis nula
es válida, entonces la hipótesis nula probablemente no sea válida.

La clave en la cadena inferencial de contrastación de hipótesis, es la estimación de los


errores estándar de las estadísticas. Es decir, la estimación del monto estimado en
que el valor estadístico puede “variar” de una muestra a la otra, simplemente como
resultado de los errores de muestreo. Con poca frecuencia pueden observar o
calcularse directamente tales errores estándar ya que no disponemos de réplicas. Sin
embargo, la información de nuestra muestra sirve para estimar la variabilidad de la
muestra.

Muchos procedimientos estadísticos comunes permiten estimar los errores estándar


mediante aproximaciones muy bien validadas (por ejemplo el error estándar de una
media se estima, generalmente, por la desviación estándar de la muestra dividida por
la raíz cuadrada del tamaño de la muestra). Estas aproximaciones, sin embargo, se
mantienen cuando se extraen observaciones de un muestreo aleatorio independiente.
Las observaciones de la red son, en su mayoría, no independientes por definición. En
consecuencia, las fórmulas inferenciales convencionales no se aplican a los datos de
redes (aunque pueden aplicarse las fórmulas desarrollados por otros tipos de
muestreo dependiente). Es particularmente peligroso asumir que tales fórmulas se
pueden aplicar, ya que la no independencia de las observaciones de la red

24
usualmente resultarán en subestimaciones de la variabilidad real del muestreo, y
demasiada confianza en nuestros resultados.

El enfoque de la mayoría de los analistas de redes interesados en inferencia


estadística para contrastar hipótesis sobre propiedades de la red, es trabajar
directamente las distribuciones de probabilidad de los estadísticos. Se utiliza este
enfoque porque: 1) no se han desarrollado aproximaciones para las distribuciones de
muestreo de la mayoría de las estadísticas descriptivas utilizadas por los analistas de
redes y 2) el interés a menudo se centra en la probabilidad de que un parámetro
relativo de alguna teoría inicial (usualmente aleatoria) más que en la probabilidad de
que una red dada sea típica en la población de todas las redes.

Supongamos, por ejemplo, que estamos interesados en la proporción de actores


dentro de una red que son miembros de grupos o cualquier otro parámetro o
estadística de la red. La noción de grupo implica una estructura – conexiones no
aleatorias entre los actores. Se tienen los datos sobre una red de diez nodos, en los
cuales hay 20 lazos simétricos entre los actores y se observa que hay un grupo que
contiene cuatro actores. La pregunta deductiva puede ser: si los lazos entre los
actores fueran eventos aleatorios, ¿qué tan probable será que esa red de diez nodos
y 20 lazos simétricos muestre grupos de tamaño cuatro o más? Si se concluye que los
grupos de tamaño igual o mayor que cuatro en redes de este tamaño y grado son
comunes, se debe ser cauteloso en concluir que se ha descubierto una “estructura”
de no-aleatoriedad. Si se concluye que tales grupos (aquellos más numerosos o más
inclusivos) son muy improbables bajo la suposición de que los lazos son sólo
aleatorios, entonces es muy acertado llegar a la conclusión de que existe una
estructura social.

Pero, ¿cómo se determina esta probabilidad? Uno de los métodos utilizados es la


simulación –y como la mayoría de las simulaciones, se requiere una gran cantidad de
recursos y habilidades de programación. En el caso anterior, se puede utilizar una
tabla de números aleatorios para distribuir 20 lazos entre 10 actores, y entonces
buscar la red resultante para grupos de tamaño cuatro o más. Si no se encuentran
grupos, se asigna cero al ensayo; si se consigue un grupo, se asigna un uno. El resto
es simple. Sólo repetir el experimento varios cientos de veces y añadir qué proporción
de “ensayos” devienen “éxitos”. La probabilidad de un éxito entre estos experimentos
de simulación es un buen estimador de la probabilidad de que pueda encontrarse una
red de este tamaño y densidad, teniendo grupos de este tamaño “sólo por accidente”

25
cuando los mecanismos causales no-aleatorios que se cree causa el grupo no operan
de hecho.

Esto puede parecer extraño, y es ciertamente un gran trabajo (la mayoría del cual,
afortunadamente, puede ser hecho por ordenador). Pero realmente, no es muy
diferente de la lógica de la prueba de hipótesis con datos que no sean reticulares. Los
datos de redes sociales tienden a diferir de los datos de encuestas más
“convencionales”, en algunas formas claves: los datos de redes a menudo no son
muestras probabilísticas, y las observaciones de los nodos individuales no son
independientes. Estas diferencias son importantes para las preguntas sobre la
generalización de los hallazgos y sobre los mecanismos de contrastación de hipótesis.
Sin embargo, no hay nada sustancialmente distinto sobre la lógica del uso de la
estadística descriptiva e inferencial para datos de redes sociales.

La aplicación de la estadística a los datos de redes sociales es un área interesante y,


en el momento de redactar este trabajo, es un campo en desarrollo. En tanto en
cuanto este texto se centra en los usos básicos y comunes del análisis de redes, no
hemos de decir mucho más acerca de la estadística. Mucho de lo que sigue en el libro
puede relacionarse con el lado “descriptivo” de la estadística (desarrollando índices
para describir ciertos aspectos de la distribución de lazos relacionales entre actores en
redes). Para aquellos interesados en el lado inferencial, un buen punto de partida es la
segunda mitad del excelente libro de Wasserman y Faust.

26
INTRODUCCIÓN A LOS MÉTODOS
MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.
SOCIALES.

CAPÍTULO SEGUNDO

Robert A. Hanneman. Departmento de Sociología de la


Universidad de California Riverside
NOTA PREVIA

Este documento está traducido para la lista REDES con permiso del autor a partir de
la versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html< [Fecha de consulta:
Octubre de 2000].

La traducción se ha realizado por bloques. En este documento se presenta el


segundo capítulo, traducido por Águeda Quiroga y revisado por José Luis Molina.

2
CAPÍTULO I I. ¿POR QUÉ UTILIZAR MÉTODOS
MÉTODOS
FORMALES EN EL ANÁLISIS
ANÁLISIS DE REDES
SOCIALES?

La idea básica de una red social es simple: se trata de un conjunto de actores (o


puntos, nodos o agentes) entre los que existen vínculos (o relaciones). Las redes
pueden tener muchos o pocos actores y una o más clases de relaciones entre pares
de actores.

Para entender acertadamente una red social es necesario realizar una descripción
completa y rigurosa de la estructura de sus relaciones como punto de partida para el
análisis. De manera ideal, deberíamos conocer todas las relaciones entre cada par de
actores en la población estudiada.

Una razón para la utilización de técnicas matemáticas y de grafos en el análisis de


redes sociales es que permite representar la descripción de una red de manera
concisa y sistemática. También posibilita el uso de ordenadores para almacenar y
manipular rápidamente la información y de manera más precisa que si se hiciese
manualmente. Si trabajamos con poblaciones pequeñas (por ejemplo, la gente en un
vecindario, o las empresas en un sector industrial) podemos describir la estructura de
relaciones sociales que conecta a los actores de manera bastante efectiva utilizando
palabras. Sin embargo, para asegurarnos de que nuestra descripción es completa
podríamos querer listar todos los pares lógicamente posible de actores y describir
cada clase de relación posible entre cada par. Esta tarea puede ser muy tediosa si el
número de actores y/o el número de clases de relaciones es grande. Las
representaciones formales aseguran que toda la información necesaria se encuentra
representada sistemáticamente y provee las reglas para hacerlo de manera eficiente.

Un razón relacionada con la anterior es que el uso de métodos formales


(particularmente matemáticos) en la representación de redes sociales permite usar
ordenadores en el análisis de la información. La importancia de esta herramienta se
verá más claramente cuando aprendamos más acerca de cómo analizar redes
sociales.

Supongamos, por ejemplo, que tenemos información acerca de los flujos de comercio
de 50 mercancías (café, azúcar, té, copra, bauxita, etc.) entre las 170 o más naciones

3
del sistema mundial para un año determinado. Aquí, las 170 naciones pueden ser
vistas como actores o nodos y el monto de cada mercancía exportada de una nación
a otra puede ser pensada como la intensidad de un lazo dirigido desde una nación a
otra. Un investigador podría estar interesado, por ejemplo, en saber si las
“estructuras” del comercio de productos minerales son más similares entre ellas que,
por ejemplo, el comercio entre productos minerales y vegetales. Para responder esta
pregunta aparentemente simple (pero importante) es necesario manejar una cantidad
enorme de información. Literalmente, podría llevar años realizarlo a mano. Un
ordenador puede hacerlo en pocos minutos.

La tercera y última razón para usar métodos “formales” (gráficos y matemáticos) en la


representación de redes sociales es que las técnicas de representación y las reglas
de las matemáticas en sí mismas sugieren cosas que podríamos haber estar
buscando, pero también posibilitan la aparición de preguntas que no se nos hubieran
ocurrido si hubiésemos presentado la información en un texto. Una vez más, nos
permitimos utilizar un breve ejemplo:

Supongamos que estamos describiendo la estructura de la red de amistad en un


grupo de cuatro personas: Bob, Carol, Ted y Alice. Es sencillo hacerlo usando
palabras. Supongamos que a Bob le gustan Carol y Ted, pero no Alice, a Carol le
gusta Ted, pero ni Bob ni Alice, a Ted le agradan las tres personas del grupo y a Alice
únicamente Ted (quizás esto suene a la descripción de una estructura social muy
poco frecuente).

Podríamos también describir este patrón de lazos vinculantes con un matriz, donde
las filas representen las elecciones realizadas por cada actor. Pondremos “1” si a un
actor le gusta otro y "0" si no. Este sería el resultado:

Bob Carol Ted Alice

Bob --- 1 1 0

Carol 0 ---- 1 0

Ted 1 1 --- 1

4
Alice 0 0 1 ---

Se nos pueden ocurrir inmediatamente muchas cosas al ver la información dispuesta


de esta manera que quizás no hubiésemos pensado al leer la descripción en el
párrafo anterior. Por ejemplo, al examinar cada fila, notamos que a Ted le gustan más
personas que a Bob, Alice y Carol. ¿Es posible que se trate de un patrón? ¿Los
hombres son más proclives a informar lazos que las mujeres? (la bibliografía sugiere
que esto por lo general no es cierto).

Al utilizar matrices surge inmediatamente una pregunta: la diagonal central está vacía
(por ejemplo: a Bob le gusta Bob, a Carol le gusta Carol). ¿Es esto razonable? ¿O
nuestra descripción del patrón de relaciones debería incluir algunas consideraciones
acerca de las “auto-relaciones”? No existe ninguna respuesta para correcta para esta
pregunta. Nos limitaremos a sostener que utilizar una matriz para representar lazos
entre actores permite ver patrones con mayor facilidad y puede motivar preguntas
(incluso preguntas útiles) que una descripción verbal no generaría.

S ÍNTESIS DEL CAPÍTULO DOS

Hay tres grandes razones para utilizar métodos “formales” en la representación de


redes sociales:

Las matrices y los grafos son concisos y sistemáticos.

Resumen y presentan mucha información de manera rápida y sencilla y nos obligan a


ser sistemáticos y exhaustivos en la descripción de patrones de relaciones sociales.

Las matrices y los grafos permiten utilizar ordenadores para el análisis de la


información.

Esto es muy útil, ya que el análisis sistemático de una red puede ser extremadamente
tedioso si el número de actores o de tipos de relaciones entre los actores es grande.
Gran parte de ese trabajo es lento, repetitivo y poco interesante, pero requiere

5
precisión. Ese es exactamente el tipo de cosas que los ordenadores hacen bien y
nosotros no.

Las matrices y los grafos tienen reglas y convenciones.

A veces son las reglas y las convenciones las que permiten que nos comuniquemos
con claridad. También las reglas y convenciones del lenguaje matemático y de grafos
en sí mismas permiten ver matices en la información que podríamos pasar por alto si
sólo la hubiésemos descrito con palabras.

Necesitamos, entonces, aprender las bases de la representación de redes sociales


utilizando matrices y grafos. De esto trata el siguiente capítulo.

6
INTRODUCCIÓ N A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.

CAPÍTULO TERCERO: REPRESENTACIÓ N DE


REDES SOCIALES MEDIANTE GRAFOS.

Robert A. Hanneman. Departmento de Sociología de la


Universidad de California Riverside
NOTA PREVIA

Este documento está traducido para la lista REDES con permiso del autor a partir de
la versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html< [Fecha de consulta:
Octubre de 2000].

La traducción se ha realizado por bloques. En este documento se presenta el


segundo capítulo, traducido por Maria Ángela Petrizzo y revisado por José Luis
Molina.

2
CAPÍTULO III. REPRESENTACIÓ N DE REDES
SOCIALES MEDIANTE GRAFOS.

INTRODUCCIÓ N

Los analistas de redes sociales utilizan dos tipos de herramientas matemáticas para
representar información sobre los patrones de relaciones entre actores sociales: grafos
y matrices. En este capítulo, aprenderemos lo suficiente sobre grafos como para
entender cómo representar los datos de redes sociales. En el siguiente capítulo
introduciremos las representaciones matriciales de las relaciones sociales. Utilizando
esas dos herramientas podremos entender la mayor parte de las operaciones que los
analistas de redes sociales realizan esta información (por ejemplo, calcular medidas
precisas de la “densidad relativa de relaciones”).

Sobre estos temas hay muchísima más información que la que presentaremos aquí:
las matemáticas disponen de subdisciplinas dedicadas completamente a la teoría de
grafos y al álgebra de matrices. Los científicos sociales han tomado prestadas
simplemente unas cuantas cosas que piensan que pueden ser útiles para describir y
analizar las estructuras de las relaciones sociales.

Una advertencia: hay mucha terminología especializada que es necesario aprender. Es


un esfuerzo que vale la pena, ya que nos permite representar de forma simple algunas
ideas importantes sobre la estructura social una vez se domina lo fundamental.

GRAFOS Y SOCIOGRAMAS

Hay muchas formas distintas de “gráficos”. De barras, de pastel, de líneas y


tendencias, y también muchas otras cosas que son llamadas grafos o gráficos. Los
analistas de redes utilizan principalmente un tipo de representación gráfica que
consiste en puntos (o nodos) para representar actores y líneas (o flechas) para
representar lazos o relaciones. Cuando los sociólogos tomaron esta forma de
representación de los matemáticos, renombraron sus gráficos como “sociogramas”.
Los matemáticos distinguen los diferentes tipos de representaciones gráficas con los
nombres de “grafos recíprocos”, “grafos orientados”o simplemente “grafos”.

3
Existen muchas variaciones en los sociogramas, pero todos ellos comparten la
característica común del uso de un círculo etiquetado para cada actor en la población
que describimos y segmentos de línea entre pares de actores para representar el
hecho que existe un vínculo entre ellos. Supongamos que estamos interesados en
saber quién nombra a quién como “amigo” en un grupo de cuatro personas (Bob,
Carol, Ted y Alice). Comenzaremos representando cada actor como un “nodo” con
una etiqueta (a veces los nodos se representan con etiquetas en círculos o cuadrados).

B C

T A

Recogemos nuestros datos sobre lazos de amistad preguntando a cada miembro del
grupo (privada y confidencialmente) quiénes consideran sus “amigos cercanos”de una
lista de los otros miembros del grupo. Cada una de las cuatro personas podría
simplmente escoger a una de las otras tres como “amigo/a cercano/a”. Suponiendo
que sesto hay ocurrido, en nuestro caso ficticio, Bob escogió a Carol y Ted, pero no a
Alice; Carol escogió sólo a Ted; Ted escogió a Bob, Carol y Alice; y Alice escogió sólo a
Ted. Podemos representar esta información dibujando una flecha desde quién escoge
hasta el que es escogido en el grafo siguiente:

B C

T A

4
TIPOS DE GRAFOS

Ahora necesitamos introducir alguna terminología para describir los distintos tipos de
grafos. El ejemplo anterior en particular es binario y orientado (en contraposición
contraposición al grafo con signos, ordinal o ponderado, con presencia simultánea de
vínculos). Las relaciones sociales descritas aquí también son simples (opuestas a las
múltiples o multiplexadas).

Niveles de Medición: grafos binarios, orientados y ponderados

En la descripción del patrón de quién señala a quién como un amigo cercano, pudimos
haber hecho nuestra pregunta de muchas formas. Si preguntamos a cada entrevistado
“¿esta persona es o no un amigo cercano?”, estamos pidiendo una respuesta binaria:
cada persona es o no escogida por cada entrevistado. Muchas relaciones sociales
pueden ser descritas de esta forma: lo único que importa es si existe o no el vínculo.
Cuando nuestros datos se recogen de esta forma, podemos rerpesentarlos de una
manera simple: una flecha representa que se hizo una nominación y ninguna
representa la inexistencia de una nominación.

Pero pudimos haber hecho la pregunta de otra forma: “para cada una de las personas
en esta lista, indique si le gusta, desagrada o no le importa”. Podemos asignar un +
para indicar “agrado”, cero para indicar “no importa” y un – para indicar “desagrado”.
Esta clase de datos se llama datos “con signos”. El grafo con datos orientados utiliza
un + en la flecha para indicar una nominación positiva, un – para indicar una
nominación negativa y ninguna flecha para indicar una posición neutral o indiferente.

Sin embargo, puede realizarse la pregunta desde un enfoque diferente: “ordene tres
personas de esta lista según le agrade más, regular o menos”. Esto nos dará un
“orden de posiciones” o datos “ordinales”, que describen la fortaleza de cada
nominación de amistad. Finalmente, hemos podido preguntar “en una escala de menos
100 a más 100 –dónde –100 indica que se odia a esa persona, cero significa que se
siente neutral y +100 indica que se ama a esa persona- cómo se siente hacia ...”. Esto
nos dará información acerca del valor de cada nominación en un (al menos supuesto)
nivel proporcional de medición. Tanto en un grafo ordinal como en uno ponderado,
podremos colocar la medida de la fortaleza de la relación en la flecha del diagrama.

5
Vínculos orientados o “recíprocos”en el grafo

En nuestro ejemplo pedimos a cada miembro del grupo que escogiese a quiénes del
grupo consideraba como amigos cercanos. En este caso, a cada persona (ego) se le ha
preguntado sobre los vínculos o relaciones que ellos mismos dirigen hacia otros
(alters). Las personas nominadas no sienten necesariamente de igual forma acerca de
cada relación que ego: Bob puede señalarse a sí mismo como buen amigo de Alice,
pero Alice no necesariamente señala a Bob como buen amigo. Es muy útil describir
muchas estructuras sociales como formadas por vínculos “orientados”(que pueden ser
binarios, con signos, ordenados o ponderados). De hecho, la mayoría de los procesos
sociales incluyen secuencias de acciones dirigidas. Por ejemplo, supóngase que la
persona A hace un comentario a B, entonces B devuelve otro comentario a A y así
sucesivamente. Podemos desconocer el orden en el que sucedieron las acciones (por
ejemplo, quién comenzó la conversación), o puede que no nos importe. En este
ejemplo, podríamos querer saber solamente que “A y B tienen una conversación”. En
este caso, el vínculo o relación “conversando con”, incluye necesariamente ambos
actores A y B. Los dos actores, A y B, están “presentes” o son “concurrentes” en la
relación de “tener una conversación”. O también podemos describir la situación como
un ejemplo del tipo de institución social denominada “conversacion”, la cual, por
definición, involucra a dos (o más) actores “conectados” en una interacción
(Berkowitz).

Los grafos “orientados” utilizan la convención de que los actores o nodos se conectan
a través de líneas que tienen punta de flecha para indicar quién orienta el vínculo
hacia quién. Esto es lo que hicimos en los grafos anteriores, donde los individuos
(egos) dirigieron sus nominaciones hacia los otros (alters). Los grafos de
“concurrencia”, “presencia” o “recíprocos”, utilizan la convención de que los actores
involucrados en la relación se conectan con un segmento de línea simple (sin punta de
flecha). Aquí hay que ser muy cuidadosos. En un grafo dirigido, Bob pudo escoger a
Ted y Ted escoger a Bob. Esto podría ser representado por flechas con punta yendo
desde Bob hacia Ted y viceversa, o por una doble flecha. Pero esto tiene un sentido
distinto a un grafo que muestre a Bob y Ted conectados por un único segmento de
línea sin puntas de flecha. Tal grafo querría indicar que “hay una relación llamada
amistad cercana que une a Bob y a Ted”. La distinción puede ser sutil, pero en algunos
análisis es importante.

6
Relaciones simples o múltiples en el grafo

La información que hemos presentado acerca de la estructura social de nuestro grupo


de cuatro personas es muy simple. Es decir, describe sólo a un tipo de vínculo o
relación – nominar a un amigo cercano-. A un grafo que representa un único tipo de
relación se le llama grafo simple. Las estructuras sociales, sin embargo, son a menudo
múltiples. Es decir, hay muchas formas distintas de vínculos entre los actores sociales.
Añadamos un segundo tipo de relación a nuestro ejemplo. Además de las
nominaciones de amistad, supongamos que le preguntamos a cada persona si es
familia de cada uno de los otros tres. Bob identifica a Ted como su familia; Ted
identifica a Bob; y Ted y Alice identifican a cualquier otro (la historia completa podría
ser que Bob y Ted fuesen hermanos y Ted y Alice esposos). En este caso podríamos
añadir esta información a nuestro grafo, utilizando un color distinto o un estilo distinto
de línea para representar el segundo tipo de relación (“ser familiar de...”).

Podemos ver que el segundo tipo de vínculo, “el parentesco”, acentúa la fortaleza de
las relaciones entre Bob y Ted y entre Ted y Alice (o quizás, la presencia de un vínculo
de parentesco explique la nominación mutua como buenos amigos). El vínculo
recíproco de amistad entre Carol y Ted, sin embargo, es distinto, ya que no está
reforzado por un vínculo familiar.

Por supuesto, si estamos examinando muchos tipos distintos de relaciones entre el


mismo conjunto de actores, el poner toda esta información en un mismo grafo puede
hacerlo muy difícil de interpretar. En lugar de de ello debemos utilizar múltiples grafos
con los actores ubicados cada vez en el mismo sitio. Podríamos también querer
representar la multiplicidad de los datos de una forma más simple. Pudimos utilizar
líneas de diferente grosor para representar la existencia de muchos vínculos entre
cada par de actores; o pudimos contar el número de relaciones que estaban presentes
para cada actor y utilizar un grafo ponderado.

7
RESUMEN

Un grafo (a veces llamado sociograma) está compuesto por nodos (actores o puntos)
conectados por líneas (relaciones o vínculos). Un grafo puede representar un único
tipo de relaciones entre los actores (simple), o más de un tipo de relación (múltiple).
Cada vínculo o relación puede ser orientado (por ejemplo, se origina con un actor
fuente y alcanza a un actor objetivo), o puede ser un vínculo que representa
concurrencia, presencia o un reciprocidad entre el par de actores. Los vínculos
orientados se representan con flechas, los vínculos recíprocos se representan con
segmentos de recta. Los vínculos orientados pueden ser recíprocos (A nomina a B y
viceversa); tales vínculos pueden representarse con una flecha con doble punta. La
fortaleza de los vínculos entre actores en un grafo puede ser nominal o binaria
(representan presencia o ausencia de vínculo); con signos (representa un vínculo
negativo; un vínculo positivo o ningún vínculo); ordinales (representan si el vínculo es
fuerte, menos fuerte, etc.); o ponderada (midiendo un intervalo o nivel promedio). Al
hablar de la posición de un actor o nodo en un grafo con respecto a otros nodos o
actores en el mismo, nos referimos al actor focal como “ego” y a los otros como
“alters”.

PREGUNTAS DE ESTUDIO

1. ¿Qué son “nodos”y “líneas”? ¿Qué se utiliza para representar nodos y arcos en
un sociograma?

2. ¿Cómo se corresponden los grafos con signos, binarios y ponderados con los
niveles de medición “nominal,”ordinal”e “interválica”?

3. Distinguir entre relaciones o vínculos orientados y recíprocos.

4. ¿En qué se diferencia un vínculo orientado recíproco de un vínculo recíproco?

5. Dar un ejemplo de una relación múltiple. ¿Cómo puede representarse las


relaciones múltiples en los grafos?

8
PREGUNTAS DE APLICACIÓ N

1. Pensar en las lecturas de la primera parte del curso. ¿Algunos estudios


presentaban grafos? Si lo hacían, ¿qué tipos de grafos eran? (es decir, describir
técnicamente el tipo de grafo o matriz). Representar mediante un grafo los
datos de un artículo.

2. Suponer que estamos interesados en dibujar un grafo en el que las grandes


corporaciones estén vinculadas con las demás teniendo las mismas personas
en sus equipos directivos. ¿Tendría más sentido utilizar en el estudio un grafo
de vínculos “orientados” o “recíprocos”? ¿Es posible pensar en algún tipo de
relación entre grandes corporaciones que pueda representarse mejor con
vínculos orientados?

3. Pensar en algún grupo pequeño del cual se sea miembro (quizás un club, un
grupo de amigos, o gente viviendo en un mismo piso, etc.). ¿Qué tipos de
relaciones entre ellos podrían decirnos algo acerca de las estructuras sociales
de esta población? Intentar dibujar un grafo que represente uno de los tipos de
relaciones escogido. ¿Es posible ampliar este grafo para describir también un
segundo tipo de relación? (por ejemplo, uno podría empezar con “quién le
agrada a quién”y añadir “quién pasa más tiempo con quién”).

4. Realizar grafos de una red “estrella”, “línea” y “círculo” . Pensar en ejemplos


del mundo real con ese tipo de estructuras donde los vínculos sean orientados,
donde sean recíprocos o no orientados. ¿Qué hace que una jerarquía estricta lo
parezca? ¿Qué hace que una población que está segregada en dos grupos lo
parezca?

9
INTRODUCCIÓ N A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.

CAPÍTULO CUARTO: REPRESENTACIÓ N DE


REDES SOCIALES MEDIANTE MATRICES.

Robert A. Hanneman. Departmento de Sociología de la


Universidad de California Riverside
NOTA PREVIA

Este documento está traducido para la lista REDES con permiso del autor a partir de
la versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html> [Fecha de consulta:
Mayo de 2001].

La traducción se ha realizado por bloques. En este documento se presenta el cuarto


capítulo, traducido por Maria Ángela Petrizzo y revisado por José Luis Molina.

2
CAPÍTULO IV. REPRESENTACIÓ N DE REDES
SOCIALES MEDIANTE MATRICES

INTRODUCCIÓ N

Los grafos constituyen una manera muy útil de representar información sobre
redes sociales. Sin embargo, cuando existen muchos actores y/o muchas
clases de relaciones, éstos pueden hacerse tan visualmente complicados que
se hace muy difícil identificar estructuras. En su lugar, también es posible
representar la información sobre redes sociales en forma de matrices. De esta
forma, la representación de la información permite la utilización de
herramientas matemáticas y de computación para identificar estructuras. Los
analistas de redes sociales utilizan las matrices de una variedad de formas. Es
por ello que son necesarios ciertos conocimientos matemáticos básicos sobre
el tema. En este texto revisaremos los aspectos básicos que son necesarios
para entender qué es lo que hacen los analistas de redes sociales. Para
aquellos que quieran profundizar más en el tema, existen excelentes manuales
introductorias al álgebra de matrices para científicos sociales.

¿QUÉ ES UNA MATRIZ?

Para comenzar, una matriz es simplemente la disposición rectangular de un


conjunto de elementos (de hecho, es un poco más complicado que eso, pero
retomaremos el tema de las matrices de más de dos dimensiones en breve).
El tamaño de los rectángulos viene dado por el número de filas y columnas de
elementos que contienen. Una matriz de “3 por 6” tiene tres filas y seis
columnas; una matriz de “i por j” tiene i líneas y j columnas. A continuación se
muestran una matriz de 2 por 4 y una de 4 por 2.

3
2*4

1,1 1,2 1,3 1,4

2,1 2,2 2,3 2,4

4*2

1,1 1,2

2,1 2,2

3,1 3,2

4,1 4,2

Los elementos de una matriz, se identifican por sus “ubicaciones”. El elemento


1,1 es el elemento ubicado en la primera fila y la primera columna; el elemento
13,2 está en la treceava fila y la segunda columna. Las ubicaciones de las
celdas han sido utilizadas como elementos constitutivos de las matrices en los
dos ejemplos anteriores. A menudo, las matrices se presentan como
ordenaciones de elementos limitados por líneas verticales a su derecha e
izquierda, o corchetes a la izquierda y derecha. En el lenguaje html (utilizado
para preparar páginas web), es muy fácil utilizar “tablas” para representar
matrices. Las matrices pueden ser nombres dados; estos nombres a menudo
se muestran en letras capitales en negrita.

Los científicos sociales que utilizan matrices para representar redes sociales a
menudo no utilizan las convenciones matemáticas y simplemente muestran sus
datos como una ordenación de filas y columnas etiquetadas. Las etiquetas no
son realmente parte de la matriz, sino que son utilizadas sólo para clarificar la
presentación. La matriz que se muestra a continuación, por ejemplo, es una
matiz de 4 por 4, con etiquetas adicionales:

4
Bob Carol Ted Alice

Bob - 1 0 0

Carol 1 - 1 0

Ted 1 1 - 1

Alice 0 0 1 -

LA MATRIZ DE “ADYACENCIA”

La forma más común de matriz en el análisis de redes sociales es una matriz


simple compuesta por tantas filas y columnas como actores existan en el
conjunto de datos y dónde los elementos representan los vínculos entre los
actores. La más simple y común de las matrices es la matriz binaria. Es decir,
si existe un vínculo, se coloca un 1 en la celda, si no lo hay se escribe un cero.
Este tipo de matriz es el punto de partida de casi todos los análisis de redes y
se llama “matriz de adyacencia” porque representa quién está cerca de quién,
o adyacente a quién en el “espacio social” mostrado por las relaciones que
hemos medido. Por convención, en un grafo dirigido el origen de un vínculo es
la fila y el objeto es la columna. Veamos un ejemplo simple. El grafo dirigido de
las preferencias de amistad entre Bob, Carol, Ted y Alice sería como sigue:

B C

T A

Ya que los vínculos se miden en el nivel nominal (es decir, los datos son datos
binarios de preferencias), se puede representar la misma información en una
matriz como la siguiente:

5
B C T A

B - 1 0 0

C 1 - 1 0

T 1 1 - 1

A 0 0 1 -

Es necesario tener presente que las filas representan el origen de los vínculos
dirigidos y las columnas los destinos: Bob escogió a Carol, pero Carol no lo
escogió a él. Éste es un ejemplo de una matriz “asimétrica” que representa
vínculos dirigidos (vínculos que van de un origen a un receptor). Es decir, el
elemento i,j no necesariamente es igual que el elemento j,i. Si los vínculos que
representamos en nuestra matriz fueran “vínculos recíprocos” (por ejemplo,
vínculos que representan la relación “es compañero de negocios de ...”), o de
“co-presencia o concurrencia”, (e.g. dónde los vínculos representan una
relación como “trabaja en el mismo grupo de directores que...”) la matriz
necesariamente sería simétrica; es decir, el elemento i,j sería igual al elemento
j,i.

Los datos de preferencias binarias a menudo se representan con ceros y unos,


indicando la presencia o ausencia de cada relación lógica posible entre pares
de actores. Los grafos dirigidos se representan en forma de matriz (a menudo)
con –1, 0 y +1 para indicar relaciones negativas, nulas o neutrales y
relaciones positivas. Cuando se miden los vínculos de forma ordinal o de
intervalo, la magnitud numérica del vínculo medido se coloca como un
elemento de la matriz. Como hemos discutidos en el capítulo uno, hay otras
formas posibles de datos (multicategoría nominal, ordinales con más de tres
rangos, nominales con orden de rangos totales). Estas otras formas, sin
embargo, raramente se utilizan en estudios sociológicos y no les prestaremos
mucha atención.

6
En la representación de datos de redes sociales como matrices, la pregunta
que siempre surge es: ¿qué hago con los elementos de la matriz donde i=j? Es
decir, por ejemplo, ¿Bob se ha considerado como amigo cercano de él mismo?
A esta parte de la matriz se le conoce como la diagonal principal. A veces, el
valor de la diagonal principal carece de significado y se ignora (se deja en
blanco). A veces, sin embargo, la diagonal principal puede ser de gran
importancia, y puede tomar valores muy significativos. Esto es particularmente
cierto cuando las líneas y las columnas en nuestra matriz son “supernodos” o
“bloques”. Veremos esto en breve.

A menudo es conveniente hacer referencia a ciertas partes de una matriz


utilizando una terminología resumida. Si se toman todos los elementos de una
fila (por ejemplo, a quiénes escoge a Bob como amigos: 1,1,1,0), se examina el
“vector fila” para Bob. Si sólo se observa quién escoge a Bob como amigo (la
primera columna o 1,0,1,0), se examina el “vector columna” para Bob. A veces
es útil hacer ciertas operaciones con los vectores fila o los vectores columna.
Por ejemplo, si se suman los elementos de los vectores columnas en este
ejemplo, puede obtenerse la medida de cuán “popular” es cada nodo (en
términos de con cuánta frecuencia fueron objeto de un vínculo dirigido de
amistad).

PERMUTACIÓ N, BLOQUES E IMÁGENES DE MATRICES

También es útil, a veces, reorganizar las filas y columnas de una matriz de


forma tal que pueda observarse los patrones de manera más clara. Al
intercambio de filas y columnas (si se quiere reagrupar las filas, se deberá
reagrupar las columnas de la misma forma o la matriz no tendrá sentido para la
mayoría de operaciones), se le conoce como “permutación” de la matriz.

Nuestros datos originales serían:

Bob Carol Ted Alice

Bob - 1 0 0

7
Carol 1 - 1 0

Ted 1 1 - 1

Alice 0 0 1 -

Reorganicemos (permutemos) la matriz de forma tal que los dos hombres y las
dos mujeres sean adyacentes en la matriz. La permutación de la matriz
simplemente significa el cambio del orden de las líneas y columnas. En tanto
que la matriz es simétrica, si se cambia la posición de una línea, se debe
cambiar la posición de su columna correspondiente.

Bob Ted Carol Alice

Bob - 1 1 0

Ted 1 - 1 1

Carol 0 1 - 0

Alice 0 0 1 -

Ninguno de los elementos ha visto cambiar sus valores a través de esta


operación o reorganizado las filas y las columnas, sólo se han cambiado las
cosas de sitio. También se han resaltado algunas zonas de la matriz. Cada
sección coloreada se denominada bloque. Los bloques se forman trazando
líneas de división a través de las filas y columnas de la matriz (por ejemplo,
entre Ted y Carol). El trazado de estas líneas divisorias a través de la matriz
suele llamarse partición de la matriz. Esta matriz la hemos dividido en función
del sexo de los actores. La partición a veces es conocida como el proceso de
“hacer bloques en una matriz” ya que la partición produce bloques.

8
Este tipo de agrupamiento de celdas con frecuencia se hace en análisis de
redes para entender cómo algunos conjuntos de actores se encuentran
“inmersos” en roles sociales o en entidades grandes. Aquí, por ejemplo, puede
verse que todos los ocupantes del rol social conocido como “mujer” escoge a
los demás como su amigo; que ninguna mujer escoge a otra como su amiga, y
que los hombres son más propensos a escoger mujeres (se han seleccionado
3 de cuatro posibilidades), que las mujeres a escoger hombres (se han
seleccionado sólo 2 de las cuatro posibles combinaciones). Se ha agrupado a
las mujeres juntas para crear una “partición”, “supernodo” , “rol social” o
“bloque”. A menudo se dividen matrices de redes sociales de esta forma para
identificar y probar ideas acerca de la forma en que los actores se encuentran
“involucrados” en roles sociales u otros “contextos”.

Puede quererse evitar el análisis de los nodos individuales y examinar sólo


posiciones o roles. Si se calcula la proporción de todos los vínculos que están
presentes en un bloque, se puede crear una matriz de bloques de densidad.
Haciendo esto se ignoran los vínculos reflexivos de nuestro ejemplo:

Matriz de bloques de
densidad

Hombre Mujer

Hombre 1.00 0.75

Mujer 0.50 0.00

Se puede querer agrupar la información aún más, utilizando una imagen de


bloque o matriz Imagen. Si la densidad en un bloque es mayor que una
cantidad dada (a menudo se utiliza la densidad promedio para la totalidad de
la matriz como una puntuación de corte, en el actual ejemplo la densidad es
.58), se introduce un “1” en una celda de la matriz de bloques, y un “0” en caso
contrario. Este tipo de simplificación se llama “imagen” de la matriz de bloques.

9
Matriz Imagen

Hombre Mujer

Hombre 1 1

Mujer 0 0

Las imágenes de matrices de bloques son herramientas muy útiles en la


simplificación de estructuras complejas de datos. Como cualquier
procedimiento de simplificación, debe utilizarse el buen juicio en la decisión de
cómo identificar los bloques y qué cortes utilizar en la creación de imágenes
–o se podría perder información importante.

OPERACIONES MATEMÁTICAS CON MATRICES

La representación de los vínculos entre los actores a través de matrices puede


ser de ayuda para observar estructuras de relaciones mediante la realización
de manipulaciones simples como la suma de vectores fila o la partición de una
matriz en bloques. Los analistas de redes sociales utilizan una gran cantidad
de operaciones matemáticas adicionales que pueden desarrollarse con
matrices para una gran variedad de propósitos (suma y resta de matrices,
trasposiciones, inversas, multiplicación de matrices y otras exóticas como
determinantes, autovalores y autovectores). Sin pretender enseñar álgebra de
matrices, es útil conocer al menos un poco sobre estas operaciones
matemáticas y para qué se utilizan en el análisis de redes sociales.

Trasposición de una matriz

Esto es, simplemente, el intercambio de filas y columnas de forma tal que i se


convierte en j y viceversa. Si se toma la matriz traspuesta de una matriz de
adyacencia directa y se examinan sus vectores fila, se estará observando los
orígenes de los vínculos dirigidos a un actor. El grado de similitud entre una
matriz de adyacencia y esta matriz traspuesta, es una forma de resumir el
grado de simetría en el patrón de relaciones entre los actores. Es decir, la

10
correlación entre una matriz de adyacencia y la traspuesta de esa matriz es la
medida del grado de reciprocidad de los vínculos. La reciprocidad de los
vínculos puede ser una propiedad muy importante de una estructura social ya
que se refiere tanto al equilibrio como al grado y forma de la jerarquía de una
red.

Inversa de una matriz

Se trata de una operación matemática que origina una matriz tal que al
multiplicarla por la matriz original, produce una matriz nueva con números 1 en
la diagonal principal y cero en las demás posiciones (esto recibe el nombre de
matriz de identidad). Sin ahondar en este tema, puede pensarse que la inversa
de una matriz es un tipo “opuesto” de la matriz original. Las matrices inversas
se utilizan para hacer otros cálculos en el análisis de redes sociales. Sin
embargo, a veces también es interesante estudiarlas en sí mismas. Es algo
similar a mirar un rótulo negro sobre un papel blanco en contraste con un
rótulo en blanco sobre un papel negro: a veces pueden observarse cosas
diferentes.

Suma y resta de matrices

Éstas son las operaciones matemáticas con matrices más fáciles. Simplemente
se suma o resta cada elemento correspondiente i,j de dos (o más) matrices.
Por supuesto, para realizar esto, las matrices deben tener el mismo número de
elementos i y j (a esto se le llama matrices “compatibles” con la adición y la
sustracción) –y los valores de i y j deben estar en el mismo orden en cada
matriz. A menudo, la suma y la resta de matrices se utilizan en análisis de
redes cuando se intenta simplificar o reducir la complejidad de múltiples datos
a formas simples.

Si se tiene una matriz simétrica que representa el vínculo “intercambio de


dinero” y otra que representa la relación “intercambio de bienes”, puede
sumarse las dos matrices para indicar la intensidad de la relación de
intercambio. Las parejas con una puntuación cero no tendrán ninguna relación,
aquellas con un “1” estarán vinculadas bien por el trueque o bien por un

11
intercambio de productos; y aquellos con una puntuación de “2” podrían estar
vinculados tanto por relaciones de trueque como por intercambio de productos.

Si se sustrae la matriz de “intercambio de bienes” de aquélla de “intercambio


de dinero”, una puntuación de –1 indicaría parejas con una relación de
trueque; una puntuación de cero indicaría o bien ninguna relación o una
relación de trueque o intercambio de productos y una puntuación de +1
indicaría parejas que sólo poseen una relación de intercambio de productos.
Uno u otro enfoque son útiles según las preguntas de investigación
planteadas.

Correlación y regresión de matrices

La correlación y regresión de matrices son maneras de describir la asociación


o similitud entre las matrices. La correlación interroga a dos matrices acerca de
“cuán similares son”. La regresión utiliza las puntuaciones de una matriz para
predecir las puntuaciones en la otra. Si queremos saber cuán similar es la
matriz A a la B, se toma cada elemento i,j de la matriz A, se compara con el
mismo elemento i,j de la matriz B, y se calcula la medida de asociación (qué
medida se utilice depende del nivel de medida de los vínculos en las dos
matrices). La regresión de matrices realiza esta misma operación con los
elementos de una matriz definidos como las observaciones de la variable
dependiente y los correspondientes elementos i,j de otra matriz que se han
definido como las observaciones de las variables independientes. Estas
herramientas son utilizadas por los analistas de redes sociales para el mismo
propósito que persiguen aquellos que no lo son: evaluar la similitud o
correspondencia entre dos distribuciones de puntuaciones. Podemos, por
ejemplo, preguntar qué tan similar es el patrón de vínculos de amistad entre
actores a su patrón de parentesco. Podemos querer ver hasta qué punto es
posible predecir qué naciones tienen buenas relaciones diplomáticas con otras
sobre la base de la importancia de los flujos comerciales entre ellas.

12
Multiplicación y multiplicación Booleana de matrices

La multiplicación de matrices es una operación un tanto infrecuente, pero


puede ser muy útil para el analista de redes. Es necesario tener un poco de
paciencia en este apartado. Primero, necesitamos mostrar cómo hacer una
multiplicación de matrices y unos pocos resultados importantes (como qué
sucede si se multiplica una matriz de adyacencia por sí misma, o si se eleva a
una potencia). Intentaremos, entonces explicar la utilidad de éstas
operaciones.

Para multiplicar dos matrices, éstas deben ser “compatibles” con la


multiplicación. Esto significa que el número de filas en la primera matriz debe
ser igual al número de columnas en la segunda. Con frecuencia, los analistas
de redes utilizan matrices de adyacencia, que son cuadradas y, por tanto,
compatibles con la multiplicación. Para multiplicar dos matrices, se comienza
en la esquina superior izquierda de la primera matriz, y se multiplica cada
celda en la primera fila de la primera matriz por el valor en cada celda de la
primera columna de la segunda matriz, y luego se suman los resultados. Se
procede de igual forma para cada celda en cada fila de la primera matriz,
multiplicada por la columna en la segunda. Para realizar una multiplicación
booleana de matrices, el proceso es el mismo, pero se introduce un cero en la
celda si el producto de la multiplicación es cero y un uno si el producto es
diferente de cero.

Supongamos que queremos multiplicar estas dos matrices:

0 1
2 3 6 7 8
*
4 5 9 10 11

El resultado es:

(0*6)+(1*9 (0*7)+(1*10 (0*8)+(1*11

13
) ) )
(2*6)+(3*9 (2*7)+(3*10 (2*8)+(3*11
) ) )
(4*6)+(5*9 (4*7)+(5*10 (4*8)+(5*11
) ) )

La operación matemática en sí misma no nos interesa (muchas aplicaciones


pueden ejecutar una multiplicación de matrices). Sin embargo, la operación es
útil cuando se aplica a una matriz de adyacencia. Veamos de nuevo a nuestros
amigos:

B C

T A

La matriz de adyacencia para los cuatro actores B, C, T y A (en ese orden) es:

0 1 1 0
0 0 1 0
1 1 0 1
0 0 1 0

Otra forma de pensar en esta matriz, es advertir qué nos dice si hay un camino
de un actor a otro. Un 1 representa la presencia de un camino, un cero
representa la ausencia de éste. La matriz de adyacencia es exactamente lo
que su nombre sugiere – nos dice cuáles actores son cercanos o tienen un
camino directo de uno a otro.

Ahora, supongamos que multiplicamos esta matriz de adyacencia por sí misma


(por ejemplo elevando la matriz a 2, o al cuadrado).

(0*0)+(1*0)+(1*1)+(0*0) (0*1)+(1*0)+(1*1)+(0*0) (0*1)+(1*1)+(1*0)+(0*1) (0*0)+(1*0)+(1*1)+(0*0)


(0*0)+(0*0)+(1*1)+(0*0) (0*1)+(0*0)+(1*1)+(0*0) (0*1)+(0*1)+(1*0)+(0*1) (0*0)+(0*0)+(1*1)+(0*0)

14
(1*0)+(1*0)+(0*1)+(1*0) (1*1)+(1*0)+(0*1)+(1*0) (1*1)+(1*1)+(0*0)+(1*1) (1*0)+(1*0)+(0*1)+(1*0)
(0*0)+(0*0)+(1*1)+(0*0) (0*1)+(0*0)+(1*1)+(0*0) (0*1)+(0*1)+(1*0)+(0*1) (0*0)+(0*0)+(1*1)+(0*0)

O lo que es lo mismo:
1 1 1 1
1 1 0 1
0 1 3 0
1 1 0 1

Esta matriz (por ejemplo, la matriz cuadrada de adyacencia) cuenta el número


de caminos entre dos nodos que tienen longitud dos. Detengámonos por un
minuto y verifiquemos esta afirmación. Por ejemplo, nótese que el actor “B”
está conectado con cada uno de los demás actores por un camino de longitud
dos; y que no hay más que un camino como ese a ningún otro actor. El actor T
está tres veces conectado a sí mismo por caminos de longitud dos. Esto es
porque el actor T tiene vínculos recíprocos con cada uno de los otros tres
actores. No hay camino de longitud dos de T a B (aunque hay un camino de
longitud uno).

Entonces, la matriz de adyacencia nos dice cuántos caminos de longitud uno


hay de cada actor a los demás. La matriz cuadrada de adyacencia, nos dice
cuántos caminos de longitud dos hay de cada actor a los demás. También es
cierto (pero ahora no lo demostraremos) que la matriz de adyacencia elevada
al cubo indica el número de caminos de longitud tres de cada actor a los
demás, y así sucesivamente...

Si calculamos el producto booleano, además del simple producto de la matriz,


la matriz cuadrada de adyacencia nos dirá dónde hay un camino de longitud
dos entre dos actores (no cuántos caminos de este tipo hay). Si tomamos la
matriz booleana cuadrada y la multiplicamos por la matriz de adyacencia
utilizando una multiplicación booleana, el resultado nos indicará qué actores
estaban conectados por uno o más caminos de longitud tres, y así
sucesivamente...

15
Finalmente, ¿a qué debe prestarse atención?

Algunas de las propiedades fundamentales de una red social tienen que ver
con cómo están conectados los actores a los demás. Las redes que tienen
pocas o débiles conexiones o actores conectados sólo por caminos de gran
longitud, pueden mostrar baja solidaridad, una tendencia a quedar apartados,
lentitud de respuesta a estímulos y otras características similares. Las redes
que poseen conexiones más fuertes con caminos pequeños entre los actores
pueden ser más robustas y más capaces de responder con rapidez y
efectividad. La medición del número y longitud de los caminos entre los
actores en una red nos permite catalogar estas tendencias importantes en toda
red.

Las posiciones de los actores individuales en las redes son también descritas
muy útilmente por el número y la longitud de los caminos que poseen con
otros actores. Los actores que tienen muchos caminos hacia otros actores
pueden ser más influyentes sobre ellos. Los actores que tienen caminos cortos
a muchos otros actores pueden ser figuras influyentes o centrales. Entonces,
el número y la longitud de los caminos en una red son muy importantes para
entender tanto las limitaciones individuales como las oportunidades y para
entender el comportamiento y potenciales de la red en su totalidad.

Hay muchas medidas de la posición individual y global de la red que se basan


en dónde se encuentran los caminos de longitudes determinadas entre los
actores, la longitud del camino más corto entre dos actores y el número de
caminos entre actores. De hecho, la mayoría de las medidas básicas de las
redes (capítulo 5), medidas de centralidad y poder (capítulo 6) y las medidas
de agrupamiento y subestructuras de red (capítulo 7) se basan en un exámen
de la cantidad y longitud de los caminos entre los actores.

16
RESUMEN

Las matrices son conjuntos de elementos dispuestos en filas y columnas. A


menudo se utilizan en análisis de redes para representar la adyacencia de
cada actor a cada uno de los demás en una red. Una matriz de adyacencia es
una matriz cuadrada de actor por actor (i=j), donde la presencia de vínculos se
registran como elementos. La diagonal principal, o “vínculo reflexivo” de una
matriz de adyacencia, a menudo se ignora en el análisis de redes.

Los sociogramas, o grafos de redes pueden representarse en forma de matriz,


y pueden hacerse operaciones matemáticas para resumir la información en el
grafo. Operaciones con vectores, formación de bloques y particiones y
matemáticas de matrices (inversas, traspuestas, adición, sustracción,
multiplicación y multiplicación booleana) son operaciones matemáticas que
resultan en ocasiones útiles para permitirnos observar ciertas cosas en
relación con las estructuras de relaciones en redes sociales.

Los datos de redes sociales son, a menudo, múltiples (por ejemplo, hay
múltiples tipos de vínculos entre los actores). Tales datos se representan como
series de matrices de igual dimensión con los actores en igual posición en
cada matriz. Muchas de las mismas herramientas que se utilizan para trabajar
con una matriz individual (suma y correlación de matrices, formación de
bloques, etc.), son útiles para intentar resumirlas y observar los patrones en
datos múltiples.

Una vez que un patrón de relaciones sociales, o un vínculo entre un conjunto


de actores se ha representado de una manera formal (grafos o matrices),
podemos definir algunas ideas importantes sobre la estructura social en formas
más precisas valiéndonos para ello de las matemáticas. En el resto capítulos
observaremos cómo los analistas de redes han traducido formalmente algunos
de los conceptos centrales que los científicos sociales utilizan para describir
las estructuras sociales.

17
Preguntas de estudio

1. Si una matriz es “3 por 2”, ¿cuántas columnas y cuántas filas tiene?


2. Las matrices de adyacencia son “cuadradas”, ¿por qué?
3. Si hay un “1” en la celda 3,2 de una matriz de adyacencia que
representa un sociograma, ¿qué nos indica?
4. ¿Qué quiere decir “permutar” una matriz y “hacer bloques” con una
matriz?

Preguntas aplicadas

1. Pensar en lecturas de un curso de análisis de redes sociales. ¿Algunos


trabajos presentan matrices? Si lo hacen, ¿qué clase de matrices son?
(es decir, cuál es la descripción técnica del tipo de grafo o matriz).
Tomar un artículo y mostrar los datos en forma de matriz.
2. Pensar en algún grupo pequeño del que se sea miembro (quizás un
club, un grupo de amigos, o gente que vive en el mismo complejo de
apartamentos, etc.). ¿Qué clase de relaciones entre ellos nos diría algo
sobre las estructuras sociales de esta población? Intentar preparar una
matriz que represente uno de los tipos de relaciones escogido. ¿Puede
aplicarse esta matriz también para describir un segundo tipo de
relación? (por ejemplo, una puede comenzar con “¿Quién le agrada a
quién?” y luego añadir “¿Quién está más tiempo con quién?”)
3. Utilizando las matrices creadas en el punto anterior ¿tiene sentido dejar
la diagonal “en blanco” o no?. Intentar permutar y hacer bloques con la
matriz.
4. ¿Es posible hacer una matriz de adyacencia para representar una red
“estrella”? Qué sucede con la “línea” y el “círculo”. Observar los unos y
ceros en estas matrices –a veces podemos reconocer la presencia de
ciertos tipos de relaciones sociales por estas representaciones
“digitales”. ¿A qué se parece una jerarquía estricta? ¿A qué se parece
una población que está segregada en dos grupos?

18
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.

CAPITULO QUINTO

Robert A. Hanneman. Departamento de Sociología de la


Universidad de California Riverside.
NOTA PREVIA

Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].

Este capítulo ha sido traducido por José Luis Molina.

2
CAPÍTULO V. PROPIEDADES BÁSICAS DE LAS REDES
Y DE LOS ACTORES

La perspectiva de redes implica tener en cuenta múltiples niveles de análisis. Las


diferencias entre los actores son interpretadas en base a las limitaciones y
oportunidades que surgen de la forma en que éstos están inmersos en las redes; la
estructura y el comportamiento de las redes está basado en y activado por las
interacciones locales entre los actores. A medida que examinemos algunos de los
conceptos básicos y definiciones del análisis de redes sociales en este capítulo y en
los siguientes, esta dualidad entre individuo y estructura se pondrá de manifiesto una y
otra vez.

En este capítulo examinaremos algunos de las más obvias y menos complejas ideas
de los métodos formales de análisis de redes. A pesar de la simplicidad de las ideas y
definiciones, hay buenas razones teóricas (y alguna evidencia empírica) para creer las
propiedades básicas de las redes sociales tienen importantes consecuencias. Tanto
para los individuos como para las estructuras una cuestión de fundamental
importancia es la de las conexiones. Normalmente, algunos actores tienen muchas
conexiones mientras que otros tienen pocas, especialmente cuando las poblaciones
se convierten en grandes y no todas las conexiones posibles están presentes –existen
“agujeros estructurales”. Hasta qué punto los individuos están conectados unos con
otros y hasta qué punto la red en su conjunto está integrada, son las dos caras de la
misma moneda.

Las diferencias en cómo los individuos están conectados puede ser extremadamente
útil para entender sus atributos y comportamiento. Muchas conexiones significa a
menudo que los individuos se exponen todavía a más y más diversa información.
Individuos bien conectados pueden ser más influyentes y pueden estar más
influenciados por otros. Las diferencias en el grado de conexión de poblaciones
completas puede tener también importantes consecuencias. La enfermedad y los
rumores se extienden muy rápidamente donde hay altas tasas de conexiones. Pero
también lo hace la información útil. Las poblaciones más conectadas puede ser más
capaces para movilizar sus recursos y también pueden disponer de múltiples y
diversas perspectivas para resolver problemas. Entre el individuo y la población hay
otro nivel de análisis –el de la “composición”. Algunas poblaciones pueden estar
compuestas de individuos que son bastantes similares en la forma en la que están
conectados. Otras poblaciones pueden ostentar claras diferencias, con una pequeña

3
elite de personas centrales y conectadas y una gran masa de personas con pocas
conexiones. Las diferencias en conexiones pueden explicarnos algo acerca de cómo
están estratificados los grupos sociales.

A causa de que muchos individuos no están usualmente conectados directamente a la


mayor parte de otros individuos en una población, puede ser bastante importante ir
más allá simplemente examinando las conexiones inmediatas de los actores y la
densidad media de las conexiones directas en poblaciones. El segundo conjunto de
aproximaciones más importante que examinaremos en este capítulo tiene que ver con
la idea de distancia entre los actores (o, llanamente, cómo de cerca uno está de otro).
Algunos actores pueden ser capaces de alcanzar a la mayor parte del resto de actores
de la población con poco esfuerzo: se lo cuentan a sus amigos, éstos a los suyos y
todo el mundo lo sabe. Otros actores, en cambio, pueden tener dificultades para
enterarse. Ellos pueden explicar cosas a la gente, pero la gente con la que se
relacionan no está bien conectada y el mensaje no llega muy lejos. También es
posible que si mis amigos y yo tenemos amigos en común, mi red esté bastante
limitada, aunque tenga bastantes amigos. En cambio, si mis amigos tienen conexiones
no redundantes el rango de mis conexiones se expande. Si los individuos difieren en
su cercanía al resto de actores, entonces la posibilidad de estratificación a lo largo de
esta dimensión crece. Además, una diferencia importante entre las “clases sociales”
es no tanto el número de conexiones que los actores tienen, sino cuáles de esas
conexiones se superponen y “limitan” o extienden o proporcionan “oportunidades”. Las
poblaciones en su conjunto, entonces, pueden diferir en cómo de cerca están los
actores a otros actores de media. Tales diferencias pueden ayudarnos a entender la
difusión, homogeneidad, solidaridad y otras diferencias en las propiedades macro de
los grupos sociales.

Los métodos de las redes sociales tienen un vocabulario para describir la conectividad
y la distancia que podría, de entrada, parecer bastante formal y abstracto. Esto no es
sorprendente ya que muchas de las ideas están tomadas directamente de las teoría
matemática de grafos. Pero vale la pena el esfuerzo de batallar con la jerga. La
precisión y el rigor de las definiciones nos permite comunicar claramente las
propiedades importantes de la estructuras sociales –ya menudo lleva a perspectivas
que no habrían sido posibles si hubiésemos usado aproximaciones menos formales.

4
UN EJEMPLO

Las propiedades básicas de las redes son fáciles de aprender y comprender con
ejemplos. Estudiar un ejemplo también proporciona aplicaciones sociológicamente
significativas de la aplicación de formalismos. En este capítulo observaremos una red
binaria dirigida simple que describe el flujo de información entre 10 organizaciones
formales preocupadas por el bienestar social en una ciudad del medio Oeste de los
Estados Unidos (Knoke and Burke). Por supuesto, los datos reticulares pueden
obtenerse de formas variadas (relaciones no dirigidas, múltiples lazos, relaciones
valoradas, etc.) y un ejemplo no puede contener todas las posibilidades. Sin embargo,
pueden ser bastante sorprendente observar cuánta información puede ser “exprimida”
de una simple matriz binaria usando los conceptos básicos de grafos.

Para redes pequeñas, es a menudo útil examinar directamente el grafo. Aquí tenemos
un dígrafo (grafo dirigido) para los datos de la red de intercambio de información de
Knoke:

Un ojo entrenado debería percibir inmediatamente unas cuantas cuestiones


simplemente observando el grafo. Existen un número limitado de actores aquí (diez,
de hecho) y todos ellos están conectados. Pero, claramente no todas las conexiones
posibles están presentes y hay algunos “agujeros estructurales” (o al menos pequeños
agujeros en la red social). Parecen existir algunas diferencias en cómo los actores
están conectados (compara el actor número 7, un periódico, con el actor número 6,
una organización para la defensa de los derechos sociales). Si se observa
atentamente se podrá ver que algunas conexiones de los actores son probablemente
recíprocas (esto es, A comparte información con B, B también comparte información
con A); algún otro actor (e.g. 6 y 10 son probablemente más emisores que receptores

5
de información). Como resultado de la variación en cómo los actores están conectados
y si los lazos son recíprocos, algunos actores pueden estar a bastante “distancia” de
otros. Parecen haber grupos de actores que difieren en este sentido ( (1, 2, 4, 5, and 6
parecen estar en el centro de la acción, 6, 9, y 10 parecen ser más periféricos).

Una cuidadosa mirada al grafo puede ser muy útil para obtener una noción intuitiva de
las importancia de las características de una red social. Con grandes poblaciones o
muchas conexiones, sin embargo, los grafos no son de mucha ayuda. Observando el
grafo podemos disponer de una buena visión intuitiva de lo que está pasando, pero
nuestras descripciones de lo que vemos son bastante imprecisas (el párrafo anterior
es un ejemplo de esto). Para ser más precisos, utilizar ordenadores que apliquen
algoritmos para calcular las medidas matemáticas de las propiedades de los grafos, es
necesario trabajar con matrices de adyacencia en lugar de con grafos.

1COUN 2COMM 3EDUC 4INDU 5MAYR 6WRO 7NEWS 8UWAY 9WELF 10WEST

1COUN --- 1 0 0 1 0 1 0 1 0

2COMM 1 --- 1 1 1 0 1 1 1 0

3EDUC 0 1 --- 1 1 1 1 0 0 1

4INDU 1 1 0 --- 1 0 1 0 0 0

5MAYR 1 1 1 1 --- 0 1 1 1 1

6WRO 0 0 1 1 1 --- 1 0 1 0

7NEWS 0 1 0 1 1 0 --- 0 0 0

8UWAY 1 1 0 1 1 0 1 --- 1 0

9WELF 0 1 0 0 1 0 1 0 --- 0

10WEST 1 1 1 0 1 0 1 0 0 ---

Hay diez filas y columnas, los datos son binarios y la matriz asimétrica. Como
mencionamos en el capítulo en el que usamos matrices para representar redes , la fila
es tratada como la fuente de información y la columna como la receptora. Haciendo
algunas operaciones muy simples sobre esta matriz es posible desarrollar un útil y
sistemático índice de números o medidas de algunas de las propiedades de la red que
identificamos a simple vista en el grafo.

6
CONEXIONES

Desde que las redes están definidas por sus actores y las conexiones entre ellos, es
útil empezar nuestra descripción de las redes examinando esas propiedades simples.
Centrándonos en primer lugar en la red en su conjunto, uno podría estar interesado en
el número de actores, el número de conexiones que son posibles y el número de
conexiones efectivamente existentes. Diferencias en el tamaño de las redes y en cómo
los actores están conectados, nos explican dos cosas acerca de las poblaciones
humanas que son críticas. Pequeños grupos difieren de los grandes grupos en
muchos sentidos importantes –además, el tamaño de la población es una de las
variables más importantes en el análisis sociológico. Las diferencias en cómo están
conectados los actores en una población pueden ser un indicador clave de la
solidaridad, la “densidad moral” y la “complejidad” de su organización social .

Los individuos, al igual que las redes, difieren en esas características demográficas
básicas. Los actores individuales pueden tener pocos o muchos lazos. Los individuos
pueden ser “fuentes” de relaciones, “agujeros” (actores que reciben pero no emiten) o
ambos. Esas clases de diferencias básicas entre las conexiones inmediatas de los
actores puede ser crítica explicando cómo ellos ven el mundo y cómo el mundo los ve
a ellos. El número de clases de lazos que los actores tienen constituyen la base para
la similitud o diferencia en relación a otros actores – y por tanto la posible
diferenciación o estratificación. El número y clase de lazos que los actores tienen son
claves para determinar has qué punto su inclusión en la red limita su conducta y el
rango de oportunidades, influencia y poder que tienen.

Es posible que una red no esté completamente conectada. Se trata de una cuestión de
accesibilidad. Pueden existir dos o más grupos desconectados en la población. Si no
es posible que todos los actores puedan alcanzar al resto de los actores, entonces
nuestra población está formada por más de un grupo. Los grupos pueden ocupar el
mismo espacio o tener el mismo nombre pero no todos los miembros están
conectados. Obviamente, tales divisiones en las poblaciones pueden ser
sociológicamente relevantes. Desde el momento que una red no está conectada
pueden darse las condiciones para estratificación y conflicto. Al nivel individual, el
grado al cuál un actor puede alcanzar otros indica hasta qué punto los individuos están
separados del conjunto, o hasta qué punto están aislados. Tal aislamiento puede tener
una significación psicosocial. Si un actor no puede alcanzar o no puede ser alcanzado
por otro, entonces puede que no exista aprendizaje, ayuda o influencia entre los dos.

7
Otra manera útil de mirar a las redes como un conjunto y la manera en la cuál los
individuos están inmersos en ella, es examinar las estructuras locales. Las
aproximaciones más comunes se han centrado en las díadas (series de dos actores) y
en las tríadas (series de tres actores).

Con datos dirigidos, hay cuatro posibles relaciones diádicas: A y B no están


conectados, A emite a B, B emite a A o A y B emiten mutuamente (con relaciones
recíprocas sólo hay dos relaciones posibles –relación o ausencia de relación). Puede
ser útil mirar a cada actor en términos de las clases de relaciones diádicas en las
cuáles está inmerso. Un actor que emite pero no recibe puede ser bastante diferente
de uno que emite y recibe relaciones. Un interés común en el análisis de las relaciones
diádicas es hasta qué punto los lazos son recíprocos. Algunos teóricos sienten que
existe una tendencia entre las díadas de disponer bien de relaciones equilibradas bien
a que sean nulas y que los lazos asimétricos pueden ser inestables. Por supuesto, uno
puede examinar la red en su conjunto y también las diferencias individuales. En un
sentido, una red que tiene un predominio de lazos nulos o recíprocos por encima de
las conexiones asimétricas puede ser más “igualitaria” o “estable” que otra en la que
predominan las relaciones asimétricas (la cual podría ser más bien una jerarquía).

Los teóricos de los pequeños grupos argumentan que muchas de las más interesantes
y básicas cuestiones de la estructura social se manifiestan cuando se examinan las
tríadas. Tríadas permiten un rango mucho mayor de relaciones posibles (con
relaciones dirigidas hay de hecho 64 tipologías posibles de relaciones entre tres
actores!), incluyendo las relaciones que exhiben jerarquía, igualdad, y la formación de
grupos exclusivos (e.g. el caso en el dos actores se conectan y excluyen a un tercero).
Así, un pequeño grupo de investigadores sugieren que realmente todas las formas de
relaciones sociales pueden ser observadas en tríadas. A causa de este interés,
podemos realizar un “censo de tríadas” para cada actor y para la red en su conjunto.
En particular podemos estar interesados en la proporción de tríadas que son
“transitivas” (esto es, exhiben un tipo de equilibrio en el que si A dirige un lazo a B, y B
dirige un lazo a C, entonces A también dirige un lazo a C). Estas tríadas transitivas o
equilibradas son propuestas por algunos investigadores como el “equilibrio” o el
estado natural hacia el cuál las relaciones triádicas tienden (¡no todos los teóricos
estarían de acuerdo!).

8
Por tanto, hay realmente bastante que aprender acerca de cómo los actores están
inmersos en las redes y de la estructura de la red examinando las adyacencias.
Volvamos a nuestros datos sobre organizaciones en el campo del bienestar social y
apliquemos esas ideas.

TAMAÑO, DENSIDAD Y GRADO

El tamaño de una red es a menudo muy importante. Imaginemos un grupo de 12


estudiantes en un seminario. No sería difícil que los doce estudiantes se conociesen
entre sí bastante bien y desarrollasen relaciones de intercambio (por ejemplo,
compartir apuntes). Ahora imaginemos una gran clase de 300 estudiantes. Sería
extremadamente difícil para cualquier estudiante conocer a todos los otros y sería
virtualmente imposible una red única para compartir apuntes. El tamaño es crítico para
la estructura de las relaciones sociales a causa de los recursos limitados y las
capacidades de que cada actor dispone para construir y mantener lazos. A medida
que el grupo crece, la proporción de todos los lazos que pudiesen (lógicamente) estar
presentes ---densidad— disminuirá y muy probablemente emergerán grupos y
facciones diferenciados.

Nuestra red de ejemplo tiene 10 actores. Usualmente el tamaño de la red se obtiene


simplemente contando el número de nodos. Si en una red existen (k * k-1) pares
únicos de actores ordenados (esto es, AB es diferente de BA y se dejan de lado los
lazos reflexivos), donde k es el número de actores. Puedes intentar verificar esta
afirmación por ti mismo en pequeñas redes. Por tanto, en nuestra red de 10 actores,
con datos dirigidos, existen 90 relaciones lógicamente posibles. Si tuviésemos lazos
recíprocos o simétricos el número sería 45 desde el momento que las relación AB es
la misma que la BA. El número de relaciones lógicamente posibles crece entonces
exponencialmente a medida que el número de actores se incrementa linealmente. Por
tanto, se deduce que el número lógicamente posible de estructuras sociales se
incrementa (o, por definición, se incrementa la “complejidad”) exponencialmente con el
tamaño.

Redes completamente saturadas (por ejemplo una en la cual todos los lazos
lógicamente posibles están de hecho presentes) son empíricamente raras,
especialmente cuando existen más de unos cuantos actores en una población. Es útil
observar hasta qué punto una red está a punto de alcanzar todo su potencial. Esto
significa examinar la densidad de los lazos, la cual se define como la proporción de

9
relaciones existentes en relación a las posibles. Por esto es importante el informe de
la rutina de estadística univariada de UCINET.

(Para la matriz completa)


*********************
Mean 0.54
Std Dev 0.50
Sum 49
Variance 0.25
Minimum 0
Maximum 1
N of Obs 90

Notas: La media es 0.54. Esto es, la media del conjunto de todas las relaciones posibles
(ignorando los lazos reflexivos) es 0,54. Dado que los datos son binarios esto significa que el
54% de todos los lazos posibles están presentes (o lo que es lo mismo: la densidad de la
matriz). La desviación estándar es una medida de cuánta variación hay entre elementos. Si
todos los elementos fuesen un 1 o todos un 0, la desviación estándar seria 0 –no habría
variación. Aquí, la variabilidad media de un elemento a otro es 0,50, casi tan grande como la
media. Por lo tanto, podría decirse que hay relativamente una gran cantidad de variación en las
relaciones. Con datos binarios , la máxima variabilidad en los lazos –o la máxima incertidumbre
sobre si cualquier lazo dado puede estar presente o ausente – se realiza en la densidad de
0.50. A medida que la densidad se aproxima a uno o alternativamente a cero, la desviación
estándar y la varianza entre lazos se reduce.

Dado que los datos en nuestro ejemplo son asimétricos (esto es, lazos o relaciones
dirigidas), podemos distinguir entre relaciones enviadas y relaciones recibidas.
Observando la densidad para cada fila y para cada columna, podemos saber un poco
acerca de la manera en la cuál los actores están inmersos en la densidad global. Aquí
tenemos “al modo de las filas” los estadísticos univariados de nuestro ejemplo tomado
de UCINET:

(para las filas o emisoras de lazos)


*************************************
Mean Std D Sum Var
---- ---- ---- ----
1 0.44 0.50 4.00 0.25
2 0.78 0.42 7.00 0.17
3 0.67 0.47 6.00 0.22
4 0.44 0.50 4.00 0.25
5 0.89 0.31 8.00 0.10
6 0.33 0.47 3.00 0.22
7 0.33 0.47 3.00 0.22
8 0.67 0.47 6.00 0.22
9 0.33 0.47 3.00 0.22
10 0.56 0.50 5.00 0.25

Notas: Los estadísticos de las filas nos explican el rol que cada actor juega como “fuente” de
relaciones (en un grafo no dirigido). La suma de las conexiones de un actor con el resto (e.g.
actor #1 envía información a los otros cuatro) se llama grado nodal de salida (para los datos
simétricos, por supuesto, cada nodo tiene simplemente un grado nodal y no podemos distinguir
el grado nodal del entrada del grado nodal de salida). El grado nodal de los puntos es
importante porque nos explica cuántas conexiones tiene un actor. El grado nodal de salida es
normalmente una medida de cuan influyente el actor puede ser. Podemos ver que el actor #5
envía lazos a todos los actores restantes menos uno; los actores #6, #7 y #9 envían
información a sólo tres de los actores. Actores #2, #3, #5, y #8 son similares en el sentido de
constituir fuentes de información para porciones importante de la red; los actores #1, #6, #7, y
#9 son similares desde el punto de vista que no constituyen fuentes de información. Podríamos
predecir que el primer grupo de organizaciones dispondrá de divisiones especializadas en

10
relaciones públicas, mientras que el segundo grupo podría no hacerlo. Los actores en el primer
grupo podría tener un alto potencial de influencia; los actores de “en medio” serán influyentes si
están conectados con los actores “correctos” y si no es así tendrán muy poca influencia. Por
tanto, existe variación en los roles que esas organizaciones juegan como fuentes de
información. Podemos normalizar esta información (y por lo tanto compararla con otras redes
de diferentes tamaños) expresando el grado nodal de salida como la proporción del número de
elementos en la fila. Esto es, calculando la media. El actor #10, por ejemplo, envía lazos al
56% de los restantes actores. Este dato lo podemos comparar entre redes de diferentes
tamaños.

Otro modo de pensar acerca de cada actor como fuente de información es mirar a la
varianza o la desviación estándar de las filas. Notamos que los actores con muy pocos
lazos de salida, o muchos lazos de salida tienen menos variabilidad que aquellos que
con niveles intermedios de relaciones. Esto nos dice algo: aquellos actores con lazos
hacia cualquier otro, o con lazos a casi nadie son más "predecibles" en su conducta
hacia otros que aquellos con números intermedios de relaciones. E un sentido, actores
con muchos lazos (en el centro de la red) y actores en la periferia de una red (pocos
lazos) tienen patrones de conducta que están más limitados y son más predecibles.
Actores con solo algunos lazos pueden variar más en su conducta, dependiendo con
quiénes están conectados.

Podemos también observar los datos de las columnas. Ahora, estamos mirando a los
actores como “sumideros” o receptores de información. La suma de cada columna en
la matriz de adyacencia es el grado nodal de entrada del punto. Esto es, cuántos
actores envían información o lazos al nodo que estamos estudiando. Los actores que
reciben información de muchas fuentes pueden ser prestigiosos (otros actores quieren
ser conocidos por el actor y por lo tanto le envían información). Los actores que
reciben información de muchas fuentes pueden ser también más poderosos –desde
que “conocimiento es poder”. Pero, los actores que reciben un montón de información
podrían sufrir también de “sobrecarga de información” o “ruido e interferencia” debida a
los mensajes contradictorios de muchas fuentes.

(para las columnas o lazos recibidos)


**************************************************************
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
---- ---- ---- ---- ---- ---- ---- ---- ---- ----
Mean 0.56 0.89 0.44 0.56 0.89 0.11 1.00 0.22 0.56 0.22
Std Dev 0.50 0.31 0.50 0.50 0.31 0.31 0.00 0.42 0.50 0.42
Sum 5.00 8.00 4.00 5.00 8.00 1.00 9.00 2.00 5.00 2.00
Variance 0.25 0.10 0.25 0.25 0.10 0.10 0.00 0.17 0.25 0.17

Notas: Mirando a las medias, podemos observar que hay mucha variación –más que para los
emisores de información. Nosotros vemos que los actores #2, #5, y #7 son muy importantes.
#2 y #5 también son importantes enviando información – por lo tanto ellos actúan como
“comunicadores” y “facilitadores” en el sistema. El actor #7 recibe mucha información pero no
envía demasiada. Por contra, el actor #7, es de hecho un “sumidero de información" –
colecciona hechos, pero no los crea (al menos eso esperamos dado que el actor #7 es un
periódico). Los actores #6, #8, y #10 parecen estar “fuera de juego” – esto es, no reciben

11
información de muchas fuentes directamente. El actor #6 tampoco envía mucha información –
por lo tanto #6 parece estar “aislado”. Los números #8 y #10 envían relativamente más
información de la que reciben. Uno podría sugerir que ellos son “recién llegados” que podrían
intentar ser influyentes, pero que de hecho carecen de las claves adecuadas.

Podemos aprender mucho de la red en general, y sobre las limitaciones estructurales


de los actores individuales, e incluso formular algunas hipótesis sobre los roles
sociales y las tendencias de comportamiento simplemente observando los nodos
adyacentes y calculando algunos estadísticos básicos. Antes de discutir la ligeramente
más compleja idea de distancia, hay un par más de aspectos de la “conectividad” que
suelen ser de interés.

ACCESIBILIDAD

Un actor es “accesible” por otro si existe un conjunto de conexiones mediante las


cuales podamos trazar un camino, desde la fuente hasta el destino, y sin tener en
cuenta cuántos otros nodos puedan estar entre ellos. Si los datos son asimétricos o
dirigidos, es posible que el actor A pueda alcanzar el actor B, pero que el actor B no
pueda alcanzar al actor A. Con lazos simétricos o recíprocos, por supuesto, cada par
de actores es accesible si uno de ellos está conectado con el otro. Si algunos actores
en una red no pueden alcanzar a otros, entonces existe una división potencial de la
red. O, podría indicar que la población que estamos estudiando está realmente
compuesta de más de una subpoblaciones separadas.

En los datos de intercambio de información de Knoke, se demuestra que todos los


actores son accesibles por todos. Esto es algo que se puede verificar a simple vista..
Observa si es posible encontrar un par de actores cualquiera en el diagrama de tal
forma que no sea posible trazar un camino desde el primero hasta el segundo
mediante flechas que apuntan siempre en la misma dirección (¡no pierdas tiempo con
esto porque no existe tal posibilidad!).

RECIPROCIDAD Y TRANSITIVIDAD

En algunos casos podría ser útil clasificar las relaciones diádicas de cada actor y la
para la red en general. Hemos hecho esto en la siguiente tabla:

12
Nodos Sin lazos Lazos entrantes Lazos salientes Lazos recíprocos Tamaño del vecindario

1COUN 2 3 0 4 (58%) 7

2COMM 1 1 0 7 (88%) 8

3EDUC 3 0 2 4 (67%) 6

4INDU 3 2 1 3 (50%) 6

5MAYR 1 0 0 8 (100%) 8

6WRO 6 0 2 1 (33%) 3

7NEWS 0 5 0 4 (44%) 9

8UWAY 3 0 4 2 (33%) 6

9WELF 3 2 1 3 (50%) 6

10WEST 4 0 3 2 (40%) 5

Whole Network 39 13 13 38 (75%) 51

El tamaño del vecindario para cada actor es el número de otros actores a los cuáles
son adyacentes. Cuando tabulamos los datos acerca de las adyacencias de los
actores como hemos hecho aquí, existe la tendencia a caracterizar los actores en
términos de la similaridad de sus perfiles de relaciones (hablaremos de esto más
adelante). Algunos de los actores son predominantemente “fuentes” (esto es, tienen
tendencia a enviar más que a recibir -- actores #3, #6, y #8). Algunos actores pueden
ser predominantemente “sumideros” (esto es, tienen tendencia a recibir más que a
enviar -- actores #1, #5). Otros actores pueden ser “transmisores” que tanto envían
como reciben, pero a diferentes actores. Seguramente más interesante es que los
actores difieren de forma bastante marcada en su implicación en relaciones mutuas o
recíprocas. Los actores #2 y #5 se diferencian especialmente por tener relaciones
“simétricas” o equilibradas con otros actores.

Para la red en su conjunto, notamos que una proporción considerable de las


relaciones son recíprocas. Tal estructura es una en la cual una gran cantidad de
inmediatas comunicaciones en los dos sentidos pueden ocurrir. Esto puede sugerir
una estructuración del campo de relaciones bastante poco jerárquica y un campo en el
cual existen muchas relaciones locales y particulares en ambas direcciones en lugar
de una estructura monolítica o establishment.

13
Es también útil examinar las conexiones en términos de relaciones triádicas. El
número de tríadas que existen con 10 actores es muy grande; y, con datos dirigidos,
cada una de las tríadas podría clasificarse en uno de los 64 tipos. Más comúnmente,
el interés se ha centrado en las tríadas transitivas. El principio de transitividad significa
que si A está enlazada a B y B está enlazada a C, entonces A tendría que estar
enlazada a C. La idea, como “equilibrio” y “reciprocidad” es que las relaciones triádicas
(cuando existen relaciones entre los actores) deberían tender hacia la transitividad o el
equilibrio. Una forma especial de esta idea se conoce como la “teoría del equilibrio”. La
teoría del equilibrio trabaja especialmente con relaciones de efecto positivo o negativo.
Se supone que si a A le gusta B y a B le gusta C, entonces a A le debería gustar C. O
también, si a A le gusta B y a B no le gusta C, entonces a A no le debería gustar C.

Para la red de información de Knoke, UCINET informa que el 20.3% de todas las
tríadas que podían ser transitivas (por ejemplo, aquéllas tríadas con tres o más lazos
conectando todos los actores) son transitivas. Esto no es un nivel especialmente alto,
y sugiere bien que la teoría hacia el equilibrio no ha podido darse en estos datos
(seguramente porque el sistema no ha funcionado demasiado tiempo), o que la teoría
no se aplica en este caso (más probablemente).

DISTANCIA

Las propiedades de la red que hemos examinado hasta el momento tienen que ver
principalmente con adyacencias –las relaciones directas de uno actor con el siguiente.
Pero la manera en la que la gente está inmersa en las redes es más compleja que
esto. Dos personas, llamémoslas A y B, pueden cada una tener cinco amigos. Pero
supongamos que ninguno de los amigos de A tiene amigos excepto A. En cambio,
cada uno de los cinco amigos de B tiene cinco amigos. La información disponible para
B y el potencial de B para influir es mucho más grande que el de A. Esto es, a veces
ser el “amigo de un amigo” puede tener bastantes consecuencias.

Para capturar este aspecto de cómo las personas están inmersas en las redes, una
aproximación importante consiste en examinar la distancia a la que está situado un
actor en relación a los demás. Si dos actores son adyacentes, la distancia entre ellos
es una (esto es, una señal necesita un paso para llegar desde el emisor hasta el
receptor). Si A habla con B, B habla con C (y A no habla con C), entonces los actores
A y C están a una distancia de dos. Cuántos actores están a diferentes distancias
unos de otros puede ser importante para entender las diferencias entre actores en las

14
limitaciones y oportunidades que tienen como resultado de su posición. A veces
estamos también interesados en de cuántas maneras se pueden conectar dos actores
con una distancia dada. Esto es, puede el actor A alcanzar al actor B en más de una
manera? A veces, conexiones múltiples pueden indicar una conexión más fuerte entre
dos actores que una sola relación.

Las distancias entre actores en una red puede ser una importante característica macro
de una red en su conjunto. Cuando las distancias son grandes, puede tomar un largo
período de tiempo a una información difundirse a través de una población. Puede ser
también que algunos actores sean bastante poco conscientes de este hecho y que
estén influenciados por otros –incluso si son técnicamente accesibles, el costo puede
ser demasiado alto para comportar intercambios. La variabilidad en las distancias que
tienen con otros actores puede constituir la base de la diferenciación e incluso de la
estratificación. Esos actores que están próximos a muchos otros pueden ser capaces
de ejercer más poder que aquellos que están más distantes. En el próximo capítulo
profundizaremos en este aspecto de la variabilidad en las distancias de los actores.

Por el momento, tenemos que aprender un poco de la jerga que es utilizada para
describir las distancias entre actores: paseos, caminos y semicaminos. Utilizando esas
definiciones básicas, podremos desarrollar algunas maneras más potentes de
describir varios aspectos entre los actores en una red.

PASEOS, ETC.

Para describir las distancias entre actores en una red con precisión, necesitamos algo
de terminología. Y, como puede imaginarse, no es lo mismo hablar de un grafo simple
o de un grafo conectado. Si A y B son adyacentes en un simple grafo, ellos tienen una
distancia de uno. En un grafo dirigido, sin embargo, A puede ser adyacente a B
mientras B no es adyacente a A – la distancia de A a B es uno, pero no hay distancia
de B a A. A causa de esta diferencia necesitamos términos ligeramente diferentes para
describir las distancias entre actores en grafos y dígrafos.

Grafos simples: La forma más general de conexión entre dos actores en un grafo se llama un
paseo. Un paseo es una secuencia de actores y relaciones que empiezan y terminan con
actores. Un paseo cerrado es uno en el cuál el principio y el punto final del camino son el
mismo actor. Los paseos no están restringidos. Un paseo puede implicar el mismo actor o la
misma relación múltiples veces. Un ciclo es un paseo especialmente restringido que se usa a
menudo para examinar los vecindarios (los puntos adyacentes) de los actores. Un ciclo es un
paseo cerrado de tres o más actores, todos los cuales son diferentes, excepto por lo que se
refiere al actor de origen-destino. La longitud de un paseo es simplemente el número de
relaciones contenidas en él. Por ejemplo, considera este grafo:

15
Hay muchos paseos en un grafo (de hecho, un número infinito si deseamos inclroducir paseos
de cualquier longitud – a pesar que, usualmente, restringimos nuestra atención a paseos de
pequeñas longitudes). Para ilustrar solo uno cuántos empecemos por el actor A y vayamos al
actor C. Hay un paseo de longitud 2 (A,B,C). Hay un paseo de longitud tres (A,B,D,C). Existen
algunos paseos de longitud 4 (A,B,E,D,C; A,B,D,B,C; A,B,E,B,C). A causa de que no están
restringidos, los mismo actores y relaciones pueden usarse más de una vez en un camino
dado. No hay ciclos que comiencen y acaben en A. Hay algunos que empiezan y acaban con el
actor B (B,D,C,B; B,E,D,B; B,C,D,E,B).
Normalmente es más útil restringir de alguna manera nuestra noción de lo que constituye una
conexión. Una posibilidad es restringir el cómputo de los paseos solamente a los paseos que
no rehúsan las relaciones. Un sendero entre dos actores es cualquier paseo que incluye una
relación dada solamente una vez (el resto de actores, sin embargo, pueden ser parte de un
sendero en múltiples ocasiones). La longitud de un sendero es el número de relaciones que
contiene. Si el sendero empieza y acaba con el mismo actor, se llama un sendero cerrado. En
nuestro ejemplo anterior, existen algunos senderos que van de A a C. Están excluidos trazados
como A,B,D,B,C (el cual es un paseo, pero no es un sendero porque la relación entre B y D se
usa más de una vez).
Seguramente, la definición más útil de una conexión entre dos actores (o entre un actor y él
mismo) es un camino. Un camino es un paseo en el cuál cada otro actor y cada otra relación
en el grafo puede usarse una sola vez. La única excepción la constituye un camino cerrado, el
cuál empieza y acaba con el mismo actor. Todos los caminos son senderos y paseos, pero
todos los paseos y senderos no son caminos. En nuestro ejemplo, hay un número limitado de
caminos conectando A y C: A,B,C; A,B,D,C; A,B,E,D,C.
Grafos dirigidos: Paseos, senderos y caminos también pueden definirse para los grafos
dirigidos. Pero existen dos modalidades de cada, dependiendo si queremos tomar en cuenta la
dirección o no. Semi-paseos, semi-senderos, y semi-caminos son los mismos que para los
datos no dirigidos. Definiendo esas distancias, la direccionalidad de las conexiones es
simplemente ignorada (esto es, flechas –o lazos dirigidos que son tratados como si fuesen
líneas – lazos no dirigidos). Como siempre, la longitud de esas distancias es el número de
relaciones en el paseo, sendero o camino. Si no queremos prestar atención a la direccionalidad
de las conexiones podemos definir paseos, senderos y caminos de la misma manera que
hicimos antes, pero con la restricción que no podemos “cambiar la dirección” a medida que nos
movemos a través de las relaciones de actor a actor. Considera un grafo dirigido:

16
En este dígrafo existe un número de paseos de A a C. Sin embargo, no existen paseos que
partan de C (o de cualquier otro) a A. Algunos de esos paseos de A a C son también senderos
(e.g. A,B,E,D,B,C). Hay, sin embargo, solo tres caminos de A a C. Un camino es de longitud 2
(A,B,C); uno es de longitud tres (A,B,D,C); uno es de longitud cuatro (A,B,E,D,C).
Las varias clases de conexiones (paseos, senderos, caminos) nos provee de diferentes
maneras de pensar acerca de las distancias entre actores. La principal razón por la que los
analistas de redes están preocupados con esas distancias es que proveen un camino para
pensar acerca de la fuerza de lazos o relaciones. Los actores que están conectados con
distancias cortas o de poca longitud pueden tener relaciones más fuertes; los actores que
están conectados muchas veces (por ejemplo teniendo muchos caminos en lugar de uno sólo)
pueden tener lazos más fuertes. Su conexión puede también estar menos sujeta a
interrupciones y, por lo tanto, ser más estable y fiable .
Observemos brevemente las distancias entre los pares de actores en los datos de Knoke sobre
flujos de información dirigida:
# paseos de longitud 1
1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 0 1 0 0 1 0 1 0 1 0
2 1 0 1 1 1 0 1 1 1 0
3 0 1 0 1 1 1 1 0 0 1
4 1 1 0 0 1 0 1 0 0 0
5 1 1 1 1 0 0 1 1 1 1
6 0 0 1 0 0 0 1 0 1 0
7 0 1 0 1 1 0 0 0 0 0
8 1 1 0 1 1 0 1 0 1 0
9 0 1 0 0 1 0 1 0 0 0
10 1 1 1 0 1 0 1 0 0 0

# paseos de longitud 2
1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 2 3 2 3 3 0 3 2 2 1
2 3 7 1 4 6 1 6 1 3 2
3 4 4 4 3 4 0 5 2 3 1
4 2 3 2 3 3 0 3 2 3 1
5 4 7 2 4 8 1 7 1 3 1
6 0 3 0 2 3 1 2 0 0 1
7 3 2 2 2 2 0 3 2 2 1
8 3 5 2 3 5 0 5 2 3 1
9 2 2 2 3 2 0 2 2 2 1
10 2 4 2 4 4 1 4 2 3 2

# paseos de longitud 3

1 2 3 4 5 6 7 8 9 10
-- -- -- -- -- -- -- -- -- --
1 12 18 7 13 18 2 18 6 10 5
2 20 26 16 21 27 1 28 13 18 7
3 14 26 9 19 26 4 25 8 14 8
4 12 19 7 13 19 2 19 6 10 5
5 21 30 17 25 29 2 31 15 21 10
6 9 8 8 8 8 0 10 6 7 3
7 9 17 5 11 17 2 16 4 9 4
8 16 24 11 19 24 2 24 10 15 7
9 10 16 5 10 16 2 16 4 8 4
10 16 23 11 16 23 2 24 8 13 6

Número total de paseos (longitudes 1, 2, 3)

1 2 3 4 5 6 7 8 9 10
-- -- -- -- -- -- -- -- -- --
1 14 21 9 16 21 2 21 8 12 6
2 23 33 17 25 33 2 34 14 21 9
3 18 30 13 22 30 4 30 10 17 9
4 14 22 9 16 22 2 22 8 13 6
5 25 37 19 29 37 3 38 16 24 11
6 9 11 8 10 11 1 12 6 7 4
7 12 19 7 13 19 2 19 6 11 5
8 19 29 13 22 29 2 29 12 18 8
9 12 18 7 13 18 2 18 6 10 5
10 18 27 13 20 27 3 28 10 16 8

17
El inventario del total de conexiones entre actores es útil principalmente para tener una idea de
cómo de “cerca” un par de actores está, y del grado de acoplamiento del sistema en su
conjunto. Aquí, podemos ver que usando solamente las conexiones de dos pasos (por ejemplo.
un “amigo de un amigo”), hay una gran cantidad de conexión de promedio en el grafo; nosotros
también vemos que hay grandes diferencias entre actores en su grado de conectividad y a
quién están conectados. Esas diferencias pueden ser usadas para comprender cuánta
información se mueve en la red, qué actores influirán probablemente a otros y un número
determinado de otras importantes propiedades.

DIÁMETRO Y DISTANCIA GEODÉSICA

Una definición determinada de la distancia entre actores en una red es usada por
muchos algoritmos para definir propiedades más complejas de las posiciones de los
individuos y de la estructura de la red en su conjunto. Esta cantidad es la distancia
geodésica. Tanto para datos dirigidos como no dirigidos, la distancia geodésica es el
número de relaciones en el caminos más corto posible de un actor a otro (o de un
actor a él mismo y, si somos cuidadosos, no deberíamos tenerla en cuenta).

La distancia geodésica es ampliamente usada en análisis de redes sociales. Pueden


haber muchas conexiones entre dos actores en una red. Si consideramos cómo la
relación entre dos actores puede proveer a cada otro con oportunidades y limitaciones,
puede darse el caso que no todos los lazos importen. Por ejemplo, supongamos que
estoy intentando enviar un mensaje a Sue. Dado que conozco su dirección de correo
electrónico, puedo enviarle un mensaje directamente (un camino de longitud 1). Yo
también conozco a Donna, y sé que Donna tiene el correo electrónico de Sue. Yo
podría enviar un mensaje para Sue a Donna, y pedirle que se lo reenviase. Éste sería
un camino de longitud 2. Delante de esta disyuntiva yo probablemente escogeré el
camino geodésico (esto es, el directo a Sue) a causa que da menos problemas y es
más rápido y también a que no depende de Donna. Por lo tanto, el camino geodésico
(o caminos, pues pueden haber más de uno) es a menudo el “óptimo” o “más eficiente”
entre dos actores. Muchos algoritmos en análisis de redes sociales asumen que los
actores usan los caminos geodésicos cuando existen alternativas.

Usando UCINET, podemos fácilmente localizar las longitudes de los caminos


geodésicos en nuestros datos dirigidos sobre intercambios de información.

18
Distancias geodésicas para intercambios de información
1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 0 1 2 2 1 3 1 2 1 2
2 1 0 1 1 1 2 1 1 1 2
3 2 1 0 1 1 1 1 2 2 1
4 1 1 2 0 1 3 1 2 2 2
5 1 1 1 1 0 2 1 1 1 1
6 3 2 1 2 2 0 1 3 1 2
7 2 1 2 1 1 3 0 2 2 2
8 1 1 2 1 1 3 1 0 1 2
9 2 1 2 2 1 3 1 2 0 2
10 1 1 1 2 1 2 1 2 2 0

Notas: A causa de que la red es densa, el camino geodésico es generalmente pequeño. Esto
sugiere que la información puede viajar bastante rápidamente en esta red. Obsérvese también
que hay una distancia geodésica para cada unos de los pares xy e yx -- esto es, el grafo está
plenamente conectado y los actores son “accesibles” por todos los otros (o lo que es lo mismo:
existe un camino de alguna longitud de cualquier actor a cualquier actor). Cuando una red no
está plenamente conectada, no podemos definir las distancias geodésicas entre los pares. la
aproximación estándar en estos casos es tratar la distancia geodésica entre actores
desconectados como la longitud mayor de todas las presentes en las distancias reales de los
datos. Para cada actor, calcularíamos la media y la desviación estándar de sus distancias
geodésicas para describir su grado de cercanía al resto de actores. Para cada actor, esa
distancia geodésica mayor se llama excentricidad – una medida de cómo de lejos un actor está
del más alejado.

A causa que la red está totalmente conectada, un mensaje que empieza en algún lugar
alcanzará eventualmente cualquier otro. A pesar que el programa no lo calcula, podría
calcularse la media (o mediana) de la distancia geodésica, y la desviación estándar de la
matriz, y para cada actor desde las filas y desde las columnas. Esto nos explicaría cómo de
lejos un actor está de otro y cómo de lejos y quién puede estar intentando influenciarlo. Esto
también nos explica qué actores tienen una conducta más predecible (en este caso, si han oido
algo o no) y menos predecible.

Mirando la red total, podemos ver que está conectada y que la distancia geodésica promedio
es bastante pequeña. Esto sugiere un sistema en el cual la información probablemente
alcanzará a cualquiera y que lo hará rápidamente. Para obtener otra noción del tamaño de una
red, podríamos pensar en su diámetro. El diámetro de una red es la distancia geodésica más
larga existente en la red (conectada). En este caso, ningún actor está situado a más de tres
pasos de cualquier otro – una red bastante "compacta". El diámetro de una red nos explica
cómo de “grande” ésta es en un sentido (esto es, cuántos pasos son necesarios para ir de un
sitio a otro). El diámetro es también una medida útil que puede servirnos para marcar el límite
superior de las longitudes de los caminos que estamos estudiando. Muchos investigadores
limitan sus exploraciones a las conexiones entre actores para incluir conexiones que no son
más largas que el diámetro de la red.

A veces la redundancia de la conexión es una importante característica de la estructura de una


red. Si hay muchos caminos eficientes conectando dos actores, las probabilidades que una
señal irá de un sitio a otro mejoran. Por supuesto, si dos actores son adyacentes, solamente
existiría este camino. A continuación pueden verse los pares entre los que hay más de un
camino geodésico:

19
# de caminos geodésicos en intercambios de información
1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 - - 2 3 - 2 - 2 - -
2 - - - - - - - - - 2
3 4 - - - - - - 2 3 -
4 - - 2 - - 2 - 2 3 -
5 - - - - - - - - - -
6 9 3 - 2 3 - - 6 - -
7 3 - 2 - - 2 - 2 2 -
8 - - 2 - - 2 - - - -
9 2 - 2 3 - 2 - 2 - -
10 - - - 4 - - - 2 3 -

Notas: Podemos ver que muchas de las conexiones geodésicas entre esos actores no son
solamente de corta distancia, pero que muchas veces hay múltiples caminos más cortos de x a
y. Esto sugiere un par de cosas: el flujo de información probablemente no se interrumpirá a
causa de los múltiples caminos; y será difícil para cualquier individuo ser un “intermediario”
poderoso en esta estructura a causa de que muchos actores tienen caminos alternativos
eficientes de conexión a otros actores que pueden obviar el paso por un actor determinado.

FLUJO, COHESIÓN E INFLUENCIA

El uso de caminos geodésicos para examinar las propiedades de las distancias entre
individuos y para la red total a menudo tiene mucho sentido. Pero hay muchos otros
casos en los que la distancia entre dos actores y la conectividad del grafo en su
conjunto se concibe mejor al implicar todas las relaciones – no sólo las más eficientes.
Si yo comienzo un rumor, pro ejemplo, éste pasará a través de la red por todos los
caminos disponibles – y no sólo por los más eficientes. El crédito que una persona de
a mi rumor puede depender de cuántas veces lo ha escuchado por diferentes lados – y
no los pronto que lo escucharon. Para usos de la distancia como éste necesitamos
tener en cuenta todas las conexiones entre actores.

Se han desarrollado algunas aproximaciones para contar la cantidad de conexiones


entre pares de actores que tengan en cuenta todas las conexiones entre ellos. Esas
medidas han sido usadas para diferentes propósitos y esas diferencias se reflejan en
los algoritmos usados para calcularlas. Examinemos esas tres ideas.

Flujo máximo: Una noción de cómo cuánto están dos actores totalmente conectados (llamada
flujo máximo por UCINET) pregunta cuantos actores diferentes en el vecindario de un emisor
llevan a caminos hacia el destinatario. Si necesito transmitirte un mensaje y sólo hay una
persona a la que pueda enviárselo para retransmitirlo, mi conexión es débil – incluso si la
persona a la que envío el mensaje tiene muchas maneras de alcanzarte. Si, por otro lado, hay
cuatro personas a las cuales yo puedo enviar mi mensaje, entonces mi conexión es más fuerte.
Este aproximación al “flujo” sugiere que la fuerza de mi lazo hacia ti no es más fuerte que el
lazo más débil en las cadenas de conexiones, donde debilidad significa carecer de alternativas.
Esta aproximación a la conexión entre actores está conectada con la noción de grado de
intermediación que examinaremos en el siguiente capítulo. También es lógicamente cercana a
la idea que el número de caminos, y no su longitud, puede ser importante para conectar gente.
Para nuestros datos diseccionados, los resultados del recuento de UCINET del flujo máximo se
muestran a continuación. Debería verificarse por uno mismo que, por ejemplo, hay cuatro

20
“cuellos de botella” en los flujos del actor 1 al actor 2, pero cinco de tales cuellos en el flujo del
actor 2 al actor 1.

Flujo máximo
1
1 2 3 4 5 6 7 8 9 0
COCOEDINMAWRNEUWWEWE
- - - - - - - - - -
1 COUN 0 4 3 4 4 1 4 2 4 2
2 COMM 5 0 3 5 7 1 7 2 5 2
3 EDUC 5 6 0 5 6 1 6 2 5 2
4 INDU 4 4 3 0 4 1 4 2 4 2
5 MAYR 5 8 3 5 0 1 8 2 5 2
6 WRO 3 3 3 3 3 0 3 2 3 2
7 NEWS 3 3 3 3 3 1 0 2 3 2
8 UWAY 5 6 3 5 6 1 6 0 5 2
9 WELF 3 3 3 3 3 1 3 2 0 2
10 WEST 5 5 3 5 5 1 5 2 5 0

SINGLE-LINK HIERARCHICAL CLUSTERING

U C E I M N C W W
W W O D N A E O E E
R A U U D Y W M L S
O Y N C U R S M F T

1
Level 6 8 1 3 4 5 7 2 9 0
----- - - - - - - - - - -
8 . . . . . XXXXX . .
5 . . XXXXXXXXXXXXX .
2 . XXXXXXXXXXXXXXXXX
1 XXXXXXXXXXXXXXXXXXX

Notas: Como casi cualquier otra medida de las relaciones entre pares de actores, puede ser
útil ver si podemos clasificar los actores siendo más o menos similares los unos a los otros en
términos del patrón de relaciones con el resto de actores. El análisis de clusters es una útil
técnica para encontrar grupos de actores que tienen relaciones similares con otros. Tendremos
mucho que decir sobre este tema en los últimos capítulos.
En el ejemplo actual, vemos que los actores #2, 5, y 7 son relativamente similares entre sí en
términos de la distancia máxima de flujo al resto de actores. Una rápida comprobación del
grafo revela porqué esto es así. Esos tres actores tienen diferentes maneras de acceder los
unos a los otros y al resto de actores en la red. En este sentido, son muy diferentes del actor 6,
el cuál puede depender de hasta tres otros actores para establecer la conexión.

Cohesión de Hubbell y Katz: La aproximación de flujo máximo se centra en la vulnerabilidad


o redundancia de la conexión entre pares de actores – un argumento del tipo "tan fuerte como
el lazo más débil”. Como aproximación alternativa, podríamos considerar la fuerza de todos los
lazos al definir la conexión. Si estamos interesados en cuánto dos actores puede influenciar
mutuamente, o compartir un sentido de posición común, el rango completo de sus conexiones
debería ser considerado.

Incluso si queremos incluir todas las conexiones entre dos actores, puede ser que en muchas
ocasiones no tenga ningún sentido considerar un camino de longitud 10 tan importante como
uno de longitud 1. La aproximación de Hubbelly Katz cuenta el total de conexiones entre los
actores (lazos para datos no dirigidos, lazos que envían y reciben para datos dirigidos). Cada
conexión, sin embargo, es ponderada en relación a su longitud. Cuanto más grande sea la
longitud, más débil será la conexión. Hasta qué punto la conexión se vuelve débil
incrementando la longitud depende de un factor de “atenuación”. En nuestro siguiente ejemplo
hemos usado una factor de atenuación de 0.5. Esto es, un punto adyacente recibe el peso de
1, un paseo de longitud 2 recibe un peso de 0.5, una conexión de longitud 3 recibe un peso de
0,25, etc. La aproximación de Hubbell y Katz es muy similar. Katz incluye una matriz identidad
(una conexión de un actor consigo mismo) como la conexión más fuerte; la aproximación de
Hubbell no lo hace. Calculadas por UCINET, ambas aproximaciones “normalizan” los
resultados desde grandes distancias negativas (esto, actores que están relativamente muy
cerca de otros pares o tienen una alta cohesión) a grandes números positivos (esto es, los
actores que tienen una gran distancia relativa al resto).

21
Method: HUBBELL

1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
------ ------ ------ ------ ------ ------ ------ ------ ------ ------
1 COUN -0.67 -0.67 2.00 -0.33 -0.67 2.00 0.33 -1.33 -1.33 1.33
2 COMM -0.92 -0.17 1.50 -0.08 -0.67 1.50 0.08 -0.83 -1.08 0.83
3 EDUC 5.83 3.33 -11.00 0.17 3.33 -11.00 -2.17 6.67 8.17 -7.67
4 INDU -1.50 -1.00 3.00 0.50 -1.00 3.00 0.50 -2.00 -2.50 2.00
5 MAYR 1.25 0.50 -2.50 -0.25 1.00 -2.50 -0.75 1.50 1.75 -1.50
6 WRO 3.83 2.33 -8.00 0.17 2.33 -7.00 -1.17 4.67 6.17 -5.67
7 NEWS -1.17 -0.67 2.00 0.17 -0.67 2.00 0.83 -1.33 -1.83 1.33
8 UWAY -3.83 -2.33 7.00 -0.17 -2.33 7.00 1.17 -3.67 -5.17 4.67
9 WELF -0.83 -0.33 1.00 -0.17 -0.33 1.00 0.17 -0.67 -0.17 0.67
10 WEST 4.33 2.33 -8.00 -0.33 2.33 -8.00 -1.67 4.67 5.67 -4.67
Method: KATZ
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
------ ------ ------ ------ ------ ------ ------ ------ ------ ------
1 COUN -1.67 -0.67 2.00 -0.33 -0.67 2.00 0.33 -1.33 -1.33 1.33
2 COMM -0.92 -1.17 1.50 -0.08 -0.67 1.50 0.08 -0.83 -1.08 0.83
3 EDUC 5.83 3.33 -12.00 0.17 3.33 -11.00 -2.17 6.67 8.17 -7.67
4 INDU -1.50 -1.00 3.00 -0.50 -1.00 3.00 0.50 -2.00 -2.50 2.00
5 MAYR 1.25 0.50 -2.50 -0.25 0.00 -2.50 -0.75 1.50 1.75 -1.50
6 WRO 3.83 2.33 -8.00 0.17 2.33 -8.00 -1.17 4.67 6.17 -5.67
7 NEWS -1.17 -0.67 2.00 0.17 -0.67 2.00 -0.17 -1.33 -1.83 1.33
8 UWAY -3.83 -2.33 7.00 -0.17 -2.33 7.00 1.17 -4.67 -5.17 4.67
9 WELF -0.83 -0.33 1.00 -0.17 -0.33 1.00 0.17 -0.67 -1.17 0.67
10 WEST 4.33 2.33 -8.00 -0.33 2.33 -8.00 -1.67 4.67 5.67 -5.67

Como todas las medidas de las propiedades de pares de actores se podría analizar la
información mucho más. Podríamos ver qué individuos son similares a qué otros (esto es, ¿a
qué grupos o estratos definidos por la similaridad del total de sus conexiones al resto de nodos
en la red pertenecen?). Nuestro interés podría también centrarse en la red total, dónde
podríamos examinar el grado de varianza y la forma de la distribución de las conexiones de las
díadas. Por ejemplo, una red en la cual todos los pares de actores estuviesen totalmente
conectados podría suponerse que se comportaría de manera muy diferente que una en la que
hubiesen diferencias radicales entre los actores.

La influencia de Taylor: La aproximación de Hubbell y Katz puede tener más sentido cuando
se aplica a datos simétricos, a causa de que no presta atención a las direcciones o a las
conexiones (por ejemplo, los lazos de A dirigidos a B son tan importantes como los de B
dirigidos a A a la hora de definir la distancia o solidaridad –cercanía—entre ellos). Si estamos
más específicamente interesados en la influencia de A sobre B en un grafo dirigido, la
aproximación a la influencia de Taylor propone una interesante alternativa.

La medida de Taylor, como las otras, usa todas las conexiones y aplica un factor de
atenuación. Más que estandarizar completamente la matriz resultante, sin embargo, se adopta
una aproximación diferente. Los marginales de las columnas para cada actor son sustraídos de
los marginales de las filas y el resultado es entonces normalizado. Traducido al español lo que
hacemos es mirar al equilibrio entre los actores que envían conexiones (marginales de filas) y
los actores que reciben conexiones (marginales de columnas). Los valores positivos reflejan
entonces una preponderancia en enviar sobre recibir de un actor de la pareja – o un equilibrio
de influencia entre los dos. Nótese que el periódico (#7) muestra disponer de influencia neta en
relación con la mayoría del resto de actores, mientras que la organización para la defensa de
los derechos al bienestar social (#6) tiene un balance negativo con la mayor parte de los otros
actores.
Method: TAYLOR

1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
----- ----- ----- ----- ----- ----- ----- ----- ----- -----
1 COUN 0.00 -0.02 0.23 -0.07 0.12 0.11 -0.09 -0.15 0.03 0.18
2 COMM 0.02 0.00 0.11 -0.06 0.07 0.05 -0.05 -0.09 0.05 0.09
3 EDUC -0.23 -0.11 0.00 0.17 -0.36 0.18 0.26 0.02 -0.44 -0.02
4 INDU 0.07 0.06 -0.17 0.00 0.05 -0.17 -0.02 0.11 0.14 -0.14
5 MAYR -0.12 -0.07 0.36 -0.05 0.00 0.30 0.01 -0.23 -0.13 0.23
6 WRO -0.11 -0.05 -0.18 0.17 -0.30 0.00 0.19 0.14 -0.32 -0.14
7 NEWS 0.09 0.05 -0.26 0.02 -0.01 -0.19 0.00 0.15 0.12 -0.18
8 UWAY 0.15 0.09 -0.02 -0.11 0.23 -0.14 -0.15 0.00 0.28 0.00
9 WELF -0.03 -0.05 0.44 -0.14 0.13 0.32 -0.12 -0.28 0.00 0.31
10 WEST -0.18 -0.09 0.02 0.14 -0.23 0.14 0.18 -0.00 -0.31 0.00

22
Como la muchas otras medidas las diferentes aproximaciones a la distancia entre actores y en
la red en su conjunto provee de un conjunto de alternativas. Ninguna definición para definir la
distancia será la “correcta” para una propósito determinado. A veces realmente no sabemos a
priori que aproximación puede ser la mejor y normalmente tenemos que ver cómo funcionan
algunas de ellas.

RESUMEN

Existe una gran cantidad de información los individuos y la población en una simple
matriz de adyacencia. En este capítulo has aprendido mucha terminología para
describir las conexiones y distancias entre actores y también para describir las
poblaciones completas. En un análisis de redes básico se suele focalizar en el
vecindario inmediato: las díadas y las tríadas en las cuales están inmersos. El grado
de un actor, y el grado nodal de entrada y de salida (si los datos son dirigidos) nos
explica hasta qué punto un actor puede estar limitado por o limitar a otros. Esta
conocimiento puede ser útil para describir la estructura de oportunidades de un actor.
Nosotros también hemos visto que es posible describir “tipos” de actores que pueden
formar grupos o estratos sobre la base de las posiciones que ocupan en la estructura
de oportunidades -- e.g. "aislados" "emisores" etc.

La mayor parte del tiempo y esfuerzo de los actores sociales se invierte en contextos
locales –interactuando en díadas y tríadas. Buscando todas las conexiones de los
actores, hemos sugerido que el grado de “reciprocidad”, “equilibrio” y “transitividad” en
las relaciones puede ser entendido como un importante indicador de estabilidad e
institucionalización (esto es, hasta qué punto las relaciones son dadas por supuestas y
están gobernadas por normas) de las posiciones de los actores en las redes sociales.

Las conexiones locales de los actores son importantes para comprender la conducta
social del conjunto de la población y también para entender cada individuo. El tamaño
de la red, su densidad, tanto si los actores son accesibles por otros (por ejemplo, está
la población conectada o existen múltiples componentes?), como si las relaciones
tienden a ser recíprocas o transitivas y todas las otras propiedades que hemos
examinado para las conexiones individuales también son significativas para describir
el conjunto de la población. Tanto los niveles típicos de características (e.g. el grado
nodal medio de los puntos) y la cantidad de diversidad en las características (e.g. la
varianza en el grado nodal de los puntos) puede ser importante en explicar la conducta
macro. Las poblaciones con alta densidad responden de forma diferente a los desafíos
que aquéllas que tienen una baja densidad; las poblaciones con una gran diversidad

23
en las densidades individuales pueden tender a desarrollar más diferenciación y
estratificación.

En este capítulo hemos examinado también algunas propiedades acerca del modo en
el que los individuos están inmersos en las redes y de éstas en su sentido más amplio
en lugar de los vecindarios locales de los actores. Una terminología especializada ha
sido introducida para describir las distancias entre pares de actores: paseos, senderos
y caminos. Hicimos notar que existen algunas diferencias importantes entre los datos
dirigidos y los no dirigidos al aplicar esas ideas de distancia.

Uno de los más aproximaciones más comunes e importantes a la indexación de las


distancias entre actores es el geodésico. El geodésico es útil para describir la distancia
mínima entre actores. Las distancias geodésicas entre pares de actores es la más
comúnmente usada medida de grado de cercanía. La distancia geodésica media de un
actor al resto, la variación en esas distancias y el número de distancias geodésicas al
resto de actores puede describir importantes similitudes y diferencias entre los actores
en cómo y cómo de cerca están conectados la población en su conjunto.

La distancia geodésica, sin embargo, examina sólo una simple conexión entre un par
de actores (o en algunos casos algunas si hay múltiples geodésicos conectándolos). A
veces la suma de todas las conexiones entre actores, más que la más corta conexión ,
puede ser relevante. Hemos examinado aproximaciones que miden la vulnerabilidad
de la conexión entre los actores (flujo), la solidaridad de los actores por parejas
(Hubbell y Katz), y la influencia potencial de unos actores en relación a otros (Taylor).
Otra vez, es importante recordar que las diferencias y las similitudes entre las
personas individuales en el sentido de su distancia a otros puede ser una base
estructural para la diferenciación y la estratificación. Y, como siempre, esos complejos
patrones de distancias de individuos en relación a otros constituye también una
característica de la población en su conjunto – también para describir las limitaciones y
oportunidades a las que se enfrentan los individuos. Por ejemplo, una población en la
cual la mayor parte de los actores tienen múltiples distancias geodésicas a otros se
comportará, muy probablemente, de manera bastante diferente de una en la cual hay
poca redundancia de eficientes vínculos de comunicación (piensa acerca de algunas
clases diferentes de organizaciones burocráticas – digamos un hospital clínico versus
una fábrica de coches).

Hemos visto que existe una gran cantidad de información disponible en una pocas
simples observaciones de una matriz de adyacencia. La vida, por supuesto, puede ser

24
más complicada. Podríamos disponer de múltiples capas o datos multiplexados;
podríamos datos que diesen información sobre al fortaleza de los vínculos más que su
simple presencia o ausencia. Sin embargo, los métodos que hemos usado aquí
proporcionan una buena introducción a lo que puede hacerse con datos más
complejos.

Ahora que ya disponemos de una buena aproximación a los conceptos básicos de


conexión y distancia, estamos listados par utilizar esas ideas en la construcción
algunos conceptos y métodos para describir algunos aspectos más complicados de las
estructuras de redes de las poblaciones. Volveremos sobre los dos conceptos más
importantes en los próximos capítulos. Primero examinaremos (Capítulo 6) el concepto
de centralidad y centralización, el cuales importante para entender el poder, la
estratificación, el rango y la desigualdad en las estructuras sociales. Entonces in el
capítulo 7 centraremos nuestra atención en examinar subestructuras mayores que las
díadas y las tríadas. Las poblaciones derivadas de las estructuras sociales están casi
siempre divididas y diferenciadas en cliques, facciones y grupos (los cuales pueden o
no estar jerarquizados). Construyendo sobre esas ideas, concluiremos nuestro
investigación introductoria de conceptos de redes (Capítulos 8-11) con atención a más
abstracta pero teóricamente más importante tarea de describir las posiciones en la red
y los roles sociales que son centrales en el análisis sociológico.

PREGUNTAS DE REPASO

1. Explica las diferencias entre los “tres niveles de análisis” de los grafos (individual,
agregados, completo).
2. ¿Cuál es el tamaño de una población? ¿Por que el tamaño de una población es
importante para el análisis sociológico?
3. Si disponemos de una red de 5 actores (y asumiendo que no existen lazos
reflexivos) ¿cuál es el número potencial de lazos dirigidos? ¿Cuál es el número
potencial de lazos no dirigidos?
4. ¿Cómo se mide la densidad? ¿Por qué la densidad es posible en el análisis
sociológico?
5. ¿Qué es el “grado de un punto”? ¿Por qué podría ser sociológicamente importante
que algunos actores tengan altos rangos nodales y otros los tengan bajos? ¿Cuál es la
diferencia entre “grado nodal de salida” y “grado nodal de entrada”?
6. Si el actor "A" es accesible por el actor "B" ¿no significa eso necesariamente que el
actor "B" es accesible por el "A?" ¿Por qué y por qué no?
7. Para pares de actores con relaciones dirigidas, existen cuatro posibles
configuraciones de lazos. ¿Cómo los podemos mostrar? ¿Qué configuraciones están
“equilibradas”? Para una tríada con relaciones no dirigidas ¿cuántas configuraciones
de lazos existen?¿Cuáles son equilibrados o transitivos?
8. ¿Cuáles son las diferencias entre paseos, senderos y caminos? ¿Por qué los
“caminos” son los usados más comúnmente para las distancias entre actores en el
análisis sociológico?

25
9. ¿Qué es una distancia “geodésica” entre dos actores? Muchas medidas de redes
sociales asumen que el camino geodésico es el más importante entre actores – por
qué es plausible esta asunción?
10. Tenemos dos poblaciones de 10 actores cada una, una tiene un diámetro de 3 y la
otra un diámetro de 6. ¿Puedes explicar la afirmación a alguien que no sepa nada de
análisis de redes?¿ Puedes explicar por qué la diferencia en diámetro puede ser
importante para entender las diferencias entre las dos poblaciones?
11. ¿Cómo las aproximaciones de “flujos ponderados” al estudio de la distancia social
difieren de las aproximaciones “geodésicas”?
12. ¿Por qué podría ser importante que dos actores tuviesen más de un geodésico u
otro camino entre ellos?

APLICACIONES

1. Piensa en las lecturas de la primera parte del curso. ¿Qué estudios usan las ideas
de conectividad y densidad? ¿Qué estudios usan las ideas de distancia? ¿Qué
aproximaciones específicas usan esos conceptos?
2. Dibuja los grafos de una “estrella”, un “círculo”, una “línea” y una “jerarquía”.
Describe el tamaño, potencial y densidad de cada grafo. Examina los grados nodales
de los puntos en cada grafo –existen diferencias entre los actores? ¿Esas diferencias
nos explican algo acerca de los “roles sociales”de los actores? Crea una matriz para
cada grafo que muestre las distancias geodésicas entre cada par de actores.¿Hay
diferencias entre los grafos en el modo en el que están conectados por múltiples
distancias geodésicas?
3. Piensa acerca de un pequeño grupo de gente que conozcas bien (posiblemente tu
familia, vecinos, un grupo de estudio, etc.). ¿Quién ayuda a quién en este grupo?
¿Cuál es la densidad de los lazos? ¿Son los lazos recíprocos? ¿Son las tríadas
transitivas?
4. Chrysler Corporation te ha contratado como consultor. Su división de investigación
está tardando mucho en diseñar nuevos modelos de coches y a menudo el trabajo de
los “creativos” no casa muy bien con el trabajo de los “ingenieros de producción” (La
gente que de hecho acaba construyendo el coche). La División de investigación de
Chrysler está organizada como una burocracia clásica con dos ramas (creativos y
producción) coordinada a través de un grupo de directivos y una jefe de División.
Analiza las razones por las cuales los resultados son pobres. Sugiere algunas
maneras alternativas de organizar que podrían mejorar el rendimiento y explica por
qué ayudarían.

26
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES

CAPÍTULO SEXTO: CENTRALIDAD Y PODER

Robert A. Hanneman. Departmento de Sociología de la


Universidad de California Riverside
NOTA PREVIA

Este documento está traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
<http://wizard.ucr.edu/~rhannema/networks/text/textindex.html> [Fecha de consulta:
Diciembre de 2001].

La traducción se ha realizado por bloques. En este documento se presenta el sexto


capítulo, traducido por Lissette Aliaga [unmsm_lissette@yahoo.com.mx] y revisado por
José Luis Molina [joseluis.molina@uab.es].

NP

2
ÍNDICE

CAPÍTULO VI. CENTRALIDAD Y PODER ....................................................................... 4

INTRODUCCIÓN: CENTRALIDAD Y PODER ............................................................. 4

LAS DIFERENTES CARAS DEL PODER ................................................................... 5

CENTRALIDAD DE GRADOS...................................................................................... 8

CENTRALIDAD DE CERCANÍA ................................................................................. 11

CENTRALIDAD DE GRADO DE INTERMEDIACIÓN ................................................ 13

EIGENVECTOR DE DISTANCIAS GEODÉSICAS .................................................... 15

CENTRALIDAD DE FLUJO ........................................................................................ 18

EL ÍNDICE DE PODER BONACICH .......................................................................... 20

RESUMEN DEL CAPÍTULO 6 .................................................................................... 24

3
CAPÍTULO VI. CENTRALIDAD Y PODER

INTRODUCCIÓN: CENTRALIDAD Y PODER

Todos los sociólogos concordarían en que el poder es una propiedad fundamental de


las estructuras sociales. Habría menos acuerdo sobre qué es el poder, y cómo
podemos describirlo y analizar sus causas y consecuencias. En este capítulo
veremos algunas de las principales aproximaciones que el análisis de redes sociales
ha desarrollado para estudiar el poder y un concepto íntimamente relacionado como es
la centralidad.

La perspectiva de redes ha contribuido en gran parte a la comprensión del poder social.


Quizá aún más importante, la aproximación a las redes sociales enfatiza que el poder
es inherentemente relacional. Un individuo no tiene poder en abstracto, se tiene poder
porque se puede dominar a otros – el poder de ego es la dependencia del alter y
viceversa. Debido a que el poder es una consecuencia de los patrones de relación, la
cantidad de poder en las estructuras sociales puede variar. Si un sistema está muy
débilmente acoplado (baja densidad) poco poder puede ser ejercido; en sistemas de
alta densidad existe el potencial para mayor poder. El poder es una propiedad
sistémica (macro) y relacional (micro). La cantidad de poder en un sistema y su
distribución a través de los actores están relacionados pero no son lo mismo. Dos
sistemas pueden tener la misma cantidad de poder, pero éste puede estar
igualitariamente distribuido en uno y desigualmente distribuido en otro. El poder en las
redes sociales podría ser visto tanto como una propiedad micro (i.e. éste describe las
relaciones entre actores) o como una propiedad macro (i.e. éste describe la población
entera). Por tanto, como pasa en otros conceptos sociológicos claves, lo macro y lo
micro están íntimamente conectados en la perspectiva de redes sociales.

Los analistas de redes a menudo describen la manera en a


l que un actor está
insertado en una red relacional en la medida que se le imponen restricciones y se le
ofrecen oportunidades. Los actores que se enfrentan a menos restricciones y tienen
más oportunidades que otros, están en posiciones estructurales favorables. Tener una
posición favorable significa que un actor puede extraer mejores ofertas en los
intercambios y que será un foco para la deferencia y atención por parte de aquéllos en
posiciones menos favorables. Pero ¿a qué nos referimos con ‘tener una posición
favorable’ y ‘tener más oportunidades’ y ‘menos restricciones’? No existe una sola

4
respuesta correcta y definitiva para estas difíciles preguntas. Sin embargo, el análisis
de redes ha hecho importantes contribuciones en proveer definiciones precisas y
mediciones concretas de las diferentes aproximaciones a la noción de poder que se
atribuye a las posiciones en estructuras de relaciones sociales.

LAS DIFERENTES CARAS DEL PODER

Para entender las aproximaciones que el análisis de redes usa para estudiar el poder,
es útil pensar primero sobre algunos sistemas muy simples. Considera estas tres
redes, las cuales son denominadas ‘estrella’, ‘línea’ y ‘círculo’.

A primera vista, se puede sugerir que el actor A tiene una posición estructural
altamente favorable en la red estrella, si la red está describiendo una relación como un
intercambio o distribución de recursos. Pero, ¿exactamente por qué está este actor A
en una ‘mejor’ posición que el resto de nodos de la red estrella? ¿qué hay que decir
sobre la posición de A en la red línea? ¿estar en el final de la línea es una ventaja o una
desventaja? ¿Están todos los actores en la red círculo exactamente en la misma
posición estructural? Necesitamos pensar sobre por qué la ubicación estructural puede
ser ventajosa o desventajosa para los actores. Concentrémonos en el porqué el actor
A está tan obviamente en una posición ventajosa en la red estrella.

5
Grado: En primer lugar, el actor A tiene más oportunidades y alternativas que los otros
actores. Si el actor D eligiera no proveer a A con algún recurso, A tiene un número de
otros lugares dónde ir para conseguirlo; sin embargo, si D eligiera no intercambiar con
A, D no estaría en capacidad de realizar ningún intercambio. Cuantos más vínculos
tenga A, más poder podrá tener. En la red estrella, el actor A tiene grado seis, todos
los demás actores tienen grado uno. De esta lógica se desprenden las medidas de
centralidad y poder basadas en el grado del actor, lo cual discutiremos a continuación.
Los actores que tienen más vínculos tienen mayores oportunidades porque tienen más
opciones. Esta autonomía los hace menos dependientes ante cualquier otro actor
específico y por lo tanto más poderosos.

Ahora, consideremos la red círculo en términos de grado. Cada actor tiene


exactamente el mismo número de compañeros alternativos para hacer negocios (o
grado), entonces todas las posiciones son igualmente ventajosas. En la red línea, el
asunto es un poco más complejo. Los actores al final de la línea (A y G) están en
realidad en una desventaja estructural, pero todos los demás son aparentemente
iguales (en realidad, no es tan simple). Generalmente, aún cuando, los actores que
son más centrales en la estructura, en el sentido de tener mayor grado o más
conexiones, tienden a tener posiciones favorables y por lo tanto mayor poder.

Cercanía: La segunda razón de por qué el actor A es más poderoso que los otros
actores en la red estrella es que el actor A está más cerca del resto de actores que
cualquier otro. El poder puede ser ejercido por el trato e intercambio directo. Pero el
poder también proviene de actuar como un ‘punto de referencia’ por el cual otros
actores se juzgan a sí mismos y por ser un centro de atención cuyos puntos de vista
son escuchados por un gran número de actores. Los actores que son capaces de
alcanzar a otros en longitudes de caminos más cortas, o quienes son más accesibles
por otros actores en longitudes de caminos más cortos, tienen posiciones favorables.
Esta ventaja estructural puede ser traducida en poder. En la red estrella, el actor A
está a distancia geodésica de uno de todos los otros actores, mientras cada uno de los
otros actores está a distancia geodésica de dos de los otros actores (excepto A).
Desde esta lógica de ventaja estructural se desprenden aproximaciones que enfatizan
la distribución de la cercanía y distancia como un recurso de poder.

Consideremos ahora la red círculo en términos de la cercanía del actor. Cada actor se
sitúa en longitudes de camino diferentes desde los otros actores, pero todos los
actores tienen distribuciones idénticas de cercanía y de nuevo parecerían ser iguales

6
en términos de posiciones estructurales. En la red línea, el actor de en medio (D) está
más cercano a todos los otros actores que lo que están en el grupo C, E; grupo B, F y
el grupo A, G. De nuevo, los actores al final de la línea, o en la periferia, están en
desventaja.

Grado de Intermediación: La tercera razón que hace que el actor A esté en ventaja
en la red estrella es porque el actor A está situado entre cada otro par de actores y no
existe ningún otro actor entre A y el resto de actores. Si A quiere contactar con F, A lo
hará directamente. Si F quiere contactar con B, tiene que hacerlo por medio de A.
Esto da al actor A la capacidad de negociar contactos entre los actores – para extraer
‘tarifas de servicios’ y aislar actores o prevenir contactos. El tercer aspecto de una
posición estructural ventajosa por lo tanto es encontrarse entre otros actores.

En la red círculo, cada actor está situado entre cada otro par de actores. Realmente,
existe dos caminos conectando cada par de actores, y cada tercer actor está situado
en uno, pero no en otro de ellos. De nuevo, todos los actores están igualmente en
ventaja o desventaja. En la red línea, nuestros puntos finales (A,G) no están situados
entre cualquier par y no tienen ningún poder negociador. Los actores más cercanos al
centro de la cadena aparecen en más caminos entre pares y están nuevamente en una
posición ventajosa.

Cada una de estas ideas (grado, cercanía y grado de intermediación) ha sido


implementada de varias formas. Examinaremos brevemente tres implementaciones
aquí. El enfoque eigenvector de geodésicos construye la noción de cercanía/distancia.
El enfoque de flujo (que es similar al enfoque de flujo discutido en el capítulo anterior)
modificó la idea de grado de intermediación. La medida de poder Bonacich es una
importante y ampliamente usada generalización del enfoque al poder basado en
grados. En el capítulo previo discutimos varios enfoques a la distancia que habla de la
influencia de puntos entre ellos (Hibbell, Katz, Taylor). Estos enfoques, que no
discutiremos de nuevo ahora, pueden ser vistos como generalizaciones de la lógica de
cercanía que mide el poder de los actores.

Los analistas de redes más probablemente describirían sus enfoques como


descripciones de centralidad que de poder. Cada uno de los 3 enfoques (grado,
cercanía e intermediación) describen la ubicación de individuos en términos de cuán
cerca están del ‘centro’ de la acción en la red. Aunque la definición de lo que significa
estar al centro difiere, es más acertado describir enfoques a redes de esta forma –

7
medidas de centralidad- que medidas de poder. Pero, como hemos sugerido aquí, hay
varias razones por las cuales las posiciones centrales son posiciones poderosas.

CENTRALIDAD DE GRADO

Los actores que tienen mayores vínculos con otros actores puede que tengan
posiciones ventajosas. Debido a que tienen muchos vínculos, pueden tener formas
alternativas de satisfacer necesidades y por tanto son menos dependientes de otros
individuos. Además, dado que disponen de muchos vínculos, pueden tener acceso y
pueden conseguir más del conjunto de los recursos de la red. El hecho de tener más
vínculos les posibilita a menudo ser terceros y permitir intercambios entre otros,
pudiéndose beneficiar de esa posición. Así que una muy simple, pero a menudo
efectiva, medida de centralidad de un actor y de su poder potencial es su grado.

Con datos de relaciones recíprocas los actores difieren entre ellos sólo en cuantas
conexiones tienen. Con datos de relaciones orientadas puede ser importante distinguir
la centralidad basada en grados de entrada de la centralidad basada en grados de
salida. Si un actor recibe muchos vínculos a menudo se dice que es prominente o de
prestigio, o sea muchos otros actores buscan entablar vínculos con él, y esto puede
indicar su importancia. Los actores que inusualmente tienen un alto grado de salida
son actores que son capaces de intercambiar con muchos otros, o hacer a muchos
otros conscientes de sus punto de vista. Los actores que muestran alta centralidad de
grados de salida se dice que son actores influyentes.

Recordemos los datos sobre intercambio de información entre organizaciones


operando en el campo del bienestar social (Knoke) que hemos estado examinando.

8
Examinaremos los grados de entrada y de salida de los puntos como medida de quién
es ‘central’ o ‘influyente’ en esta red. UCINET ha sido usado para el recuento y otros
cálculos adicionales a partir de las sugerencias de Linton Freeman.

MEDIDAS DE CENTRALIDAD DE GRADO DE FREEMAN

1 2 3 4
Grado de salida Grado de Entrada Número de Grado de Número de Grado
Salida de Entrada

1 COUN 4.00 5.00 44.44 55.56


2 COMM 7.00 8.00 77.78 88.89
3 EDUC 6.00 4.00 66.67 44.44
4 INDU 4.00 5.00 44.44 55.56
5 MAYR 8.00 8.00 88.89 88.89
6 WRO 3.00 1.00 33.33 11.11
7 NEWS 3.00 9.00 33.33 100.00
8 UWAY 6.00 2.00 66.67 22.22
9 WELF 3.00 5.00 33.33 55.56
10 WEST 5.00 2.00 55.56 22.22

ESTADÍSTICAS DESCRIPTIVAS

1 2 3 4
Grado de Grado de Entrada Número de Grado Número de Grado
salida de Salida de Entrada

Promedio 4.90 4.90 54.44 54.44


Desviación
Estándar
1.70 2.62 18.89 29.17
Varianza 2.89 6.89 356.79 850.62
Mínimo 3.00 1.00 33.33 11.11
Máximo 8.00 9.00 88.89 100.00

Centralización de red (grado de salida): 43.056%

Centralización de red (grado de entrada): 56.944%

Notas: Los actores #5 y #2 tienen mayor grado de salida, y pueden ser considerados
los más influyentes (aunque puedan importar a quienes mandan información, esta
medida no toma eso en cuenta). Los actores # 5 y # 2 se unen a # 7 (NEWS) cuando
examinamos los grados de entrada. Que otras organizaciones compartan información
con estos tres indicaría un deseo por parte de ellas de intentar tener influencia. Este
intento de influenciar puede ser interpretado como un acto de deferencia, o

9
reconocimiento de que las posiciones de los actores 5, 2 y 7 podrían ser valiosas. Si
nos interesara comparar redes de distinto tamaño o densidad sería útil ‘estandarizar’ la
medida de entrada y salida. En las dos últimas columnas de la primera tabla de
resultados de arriba, todos los recuentos de grados han sido expresados como
porcentajes del más grande recuento de datos en el grupo. (i.e. el # 7 tiene grado de
salida 9)

Los resultados de la tabla siguiente a la anterior tratan del nivel ‘meso’ de análisis. Esto
es, cómo se observa el grado de distribución del grado de centralidad. En promedio,
los actores tienen grados de 4.9, que es bastante alto, dado que hay sólo nueve
actores más. Vemos que el rango de los grados de entrada ligeramente más alto
(mínimo y máximo) que el grado de salida, y que hay más variabilidad a través de
actores en grado de entrada que en grado de salida (desviaciones y variaciones
estándar). El rango y grados de variabilidad ( y otras propiedades de redes) pueden
ser bastante importantes, porque describen si la población es homogénea o
heterogénea en lo que a posiciones estructurales se refiere. Uno puede examinar si la
variabilidad es alta o baja con relación a las puntuaciones clásicas calculando el
coeficiente de variación, (desviación estándar dividida por el promedio, por 100) para el
grado de entrada y de salida. Para las reglas usadas a menudo para evaluar
coeficientes de variación, los valores actuales (35 para el grado de salida y 53 para el
grado de entrada) son moderados. Claramente, sin embargo, la población es más
homogénea con relación al grado de salida (influencia) que el grado de entrada
(prominencia).

La última pieza de información dada por el informe de arriba son los “medidas de
centralización de grafo de Freeman” que describe a la población como un todo --el nivel
macro. Estos son estadísticas muy útiles, pero requieren de un poco de explicación.

Recuerda la red estrella de la discusión anterior (revísala si no es así). La red estrella


es la más centralizada o la más desigual posible para un cualquier número de actores.
En la red estrella, todos los actores menos uno tienes el grado de uno, y la ‘estrella’
tiene grado del número de actores menos uno. Freeman pensó que sería útil expresar
el grado de variabilidad en los grados de los actores en nuestra red observada como un
porcentaje del de la red estrella del mismo tamaño. Es así como las medidas del
gráfico de centralización de Freeman pueden ser entendidas: expresan el grado de
desigualdad o variación en nuestra red como un porcentaje de una red estrella perfecta
del mismo tamaño. En el caso actual, el gráfico de centralización, de grado de salida,

10
es de 43% y el gráfico de grado de entrada es de 57%. Llegaríamos a la conclusión
que hay una cantidad sustancial de concentración o centralización en toda la red. Es
decir, el poder de los actores individuales varía substancialmente y esto significa que
en total, las ventajas posicionales se distribuyen de forma desigual en esta red.

Ahora que entendemos estas ideas básicas, podemos ser más breves al ver otros
enfoques de la centralidad y el poder.

CENTRALIDAD DE CERCANÍA

Las medidas de grados de centralidad pueden ser criticadas porque sólo toman en
cuenta los vínculos inmediatos que tiene el actor, en lugar de los vínculos indirectos
con todos los demás. Un actor puede estar vinculado con muchos otros, pero esos
otros pueden estar un tanto desconectados del conjunto de la red. En un caso como
éste, el actor puede ser bastante central, pero sólo en una área local.

Los enfoques a la centralidad por cercanía enfatizan la distancia de un actor a otros en


la red al concentrarse en la distancia geodésica de cada actor con todos los demás.
Uno puede considerar las distancias geodésicas entre actores tanto directos como
indirectos. Siguiendo con el mismo ejemplo, hemos decidido observar vínculos
indirectos. La suma de estas distancias geodésicas para cada actor es la lejanía del
actor al resto. Podemos convertir ésta en una medida de cercanía o centralidad de
cercanía al tomar la inversa (esto es, uno dividido por la lejanía) y normalizarla con
relación al actor más central. Aquí están los resultados de UCINET para nuestros
datos de intercambio de información.

Lejanía Cercanía

1 11.00 81.82
2 10.00 90.00
3 12.00 75.00
4 12.00 75.00
5 10.00 90.00
6 15.00 60.00
7 9.00 100.00
8 12.00 75.00
9 12.00 75.00
10 13.00 69.23

11
Lejanía Cercanía

Promedio 11.60 79.10


Desviación Est. 1.62 11.01
Suma 116.00 791.05
Varianza 2.64 121.13
Mínimo 9.00 60.00
Máximo 15.00 100.00

Centralización de red: 49.34%

Podemos ver que el actor # 7 es el más cercano o central de los actores usando este
método, porque la suma de las distancia geodésica de # 7 con otros actores (un total
de 9, a través de 9 actores) es la menor (es más, es la suma mínima de distancias
geodésicas). Dos actores más (# 2 y # 5) son más cercanos. WRO (# 6) tiene la
mayor lejanía. En una red pequeña con alta densidad, no sorprende que la centralidad
basada en la distancia es muy similar a la centralidad basada en adyacentes (dado que
muchas distancias geodésicas en esta red son adyacentes). En redes más grandes o
menos densas, los dos enfoques pueden dar imágenes distintas de quiénes son los
actores centrales.

La centralidad basada en la distancia puede también ser usada para caracterizar la


centralización del gráfico entero. Es decir, ¿cuán desigual es la distribución de la
centralidad a lo largo de una población?. Otra vez, una manera útil de hacer un índice
de esta propiedad de todo el gráfico es comparar la varianza en los datos actuales con
la varianza de la red estrella del mismo tamaño. Otra vez, la red estrella es aquella
dónde la distribución de lejanía entre actores muestra la máxima posible concentración
(con un actor estando máximamente cerca de distantes entre ellos). El índice de
centralidad basado en la cercanía muestra un más modesto pero aun substancial
grado de concentración en toda la red.

12
CENTRALIDAD DE GRADO DE INTERMEDIACIÓN

Supongamos que quiera influenciarte mandándote información o hacer un trato para


intercambiar algunos recursos, pero que para hablar contigo tenga que pasar por un
intermediario. Por ejemplo, supongamos que quiera convencer al Rector de mi
Universidad para que compre un nuevo ordenador. De acuerdo con las reglas de
nuestra jerarquía burocrática, tendría que mandar mi pedido a través del Consejo de mi
Departamento, un Decano, y el vicerrector ejecutivo. Cada una de estas personas
podría demorar mi pedido, o evitar que mi pedido pase. Esto le da a la gente situada
‘entre’ yo y el Rector poder con respecto a mí. Para estirar el ejemplo un poco más
supongamos que también tengo un trabajo en una Escuela de Negocios al mismo
tiempo que en el Departamento de Sociología. En este caso yo podría mandar mi
pedido por ambos caminos. Tener más de un camino me hace menos dependiente y
en cierto sentido más poderoso.

La centralidad del grado de intermediación ve al actor con una posición favorable en la


medida que el actor está situado entre los caminos geodésicos entre otros pares de
actores en la red. Es decir, a más gente que dependa de mi para hacer conexiones
con otra gente, más poder tendré yo. Si, sin embargo, dos actores están conectados
por más de un camino geodésico y yo no estoy en todos, pierdo poder. Usando el
ordenador es fácil localizar caminos geodésicos entre todos lo pares de actores y
contar cuán frecuentemente cada actor aparece en cada camino. Y si agregamos,
para cada actor, la proporción de veces que están ‘entre’ otros actores para mandar la
información en los datos de Knoke, obtendremos una medida de la centralidad del
actor. Podemos normalizar esta medida expresándola como un porcentaje del grado
máximo posible de intermediación que un actor pueda tener. Los resultados de
UCINET son:

13
Intermediación Intermediación
Normalizada

1 0.67 0.93
2 12.33 17.13
3 11.69 16.24
4 0.81 1.12
5 17.83 24.77
6 0.33 0.46
7 2.75 3.82
8 0.00 0.00
9 1.22 1.70
10 0.36 0.50

Intermediación Intermediación
Normalizada

Promedio 4.80 6.67


Desviación Est. 6.22 8.64
Suma 48.00 66.67
Varianza 38.69 74.63
Mínimo 0.00 0.00
Máximo 17.83 24.77

Centralización de red = 20.11%

Notas: Vemos que hay mucha variación en la intermediación del actor (desde 0 hasta
17.83), y que hay bastante variación (desviación estándar = 6.2 con relación al
promedio de intermediación de 4.8). A pesar de esto la centralidad de toda la red es
relativamente baja. Esto tiene sentido porque sabemos que por completo un medio de
todas las conexiones puede ser hecha en esta red sin la ayuda de ningún intermediario
por tanto no puede haber mucha intermediación. Tomando en cuenta la restricción
estructural, no hay mucho poder en esta red. Los actores # 2, # 3 y # 5 parecen ser
relativamente un poco más poderosos que otros de acuerdo a estas medidas.
Claramente, hay base estructural para que estos actores perciban que son ‘distintos’
de los otros en la población. Es más, no sería sorprendente que estos actores se
vieran a sí mismos como los negociantes que mueven y hacen que sucedan las
cosas. En este sentido, aunque no hay mucho poder de intermediación en el sistema,
éste podría ser importante para la formación y estratificación del grupo.

14
Cada uno de estos enfoques básicos a la centralidad y poder (grado, cercanía e
intermediación) pueden y han sido elaborados para obtener información adicional de
los grafos. Revisando algunas de estas elaboraciones podemos sugerir otras formas
de relación del poder y la posición en las redes sociales.

EIGENVECTOR DE DISTANCIAS GEODÉSICAS

La medida de centralidad de cercanía descrita líneas arriba se basa en la suma de


distancias geodésicas de cada actor al resto (lejanía). En redes más grandes y
complejas que los ejemplos que hemos considerado es posible que esta medida
desoriente en cierta forma. Considera dos actores, A y B. El actor A es cercano a un
grupo pequeño y cerrado dentro de un red más grande, y bastante distante de muchos
miembros de la población. El actor B está a moderada distancia de todos los actores
de la población. La medición de lejanía para A y B podría ser bastante similar en
magnitud. En cierto sentido, sin embargo, el actor B es realmente más central que A
en este ejemplo, porque B puede alcanzar más nodos de la red con el mismo
esfuerzo.

El enfoque eigenvector es un intento de encontrar a los actores más centrales (i.e.


aquéllos con menor lejanía que otros) en términos de estructura ‘global’ o ‘general’ y
prestar menos atención a patrones más locales. El método usado (análisis de
factores) va más allá del alcance de este texto. En general, lo que el análisis de
factores hace es identificar ‘dimensiones’ de la distancia entre actores. La ubicación
de cada actor con relación a cada dimensión se llama ‘valor eigen’ y la colección de
tres valores se llama ‘eigen vector’. Usualmente, la primera dimensión captura los
aspectos ‘globales’ de distancias entre actores; las segundas y futuras dimensiones
capturan más subestructuras específicas.

Para ilustrar esto hemos usado UCINET para calcular los ‘eigenvectores’ de la matriz
de distancia para información de los datos sobre intercambio de información de Knoke.
En este ejemplo, hemos medido la distancia entre dos actores como la más larga de
las distancias geodésicas dirigida entre ellas. Si nos interesara más la información de
las relaciones de intercambio que simplemente las fuentes o receptores de información
sería bueno tomar este enfoque - porque nos dice que para estar cerca, un par de

15
actores deben tener distancias cortas entre ellos en ambas direcciones. Aquí está el
resulado:

CENTRALIDAD DE BONACICH

ATENCIÓN: ESTA VERSIÓN DEL PROGRAMA NO PUEDE MANEJAR DATOS ASIMÉTRICOS. LA


MATRIZ HA SIDO SIMETRIZADA TOMANDO LA LONGITUD DE xij Y xji.

VALORES EIGEN

FACTOR VALOR PORCENTAJE ACUMULATIVO% RATIO

1 6.766 74.3 74.3 5.595


2 1.209 13.3 87.6 1.282
3 0.944 10.4 97.9 5.037
4 0.187 2.1 100.0

9.106 100.0

MEDIDAS CENTRALIDAD DEL VECTOR EIGEN BONACICH

1 2
vector eigen vector eigen
Normalizado

1 COUN 0.343 48.516


2 COMM 0.379 53.538
3 EDUC 0.276 38.999
4 INDU 0.308 43.522
5 MAYR 0.379 53.538
6 WRO 0.142 20.079
7 NEWS 0.397 56.124
8 UWAY 0.309 43.744
9 WELF 0.288 40.726
10 WEST 0.262 37.057

16
ESTADÍSTICAS DESCRIPTIVAS

1 2
Vector Eigen Vector Eigen
Normalizado

1 Promedio 0.31 43.58


2 Desviación Est. 0.07 10.02
3 Suma 3.08 435.84
4 Varianza 0.01 100.41
5 Euc Norm 1.00 141.42
6 Mínimo 0.14 20.08
7 Máximo 0.40 56.12
8 N° de obs. 10.00 10.00

Índice de Centralización de la red = 20.90%

El primer grupo de estadísticas nos dice cuánto del patrón general de distancias entre
actores puede ser visto como reflejando el patrón global (el primer valor eigen), y más
localmente, los patrones adicionales. Estamos interesados en los porcentajes de la
variación general en las distancias que se toman en cuenta por el primer factor. Aquí
este porcentaje es 74.3% esto significa que casi ¾ de todos las distancias entre
actores son reflejo de las principales dimensiones del patrón. Si esta cantidad no es
grande (digamos más del 70%), se debe tener cuidado al usarlo para interpretar
resultados futuros, porque el patrón dominante no está haciendo un buen trabajo
describiendo los datos. El primer valor eigen debe ser considerablemente mayor que
el segundo (aquí, el radio entre el primer valor eigen y el segundo es de 5.6 a 1). Esto
significa que el patrón dominante en cierta forma es 5.6 veces tan “importante” como el
patrón secundario.

Después podemos atender a las puntuaciones de cada caso en el primer eigenvector.


Las puntuaciones más altas indican que los actores son “más centrales” al patrón
principal de distancias entre todos los actores, las puntuaciones más bajas indican que
los actores son más periféricos. Los resultados son muy similares a los encontrados
en nuestro anterior análisis de centralidad por cercanía, con el actor # 7, # 5 y # 2 más
centrales y # 6 más periférico. Usualmente el enfoque del valor eigen hará lo que debe
hacer: darnos una versión ‘limpia’ de las medidas de centralidad por cercanía, como lo
hace aquí. Es una buena idea examinar ambos y compararlos.

Finalmente, examinamos la centralización general del gráfico y la distribución de


centralidades. Hay relativamente poca variabilidad en la centralidad (desviación

17
estándar .07) alrededor del promedio (.31). Esto sugiere que, en general, no hay
grandes desigualdades en la centralidad o poder del actor, cuando medimos de esta
forma. Comparado a la red ‘estrella’, el nivel de desigualdad o concentración de los
datos Knoke es sólo 20.9% de lo máximo posible. Esto es mucho menor que la
medida de centralización de red para la medida de cercanía ‘cruda’ (49.3), y sugiere
que algunas diferencias de poder usando el enfoque de la cercanía ‘cruda’ pueden
deberse más a aparentes desigualdades locales que globales.

El enfoque de análisis de factores puede ser usado para examinar el grado o


intermediación también, pero no te agobiaremos con esos ejercicios. Nuestro punto
principal es: la distancia geodésica entre actores es una medida razonable de un
aspecto de centralidad - o ventaja posicional. A veces, estas ventajas pueden ser más
locales y a veces más globales. El enfoque factor analítico es un acercamiento que
algunas veces nos ayuda a enfocar el patrón más global. Otra vez, no se trata de que
un enfoque sea ‘correcto’ y otro ‘no’ sino que dependiendo de los objetivos de nuestro
análisis, desearemos enfatizar uno u otro aspecto de la ventaja posicional que surge de
la centralidad.

CENTRALIDAD DE FLUJO

La medida de centralidad de intermediación que hemos examinado arriba caracteriza a


actores con ventaja posicional, o poder, en la medida que aparecen en el camino más
corto (geodésico) entre otro par de actores. La idea es que actores que están ‘entre’
otros actores y sobre aquellos de quiénes éstos dependen para hacer intercambios,
convertirá el rol de intermediario en poder.

Supongamos que dos actores quieren una relación, pero el camino geodésico entre
ellos está bloqueado por un intermediario indiferente. Si existe otro camino, los dos
actores lo usarán probablemente, aunque sea más largo o ‘menos eficiente’. En
general, los actores pueden bien usar todos los vínculos que los conectan en vez de
solamente vínculos geodésicos. El enfoque de flujo a la centralidad expande la noción
de centralidad de intermediación y supone que los actores usarán todos los itinerarios
que los conectan antes que solamente caminos geodésicos. El enfoque de flujo a la
centralidad expande la noción de intermediación. Asume que los actores usarán todos
los itinerarios que los conectan. La intermediación se mide por la proporción de todo el
flujo entre dos actores (es decir, a través de todos los caminos que los conecta) que
ocurre en los caminos de los cuales el actor es parte. Para cada actor, entonces, la

18
medida suma cuán involucrado el actor está en todo el flujo entre todos los pares de
actores (¡la cantidad de cálculos con más de una par de actores puede ser
enormemente intimidatoria!). En tanto se puede esperar que la magnitud de este índice
se incremente con el tamaño y densidad de la red, es útil estandarizarlo calculando el
flujo de intermediación de cada actor en relación al flujo total de intermediación que no
involucra al actor.

CENTRALIDAD DE FLUJO DE INTERMEDIACIÓN

Flujo de Flujo de
intermediación intermediación
Normalizado

1 10.00 7.69
2 49.00 39.20
3 17.00 12.50
4 14.00 10.53
5 48.00 37.80
6 2.00 1.34
7 23.00 16.67
8 8.00 6.06
9 9.00 6.34
10 12.00 9.09

ESTADÍSTICAS DESCRIPTIVAS PARA CADA MEDIDA

Flujo de Flujo de
intermediación intermediación
Normalizado

Promedio 19.20 14.72


Desviación Est. 15.57 12.50
Suma 192.00 147.21
Varianza 242.56 156.33
Mínimo 2.00 1.34
Máximo 49.00 39.20

Índice de Centralización de la red = 27.199%

Con esta medición más completa de centralidad de intermediación los actores # 2 y #


5 son claramente los más importante mediadores (con el NEWS #7 , siendo un
distante tercero). El actor # 3 que era importante cuando considerábamos sólo flujo
geodésico es ahora menos importante. Mientras la imagen completa no cambia
mucho, la definición elaborada de intermediación nos da una impresión algo distinta de
quién es el más importante en la red.

19
Algunos actores claramente son más centrales que otros, y la variabilidad relativa de
flujo de intermediación de los actores es bastante grande (la desviación estándar de
intermediación del flujo normalizado es de 14.7 con relación al promedio de 12.5 dado
un coeficiente de variación relativa de 85%). A pesar de esta relativamente alta
cantidad de variación, el grado de desigualdad o concentración en la distribución de las
centralidades del flujo de intermediación entre los actores es bastante baja -en relación
a la red estrella (el índice de centralización es de 27.199). Esto es ligeramente más
alto que el índice para las medidas de intermediación que se basaba sólo en distancias
geodésicas.

EL ÍNDICE DE PODER DE BONACICH

Phillip Bonacich propuso una modificación al enfoque de centralidad de grado que ha


sido ampliamente aceptado como superior a la medida original. La idea de Bonacich,
como toda buena idea es simple. El enfoque original de centralidad sostiene que
actores que tienen más conexiones son probablemente más poderosos porque pueden
directamente afectar a más actores. Esto tiene sentido, pero tener el mismo grado no
necesariamente hace a los actores igualmente importantes.

Supongamos que Bill y Fred cada uno tiene 5 amigos cercanos. Los amigos de Bill sin
embargo están bastante aislados y no tienen muchos otros amigos además de Bill.
Los amigos de Fred tienen muchos amigos quienes a la vez también tienen muchos
amigos y así sucesivamente. ¿quién es más central?. Estaríamos de acuerdo que es
Fred porque la gente con la que está conectada está mejor conectada que lo amigos
de Bill. Bonacich sostiene que la centralidad es una función de cuántas conexiones
tiene uno y los actores en relación con uno.

Mientras argumentábamos que los actores más centrales son los más poderosos,
Bonacich cuestionó esta idea. Compara a Bill y a Fred de nuevo. Fred es claramente
más central, pero ¿es más poderoso?. Un argumento sería de que uno puede ser más
influyente si está conectado a otros centrales - porque uno puede rápidamente
contactarse con muchos otros actores con su mensaje. Pero si los actores con los
que estas conectado están a su vez bien conectados no son altamente dependientes
de ti – tienen muchos contactos, al igual que tú. Si por otro lado la gente con la que
contactas no está bien conectada, es dependiente de ti. Bonacich argumentaba que
estar bien conectado a otros conectados te hace central pero no poderoso. De alguna
manera, irónicamente, estar conectado a otros que no están bien conectados hace a

20
uno poderoso, porque estos otros actores dependen de ti – mientras los otros actores
bien conectados no.

Bonacich propuso que ambas nociones centralidad y poder eran funciones de las
conexiones del actor con su entorno. A más conexiones los actores tengan con tu
entorno, más central eres tú. Cuantas menos conexiones éstos tengan con tu entorno,
más poderoso eres. Parecería existir un problema para construir un algoritmo que
incorporase estas ideas: supongamos A y B están conectados; el poder y centralidad
de A está en función de sus propias conexiones y también las conexiones de B. De la
misma forma, el poder y centralidad de B depende de las de A. Así que, el poder y
centralidad de cada actor depende del poder de cada otro simultáneamente.

Hay una manera de salir de este dilema del huevo y la gallina. Bonacich mostró que
para resolver esta ecuación en sistemas simétricos, un enfoque de estimación iterativa
simultánea eventualmente convergería en una sola respuesta. Se comienza dándole a
cada actor una centralidad estimada igual a su propio grado, más un cálculo ponderado
de la función de los actores con quién está conectado. Entonces, hacemos esto de
nuevo, usando las primeras estimaciones (i.e. le damos a cada actor una centralidad
estimada igual a su primera puntuación más las primeras puntuaciones de aquéllos
con los que está conectado). Si hacemos esto numerosas veces, los tamaños
relativos (no los tamaños absolutos) de todas las puntuaciones serán iguales. A
continuación, las puntuaciones pueden ser recalculadas escalando las constantes.

Examinaremos las puntuaciones de centralidad y poder para nuestros datos de


intercambio. Primero, examinamos el caso donde la puntuación para cada actor es
una función positiva de su propio grado y el nivel de los otros a los que está conectado.
Hacemos esto al seleccionar un peso positivo (Parámetro Beta) para el grado de otros
en cada entorno del actor. Este enfoque nos lleva a una puntuación de centralidad.

21
CENTRALIDAD BONACICH

Beta Parameter: 0.50000

ATENCIÓN: La matriz de datos ha sido simetrizada tomando la


longitud de xij y xji.

CENTRALIDAD DEL ACTOR

1
Centralidad

1 COUN - 2.68
2 COMM - 3.74
3 EDUC - 2.76
4 INDU - 2.95
5 MAYR - 4.05
6 WRO - 1.16
7 NEWS - 2.67
8 UWAY - 3.49
9 WELF - 2.89
10 WEST - 2.95

ESTADÍSTICAS DESCRIPTIVAS

1
Centralidad

1 Promedio - 2.93
2 Desviación Est. 0.74
3 Suma - 29.32
4 Varianza 0.55
5 Euc. Norm 9.57
6 Mínimo - 4.06
7 Máximo - 1.16

Índice de Centralización de la red = 17.759

Notas: Si analizamos el valor absoluto de las puntuaciones nos encontramos con un a


historia conocida. El actor # 5 y # 2 son claramente los más centrales. Esto se debe a
que tienen un alto grado y porque están conectados entre sí y con otros actores de alto
grado. El UWAY (# 8) también aparece con alta centralidad con esta medida - éste es
un nuevo resultado. En este caso se debe a que el UWAY está conectado a todos los

22
otros puntos con altos grados al ser una fuente para ellos y hemos contado una
relación tanto si se trata de un emisor como de un receptor.

Cuando tomamos en cuenta las conexiones de aquéllos con quienes los actores están
conectados, hay menos variación en los datos que cuando examinamos sólo
adyacentes. La desviación estándar de las centralidades del actor es pequeña en
relación a la puntuación media. Esto sugiere relativamente poca dispersión o
desigualdad en la centralidad, lo que se confirma al comparar la distribución de los
datos con la red ‘estrella’ (i.e. índice de centralidad de la red = 17.759).

Veamos el lado del poder del índice que se calcula con él mismo algoritmo, pero que
da peso negativo a conexiones con conexiones débiles.

PODER BONACICH

Parámetro Beta: - 0.500000

ATENCIÓN: La matriz de datos ha sido simetrizada tomando el


longitud de xij y xji.

PODER DEL ACTOR

1
Poder

1 COUN - 1.00
2 COMM 2.00
3 EDUC 1.00
4 INDU 1.00
5 MAYR 3.00
6 WRO - 0.00
7 NEWS 3.00
8 UWAY 1.00
9 WELF 2.00
10 WEST 1.00

23
ESTADÍSTICAS

1
Poder

1 Promedio 1.30
2 Desviación Est. 1.19
3 Suma 13.00
4 Varianza 1.41
5 Euc. Norm 5.57
6 Mínimo - 1.00
7 Máximo 3.00

Índice de Centralización de la red = 17.000

Notas: Como era previsible, estos resultados son muy distintos a otros que hemos
examinado. Puedo decir que no sorprende porque la mayoría de medidas que hemos
visto equiparan centralidad con poder, mientras que el índice de poder de Bonacich ve
el poder como distinto a la centralidad.

El MAYR (# 5) y COMM (# 2) son centrales (resultados previos) y poderosos. Ambos


actores están conectados con casi todos - incluidos bien conectados y poco
conectados. El actor # 9 (WELF) se ubica en este índice entre los actores más
poderosos. Esto es probablemente por su vínculo con WRO (# 6) un actor poco
conectado. El actor # 1 que tiene alto grado se ve aquí como no poderoso, si ve el
diagrama otra vez, puede ver que el actor # 1 se conecta casi con todos los actores
altamente conectados.

El enfoque de Bonacich a la centralidad y al poder basado en el grado son extensiones


naturales de la idea de grado de centralidad basado en adyacentes. Uno simplemente
toma en cuenta las conexiones de tus conexiones además de tus conexiones. La
noción que el poder surge con conexiones con débiles, por oposición a las fuertes es
interesante y apunta a otra manera en la que la posición de los actores en la estructura
de red les da diferentes potencialidades.

RESUMEN DEL CAPÍTULO 6

Los métodos de análisis de redes sociales proporcionan algunas herramientas útiles


para dirigirse a uno de los más importantes (pero también más complejos y difíciles)
aspectos de la estructura social: las fuentes y distribución del poder. La perspectiva de

24
redes sugiere que el poder de los actores no es un atributo del individuo, sino que
surge de sus relaciones con los otros. Todas las estructuras sociales pueden también
ser vistas como desplegando altos o bajos niveles de poder como resultado de las
variaciones en los patrones de vínculos entre los actores. Además, el grado de
desigualdad o concentración de poder en la población podría ser indexado.

El poder se deduce de la ocupación de posiciones ventajosas en las redes de


relaciones. Tres son las fuentes básicas de poder: grado alto, alta cercanía y alto
grado de intermediación. En estructuras simples (como la estrella, el círculo y la línea),
estas ventajas tienden a covariar. En estructuras grandes y complejas, puede existir
disyuntivas considerables entre estas características de una posición – de tal manera
que un actor podría ser localizado en una posición que es ventajosa en algún aspecto,
y desventajosa en otros.

En el capítulo anterior y en el presente, hemos enfatizado que los métodos de análisis


de redes sociales nos dan, en el mismo momento, visiones individuales y de la
población en general. Uno de los temas más importantes y de larga duración en el
estudio de la organización social humana, sin embargo, es la importancia de las
unidades sociales que se sitúan entre los polos de los individuos y la población en
general. En el próximo capítulo, volvemos a concentrarnos en cómo los métodos de
análisis de redes sociales describen y miden la diferenciación de subpoblaciones.

PREGUNTAS DE ESTUDIO CAPÍTULO 6

• ¿Cuál es la diferencia entre ‘centralidad’ y “centralización”?

• ¿Por qué es un actor con mayor grado un actor más ‘central’?

• ¿Cómo la medida de influencia Bonacich extiende la idea de centralidad?

• ¿Puedes explicar por qué se dice que un actor que tiene una suma más
pequeña de distancias geodésicas a todos los actores es más ‘central’, usando
el enfoque de cercanía?

• ¿Cómo el enfoque de flujo extiende la idea de ‘cercanía’ como una


aproximación a la centralidad?

25
• ¿Qué significa que un actor se sitúa ‘entre’ otros dos actores? ¿Por qué la
intermediación da al actor poder de influencia?

• ¿Cómo el enfoque de flujo extiende la idea de ‘intermediación’ como una


aproximación a la centralidad?

• Muchos de los enfoques sugieren que la centralidad confiere poder e influencia.


Bonacich sugiere que el poder y la influencia no son lo mismo. ¿Cuál es el
argumento de Bonacich? ¿Cómo Bonacich mide el poder del actor?

PREGUNTAS DE APLICACIÓN CAPÍTULO 6

• Piensa en las lecturas de la primera parte del curso. ¿Qué estudios usaron las
ideas de ventaja estructural, centralidad, poder e influencia? ¿qué clases de
enfoque se utilizaron para cada uno : el grado, cercanía e intermediación?

• ¿Puedes pensar en alguna circunstancia donde ser ‘central’ podría hacer a uno
menos influyente? ¿menos poderoso?

• Considera una red directa que describe una burocracia jerárquica, donde la
relación es ‘dar ordenes a’, ¿qué actores tienen el más alto grado? ¿son ellos
los más poderosos e influyentes? ¿qué actores tienen alta cercanía? ¿qué
actores tienen alta intermediación?

• ¿Puedes pensar en un ejemplo de la vida real en el cual un actor podría ser


poderoso pero no central? ¿quién podría ser central y no poderoso?

26
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.

CAPÍTULO SÉPTIMO

Robert A. Hanneman. Departamento de Sociología de la


Universidad de California Riverside.
NOTA PREVIA

Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].

Este capítulo ha sido traducido por René Ríos, del Departamento de Sociología de la
Universidad Católica de Chile.

2
CAPÍTULO VII. GRUPOS Y SUBESTRUCTURAS

INTRODUCCIÓN

Unos de los intereses más comunes del análisis estructural radica en las
"subestructuras" que pueden estar presentes en una red. Las Díadas, Tríadas y
círculos ego-centrados, pueden ser pensadas como subestructuras. Las
combinaciones de díadas y tríadas en estructuras mayores, las cuales están
conectadas a su vez, desarrollan o constituyen las redes. Muchas de las
aproximaciones para comprender la estructura de una red enfatizan la forma en la que
las conexiones están compuestas y se extienden para desarrollar "cliques" más
grandes o subagrupaciones. Esta visión de la estructura social centra la atención en
cómo la solidaridad y la conexión de grandes estructuras pueden ser construidas a
partir de componentes pequeños y cohesionados: un tipo de aproximación de abajo
hacia arriba. Los analistas de redes han desarrollado un conjunto de definiciones y
algoritmos para identificar los componentes más pequeños en las grandes estructuras:
cliques, n-cliques, n-clans y k-plexes sirven para ver las redes desde esa perspectiva.

La división de actores en cliques o subgrupos puede ser un aspecto muy importante


de la estructura social. Pueden ser importantes para comprender el comportamiento
de la red en su conjunto. Por ejemplo, suponga que los actores de una red forman
dos cliques no yuxtapuestos, pero que existe alguna yuxtaposición de miembros, esto
es, que algunos actores pertenecen a ambos cliques. Donde los grupos coinciden,
podemos esperar que el conflicto entre ellos sea menos probable que en aquellos
dónde no coinciden. Donde los grupos coinciden, la movilización y difusión pueden
esparcirse más rápidamente a través de toda la red; donde no hay yuxtaposición de
los grupos, pueden observarse rasgos de un grupo que no se difunden al otro.

Saber cómo un individuo está inmerso en la estructura de grupos en una red puede
ser un aspecto crítico para la comprensión de su conducta. Por ejemplo, algunos
pueden actuar como puentes entre grupos (los cosmopolitas, ampliadores de
fronteras). Otros pueden tener todas sus relaciones dentro de un único clique (los
locales o internos). Algunos actores pueden ser parte de una elite cerrada y
densamente conectadas, mientras que otros están completamente aislados de ese
grupo. Tales diferencias en las formas que los individuos están inmersos en la
estructura de grupos en una red pueden tener profundas consecuencias en las

3
maneras que esos actores perciben su funcionamiento y en las prácticas que más
probablemente despliegan.

La idea de subestructuras, o grupos, o cliqués, en una red es una poderosa


herramienta para comprender la estructura social y la imbricación de los individuos. La
definición de un clique es bastante simple: es un subconjunto de actores que están
más fuertemente conectados mutuamente que lo que lo están con otros actores que
no forman parte del grupo. Pero cuando uno quiere ser más preciso y aplicar
rigurosamente el concepto al analizar los datos, se tienen que afrontar complicaciones
mayores.

Para visualizar algunas de las principales ideas y examinar algunas de las principales
maneras de cómo los analistas han definido los cliques, trabajaremos con un ejemplo.
Todos los análisis se pueden realizar usando UCINET.

La mayoría de los algoritmos computacionales para definir cliques operan sobre datos
binarios simétricos. Usaremos los datos de intercambio de información de Knoke.
Cuando los algoritmos lo permitan, usaremos los datos en su forma dirigida. Cuando
los datos sean simétricos, analizaremos los vínculos fuertes. Esto es, vamos a
simetrizar los datos, de modo que sólo contaremos los lazos recíprocos, es decir, un
vínculo existe sólo si xy e yx están presentes.

La matriz de datos resultantes es la siguiente:

1
1 2 3 4 5 6 7 8 9 0
- - - - - - - - - -
1 -
2 1 -
3 0 1 -
4 0 1 0 -
5 1 1 1 1 -
6 0 0 1 0 0 -
7 0 1 0 1 1 0 -
8 0 1 0 0 1 0 0 -
9 0 1 0 0 1 0 0 0 -
10 1 0 1 0 1 0 0 0 0 -

Teóricamente tiene sentido insistir en que la información se mueva en ambas


direcciones para que la cercanía sea percibida por ambas partes, y reducir la densidad
de la matriz sustancialmente. Las matrices con una densidad muy alta, casi por
definición, tienen pocos subgrupos o cliques distinguibles. Ayuda a visualizar el grafo
de datos.

4
Notas: El diagrama sugiere varias cosas. Los actores # 5 y # 2 aparecen en el centro
de la acción, en el sentido de que son miembros de varias de las agrupaciones y
sirven para conectarlas por su coparticipación. La conexión de subgrafos por los
actores puede ser un rasgo importante. Podemos también ver que hay un caso (#6)
que no es miembro de ningún subgrupo (excepto de un díada). Si se examina
cuidadosamente, se verá que las díadas y tríadas son los subgrafos más comunes y
que a pesar de la substancial conectividad en el grafo, agrupaciones superiores a
éstas son pocas. De la inspección visual, se ve que la mayoría de las diversas
agrupaciones están conectadas: los grupos se yuxtaponen.

Los principales rasgos de un grafo, en términos de los cliques y subgrafos, se pueden


identificar por observación directa:

• ¿Cuán separados están los subgrafos (se yuxtaponen y comparten miembros,


o dividen y crean facciones en la red)?

• ¿De qué tamaño son los subgrafos conectados? Hay pocos grupos grandes o
un gran número de grupos pequeños?

• ¿Hay actores particulares que parecen desempeñar roles en la red? Por


ejemplo, son nodos que conectan el grafo o hay quienes están aislados de los
grupos?

Las herramientas formales y conceptos de la estructura de subgrafos ayudan a definir


las ideas con mayor rigurosidad. Varios algoritmos se pueden aplicar para ubicar,
listar y estudiar los rasgos de los subgrafos. Obviamente, dependiendo de nuestras
definiciones, es posible establecer diversas agrupaciones y posiciones en las
subestructuras. En seguida, veremos algunas de las ideas más comunes.

5
APROXIMACIONES DE ABAJO HACIA ARRIBA

En un sentido, todas las redes están compuestas de grupos (o subgrafos). Cuando


dos actores tienen un vínculo, forman un "grupo". Una aproximación para pensar
acerca de la estructura grupal de una red comienza con este grupo básico y busca
cuánto se puede extender esta relación cercana. Un clique extiende la díada
añadiendo a ella miembros que están vinculados con todos los miembros de un grupo.
Se puede relajar esta definición estricta de modo que sea posible incluir nodos
adicionales que no están muy fuertemente vinculados (n-cliques, n-clans, k-plexes y k-
núcleos). La noción, sin embargo, es partir de los vínculos simples para "construir" la
red. Un mapa de toda la red puede ser construido examinando los tamaños de los
distintos cliques y agrupaciones de tipo clique notando sus tamaños y yuxtaposiciones.

Este tipo de aproximación, acerca de las subestructuras de las redes, tienden a


enfatizar cómo lo macro puede surgir de lo micro. Tienden a enfocar nuestra atención
primero en individuos y en entender cómo están inmersos en la estructura mayor de la
red a partir de los grupos yuxtapuestos. Esta idea aparentemente obvia se tiene que
destacar porque también es posible aproximarse a la cuestión de la subestructura de
las redes, desde una perspectiva de arriba hacia abajo. Habitualmente, ambos
aspectos son valiosos y complementarios. Vamos a continuar con la aproximación de
abajo hacia arriba.

CLIQUES

La idea de un clique es relativamente simple. Al nivel más general, un clique es un


subconjunto de una red en el cual los actores están más cercana y fuertemente
conectados mutuamente, que lo que lo están respecto al resto de los integrantes de la
red. En lazos de amistad, por ejemplo, es usual que la gente forme cliques en los
grupos humanos, sobre la base de la edad, género, raza [sic], etnicidad, religión o
ideología y muchas otras cosas. Los más pequeños están formados por dos actores:
la díada. Pero la díada puede ser "extendida" para llegar a ser más inclusiva,
formando componentes fuertes y vinculados muy estrechamente en los grafos. Se
pueden desarrollar varias maneras para encontrar grupos en los grafos, que son
extensiones de díadas.

6
La definición más fuerte de un clique es un determinado número de actores (más de
dos, usualmente se usan tres), que tienen todos los vínculos posibles presente entre
ellos. Una agrupación de este tipo es el "Subgrafo máximo completo", el cual se
expande hasta incluir a la mayor cantidad de actores posibles. Requerimos a UCINET
encontrar todos los cliques en los datos de Knoke que satisfacen el criterio de
subgrafo máximo completo de definición de clique.

Notas: Hay siete (7) subgrafos máximos completos presente en estos datos. El
mayor está compuesto por cuatro de los diez actores y todos los integrantes de los
cliques más pequeños comparten alguna yuxtaposición con alguna parte del núcleo.
Podremos estar interesados en cuánto estas subestructuras están yuxtapuestas y en
saber qué actores son más "centrales" y en cuáles están más aislados de los cliques.
Podemos buscar respuestas analizando la coparticipación.

Notas: Es inmediatamente evidente que el actor #6 está completamente aislado y que


los actores # 2 y # 5 se yuxtaponen con casi todo los demás actores en al menos un
clique. Vemos que los actores 2 y 5 son más "cercanos" en el sentido de que
comparten participación en cinco de los siete cliques. Podemos avanzar un paso más
realizando un análisis de conglomerados de adición sucesiva de lazos para crear una
“secuencia de afiliación” basada en el número de partipaciones en cliques que los
actores comparten.

7
AGLOMERACIÓN JERÁRQUICA

Notas: Vemos que los actores 2 y 5 se juntan primero por estar cercanos ya que
comparten 5 participaciones. Al nivel de compartir solo dos participaciones se
incorporan los actores 1, 3 y 10. Si requerimos sólo una participación, todos los
actores, con excepción del 6, se incorporan.

Insistir que cada miembro de un clique debe estar conectado a cualquier otro miembro
es una definición muy estricta de lo que entendemos por un grupo. Hay varias
maneras de relajar esta restricción. Dos aproximaciones principales son N-clique, N-
clan y K-plex.

N-CLIQUES

Para muchos propósitos la definición estricta (subgrupo máximo completamente


conectado) puede resultar demasiado fuerte. Requiere que todo miembro de un
subgrupo tenga un lazo directo con todos y cada uno de los otros miembros. Se
pueden pensar casos de cliques en los que al menos algunos de sus miembros no
estén conectados tan cercana ni fuertemente. Hay dos principales maneras de relajar
la definición de clique para hacerla más útil y general.

Una alternativa es definir a un actor como miembro de un clique si está conectado con
todos los otros miembros del grupo a una distancia mayor que uno. Usualmente, se
usa la distancia de trayecto de dos. Esto es equivalente a ser amigo de un amigo.
Esta forma de denomina N-clique, en la que N corresponde a la longitud de la
trayectoria permitida para hacer una conexión con todos los otros miembros. Cuando
aplicamos la definición N-clique a nuestros datos, obtenemos lo siguiente.

8
Notas: Los cliques que vimos antes se han hecho más inclusivos por la definición
relajadas de participación grupal. El primer n-clique incluye a todos excepto al actor 6.
El segundo es más restrictivo e incluye al 6 (WRO), junto con dos elementos del
núcleo. Como hemos relajado la exigencia de cercanía para ser considerado
miembros, hay menos cliques máximos. Con subgrupos más grandes y menos
frecuentes, el alcalde (#5), ya no parece ser tan crítico. Con la definición más relajada
aparece ahora un "núcleo duro" de actores que son miembros de ambas agrupaciones
mayores. Esto se puede constatar en la matriz de coparticipación y por aglomeración
[clustering].

Notas: Al examinar estas coparticipaciones en cliques y de la aglomeración por


cercanía, bajo esta definición de clique, se produce un cuadro ligeramente distinto que
una aproximación de lazos fuertes. Los actores #2, #3, #5 y #10 forman un núcleo o
círculo íntimo con este método. A diferencia del núcleo compuesto por los actores #2,
#5, #4 y #7, obtenido por el método máximo, en el cual el 5 es una clara estrella). No
se puede afirmar que un resultado es más correcto que el otro.

9
N-CLANES

El enfoque N-clique, tiende a encontrar agrupaciones grandes y difusas en lugar de las


más fuertes y discretas del enfoque máximo. En algunos casos, se pueden encontrar
N-cliques que tiene la posiblemente indeseada propiedad de la conectividad con
actores que no son en sí mismos miembros de un clique. Sin embargo, para la
mayoría de las aplicaciones sociológicas esto es problemático.

Por esta razón, algunos analistas han sugerido restringir los N-cliques por medio de
exigir que el rango total o la distancia de la trayectoria entre cualquier par de miembros
de un N-clique también satisfagan una condición. Este tipo de restricción tiene el
efecto de forzar todos los vínculos entre miembros a que se realicen por medio de
otros miembros de un N-clique. Este enfoque es el N-clan. En el caso actual, el
enfoque N-clan no difiere del enfoque N-clique

10
Notas: Los enfoques N-clique y N-clan proveen alternativas a la definición estricta de
clique y a menudo estos enfoques más relajados tienen bastante sentido con datos
sociológicos. En esencia, el enfoque N-clique permite a un actor ser miembro de un
clique aún si no tienen lazos con todos los otros miembros pero siempre que tenga
vínculos con otro miembro y que no esté alejado más de n pasos (usualmente 2) de
todos los miembros del clique. El enfoque N-clan es una modificación relativamente
menor del enfoque N-clique, que requiere que todos los vínculos entre los actores se
realicen a través de otros miembros del grupo.

Si no se está convencido de considerar a un amigo de un miembro de un clique como


miembro del clique (el enfoque N-clique), se puede considerar una manera alternativa
de relajar los supuestos de la definición estricta, el enfoque K-plex.

K-PLEX

Una manera alternativa de relajar los supuestos fuertes del subgrafo máximo completo
es permitir que los actores sean miembros de un clique si tienen lazos con todos
excepto con k otros miembros. Por ejemplo, si A tiene vínculos con B y C, pero no con
D; y ambos B y C tienen vínculos con D, los cuatro actores podrían constituir un clique
bajo el enfoque K-plex. Este enfoque postula que un nodo es miembro de un clique de
tamaño n, si tiene lazos directos con n-k miembros de ese clique. El enfoque K-plex
parecer tener bastante en común con el N-clique, pero el análisis basado en K-plex a
menudo arroja un cuadro bastante diferente de las subestructuras del grafo. En vez
de agrupaciones grandes y concatenadas, que a veces produce el análisis N-clique, el
análisis K-plex tiende a encontrar números relativamente grandes de pequeñas
agrupaciones. Esto tiende a llamar la atención sobre yuxtaposiciones y co-presencia
(centralización) más que en solidaridad y accesibilidad.

En el ejemplo que sigue permitimos que k sea igual a dos. Esto es, un actor es
considerado miembro de un clique si tiene vínculos con todos menos otros dos actores
en dicho clique. Con esta definición, hay muchos clique de tamaño tres (en efecto, en
nuestro grafo hay 35 K-plex cliques, pero sólo seis de ellos tienen mas de tres
miembros). Con K=2 un nodo requiere estar conectado solo con un otro miembro para
ser considerado. Pero esto no es muy satisfactorio como clique, de modo que hemos
eliminado estas agrupaciones de tres casos. Los restantes K-cliques son:

11
K-PLEXES:
COUN COMM EDUC MAYR WEST
COUN COMM EDUC WEST
COUN COMM INDU MAYR
COUN COMM MAYR NEWS
COUN COMM MAYR UWAY
COUN COMM MAYR WELF
COMM EDUC INDU MAYR
COMM EDUC MAYR NEWS
COMM EDUC MAYR UWAY
COMM EDUC MAYR WELF
COMM INDU MAYR NEWS
COMM INDU MAYR UWAY
COMM INDU MAYR WELF
COMM MAYR NEWS UWAY
COMM MAYR NEWS WELF
COMM MAYR UWAY WELF

Notas: El COMM está presente en todo componente k; el MAYR en todos menos


uno. Claramente estos dos actores son "centrales", en el sentido de que juegan un rol
de puente entre múltiples diferentes círculos sociales ligeramente diferentes. De
nuevo notamos que la organización número #6, (WRO) no es miembro de ningún
clique k-plex. Comparado con el método máximo o N-clique, el método K-plex tiende a
encontrar los "círculos sociales solapados o yuxtapuestos".

El enfoque K-plex para definir subestructuras tiene bastante sentido en muchos


problemas. Requiere que los miembros de un grupo tengan vínculos con la mayoría
de otros miembros - lazos por medio de intermediarios (como en el enfoque N-clique)
no habilitan a un nodo como miembro. La imagen de la estructura grupal que emerge
de enfoques K-plex puede ser bastante diferente que los que surgen del análisis N-
clique. De nuevo, no se trata de que uno sea correcto y el otro equivocado.
Dependiendo de los objetivos del análisis, ambos pueden proveer interesantes
perspectivas sobre la subestructura de los grupos.

K-NÚCLEOS

Un k-núcleo es un grupo máximo de actores, todos los cuales están ligados a algún
número (k) de otros miembros del grupo. Para ser incluido en un K-plex, un actor
debe estar ligado con todo excepto k otros actores en el grupo. El enfoque K-núcleo
es más relajado, permitiendo a los actores formar parte de un grupo si están
conectados con k miembros, siendo indiferente a cuántos otros miembros pudieran
estar conectados. Al variar el valor de k (es decir, a cuántos miembros del grupo debe
estar conectado), pueden emerger distintas imágenes. Los K-núcleos pueden ser - y

12
suelen serlo-, más inclusivos que los K-plexes. Y, a medida que k es más pequeño, el
tamaño de los grupos se agrandará.

En nuestro datos de ejemplo, si requerimos que cada miembro de un grupo tenga


lazos con otros 3 miembros (un 3-núcleo) se identifica un grupo central bastante
grande [#1,#2,#3,#4,#5,#7,#10]. Cada uno de los siete miembros de este núcleo tiene
lazos con al menos otros tres. Si relajamos el criterio y requerimos solo dos lazos, se
agregan los actores 8 y 9 a este grupo (y el miembro 6 es un aislado). Si requerimos
sólo un lazo (en realidad, sería lo mismo que un componente), todos los actores están
conectados.

La definición del k-núcleo es intuitivamente atractiva para algunas aplicaciones. Si un


actor tiene vínculos con un número suficiente de miembros de un grupo, pueden
sentirse atados al grupo, aún cuando no conozcan a muchos o incluso a la mayoría de
sus miembros. Puede ser que la identidad dependa de la conexión, más que de
inmersión en un subgrupo.

ENFOQUES DE ARRIBA-ABAJO

Los enfoques que hemos examinado comienzan con la díada y examina si este tipo de
estructura cohesiva se puede extender hacia afuera. La estructura total de la red es
vista como emergiendo de yuxtaposiciones y apareamientos de componentes
pequeños. Ciertamente, esta es un forma válida de pensar acerca de estructuras
mayores y sus componentes.

Se podría preferir, sin embargo, comenzar con la totalidad de la red como su marco de
referencia, más que desde la díada. Enfoques de este tipo tienden a mirar la
estructura total e identificar subestructuras como partes que son localmente más
densas que el campo como un todo. En un sentido, este lente más macro, busca
agujeros o vulnerabilidades o puntos débiles en la estructura general de solidaridad de
la red. Los agujeros o puntos débiles definen líneas de división o separación en el
grupo mayor y apuntan a cómo se podría descomponer en sus unidades más
pequeñas.

13
Estas descripciones verbales de los lentes hacia arriba y hacia abajo exageran
enormemente las diferencias entre los enfoques cuando examinamos las definiciones
específicas y los algoritmos concretos que pueden usarse para localizar y estudiar la
subestructura. Aún así, la lógica y algunos de los resultados de los análisis pueden
llevar a perspectivas distintas y usualmente complementarias.

COMPONENTES

Los componentes de un grafo son partes que están internamente conectadas, pero
desconectadas entre los subgrafos. Si un grafo contiene uno o más nodos aislados,
estos actores son componentes. Más interesantes son aquellos que dividen los grafos
en partes separadas, en las que cada una tiene diversos actores que están
recíprocamente conectados (no nos importa cuán cercanamente ligados estén).

En el ejemplo que hemos estado usando, los datos sobre intercambio de información
de Knoke, hay un sólo componente. Esto es, todos los actores están conectados.
Éste suele ser a menudo el caso, aún en redes relativamente grandes con
aparentemente obvias subestructuras. De modo similar a cómo una definición estricta
de clique puede ser demasiado fuerte para capturar el significado conceptual, la
noción fuerte de componente es usualmente muy fuerte para encontrar significativos
puntos débiles, agujeros o subpartes locales densas en un grafo grande. De modo
que examinaremos algunos enfoques más flexibles.

BLOQUES Y PUNTOS DE CORTE

Un enfoque para encontrar estos puntos claves en un diagrama es preguntarse si al


ser eliminado un nodo la estructura se dividirá en sistemas desconectados. Si existen
tales nodos, se llamarán puntos de corte. Y se puede imaginar que tales puntos de
corte pueden ser actores particularmente importantes, que actúan como intermediarios
entro grupos desconectados. Las divisiones que los puntos de corte producen en un
grafo se llaman bloques. Podemos encontrar los máximos subgrafos no separables
(bloques) en un grafo por medio de ubicar los puntos de corte. Esto es, tratamos de
ubicar los nodos que conectan el grafo (si los hay).

En los datos que hemos estado examinando hay uno y solo uno, punto de corte, pero
no es muy interesante.

14
Se encontraron 2 bloques.
BLOCKS:
Block 1: EDUC WRO
Block 2: COUN COMM EDUC INDU MAYR NEWS UWAY WELF WEST

Notas: Vemos que el grafo se puede descomponer (o es desconectable) en dos


bloques. EDUC es el miembro que liga los dos subgrafos separables y es, por lo tanto
un punto de corte. Se puede confirmar con un rápido examen del gráfico (para estos
análisis, hemos usado los datos dirigidos en vez de los simetrizados).

Aquí vemos que EDUC es el único punto que al ser eliminado dejaría la estructura
desconectada (esto es, WRO no podría ser alcanzable por otros actores). En este
sentido, resulta que EDUC juega el rol de conectar la que de otra forma sería una
organización (WRO) aislada de los restantes miembros de la red.

CONJUNTOS LAMBDA Y PUENTES

Un enfoque alternativo es indagar si hay ciertas conexiones que al ser eliminadas,


resultarían en una estructura desconectada. Esto es equivalente a preguntarse acerca
de si hay ciertas relaciones claves (en contraste a si hay ciertos actores claves). En
nuestro ejemplo, la única relación que califica como tal es la que hay entre EDUC y
WRO. Pero, dado que sólo deja afuera a un actor, más que alterar a toda la red, no es
muy interesante. Pero se puede abordar esta cuestión de un modo más sofisticado.
El enfoque del conjunto Lambda ordena cada relación en la red en términos de su
importancia por medio de la valoración del flujo entre actores que pasa a través de
cada nexo. Luego identifica el conjunto de actores que, si fuesen desconectados,
perturbarían significativamente el flujo entre todos los actores. Las matemáticas y el
cálculo son extremadamente complejos, pero la idea es suficientemente simple. Para
nuestros datos, los resultados del conjunto Lambda son:

15
CONJUNTOS LAMBDA

HIERARCHICAL LAMBDA SET PARTITIONS

U W C E I M C N W
W W E O D N A O E E
R A L U U D Y M W S
O Y F N C U R M S T
1
Lambda 6 8 9 1 3 4 5 2 7 0
------ - - - - - - - - - -
7 . . . . . . XXX . .
3 . . . XXXXXXXXXXXXX
2 . XXXXXXXXXXXXXXXXX
1 XXXXXXXXXXXXXXXXXXX

Notas: Este enfoque identifica a los vínculos #2 al #5 (MAYR a COMM) como los más
importantes del grafo, en el sentido de que transportan una gran cantidad de tráfico, y
si se eliminasen el grafo se perturbaría enormemente. Este resultado se confirma al
examinar la imagen 1, donde vemos que la mayoría de los actores están conectados
con la mayoría de los restantes por vía del vínculo que va del #2 al #5.
Considerablemente menos críticos son los vínculos entre los actores 2 y 5 con los
#1,#3,#4,#7 y #10. De nuevo, la imagen muestra que esas organizaciones son una
especie de círculo externo en torno al núcleo.

La idea del conjunto Lambda nos ha situado bastante lejos de la idea de componentes
estrictos. En vez de enfatizar la descomposición o separación de la estructura en
componentes desconectados, la idea del conjunto lambda, es más continua. Enfatiza
los puntos en los cuales el tejido de las conexiones es más vulnerable a la ruptura. De
nuevo, no se trata de maneras correctas o erróneas de aproximarse a la noción que
las grandes estructuras pueden ser no homogéneas y que estén más expuestas a la
división y ruptura en algunas localizaciones más que en otras. Nuestro último enfoque
combina la lógica de ambos anteriores.

FACCIONES

En términos de redes, los actores son equivalentes en la medida que tienen el mismo
perfil de relaciones con otros actores. Se sigue que podemos definir particiones de la
red sobre la base de agrupar juntos a actores por su similitud en cuanto a con quién
están vinculados. En un extremos, podríamos tener un grafo que fuese divisible en
componentes y que cada componente es un clique (esto es, en un grupo, todos están
vinculados con todos; entre grupos no hay lazos). Algunas divisiones menos estrictas
permitirían que hubiese algunos vínculos entre grupos y una densidad no completa
dentro de los grupos.

16
Usando el poder de la computadora es posible buscar particiones de un grafo en
subgrafos que maximicen la similaridad de los patrones de conexión de los actores
dentro de cada grupo. También es posible evaluar cuán buena es la participación
comparándola con el resultado de una partición típica ideal pura, donde los actores
dentro de cada grupo tienen máxima similitud y los actores entre grupos tienen
máxima disimilitud de vínculos.

El primer paso en este enfoque es tratar de decidir qué número de grupos o divisiones
proveen una cuadro más útil e interesante de los datos. Probamos con la opción de 2
a 5 grupos y nos quedamos con 4. La decisión se hizo en relación a la claridad e
interpretabilidad de la partición resultante en la matriz de adyacencia:

FACTIONS
Diagonal valid? YES
Use geodesics? NO
Method: CORRELATION
Treat data as: SIMILARITIES
Number of factions: 4
Fit: -0.503

Group Assignments:
1: EDUC WRO
2: COUN COMM INDU MAYR NEWS UWAY
3: WELF
4: WEST

Grouped Adjacency Matrix


1
6 3 2 4 5 1 7 8 9 0
W E C I M C N U W W
-----------------------------
6 WRO | 1 1 | 1 | 1 | |
3 EDUC | 1 1 | 1 1 1 1 | | 1 |
-----------------------------
2 COMM | 1 | 1 1 1 1 1 1 | 1 | |
4 INDU | | 1 1 1 1 1 | | |
5 MAYR | 1 | 1 1 1 1 1 1 | 1 | 1 |
1 COUN | | 1 1 1 1 | 1 | |
7 NEWS | | 1 1 1 1 | | |
8 UWAY | | 1 1 1 1 1 1 | 1 | |
-----------------------------
9 WELF | | 1 1 1 | 1 | |
-----------------------------
10 WEST | 1 | 1 1 1 1 | | 1 |
-----------------------------

Este enfoque se corresponde bien con la noción intuitiva de que los grupos en el grafo
pueden definirse por una combinación de la densidad local y la presencia de agujeros
estructurales entre algunos conjuntos de actores y otros. En este caso, se trata de
partes más fuertes y débiles del tejido, más que de agujeros. Dado que hemos usado
datos dirigidos para este análisis, debe notarse que la división se basa en quiénes
envían información a quien y en quiénes reciben de quién. La agrupación {6,3}, por
ejemplo, envía información a otros grupos, pero está separada de ellos porque los
otros grupos no les envían información. La imagen no sólo identifica facciones

17
actuales o potenciales, sino que nos dice algo acerca de las relaciones entre las
facciones, potenciales aliados y enemigos en algunos casos.

RESUMEN DEL CAPÍTULO SÉPTIMO

Uno de los aspectos más interesantes acerca de las estructuras sociales es su


subestructura de agrupaciones y cliques. El número, tamaño y las conexiones entre
las subagrupaciones en una red nos dicen mucho acerca de la conducta probable de
la red en su conjunto. ¿Cuán rápido va a circular algo a través de los actores de la
red? Si es más probable que los conflictos involucren a múltiples grupos o sólo a dos
facciones. ¿En qué medida se yuxtaponen los subgrupos y las estructuras sociales?
Todos estos aspectos de la estructura de los subgrupos pueden ser muy relevantes
para predecir la conducta de la red completa.

La ubicación de los individuos en redes puede también ser pensada en términos de


cliques o subgrupos. Algunos individuos pueden actuar como puentes entre grupos,
otros como aislados; algunos actores pueden ser cosmopolitas y otros locales, en
términos de sus afiliaciones grupales. Tales variaciones en las formas que los
individuos se conectan a grupos o cliques puede tener consecuencias para su
comportamiento como individuos.

En esta sección hemos revisado brevemente algunas de las definiciones más


importantes de subgrupos o cliques y hemos examinado los resultados de la
aplicaciones de dichas definiciones a los datos. Hemos visto que distintas definiciones
de lo que es un clique resultan en imágenes distintas de la misma realidad.

PREGUNTAS DE REPASO

1. Explica el término "subgrafo máximo completo".

2. ¿En qué sentido los n-cliques y los N-clans relajan la definición de clique?

3. Da un ejemplo de situación en la que el enfoque de N-clique o de N-clan sería más


útil que uno de clique estricto.

4. ¿En qué sentido los K-plexes y los K-núcleos relajan la definición de clique?

5. Da un ejemplo en el que fuese más útil usar K-plex o K-núcleo en vez de un clique
estricto.

18
6. ¿Qué es un componente en un grafo?

7. ¿Cómo relaja la definición estricta de componente la idea de un bloque?

8. ¿Hay algún punto de corte en una red estrella, en una red lineal y una red círculo?

9. ¿Cómo relaja la definición estricta de componente la idea de conjunto Lambda?

10. ¿Existen puentes en una red estrictamente jerárquica?

PREGUNTAS DE APLICACIÓN

1. Repasa las lecturas de la primera parte del curso. ¿Qué estudios usaron las ideas
de grupos y subestructruras? ¿Qué enfoques usaron, cliques, clans, plexes, etc.?

2. Trata de aplicar la noción de subestructuras grupales en distintos niveles de


análisis. ¿Hay subestructuras dentro del grupo de parentesco del cual formas parte?
¿Cómo se divide la población de Riverside en subestructuras? ¿Hay subestructuras
en la población de Universidades de los EEUU? ¿Hay naciones en el sistema mundial
que están divididas de alguna forma en subestructuras?

3. ¿Cómo pueden ser afectadas las vidas de personas que están en puntos de corte
por ocupar este tipo de posición estructural? Piensa en un ejemplo.

4. Elabora un ejemplo de población con subestructuras basado en el mundo real o


literario. ¿Cómo podrían ser descritas, usando conceptos formales, las subestructruas
en un caso del mundo real ... ¿son clanes, facciones, etc?

19
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.

CAPITULO OCTAVO

Robert A. Hanneman. Departamento de Sociología de la


Universidad de California Riverside.
NOTA PREVIA

Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].

Este capítulo ha sido traducido por Ainhoa de Federico de la Rúa .

2
CAPÍTULO VIII. POSICIONES EN LA RED Y ROLES
SOCIALES: LA IDEA DE EQUIVALENCIA

INTRODUCCIÓN

Hemos estado examinando algunas de las maneras en que los analistas de redes
sociales consideran los datos sobre redes. Comenzamos buscando regularidades en
la estructura de conjunto (p.e. conectividad, densidad, etc.) y el grado de inclusión
(embeddedness) de un actor (p.e. distancia geodésica, centralidad). Una segunda
perspectiva para examinar datos de redes sociales es buscar los subgrafos o grupos
de actores más cercanos entre sí que a otros grupos o actores. Por ejemplo
examinamos el significado de las cliques, los bloques y los puentes como maneras de
concebir y describir cómo los actores en una red pueden ser subdivididos en
subgrupos basándonos en sus modos de relación mutuos. Todo esto, aunque parezca
un poco técnico, es muy fácil de comprender conceptualmente. El nodo central de una
red estrella está más cerca de todos los otros miembros que cualquiera de los demás.
Esta es una idea fácil de comprender. Una clique, definida como el “máximo subgrafo
completo” suena difícil, pero de nuevo es un concepto que se entiende. Se trata
sencillamente del mayor conjunto de individuos que están conectados con todos los
otros miembros del grupo. De nuevo la idea no es difícil porque es muy concreta:
podemos ver y sentir las cliques.

Ahora vamos a dirigir nuestra atención hacia formas algo más abstractas de
comprender los modelos de relaciones entre actores sociales: el análisis de
posiciones. Es importante ser capaz de teorizar sobre las posiciones y analizar los
datos en tanto que posiciones puesto que queremos ser capaces de generalizar a
propósito de los comportamientos sociales y la estructura social. Es decir, queremos
poder afirmar principios que sean válidos para todos los grupos, todas las
organizaciones, todas las sociedades etc. Para ello tenemos que pensar en los
actores, no en tanto que individuos únicos (aunque lo sigan siendo), sino como
ejemplos de categorías. Como tarea empírica necesitamos ser capaces de agrupar los
actores más similares y de describir lo que los hace similares; y también ser capaces
de describir lo que los hace similares, en tanto que categoría, de los miembros de
otras categorías.

3
El pensamiento sociológico utiliza categorías abstractas cotidianamente. “La clase
trabajadora, la clase media, la case superior” son algunos de los conjuntos de
categorías que prescriben las posiciones sociales. “Hombres y Mujeres” son realmente
etiquetas sobre categorías de personas que son más similares dentro de la categoría
que entre categorías -al menos para comprender y predecir algunos aspectos de su
comportamiento social. Cuando categorías como estas son utilizadas como parte de
teorías sociológicas, son usadas para describir roles sociales o posiciones sociales
típicas de miembros de la categoría.

Muchos de los sistemas de categorías usados por los sociólogos están basados en
atributos que los actores tienen en común. Si afirmo que los “varones americanos-
europeos de edad entre 45 y 64 años tienden a tener salarios elevados en los Estados
Unidos” estoy hablando de un grupo de personas que son similares demográficamente
– comparten ciertos atributos (ser varones, tener antepasados europeos, edad
biológica y salario). El análisis estructural no se interesa particularmente por estos
sistemas de categorías (o variables) que se basan en descripciones de atributos
individuales similares (algunos analistas estructurales radicales incluso afirman que
tales categorías no son en absoluto sociológicas). Los analistas estructurales intentan
definir categorías y variables en términos de similitud de los modelos de relaciones
entre los actores, en lugar de definirlas respecto a los atributos de los actores. Es
decir, la definición de una categoría, o rol social o posición social depende de sus
relaciones con otra categoría. Los roles sociales y las posiciones, defienden los
analistas estructurales, son inherentemente relacionales. Esta idea es bastante
abstracta, esperemos que algunos ejemplos permitan aclararla.

¿QUÉ ES EL ROL SOCIAL “MARIDO”?

Una manera útil de definirlo es como un conjunto de interacciones regulares con un


miembro o con miembros de otras categorías sociales: “esposa” o “hijo/a” (y
probablemente otros). Cada una de estas categorías (p.e. marido, esposa, hijo/a)
puede ser definida solamente gracias a regularidades en los modelos de relaciones
con otras categorías (hay un cierto número de relaciones aquí: monetarias,
emocionales, rituales, sexuales…). Es decir que la familia y el los roles de parentesco
son inherentemente relacionales.

¿Qué es un “trabajador”? Podríamos querer decir “una persona que trabaja” (lo cual es
un atributo compartido prácticamente por todos los seres humanos). Una definición

4
más interesante sociológicamente sería la de Marx en tanto que persona que vende el
control sobre su poder de trabajo a un capitalista. Nótese que el significado de
“trabajador” depende de un “capitalista” y viceversa. Es la relación (en este caso,
como Marx lo expresaría, la relación de explotación) entre los ocupantes de los dos
roles la que define el significado de los roles.

La idea es que, para el analista estructural, los bloques constituyentes de la estructura


social son los roles sociales o las posiciones sociales. Estos roles sociales o
posiciones son definidos a partir de las regularidades en los modos de relación entre
actores, no a partir de los atributos de los actores mismos. Identificamos y estudiamos
los roles sociales y las posiciones a partir del estudio sistemático de las relaciones
entre actores, no a partir de las características de actores individuales. Elementos que
parecen ser atributos individuales tales como la raza (sic.) religión y edad pueden ser
concebidas como etiquetas sucedáneo para dar cuenta de regularidades en las
relaciones. Por ejemplo “blanco” (en Estados Unidos) como categoría social es
realmente una manera reductora de referirse a personas que típicamente tienen
formas comunes de relacionarse con miembros de otras categorías: los “no blancos”.
Elementos que en principio aparecen como atributos de los individuos realmente no
son más que maneras de decir que un individuo que pertenece a tal categoría tiene
ciertos modelos de relaciones características con miembros de otras categorías.

APROXIMACIONES A LAS POSICIONES EN LA RED Y LOS ROLES


SOCIALES

Puesto que definimos las posiciones o categorías sociales en tanto que las relaciones
entre actores, podemos identificar y definir empíricamente las posiciones sociales
utilizando datos de redes. De manera intuitiva, podríamos decir que dos actores
ocupan la misma posición o rol en la medida en que sus relaciones con otros actores
son las mismas. Sin embargo en esta definición intuitiva encontramos un par de cosas
molestas.

Primero, ¿qué relaciones tenemos en cuenta y entre quién para identificar qué actores
son similares y cuales no? Las relaciones que tengo con la Universidad son en cierto
modo parecidas a las relaciones que tienen los estudiantes: ambos estamos
gobernados por las mismas reglas, prácticas y procedimientos. Las relaciones que
tengo con la Universidad son muy distintas de las de los estudiantes en ciertos
aspectos (p.e. la Universidad me paga y los estudiantes pagan a la universidad). ¿Qué

5
relaciones deberían contar y cuales no al intentar describir los roles de “profesor” y de
“estudiante”? Incluso ¿por qué examinar las relaciones entre estudiantes y profesores
y la universidad en lugar de incluir, por ejemplo, miembros de la legislación del
estado? No existe una respuesta sencilla sobre cuáles son las “relaciones correctas”
que hay que examinar y no hay una respuesta sencilla sobre quiénes constituyen el
conjunto de actores relevantes. Todo depende del objetivo de la investigación, de la
perspectiva teórica utilizada y de las poblaciones a las que queramos generalizar
nuestros descubrimientos.

El segundo problema de nuestra definición intuitiva de un “rol” o “posición” es el


siguiente: asumiendo que haya delimitado un conjunto de actores y un conjunto de
relaciones que tengan sentido para estudiar una cuestión particular, ¿qué quiere decir
que los actores que comparten las mismas posiciones son similares en sus modelos
de relación? La idea de “similitud” ha de ser definida de manera precisa. De nuevo no
hay una respuesta única y “correcta” para todos los objetivos de investigación. Pero
existen sin embargo maneras rigurosas de pensar en lo que quiere decir “similar” y
maneras sistemáticas de examinar los datos para definir roles sociales y posiciones
sociales empíricamente. Estos son los temas a los que dedicaremos el resto de esta
sección.

DEFINIR LA EQUIVALENCIA O SIMILITUD

¿Qué queremos decir cuando decimos que dos actores tienen modelos similares de
relación y que por lo tanto ambos son miembros de un mismo rol social o posición?
Existen al menos tres maneras de entender la “similitud”. Algunos analistas han
llamado estos tipos de similitud equivalencia estructural, equivalencia automórfica y
equivalencia regular. Los tres tipos de similitud difieren en sus grados de abstracción,
siendo la equivalencia estructural la más concreta y la equivalencia regular la más
abstracta.

Sigue a continuación una breve descripción de los distintos conceptos de equivalencia.


Los estudiaremos en más detalle en los siguientes tres capítulos. Para ilustrar la
presente exposición utilizaremos un ejemplo de red. Hemos tomado la imagen de una
estructura jerárquica simple de Wasserman y Faust porque es muy útil para la
ilustración.

6
EQUIVALENCIA ESTRUCTURAL

Se dice que dos nodos son exactamente equivalentes estructuralmente si tienen


estrictamente las mismas relaciones con todos los otros actores. La equivalencia
estructural es fácil de entender (aunque se puede operacionalizar de distintas
maneras) porque es muy concreta. Dos actores son equivalentes en la medida en que
tengan las mismas relaciones con todos los otros actores. Si a A le gusta B y a C le
gusta B, A y C son estructuralmente equivalentes (nótese que el hecho de que a A le
guste C y viceversa no tiene importancia porque A y C tienen un patrón idéntico de
relaciones). Si dos nodos son exactamente equivalentes estructuralmente, también
serán equivalentes automórficamente y regularmente. Esto es así porque la
equivalencia estructural realmente significa lo mismo que “idéntico” o “sustituible”.
Borgatti et al. se refieren a la equivalencia estructural como “equivalencia de
localización en una red”. Puesto que la equivalencia estructural estricta es poco
frecuente, en especial en redes grandes, a menudo los investigadores se interesan por
el “grado de equivalencia estructural” más que por la presencia o ausencia de la
equivalencia estructural estricta.

EQUIVALENCIA AUTOMÓRFICA

Dos actores son equivalentes automórficamente si existe un re-etiquetado posible de


actores sin que cambie ninguna de las propiedades del grafo. La equivalencia
automórfica implica conjuntos de actores más que actores individuales. La
equivalencia automórfica se pregunta si se pueden localizar subgrafos o subconjuntos
de actores estructuralmente idénticos, es decir que puedan ser intercambiados entre sí
sin alterar las distancias en el grafo.

Si los actores son exactamente equivalentes estructuralmente –es decir, están


conectados del mismo modo con los mismos actores- también son equivalentes
automórficamente. Es decir, podrían ser intercambiados y ninguna de las propiedades

7
del diagrama se modificaría. Automorfismos más interesantes incluyen conjuntos de
actores que pueden intercambiarse entre si. Piense en tres McDonalds poseídos por el
mismo propietario de la franquicia. Imagine nuestro grafo de más arriba con el
propietario (A) de los tres restaurantes, cada uno con un directivo (B, C y D) y cada
uno con uno o más trabajadores. Cada restaurante tiene un directivo particular,
trabajadores particulares y clientes particulares. Los trabajadores en los tres
restaurantes no tienen relaciones estructuralmente equivalentes. Es decir, Edna
(trabajadora en el 1º restaurante) no puede ser intercambiada por Inge (del 3º
restaurante) sin perturbar los lazos con otros actores y las distancias entre ellos. Pero
si re-etiquetamos el restaurante A como B y el restaurante B como A, no ha cambiado
nada. Si cambiamos el conjunto de actores B, E, F por el conjunto de actores D, H, I,
todas las distancias entre todos los actores son preservadas. Este cambio es una
intercambio automórfico.

La razón por la que estos conjuntos son importantes es que las estructuras sociales
(en especial las que son grandes y complicadas) a menudo tienen subconjuntos de
actores, o estructuras locales que son equivalentes funcionalmente o réplicas las unas
de las otras. Tales similitudes son muy útiles para tratar de comprender cómo grandes
conjuntos de humanos se organizan. Nos permiten dirigir la atención hacia los
modelos comunes de relaciones sociales en lugar de ver cada estructura social como
única.

EQUIVALENCIA REGULAR

Se dice que dos nodos son equivalentes regularmente si tienen el mismo perfil de
lazos con miembros de otros conjuntos de actores que también son equivalentes
regularmente. Esta es una manera complicada de decir algo que reconocemos
intuitivamente. Dos madres, por ejemplo, son equivalentes, porque cada una tiene un
cierto modelo de relaciones con un marido, hijos, parientes políticos (por ejemplo,
aunque éstas sean muy relativas culturalmente). Dos madres (habitualmente en
nuestra sociedad) no tienen relaciones con el mismo marido o con los mismos hijos o
parientes políticos. Es decir, no son estructuralmente equivalentes. Pero son similares
porque tienen el mismo tipo de relaciones con algún miembro o miembros de otro
conjunto de actores (quienes son igualmente considerados como equivalentes por su
similitud de relaciones con miembros del conjunto “madre”). Este es un concepto obvio
pero crucial. Los actores equivalentes regularmente no ocupan necesariamente las

8
mismas posiciones respecto a otros actores individuales, más bien tienen los mismos
tipos de relaciones con algunos miembros de otros grupos de actores.

Los actores que son equivalentes estructuralmente son necesariamente equivalentes


regularmente. Los actores equivalentes regularmente no son necesariamente
estructuralmente equivalentes. La equivalencia estructural es más fácil de examinar
empíricamente porque concierne actores individuales específicos; la equivalencia
regular es más difícil de examinar empíricamente porque es necesario desarrollar
categorías abstractas de actores en relación con otras categorías abstractas.

9
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.

CAPÍTULO NOVENO

Robert A. Hanneman. Departamento de Sociología de la


Universidad de California Riverside.
NOTA PREVIA

Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].

Estos capítulos han sido traducidos por René Ríos, Departamento de Sociología de la
Universidad Católica de Chile.

2
CAPÍTULO IX. MEDICIONES DE SIMILARIDAD Y
EQUIVALENCIA ESTRUCTURAL

INTRODUCCIÓN

En esta sección vamos a examinar algunas de las maneras en que podemos definir y
medir empíricamente el grado de equivalencia estructural o la similaridad entre actores
en razón de su posición en la red. En seguida vamos a examinar algunos de los
posibles enfoques para analizar los patrones de equivalencia estructural basados en
las medidas de similitud.

Recordemos que la equivalencia estructural significa que los actores son sustituibles.
Esto es que los actores tienen un mismo patrón de relación con todos los otros. La
equivalencia estructural exacta es rara en la mayoría de las estructuras sociales (como
ejercicio, traten de imaginar como sería una estructura social en la que la mayoría de
los actores fueren sustituibles por los demás). En consecuencia, a menudo
calculamos medidas del grado en el que los actores son similares, y las usamos como
base para identificar conjuntos de actores que son muy similares entre si y distintos de
otros actores en otros conjuntos.

Para propósitos de ilustración, vamos a analizar los datos sobre envío y recepción de
información entre burocracias de Knoke. Estos datos muestras vínculos dirigidos y
están medidos a nivel nominal, esto es binario.

3
Este es un análisis bastante restringido, y no debe ser tomado muy en serio. Pero los
datos son útiles para entregar una ilustración de los principales enfoques para medir la
equivalencia estructural y para identificar actores que tienen similares posiciones
reticulares.

MEDICIONES DE SIMILITUD ESTRUCTURAL

Podemos intentar establecer intuitivamente qué nodos son más similares entre sí con
otros nodos mirando el diagrama. Notamos algunas cosas importantes. Parece ser
que los actores #2, #5 y #7 pueden ser estructuralmente similares en tanto tienen
lazos recíprocos y casi con todos los demás. Los actores #6, #8 y #10 son
regularmente similares por que están relativamente aislados, pero no son
estructuralmente similares porque están conectados a conjuntos distintos de actores.
Más allá de esto, sin embargo, es realmente bastante difícil establecer la similitud
estructural rigurosamente por medio de la inspección del diagrama.

Podemos ser más precisos si usamos la representación matricial. Esto además nos
permite usar el computador para realizar el tediosos trabajo involucrado en el cálculo
de índices para establecer la similitud. Se reproduce la matriz original de datos más
abajo. Muchos de los rasgos que aparecían en el diagrama son también fácilmente
captables en la matriz. si miramos en las filas y contamos los grados de salida y si
examinamos las columnas y contamos los grados de entrada podemos ver quienes
son actores centrales y quienes aislados. Pero, de manera más general, podemos ver
que dos actores son estructuralmente equivalentes en la medida que su perfil de
puntajes en sus filas y columnas son similares.

4
Se dice que dos actores son estructuralmente equivalentes si tienen similares
patrones de vínculos con otros actores. Esto significa que las entradas en las filas y
columnas de cada actor son idénticas entre sí. Si la matriz fuese simétrica, sólo
necesitaríamos examinar pares de filas o columnas. Pero como estos datos son lazos
dirigidos, debemos examinar la similaridad de los vínculos de emisión y de recepción
(por supuesto, podemos estar interesados en la equivalencia estructural de sólo los
lazos emisores o de los receptores). Podemos ver la similitud de los actores si
expandimos la matriz listando un vector de fila seguido de un vector de columna de
cada actor como columna, así:

5
Para ser estructuralmente equivalentes, dos actores deben tener los mismos vínculos
con los mismos otros actores - esto es, que las entradas en sus columnas deben ser
idénticas (con la excepción de los autovínculos, que probablemente ignoraríamos en la
mayoría de los casos). Habiendo organizado los datos de esta manera, hay algunos
aspectos bastantes obvios que podríamos hacer para proveer un índice que resuma
cuán cercano a la equivalencia estructural está cada par de actores. Con algo de
imaginación se puede llegar a otras ideas, pero los cuatro enfoques más comunes
para indexar la equivalencia estructural son la correlación, las distancias euclidianas

6
cuadradas, matches (aciertos) y aciertos positivos. Más abajo, cada uno de estos
resultados se muestra como una matriz de similitud o distancia.

COEFICIENTES DE CORRELACIÓN PEARSON.

La medida de similitud por correlación es particularmente útil cuando los datos de los
lazos están valorados, esto es contienen información acerca de la fortaleza del vínculo
y no sólo de su presencia o ausencia. Las correlaciones Pearson van entre -1.00 (que
significa que dos actores tiene exactamente los mismo lazos opuestos entre sí), a
través de cero (que implica que el conocimiento de los vínculos de un actor a un
tercero no nos ayuda a estimar los lazos de otro actor con ese tercero) a +1
(implicando que los dos actores tienen exactamente el mismo par de vínculos con
otros, una equivalencia estructural perfecta). Las correlaciones Pearson se usan a
menudo para sumarizar equivalencia estructural pareada, porque el estadístico "r" se
usa frecuentemente en estadística social. Si los datos no son verdaderamente
nominales o si la densidad es muy alta o muy baja, las correlaciones pueden ser
problemáticas y deberían examinarse los aciertos. Diferentes estadísticos usualmente
entregan las mismas respuestas. A continuación se presentan las correlaciones
Pearson entre los vectores concatenados de filas y columnas calculados con UCINET.

1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
----- ----- ----- ----- ----- ----- ----- ----- ----- -----
1 1.00
2 0.42 1.00
3 0.10 -0.48 1.00
4 0.50 0.42 0.13 1.00
5 0.33 0.79 -0.38 0.33 1.00
6 -0.07 0.15 0.00 -0.07 0.00 1.00
7 0.40 0.29 0.22 0.42 0.10 -0.37 1.00
8 0.63 0.37 0.26 0.63 0.29 -0.00 0.05 1.00
9 0.63 0.04 0.26 0.38 -0.10 -0.10 0.59 0.49 1.00
10 0.26 0.29 0.40 0.52 0.25 0.36 -0.03 0.38 0.13 1.00

Nota: Sólo se necesita la mitad de la matriz, dado que la similaridad XY es la misma


que la YX. Hay un rango amplio de similaridades en la matriz. Los actores 2 y 5 son
los más similares (r=.79); los actores 3 y 5, los más disimilares (r=-.38). La mayoría
de los números son positivos, y muchos son sustanciales. Este resultado es
consistente con la relativamente alta densidad y reciprocidad en estos datos, y es un
resultado de ellas. Cuando las densidades son muy bajas, y los lazos no son
recíprocos, las correlaciones pueden ser muy pequeñas.

7
Una manera de llegar a una síntesis aún más clara se obtiene al realizar un análisis de
aglomerados (cluster) de la matriz de similitud. Lo que éste hace es agrupar juntos a
los nodos que son más similares primero, en este caso los actores 2 y 5. Tomando los
puntajes de cada conglomerado (cluster) que están más cerca de alguno de los otros
conglomerados (método de vínculo único o vecino más cercano), se recalculan las
similitudes, y en seguida se agrega el siguiente par más similar (podría ser otro par de
actores, o el par 2 y 5 con algún otro actor). Este proceso continúa hasta que todos
los actores estén unidos. A continuación se presenta un sumario de la matríz de
similitud o proximidad, generado por un análisis de aglomeración de vínculo único.

HIERARCHICAL CLUSTERING OF CORRELATION MATRIX


1
Level 5 2 4 1 8 7 9 6 3 0
----- - - - - - - - - - -
0.787 XXX . . . . . . . .
0.630 XXX . XXX . . . . .
0.595 XXX . XXX XXX . . .
0.587 XXX XXXXX XXX . . .
0.409 XXX XXXXXXXXX . . .
0.405 XXX XXXXXXXXX . XXX
0.242 XXX XXXXXXXXX XXXXX
0.140 XXXXXXXXXXXXX XXXXX
0.101 XXXXXXXXXXXXXXXXXXX

Notas: El resultado establece que los actores #5 y #2 son más similares (a nivel de
.787 usando el método particular de aglomeración escogido). Este par permanece
separado de todos los demás hasta bien avanzado el proceso de aglomeración. El
siguiente par más similar es el constituido por el actor #1 y el #8 (a .630); luego el par
#7, #9 (a .595). A una similaridad de .587 un grupo más grande es creado, compuesto
por los actores #4, #1 y #8; el proceso continúa hasta que todos los actores se
aglomeran. Notar que los actores #6, #3 y #10 se aglomeran en un grupo suelto, y
están bastante distante de los restantes actores.

¿Cuántos grupos de nodos estructuralmente equivalentes hay en esta red? No hay


una respuesta correcta. La teoría puede llevar a predecir que los flujos de información
siempre producen tres grupos; o que los grupos siempre se dividen en dos facciones,
etc. Si tenemos una teoría acerca de cuantos conjuntos de actores estructuralmente
equivalentes debiera haber, podemos evaluar su bondad de ajuste con los datos. Más
a menudo, no tenemos una teoría muy fuerte acerca de cuántos conjuntos de actores
estructuralmente equivalentes podrían haber. En este caso, los resultados proveen
algunas guías.

8
Nota que en un alto nivel de similaridad (.787), los diez actores se dividen en 9 grupos
(5 y 2, y cada uno de los demás). Si permitimos que los miembros de los grupos sigan
siendo equivalentes, aún si son similares sólo a nivel .60 (.585), podemos llegar a un
cuadro bastante distinto: hay 6 grupos entre los diez actores. Si bajamos al nivel .40
de similitud, hay tres grupos con un excluido (el casi aislado WRO, # 6). Podríamos
dibujar un diagrama del número de grupos (en el eje Y) contra el grado de similaridad
al aglomerar (en el eje X). Este diagrama es uno del tipo de retornos marginales
(llamado en análisis factorial un Plot Screen). su punto de inflexión es el más eficiente
número de grupos. Más usualmente, uno busca una imagen del número de grupos
estructuralmente equivalentes que es suficientemente simple de comprender, a la vez
que sea suficientemente fuerte estadísticamente (con una relativamente alta similitud)
para ser defendible.

El coeficiente de correlación Pearson, da considerable ponderación o peso a las


diferencias más grandes entre puntajes particulares del perfil de actores, por la forma
de cálculo, que eleva al cuadrado la diferencia entre puntajes entre vectores. Esto lo
hace sensible a los valores extremos (en datos valorados) y a algunos errores. La
correlación también mide la asociación lineal, y en algunos casos ésta puede ser una
noción restrictiva.

DISTANCIAS EUCLIDIANAS

Una medida relacionada pero menos sensibles es la distancia Euclidiana. Esta es una
medida de dis-similitud, pues es la raíz de la suma de las diferencias al cuadrado entre
los vectores de los actores, es decir, las columnas de la matriz de adyacencia. En
muchos casos, los análisis de distancias euclidianas y de correlación pearson arrojan
el mismo resultados sustantivo. No obstante es una práctica recomendable analizar
ambas.

He aquí los resultados basados en las distancias euclidianas.

9
EUCLIDEAN DISTANCE MATRIX
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
---- ---- ---- ---- ---- ---- ---- ---- ---- ----
1 0.00
2 2.45 0.00
3 2.65 3.32 0.00
4 2.00 2.45 2.65 0.00
5 2.65 1.00 3.16 2.65 0.00
6 3.00 3.32 2.83 3.00 3.46 0.00
7 2.24 2.24 2.45 2.24 2.45 3.46 0.00
8 1.73 2.65 2.45 1.73 2.83 2.83 2.83 0.00
9 1.73 3.00 2.45 2.24 3.16 2.83 2.00 2.00 0.00
10 2.45 2.83 2.24 2.00 3.00 2.24 3.00 2.24 2.65 0.00

Nota: El patrón es bastante similar. Los actores 2 y 5 que tienen la correlación más
fuerte (una medida de similaridad) tienen la menor distancia (una medida de dis-
similaridad). A diferencia del coeficiente de correlación, el tamaño de la distancia
euclidiana no puede interpretarte. Todas las distancias serán positivas (o al menos no
negativas), y las ideas de asociación positiva, no asociación o asociación negativa,
que tenemos con el coeficiente de Pearson, no se pueden usar con las distancias.
Noten que el rango de los valores de las distancias euclidianas es relativamente
menor que el de las correlaciones que vimos anteriormente. La distancia mayor no es
a la menor tantas veces como la correlación mayor es a la menor. Esto resulta de la
manera que se calculan, dando menos ponderación o peso a los casos extremos.

AGLOMERACIÓN JERÁRQUICA DE LA MATRIZ DE DISTANCIAS EUCLIDIANAS


Level 5 2 7 4 1 8 9 6 3 0
----- - - - - - - - - - -
1.000 XXX . . . . . . . .
1.732 XXX . . XXX . . . .
1.821 XXX . XXXXX . . . .
1.992 XXX . XXXXXXX . . .
2.228 XXX XXXXXXXXX . . .
2.236 XXX XXXXXXXXX . XXX
2.434 XXX XXXXXXXXX XXXXX
2.641 XXX XXXXXXXXXXXXXXX
3.014 XXXXXXXXXXXXXXXXXXX

Nota: En este caso, el análisis de las distancias euclidianas dan exactamente la


misma impresión acerca de cuáles conjuntos son más equivalentes. Es habitualmente
lo que se obtiene con datos binarios. Con datos valorados, los resultados pueden ser
distintos entre correlaciones y distancias. La representación gráfica del análisis de
conglomerados claramente sugiere tres agrupaciones de casos ( {2,5}, {7,4,1,8,9},
{6,3,10}). También sugiere, de nuevo, que nuestros actores nucleares [5,2] tienen un
alto grado de equivalencia estructural - y son más sustituibles entre sí.

10
PORCENTAJE DE COINCIDENCIA EXACTA

En algunos casos los vínculos que examinamos pueden estar medidos al nivel
nominal. Cada par de actores puede tener una relación de uno de diversos tipos
(codificados como "a", "b" "c" o "1", "2", "3"). Aplicar distancias euclidianas o
correlaciones a ese tipo de datos puede ser erróneo. En vez, estamos interesados en
el grado en el cual una relación para el actor X es una coincidencia exacta con la
correspondiente relación del actor Y. Con datos binarios, el porcentajes de
coincidencia exacta pregunta a través de todos los actores para los que podemos
hacer comparaciones, ¿qué porcentaje de las veces X e Y tienen la misma relación
con otro actor? Esta es una medida de equivalencia estructural para datos binarios
dado que coincide mucho con nuestra noción del significado de la equivalencia
estructural.

PORCENTAJE DE COINCIDENCIA EXACTA


1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
----- ----- ----- ----- ----- ----- ----- ----- ----- -----
1 1.00
2 0.63 1.00
3 0.56 0.31 1.00
4 0.75 0.63 0.56 1.00
5 0.56 0.94 0.38 0.56 1.00
6 0.44 0.31 0.50 0.44 0.25 1.00
7 0.69 0.69 0.63 0.69 0.63 0.25 1.00
8 0.81 0.56 0.63 0.81 0.50 0.50 0.50 1.00
9 0.81 0.44 0.63 0.69 0.38 0.50 0.75 0.75 1.00
10 0.63 0.50 0.69 0.75 0.44 0.69 0.44 0.69 0.56 1.00

Nota: Estos resultados muestran la similitud de otra manera pero que es bastante fácil
de interpretar. El número .63 en la celda 2,1 significa que, comparando al actor #! con
el #2, tienen el mismo vínculo (presente o ausente) a otros actore el 63% de las veces.
La medida es particularmente útil con medidas nominales multi-categoriales de
relaciones; también provee una escala para datos binarios.

11
AGLOMERACION JERARQUICA DE LA MATRIZ DE COINCIDENCIA EXACTA.
1
Level 5 2 4 1 8 7 9 6 3 0
----- - - - - - - - - - -
0.938 XXX . . . . . . . .
0.813 XXX . XXX . . . . .
0.792 XXX XXXXX . . . . .
0.750 XXX XXXXX XXX . . .
0.698 XXX XXXXXXXXX . . .
0.688 XXX XXXXXXXXX . XXX
0.625 XXX XXXXXXXXX XXXXX
0.554 XXX XXXXXXXXXXXXXXX
0.432 XXXXXXXXXXXXXXXXXXX

Notas: En este caso, el resultado que se obtiene usando coincidencias es bastante


similar al de correlaciones y distancias, como suelen serlo en la práctica. La
aglomeración si sugiere que el conjunto [2,5] es bastante diferente al de todos los
demás actroes. Las correlaciones y distancias euclidianas tendían a enfatizar la
diferencia del conjunto [6,3,10] y a aminorar la particularidad única de [2,5].

COEFICIENTES DE JACCARD

En algunas redes las conexiones son bastante escasas. En efecto, si se están


investigando relaciones de tipo personal en organizaciones grandes, los datos pueden
tener muy baja densidad. Donde la densidad es muy baja, las medidas de
coincidencias, correlaciones y distancias puden mostrar escasa variación entre los
actores y pueden dificultar el discernimiento de los conjuntos de equivalentes
estructurales (por supuesto, en redes muy grandes, con baja densidad, puede haber
en realidad muy bajos niveles de equivalencia estructural).

Un enfoque para resolver este problema consiste en calcular el número de veces que
ambos actores reportan una relación (del mismo tipo de vínculo) a los mismos terceros
actores como un porcentaje del número total de vínculos reportados. Esto es,
ignoramos los casos en que ni X o Y están ligados a Z, e inquirimos, qué porcentaje
en común tienen en relación a la totalidad de vínculos presente. Esta medida se llama
porcentaje de coincidencias positivas (por UCINET), o el coeficiente Jaccard (en
SPSS). He aquí el resultado obtenido de los datos:

12
Percent of Positive Matches (Jaccard coefficients)
1 2 3 4 5 6 7 8 9 10
COUN COMM EDUC INDU MAYR WRO NEWS UWAY WELF WEST
----- ----- ----- ----- ----- ----- ----- ----- ----- -----
1 1.00
2 0.54 1.00
3 0.46 0.31 1.00
4 0.60 0.54 0.42 1.00
5 0.50 0.93 0.38 0.50 1.00
6 0.18 0.27 0.11 0.18 0.25 1.00
7 0.58 0.64 0.54 0.55 0.60 0.08 1.00
8 0.67 0.46 0.50 0.67 0.43 0.20 0.38 1.00
9 0.67 0.36 0.50 0.55 0.33 0.11 0.64 0.56 1.00
10 0.40 0.43 0.44 0.60 0.36 0.38 0.31 0.50 0.36 1.00
HIERARCHICAL CLUSTERING OF JACCARD COEFFICIENT MATRIX
1
Level 6 2 5 3 4 1 8 7 9 0
----- - - - - - - - - - -
0.929 . XXX . . . . . . .
0.667 . XXX . . XXX . . .
0.644 . XXX . XXXXX . . .
0.636 . XXX . XXXXX XXX .
0.545 . XXX . XXXXXXXXX .
0.497 . XXX XXXXXXXXXXX .
0.435 . XXXXXXXXXXXXXXX .
0.403 . XXXXXXXXXXXXXXXXX
0.272 XXXXXXXXXXXXXXXXXXX

Nota: De nuevo el cuadro básico emerge, sugiriendo que no importa mucho qué
estadístico se usa para indexar la similaridad estructural entre un par de actores - al
menos para obtener el cuadro general. La aglomeración de estas distancias esta vez,
enfatiza la singularidad del actor # 6, el cual es aún más singular por esta medición
debido al número relativamente pequeño del total de relaciones que tiene, que resulta
en un nivel de similitud aún menor debido a que se ignora la ausencia de lazos
conjuntos. Cuando los datos son ralos, y hay muy sustanciales diferencias en los
grados de los puntos, es una buena opción para datos nominales o binarios, usar el
coeficiente de coincidencia positiva.

Con algo de inventiva, se puede pensar en algunas otras formas de indexar el grado
de similitud estructural entre actores. Se puede usar la rutina "proximities" de SPSS,
que ofrece una colección grande de medidas de similitud, junto con una buena
discusión de ellas. La elección de la medida debe estar orientada por la noción
conceptual de qué es lo importante acerca de la similaridad de dos perfiles de relación
para los propósitos del análisis particular. A menudo, con franqueza, hace poca
diferencia, pero esto no es suficiente para ignorar la cuestión.

13
DESCRIPCIÓN DE CONJUNTOS DE EQUIVALENCIA
ESTRUCTURAL: MODELOS E IMÁGENES DE BLOQUES

Los enfoques que hemos examinado hasta ahora procuran proveer sumarios de cuán
similares o distintos son un par de actores usando la vara de la equivalencia
estructural. Estas matrices de similitud o proximidad (y a veces, de su opuesto,
distancia), proveen una completa descripción de parejas de estos aspectos de
posiciones en las redes. Pero es difícil ver el bosque por medio de los árboles, las
matrices de distancia y similitud a veces son tan grandes y densas como las matrices
de adyacencia o de vínculos de las que se derivan.

Un enfoque muy útil para obtener el cuadro general consiste en aplicar el análisis de
conglomerados para intentar discernir cuantos conjuntos de equivalencia estructural
hay, y cuáles actores están en cada conjunto. Vimos antes varios ejemplos acerca de
cómo se puede usar el análisis de conglomerados para presentar cuadros más
simples y sintéticos de patrones de similitud o disimilaridad de la posición estructural
de actores. El análisis de conglomerados está fuertemente afincado en
comparaciones de pares y jerárquicas. También asume la unidimensionalidad
subyacente en los datos de similitud. A menudo es útil considerar otros enfoques que
tienen distintos sesgos. Uno de ellos es el escalamiento multidimensional, que no
será discutido aquí, ya que raramente se usa para analizar datos de equivalencia
estructural. Examinaremos tres enfoques más comunes: CONCOR, análisis de
componentes principales y búsqueda de tabú.

La matriz de similitud y el análisis de conglomerados no dicen cuáles son las


similitudes que hacen que los actores de un conjunto sean similares y cuáles
diferencias hacen que los actores en un conjunto sean distintos a los actores en otro.
Para comprender las bases de similitud y diferencias entre actores estructuralmente
equivalente es pertinente el enfoque del modelo de bloques y la matriz de imagen que
se basa en él. Ambas ideas se han explicado antes. Vamos a mirar ahora como nos
pueden ayudar a entender los resultados del CONCOR y de la búsqueda de tabú.

14
CONCOR

Este es un enfoque que se ha usado hace tiempo. Aunque su algoritmo se ve


actualmente como algo peculiar, la técnica generalmente produce resultados
significativos. Comienza correlacionando cada par de actores. Cada fila de esta
matriz de correlación actor por actor, se extrae y se correlaciona con cada una de las
otras filas. En un sentido, el enfoque es equivalente a preguntarse ¿cuán similiar es el
vector de similitudes del actor X con el vector de similitudes del actor Y? El proceso se
reitera una y otra vez. Eventualmente los elementos de la matriz de correlación
iterada converge en un valor de +1 o -1.

CONCOR entonces divido los datos en dos conjuntos sobre la base de esas
correlaciones. Luego, en cada conjunto (si tienen más de dos actores) el proceso se
repite. Continúa hasta que todos los actores son separados (o hasta que perdemos
interés en el proceso). El resultado en un árbol binario que da lugar a la partición final.

Para ilustrarlo pedimos a CONCOR nos muestre los grupos que mejor satisfacen esta
propiedad cuando creemos que hay cuatro grupos. Todos los algoritmos de bloques
requieren que tengamos una idea a priori acerca de cuantos grupos hay.

Matriz de bloques

15
Nota: La matriz de bloques ha reagrupado las filas y columnas (e insertado líneas
divisorias o "particiones") para intentar poner juntos a los actores que tienen filas y
columnas similares (dada la restricción de forzar en cuatro grupos). La matriz de
bloques nos permite ver las similitudes que tienen los cuatro grupos (y también que las
agrupaciones no son perfectas). El primer grupo [1,4,8,9] no presenta un perfil
consistente de envío y recepción de información entre sus integrantes, no son un
clique. La relación de este grupo [1,4,8,9] con el próximo [7,3] es interesante. Todos
los actores del primer grupo envían información al 7 pero no a 3. Solamente un actor
del primer grupo recibe información de [7,3] y lo hace de ambos integrantes. Cada
miembro del grupo [1,4,8,9] envía y recibe información de ambos miembros de [5,2].
Finalmente el conjunto [1,4,8,9] es similar pues no envían ni reciben información de
[6,10]. Los actores 5 y 2 tienen perfiles casi idénticos de la comunicación recíproca
con todos los miembros de cualquier otro grupo, con la excepción de [6,10]. Por último
[6,10] está aislado, pero envía a ambos [7,3]; y comparten el hecho de que sólo [3] les
reciproca.

El diagrama de bloques permite ver con bastante claridad qué actores son
estructuralmente equivalentes, y , más importante, qué de los patrones de sus
relaciones define la similitud. En algunos casos desearíamos sintetizar la información
aún mas, creando una imagen del diagrama de bloques. Para ello, combinamos
elementos de las filas y columnas en grupos y caracterizamos las relaciones en la
matriz como presente si despliegan una densidad mayor a la promedio (recordemos
que en esta matriz la densidad general es .50). Si menos lazos están presente, se
introduce un cero. La imagen de los bloques es:

Nota: Esta "imagen" del diagrama de bloques tiene la virtud de una simplicidad
extrema, aunque una buena cantidad de información acerca de las relaciones entre
actores se ha perdido. Dice que los actores en el bloque 1 tienden a no enviar y
recibir recíprocamente o con el bloque 4; tienden a enviar información a los bloques 2

16
y 3 pero reciben información sólo del 3. El segundo bloque de actores aparecen como
receptores. Envían sólo al bloque 3, pero reciben información de cada uno de los
otros grupos. El tercer bloque envía y recibe con los bloques 1 y 2, pero no con el 4.
Finalmente, tal como antes, los actores del bloque 4 envían a los actores del bloque 2
pero no reciben información de ninguno de los otros bloques.

Se puede avanzar un paso más en la simplificación. Usando los conjuntos


seccionados como nodos, y la imagen como un conjunto de adyacencias, podemos
representar los resultados de la siguiente forma:

Comentario: Este gráfico más simplificado sugiere la marginalidad de 4, la


reciprocidad y centralidad de las relaciones de 3 y la asimetría entre 1 y 2.

Hemos presentado los resultados de CONCOR en detalle para ilustrar la utilidad de


permutar y generar bloques, calcular la imagen y graficar el resultado. CONCOR
puede generar resultados peculiares que no son reproducidos por otros métodos. Si
se usa CONCOR, es recomendables comparar sus resultados con otros algoritmos,
una de esos métodos de comparación es la búsqueda tabú (que a su vez genera
resultados peculiares que deben ser comparados).

La bondad de ajuste de un modelo de bloques se puede evaluar correlacionando la


matriz permutada (el modelo de bloques) contra un modelo perfecto con los mismos
bloques, esto es, uno en el que todos los elementos de un bloque son unos y todos los
elementos de bloques cero son cero. Para un modelo CONCOR de dos divisiones
(cuatro grupos) el r cuadrado (r 2) es .50, es decir, la mitad de la varianza en los lazos
del model CONCOR se pueden explicar por un modelo estructural de bloques
perfecto. Lo que puede ser considerado como aceptables aunque no sea una bondad
muy buena ya que no hay criterios acerca de qué es una adecuada bondad de ajuste.

17
BÚSQUEDA DE TABÚ

Este método ha sido desarrollado recientemente y se basa en el uso intensivo de la


computación. Usa un algoritmo más moderno y computacionalmente intensivo que el
CONCOR, para tratar de implementar la misma idea de agrupar juntos a actores que
son casi similares en un bloque. Lo hace buscando conjuntos de actores que, si se
ponen en un bloque, producen la suma menor de varianzas de los perfiles de relación,
dentro de los bloques. Si dos actores tienen relaciones similares las varianzas
respecto al promedio del bloque será pequeña. De modo que la partición que
minimiza la suma de varianzas dentro de los bloques, está minimizando la varianza
general de los perfiles de relación. En principio, este método debería producir
resultados similares (pero no necesariamente idénticos) que CONCOR. En la práctica
no siempre es así. A continuación se presentan los resultados de este método con
una especificación de 3 grupos.

Matriz de Bloques Adyacentes

Comentario: Los bloques producidos son similares al resultado con CONCOR. Un


conjunto de actores [1,4,8,9] es idéntico. El bloque CONCOR [7,3] se divide en los
nuevos resultados, con el actor 7 agrupado con [5,2] y el actor 3 con el [6,10].
Examinando la matriz permutada y de bloques adyacentes, se puede ver que regiones

18
amplias de la matriz tienen ahora varianza mínima - las entradas en las celdas son las
mismas. Esto es lo que el modelo de bloques intenta hacer: producir regiones lo más
grande posibles, con homogeneidad de puntajes. Podemos interpretar directamente
los resultados o producir una imagen de bloques:

Comentario: Esta imagen sugiere que dos de los tres bloques es algo más solidario,
en tanto que sus miembros envían y reciben información entre ellos (bloques 1 y 2).
Los actores en el bloque 3 son similares por cuanto no intercambian información entre
ellos directamente. Lo que estamos viendo es una especie de jerarquía entre bloques
1 y 2, con el bloque 3 más aislado. Estos patrones se pueden representar en un
gráfico.

La bondad de ajuste de un modelo de bloques puede ser evaluado correlacionando la


matriz permutada (el modelo de bloques) contra un modelo perfecto con los mismos
bloques (uno en el que todos los elementos de un bloque son unos y todos los
elementos de bloques cero son cero). Para el modelo de búsqueda tabú para tres
grupos, este r2 es .47. El que no es muy grande. Notamos que es una bondad de
ajuste tan buena como la del modelo CONCOR con un grupo adicional. Por supuesto,
uno puede ajustar modelos para varios números de bloques y graficar las estadísticas
r2 para decidir cual de ellos es el óptimo.

19
ANÁLISIS FACTORIAL, DE COMPONENTES PRINCIPALES

Todos los enfoques de equivalencia estructural se centran en la similaridad de


patrones de relación de cada actor con los demás. Si esos patrones son similares,
entonces los actores son estructuralmente equivalentes.

El análisis de conglomerados, búsqueda tabú y CONCOR, comparten en común el


supuesto de que se busca una similaridad global o singular en una única dimensión.
Esto, sin embargo, no garantiza que la matriz de similitud entre los perfiles de relación
de los actores sea unidimensional. El análisis factorial y el escalamiento
multidimensional de la matriz de similitud o de distancia relaja este supuesto. Estos
métodos escalares sugieren que, subyacentes a las similitudes observadas, puede
haber más de un aspecto o forma del patrón de equivalencia estructural y que los
actores que son estructuralmente similares en un aspecto o dimensión pueden ser
disimilares en otra.

La implementación de UCINET del enfoque de componentes principales busca la


similitud en los perfiles de distancias de un actor a los demás. Los otros enfoques,
que vimos antes, examinan los lazos desde y hacia los actores con datos
direccionados. Por supuesto el análisis factorial puede ser aplicado a cualquier matriz
rectangular simétrica, de modo que la opción de UCINET es una entre otros enfoques
posibles.

Se calculan las correlaciones entre pares de filas en la matriz de distancia. Luego se


realiza un análisis de componentes principales y las ponderaciones se rotan (la
documentación de UCINET no describe el método usado para decidir cuántos factores
retener, ni se describe el método de rotación). A continuación se presenta parte del
resultado obtenido con la rutina CATIJ de UCINET.

20
21
Comentario: El análisis factorial identifica una clara y fuerte dimensión, y dos
adicionales que son esencialmente internas. El segundo y tercer factor se deben a la
particularidad de los patrones de las distancias de EDUC y a los patrones de las
distancias de WRO. Estas distancias no se pueden explicar por los mismas patrones
subyacentes de los otros, lo que sugiere que estas dos organizaciones no pueden ser
priorizadas en las mismas dimensiones de similitud de que las otras.

Este resultado es bastante distinto al obtenido con los otros métodos. En parte se
debe al uso de distancias en vez de adyacencias. La principal razón para la
diferencias es, sin embargo, que los métodos factoriales (y de escalamiento
multidimensional) buscan por dimensionalidades en los datos, en vez de suponer
unidimensionalidad. Los resultados sugieren que las organizaciones 3 y 6 no son
estructuralmente equivalentes a las otras y que sus lazos difieren en su significado o
función de los vínculos entre las otras organizaciones. En un sentido, el resultado
implica que el intercambio de información para estas dos organizaciones puede ser de
un tipo de vinculación distinto que el de las demás organizaciones.

Si se mira a la ubicación de nodos en la primera dimensión, se puede ver que las


organización están ordenadas de una manera similar a la obtenida con los otros
resultados. Uno podría imaginar que seleccionando puntos de corte a lo largo de la
primera dimensión se obtendrían agrupaciones agrupaciones {4,8,1,7,8}, {5}, {2,10},
{3,6}. Estas son bastante similares, si no idénticas, a las encontradas en los otros
análisis.

Es sugerente el uso del análisis factorial para purificar las agrupaciones por medio de
la extracción y remoción de dimensiones secundarias. Como casi todos los usos del
análisis factorial, sin embargo, debería ser usado juiciosamente. Los resultados
pueden ser similares, o muy distintos a los obtenidos con métodos de escalamiento
unidimensional. Como siempre, no hay ninguno inherentemente correcto.

ESCALAMIENTO MULTIDIMENSIONAL

Una variación del algoritmo CATIJ es el escalamiento multidimensional, MDS, el cual,


como el análisis factorial y de conglomerados, son una gran familia de técnicas algo
diversas. Su mayor utilidad radica en que presenta los patrones de similitud o
disimilaridad de los perfiles de relación entre actores (cuando se aplica a adyacencia o
distancias), como un mapa de un espacio multidimensional. Este mapa permite ver
cuán cercanos están los actores, si se aglomeran en el espacio multidimensional y

22
cuánta variación presentan en cada dimensión. A continuación se presentan los
resultados de la rutina no paramétrica de UCINET usada para generar un mapa
bidimensional de la matriz de adyacencia.

23
Comentario: El stress en dos dimensiones es bajo, esto es, la bondad de ajuste es
alta. Esto sugiere que la tercera dimensión identificada por el análisis factorial previo
puede no haber sido necesaria. EDUC y WRO son de nuevo identificados como
estableciendo una dimensión distinta de las similaridades, en este caso dim 1. La
aglomeración de casos en la dimensión principal, la dim 2, no corresponde muy
cercanamente a los métodos de bloques ni factorial {1,10}, {2,4,5,7,8}, {9}.

Esto puede deberse a varias razones, tales como usar distancias euclidianas en vez
de correlaciones, dos en vez de tres dimensiones, etc. Una vez mas no se trata de
que una solución sea la correcta y las demás no. El enfoque MDS está mostrandonos

24
algo diferente y adicional acerca de las equivalencias estructurales aproximadas de
estos puntos.

RESUMEN DEL CAPÍTULO IX

Hemos discutido la idea de equivalencia estructural de los actores y hemos visto


algunas de las metodologías que son usadas para medirla, encontrar patrones en los
datos empíricos y describir el conjunto de actores sustituibles.

La equivalencia estructural de dos actores es el grado al cual ambos tienen el mismo


perfil de relaciones con otros en la misma red. La equivalencia exacta es rara en la
mayoría de las estructuras sociales (una interpretación de equivalencia exacta es que
representa una redundancia sistemática de los actores, que puede ser de alguna
manera funcional para la red).

Aunque se puede a veces ver patrones de equivalencia estructural a ojo en una matriz
de adyacencia o en un diagrama, casi siempre debemos usar métodos numéricos.
Estos nos permiten lidiar con datos multiplejos, grandes números de actores y datos
valorizados, así como de tipo binario, como el que hemos examinado aquí.

El primer paso es producir una matriz de similitud o distancia para todo par de actores.
Esta matriz sintetiza la similaridad o disimilaridad general de cada par de actores en
términos de sus relaciones con otros. Hay varias maneras de calcular esos índices,
los mas comunes son la correlación Pearson, la distancia euclidiana, la proporción de
coincidencias (para datos binarios) la proporción de coincidencias positivas
(coeficiente Jaccard, también para datos binarios).

Se pueden usar varios métodos para identificar patrones en matrices de similitud o de


distancia y para describirlos. El análisis de conglomerados agrupa juntos a los dos
actores más similares entre sí, recalcula las similitudes e itera hasta que se ha
combinado a todos los actores. Lo que produce una secuencia de aglomeración o
mapa en el cual los actores se ubican en una jerarquía de inclusión incremental a
grupos, que en consecuencia, son menos exactamente equivalentes. El escalamiento
multidimensional y el análisis factorial se pueden usar para identificar qué aspectos de
los perfiles de relación son más críticos para hacer a los actores más similares o
distintos y también se pueden usar para identificar agrupaciones. La agrupación de
actores estructuralmente equivalentes puede ser identificada por el método divisivo de
iterar la matriz de correlación de actores (CONCOR) y por el método directo de

25
permutación y búsqueda de bloques de ceros y unos perfectos en la matriz de
adyacencia (búsqueda tabú).

Una vez que se ha determinado el número de agrupaciones adecuado, los datos se


pueden permutar y agrupar en bloques y calcular las imágenes. Estas técnicas hacen
posible visualizar cómo son aproximadamente equivalentes los actores de un conjunto
y porqué distintos conjuntos son diferentes. Nos permiten describir el significado de
los grupos y ubicar a sus miembros en la red.

El análisis de equivalencia estructural a menudo produce hallazgos interesantes y


reveladores acerca de los patrones de relación y las conexiones entre los actores
individuales en una red. El concepto de equivalencia estructural busca operacionalizar
la noción de que los actores pueden tener posiciones idénticas o casi iguales en una
red, y, por lo tanto, ser directamente sustituibles por el otro. Una explicación
alternativa es que los actores que son estructuralmente equivalentes enfrentan la
misma matriz de restricciones y oportunidades en sus participaciones sociales.

El análisis sociológico no es acerca de sujetos individuales y el análisis estructural


está ocupado, primariamente, con la idea más general y abstracta de roles o
posiciones que definen la estructura del grupo, más que la ubicación de actores
específicos en relación a otras personas. Para tal análisis, usaremos un conjunto de
herramientas que permiten estudiar la replicación de subestructuras, la equivalencias
automórfica, y los roles sociales, la equivalencia regular.

26
INTRODUCCIÓN A LOS MÉTODOS DEL
ANÁLISIS DE REDES SOCIALES.

CAPÍTULOS DÉCIMO Y DECIMOPRIMERO

Robert A. Hanneman. Departamento de Sociología de la


Universidad de California Riverside.
NOTA PREVIA

Este documento esta traducido para la lista REDES con permiso del autor a partir de la
versión electrónica disponible en
http://wizard.ucr.edu/~rhannema/networks/text/textindex.html [Consulta: 20-02-02].

Estos capítulos han sido traducidos por René Ríos, Departamento de Sociología de la
Universidad Católica de Chile.

2
CAPÍTULO X. EQUIVALENCIA AUTOMÓRFICA.

DEFINICIÓN

La definición de Equivalencia Automórfica es menos compleja que la de equivalencia


estructural, pero algo más que la equivalencia regular. Hay una jerarquía de estos tres
conceptos de equivalencia. Cualquier conjunto de equivalencias estructurales es
también automórfico y regular. Cualquier conjunto de equivalencias automórficas lo es
regular, Pero no toda equivalencia regular es necesariamente automórfica o
estructural; y no todas las equivalencias automórficas son necesariamente
estructurales.

Formalmente, "dos vértices u y v de un grafo etiquetado G son automórficamente


equivalentes si todos los vértices pueden ser re etiquetados para formar un grafo
isomórfico con las etiquetas de u y ve intercambiadas. Dos vértices automórficamente
equivalentes comparten exactamente las misma propiedades independientes de
rótulo. (Borgatti, Everett y Freeman, 1996: 119).

De un modo más intuitivo, son actores automórficamente equivalentes, si podemos


permutar el grafo de manera tal que el intercambiar los dos actores no tiene efectos en
las distancias entre todos los actores del grafo. Para establecer su equivalencia
automórfica podemos primer imaginar el cambiar sus posiciones en la red. Luego
miramos y vemos si, al cambiar a algún otro actor, podemos crear un grafo en el cual
todos los actores están a la misma distancia a la que estaban en el grafo original.

En el caso de la equivalencia estructural, dos actores son equivalentes si podemos


intercambiarlos y no afectar las propiedades del grafo. Los actores automórficamente
equivalentes son actores que pueden ser intercambiados sin efecto en el grafo, dado
que otros actores también han sido movidos. Si aún no le queda claro el concepto, no
desespere, continúe la lectura y vuelva a la definición después de ver algunos
ejemplos.

USOS DEL CONCEPTO

La equivalencia estructural enfoca nuestra atención a la comparación pareada de


actores. al tratar de encontrar actores que pueden ser enrocados, estamos en

3
realidad mirando las posiciones de los actores en una red en particular. Estamos
tratando de encontrar actores que son clones de substitutos.

La equivalencia automórfica comienza por cambiar el foco de nuestra atención,


llevándonos hacia una visión más abstracta de la red que las posiciones individuales.
Se pregunta si toda la red puede ser reordenada, poniendo a distintos actores en
diferentes nodos, pero dejando la estructura relacional, o esqueleto de la red intactos.

Supongamos que hay diez trabajadores en un restaurante franquiciado, como


MacDonald´s, que reportan a un gerente. Este a su vez reporta al dueño de la
franquicia que controla otro restaurante franquiciado. También tiene un gerente y 8
trabajadores. Si el propietario decide transferir al gerente del primer restaurante al
segundo y viceversa, la red ha sufrido una disrupción. Pero si el gerente transfiere a
los gerentes y a los trabajadores, la red permanece intacta. La transferencia es una
permutación en el grafo que deja todas las distancias entre el par de actores
exactamente como estaba antes de la transferencia. En este sentido, el personal de
un restaurante es equivalente al del otro, aunque las personas individuales no sean
sustituibles.

El ejemplo hipotético de los restoranes ilustra la principal utilidad del concepto de


equivalencia automórfica. En vez de preguntarse qué individuos pueden ser
intercambiados sin modificar las relaciones sociales descritas por el grafo
(equivalencia estructural), el concepto, algo más relajado de equivalencia automórfica
enfoca la atención hacia conjuntos de actores que son sustituíbles como sub grafos,
en relación a otros subgrafos. En muchas estructuras sociales, puede haber muchas
sub estructuras que son equivalentes a otras. El número, tipo, y relaciones entre tales
subestructuras pueden ser bastante intersantes. Muchas estructuras que se ven muy
grandes y complejas, pueden estar compuestas, al menos parcialmente, de múltiples
subestructuras idénticas; las que pueden ser sustitutas de otras. De hecho si un
MacDonald´s es un MacDonald´s, es un MacDonal´s...

LA BÚSQUEDA DE CONJUNTOS EQUIVALENTES

En principio, se pueden identificar los automorfismo en un grafo, por el método de la


fuerza bruta consistente en examinar toda posible permutación del grafo. Con uno
pequeño, y un computador rápido, es útil hacerlo así. Básicamente, se examina toda
permutación posible para ver si tienen la misma estructura de vínculos que el grafo
original. Para grafos más grandes el número de permutaciones que requieren ser

4
comparadas se vuelve extremadamente grande. Para los grafos de muchas redes
reales, no los ejemplos soñados por los teóricos, puede no haber automorfismos
exactos. Para grafos complicados, y particularmente para grafos dirigidos o valorados,
la cantidad de capacidad computacional requerida puede ser abrumadora y se puede
asegurar queno habrá mas que unas pocas equivalencias si las hay.

Al igual que con la equivalencia estructural, puede ser útil identificar automorfismos
aproximados, los que pueden surgir cuando la medición de relaciones contiene
errores, cuando la variabilidad muestral ofrece un cuadro incompleto de la red o
cuando las relaciones que generan una red no está en equilibrio, es decir cuando los
procesos de transitividad y balance no están completos cuando se colecta los datos.
O, por supuesto, puede darse el caso de que en una red exista verdaderamente un
conjunto de actores que son similares entre sí, pero no exactamente equivalentes.
UCINET provee diversos enfoques para identificar conjuntos de actores que son
aproximadamente equivalentes automórficamente.

La equivalencia geodésica se enfoca en la similitud de los perfiles de las distancias


geodésicas de un actor con otros. La idea puede ser aplicada a datos dirigidos o no
dirigidos y para datos binarios o valorizados. Primero se calcula la matriz de distancia
geodésica. Segundo, el vector de distancia geodésica de cada actor es extraída y los
elementos se ordenan. Tercero, se calcula para los vectores ordenados, la medida
de disimilaridad de distancia euclidiana. La resultante matriz de distancia sintetiza la
disimilitud por pares en el perfil de distancias geodésicas del actor. El elemento clave
aquí es que se trata de la comparación entre dos actores, del perfil de distancias
geodésicas y no de las distancias geodésicas dirigidas a los mismos receptores. En
tanto ambos actores tengan la misma mezcla de distancias geodésicas, serán
equivalentes.

Una vez que la matriz de disimilitudes ha sido generada, se pueden usar análisis de
conglomerados o escalamiento dimensional para identificar particiones de actores
aproximadamente equivalentes.

El algoritmo maxsim de UCINET es una extensión del enfoque de equivalencia


geodésica, que es particularmente útil para datos orientados y valorizados. El
algoritmo comienza con una matriz de distancia (o con una concatenación de
distancias desde y de distancia a, para datos direccionados). Las distancias de cada
actor se ordenan de menor a mayor y la distancia euclidiana se usa para calcular la
disimilaridad de perfiles de distancia entre cada par de actores. El algoritmo puntúa

5
como automórficamente equivalentes a los actores que tienen perfiles similares de
distancia. Nuevamente, el foco radica en saber si el actor u tienen un conjunto similar
de distancias, sin importar las distancias, con el actor v. El escalamiento dimensional
o aglomeración de distancias se pueden usar para identificar conjuntos de actores
aproximadamente automórficamente equivalentes.

Búsqueda tabú, es un método numérico para encontrar la mejor división de actores en


un número dado de particiones sobre la base de la equivalencia automórfica
aproximada. Al usar este método, es importante explorar el rango de posibles
números de particiones, a no ser que se disponga de uno a priori por la teoría, para
determinar cuántas particiones son útiles. Una vez seleccionado el número de
particiones es útil reiterar el algoritmo varias veces para asegurarse que se ha
encontrado un mínimo global y no uno local.

El método comienza con la asignación estocástica de particiones. Una medida de


maldad de ajuste se construye calculando la suma de cuadrados para cada fila y
columna dentro de un bloque y la varianza de esas sumas de cuadrados. Estas
varianzas se suman luego a través de los bloques para construir una medida de
bondad de ajuste. La búsqueda continúa hasta encontrar una asignación de actores a
particiones que minimice el estadístico de maldad de ajuste.

Lo que se está minimizando es una función de la disimilaridad de la varianza de


puntajes dentro de las particiones. Esto es, el algoritmo busca agrupar juntos a
actores que tienen similares cantidades de variabilidad en sus puntajes de filas y
columnas en los bloques. Los actores que tienen una variabilidad similar es probable
que tengan perfiles similares de vínculos enviados y recibidos dentro y entre bloques,
aunque no necesariamente tienen los mismos vínculos con los mismos otros actores.

Al revés de otros métodos mencionados aquí, la búsqueda tabú, produce una matriz
particionada, y no un matriz de disimilaridades. También provee de un estadístico de
maldad de ajuste. Ambos resultados hacen recomendable este enfoque quizás
combinado con otros métodos.

6
ALGUNOS EJEMPLOS

La red estrella analizada por distancia geodésica.

Sabemos que a partición {A}, {B,C,D,E,F,G} define conjuntos estructuralmente


equivalentes. Por consiguiente, esta es también una partición automórfica. Aunque
este sea un resultado obvio, sirve como ejemplo para comprender los algoritmos
necesarios para identificar equivalencias automórficas. El resultado del algoritmo de
equivalencia geodésica de UCINET para identificar conjuntos de equivalencia
automórfica es el siguiente:

Comentario: Los actores están listados en las filas, el número de sus geodésicas de
distintas longitudes están en las columnas.

7
Nota: Las disimilaridades están medidas como distancias euclidianas.

Nota: La aglomeración de distancias claramente divide en dos conjuntos, centro y


periferia.

LA RED LINEAL ANALIZADA CON MAXSIM

La red lineal es interesante por las divergencias entre centralidades y grado de


intermediación de los actores.

Este es el producto del algoritmo Maxsim de UCINET (nodo 1 = "A", nodo 2 ="B", etc.)

AUTOMORPHIC EQUIVALENCE VIA MAXSIM


NOTA: Binary adjacency matrix converted to reciprocals of geodesic
distances. Matriz binaria de adyacencia convertida a recíprocos de
distancias geodésicas.

Comentario: Maxsim es mas útil con datos valorizados, de modo que se analizan las
recíprocas de las distancias en vez de las adyacencias.

8
DISTANCIAS ENTRE ACTORES

1 2 3 4 5 6 7
---- ---- ---- ---- ---- ---- ----
1 0.00 3.22 3.62 3.73 3.62 3.22 0.00
2 3.22 0.00 1.16 1.37 1.16 0.00 3.22
3 3.62 1.16 0.00 0.50 0.00 1.16 3.62
4 3.73 1.37 0.50 0.00 0.50 1.37 3.73
5 3.62 1.16 0.00 0.50 0.00 1.16 3.62
6 3.22 0.00 1.16 1.37 1.16 0.00 3.22
7 0.00 3.22 3.62 3.73 3.62 3.22 0.00

HIERARCHICAL CLUSTERING OF (NON-)EQUIVALENCE MATRIX


Level 4 5 3 2 6 1 7
----- - - - - - - -
0.000 . XXX XXX XXX
0.500 XXXXX XXX XXX
1.212 XXXXXXXXX XXX
3.383 XXXXXXXXXXXXX

Comentario: La aglomeración primero separa como equivalentes, el conjunto de los


dos actores de las puntas, luego el siguiente para hacia adentro, el siguiente y el
centro. Analice Ud. mismo para convencerse de que este es un automorfismo válido,
y de hecho exacto, de este grafo.

LA RED DE WASSERMAN-FAUST ANALIZADA POR TODAS LAS


BÚSQUEDAS DE PERMUTACIONES

El grafo presentado por Wasserman y Faust es ideal para ilustrar las diferencias entre
las equivalencias estructurales, automórficas y regular. Antes de mirar los resultados,
vea si puede escribir cuales son las posiciones automórficamente equivalentes en esta
red.

He aquí el producto del examen de UCINET para todas las permutaciones de este
grafo.

9
Comentario: El algoritmo examinó más de trescientos mil posibles permutaciones del
grafo. Vemos que dos de las ramas (B,E, F y D,H,I) son intercambiables como
subestructuras completas.

La red de intercambio de información entre burocracias de Knoke, analizada con


búsqueda TABU.

Ahora examinaremos datos más complejos. En los datos de información de Knoke no


hay automorfismos exactos, lo que no es sorprendente dada la complejidad del patrón
de conexiones, particularmente si distinguimos entre vínculos entrantes y salientes
(emisores y receptores).

10
Al igual que con la equivalencia estructural, puede ser útil examinar aproximada
equivalencia automórfica. Para ello es útil el algoritmo de búsqueda TABU.
Seleccionamos el número de particiones a evaluar y el programa busca encontrar el
error mínimo al agrupar los casos.

He aquí los resultados del análisis de los datos de Knoke con el algoritmo de
búsqueda TABU de UCINET. Primer examinamos la bondad de ajuste de diferentes
números de particiones de los datos.

Comentario: No hay una respuesta correcta acerca de cuántos automorfismo hay


aquí. Hay dos respuestas triviales: aquella que agrupa todos los casos juntos en una
partición y aquella que separa cada caso en su propia partición. Entre medio uno
podría seguir la lógica del gráfico "scree" del análisis factorial para seleciconar un
número significativo de particiones. Miremos primero los resultados para tres
particiones:

11
Comentario: Las filas y columnas de WRO tiene varianzas similares (altas), y las filas
y columnas de MAYR tienen similares varianzas (bajas). Pareciera que el algoritmo ha
funcionado bien al dividir la matriz en bloques de modo que produzca filas y columnas
con similar varianza dentro de los bloques. Una visión bastante simple, pero no tan
cruda, de los datos es que el MAYR y el WRO son bastante únicos, y tienen relaciones
similares con actores más o menos intercambiables en el resto del grupo grande.

Por supuesto que, con más particiones, podemos lograr mejor bondad de ajuste. Los
analistas tendrán que ejercer su propio juicio, dados los objetivos de su estudio,
acerca de si un mejor ajuste significa un mejor modelo o tan sólo uno que es más
complicado. He aquí el resultado para siete particiones:

12
Comentario: En este caso, particiones adicionales de los datos dan por resultado la
separación adicional de actores individuales en torno a un centro más grande. Lo cual
no es necesariamente el caso, pues podrían haber resultado facciones o divisiones de
particiones, así como la separación de actores individuales. Nos queda una visión de
la red como una en la que hay un núcleo con cerca de la mitad de los actores que son
más o menos sustituibles en sus relaciones con otras posiciones, seis, en el resultado
mostrado.

RESUMEN CAPÍTULO X

En un sentido, el tipo de equivalencia expresada bajo la noción de automorfismo cae


entre la equivalencia estructural y la regular. La estructural significa que los actores
individuales pueden ser sustituidos unos por otros. La automórfica que las
subestructuras de los grafos se pueden sustituir. Como veremos a continuación, la
equivalencia regular va aún más allá, y busca lidiar con clases o tipos de actores, en

13
que cada miembro de cualquier clase tiene relaciones similares con algún miembro de
cada una de las otras.

La noción de equivalencia estructural corresponde bien con los análisis enfocados en


la manera que los individuos están imbricados en las redes, o análisis reticular
posicional. La noción de equivalencia regular enfoca la atención en clases de actores,
o roles, más que en individuos o grupos. El análisis de equivalencias automórfica está
entre estos focos más convencionales y no ha recibido aún mucha atención en la
investigación empírica. Con todo, la búsqueda de subestructura de sustitución
múltiple en grafos, particularmente en grandes y complejos, puede revelar que la
complejidad de estructuras muy grandes es más aparente que real; a veces son
descomponibles, al menos parcialmente, en similares múltiples estructuras mas
pequeñas.

14
CAPÍTULO XI. EQUIVALENCIA REGULAR

DEFINICIÓN

La equivalencia regular es la menos restrictiva de las tres definiciones más


comúnmente usadas. Es, sin embargo, la más importantes para el sociólogo. Esto
porque el concepto de equivalencia regular y los métodos empleados para identificar y
describir los conjuntos equivalentes se corresponden cercanamente con el concepto
sociológico de rol. La noción de roles sociales es central en la mayoría de las
teorizaciones sociológicas.

Formalmente, "dos actores son regularmente equivalentes si están igualmente


relacionados con otros equivalentes (Borgatti, Everett y Freeman, 1996: 128). Los
conjuntos regularmente equivalentes están compuestos por actores que tienen
similares relaciones con miembros de otros conjuntos de equivalentes regulares. El
concepto no se refiere a vínculos con otros actores específicos, o a la presencia de
sub grafos similares; los actores son regularmente equivalentes si tienen lazos
similares con cualquier otros miembros de otros conjuntos.

El concepto es más fácil de captar intuitivamente que formalmente. Susan es la hija


de Inga. Debora es la hija de Sally. Susan y Debora forman un conjunto regularmente
equivalente porque cada una tiene un vínculo con un miembro de otro conjunto. Inga y
Sally forman un conjunto porque cada una tiene un vínculo con un miembro de otro
conjunto. En lo referido a la equivalencia regular no nos interesa qué hija va con cuál
madre; lo que es identificado por la equivalencia regular es la presencia de dos
conjuntos (que podemos rotular madres e hijas), cada uno definido en su relación con
el otro conjunto. Las madres son madres porque tienen hijas, las hijas lo son porque
tienen madres.

USOS DEL CONCEPTO

La mayoría de las aproximaciones a posiciones sociales las definen relacionalmente.


Para Marx, los capitalistas pueden existir si hay trabajadores y viceversa. Los dos
roles son definidos por la relación entre ellos, (i.e. los capitalistas expropian plusvalía
de la fuerza de trabajo de los trabajadores). Esposos y esposas; hombres y mujeres;
minorías y mayorías; castas altas y bajas; y la mayoría de otros roles se definen
relacionalmente.

15
El enfoque de equivalencia regular de una red se puede usar entonces para ubicar y
definir la naturaleza de los roles por sus patrones de relación. La relación entre roles
que el análisis de equivalencia regular hace patente y las percepciones de los actores
o la denominación de sus roles, pueden ser problemáticos. Lo que los actores rotulan
con nombres de roles y las expectativas (o normas que van con los roles) resultantes
que tienen hacia ellos pueden influir pero no determinar completamente los patrones
reales de interacción. Estos a su vez, son regularidades de las cuales emergen roles
y normas.

Estas ideas están en el núcleo de la perspectiva sociológica: de la interacción surgen


la cultura y las normas y roles que restringen la interacción. La identificación y
definición de roles por medio del análisis de equivalencia regular en datos reticulares
es posiblemente el desarrollo intelectual más importante del análisis de redes sociales.

EL HALLAZGO DE CONJUNTOS EQUIVALENTES

La definición formal postula que dos actores son regularmente equivalentes si tienen
un patrón similar de vínculos con otros que a su vez son equivalentes entre sí.
Consideremos a dos hombres. Cada uno tiene hijos, aunque en números diferentes.
Tienen una esposa, cada una de ellas a su vez, tienen hijos y un marido, es decir tiene
vínculos con todos y cada uno de los miembros de esos conjuntos. Cada hijo tiene
vínculos con uno o más miembros del conjunto esposos y esposas.

Al identificar qué actores son maridos no nos interesan los vínculos entre miembros de
este conjunto, de hecho esperaríamos que este bloque fuese cero. Lo que es
importante es que cada marido tenga al menos un vínculo con una persona en la
categoría esposa y al menos uno en la categoría hijo. Los maridos son equivalentes
entre sí porque tienen vínculos similares con miembros de los conjuntos esposas e
hijos.

Pero pareciera haber un problema con esta bastante simple definición. Si la definición
de cada posición depende de su relación con otras posiciones, ¿por dónde se parte?

Hay varios algoritmos que ayudan a identificar conjuntos regularmente equivalentes.


UCINET provee algunos métodos que son particularmente útiles para ubicar actores
aproximadamente equivalentes en grafos valorados, multirelacionales y orientados.
Algunos métodos más simples para datos binarios se pueden ilustrar directamente.

16
Consideremos una vez más, la red en el ejemplo de Wasserman-Faust. Supongamos
que es una imagen de una jerarquía simple de comando. Todos los vínculos están
dirigidos desde lo alto del diagrama hacia abajo. Encontraremos una caracterización
de equivalencia regular de este diagrama.

Primero, caracterizamos cada posición como una fuente (un actor que envía vínculos,
pero que no los recibe), un repetidor (un actor que recibe y envía) y un sumidero (un
actor que recibe pero que no envía). La fuente es A, los repetidores son B,C y D y los
sumideros son E,F,G,H e I. Hay una cuarta posibilidad lógica. Un aislado es un nodo
que ni envía ni recibe vínculos. Los aislados forman un conjunto con equivalencia
regular en cualquier red, y deberían ser excluidos del análisis de equivalencia de un
sub grafo conectado.

Dado que hay un solo actor en el conjunto de emisores o fuente, no podemos


identificar ninguna complejidad adicional en dicho rol. Consideremos los tres
repetidores (B,C y D). En el vecindario (esto es adyacente con) del actor B hay tanto
fuentes como sumideros. Lo mismo es válido para los otros repetidores, aunque los
tres actores pueden tener distintos números de fuentes y sumideros y estos pueden
ser a su vez diferentes fuentes o sumideros específicos (o los mismos). No podemos
definir más el rol de este conjunto {B,C,D} porque hemos agotado sus vecindarios. Es
decir, las fuentes a las cuales están conectados los repetidores no pueden ser
mayormente diferenciadas en múltiples tipos, puesto que hay sólo una fuente; los
sumideros a los que los repetidores emiten no pueden ser adicionalmente
diferenciados porque no tienen más conexiones.

Ahora consideremos a los terminales (los actores E,F,G,H e I). Cada uno está
conectado a una fuente (que son distintas). Hemos establecido que, en este caso,
todas las fuentes (B,C y D) son regularmente equivalentes. De modo que E e I, están
equivalentemente conectados a otros equivalentes. Con eso termina la partición.

17
El resultado de la partición [A], [B,C,D],, [E,F,G,H,I] satisface la condición de que cada
actor en cada partición tenga el mismo patrón de conexión con actores de otras
particiones. La matriz de adyacencia permutada se ve así:

Es útil hacer bloques en la matriz para mostrar su imagen. Aquí, sin embargo,
usaremos algunas reglas especiales para determinar los bloques con 0 y con 1. Si un
bloque está compuesto por puros 0, será un bloque 0. Si cada actor en una partición
tienen un vínculo con cualquier actor de otro bloque, definiremos el bloque conjunto
como un bloque 1. La imagen usando esta regla es:

A emite a uno o más del BCD pero a ninguno del EFGHI. BCD no envía a A, pero
cada uno de BCD envía al menos uno a EFGHI. Ninguno de EFGHI envía a alguno de
A o de BCD. Esta imagen, de hecho, despliega el patrón característico de una
jerarquía estricta: unos en el vector en la primera diagonal (hacia arriba de la diagonal
principal) y ceros en todos los demás. La regla para definir un bloque 1 cuando cada

18
actor es una partición tiene un vínculo con un actor en otra partición es una manera de
operacionalizar la noción de que los actores del primer conjunto son equivalentes si
están conectados con actores equivalentes entre sí, en la otra partición, sin que se
requiera, o se impida, que estén vinculados a los mismos otros actores. Esta regla de
imagen es la base para el algoritmo de búsqueda tabú. La búsqueda en el vecindario,
es la base para el enfoque REGE para datos categóricos (discusión y ejemplos más
abajo).

Para resumir: comenzamos una búsqueda en el vecindario caracterizando a cada


actor como fuente, repetidor, terminal o aislado. Examinando cada categoría,
determinamos que tipos de actores hay en cada vecindario de cada uno de los actores
en las particiones iniciales. Si el tipo de actores presente en cada vecindario son los
mismos, hemos terminado y podemos ir hacia el próximo grupo inicial; si los actores
tienen distinta composición vecindaria, podemos subdividirlos repetir el proceso. En
principio, la búsqueda de vecindario continuará hacia afuera para cada actor hasta que
las trayectorias de todas las longitudes se hayan examinado. En la práctica, los
analistas no van más allá de 3 pasos. Para la mayoría de los casos, las diferencias en
la composición del vecindario de un actor que está más distante que 3, no son
sustantivamente importantes.

La regla de búsqueda en vecindario trabaja bien para datos binarios orientados. Se


puede extender a valores integrales y datos multirelacionales (algoritmo categorial
REGE). Si la fuerza de los lazos dirigidos se ha medido (o si uno usa la recíproca de
la distancia geodésica entre actores como proxy de su fuerza de vínculo), el algoritmo
continuo REGE se puede aplicar para reponderar iterativamente en la búsqueda
vecinal para identificar actores aproximadamente equivalentes.

Muchos datos de redes muestran lazos no dirigidos. Esto hace problemática la


aplicación de algoritmos de equivalencia regular. Consideremos la red de Wasserman-
Faust en su forma no orientada.

19
Si no se dispone del direccionamiento, no podemos dividir los datos en fuentes,
repetidores y terminales, de modo que la idea de búsqueda vecinal se diluye. En este
caso tiene más sentido examinar la matriz de distancias geodésicas, en vez de la
matriz de adyacencia. Entonces se puede usar REGE categorial, que trata cada valor
de distancia geodésica como un vecindario cualitativamente diferente. O, se puede
usar REGE continuo, probablemente una opción más razonable, considerando el
inverso de la distancia como una medida de la fuerza del vínculo.

Veamos algunos ejemplos de estos enfoques con datos reales. Primero vamos a
ilustrar el enfoque básico de búsqueda vecinal con REGE categorial. Luego
compararemos los tratamientos categoriales y continuos de los valores de las
geodésicas en un grafo no dirigido. Finalmente, vamos a aplicar el método de
búsqueda tabu a datos binarios dirigidos.

REGE CATEGORIAL PARA DATOS BINARIOS DIRIGIDOS


(INTERCAMBIO DE INFORMACIÓN DE KNOKE)

La red de intercambio informacional de Knoke es dirigido y binario, aunque muchos


vínculos son recíprocos.

El algoritmo REGE, cuando se aplica a datos binarios, primero categoriza a los actores
como fuentes, repetidores y terminales. Luego intenta subdividir a los actores en cada
una de esas categorías de acuerdo a los tipos de actores en el vecindario. El proceso
continúa, por no muchos pasos, hasta que todos los actores están divididos, y no hay

20
una mayor diferenciación obtenible por extensión del vecindario. He aquí los
resultados:

Comentario: Este enfoque sugiere una solución de {1,4,9}, {3,6,8,10}, {5}. Vemos
más adelante que es partición es similar aunque no idéntica con la solución producida
por la búsqueda Tabú. En este caso, los actores y sus vecindarios son bastante
similares en un sentido tosco, de ser fuentes, repetidores y terminales. Cuando los
roles de los actores son muy similares en este sentido tosco, la búsqueda vecinal
simple no puede producir resultados sosos.

REGE CATEGORIAL PARA DISTANCIAS GEODÉSICAS (DATOS


DE MATRIMONIO DE PADGETT)

Los datos sobre alianzas matrimoniales entre las familias de la elite Florentina
presentan densidades de medianas a bajas y no son dirigidas. Hay considerables
diferencias entre las posiciones de las familias.

21
El algoritmo REGE categorial se puede usar para identificar actores con equivalencia
regular tratando los elementos de la matriz de distancia geodésica como descriptores
del tipo de vínculos, de modo que distintas distancias geodésicas son tratadas como
cualitativamente diferentes. Dos nodos son equivalentes si cada uno tienen un actor
en su vecindario que es del mismo tipo, en este caso, esto significa que son similares
si cada uno tiene un actor que está a la misma distancia geodésica respecto a ellos.
Con muchos conjuntos de datos, los niveles de similitud de vecindarios pueden
resultar bastante altos, y puede ser difícil diferenciar las posiciones de los actores
sobre la base de la equivalencia regular.

22
Comentario: El uso de Rege con datos no dirigidos, puede producir resultados
inesperados, aún cuando se sustituyen las distancias geodésicas por valores binarios.
Puede ser más útil combinar el número de vínculos distintos para producir valores
continuos. El principal problema es que con datos no dirigidos la mayoría de los casos
van a aparecer muy similares unos con otros (en el sentido "regular), y ningún
algoritmo puede corregir esto. Si las distancias geodésicas se pueden usar para
representar las diferencias en los tipos de vínculo, que es la cuestión conceptual, y si
los actores tienen alguna variabilidad en sus distancias, este método produce
resultados significativos. Pero, en mi opinión, debe usado con cautela, si es que se
usa, con datos no dirigidos.

REGE CONTINUO PARA DISTANCIAS GEODÉSICAS (DATOS DE


MATRIMONIOS DE PADGETT)

Un enfoque alternativo para los datos no dirigidos de Padgett es tratar los distintos
niveles de distancias geodésicas como medidas de (la inversa) de la fortaleza de
vínculos. Dos nodos son más equivalentes si tienen un actor de similar distancia en
su vecindario (similar en el sentido cuantitativo de que 5 es más similar a 4, que lo que
es 6). Por defecto, el algoritmo extiende la búsqueda a vecindarios de distancia 3,
aunque se pueden seleccionar menos o más.

23
EQUIVALENCIA REGULAR POR MEDIO DEL ALGORITMO REGE
DE WHITE/REITZ

24
Comentario: Una mejor opción para datos no dirigidos que el enfoque categorial, es
el algoritmo REGE continuo aplicado a las distancias geodésicas. El resultado sigue
mostrando equivalencias regulares bastante altas ente los actores, y la solución es
modestamente similar a la del enfoque categorial.

LA RED DE INTERCAMBIO DE INFORMACIÓN DE KNOKE


ANALIZADA CON LA BÚSQUEDA TABÚ

Antes hemos examinado la red de información de Knoke usando el enfoque de


vecindario. El método tabú es una búsqueda iterativa de una permutación y partición
del grafo, dada una decisión a priori acerca del número de particiones, que produce el
menor número de excepciones a codificaciones de bloques cero y uno de equivalencia
regular. En otras palabras, los bloques son cero si todas sus entradas son cero y uno
si hay al menos un elemento en cada fila y columna. Aquí aplicamos el método a los
mismos datos que hemos usado antes para el análisis simple de vecindario. El
resultado es:

25
Comentario: El método produce un estadístico de ajuste y deben compararse las
soluciones para distintos números de particiones. En este caso, un modelo de 5
grupos se ajusta mejor que la solución de 4 grupos mostrada aquí. La solución de 4
grupos se reporta para que se pueda comparar con el resultado de búsqueda de
vecindario, presentada antes.

La matriz de adyacencia de bloques para la solución de 4 grupos es, sin embargo,


bastante convincente. De los 12 bloques que son de interés, (los bloques en las
diagonales no son relevantes para el análisis de rol), 10 satisfacen perfectamente las
reglas para bloques 0 y 1.

La solución es también interesante desde el punto de vista sustantivo. El primer


conjunto {2,5}, por ejemplo, son repetidores puros, que envían y reciben a y de todos
los otros roles. El conjunto {6,10,3} sólo emite a otros dos tipos, no a todos los tres
tipos, y reciben desde sólo un tipo. Y así sucesivamente.

El método de búsqueda tabú puede ser muy útil y generalmente produce resultados
interesantes. Es un algoritmo iterativo de búsqueda, pero igualmente puede encontrar
soluciones locales. Muchas redes tienen más de una partición válida por medio de la
equivalencia regular y no hay garantías de que el algoritmo siempre encontrará la
misma solución. Debe ser ejecutado varias veces con diferentes configuraciones
iniciales.

26
RESUMEN DEL CAPÍTULO XI

El concepto de equivalencia regular es muy importante para los sociólogos que usan
métodos de análisis de red, porque es coincidente con la noción de rol social. Dos
actores son equivalentes regulares si tienen a su vez, relaciones a otros equivalentes
(no necesariamente los mismos, o en el mismo número). Las equivalencias pueden
ser exactas o aproximadas. A diferencia de definiciones estructurales o automórficas
de equivalencia, puede haber muchas maneras válidas para clasificar a los actores en
conjuntos de equivalencia regular en un grafo dado - y más de una puede ser
significativa.

Existen diversos enfoques algorítmicos para realizar el análisis de la equivalencia


regular. Todas se basan en la búsqueda de vecindarios de actores y en el
perfilamiento de los vecindarios por la presencia de actores de otros tipos. En la
medida que los actores tienen tipos similares a actores que están a similares
distancias en sus vecindarios, son regularmente equivalentes. Esta definición algo
suelta puede traducirse con bastante precisión en reglas de bloques uno y cero para
producir una matriz de imagen de los bloques de equivalencia propuestos. La bondad
(de ajuste) de estas imágenes es quizás el mejor test para una partición propuesta. Y
las propias imágenes son la mejor descripción de la naturaleza de cada rol en
términos de sus patrones de relación esperados desde otras reglas.

Sólo hemos tratado superficialmente el análisis de equivalencias regulares y de roles


en una red. Una extensión mayor que lo hace más rico aún, es la incorporación de
múltiples tipos de vínculos (es decir, matrices de relación apiladas). Otra extensión es
el álgebra de roles que busca identificar relaciones subyacentes, o generativas de los
patrones de vínculos en redes de múltiples vínculos (en vez de simplemente apilarlas
o sumarlas).

27

También podría gustarte