Está en la página 1de 15

Maestría en Humanidades Digitales en Línea

Tecnologías digitales

Ejercicio de manejo de Gephi

Equipo 3

Genaro García Jiménez

Ángel David Higuera Dávila

Brianda Maite Ramírez Ramírez

María del Pilar Sandoval Blanco

Docente titular: Dr. Manuel Cebral Loureda

Docente tutor: Mtro. Carlos Alberto Esparza Hernández

29 de octubre de 2023
Ejercicio de manejo de Gephi

1. Tema
En el presente análisis se tendrá como punto de referencia el dataset Jazz Musician
Network publicado en Github en la sección de dataset para la aplicación Gephi. Esta red utiliza
una base de datos de grabaciones de jazz para estudiar la colaboración entre músicos en el año
2003. Allí se estudian dos niveles de colaboraciones: primero, la red de colaboración entre
individuos, donde se conectan dos músicos si han tocado en la misma banda; y segundo, la
colaboración entre bandas, donde se conectan dos bandas si tienen un músico en común. Lo
anterior permite definir el propósito de esta red como no dirigida. De ese modo, en este ejercicio
se estudian las relaciones entre 198 nodos de la base de datos, vinculados mediante 5484 aristas.

2. Base de datos (dataset): NET file. Jazz musicians network: List of edges of the network
of Jazz musicians. P.Gleiser and L. Danon , Adv. Complex Syst.6, 565 (2003).
3. Visualización 1 en Gephi: Noverlap
Figura 1
Grafo Gephi, Jazz Musician Network, Noverlap

Análisis
En el gráfico anterior se presenta la frecuencia de los nodos que convergen desde
diferentes distancias, tomando en cuenta que los nodos corresponden a 198, la cantidad hace que
las líneas se superpongan y se muestren los más relevantes de acuerdo a su distancia y el grado
de unión con otros nodos. Cabe mencionar que para este tipo de gráfico subimos el speed, el
ratio y el margin a 10 puntos, ya que la visualización es más clara para poder observar mejor los
nodos.
Este tipo de grafo hace notar que los nodos son equidistantes, sin embargo, al mostrar
detalles de alguno podemos ver que cada punto nos muestra una referencia diferente de su
distancia con otro nodo.
Figura 2
Grafo Gephi, Jazz Musician Network, Noverlap

Análisis
En los tres gráficos pudimos observar la relevancia de los puntos y de acuerdo a su unión
con otros, nodos que convergen y que demuestran su relación con otros, Noverlap permitió ver
con detalle su relevancia entre distancias y los nodos con los que tienen un interés mayor al
entrar en contacto. Lo anterior hace notar su posición con respecto a otros y las conexiones que
pueden existir entre ellos, relaciones musicales, tomando en cuenta las bases de datos.
Figura 3
Grafo Gephi, Jazz Musician Network, Noverlap, Statistical Interference Report

Se presentan los nodos relacionados de acuerdo a su relevancia y la medida de la distribución,


tomando en cuenta las comunidades que la conforman y sus relaciones con otros nodos.
4. Visualización 2 en Gephi: Frichterman Reingold
Figura 4
Grafo Gephi, Jazz Musician Network. Fruchterman Reingold

Análisis
En esta primera visualización se trabajó con el algoritmo de Fruchterman Reingold, con
un valor de gravedad bajo para optar por la dispersión de los elementos y un factor de escala de
2.4 para visualizar más fácilmente las relaciones. En este gráfico es posible observar, de manera
general, cuáles de los nodos presentados en la base de datos tiene mayor número de relaciones
con otros nodos y cuáles son los nodos cuya relación directa se limita incluso a un solo elemento.
En este algoritmo de visualización los nodos cuyo número de relaciones es mayor se ubican al
centro del grafo, mientras que los nodos que tienen relaciones únicas se dispersan a los extremos
de la gráfica.
En esta primera visualización, llama la atención los nodos 136 y 60, pues en estos, en
particular, se concentra un gran número de aristas, además de la posición de centralidad en las
que los ubica el algoritmo. Así como también la zona que involucra los nodos 114, 194, 196 y la
zona en donde se ubican los nodos 100, 109 y 135, pues en estas áreas se ve el mayor número de
aristas intersectadas. Por otro lado, los elementos 160, 21, 165, 30 y 120 destacan por estar
aislados del centro de la gráfica y porque tienen una única relación con los demás nodos.

Figura 5
Grafo Gephi, Jazz Musician Network. Fruchterman Reingold, color
Análisis
En esta variación del algoritmo se utilizó un valor de gravedad más alto, lo cual refleja
cómo la gráfica se forma a partir de un punto central generando una lógica circular, además de un
factor de escala en la expansión de 5.0 para dispersar un poco los nodos y evitar la superposición
de elementos. Adicionalmente, desde la apariencia se le agregó color a los nodos según el grado
y a las aristas según el rango para visibilizar otra característica de las relaciones.
En esta gráfica se puede observar que todas las aristas tienen el mismo tono de color lo
que nos indica que en la base de datos consultada todas las relaciones tienen el mismo peso. Sin
embargo, el rango en los nodos es diferente y se debe a la cantidad de vínculos que tiene cada
nodo. De esta manera, es posible visualizar que los nodos 136 y 60 tienen un color rojo fuerte,
mientras que los nodos 160, 21, 165, 30 y 120 están en color negro. Lo anterior está en total
concordancia con el análisis que se realizó en la figura 4.

5. Visualización 3 en Gephi: Force Atlas 2


Figura 6
Grafo Gephi, Jazz Musician Network. Force Atlas 2
Análisis
Utilizando el algoritmo de Force Atlas 2 y poniendo énfasis en la densidad del grafo, se
puede observar que hay dos grupos de nodos que prácticamente son relacionados entre sí por tres
nodos centrales. Es así como los nodos 136, 18 y 88 son lo que sirven de enlace entre los dos
clusters principales. El color y la intensidad del color verde marcan la densidad del grafo y,
siguiendo con lo anterior, destaca el nodo 136 con un total de treinta y ocho aristas, siendo el
nodo con mayor densidad de grafo. Se puede ver la representación de esto en la Figura 7, donde
resalta este nodo.
Figura 7
Grafo Gephi, Jazz Musician Network. Force Atlas 2, 136

Si bien el nodo 136 destaca por su fuerza de atracción para “unir” a los dos distintos
clusters, como se comentó en la Visualización 1: Frichterman Reingold, se destaca que el nodo
60 es el que cuenta con mayor densidad de grafo al tener sesenta y ocho aristas. A pesar de ser el
nodo con mayor densidad, se puede analizar que ninguna de sus aristas lo lleva con el cluster del
lado derecho. Requiere mínimo dos pasos para poder llegar a ellos, pues hay una repulsión hacia
ellos y una atracción respecto al cluster izquierdo.
El lado opuesto lo encontramos con aquellos nodos que tienen una densidad de grafo muy
baja es decir que tiene mínimas conexiones con otros grafos, allí nos encontramos con los nodos
165, 30 y 120 que solo tienen una arista. Como ejemplo, el nodo 120 requiere tres pasos para
poder llegar al nodo 60, que comentamos previamente. Para visualizar esto de manera más
completa, la estadística de grado con peso nos permite marcar el tamaño de la etiqueta del nodo
para identificar aquellos nodos con mayor y menor popularidad sin importar la atracción y
repulsión. A través de esta estadística y usando la tabla de datos pudimos encontrar otros dos
nodos con una sola arista: 21, 160 y 165 que se suman al 30 y 120. Para finalizar esta
visualización, comentar que el peso promedio fue de 55.4 teniendo extremos con los nodos que
ya mencionamos (véase Figura 8): 21, 30, 120, 160 y 165 con peso de 2; 136 con peso de 200.
Figura 8
Grafo Gephi, Jazz Musician Network. Force Atlas 2, extremos grado por pesos
6. Visualización 4 en Gephi: OpenOrd
Figura 9
Grafo Gephi, Jazz Musician Network. Modularidad y algoritmo OpenOrd

Análisis
Se ejecuta la estadística de modularidad para identificar las subdivisiones internas de la
red. Se identifican cuatro módulos y cada uno se presenta con un color diferente. Se ajusta el
tamaño de los nodos por grado entre mínimo uno y máximo 20. Asimismo, al ejecutar el
algoritmo de distribución OpenOrd se logra separar los nodos de una misma comunidad en una
misma zona de la pantalla y se afina la visualización con los algoritmos de expansión y noverlap.
Es así como, en la figura anterior, se pueden identificar que los nodos con mayor media de
conexiones son 136, 60, 132, 168, 108 y 122. En esta visualización la expansión de la red
permite validar, como se afirmó en la visualización anterior, que los nodos 136, 18, 88, 39 y 181
actúan como intermediarios, pero, sin duda, el de mayor liderazgo es el nodo 136.
La partición por modularidad diferencia radicalmente dos agrupaciones con alta
interconexión: una de color verde (modularidad 1) que se presenta aislada, solo vinculada al
grafo por los intermediarios; en cambio, las demás modularidades (0, 2 y 3) se presentan juntas
con una altísima densidad entre sus nodos, probablemente son músicos o bandas que habitan las
mismas ciudades o comparten los mismos lugares de grabación; sin embargo, entre tanto no se
cuente con los nombres y lugares de origen de los individuos de la base de datos, todas son
conjeturas. En todo caso, llama mucho la atención la marcada separación de la comunidad en
color verde, incluso podría tratarse de una comunidad apartada por temas de segregación racial.

Figura 10
Grafo Gephi, Jazz Musician Network. Modularidad y algoritmo Fruchterman Reingold

Análisis
Para organizar en forma concéntrica los nodos, se ejecutó nuevamente el algoritmo
Fruchterman Reingold; esta distribución permite visualizar el grafo de forma uniforme. En esta
visualización la centralidad del nodo 136 es notable, es muy probable que este registro
corresponda a la banda de Jazz más popular de la base de datos, aunque su popularidad, como ya
se mencionó, radica en su propiedad de intermediación. Cabe anotar que en la comunidad de
color morado está el mayor número de nodos con centralidad destacada: los nodos 60, 132, 168 y
122 también son influyentes por su ubicación como intermediarios.

7. Tabla de datos estadísticos de la red


Se procede a organizar la respectiva tabla en el laboratorio de datos. En primer lugar, se
ocultan las columnas que desde el dataset no aportan ningún dato. Se ejecutan las estadísticas de:
grado medio, centralidad, diámetro de la red, densidad de grafo, y se obtiene esta información en
nuevas columnas:
La información ordenada por el atributo ‘Grado’, columna tres, ubica al ítem 136 como el
de mayor centralidad con 100 aristas de relaciones. Se observa también la modularidad y la
capacidad de intermediación.
Referencias

Bastian, M., Heymann, S., & Jacomy, M. (2009). Gephi: An Open Source Software for
Exploring and Manipulating Networks. https://gephi.org/publications/gephi-bastian-feb09.pdf

Cebral, M. (2023). Teoría de Grafos Aplicada a las Humanidade Digitales. En Tecnologías


Digitales, EH4004.10: Canvas. Tecnológico de Monterrey.

Düring, M. (2015, febrero 18). From Hermeneutics to Data to Networks: Data Extraction and
Network Visualization of Historical Sources. The Programming Historian.
https://programminghistorian.org/en/lessons/creating-network-diagrams-from-historical-sources

Estadísticas - curso Gephi. (s. f.). http://gephi.wikidot.com/capitulo06

Gephi. (2011, 13 junio). Tutorial Layouts. Gephi. Recuperado 21 de octubre de 2023, de


https://gephi.org/tutorials/gephi-tutorial-layouts.pdf

Gleiser, P. y Danon L. (2003). Jazz Musicians Network. Adv. Complex Syst.6, 565 (2003).

También podría gustarte