Está en la página 1de 6

UNIVERSIDAD DE GRANADA

FACULTAD DE CIENCIAS POLÍTICAS Y SOCIOLOGÍA

Departamento de Ciencias de la
Computación e Inteligencia Artificial

Ciencia y Minería de Datos

Guión de Prácticas

Práctica 2:
Análisis de Centralidad
de una Red Social con Gephi

Curso 2023-24

Segundo Curso del Grado en Sociología


Práctica 2
Análisis de Centralidad
de una Red Social con Gephi

1. Objetivos
El objetivo de esta segunda práctica es aprender a realizar un análisis de
centralidad sobre una red social que nos permita determinar los actores más relevantes de
la misma haciendo uso de la herramienta Gephi. En principio, partiremos de una pregunta
de investigación muy general, ¿cuáles son los actores más relevantes del sistema social
analizado?, y la responderemos de forma global utilizando todas las medidas de
centralidad que hemos aprendido en el Tema 4 de Teoría. Posteriormente, trataremos de
plantearnos preguntas más concretas que podamos responder en base a nuestro
conocimiento experto de la red escogida.

La práctica se evalúa sobre un total de 1,25 puntos. La fecha límite de entrega


será el miércoles 8 de noviembre de 2023 antes de las 23:55 horas. La entrega de la
práctica se realizará en el espacio de la asignatura en la plataforma Prado. Solo debe
entregarla uno de los dos componentes de la pareja de estudiantes que la haya
realizado.

2. Trabajo a Realizar
2.1. Selección de la Red Social
Haremos uso de la misma red social escogida en la primera práctica. Si algún
estudiante quiere cambiarla, puede hacerlo, pero no se recomienda. En caso de no haber
realizado la primera práctica, se deben seguir las instrucciones de la Sección 2.1 del guión
de la práctica 1 para seleccionar la red a emplear en la práctica actual. En cualquier caso,
la red seleccionada no podrá haber sido escogida anteriormente por ningún compañero.

2.2. Estudio de la Centralidad de los Actores


El/la estudiante realizará un pequeño análisis de redes sociales sobre la red
escogida basado en las medidas de Centralidad estudiadas. Como hemos comentado,
tratará de determinar los actores principales del sistema social analizado desde una
perspectiva global. Para ello, aplicará al menos las medidas de grado, intermediación,
cercanía y vector propio, y analizará los resultados obtenidos para determinar qué
actores obtienen los mejores valores en cada medida, qué actores repiten en buenas
posiciones en el orden en varias medidas, etc.

1
2.2.1. Obtención de los valores de las medidas de centralidad

El valor de tres de estas medidas ya está calculado con los pasos que realizamos
en la primera práctica. La centralidad de grado (no normalizada) se generó al calcular el
Grado medio en la ventana Estadísticas. Las de intermediación y cercanía se generaron
con las opciones Diámetro de la red o Longitud media de camino. En este caso, sí que es
posible especificar si se desean obtener normalizadas o no normalizadas con el checkbox
“Normalizar centralidades en el rango [0,1]”. Finalmente, la Centralidad de vector
propio se calcula en la opción del menú Estadísticas del mismo nombre. Todos los pasos
necesarios para obtener estas cuatro medidas de centralidad en Gephi están explicados en
el Seminario 4.

En el caso en que nuestra red presente más de una componte conexa, se


recomienda calcular la Centralidad de cercanía sobre la componente gigante de la
misma. Es decir, aplicar primero el filtro de Componente gigante estudiado en la primera
práctica y luego calcular el valor de esta medida. Esto se hace para evitar que nodos
pertenecientes a componentes conexas de tamaño pequeño obtengan valores altos en la
Centralidad de cercanía y falseen el análisis de ésta.

Una vez calculadas las medidas, el/la estudiante accederá a la pestaña Laboratorio
de datos y anotará los nombres de los cinco actores con mejor valor para cada una de
las cuatro medidas anteriores, así como el valor concreto de la medida en cada caso y
los almacenará en una tabla como la siguiente:

Centralidad de Centralidad de Centralidad de Centralidad de


Grado Intermediación Cercanía Vector propio
Nombre 1er actor: Nombre 1er actor: Nombre 1er actor: Nombre 1er actor:
valor 1er actor valor 1er actor valor 1er actor valor 1er actor
Nombre 2o actor: Nombre 2o actor: Nombre 2o actor: Nombre 2o actor:
valor 2o actor valor 2o actor valor 2o actor valor 2o actor
Nombre 3er actor: Nombre 3er actor: Nombre 3er actor: Nombre 3er actor:
valor 3er actor valor 3er actor valor 3er actor valor 3er actor
Nombre 4o actor: Nombre 4o actor: Nombre 4o actor: Nombre 4o actor:
valor 4o actor valor 4o actor valor 4o actor valor 4o actor
Nombre 5o actor: Nombre 5o actor: Nombre 5o actor: Nombre 5o actor:
valor 5o actor valor 5o actor valor 5o actor valor 5o actor

Se piden al menos cinco actores para realizar el análisis, pero el/la estudiante
puede añadir más en alguna o todas las medidas de Centralidad. Como vimos en el
Seminario 4, esto dependerá de la distribución concreta de los valores de cada medida.
Por ejemplo, si tenemos siete actores con los valores más altos de una medida y luego
encontramos un salto en el que el valor baja mucho en el octavo actor, incluiríamos esos
siete. Si hay tres actores con un valor destacado y luego el cuarto y el quinto presentan
un valor significativamente más bajo, entonces bastará con incluir esos cinco.

2
2.2.2. Obtención de visualizaciones de la red con los valores de dos medidas de
centralidad

Para complementar la información numérica se realizarán al menos dos


representaciones gráficas de la red en las que se visualicen conjuntamente dos de las
medidas anteriores (una asociada al tamaño de los nodos y otra a su color, por ejemplo,
la intermediación en el tamaño de los nodos y la centralidad de vector propio en el color
de estos) como las mostradas en las transparencias del Tema 4 y el Seminario 4:

Como vimos en el Seminario 4, estas visualizaciones pueden realizarse


directamente en Gephi, usando las opciones Nodos y Ranking en la ventana Apariencia.
Los dos iconos con la paleta y las bolas de distinto tamaño de la parte superior derecha
de la pantalla permiten escoger qué valor de medida se desea emplear para definir el color
y el tamaño de los nodos en la visualización, respectivamente:

3
El/la estudiante escogerá las medidas que desee visualizar y justificará su elección.
Las visualizaciones nos permitirán localizar las posiciones de los nodos más centrales de
la red según cada medida. Se analizará cada visualización presentada.

2.2.3. OPCIONAL: Gráficos adicionales

Se valorará adicionalmente la realización de gráficos de dispersión (scatter


plots) que representen los valores de dos de las medidas para todos los actores de la red
como los estudiados en los ejemplos de análisis de centralidad del Tema 4:

Para realizarlos, es necesario exportar los valores de las medidas de Centralidad


de los nodos de nuestra red desde el Laboratorio de datos en formato csv con la opción
Exportar tabla y abrirlas en Excel o en cualquier otro software estadístico. Desde allí,
generaremos los gráficos deseados escogiendo dos de las medidas, representando los
valores de la primera en el eje X y los de la segunda en el eje Y, e incluyendo la etiqueta
del nodo. Estas gráficas permiten determinar los actores más relevantes de la red de una
forma sencilla.

2.2.3. Análisis de centralidad de la red social escogida

Finalmente, realizará un pequeño análisis de los actores más importantes de la red


desde una perspectiva global en función de los valores de las medidas calculadas en la
Sección 2.2.1, de las visualizaciones generadas en la Sección 2.2.2 y de los gráficos
obtenidos en la Sección 2.2.3 (en caso de haberlos realizado), aplicando el conocimiento
adquirido en el Tema 4 y en el Seminario 4 del curso.

4
Se responderá a la pregunta general planteada, ¿cuáles son los actores más
relevantes del sistema social analizado?, empleando toda la información disponible.
Recordamos que habrá que analizar todas las tablas, visualizaciones y gráficos que se
incluyan en nuestro informe. Un científico de datos/sociólogo computacional que se
precie no puede poner una tabla/gráfica/etc. sin analizarla porque no aporta información
en su estudio.

Finalmente, se valorará adicionalmente el que el/la estudiante se plantee alguna


pregunta adicional sobre la relevancia de los actores del sistema social analizado y la
resuelva haciendo uso de las medidas de centralidad estudiadas.

3. Documentación y Ficheros a Entregar


La documentación de la práctica será un fichero pdf que deberá incluir, al menos,
el siguiente contenido:
a) Portada con el número y título de la práctica, el curso académico y el nombre,
DNI y dirección e-mail del alumno.
b) Una sección que incluya la descripción de la red seleccionada, el lugar de donde
se ha obtenido y una visualización inicial de la misma.
c) Una sección que incluya las tablas con los valores de las medidas de Centralidad,
las visualizaciones de la red obtenidas y los gráficos de dispersión en caso de
haberse realizado.
d) Una sección que incluya el análisis de la centralidad de los actores de la red
realizado con la información obtenida en la sección anterior para responder a la
pregunta general y a las preguntas adicionales, en caso de haberlas formulado.
e) Referencias bibliográficas u otro tipo de material distinto del proporcionado en la
asignatura que se haya consultado para realizar la práctica (en caso de haberlo
hecho).

Aunque lo esencial es el contenido, también debe cuidarse la presentación y la


redacción.

El fichero pdf de la documentación, el fichero original GraphML (o cualquier otro


formato, como GDF) de la red, y el fichero del proyecto Gephi se comprimirán
conjuntamente en un fichero zip etiquetado con los apellidos y nombre del alumno (Ej.
Pérez Pérez Manuel.zip). Este fichero será entregado por internet a través del espacio de
la asignatura en la plataforma Prado. Se recuerda que solo debe entregarla uno de los
dos componentes de la pareja de estudiantes que haya realizado la práctica.

También podría gustarte