Está en la página 1de 4

ANÁLISIS MULTIVARIANTE DE

DATOS: MÉTODOS DE
CLASIFICACIÓN Y REDUCCIÓN DE
DATOS
https://youtu.be/_3YKNZW2HNc

CLASIFICACIÓN DE DATOS: CASO


PRÁCTICO
La aplicación de clasificación de datos es muy versátil. A continuación se muestran ejemplos de
aplicación de los métodos de clasificación.

Análisis de redes sociales

El ser humano es esencialmente un ser social que se relaciona por grupos: familiares, laborales,
sentimentales, etc., como consecuencia de un largo proceso en la vida de cada persona. Desde el
punto de vista de la sociedad, este proceso se desarrolla a partir de la participación activa de las
personas en una red de relaciones sociales. En dicha red, los individuos están interconectados,
interactúan y pueden tener más de un tipo de relación entre ellos.

La siguiente red se construye entre los personajes de la novela de Víctor Hugo Les Miserables. Dos
personajes están conectados si ellos aparecen en la misma escena. El peso de dicha conexión es el
número de apariciones comunes. Dada esta red de personajes, uno de los problemas más estudiados
es conocer los grupos/comunidades de esta red (entendiendo por comunidad o grupo como un
conjunto de personajes altamente conectados entre ellos y pocos conectados con los demás). Otros
problemas interesantes dentro del análisis de redes sociales es detectar líderes, por ejemplo, a partir
de diferentes medidas de centralidad.

https://giphy.com/gifs/bigf2321-l0MYMLrZwBNXrl1iU?
utm_source=iframe&utm_medium=embed&utm_campaign=tag_click

Figura 15. Detección de comunidades en la relación a los personajes de Los Miserables.

https://giphy.com/gifs/bigf2322-l0MYRD0KPfgQJVbEs?
utm_source=iframe&utm_medium=embed&utm_campaign=tag_click

Figura 16. Detección de líderes en la relación a los personajes de Los Miserables.

Clasificación de individuos
Se grupa a los individuos en grupos homogéneos en función de las características que se han
medido. Por ejemplo, se pueden clasificar 9 comunidades autónomas según el número de parados en
agricultura, industria, construcción, servicios y los que se encuentran buscando empleo.

Figura 17. Clasificación de individuos.

REDUCCIÓN DE DATOS: CASO


PRÁCTICO
Análisis factorial

En un estudio sobre el nivel de gastos e ingresos de una familia y el nivel de educación de los
miembros de la misma, se han medido las siguientes variables en una muestra de 18 individuos:
gasto medio mensual del individuo, ingresos medios mensuales del individuo, número de hijos del
individuo, edad del individuo, número de años de escolarización del individuo, número de años de
escolarización del padre del individuo y número de años de escolarización de la madre del individuo.

Si se seleccionan dos componentes para reducir el número de variables del estudio, se observa que:
Componente

1 2

Gasto mensual 0,87 0,45

Ingresos medios mensuales 0,715 0,594

Número de hijos -0,189 -0,86

Variable Edad 0,809 -0,119

Número de años de escolarización -0,548 0,729

Número de años de escolarización del padre -0,813 0,477

Número de años de escolarización de la madre -0,584 0,166

En la matriz de componentes las variables hijos y edad quedan representadas en una única
componente. Pero las variables restantes, al tener puntuaciones parecidas en ambos componentes, no
se podrían clasificarlas correctamente.

Análisis de correspondencia

En un estudio sobre 100 madres de recién nacidos en el que se analiza la clase social (alta, media,
baja) y el control médico del embarazo (excelente, bueno, malo, nulo), ¿son independientes estas
variables o tienen alguna relación?
En la tabla de contingencia se observa una mayor concentración de buenos controles médicos en
embarazos de mujeres en clases sociales medias con respecto de las clases sociales baja y alta; un
mal control médico concentrado en clases sociales medias y bajas; y un control médico excelente en
clases sociales medias y altas.

Control del embarazo

Excelente Bueno Malo Nulo

Alta 8 5 0 0

Clase social Media 12 26 13 0

Baja 0 9 21 6

El diagrama conjunto de puntos de categoría muestra la proximidad de la clase social alta con un
control excelente del embarazo. El medio rural urbano asociado a un mal control del embarazo y una
clase social baja, etc.

Figura 18. Análisis de correspondencia. Caso práctico.

También podría gustarte