Está en la página 1de 37

Clase 8 Análisis de Clúster Jerárquico

Análisis Clúster Jerárquico

La metodología clúster permite usar escala Likert, como técnica de agrupación de variables
es similar al análisis factorial (ambos son técnica de interdependencia) pero es menos
restrictivo respecto a los supuestos (no exige linealidad, no simetría, permite variables
categóricas) y admite varios métodos de estimación de la matriz de distancias.
Estandarizar las variables es darle la misma importancia y el mismo peso a cada una de
ellas sino se hace algunas pueden tener mayor importancia que otras en la generación de
clúster.

1
Clase 8 Análisis de Clúster Jerárquico

Etapas del Análisis Clúster

El análisis clúster es subjetivo, y por tanto es muy importante seguir un procedimiento


ordenado para obtener una solución factible. Se aconseja el uso tanto de métodos
jerárquicos como No Jerárquicos. Se usa el método no jerárquico a partir del método
jerárquico.

2
Clase 8 Análisis de Clúster Jerárquico

3
Clase 8 Análisis de Clúster Jerárquico

Técnicas de Clasificación

4
Clase 8 Análisis de Clúster Jerárquico

5
Clase 8 Análisis de Clúster Jerárquico

6
Clase 8 Análisis de Clúster Jerárquico

Clúster Jerárquico. Opciones SPSS, revisión de comandos

Clúster bietápico (dos fases) permite trabajar con variables mixtas y para un número grande
de individuos. Clúster no jerárquicos son los K-medias: requiere número a priori de clúster
y sólo variables cuantitativas. Clúster jerárquicas para variables cuantitativas o cualitativas
pero no se pueden mezclar y no se conoce el número a priori de conglomerados (clúster).

7
Clase 8 Análisis de Clúster Jerárquico

8
Clase 8 Análisis de Clúster Jerárquico

9
Clase 8 Análisis de Clúster Jerárquico

Clúster Jerárquico Dicotómicas SPSS

Variables dicotómicas para hacer un análisis clúster tipo jerárquico.

Si se va a trabajar con la variable binaria sexo que no está como binaria se debe recodificar.

10
Clase 8 Análisis de Clúster Jerárquico

11
Clase 8 Análisis de Clúster Jerárquico

12
Clase 8 Análisis de Clúster Jerárquico

13
Clase 8 Análisis de Clúster Jerárquico

Volviendo al Ejercicio

14
Clase 8 Análisis de Clúster Jerárquico

15
Clase 8 Análisis de Clúster Jerárquico

16
Clase 8 Análisis de Clúster Jerárquico

17
Clase 8 Análisis de Clúster Jerárquico

También se formó en la base el clúster como se muestra a continuación.

18
Clase 8 Análisis de Clúster Jerárquico

¿Qué pasa si se ve el clúster con la categoría laboral?

19
Clase 8 Análisis de Clúster Jerárquico

Estas dos variables no suministran suficiente información. La categoría “Seguridad” no tiene


distribución única se divide en dos clúster.

20
Clase 8 Análisis de Clúster Jerárquico

Algoritmo de Clasificación

21
Clase 8 Análisis de Clúster Jerárquico

Distancia mínima entre dos objetos de clúster distintos.

22
Clase 8 Análisis de Clúster Jerárquico

En el siguiente paso se calcula las varianzas de los grupos o clúster. La varianza sea mínima dentro
cada clúster.

La Centroide de un clúster es la media de los valores de cada una de las variables que están en
cada clúster.

Dendograma

23
Clase 8 Análisis de Clúster Jerárquico

La altura muestra los pasos desde de abajo hacia arriba. Eje Y son los pasos. Finalmente hay dos
clúster lado izquierdo y derecho de las figura.

24
Clase 8 Análisis de Clúster Jerárquico

Una distancia sencilla Individuo 1 con 2. Individuo 1: Raiz((1-2)¨2 +((1-1)¨2), Raiz((1-4)¨2 +((1-
5)¨2) = Raiz(3¨2 +4¨2)= 5. Se busca en la matriz la distancia más pequeña en este caso el 1 con el 2
distancia = 1, clúster A. Se le asigna el valor medio entre las dos (1+2)/2 para v1 y (1+1)/2 para v2.
Y se asigna una nueva matriz con A, y luego se vuelve a calcular las distancias generando una
nueva matriz. Se puede observar la nueva matriz de distancia y la menor distancia es 2 entre los
individuos 4 y 5, el que será el segundo clúster B.

Se pueden hacer cortes en los árboles y tomar la decisión de la cantidad de clúster ver lado
derecho del cuadro:

25
Clase 8 Análisis de Clúster Jerárquico

El clúster 2 puede ser un dato atípico.

Ejemplo Análisis Cluster

26
Clase 8 Análisis de Clúster Jerárquico

27
Clase 8 Análisis de Clúster Jerárquico

28
Clase 8 Análisis de Clúster Jerárquico

En la primera etapa se ha agrupado la observación 6 con la 8. El clúster se va asociar con el


número 6 la columna “coeficiente” es la distancia que los separa 1,653 (antes de la fusión). El
segundo paso se ha agrupado el dato 10 con el 14 etc. La etapa siguiente indica en el que el
conglomerado aparece por primera vez.

El cero indica que es un caso individual y sale por primera vez como son los tres primeros. En la
etapa 4 aparecen números porque se repite el clúster 2.

29
Clase 8 Análisis de Clúster Jerárquico

30
Clase 8 Análisis de Clúster Jerárquico

Nos muestra la distancia entre los casos:

Por ejemplo: La distancia entre la 6 y la 8 es 1.653.

31
Clase 8 Análisis de Clúster Jerárquico

Por ejemplo primer paso se ha unido La Cisterna con Quilicura. Segundo paso Macul con Cerrillo.
Lado Izquierdo son los casos.

Entrega la misma matriz pero entre 0 y 1

32
Clase 8 Análisis de Clúster Jerárquico

Otro Ejemplo Análisis Clúster II

Nos da la posibilidad de cuántos clúster elegir.

33
Clase 8 Análisis de Clúster Jerárquico

Santiago pertenece al clúster 1. Recoleta al clúster 2 etc..

También se da rango de clúster.

34
Clase 8 Análisis de Clúster Jerárquico

35
Clase 8 Análisis de Clúster Jerárquico

Ahora cambiando el método

36
Clase 8 Análisis de Clúster Jerárquico

Genera una nueva variable para guardar la información:

37

También podría gustarte