Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La metodología clúster permite usar escala Likert, como técnica de agrupación de variables
es similar al análisis factorial (ambos son técnica de interdependencia) pero es menos
restrictivo respecto a los supuestos (no exige linealidad, no simetría, permite variables
categóricas) y admite varios métodos de estimación de la matriz de distancias.
Estandarizar las variables es darle la misma importancia y el mismo peso a cada una de
ellas sino se hace algunas pueden tener mayor importancia que otras en la generación de
clúster.
1
Clase 8 Análisis de Clúster Jerárquico
2
Clase 8 Análisis de Clúster Jerárquico
3
Clase 8 Análisis de Clúster Jerárquico
Técnicas de Clasificación
4
Clase 8 Análisis de Clúster Jerárquico
5
Clase 8 Análisis de Clúster Jerárquico
6
Clase 8 Análisis de Clúster Jerárquico
Clúster bietápico (dos fases) permite trabajar con variables mixtas y para un número grande
de individuos. Clúster no jerárquicos son los K-medias: requiere número a priori de clúster
y sólo variables cuantitativas. Clúster jerárquicas para variables cuantitativas o cualitativas
pero no se pueden mezclar y no se conoce el número a priori de conglomerados (clúster).
7
Clase 8 Análisis de Clúster Jerárquico
8
Clase 8 Análisis de Clúster Jerárquico
9
Clase 8 Análisis de Clúster Jerárquico
Si se va a trabajar con la variable binaria sexo que no está como binaria se debe recodificar.
10
Clase 8 Análisis de Clúster Jerárquico
11
Clase 8 Análisis de Clúster Jerárquico
12
Clase 8 Análisis de Clúster Jerárquico
13
Clase 8 Análisis de Clúster Jerárquico
Volviendo al Ejercicio
14
Clase 8 Análisis de Clúster Jerárquico
15
Clase 8 Análisis de Clúster Jerárquico
16
Clase 8 Análisis de Clúster Jerárquico
17
Clase 8 Análisis de Clúster Jerárquico
18
Clase 8 Análisis de Clúster Jerárquico
19
Clase 8 Análisis de Clúster Jerárquico
20
Clase 8 Análisis de Clúster Jerárquico
Algoritmo de Clasificación
21
Clase 8 Análisis de Clúster Jerárquico
22
Clase 8 Análisis de Clúster Jerárquico
En el siguiente paso se calcula las varianzas de los grupos o clúster. La varianza sea mínima dentro
cada clúster.
La Centroide de un clúster es la media de los valores de cada una de las variables que están en
cada clúster.
Dendograma
23
Clase 8 Análisis de Clúster Jerárquico
La altura muestra los pasos desde de abajo hacia arriba. Eje Y son los pasos. Finalmente hay dos
clúster lado izquierdo y derecho de las figura.
24
Clase 8 Análisis de Clúster Jerárquico
Una distancia sencilla Individuo 1 con 2. Individuo 1: Raiz((1-2)¨2 +((1-1)¨2), Raiz((1-4)¨2 +((1-
5)¨2) = Raiz(3¨2 +4¨2)= 5. Se busca en la matriz la distancia más pequeña en este caso el 1 con el 2
distancia = 1, clúster A. Se le asigna el valor medio entre las dos (1+2)/2 para v1 y (1+1)/2 para v2.
Y se asigna una nueva matriz con A, y luego se vuelve a calcular las distancias generando una
nueva matriz. Se puede observar la nueva matriz de distancia y la menor distancia es 2 entre los
individuos 4 y 5, el que será el segundo clúster B.
Se pueden hacer cortes en los árboles y tomar la decisión de la cantidad de clúster ver lado
derecho del cuadro:
25
Clase 8 Análisis de Clúster Jerárquico
26
Clase 8 Análisis de Clúster Jerárquico
27
Clase 8 Análisis de Clúster Jerárquico
28
Clase 8 Análisis de Clúster Jerárquico
El cero indica que es un caso individual y sale por primera vez como son los tres primeros. En la
etapa 4 aparecen números porque se repite el clúster 2.
29
Clase 8 Análisis de Clúster Jerárquico
30
Clase 8 Análisis de Clúster Jerárquico
31
Clase 8 Análisis de Clúster Jerárquico
Por ejemplo primer paso se ha unido La Cisterna con Quilicura. Segundo paso Macul con Cerrillo.
Lado Izquierdo son los casos.
32
Clase 8 Análisis de Clúster Jerárquico
33
Clase 8 Análisis de Clúster Jerárquico
34
Clase 8 Análisis de Clúster Jerárquico
35
Clase 8 Análisis de Clúster Jerárquico
36
Clase 8 Análisis de Clúster Jerárquico
37