Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cluster
Act. Sonia Yoselin Ovando Retiz
OBJETIVOS BÁSICOS:
3. Se establece una distancia o similaridad que indique en qué medida cada par d
observaciones se parece entre sí. Se recomienda estandarizar la distancia.
En este paso se realiza una Matriz de distancias (obteniendo las distancias
entre todas las posibles combinaciones de parejas de las variables a analizar.
6. Se valida el análisis.
MEDIDAS PARA CALCULAR
LA DISTANCIA
𝐷= (𝑥𝑖𝑝 −𝑥𝑗𝑝 )2
• Distancia Euclidiana
𝐷= (𝑥𝑖𝑝 −𝑥𝑗𝑝 )2
• Distancia al cuadrado:
menos exigente que la
anterior
1
𝐷=[ (𝑥𝑖𝑝 −𝑥𝑗𝑝 )2 ] 𝑛
• Distancia de Minkowski:
Registro2: 0 Registro2: 1
Registro1: 0 a b
Registro1: 1 c d
Distancias: 𝐷 = 𝑏+𝑐
𝑏−𝑐 2
*Diferencia de tamaño: D= 𝑎+𝑏+𝑐+𝑑 2
𝑏∗𝑐
*Diferencia de configuración: D = 𝑎+𝑏+𝑐+𝑑 2
Tabla Cruzada
Joel
de frecuencias
1 0
Ismael 1 1a 2b
0 1c 0d
2−1 2
*Diferencia de tamaño: D= 1+2+1+0 2
= 0.0625
2∗1
*Diferencia de configuración: D = = 0.125
4 2
• Análisis jerárquico:
- ETAPAS:
1. Determinar los centroides iniciales para los k grupos
2. Formación de los grupos
3. Recalcular los centroides y formar grupos hasta lograr la estabilidad.
1. Determinar los centroides iniciales para los k grupos
Para cualquier análisis cluster se debe partir del número de grupos con el cual se
quedará al final el análisis.
Ejemplo:
Para este ejemplo, se considera la base de datos Museo que contiene la siguiente
información:
Encuesta a 25 niños al salir de un museo, las respuestas a las preguntas van del 1 al
7 , donde 7 es totalmente de acuerdo y 1 es totalmente en desacuerdo.
La base de datos contiene la siguiente información:
Técnica elegida
para hacer el
cluster