Documentos de Académico
Documentos de Profesional
Documentos de Cultura
● Dos Técnicas:
○ Jerárquicas:
- Agrupar los casos de forma jerárquica calculando mediante medidas
de distancia o medidas de muestreo más pequeñas
- más objetiva, más utilizada para inv. de mercados.
- no hay teoría ni clasificación previa por ello los algoritmos son más
precisos con un software
→ Tecnica de Ward
- Perfiles de consumidor
- La distancia se minimiza a la medida del conglomerado creando
grupos homogéneos y con tamaños similares.
- procedimiento de varianza en el que la D.E ^2 se minimiza a la
medida del conglomerado.
- Genera conglomerados muy similares
- es la más utilizada y tiene un desempeño más homogéneo
OJO: se pueden incluir clusters en las regresiones siempre y cuando sean solo dos
clusters y se pueda hacer variables ficticias
OJO: Siempre fijarnos en la naturaleza de las variables antes de hacer cualquier cosa
- si ya están en una misma medida entonces no hacemos la estandarización
EN SPSS
Si hubiera que estandarizar:
● Estandarizar: Analizar → estadísticos descriptivos → descriptivos → guardar variables
estandarizados como variables
Fase Exploratoria
● Clusters (jerárquico): Analizar → Clasificar → Clusters Jerárquicos (en el caso de no conocer
los clusters ni conocimiento previo) - marcar: clusters (casos), visualización (ambos)
○ Estadísticos: historial de conglomeración, matriz de proximidades y cluster
de pertenencia (ninguna)
○ Gráficos: dendrograma, todos los clusters, orientación vertical
○ Método (hay muchos métodos): Método de Ward, intervalo→ Distancia Euclídea al
cuadrado, se puede estandarizar ahí mismo si es necesario “estandarizar:
puntuaciones Z”.
○ Guardar : ninguna
→ sale un cuadro HUGE
OUTPUTS
● Matriz de Proximidades: Relaciona numéricamente las características
(variables)
- Menor número (distancia), mayor parecido entre variables.
● Historial de conglomeración
- Como se van formando los clusters
- Muestra los niveles de fusión, cuales son los casos que se agruparon
y formaron un cluster para luego formar el dendrograma
- Se hace en base a etapas:
- pasa a la siguiente etapa el menor valor
- ej: 23-24 → pasa a la siguiente 23// 5-23 → pasa a la siguiente 5
● Dendrograma
- Muestra cómo se van formando los clusters y las distancias
gráficamente entre ellos. Ayuda a establecer rangos de cuantos
clusters hay.
- La línea de arriba representa la distancia
- eje y son los casos
- lo que se busca es poder ver los organismos que menos se parecen
- la ayuda es verlo desde afuera hacia adentro
● Gráfico de témpanos:
○ se divide también en número de clusters
○ se van acabando las líneas a medida qué se van agrupando los
casos
○ estos grupos se ven más a profundidad en el dendograma
○ las columnas blancas significan qué ya no hay agrupacion
Fase Confirmatoria
● Clusters (jerárquico): Analizar → Clasificar → Clusters Jerárquicos → Estadísticos (poner los
rangos de soluciones) → Guardar → rango de soluciones con los clusters previamente
identificados
○ te salen en el SPSS columnas adicionales pero necesitamos saber cuántas
observaciones hay dentro como están distribuidos
● Tabla de frecuencias
- Luego de tener los rangos de clusters que podrían ser (ej: 4 o 5 clusters no
estamos seguros) se hace un análisis de frecuencias para ver cómo están
distribuidas cada cluster. Se debe elegir la opción de número de clusters que
tenga mayor (homogeneidad) en frecuencias (%).
● Regresas al SPSS para borrar la columna que corresponde a la cantidad de clusters
qué no vas a usar
● SPSS
○ analizar → estadísticos descriptivos → descriptivos → poner las variables
○ Guardar → guardar valores estandarizados