Documentos de Académico
Documentos de Profesional
Documentos de Cultura
(Clúster)
Es una técnica del grupo estructural, el cual tiene por objeto resumir
información sobre un conjunto de variables independientes, trabaja con
variables medidas en escala de intervalo, de razón y nominales convertidas a
dummy; para realizar este análisis las variables deberán ser todas en una
misma escala.
Área de Aplicación
r
Distancia Euclidiana d ij ( X ik X jk ) 2
al cuadrado k 1
r
Distancia Manhattan d ij X ik X jk
k 1
Distancia Manhattan : En esta métrica, la distancia entre dos puntos es la suma de las
diferencias absolutas entre sus coordenadas
Medidas de disimilaridad métrica
Distancia Chebyshev: También se denomina métrica máxima o métrica L∞. La distancia de Chebyshev
entre dos vectores es la mayor diferencia en cualquiera de las coordenadas del espacio.
Cij Max X ik X jk
Distancia del Coseno: La distancia del coseno no es propiamente una distancia sino una medida de
similaridad entre dos vectores en un espacio que tiene definido un producto interior. En el espacio
euclídeo este producto interior es el producto escalar. La similaridad coseno no debe ser considerada
como una métrica debido a que no cumple la desigualdad triangular.
r
X ik X jk
Cosij k 1
1/ 2
r r
2
ik jk
2
X X
k 1 k 1
Distancia de Correlación de Pearson
(X ik X k )( X jk X k )
Distancia Correlación de Rij k 1
1/ 2
Pearson r 2
r
ik
2
( X X k ) ( X jk X k )
k 1 k 1
Métodos Jerárquicos: Procedimiento mediante el cual
pueden agruparse basándose en su semejanza.
Técnica Aglomerativa
Métodos Jerárquicos: Procedimiento mediante el cual
pueden agruparse basándose en su semejanza.
También llamado método de la varianza mínima, busca a los dos grupos o conglomerados cuya
unión conlleve el menor incremento de la varianza. Esto significa que en cada paso se debe
probar con todas las combinaciones posibles de dos grupos, calcular el valor del índice de la
suma de cuadrados y seleccionar aquel con menor valor. La desventaja es que tiende a formar
grupos compactos y del mismo tamaño, utiliza mas información sobre el contenido de los grupos
que otros métodos, pero es el que ha demostrado mayor eficacia en estudios de simulación.
k nj 1 nj
2
SCE X ij X ij
2
nj i 1
j 1 i 1
Método del centroide (centroid Método de la mediana (median
method) method)
• El método del centroide (centroid method) • La distancia entre dos grupos es la existente
es un criterio que considera que, al unirse entre las medianas de las características de
dos elementos y formar un grupo, las los individuos que componen los grupos, de
características que prevalecerán con este modo dos grupos que se combinan se
respecto a un tercer elemento estarán dadas ponderan de forma equivalente al método
por el promedio de las que originalmente centroide, pero independientemente del
poseían, lo cual se representa de la siguiente número de individuos que haya en cada
manera grupo. Con lo anterior, la desventaja que se
presenta en el método del centroide es que
al fusionar dos grupos de diferentes tamaño,
el centroide del nuevo grupo queda más
cerca del grupo de mayor tamaño y más
lejos de aquel de menor dimensión en
proporción a sus diferencias de tamaño
Análisis de Conglomerado con SPSS
Análisis de Conglomerado con SPSS
Modelo Jerárquico Aglomerativo
Análisis de Conglomerado con SPSS
Modelo Jerárquico Aglomerativo
Variables a Conglomerar
Variable para
identificar los grupos