INMACULADA BARRERA
Como se observa pueden etiquetarse los grupos con una de las variables del fichero.
Tambin es posibles realizar conglomerados no para objetos sino para variables, (agrupar variables por el parecido que presentan en las respuestas de los individuos)
CLUSTER JERRQUICOS.OPCIN METODO: -Podremos estandarizar las variables utilizadas en el anlisis antes de utilizarlas el clculo de las similaridades si fuese necesario. Los mtodos disponibles son varios. -Permite seleccionar la medida usada para ver el parecido entre individuos con distintas distancias dependiendo si la variable es binaria, frecuencias o de intervalo. -Es posible tambin elegir el mtodo para obtener los conglomerados Todos los vistos . Los dos primeros vinculacin Inter.grupos y dentro de grupos se corresponde a la opcin denominada UPGMA (mtodo del promedio) y una variante de este donde se consideran para el clculo de la distancia media la correspondiente a todos los posibles pares del grupo resultante y no slo a los formados con un elemento de cada grupo como en el anterior.
ESTANDARIZAR
MEDIDA
METODO
Historial muestra los casos o conglomerados combinados en cada etapa, las distancias entre los casos combinados y el ltimo nivel del proceso de aglomeracin en el que cada caso se uni al conglomerado correspondiente
Matriz distancias Conglomerado de pertenencia nos da el conglomerado al que se asigna cada caso pudiendo elegir entre una nica solucin o un rango de soluciones En el ejemplo hemos seleccionado entre 2 y 3 cluster.
CLUSTER JERRQUICOS.OPCIN GRFICOS Permite obtener el dendrograma y los vertical u horizontal icicle plots, o diagramas de tmpanos.
CLUSTER JERRQUICOS.7 6
7
distancia
Cluster 2
3
5
1
distancia
Cluster 1
objeto
Cluster C
3
7 6
distancia
Cluster 2
3
Cluster B
0 1
Cluster A
5
1
objeto
Cluster 3
0 1 2 3 4 5
Cluster 1
objeto
CLUSTER JERRQUICOS.OPCIN GUARDAR Permite guardar los conglomerados de pertenencia para una solucin nica o para un rango de soluciones. Las variables guardadas pueden emplearse en anlisis posteriores para explorar otras diferencias entre grupos.
PROCEDIMIENTO K-MEANS
Una vez seleccionadas las variables y determinado el nmero de conglomerados que deseamos obtener podemos elegir entre iterar y clasificar o slo clasificar. Para obtener mxima eficacia, podemos tomar una muestra de casos utilizar el mtodo iterar y clasificar para determinar los centros de los conglomerados. Seleccionamos escribir finales en archivo. Despus repetimos el anlisis con slo clasificar leyendo los iniciales del archivo anterior
PROCEDIMIENTO K-MEANS
OPCIN ITERAR
Para la opcin iterar se puede determinar el nmero mximo de iteraciones, o bien fijar un criterio de convergencia mayor de cero y menor de uno. La opcin usar medias actualizadas recalcula centroides con cada individuo asignado al grupo, sino deselecciona esta opcin no se recalculan hasta que todos los individuos estn asignados.
PROCEDIMIENTO K-MEANS
Opcin guardar
permite crear una nueva variable que indica para cada caso el conglomerado al que pertenece y si se quiere otra variable con la distancia entre cada caso y su centro de clasificacin.
PROCEDIMIENTO K-MEANS
BOTN OPCIONES
Conglomerado
3 18,60 5,20 1,50 3,80 Conglomerado 1 2 3 14,925 14,864 29,698 1 2 14,925 3 14,864 29,698
PROCEDIMIENTO K-MEANS
BOTN OPCIONES
ANOVA
Conglomerado Media cuadrtica Cereales 1324,656 Feculas frutossecos frutasverduras 9,194 15,636 1,832 2 2 2 2 10,972 2,077 2,880 3,383 22 22 22 22 120,727 4,426 5,429 ,542 ,000 ,024 ,012 ,589 gl Error Media cuadrtica gl F Sig.
Las pruebas F slo se deben utilizar con una finalidad descriptiva puesto que los conglomerados han sido elegidos para maximizar las diferencias entre los casos en diferentes conglomerados. Los niveles crticos no son corregidos, por lo que no pueden interpretarse como pruebas de la hiptesis de que los centros de los conglomerados son iguales.
PROCEDIMIENTO K-MEANS
BOTN OPCIONES
Conglomerado
7,000
3,000
3 Vlidos Perdidos
conglomerado:
Muestra los grficos que indican variacin de cada variable dentro de los conglomerados. En categricas se genera un grfico de barras agrupado, mostrando la frecuencia de las categoras en cada conglomerado. En las contnuas un grafico de barras de error para la variable en cada conglomerado..
Conglomerado
-40
-20
20
40
t de Student