Está en la página 1de 19

Marketing II

Guía de Análisis Cluster en SPSS


• Profesores: Cristobal Fernández - Noah Silva - Diego Yañez

El análisis de conglomerados o cluster es una técnica multivariante que permite agrupar variables
en función del parecido existente entre ellas. Consiste en obtener grupos de individuos de manera
que, los objetos pertenecientes a un mismo grupo sean muy semejantes entre sí y por otro
lado, que los grupos tengan un comportamiento distinto, es decir, se busca lograr la máxima
homogeneidad en cada grupo y la mayor diferencia entre los grupos respecto a algún criterio
de selección predeterminado. Este análisis no hace diferencia entre variables dependientes e
independientes, sino busca relaciones interdependientes de todo un conjunto de variables.

SPSS cuenta con dos tipos de análisis de conglomerado: el jerárquico y el no jerárquico. El


primero es de carácter exploratorio, se utiliza para determinar el número óptimo de conglomerados
existentes en la base de datos y el contenido de los mismos; mientras que el segundo puede
confirmar lo indicado en primera instancia por un modelo de tipo jerárquico, conociendo de
antemano número de conglomerados que se desea obtener.

A continuación se presenta un análisis de Cluster realizado a una base de datos obtenida a partir
de una encuesta sobre el reciclaje relacionado con el habito, acciones que promueven el mismo,
actividades relacionadas, cultura del reciclaje, condiciones ambientales y puntos de reciclaje que
permitan tener un accionar responsable en el día a día,

Marketing II 1 NSM
Análisis de conglomerados jerárquico

Una vez ingresados los datos al SPSS, se va a Analizar, luego Clasificar y se selecciona
Conglomerados Jerárquicos.

Figure 1: Conglomerado Jerárquico.

Marketing II 2 NSM
En la ventana emergente se seleccionan las variables que describen la similitud entre los objetos o
por la cual se desean agrupar los datos. En este caso se seleccionan todas las variables ya que se
quiere analizar como las motivaciones de las personas se agrupan.

Figure 2: Conglomerado Jerárquico.

Marketing II 3 NSM
Al lado derecho de la ventana emergente se encuentran las opciones del análisis cluster:

• Estadísticos: Se dejaran las opciones por defecto, agregando el Historial de conglom-


eración.

Figure 3: Conglomerado Jerárquico.

Marketing II 4 NSM
• Gráficos: Se agregará la opción Dendrograma.

Figure 4: Conglomerado Jerárquico.

Marketing II 5 NSM
• Método: Se dejan las opciones tal cual.

Figure 5: Conglomerado Jerárquico.

• Guardar: Se dejan las opciones predeterminadas.

Marketing II 6 NSM
Análisis y Resultados

Figure 6: Resulados.

Figure 7: Resulados.

En “Historial de conglomerados” muestra cómo se fueron armando los conglomerados etapa por
etapa. En la columna “Conglomerado que se combina” se ve qué pareja de datos se unió en cada
paso.

Marketing II 7 NSM
Figure 8: Resulados.

El Diagrama de tempano se lee de abajo hacia arriba y permite conocer el número de conglomerados
en cada etapa. En la primera etapa, parte inferior del gráfico, se ven 20 grupos con la mayoría
con un solo dato. Representa gráficamente las etapas de unión de cada par de datos.

Marketing II 8 NSM
Figure 9: Resulados.

El dendograma también presenta el orden de cómo se fueron armando cada uno de los conglomer-
ados. Las líneas punteadas (verticales) representan los grandes pasos que hace para unir cada
grupo de datos con otro, es decir, los elementos se unen de manera no natural o de manera
forzada, uniendo grupos de puntos que naturalmente no están tan cercanos como los ya agrupados.

El dendograma tiene la virtud de mostrar cuáles son los grupos “naturalmente” asociados a las
variables estudiadas. Esclareciendo a priori el número de segmentos que se encuentran “ocultos”
en nuestros datos. El problema radica en que el investigador debe ser audaz en validar el número
de conglomerados, viendo si estos tienen un sentido para la investigación o no.

Marketing II 9 NSM
Grupo de Pertenencia

Una vez realizado el análisis jerárquico, para analizar los resultados de él con mayor detalle existe
una opción en el SPPS donde se asigna a cada dato el grupo de pertenencia en base a un rango
de conglomerados, permitiendo identificar cada dato con su respectivo segmento y poder realizar
análisis univariado referente a variables importantes en el estudio y determinar si los grupos son
diferentes o en realidad no se distan mucho uno del otro.
Ir a Analizar, luego Clasificar y se selecciona Conglomerados Jerárquicos. Seleccionar el
botón Guardar.

Figure 10: Grupo de pertenencia.

En la ventana emergente seleccionar Rango de soluciones. Dado el dendograma, se colocarán


desde 2 hasta 4. El rango determina el número de conglomerados que se quieren estudiar y
definirá para cada número de grupos al que pertenece cada dato.

Luego, elegir opción Gráficos y en la ventana emergente seleccionar Rango de conglomerados


y poner en Iniciar conglomerados en 2 y Detener conglomerados en 4. Hacer click en
Continuar.

Figure 11: Grupo de pertenencia.

Marketing II 10 NSM
Finalmente, aceptar.

Figure 12: Grupo de pertenencia, resultados.

Al volver a la hoja de datos, aparecerá una nueva columna ıCLU 41 , que asigna el valor del
conglomerado que pertenece cada dato. Se agregará una columna adicional por cada conglomerado
que incluya el rango predefinido anteriormente. En este caso serian 3 nuevas variables, siendo las
columnas “CLU 41 ”, “CLU 31 ” y “CLU 21 ”.

Marketing II 11 NSM
Interpretación

Una vez caracterizado los conglomerados utilizando la nueva variable, a través de SPSS se puede
realizar un análisis univariado de los datos. Ir a Analizar→ Comparar Medias

Figure 13: Interpretación.

En la ventana emergente se deben colocar las variables independientes y dependientes. En este


caso la variable independiente es la que muestra la pertenencia al conglomerado denominadas
Avarage Linkage , mientras que el resto es dependiente (preguntas realizadas).

Figure 14: Interpretación.

Marketing II 12 NSM
Ir a Opciones y seleccionar los estadísticos que nos interesen y hacer click en continuar.

Figure 15: Interpretación.

En resultados, se presentaran las características de cada conglomerado, mostrando los estadísticos


seleccionados de todas las variables a analizar.

Marketing II 13 NSM
Análisis de conglomerados no jerárquico por K medias

Una vez ingresados los datos al SPSS, se va a Analizar, luego Clasificar y se selecciona
Conglomerados de K Medias. Al igual que el ejemplo anterior se eligen las variables que van
a dar origen a los conglomerados:

Figure 16: Conglomerados no jerárquicos por K medias.

Marketing II 14 NSM
Figure 17: Conglomerados no jerárquicos por K medias.

Marketing II 15 NSM
En número de conglomerados ingresar el número de grupos deseados, en este caso 3. Y en la
opción Guardar seleccionar conglomerado de pertenencia, el resto de las opciones se dejan tal
cual.

Figure 18: Conglomerados no jerárquicos por K medias.

Finalmente, Aceptar.

Marketing II 16 NSM
Análisis y Resultados

Figure 19: Resultados.

En la primera tabla se presenta la etapa inicial de cada centroide de conglomerado de acuerdo a


las variables estudiadas.

Figure 20: Resultados.

En la Historial de iteraciones presenta cada iteración realizada por el SPSS, dando la variación
que tuvo el centroide de cada conglomerado en cada iteración.

Marketing II 17 NSM
Figure 21: Resultados.

La tabla Centros de los conglomerados finales se tiene para cada variable y conglomerado
su centroide.

Figure 22: Resultados.

La última tabla presentada muestra la cantidad de casos que tiene cada conglomerado. Al volver
a la hoja de datos, aparecerá una nueva columna ıQCL1 , que asigna el dato a uno de los tres
clúster. Al igual que en el caso anterior, esta nueva variable sirve para caracterizar los diferentes
segmentos se puede realizar a través de un análisis univariado por SPSS.

Acotación: El análisis clúster es una herramienta que permite identificar segmentos dentro de
la encuesta, para realizarlo no se necesitan preguntas especificas en ella. Es recomendable us-
arlo cuando existen en el cuestionario variables de segmentación como preferencia y hábitos de
uso y/o consumo, su validación de ser o no ser una variable de segmentación en el contexto
estudiado se comprueba a través del análisis en SPSS. Independiente de cuál sea el análisis que
se utilice, los posibles análisis serán los mismos para ambos casos, la diferencia radica en la
posición en que se encuentra el investigador, sabe o no a priori cuantos segmentos deberían existir.

Marketing II 18 NSM
Postnote: En SPSS se puede obtener una aproximación de la cantidad de clúster a utilizar
mediante la herramienta de Clúster bietápico (Analizar ⇒ Clasif icar ⇒ Clústerbietápico).
Luego, se deben seleccionar las variables que cumplan con el criterio de segmentación deseado,
seleccionar el método, generalmente distancia euclidiana. Finalmente, aparecerá un gráfico que
muestra la cantidad de grupos ideales y su calidad. Este análisis exploratorio permite tener una
aproximación del número ideal de clúster a utilziar en el método K-medias.

Figure 23: Resultado Clúster bietápico.

Marketing II 19 NSM

También podría gustarte