Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Cluster
Cluster
1
Jerrquicos (Que desarrollan los conglomerados cuando el investigador ha
definido de manera anticipada su nmero).
Algunas de las preguntas que encontramos en sta encuesta son las siguientes:
Sexo
Edad
A Es divertido ir al museo?* divertid
B Siempre que voy al museo le pido a mis papas que me compren algo de lo que venden
adentro? * pidocomp
*
C Puedo aprender en la escuela lo mismo que en el museo? aprendom
D Prefiero ir al museo en excursiones con la escuela? * excur
E Ir al museo en mi tiempo libre me quita tiempo para jugar? * quitatie
F No me interesa en lo mas mnimo asistir al museo? * nomeint
Te gust tu visita al museo? (Si/No) gustovis
*
De Totalmente en desacuerdo a Totalmente de acuerdo en escala de 7 puntos.
1. Que para identificar los grupos de nios, las preguntas que se elijan deben
de estar en la misma escala de medicin. (En caso de que esto no sea
posible, se deben de estandarizar los valores)
2
Tras aplicar la encuesta obtenemos las siguientes respuestas por parte de los 25
nios:
caso sexo edad divertid pidocomp aprendom excur quitatie nomeint gustovis
1 1 9 6 7 3 3 4 2 1
2 1 10 2 1 4 4 3 5 0
3 0 9 7 6 3 4 2 1 1
4 0 9 4 4 6 5 6 3 1
5 0 9 1 2 4 2 3 6 0
6 0 10 6 6 4 3 4 3 1
7 0 10 5 6 4 3 3 3 1
8 0 10 7 7 4 4 3 1 1
9 1 9 2 3 3 3 4 6 0
10 1 9 3 3 6 6 5 4 0
11 0 10 1 2 3 3 3 5 1
12 0 9 5 5 4 4 4 2 1
13 0 9 2 1 4 5 2 4 1
14 0 9 4 4 7 6 6 4 1
15 0 8 6 4 4 2 5 1 1
16 0 9 3 4 7 6 5 4 0
17 1 9 4 7 5 2 4 2 0
18 0 9 3 2 3 6 7 4 1
19 0 9 4 3 7 7 6 2 1
20 1 9 2 2 2 4 3 7 0
21 0 9 5 6 5 4 4 3 1
22 1 9 5 7 5 4 3 3 1
23 1 9 4 2 7 7 7 1 1
24 1 10 3 3 5 7 4 4 0
25 1 10 1 2 3 3 2 4 0
Nuestro siguiente paso es escoger las variables que podramos nosotros utilizar
para identificar a los grupos (recordamos que estas variables deben de estar en la
misma escala de medicin, o en su defecto, deben tener estandarizados los
valores).
Entonces tenemos que para esta agrupacin podemos utilizar las siguientes
preguntas:
3
(Medidas en escalas de 7 puntos de Totalmente en desacuerdo a Totalmente de
Acuerdo)
Ya que hemos elegido a las variables que consideramos que podemos utilizar para
nuestro anlisis, debemos demostrar su aplicabilidad mediante la demostracin de
la existencia de una fuerte asociacin entre las variables que van a configurarlo, lo
cual podemos hacer con el siguiente anlisis de correlacin.
Tabla de Correlaciones Bivariadas
Si no se observaran fuertes correlaciones entre las variables que sern parte del
Anlisis Cluster se puede concluir que no tiene sentido realizarlo.
4
Una vez que hemos realizado la agrupacin por un mtodo Jerrquico, podemos
realizarla tambin por un mtodo no jerrquico para validar o confirmar de alguna
forma los datos obtenidos en un principio. (De ah que los mtodos no jerrquicos
se conozcan tambin como mtodos confirmatorios)
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
20
21
18
19
25
23
24
22
2
5
9
Poca distancia 10
entre los casos 3
de cada cluster 4
6
1
8
7
11
15
13
16
14
17
12
5
Mucha distancia
entre los clusters (3)
En sta grfica podemos notar la existencia de distintos grupos de alumnos
(clusters), donde nuestra principal tarea en stos momentos es poder definir con
cuantos grupos quedarnos, opciones que podran ir desde los dos hasta que cada
alumno represente su propio cluster (es decir, 25 clusters), pero debemos tomar
en cuenta la practicidad del manejo de la informacin, y que tampoco podemos
considerar como un cluster o conglomerado a 1 slo elemento.
As que de manera grfica podemos optar por la opcin de tres clusters, donde
existe poca distancia entre los elementos de cada cluster (la observamos por las
lneas horizontales) y mucha distancia entre los distintos clusters (la observamos
de la misma manera), donde cada conglomerado estara conformado por los
siguientes nios/elementos:
6
adems de prcticos y homogneos, los clusters deben aportar informacin
razonable y fcil de comprender a la investigacin.
Una vez que hemos determinado el nmero de los clusters, podemos proceder a
estudiarlos y compararlos; una buena opcin podra ser desarrollar grficas que
nos apoyen en su estudio, y de acuerdo a las caractersticas de los clusters
podramos tambin otorgarles un nombre con el cual podamos identificarlos ms
fcilmente.
Totalm ente 7
de Acue rdo
Totalm e nte 2
en Interesados Desinteresados
desacue rdo Ldicos
1
Cluster 1: Formado por 8 alumnos, nos muestra valores altos en las preguntas de
diversin y de consumo, adems nos presenta un muy bajo promedio en la
pregunta de no me interesa en lo ms mnimo ir al museo, es decir, se
encuentran muy interesados en ir al museo, se divierten mucho ah, y adems les
piden a sus papas que les compren cosas dentro, entonces de una forma simple
podramos identificar a ste cluster como Interesado.
Cluster 2: Formado por 10 alumnos, nos muestra valores muy altos en las
preguntas de Aprendo lo mismo en la escuela que en el museo, prefiero ir al
museo en excursiones con la escuela e Ir al museo en mi tiempo libre me quita
tiempo para jugar, nos dan a entender que es un segmento que gusta de ir al
7
museo en el tiempo de la escuela y no en el tiempo libre (Quiz para perder
tiempo de clases), lo cual nos permitira identificar a ste cluster como un grupo
ldico.
Cluster 3: Formado por 7 alumnos, nos muestra valores muy bajos en la mayora
de los reactivos, pero tambin nos muestra un promedio muy alto en la pregunta
No me interesa en lo ms mnimo ir al museo, y al ser un segmento
completamente aptico, podramos identificarlo como un segmento
completamente Desinteresado.
Una vez definidas las etiquetas de cada cluster, podemos tambin continuar en la
investigacin de las caractersticas de cada grupo, tales como el sexo o si es que
gustaron de su visita al museo.
Distribucin del sexo por cluster
Cluster
2 Masc ulino
Interesados Desinteres ados Ldicos
8
Tambin podemos estudiar la opinin de cada cluster en relacin a su visita al
museo, es decir, si gustaron de ella o no, a lo que podemos ver lo siguiente:
Recuento
Te gust tu visita al
museo?
No Si Total
Interesados 1 9 10
Cluster Desinteresados 5 2 7
Ldicos 3 5 8
Total 9 16 25
5 5
4
3
2
2
No
1
0 Si
Interesados Desinteresados Ldicos
stas diferencias resultan ser obvias desde cierto punto de vista, y son utilizadas
solo para propsitos meramente descriptivos, ya que uno de los objetivos del
anlisis de conglomerados es precisamente maximizar las diferencias entre los
grupos de casos.
9
Las diferencias significativas entre stos grupos de casos las mostramos en la
siguiente tabla.
ANOVA
Suma de Media
cuadrados gl cuadrtica F Sig.
Es divertido ir al museo Inter-grupos 67.886 2 33.943 61.642 .000
Intra-grupos 12.114 22 .551
Total 80.000 24
Cuando voy al museo le pido a Inter-grupos 82.328 2 41.164 54.449 .000
mis papas que me compren
algo de lo venden adentro Intra-grupos 16.632 22 .756
Total 98.960 24
Puedo aprender en la escuela Inter-grupos 29.911 2 14.956 14.736 .000
lo mismo que en el museo
Intra-grupos 22.329 22 1.015
Total
52.240 24
En sta tabla podemos tambin identificar cules son las variables que
contribuyen ms al proceso de agrupamiento, esto podemos hacerlo mediante los
valores F, entonces podemos concluir que las variables que contribuyen ms al
agrupamiento son: Es divertido ir al museo, y Cuando voy al museo le pido a mis
papas que me compren algo adentro.
10
de un anlisis jerrquico que nos oriente y permita identificar de manera visual en
cuantos grupos se pueden dividir la base.
Cuando contamos con una base base de datos extensa, resulta hasta cierto punto
difcil poder interpretar el dendrograma (debido a su extensin), as que
podramos realizar el anlisis de K-medias pidindole a la mquina soluciones
mltiples (podramos hacerlo con ste ejercicio, con una solucin de 3 a 7
clusters), pidindole tambin a la mquina que nos guarden los conglomerados de
pertenencia para cada individuo.
Cluster
Centroides de grupo
Ldicos
Desinteresados
Interesados
11
Poca
distancia
entre los
casos
de cada
a
Resultados de la clasificacin
Grupo de pertenencia pronosticado
Average Linkage Desintere
(Betw een Groups) Interesados sados Ldicos Total
Original Recuento Interesados 10 0 0 10
Desinteresados 0 7 0 7
Ldicos 0 0 8 8
% Interesados 100.0 .0 .0 100.0
Desinteresados .0 100.0 .0 100.0
Ldicos .0 .0 100.0 100.0
12
i
Csar Lpez, Tcnicas Estadsticas con SPSS, 2001