Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Jerárquicos (Que desarrollan los conglomerados cuando el investigador ha
definido de manera anticipada su número).
Algunas de las preguntas que encontramos en ésta encuesta son las siguientes:
Sexo
Edad
A ¿Es divertido ir al museo?* divertid
B ¿Siempre que voy al museo le pido a mis papas que me compren algo de lo que venden
adentro? * pidocomp
*
C ¿Puedo aprender en la escuela lo mismo que en el museo? aprendom
D ¿Prefiero ir al museo en excursiones con la escuela? * excur
E ¿Ir al museo en mi tiempo libre me quita tiempo para jugar? * quitatie
F ¿No me interesa en lo mas mínimo asistir al museo? * nomeint
¿Te gustó tu visita al museo? (Si/No) gustovis
*
De Totalmente en desacuerdo a Totalmente de acuerdo en escala de 7 puntos.
1. Que para identificar los grupos de niños, las preguntas que se elijan deben
de estar en la misma escala de medición. (En caso de que esto no sea
posible, se deben de estandarizar los valores)
2
Tras aplicar la encuesta obtenemos las siguientes respuestas por parte de los 25
niños:
caso sexo edad divertid pidocomp aprendom excur quitatie nomeint gustovis
1 1 9 6 7 3 3 4 2 1
2 1 10 2 1 4 4 3 5 0
3 0 9 7 6 3 4 2 1 1
4 0 9 4 4 6 5 6 3 1
5 0 9 1 2 4 2 3 6 0
6 0 10 6 6 4 3 4 3 1
7 0 10 5 6 4 3 3 3 1
8 0 10 7 7 4 4 3 1 1
9 1 9 2 3 3 3 4 6 0
10 1 9 3 3 6 6 5 4 0
11 0 10 1 2 3 3 3 5 1
12 0 9 5 5 4 4 4 2 1
13 0 9 2 1 4 5 2 4 1
14 0 9 4 4 7 6 6 4 1
15 0 8 6 4 4 2 5 1 1
16 0 9 3 4 7 6 5 4 0
17 1 9 4 7 5 2 4 2 0
18 0 9 3 2 3 6 7 4 1
19 0 9 4 3 7 7 6 2 1
20 1 9 2 2 2 4 3 7 0
21 0 9 5 6 5 4 4 3 1
22 1 9 5 7 5 4 3 3 1
23 1 9 4 2 7 7 7 1 1
24 1 10 3 3 5 7 4 4 0
25 1 10 1 2 3 3 2 4 0
Nuestro siguiente paso es escoger las variables que podríamos nosotros utilizar
para identificar a los grupos (recordamos que estas variables deben de estar en la
misma escala de medición, o en su defecto, deben tener estandarizados los
valores).
Entonces tenemos que para esta agrupación podemos utilizar las siguientes
preguntas:
3
(Medidas en escalas de 7 puntos – de Totalmente en desacuerdo a Totalmente de
Acuerdo)
Ya que hemos elegido a las variables que consideramos que podemos utilizar para
nuestro análisis, debemos demostrar su aplicabilidad mediante la demostración de
la existencia de una fuerte asociación entre las variables que van a configurarlo, lo
cual podemos hacer con el siguiente análisis de correlación.
Tabla de Correlaciones Bivariadas
Si no se observaran fuertes correlaciones entre las variables que serán parte del
Análisis Cluster se puede concluir que no tiene sentido realizarlo.
4
Una vez que hemos realizado la agrupación por un método Jerárquico, podemos
realizarla también por un método no jerárquico para validar o confirmar de alguna
forma los datos obtenidos en un principio. (De ahí que los métodos no jerárquicos
se conozcan también como métodos confirmatorios)
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
20
21
18
19
25
23
24
22
2
5
9
Poca distancia 10
entre los casos 3
de cada cluster 4
6
1
8
7
11
15
13
16
14
17
12
5
Mucha distancia
entre los clusters (3)
En ésta gráfica podemos notar la existencia de distintos grupos de alumnos
(clusters), donde nuestra principal tarea en éstos momentos es poder definir con
cuantos grupos quedarnos, opciones que podrían ir desde los dos hasta que cada
alumno represente su propio cluster (es decir, 25 clusters), pero debemos tomar
en cuenta la practicidad del manejo de la información, y que tampoco podemos
considerar como un cluster o conglomerado a 1 sólo elemento.
Así que de manera gráfica podemos optar por la opción de tres clusters, donde
existe poca distancia entre los elementos de cada cluster (la observamos por las
líneas horizontales) y mucha distancia entre los distintos clusters (la observamos
de la misma manera), donde cada conglomerado estaría conformado por los
siguientes niños/elementos:
6
además de prácticos y homogéneos, los clusters deben aportar información
razonable y fácil de comprender a la investigación.
Una vez que hemos determinado el número de los clusters, podemos proceder a
estudiarlos y compararlos; una buena opción podría ser desarrollar gráficas que
nos apoyen en su estudio, y de acuerdo a las características de los clusters
podríamos también otorgarles un nombre con el cual podamos identificarlos más
fácilmente.
Totalm ente 7
de Acue rdo
Totalm e nte 2
en Interesados Desinteresados
desacue rdo Lúdicos
1
e quita
0
que m e com pren algo
lo m ás m ínim o ir al
Pre fie ro ir al m use o
Cuando voy al m useo
No m e inte res a e n
la lo m ism o
papas
Ir al m us eo en m i
m tiempo
me interesa en
ir al museo
museo
s
Puedo aprender en l
l
con la e scuela
Apre ndo en la
al museo
ione
No useo
en mi
Prefiero ir al
adentro
voyis
en excurs
libre
Es divertido
am
al museo
Cuando
m
escue
tiemIrpo
le pido
Cluster 1: Formado por 8 alumnos, nos muestra valores altos en las preguntas de
diversión y de consumo, además nos presenta un muy bajo promedio en la
pregunta de “no me interesa en lo más mínimo ir al museo”, es decir, se
encuentran muy interesados en ir al museo, se divierten mucho ahí, y además les
piden a sus papas que les compren cosas dentro, entonces de una forma simple
podríamos identificar a éste cluster como Interesado.
Cluster 2: Formado por 10 alumnos, nos muestra valores muy altos en las
preguntas de “Aprendo lo mismo en la escuela que en el museo”, “prefiero ir al
museo en excursiones con la escuela” e “Ir al museo en mi tiempo libre me quita
tiempo para jugar”, nos dan a entender que es un segmento que gusta de ir al
7
museo en el tiempo de la escuela y no en el tiempo libre (Quizá para perder
tiempo de clases), lo cual nos permitiría identificar a éste cluster como un grupo
lúdico.
Cluster 3: Formado por 7 alumnos, nos muestra valores muy bajos en la mayoría
de los reactivos, pero también nos muestra un promedio muy alto en la pregunta
“No me interesa en lo más mínimo ir al museo”, y al ser un segmento
completamente apático, podríamos identificarlo como un segmento
completamente Desinteresado.
Una vez definidas las etiquetas de cada cluster, podemos también continuar en la
investigación de las características de cada grupo, tales como el sexo o si es que
gustaron de su visita al museo.
Distribución del sexo por cluster
Cluster
2 Masc ulino
Interesados Desinteres ados Lúdicos
8
También podemos estudiar la opinión de cada cluster en relación a su visita al
museo, es decir, si gustaron de ella o no, a lo que podemos ver lo siguiente:
Recuento
¿Te gustó tu visita al
museo?
No Si Total
Interesados 1 9 10
Cluster Desinteresados 5 2 7
Lúdicos 3 5 8
Total 9 16 25
5 5
4
3
2
2
No
1
0 Si
Interesados Desinteresados Lúdicos
Éstas diferencias resultan ser obvias desde cierto punto de vista, y son utilizadas
solo para propósitos meramente descriptivos, ya que uno de los objetivos del
análisis de conglomerados es precisamente maximizar las diferencias entre los
grupos de casos.
9
Las diferencias significativas entre éstos grupos de casos las mostramos en la
siguiente tabla.
ANOVA
Suma de Media
cuadrados gl cuadrática F Sig.
Es divertido ir al museo Inter-grupos 67.886 2 33.943 61.642 .000
Intra-grupos 12.114 22 .551
Total 80.000 24
Cuando voy al museo le pido a Inter-grupos 82.328 2 41.164 54.449 .000
mis papas que me compren
algo de lo venden adentro Intra-grupos 16.632 22 .756
Total 98.960 24
Puedo aprender en la escuela Inter-grupos 29.911 2 14.956 14.736 .000
lo mismo que en el museo
Intra-grupos 22.329 22 1.015
Total
52.240 24
En ésta tabla podemos también identificar cuáles son las variables que
contribuyen más al proceso de agrupamiento, esto podemos hacerlo mediante los
valores F, entonces podemos concluir que las variables que contribuyen más al
agrupamiento son: Es divertido ir al museo, y Cuando voy al museo le pido a mis
papas que me compren algo adentro.
10
de un análisis jerárquico que nos oriente y permita identificar de manera visual en
cuantos grupos se pueden dividir la base.
Cuando contamos con una base base de datos extensa, resulta hasta cierto punto
difícil poder interpretar el dendrograma (debido a su extensión), así que
podríamos realizar el análisis de K-medias pidiéndole a la máquina soluciones
múltiples (podríamos hacerlo con éste ejercicio, con una solución de 3 a 7
clusters), pidiéndole también a la máquina que nos guarden los conglomerados de
pertenencia para cada individuo.
Cluster
Centroides de grupo
Lúdicos
Desinteresados
Interesados
11
Poca
distancia
entre los
casos
de cada
a
Resultados de la clasificación
Grupo de pertenencia pronosticado
Average Linkage Desintere
(Between Groups) Interesados sados Lúdicos Total
Original Recuento Interesados 10 0 0 10
Desinteresados 0 7 0 7
Lúdicos 0 0 8 8
% Interesados 100.0 .0 .0 100.0
Desinteresados .0 100.0 .0 100.0
Lúdicos .0 .0 100.0 100.0
12
i
César López, Técnicas Estadísticas con SPSS, 2001