Está en la página 1de 3

ANÁLISIS DE CLÚSTER

1. Analice la semejanza y la diferencia entre el análisis de conglomerados y


el análisis discriminante
Ambos se interesan en la clasificación sin embargo el análisis discriminante
requiere de un conocimiento previo del conglomerado o la pertenencia al
grupo de cada objeto o caso incluid, para desarrollar la regla de clasificación
y el análisis de conglomerado no existe información a priori sobre la
pertenencia al grupo o conglomerado de ninguno de los objetos
2. ¿Cuáles son algunos de los usos del análisis de conglomerados en
marketing?
 Segmentación de mercado
 Entender la conducta de los compradores
 Identificar oportunidades de nuevos productos
 Elegir mercados de prueba
 Reducir los datos
3. Proporcione una definición breve de los siguientes términos:
- Dendrograma: Conocido como grafica del árbol, es un medio gráfico para
presentar los resultados de la conglomeración. Las líneas verticales
representan conglomerados que están unidos. La posición de la línea en la
escala indica las distancias en las que se unen los conglomerados. El
dendograma se lee de izquierda a derecha.
- Diagrama de carámbanos: Es una representación gráfica de los resultados
de la conglomeración, recibe ese nombre porque parece una fila de
carámbanos que cuelgan del tejado de una casa. Las columnas
corresponden a los objetos que se conglomeran; y las filas, al número de
conglomerados. Un diagrama de carámbanos se lee de abajo hacia arriba.
- Calendario de aglomeración: Este programa brinda información sobre
objetos o casos que se combinan en cada etapa del proceso de
conglomeración jerárquica.
- Pertenencia al conglomerado: Indica el conglomerado al que corresponde
cada objeto o caso
4. ¿Cuál es la medida de semejanza de uso más común en el análisis de
conglomerados?
Es la distancia euclidiana o su cuadrado. La distancia euclidiana es la raíz
cuadrada de la suma de diferencias elevadas al cuadrado en los valores de
cada variable.
5. Presente una clasificación de los procedimientos de conglomeración
6. ¿Por qué suele preferirse el procedimiento de enlace promedio al de alcance único y
al de enlace completo?
R. Por qué usa la información de todos los pares de distancias, no solo las distancias
mínimas o máximas.
7. ¿Cuáles son las dos desventajas principales de los procedimientos de
conglomeración no jerárquica?
R. – La necesidad de especificar de antemano el número de conglomerados
- La arbitrariedad en la selección de los centros de los conglomerados
8. ¿Cuáles son los lineamientos para decidir el número de conglomerados?
R. – Las consideraciones teóricas, conceptuales o prácticas pueden sugerir un cierto
número de conglomerados
- En los procedimientos de conglomeración jerárquica, pueden usarse como
criterios las distancias en las que se combinan los conglomerados. Esta información
puede obtenerse del calendario de aglomeración o del dendograma.
- En los procedimientos de conglomeración no jerárquica, la proporción entre la
varianza totalintrqgrupo y la varianza entre grupos puede graficarse contra el número
de conglomerados. El punto donde se presenta un ángulo o una curva aguda indica un
número adecuado de comglomerados. Por lo regular no vale la pena incrementar el
número de conglomerados más alla de punto.
9. ¿Qué implica la interpretación de los conglomerados?
R. Implica examinar sus centroides, los cuales representan los valores promedio de los
objetos contenidos en el conglomerado en cada una de las variables. Los centroides
nos permiten
describir cada conglomerado al asignarle un nombre o etiqueta.
A menudo es util describir a los conglomerados en términos de las variables que no se
usaron para el agrupamiento. Esto incluiría variables demográficas, psicograficas, de
uso del producto, de uso de medios de comunicación, etc.

10. ¿Cuáles son algunas de las variables adicionales que se usan para describir los
conglomerados?
R. Variables demográficas, psicograficas, de uso del producto, de uso de medios de
comunicación
11. Describa algunos procedimientos disponibles para evaluar la calidad de las
soluciones de conglomeración
R. – Realicé el análisis de conglomerado con los mismos datos, pero con diferentes
medidas de distancia. Compare los resultados entre las medidas para determinar la
estabilidad de las soluciones.
- Utilice diferentes procedimientos de conglomeración y compare los resultados
- Divida al azar los datos en mitades. En cada mitad realice la conglomeración de
manera separada. Compare los centroides de los conglomerados de las dos
submuestras.
- Suprima variables al azar. Realice la conglomeración en el conjunto reducido de
variables. Compare los resultados en los obtenidos al formar los conglomerados a
partir del conjunto de variables completo.
- En la conglomeración no jerárquica, tal vez la solución dependa del orden de los
casos en el conjunto de datos. Haga varias corridas con los casos ordenados de
diferente manera, hasta que la solución se estabilice.
12. ¿Cómo se usa el análisis de conglomerados para agrupar variables?

PROBLEMAS
1. ¿Las siguientes afirmaciones son falsas o verdaderas?
a) Los procedimientos de conglomeración jerárquica y no jerárquica siempre
producen resultados diferentes
Verdadero
b) Siempre se deben estandarizar los datos antes de realizar el análisis de
conglomerados
Falso
c) Los coeficientes pequeños de distancia en el calendario de aglomeración
implican que se están fusionando casos que son diferentes
Verdadero
d) No importa qué medida de distancia se utilice; las soluciones de
conglomeración son en esencia similares
Falso
e) Es aconsejable analizar el mismo conjunto de datos con diferentes
procedimientos de agrupamiento
Verdadero

También podría gustarte