Está en la página 1de 7

CUESTIONARIO UNIDAD 3

ALUMNA : Thamar Elizabeth Torres Barrera


GRUPO: A
MATERIA : Análisis Multivariado Aplicado
DOCENTE: Marco Ovando
PREGUNTAS
1. Analice la semejanza y la diferencia entre el análisis de conglomerados y el
análisis discriminante
el análisis de conglomerados se utiliza para segmentar datos en grupos
homogéneos, mientras que el análisis discriminante se utiliza para predecir la
variable dependiente a partir de un conjunto de variables independientes.
Ambas técnicas pueden ser útiles en diferentes contextos, dependiendo de los
objetivos del análisis y de las características de los datos.
2. ¿Cuáles son algunos de los usos del análisis de conglomerados en marketing?

Segmentación de mercado: El análisis de conglomerados se utiliza para


identificar grupos de clientes con necesidades y comportamientos similares, lo
que permite a los especialistas en marketing diseñar campañas publicitarias y de
marketing dirigidas específicamente a cada grupo.
Selección de variables: El análisis de conglomerados se utiliza para seleccionar
variables que mejor diferencian entre los grupos de clientes, lo que ayuda a los
especialistas en marketing a comprender qué factores son más importantes para
los clientes.
Evaluación de la satisfacción del cliente: El análisis de conglomerados se utiliza
para identificar grupos de clientes insatisfechos y comprender las razones detrás
de su insatisfacción, lo que permite a los especialistas en marketing diseñar
estrategias para mejorar la satisfacción del cliente.
Identificación de nuevos mercados: El análisis de conglomerados se utiliza para
identificar grupos de clientes potenciales que aún no han sido explotados por la
empresa, lo que permite a los especialistas en marketing expandir su base de
clientes.
Diseño de nuevos productos: El análisis de conglomerados se utiliza para
identificar grupos de clientes con necesidades y preferencias similares, lo que
ayuda a los especialistas en marketing a diseñar productos que satisfagan mejor
las necesidades de los clientes.
3. Proporcione una definición breve de los siguientes términos; dendograma,
diagrama de carámbanos, calendario de conglomeración y pertenencia al
conglomerado

Dendograma: Es un gráfico que muestra la estructura jerárquica de los


conglomerados en un análisis de conglomerados. Cada nivel del dendograma
representa un nivel de similitud entre los conglomerados, y los conglomerados
se agrupan en función de su similitud.
Diagrama de carámbanos: Es una herramienta gráfica utilizada para visualizar
los resultados de un análisis de conglomerados. El diagrama muestra la
estructura de los conglomerados y proporciona información sobre la distancia
entre los conglomerados.
Calendario de conglomeración: Es un registro de los pasos seguidos en un
análisis de conglomerados para agrupar los objetos o casos en conjuntos más
homogéneos. El calendario de conglomeración muestra la secuencia de
conglomerados y la distancia entre ellos en cada paso del proceso.
Pertenencia al conglomerado: Es la asignación de un objeto o caso a un grupo
específico en un análisis de conglomerados. Cada objeto o caso se asigna al grupo
al que más se parece en términos de sus características o variables. La
pertenencia al conglomerado se utiliza para identificar los grupos a los que
pertenecen los objetos o casos y para realizar análisis adicionales sobre cada
grupo.
4. ¿Cuál es la medida de semejanza de uso mas común en el análisis de
conglomerados?
La medida de semejanza más comúnmente utilizada en el análisis de
conglomerados es la distancia euclidiana. La distancia euclidiana mide la
distancia entre dos objetos o casos en función de la diferencia entre sus valores
en cada una de las variables. También se utilizan otras medidas de semejanza,
como la distancia Manhattan, la distancia de Minkowski y la correlación de
Pearson, dependiendo del tipo de datos y el objetivo del análisis.
5. Presente una clasificación de los procedimientos de conglomerados]

Procedimientos aglomerativos: Comienzan considerando que cada objeto se


encuentra en su propio conglomerado y luego agrupan los objetos en función de
su similitud, hasta que todos los objetos se agrupan en un solo conglomerado.
Estos procedimientos se basan en una lógica de fusión o unión. Algunos ejemplos
de procedimientos aglomerativos son el método de enlace simple, el método de
enlace completo y el método de enlace promedio.

Procedimientos divisivos: Comienzan considerando que todos los objetos están


en un solo conglomerado y luego dividen los objetos en función de su disimilitud,
hasta que cada objeto se encuentra en su propio conglomerado. Estos
procedimientos se basan en una lógica de división o separación. Los
procedimientos divisivos son menos utilizados que los aglomerativos.
6. ¿Por qué suele preferirse el procedimiento de enlace promedio al de enlace
único y al de enlace completo?

El procedimiento de enlace promedio suele preferirse al de enlace único y al de


enlace completo porque ofrece un equilibrio entre los dos.
El procedimiento de enlace único (también conocido como mínimo o vecino más
cercano) se basa en la distancia más corta entre dos objetos y tiende a producir
conglomerados alargados o en forma de cadena, en lugar de conglomerados
compactos.
Por otro lado, el procedimiento de enlace completo (también conocido como
máximo o vecino más lejano) se basa en la distancia más larga entre dos objetos
y tiende a producir conglomerados más compactos, pero también puede
producir conglomerados que no tienen una similitud interna fuerte.
El procedimiento de enlace promedio utiliza la distancia promedio entre los
objetos y proporciona un equilibrio entre los dos extremos, produciendo
conglomerados que son relativamente compactos, pero también tienen una
similitud interna fuerte. Por esta razón, es el más comúnmente utilizado.
7. ¿Cuáles son las dos desventajas principales de los procedimientos de
conglomeración no jerárquica?

- Dependencia de los puntos iniciales: los procedimientos no jerárquicos


requieren la especificación previa del número de conglomerados a crear y la
selección de los objetos iniciales. Si los objetos iniciales no son
representativos de la muestra o del universo, el resultado final del análisis
puede verse seriamente afectado.

- Sensibilidad a los valores atípicos: los procedimientos no jerárquicos son


sensibles a los valores atípicos. Si hay valores extremos en la muestra,
pueden arrastrar a los demás objetos a un conglomerado inapropiado, lo que
puede distorsionar el resultado final del análisis.

8. ¿Cuáles son los lineamientos para decidir el número de conglomerados?

Método del codo: Se examina el gráfico de la suma de las distancias intra-cluster


por el número de conglomerados. El número de conglomerados en el que la
suma de las distancias intra-cluster se desacelera notablemente se considera
como el número apropiado de conglomerados.
Método de la silueta: Se calcula la silueta de cada objeto en la muestra, que
mide cuán similar es el objeto con respecto a su propio conglomerado en
comparación con otros conglomerados. El número de conglomerados que
maximiza el valor medio de la silueta se considera como el número apropiado de
conglomerados.
Método de la varianza explicada: En el análisis de factores, se puede utilizar el
método de la varianza explicada, que consiste en utilizar el análisis de
componentes principales para reducir el número de variables y luego aplicar el
análisis de conglomerados en los componentes principales. Se elige el número
de conglomerados que maximiza la varianza explicada por los componentes
principales.
Conocimiento previo del problema: El conocimiento previo del problema puede
ayudar a decidir el número de conglomerados apropiado. Por ejemplo, si se
espera que la muestra tenga dos grupos, entonces se debe buscar el número de
conglomerados que separe a la muestra en dos grupos distintos.
9. ¿Qué implica la interpretación de los conglomerados?
La interpretación de los conglomerados implica analizar y describir las
características de los grupos formados por el análisis de conglomerados y
determinar su significado y utilidad. Al interpretar los conglomerados, se busca
entender las diferencias y similitudes entre los grupos, y se pueden identificar
patrones y tendencias en los datos.
10. ¿Cuáles son algunas de las variables adicionales que se usan para describir los
conglomerados?

Tamaño: el tamaño del conglomerado puede ser una variable importante para
entender su estructura y su influencia en un área geográfica o en una industria
determinada.
Edad: la edad del conglomerado puede proporcionar información sobre su
estabilidad y experiencia en el mercado.
Número de empresas: el número de empresas dentro del conglomerado puede
ser una variable importante para comprender su diversidad y complejidad.
Sector industrial: el sector industrial al que pertenecen las empresas dentro del
conglomerado puede proporcionar información sobre su cartera de productos y
servicios, así como su competencia.
Localización geográfica: la localización geográfica del conglomerado puede ser
una variable importante para entender su alcance regional o global.
11. Describa algunos procedimientos disponibles para evaluar la calidad de las
soluciones de conglomeración

Coeficiente de Silhouette: Este procedimiento mide la similitud de cada objeto


con su grupo y la diferencia con los grupos vecinos. El coeficiente de Silhouette
es una medida de la cohesión y separación de los grupos, y varía entre -1 y 1. Los
valores cercanos a 1 indican una buena agrupación, mientras que los valores
cercanos a -1 indican una mala agrupación.
Índice de Davies-Bouldin: Este procedimiento mide la distancia media entre
cada grupo y su grupo más cercano. Cuanto menor sea el índice, mejor será la
calidad de la solución de conglomeración.
Medidas de Entropía: La entropía mide la cantidad de incertidumbre en una
solución de conglomeración. Las medidas de entropía, como la entropía de
información y la entropía de diversidad, se utilizan comúnmente para evaluar la
calidad de las soluciones de conglomeración. Una solución de conglomeración
de alta calidad tendrá una entropía baja.
Coeficiente de Correlación de Contingencia: Este procedimiento mide la
correlación entre los datos originales y los grupos. Un coeficiente de correlación
alto indica una buena agrupación.
Medidas de Cohesión y Separación: La cohesión mide la similitud de los objetos
dentro de un grupo, mientras que la separación mide la diferencia entre los
objetos de diferentes grupos. Las medidas de cohesión y separación se utilizan a
menudo para evaluar la calidad de las soluciones de conglomeración.
Validación Externa: Este procedimiento implica la comparación de los resultados
de la solución de conglomeración con una solución de conglomeración
"verdadera" o "correcta". Se utilizan índices como el Índice Rand Ajustado y la
Entropía de Información Normalizada Mutual para comparar las soluciones de
conglomeración.
12. ¿Cómo se usa el análisis de conglomerados para agrupar variables?
elección de variables: Selecciona un conjunto de variables que se utilizarán para
el análisis de conglomerados. Las variables deben ser relevantes para el
problema en cuestión y tener una relación significativa entre sí.
Preprocesamiento de datos: Si es necesario, preprocesa los datos para que
estén en una escala común y tengan una distribución normal. Esto se puede
hacer utilizando técnicas como la normalización o la estandarización.
Selección del método de conglomerados: Existen diferentes métodos de
conglomerados, como el método de enlace único, el método de enlace completo
y el método de enlace promedio, entre otros. Selecciona el método de
conglomerados adecuado para el problema en cuestión.
Establecimiento de la medida de distancia: La medida de distancia es una
función que se utiliza para calcular la distancia entre las variables. Las medidas
de distancia comunes incluyen la distancia euclidiana, la distancia de Manhattan
y la distancia de Mahalanobis. Selecciona la medida de distancia adecuada para
el problema en cuestión.
Ejecución del análisis de conglomerados: Aplica el método de conglomerados y
la medida de distancia seleccionados para agrupar las variables en grupos
similares. El resultado del análisis de conglomerados es un dendrograma, que es
una representación gráfica de las relaciones entre las variables.
Interpretación de los resultados: Analiza el dendrograma y determina el número
de grupos óptimo para las variables. Los grupos deben ser coherentes y tener
sentido desde una perspectiva teórica y práctica.
Validación de la solución: Valida la solución de conglomerados utilizando
medidas de calidad de la solución, como el coeficiente de Silhouette o el índice
de Davies-Bouldin.

PREGUNTAS VERDADERO O FALSO


- los procedimientos de conglomeración jerárquica y no jerárquica
siempre producen resultados diferentes. VERDADERO
- siempre se deben estandarizar los datos antes de realizar el
análisis de conglomerados. FALSO
- los coeficientes pequeños de distancia en el calendario de
aglomeración implican que se están fusionando casos que son
diferentes. FALSO
- no importa que medida de distancia se utilice; las soluciones de
conglomeración son en esencia similares. FALSO
- es aconsejable analizar el mismo conjunto de datos con diferentes
procedimientos de agrupamiento. VERDADERO
- siempre se deben estandarizar los datos antes de realizar el
análisis de conglomerados. FALSO

También podría gustarte