Está en la página 1de 13

TEMA-6.3-ANALISIS-CLUSTER.

pdf

cgazquezs

Métricas aplicadas al marketing

1º Grado en Marketing y Comunidades Digitales

Escuela Superior de Ciencias Sociales y de la Empresa (Campus


Mataró)
Universidad Pompeu Fabra

Reservados todos los derechos.


No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
MÈTRIQUES APLICADES AL MÀRQUETING
2n Màrqueting i CD 1º trimestre

TEMA 6.3: ANÁLISIS CLUSTER

1. INTRODUCCIÓN

1.1 Idea intuitiva


El análisis de conglomerados (clustering) consiste en agrupar los individuos y/o objetos en
conglomerados (grupos o clusters), de manera que los objetos del mismo conglomerados
son más similares entre ellos que los objetos de otro conglomerado.

Como son los clusters:


● Grupos tan homogéneos como sea posible en su interior (variabilidad pequeña
dentro del grupo).
● Que los grupos sean tan diferentes como sea posible entre ellos (variabilidad grande
entre los grupos).
● Además, se desea que sean explicables (identificar características similares entre
miembros de cada grupo, y características diferenciadoras entre grupos diferentes).

1.2 Aplicaciones
● Segmentación de mercados: consumidores con características similares.
● Posicionamiento de productos/marcas: política comercial.
● Estudio de audiencias y medios de comunicación: estrategias de publicidad.
● Selección de mercados-test: mercados/ciudades/sociedades tipo.

1.3 Ejemplos
➔ Encuesta sobre los hábitos de compra entre los clientes de una empresa
→ Análisis de clúster la empresa determina el tipo de clientes.
➔ Clasificación de productos → Por ejemplo, clasificar el tipo de turrón de Alicante
según los ingredientes utilizados para su elaboración.
➔ Mapas de calor → Actividad de tweets por hora o por zona geográfica.

Ejemplo: Un investigador pretende determinar los segmentos de mercado en función de las


pautas de lealtad a marcas y tiendas. Encuesta a 11 individuos y 2 variables.

Objetivos:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
MÈTRIQUES APLICADES AL MÀRQUETING
2n Màrqueting i CD 1º trimestre

➔ Simplificar los datos. En lugar de tener todas las observaciones queremos grupos de
observaciones.
➔ Identificar relaciones entre observaciones.

Cuestiones previas:
➔ ¿Cómo medimos las distancias?

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La más utilizada es la distancia euclidiana (en línea recta).
➔ ¿Qué método utilizamos para formar los conglomerados?
➔ ¿Cuántos grupos formamos?
➔ ¿Qué variables consideramos?

2. MÉTODOS

1. Algoritmos jerárquicos
La construcción se realiza en forma de árbol.
Métodos de aglomeración o ascendentes → punto de partida: un conglomerado por
cada individuo → los siguientes conglomerados se combinan en un nuevo conglomerado.

Métodos divisorios o descendientes → punto de partida: un conglomerado con todos


los individuos → las observaciones más diferentes se dividen y construyen
conglomerados más pequeños.
Gráfica: Dendograma

Si hacemos el dendrograma de los datos del ejemplo de lealtad a las tiendas y a las marcas
tenemos

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

si lees esto me debes un besito


Métricas aplicadas al marketing
Banco de apuntes de la
MÈTRIQUES APLICADES AL MÀRQUETING
2n Màrqueting i CD 1º trimestre

Clusters calculados (con 3 conglomerados)

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2. Algoritmos no jerárquicos
Asignan objetos a los conglomerados una vez el número de conglomerados a formar está
especificado

Procedimiento:
1. Seleccionar el número de grupos que queremos formar.
2. Elegir el método que queremos utilizar: K-means
3. Asignación de cada individuo a un grupo: Stata
4. Interpretación de los resultados.

Preguntas:
➔ ¿Cómo elijo el número de grupos?
➔ ¿Cómo interpreto los resultados?

Número de grupos (regla de parada)


Es totalmente subjetiva y a nuestro criterio, teniendo en cuenta que hemos de controlar que:
● Los grupos creados se pueden interpretar con facilidad.oLa media de la muestra
dentro de cada segmento sea bastante elevada para poder hacer interpretaciones
significativas

Interpretación:
● Determinación de la medida del grupo
● Análisis de los centros de gravedad de cada grupo y de las variables activas
● Análisis de las variables pasivas.

Método k-means del ejemplo lealtad a las tiendas y marcas

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

si lees esto me debes un besito


MÈTRIQUES APLICADES AL MÀRQUETING
2n Màrqueting i CD 1º trimestre

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejemplo interpretación de datos

Debido a la aproximación empírica del modelo lo recomendable es contrastar diferentes


tipos de medidas para ver si obtenemos resultados similares

Procedimiento de Distancia:
➔ Existen diversos métodos para calcular la distancia entre los grupos así como medir
la relación de dicha distancia
➔ Se pueden utilizar varias, aunque conocer el objeto de la segmentación, ayudaría a
definir el método.
➔ Euclidea (L2)
◆ Se limita al calcular la suma al cuadrado de las distancias entre coordenadas
y se saca raíz cuadrada a dicha suma
➔ Euclidea al Cuadrado (L2 cuadrado)

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

si lees esto me debes un besito


MÈTRIQUES APLICADES AL MÀRQUETING
2n Màrqueting i CD 1º trimestre

◆ Igual al anterior, pero no se obtienen la raíz cuadrada, es decir, no se elabora


el último paso. Es más recomendable si existen más de dos dimensiones
➔ Método Manhattan (L1 o valor absoluto)
◆ Parte del supuesto de que la distancia más corta (Euclidea) no puede ser
alcanzada en situaciones de la vida real como en las calles de una ciudad.
➔ Otros
➔ Linfinity, L(#), Lpower(#), Canberra, Correlation, Angular

Método de Agrupación:
● Se parte del análisis jerárquico que es más flexible
● Basado en sus resultados se utiliza un método no jerárquico para ver si se obtienen
los mismos resultados
➔ Método de Ward
◆ Se Minimiza la distancia Euclidea al centro de cada Cluster
➔ Enlace Simple
◆ Se basa en la distancia del vecino más próximo
➔ Enlace Completo
◆ Se basa en la distancia del vecino más lejano
➔ Enlace Medio
◆ Distancia promedio entre los miembros de dos Clusters diferentes
➔ Método Promedio Ponderado
◆ Similar al anterior, pero se añaden algún tipo de pesos
➔ Enlace de Medianas
◆ La distancia entre dos Cluster está dado por el valor de las medianas de los
puntos (bueno si hay casos atípicos)
➔ Enlace de Centroides
◆ La distancia entre dos Cluster es la distancia de sus centroides
Comparación de los métodos
JERÁRQUICO NO JERÁRQUICO

No hay definición previa del número de Hemos de definir previamente el número de


grupos. grupos

Proceso iterativo, partimos de n grupos Proporcionan los centros de gravedad de


para acabar en 1. los grupos

Difícil de aplicar para muestras grandes. Dan resultados adicionales para interpretar
los resultados

Gran impacto de los casos atípicos Menos susceptibles a los casos atípicos.

Menos tiempo de cálculo Más complicado de cálculo

3. EJEMPLO
Objetivo: Queremos conocer la actitud de los
consumidores cuando salen de compras.
Se utiliza una escala de 1-7 para determinar cuanto
están de acuerdo con la afirmación.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
MÈTRIQUES APLICADES AL MÀRQUETING
2n Màrqueting i CD 1º trimestre

● V1 salir de compras es divertido


● V2 salir de compres afecta al presupuesto V3 combinar salir de compras con comer
fuera de casa
● V4 salir de compras para hacer mejores compras
● V5 no me importa salir de compras
● V6 se puede ahorrar mucho si se comparan precios

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Estadísticas → Análisis multivariante → Análisis de conglomerado → Conglomerado de
datos → Enlace por criterio de Ward (Se pueden escoger otros métodos de enlace)
Análisis de conglomerado en STATA
1. Estadísticas
2. Conglomerados de datos
3. Análisis de conglomerado
4. Enlace por criterio de Ward

Estadísticas → Análisis multivariante → Análisis de conglomerado → Post-análisis de


conglomerdos → Dendrogramas
DENDOGRAMAS en STATA
1. Estadísticas
2. Post-analisis de conglomerado
3. Análisis de conglomerado
4. Dendograma

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

si lees esto me debes un besito


MÈTRIQUES APLICADES AL MÀRQUETING
2n Màrqueting i CD 1º trimestre

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Estadísticas → Análisis multivariante → Análisis de conglomerado → Post-análisis de
conglomerdos → Variables Sumarias del análisis de Conglomerados
Variables Sumarias del análisis de Conglomerados en STATA
1. Estadísticas
2. Post-análisis de conglomerado
3. Análisis de conglomerado
4. Variables sumarias del análisis de conglomerado

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

si lees esto me debes un besito


MÈTRIQUES APLICADES AL MÀRQUETING
2n Màrqueting i CD 1º trimestre

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.

Gráfico biplot
1. Gráficos
2. Gráficos para análisis multivariante
3. bivariado

Comandos para biplot:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

si lees esto me debes un besito


MÈTRIQUES APLICADES AL MÀRQUETING
2n Màrqueting i CD 1º trimestre

Estadísticas → Análisis multivariante → Análisis de conglomerado →


Conglomerado de datos → K-Medias
K-MEDIAS en STATA
1. Estadísticas
2. Conglomerados de datos
3. Análisis de conglomerado
4. K-medias

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-9370196

si lees esto me debes un besito


10
2n Màrqueting i CD 1º trimestre
MÈTRIQUES APLICADES AL MÀRQUETING

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.

También podría gustarte