Documentos de Académico
Documentos de Profesional
Documentos de Cultura
net/publication/318102801
CITATIONS READS
0 548
1 author:
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
The Asymmetry of the brain and the choice of purchase: An application of Electroencephalography – EEG evidence on consumer neuroscience tests View project
The importance of perfect synchronization of data in neuromarketing tests: An example case and how to avoid errors in the implemented EEG, Eyetracker and GSR
findings. View project
All content following this page was uploaded by Cesar Augusto Salazar Olarte on 15 August 2017.
-4 -3 -2 -1 0 1
68%
95%
99,7%
ISBN 978-9-584-65697-1
Editorial independiente
ISBN 978-9-584-65697-1
CESAR A SALAZAR OLARTE
Impresión que hoy queda reflejada más que nunca en la huella que él dejará
en el lector de este libro, puesto que va mucho más allá de un simple manual
de uso de Gandia BarbWin, uno de los programas informático-estadísticos
más utilizados en el mundo profesional de la investigación por encuesta.
Bibliografía. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
1
CAPÍTULO 1
Introducción
Capítulo 1: Introducción
La nueva generación de la información de marketing exige
nuevos hábitos en el manejo de la misma. Hoy en día en
un mundo multidimensional de información imperfecta,
es importante para los investigadores de marketing
reemplazar sus habilidades técnicas con una amplia
apreciación del proceso global de la toma de decisiones
basada en la información.
Thomas Kuhn (1962, p 186): “¿Qué son las revoluciones científicas y cuál
es la función que desempeñan en el desarrollo de la ciencia?... consideramos
como revoluciones científicas aquellos episodios de desarrollos no acumulativo
en los que un paradigma antiguo se ve sustituido en todo o en parte por otro
nuevo incompatible con él”. De esta forma tanto los marketers como los
académicos, permanecen en una búsqueda continua de nuevos paradigmas
generalizables a su entorno o mercado.
Diseño de la Investigación
Los otros valores, nivel de error y nivel de confianza, se interpretan así: El error
máximo propuesto en nuestro ejemplo de telefonía móvil es del 1.5%. Ahora bien,
supongamos que el 60% de los encuestados respondieron “Si poseo un smart
phone” se interpreta como: Entre el 58.5% y el 61.5, del mercado (Población)
de telefonía móvil posee un smartphone. Es el resultado de restar 1.5% al 60% y
sumar 1.5% al 60%.
El nivel de confianza del 95% (No hay ninguna magia en este “famoso” 95%), se
interpreta como si de cada cien veces que hagamos el mismo estudio (Telefonía móvil/
Posee smartphone), nos equivocaremos cinco veces en hallar el 60% de encuestados
que si poseen un smartphone. O lo mismo, de cada 100 diseños muestrales diferentes
en el mismo universo, nos equivocaremos cinco veces en los resultados.
Ahora bien, entendiendo cada uno de los valores de la figura 1.1, qué pasa si
esos doce millones de usuarios de telefonía móvil están en diferentes países,
por ejemplo cuatro millones en México, dos millones en Guatemala, un millón
en Honduras, un millón en Nicaragua, un millón en El Salvador, dos millones
en Venezuela y un millón en Ecuador. Solo ingresamos cada país en la ventana
emergente de la figura 1.1, y vamos calculando cada tamaño de la muestra y su
nivel de error correspondiente. Ver figura 1.2
8
CAPÍTULO 2
Análisis previo de los datos
Con estos botones se debe indicar que tipos de saltos, filtros, controles, se
deben aplicar a los datos para que correspondan con lo definido en el
cuestionario o encuesta.
CAPÍTULO 3
Análisis Descriptivo de los Datos
Allí aparece el nombre de la variable, tipo, texto extra. Si damos clic sobre el
botón “Gestión de códigos” aparece una nueva ventana con todos los códigos de
la variable ocupación.
Como se observa en la figura 3.6, damos doble clic sobre la variable “Espontáneos”
y aparecerá la tabla de propiedades de dicha variable. Nuevamente damos doble
clic en la pestaña “Tabulación y análisis” y podemos definir en la parte inferior de
la tabla como deseamos que se presente la tabla de frecuencias, para nuestro
ejemplo vamos a dar clic sobre cada una de las tres opciones que nos permite.
Observando la figura 3.8 vemos que de los 2087 encuestados solo se obtuvo
respuestas para la variable “Espontáneos” de 1777 individuos. Si se divide
1777/2087 nos dice que del 100% de la muestra solo se obtuvieron respuestas
del 85.1%. La suma de las respuestas de todas las marcas es de 3621. Ahora
bien, si se divide 360 respuestas obtenidas para la marca “Camel” en 1777
individuos, se obtiene el 20.3% de los individuos mencionan que conocen dicha
marca. Así sucesivamente se calcula cada uno de los porcentajes de las marcas.
Si se suman cada uno de los porcentajes el resultado será mayor al 100% dado
que se está teniendo en cuenta que cada individuo menciono más de una marca
que conoce o a oído mencionar.
30
Por ejemplo en la variable ¿Cuántos cigarrillos fuma en un día? Se puede ver que
la media o promedio de cigarrillos que fuma en un día es de siete cigarrillos con
una desviación típica de 6.5 cigarrillos y un coeficiente de variación del 93%. Este
último, el coeficiente de variación, es de gran importancia porque viene calculado
de dividir la desviación típica en la media aritmética.
Para este caso sería dividir 6.5/7. El coeficiente de variación nos dice que
porcentaje de la media es la desviación típica. Es muy conveniente (Por no decir
obligatorio) interpretar los estadísticos en conjunto y no separadamente. Por
ejemplo solo interpretar la media aritmética puede conducir a errores dado que
la media está influenciada por los valores máximos y los valores mínimos.
Para tal propósito deberemos agrupar en una sola categoría al rango de edad de 18
a 24 y de 25 a 34 años. Para tal fin, damos doble clic en la variable NIV_EDAD y nos
aparece la tabla de propiedades de dicha variable y en el botón gestión de códigos
creamos la nueva categoría “Jóvenes” cuyos códigos serán 1_2, que significa que
agrupe los códigos número uno y dos en un solo código. Ver figura 3.21.
43
Hasta aquí hemos creado nuestra nueva base, ahora solicitaremos nuevamente
la tabulación cruzada: Jóvenes menores de 34 años y que vivan en la ciudad de
México. Con esta base se desea conocer en donde compran tabaco o cigarrillos
los consumidores y cuál es su género.
CAPÍTULO 4
La inferencia estadística y
la investigación de mercados
Capítulo 4: La Inferencia Estadística y La Investigación De Mercados.
En este capítulo se abordarán aquellas herramientas
estadísticas de mayor utilización en la investigación
comercial y de mercados, en referencia a la inferencia de los
resultados obtenidos de una muestra hacia el marco muestral
o población objeto del estudio.
Los Paramétricos
Esto significa que los datos deben provenir de una población homogénea o de
características similares, que los datos de dicha población deben ser de tipo
cuantitativo continuos, cuya media aritmética es cero y desviación típica uno, que
la media, mediana y moda, coinciden en el centro de una distribución simétrica,
etc. Sin embargo y más adelante se abordará con más detalle, generalmente en la
investigación comercial y de mercados, difícilmente se cumplen los supuestos para
los contrastes paramétricos, es decir, no se cumple el supuesto de normalidad.
Simplemente debido a que los datos que se recogen del consumidor en su mayoría
son datos de tipo o escala “cualitativa”. En estos casos se acude a los contrastes
“No paramétricos” que presentan menos restricciones que los “paramétricos”.
52
La distribución normal es el supuesto que los datos deben cumplir para poder
aplicar algunas técnicas de análisis de datos que así lo requieren.
-4 -3 -2 -1 0 1 2 3 4
68%
95%
99,7%
En la figura 4.1 se aprecia la forma o distribución de los datos que cumplen dicho
supuesto (normalidad), como se puede ver el valor central es “cero” y valores
a la derecha se incrementan de uno en uno. A su vez, valores a la izquierda
del “cero” decrecen a partir de menos uno y de uno en uno. La pregunta que
cabría hacer es: ¿Qué significan estos números? La respuesta es muy simple, los
datos recolectados de una muestra deben “normalizarse” es decir volverlos a
una escala de medida que sirva para cualquier propósito.
53
En este punto, vamos a la figura 4.1 (Curva normal) y ahora si podemos entender
los números que allí aparecen. El número “0” que está en el centro de la curva
corresponde a la media de los valores “z” en nuestro ejemplo de la variable
“edad”. El “+1” significa que al valor medio de “0” se le suma “1” desviación
típica. El “+2” que al valor medio de “0” se le suman “2” desviaciones típicas. El
valor “3”que al valor medio de “0” se le suman “3” desviaciones típicas. Ahora
bien al lado izquierdo del valor “0” en la figura 4.1. El “-1” significa que al valor
medio de “0” se le resta “1” desviación típica. El “-2” que al valor medio de “0”
se le restan “2” desviaciones típicas. El valor “3” que al valor medio de “0” se le
restan “3”desviaciones típicas.
Por tal motivo, es bien común escuchar en el mundo del marketing la siguiente
pregunta: ¿Hay diferencias estadísticamente significativas en los resultados
obtenidos? La respuesta es muy sencilla solo debemos determinar cuál es la zona
de aceptación y la zona de rechazo de los resultados obtenidos en el estudio
o investigación.
¿Y qué significa hipótesis nula y alterna? Con un ejemplo sencillo, una hipótesis
es una suposición o alguna idea no comprobada en la realidad.
De tal manera que la hipótesis nula o hipótesis cero, se puede explicar cómo el
punto de partida de esta suposición o idea inicial. Por ejemplo si no conocemos
cuál es el consumo semanal de cigarrillos o tabaco, por la variable género,
entonces, partimos del supuesto que el consumo semanal de cigarrillos o
tabaco es igual en hombres y en mujeres. Esta sería la hipótesis nula o “Ho”. La
hipótesis alterna o “H1” sería que el consumo semanal de cigarrillos o tabaco
es diferente en hombres y en mujeres. También se pueden plantear hipótesis
puntuales o cuantificadas y también se pueden plantear hipótesis secundarias.
Pero lo importante es entender el concepto básico de que es la hipótesis nula
y que es la hipótesis alterna.
c. 99%
3. Determinar zonas de rechazo
a. 10%
b. 5%
c. 1%
4. Establecer el estadístico de contraste. Para nuestro ejemplo y dado que
estamos planteando las hipótesis alrededor de una variable cuantitativa
(Consumo diario de tabaco/cigarrillo), el más común es la prueba t-student.
5. Establecer las reglas de decisión. De tipo, si el nivel de significación de
la prueba t-student se ubica en la zona de rechazo, quiere decir que se
rechazara la hipótesis nula planteada en el punto número uno. Si por
el contrario se ubica por fuera de los valores determinados en el punto
número dos, quiere decir que la hipótesis nula no se rechaza.
6. Presentar las conclusiones aplicadas al negocio o al propósito de la
investigación sin caer en la “trampa” de las explicaciones y demostraciones
sofisticadas y confusas.
Estando todavía en la figura 4.5 damos clic en la parte inferior de dicha ventana en el
botón y aparece la ventana emergente “Estadísticos de frecuencias” damos clic
en el botón “Pruebas significación” y aparece la ventana emergente de la figura 4.6.
60
En seguida aparece la figura 4.7 con los resultados de la prueba. Allí se ven debajo
de los promedios por columna unas letras en mayúscula y unas en minúscula.
En conclusión desde la perspectiva del negocio del tabaco, se puede afirmar que
existen diferencias estadísticamente significativas en el consumo promedio diario
de tabaco o cigarrillos siendo los adultos mayores de 45 años quienes consumen
en promedio más cigarrillos o tabacos al día, observándose en su mayoría a
los hombres. Sin embargo, el nivel socioeconómico no incide en el consumo de
cigarrillos promedio en un día.
Análisis de la Varianza
Y en términos más coloquiales del negocio del tabaco, es que se desea conocer si
existen diferencias estadísticamente significativas en el consumo promedio diario
de tabaco o cigarrillos entre las marcas que compiten en el mismo.
EVALUACION_MARCA
Número de casos total 2087
Casos válidos 2087
Códigos especiales 0
Media aritmética 5,4
Error estimado 0
Intervalo confianza 90% ±0.0
Intervalo confianza 95% ±0.0
Intervalo confianza 99% ±0.0
Mediana 6
Primer cuartil 5
Tercer cuartil 6
Moda 6
Suma de casos 11247
Máximo 6
Mínimo 1
Rango 5
Desviación típica 0,8
% Varianza explicada 0,6
Coef. de variación 14,50%
Coef. de asimetría -1
Coef. aplanamiento 2,2
Con una concentración de los datos hacia los valores máximos y un aplanamiento
un poco inferior a lo acostumbrado. Por tal motivo también se estaría violando el
supuesto de normalidad.
70
Estableciéndose unos promedios por marca entre 5,3 y 5,4. Con desviación típica
que oscila entre 0,7 y 0,9. En la tabla número 4, se observa la significancia y el
valor F.
Tabla Suma Grados Cuadrados Prueba F Significación
cuadrados libertad medios
Entre-grupos 16,9 6 2,8 4,7 0,00024
Intra-grupos 1251,2 2080 0,6
Total 1268,1 2086
Ahora bien, para fines prácticos del negocio del tabaco ¿son muy diferentes
aquellas evaluaciones de 5,3 frente a las de 5,4? Pero el modelo nos dice que
SI que son diferentes…. ¿Sirve para algo más allá que todas las marcas están
bien evaluadas?
Los NO Paramétricos
Ahora bien, si solo poseemos esta información que acabamos de enunciar, ¿Cuál
sería la distribución esperada o teórica de los 2087 encuestados? Pues lo más
sencillo sería dividir los 2087 encuestados en dos géneros y cinco categorías
cada uno, así: por género 2087/2 = 1043.5 (lo aproximaríamos a 1043 hombres
y 1044 mujeres). En seguida dividimos a los 1043 hombres en cinco edades
1043
/5 = 209 hombres por cada rango de edad y dividimos a las 1044 mujeres
en cinco edades 1044/5 = 209. La tabla quedaría:
Vemos que hay 1368 mujeres y 719 hombres. Y los niveles o rangos de edad
son bien diferentes. En estos casos y por no decir en todos debemos acudir
a la siguiente formula con el propósito de calcular las frecuencias esperadas
o teóricas:
74
Calculemos la frecuencia esperada para la celda número uno de la figura 34. Esta
primera celda corresponde a los “Hombres” de “18 a 24 años”. Y sería
Damos clic en “Aceptar” y “Aceptar” y vemos que nuestra figura 4.10 cambio por
la figura 4.12 y ya contiene ambas, las frecuencias observadas y las esperadas.
Cotejando la primera frecuencia esperada es igual a la que calculamos manualmente
en el párrafo anterior. Allí aparece en la primera fila de la celda uno, 381 frecuencias
observadas frente a 370 frecuencias esperadas. Significando que se observaron
más individuos en esta casilla que los esperados “teóricamente”. Así sucesivamente
cada casilla de la figura 4.12 contiene dos filas la primera corresponde a los valores
reales-observados y la segunda a las frecuencias esperadas o teóricas.
“llamen” la atención del investigador. Los que se encuentren entre -1.96 y 1.96,
serán aquellos residuos que no interesen al investigador. Indicando que residuos
superiores a 1.96 presentan una fuerte atracción en las categorías y los residuos
menores a 1.96 presentan un fuerte rechazo entre dichas categorías.
Como lo puede estar pensando el lector, la utilidad, claridad y sencillez del análisis
de residuos, empieza a abrirnos los caminos a una mejor comprensión y por lo
tanto a una mejor interpretación de los resultados.
Ahora vamos a redactar las hipótesis para el modelo Ji cuadrado con un ejemplo aplicado.
1. Plantear las hipótesis
a. Ho: La edad del consumidor de cigarrillos no se asocia con la marca
principal consumida.
b. Hi: La edad del consumidor de cigarrillos si se asocia con la marca
principal consumida.
81
Nos aparece el resultado en la figura 4.17, el primer dato que debemos analizar
es el que aparece después de la tabla como “Significación” dado que elegimos el
95% de nivel de confianza como zona de aceptación, observamos como resultado
un valor de significación de 0.000 que al ser menor al 5%, está dentro de la zona
de rechazo de la hipótesis nula planteada, sugiriendo el rechazo de la misma y la
adopción de la hipótesis alterna. Queriendo decir, que SI existe asociación entre
la variable nivel de edad y la variable marca principal.
CAPÍTULO 5
Segmentación de Mercados
SEGMENTACIÓN AID
Las reglas del algoritmo AID se basan en pruebas sucesivas del análisis de
la varianza de la variable dependiente por cada una de las categorías
de la variable independiente.
Ahora bien, ubicados en el archivo TABACO, figura 5.1, damos clic en el botón
“Análisis Avanzado” luego clic en “Clasificación” luego clic en “Segmentación”.
De tal manera, estamos planteando que deseamos conocer cuáles de las variables
independientes incluidas en el modelo AID, discriminan más el comportamiento de
la variable dependiente o a explicar.
Sin más, damos clic en el botón “Aceptar” y lo primero que descubrimos es que
el software nos ha creado una nueva variable resultado de la segmentación
solicitada al final de la base de datos TABACO con el nombre de “$SEGMEN_1”. Y
que si damos doble clic sobre dicha variable nos resulta la figura 5.3. En donde
observamos que partiendo del nodo inicial ha descubierto 6 segmentos basados
en el algoritmo AID.
Allí se observa que inicia en el nodo raíz con 1984 casos válidos y con un
promedio aritmético de 43 cigarrillos o tabacos de consumo semanal. En seguida
vemos que la primera variable que discrimina e incide en el resultado del consumo
semanal de cigarrillos es la variable “Marca Principal”.
Esta variable se divide a su vez en dos nodos el nodo número 1.1 que contiene
las marcas de códigos 0 y 5 (Ver figura 5.5) que corresponden a las marca L&M
y Winston respectivamente. Con 477 casos que son los consumidores de dichas
marcas y que consumen semanalmente en promedio 58 cigarrillos (57.59).
Significando que el 76% del mercado consume en promedio un 17% por debajo del
consumo promedio semanal del total del mercado. Finalmente ambos segmentos
poseen un nivel de significancia similar de 0.000, inferior a la regla de parada del 0.05.
Si vamos a los nodos 1.1.1 y 1.1.2 podemos observar que la variable que
discrimina a la de “Marca Principal” es la variable “Sabor Fuerte”. Allí en el nodo
1.1.1 están 116 casos o consumidores que les parece muy importante el “Sabor
Fuerte” de las marcas L&M Y Winston. Y consumen semanalmente en promedio
72 cigarrillos o tabacos (71.59).
93
Dividiendo este último valor en el total del mercado 43, se obtiene que este
segmento consume en promedio semanalmente un 67% más cigarrillos o tabacos
que el total del mercado. Que corresponden a un 5.8% del total del mercado.
Este nodo el 1.1.1 sería potencialmente un segmento descubierto para los fines
estratégicos del “Targeting”. De esta forma se pueden seguir analizando uno a
uno los nodos y establecer en relación al criterio del “Marketer” cuál de los otros
segmentos serían también de alto potencial.
Las figuras 5.5 y 5.6 nos presentan el resultado de dar clic en las otras dos
pestañas del modelo AID, que son la tabla de códigos y la tabla de resultados de
nodo a nodo, tal como se explicó en párrafos anteriores.
94
La figura 5.7 contiene las frecuencias absolutas y relativas de cada uno de los
nodos descubiertos por el modelo AID.
SEGMENTACIÓN JHI2
Esto significa que vamos a utilizar exactamente las mismas variables seleccionadas
para el modelo AID en el modelo Jhi2. Lo importante de este método de
contrastación es poder comparar los resultados de ambos modelos y seleccionar
aquel que se ajuste mejor a los objetivos de la segmentación.
Dado que para el modelo Jhi2 necesitamos una variable cualitativa como variable
dependiente o a explicar y en el modelo AID dicha variable fue la del consumo semanal
de cigarrillos o tabacos que es una variable numérica métrica. Debemos convertir esta
variable numérica métrica en una variable de tipo cualitativo de categorías ordinales.
En tal sentido explicaremos a continuación como con la ayuda del software GBW7,
es muy fácil transformar una variable cuantitativa en una variable cualitativa.
Primero que nada vamos a dividir los datos de la variable consumo semanal de
cigarrillos o tabacos en tres partes o categorías: Los Heavy Consumers, Los
Medium Consumers y Los Low Consumers.
La figura 5.14 nos presenta la primera variable de mayor asociación a los Heavy
consumers es la variable “marca principal”, y para el nodo 1.1 se representa
por las marcas L&M y Winston. Nos dice que el 20.3% de los casos satisface la
condición de ser “Heavy Consumers” de las citadas marcas.
Entonces, calculamos el 20.3% a los 477 casos del nodo 1.1 y obtenemos que
son 97 consumidores los que pertenecen a dicha categoría. Y si dividimos estos
97 consumidores en el total del mercado, obtendremos que el 4.9% de los
consumidores son “Heavy consumers” y pertenecen a las marcas L&M y Winston.
Adicionalmente al 35% de estos consumidores les parece muy importante el
sabor fuerte y al 65% no les parece importante el sabor fuerte. Toda esta
información es la que aparece en la pestaña “Resultados” de la figura 5.14, la
pestaña correspondiente a los “Códigos” se presenta en la figura 5.15.
103
FIGURA 5.16
FIGURA 5.17. SOLICITUD DEL ÁRBOL DE SEGMENTACIÓN PARA LOS “MEDIUM CONSUMERS”
FIGURA 5.20. SOLICITUD DEL ÁRBOL DE SEGMENTACIÓN PARA LOS “LOW CONSUMERS”
Volviendo al nodo 1.1, que contiene 450 casos que cumplen la condición de “Low
Consumers” en las marcas citadas. 450/1984 = 23%, concluyendo que el 23%
del mercado de cigarrillos o tabaco, son “Low Consumers” y que consumen las
marcas L&M, Camel y Winston. Con una significancia de 0.000.
Low Consumers Segmento 1 Con un tamaño del 3% del mercado, es muy importante
el prestigio, muy importante la calidad, muy importante
la pertenencia, muy importante la disponibilidad.
Consumidores de las marcas L&M con 54 cigarrillos
semanales; Camel 63 cigarrillos semanales; Winston
con 98 cigarrillos semanales.
Segmento 2 Con un tamaño del 0.7% del mercado. No es importante
el prestigio, muy importante la calidad, muy importante
la pertenencia y muy importante la disponibilidad. Son
consumidores de las marcas L&M con 52 cigarrillos
semanales; camel con 72 cigarrillos semanales y winston
con 114 cigarrillos semanales.
Segmento 3 Con un tamaño del 1.5% del mercado. No les importa
ni la calidad ni la pertenencia, es muy importante la
disponibilidad. Son consumidores de las marcas L&M
con 42 cigarrillos semanales; camel con 49 cigarrillos
semanales y Winston con 30 cigarrillos semanales.
Segmento 4 Con un tamaño del 8.5% del mercado. No les importa
la pertenencia pero si les importa la disponibilidad. Son
consumidores de las marcas L&M con 55cigarrillos
semanales; camel con 48 cigarrillos semanales y
Winston con 92 cigarrillos semanales.
Segmento 5 Con un tamaño del 2.6% del mercado.Les importa
mucho el precio y la disponibilidad. Son consumidores
de las marcas L&M con 60 cigarrillos semanales;
camel con 46 cigarrillos semanales; Winston con 73
cigarrillos semanales.
Segmento 6 Con un tamaño del 6.6% del mercado. No les importa
el precio, pero si les importa la disponibilidad. Son
consumidores de las marcas L&M con 40 cigarrillos
semanales; camel con 41 cigarrillos semanales; Winston
con 107 cigarrillos semanales.
Segmento 7 Con un tamaño del 47% del mercado. Son consumidores
de las marcas marlboro con 33 cigarrillos semanales;
derby con 44 cigarrillos semanales; kool con 37
cigarrillos semanales; lucky strike con 31 cigarrillos
semanales.
MAPAS PERCEPTUALES
Los tan conocidos mapas perceputales por los ‘Marketers” pertenecen a una
de las técnicas del análisis multimidensional, que permiten como su nombre lo
indica, en transformar los juicios del consumidor de similitud o preferencia, en
distancias representadas en un espacio multidimensional.
• Complejidad algorítmica.
Estas son las nuevas variables que íbamos creando a lo largo de la aplicación
del modelo Jhi2, dado que tuvimos que desarrollar un árbol para cada una
de las categorías que creamos, los Heavy consumers, Medium consumers,
Low consumers.
FIGURA 5.23.
FIGURA 5.24.
117
FIGURA 5.36.
BASE DE DATOS
AGREGADA DE
TELEFONÍA MÓVIL
Al dar clic en el botón “Aceptar” aparece la figura 5.33 que contiene las pestañas
para el análisis iniciando con la pestaña “Dimensiones”.
Se observa que esta solución es aceptable dado que el valor propio de la primera
dimensión es mayor que 1.00 (1.891). Adicionalmente en las dos primeras
dimensiones se recoge el 88.57% de la varianza total, siendo la dimensión uno
la que más varianza explica con el 79.35%, seguido de la dimensión dos que
125
explica el 9.21% de la varianza. Por tal razón explicaremos los dos primeros
factores o dimensiones.
En la figura 5.34 se presentan las contribuciones para cada dimensión siendo los
segmentos L7 y L2 los que más contribuyen a la dimensión uno, seguidos de los
segmentos L1, L6 y L5. Los niveles socioeconómicos que más contribuyen a la
dimensión unos son el dos y el cuatro.
El siguiente “Centroide” el L6 que a su vez se corresponde con los L1, L5 y L3. Estos
son consumidores hombres, pertenecientes a los niveles socioeconómicos dos y tres,
de edades entre los 35 y 44 años, metalizados, arriesgados y que viven en unión libre.
FIGURA 5.40.
MAPA PERCEPTUAL
TELEFONÍA MÓVIL
En la figura 5.39 se presentan las contribuciones siendo América Móvil para la dimensión
uno y AT&T para la dimensión dos. Seguidas de claro en ambas dimensiones. Precio
bajo, Mal servicio y Mala cobertura, contribuyen en la dimensión uno. Calidad mala,
Precio alto, Buena cobertura y Buena calidad, aportan a la dimensión dos.
CAPÍTULO 6
El Valor Estratégico de Conocer
sus Clientes
Capítulo 6: El Valor Estratégico de Conocer sus Clientes
Investigación
Procesos de extracción
del conocimiento
Almacén
Centro de Central Data - Marts
Datos externos
llamadas
Web Site
Redes
Sociales
Procesos de la
BTL plataforma de gestión
Una verdadera base de datos de clientes, figura 6.2, requiere tres grandes
componentes, el primero, debe contener los datos “Básicos” del cliente, es
decir, nombre completo, dirección de casa, teléfono, correo electrónico, fecha de
nacimiento, dirección de oficina, nivel socioeconómico, número de hijos, estado
civil, nivel de estudios, número de identificación, y todos los demás datos que
nos ayuden a identificar correctamente al cliente. El segundo componente son
137
Data - Mart
Data - Marts
Clientes
Clientes potenciales
Antes de la aparición del CRM, se presentó en los años ochenta ante el mundo
académico del marketing un concepto novedoso, “El marketing de relaciones
o relationship marketing”, que aspiraba a ser un cambio en el paradigma del
marketing. Pero nunca se logró un consenso en su definición. En tal sentido
es procedente revisar los aspectos relevantes en las definiciones de autores
reconocidos como, Berry (2002), Grönroos (1990), Gummesson (1994) y
Ballantyne (1999), para ofrecer la siguiente definición sintética de marketing
de relaciones: Proceso continuo de comprometerse en actividades y programas
de colaboración con consumidores inmediatos, usuarios finales, proveedores,
empleados, y todos los actores que intervienen en la relación para crear, mantener
y mejorar mutuo valor económico.
139
Por otro lado, Harker (1999), en su intento por alcanzar una definición, concluye
que existen siete categorías conceptuales fundamentales con las que se puede
definir el marketing de relaciones. Estas categorías son:
• Nacimiento
• Desarrollo
• Mantenimiento
• Escala de tiempo
• Interacción
• Resultados
• Contenido emocional.
En este sentido, Harker afirma, con base en una investigación de 117 fuentes
diferentes, que la mejor definición ofrecida y coincidente con estas categorías, es
la expuesta por Grönroos (1994):
Habilitar las promesas: para cumplir con las promesas en tiempo real, la
empresa debe estar organizada y capacitada para entregarlas, es decir, poseer
la estructura organizacional pertinente, la cual permite que los empleados,
en el momento de interactuar con el cliente, cuenten con todos los recursos
necesarios para entregarla, en otras palabras, se debe conservar el personal
idóneo, capacitado y motivado, apoyado por procesos y sistemas que faciliten
entregar, correctamente lo prometido al cliente.
MARKETING EXTERNO
HACIENDO
PROMESAS
MARKETING INTERNO
HABILITANDO MANTENIENDO
LAS PROMESAS LAS PROMESAS
MARKETING INTERACTIVO
En la figura 6.5 Sin et.al (2003), proponen que el CRM tiene cuatro componentes
o pilares básicos. Centrarse en los clientes clave, organización diseñada para el
CRM, gerencia del conocimiento y la tecnología del CRM.
CRM
Es el primer componente o pilar del CRM, dado que la filosofía del CRM es diseñar
estrategias de marketing centradas y enfocadas en los clientes de alto valor o “Key
Customers. Estos clientes clave son los que generan los mayores beneficios para
la empresa y deben obtener un trato especial y preferencial, para conservarlos a
143
través del tiempo. Una pregunta que se puede estar planteando el lector podría
ser ¿Cómo identifico los clientes clave?, bueno definitivamente se debe calcular el
CLV (Customer Lifetime Value) por cada uno de los clientes de la base de datos y
segmentarlos de acuerdo a su valor para la empresa en “Clientes de alto valor”;
“Clientes de Valor medio” y “Clientes de bajo valor”. De esta forma al identificar
el valor que agrega cada cliente se puede destinar los presupuestos de inversión
de marketing de acuerdo a este valor.
Kavali et al. (1999) proponen que hay que resolver cuestiones respecto a qué
relaciones críticas debe conocer una organización, cuáles debe desarrollar,
cómo medir las relaciones críticas y dónde buscar el conocimiento. Para tal
efecto proponen el hogar de la interacción del conocimiento en el marketing de
relaciones. Véase la Figura 6.6.
145
CULTURA Y CLIMA
DE LAS RELACIONES
CONOCIMIENTO
INTERACCIÓN STAKE-
FIRMA
& DIÁLOGO HOLDERS
CONFIANZA COMPROMISO
Las bases de este hogar son la confianza y el compromiso, que a su vez son los
del marketing de relaciones; con éste se crea un conocimiento de las partes que
permite gerenciar o gestionar el conocimiento que será retroalimentado mediante
la interacción y el diálogo entre los miembros de la organización y los grupos de
interés que afectan el funcionamiento de la misma (inversionistas, agremiaciones,
gobierno, medios de comunicación, etc.). Esta interacción y diálogo van
generando el efecto bola de nieve en la generación de nuevo conocimiento de las
partes y a su vez crean, en el largo plazo, una cultura y un clima de la relación.
Por otro lado, el marketing de relaciones, según la mayor parte de sus definiciones,
aboga por el establecimiento de relaciones duraderas con todos aquellos actores
involucrados de manera directa o indirecta en el negocio.
146
Tecnología CRM:
El CRM operativo son todas las herramientas tecnológicas utilizadas para crear,
captar, gestionar, comunicar e intercambiar, la información de varias formas voz,
datos, video, imágenes, multimedia, entre otras.
CRM
CRM Analítico
CRM Operativo
En conclusión, varios autores concuerdan en que el CRM es más que una solución
tecnológica (Paas & Kuijler, 2001): la retención de clientes impacta en el resultado
del valor de las acciones de la empresa. González, Raeside & Warwick (2006)
recalcan la necesidad de ser cuidadosos en la implementación de proyectos del
CRM e insiste también en que deben ser claras sus métricas y efectividad. Stone
(2003) también manifiesta el cuidado que se debe tener con los proyectos de
CRM, y argumenta que en las empresas existen debilidades relacionadas con el
uso adecuado de los datos, el desconocimiento en el ciclo de compra y en el valor
del cliente.
Hay diferentes tipos de definiciones del valor de vida del cliente o CLV, desde la
perspectiva del “Valor” para el cliente, hasta la famosa “Equidad del Cliente”. Pero
la importancia del cálculo o estimación del CLV radica en la toma de decisiones
por los “Marketers” más informadas que intuitivas y más rápidas. La tendencia
empresarial en los últimos años es el reenfoque del análisis de sus utilidades
basado en los costos, la producción y la competencia. Hacia la importancia de la
relación con el consumidor y sus implicaciones.
La definición del valor del cliente por Jain & Singh (2002, p. 37): “El CLV para una
empresa es el beneficio o pérdida total de un cliente a lo largo de la historia de
sus transacciones con la empresa”.
Una definición interesante puede ser la propuesta por Woodruff (1997, p. 142),
dado su orientación más cualitativa que financiera: “El valor de un cliente es una
preferencia percibida por el consumidor de la evaluación de los atributos del
producto, el rendimiento de los atributos y las consecuencias de la facilidad o no,
provenientes del uso, para lograr las metas y propósitos en dichas situaciones
de uso del producto”.
150
Otra definición es la de Pfeifer & Bang (2005, p. 49): “El valor presente de los
flujos de caja atribuibles a la relación con el cliente a través del periodo o tiempo
de dicha relación”.
Las claves del buen cálculo o estimación del CLV pueden ser, Kumar (2008):
• El valor del dinero no es constante a través del tiempo.
• Hay que incluir la probabilidad que un cliente permanezca activo a través del
tiempo.
• Es una herramienta útil para los “marketers” con el objetivo de proyectar
FIGURA 6.8. las
utilidades futuras por cada cliente. PUNTAJE RFM
En este capítulo se va a exponer tres modelos de CLV aclarando claro está, que
existen múltiples modelos. El primero de ellos el RFM de sus siglas Reciente –
Frecuente – Monetario es el primer modelo planteado para la valoración de los
clientes. El segundo modelo es el denominado el “Modelo básico o estructural” y
el tercer modelo “El modelo con la tasa de retención”.
Modelo RFM
Stone (1988) propone unos puntajes o “Score” que permitan segmentar la base
de datos de clientes según el RFM. Ver figura 6.8
Para las compras recientes se divide el año en tres trimestres y se asignan los
puntajes o pesos, si compro en el último trimestre del año se le asignan 24
152
Esta propuesta de Stone como se puede apreciar ha sido muy criticada dada su
debilidad en el soporte metodológico de la misma. Pero como se mencionó en
párrafos anteriores, no es el único método propuesto a diversidad de métodos
propuestos alrededor del RFM.
Hughes (2000), describe en su libro un método muy acogido por los “Marketers”
dada su fácil aplicabilidad y sin necesidad de recurrir a un estadístico. Solo
se necesita ordenar muy bien la base de datos por cada uno de los criterios
R, F, M.
Después se procede a ordenar cada una de las variables originales tal y como se
presenta en la figura 6.10
155
En la figura 6.11, ya con los códigos ingresados a las nuevas variables se debe
ordenar la base de datos por las tres nuevas variables en estricto orden, primero
“Reciente” segundo “Frecuente” y por último “Monetario”. Y ya aparecerán en la
figura 6.12, la base de datos ordenada a partir de los clientes más importantes
hacia abajo.
156
En la figura 6.12 se aprecian claramente los segmentos ordenados por los tres
criterios del RFM, y su grado de importancia en relación al método seleccionado.
n (Ri - Ci)
i = Periodo de los flujos de caja generados por
el cliente desde la transacción
∑ (1 + d)
i=1
i
Ri = Ingresos por el cliente en el periodo i
Ci = Costo total de generar Ri en el periodo i
n = Número de periodos proyectados
d = Tasa de descuento
n mt
CLV = ∑ (1 + i)
t=1
t
familia una vez cada tres años en la aerolínea AA. Solo el 35% de los clientes
159
que viaja en AA, vuelve y la utiliza para sus vacaciones. De tal manera que su
TR = (0.35)1/3 = 70%.
t
n mt ∏ rj
CLV = ∑ t=1
j=
(1 + i)t
1
Dado que la anterior ecuación es muy intensiva en cuanto a los datos y cálculos
requeridos, se desprende de dicha ecuación una nueva ecuación que pretende
utilizar tasas de retención y de descuento constantes para simplificar el cálculo
del CLV. En tal sentido Gupta & Lehmann (2005) proponen dicha simplificación,
asumiendo que los márgenes, retenciones y descuentos permanecen constantes
a través del tiempo y asumen que horizonte temporal es infinito. Ver figura 6.16.
160
∞ m x rt
CLV = ∑ = m r 1+i-r
(/ )
t=1 (1 + i) t
Iniciaremos con el modelo estructural básico de la figura 6.14, para tal fin hemos
creado una base de datos de ejemplo en nuestro software GBW7 que la hemos
nombrado como BD CLV. Allí hay variables demográficas y piscográficas y 18
variables numéricas métricas, que son las que en principio nos interesan para
el cálculo del CLV. Están las variables del “m1” a “m6” las cuáles contienen los
márgenes netos por cada uno de los seis periodos. Las variables “r1” a “r6”que
representan cada una de las tasas de retención. Y las variables “i1” a “i6” que
representan cada una de las tasas de descuento.
Ya las variables restantes como edad, género, rango salarial, estado civil, nivel
socioeconómico y AIO’S. Servirán para la perfilación de la segmentación basados
en el criterio del CLV.
161
Lo primero que se debe hacer es crear una nueva variable que se nombrara
como CLV_BASICO. Para tal fin procedemos a “Añadir variables” y seleccionamos
la opción “Expresión Aritmética” tal y como se puede ver en la figura 6.17. Se ha
decidido que sea una variable de expresión aritmética debido a que en primera
instancia debe calcular la ecuación y en segunda instancia, cada vez que se
ingrese un nuevo cliente a la base de datos o se actualice uno existente, el cálculo
del CLV se volverá a procesar automáticamente.
FIGURA 6.17.
En la figura 6.19 nos aparece creada y calculada nuestra nueva variable CLV_BASICO.
FIGURA 6.19
163
En la figura 6.23 ya aparece la nueva variable “PIRAMIDE” junto con los códigos
en relación a la importancia de los clientes “Heavy”; “Medium”; “Low”.
FIGURA 6.23.
PIRAMIDE
HEAVY: 14%
(N=199)
MEDIUM: 32%
LOW: 55%
Como se puede apreciar en la figura 6.24, el 14% de todos los clientes (n=199),
pertenecen al segmento “Heavy” es decir de mayor CLV, seguidos del 32% de los
“Medium” y el 54% de los “Low”.
Pero falta cuantificar cada uno de estos clientes y sería, ver tabla 7:
PIRAMIDE
HEAVY MEDIUM LOW
199 27 63 109
Suma 4095375 966017 1515217 1614141
CLV_TOTAL
• Heavy: Son el 14% del total de la base de clientes (27 de 199). Representan
un CLV total de 966.017 dólares, que se traducen en un 23.6% del total de
CLV. Con un promedio de 35.778 dólares de CLV por cliente y un coeficiente
de variación del 20% muy por debajo de la variación total del 41%.
• Medium: Son el 32% del total de la base de clientes (63 de 199).
Representan un CLV total de 1.515.217 dólares, que se traducen en un
37% del total de CLV. Con un promedio de 24.051 dólares de CLV por cliente
y un coeficiente de variación del 10% muy por debajo de la variación total
del 41%.
• Low: Son el 54% del total de la base de clientes (109 de 199). Representan
un CLV total de 1.614.141 dólares, que se traducen en un 39.4% del total de
CLV. Con un promedio de 14.809 dólares de CLV por cliente y un coeficiente
de variación del 26%, por debajo de la variación total del 41%.
Como vimos al final del capítulo anterior, la perfilación de los segmentos se puede
realizar a través del análisis de correspondencias, para poder determinar las
interrelaciones de las categorías a estudiar. Adicionalmente es una técnica sencilla
de interpretar por su representación gráfica.
En referencia al estado civil los casados y unión libre, aportan en mayor proporción
a la dimensión dos. El nivel socioeconómico medio contribuye a la dimensión dos
y los niveles bajo y alto están presente similarmente en las dos dimensiones.
171
Los metalizados y sociales son los de mayor contribución a la dimensión uno y los
no metalizados y los “Locho” (Perezoso), contribuyen a la dimensión dos. Los
restantes AIO’S contribuyen similarmente a la dimensión dos.
Los “Medium” reciben ingresos menores a los 400 dólares, hombres separados
y en unión libre, divididos en niveles socioeconómicos bajo y alto. De edades
entre los 26 y 35 años y mayores a 56 años, siendo los de nivel socioeconómico
bajo más laboriosos y los de nivel socioeconómico alto más arriesgados, locho
y vanidoso.
Bibliografía
Berry,M., linoff,G. (2004). Data Mining Techniques. Wiley publishing Inc. USA.
Bitner, M. (1995). Building Service Relationship: It´s all about Promises. Journal
of the Academy of Marketing Science. Vol. 23. No. 4, 246-251.
174
Jain, D. & Singh, S. (2002). Customer lifetime value research in marketing: A review
and future directions. Journal of Interactive Marketing. 2, 16, 2. Pg. 34.
Parr,O. (2001). Datamining Cookbook. John Wiley & Sons, INC. USA.
Sin,L., Tse, A., Yim, F. (2003). CRM: Conceptualization and scale develpment.
European Journal of Marketing. VOl. 39. 11/12 Pg. 1264-1290.
Smith, DVL & Fletcher, JH. (2001). Inside Information: Making Sense of
Marketing Data. John Wiley & Sons. USA.
Sonquist, J., Baker, E., Morgan, J. (1971). Searching for Structure. Institute for
Socail Research. Univ. Michigan. Ann Arbor.
Weinberg, B. & Berger, P. (2011). Conected customer lifetime value: The impact
of social media.Journal of Direct, Data and Digital Marketing Practice. 12,
4. 328-344.
177
Woodruff, R. (1997). Customer Value: The Next Source for Competitive Advantage.
Academy of Marketing Science Journal. Vol. 25. No. 2, 139-153.