Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Instituto Tecnológico Y de Estudios Superiores de Monterrey: Biblioteca
Instituto Tecnológico Y de Estudios Superiores de Monterrey: Biblioteca
TECNOLÓGICO
• DE MONTERREY
Biblioteca
Clrnptm Ciudad de r.Mu:o
Tesis de Maestría
Contenido
Prólogo ............................................................................................................................................ 7
Anexos ........................................................................................................................................... 73
Bibliografia .................................................................................................................................... 87
6
Tabla de ilustraciones
Ilustración 1. Gráfica del Costo de Adquisición de Clientes ......................................................... 12
Prólogo
Es común que se relacione la Ingeniería Industrial y de Sistemas con piso de producción, sin
embargo, la influencia de esta ingeniería ha abarcado no solamente a las industrias
manufactureras, sino también al comercio y los servicios, de manera que el Ingeniero Industrial
puede aplicar sus conocimientos a procesos susceptibles de optimización en diversas ramas de la
industria.
Por estas razones, además de tener un interés particular por la mercadotecnia y su relación
con la ingeniería, he decidido abordar este tema de tesis, el cual espero sea de utilidad para
lectores relacionados con la Ingeniería Industrial y de Sistemas así como con la Mercadotecnia.
8
Resumen Ejecutivo
Las empresas que mantienen relaciones comerciales directamente con los consumidores finales
suelen enfrentarse al problema de anunciar sus productos y servicios a costos competitivos que
les permitan mantener su liquidez. Lamentablemente, los medios tradicionales de mercadeo tales
como la televisión, la radio o los medios impresos generan costos excesivamente altos, que en
casos de empresas pequeñas, pueden ser inclusive superiores al nivel de facturación que estas
organizaciones podrían lograr.
Como respuesta a este dilema surge la mercadotecnia directa, una técnica que permite
dirigir la publicidad a clientes específicos seleccionados con base en sus características y
propensión de compra. Los métodos para realizar esta selección pueden modelarse
matemáticamente y existen empresas dedicadas al desarrollo exclusivo de este tipo de
herramientas; lamentablemente el costo de implementación de sus modelos generados suele ser
también demasiado elevado para los presupuestos asignados a la publicidad y mercadotecnia.
Tomando como idea central el problema mencionado, esta tesis toma los aspectos más
significativos de dos herramientas de análisis utilizadas en la industria crediticia y en las ciencias
sociales, los Modelos Credit Scoring y los Modelos de Estructuras de Covarianza. El modelo
resultante consta de 4 grandes etapas que se interrelacionan para calcular la propensión de
compra de los clientes de una organización.
Donde
Y ~ Variable de respuesta
F ~ Factores de primer orden
V ~ Variables observables
r ~ Errores
9
1.1 Introducción
Al lanzar una campaña mercadológica, las empresas necesitan controlar sus riesgos financieros
para incrementar sus posibilidades de éxito, ya que como mencionaba Peter Drucker, considerado
el padre de la administración, es necesario dirigir los esfuerzos hacia los riesgos correctos, los
1
cuales no son necesariamente los más pequeños. Controlar los riesgos implica necesariamente
tomar decisiones, las cuales ayudarán a coordinar eficaz111ente las estrategias a seguir dentro de
cada campaña.
Alfred P. Sloan, presidente del consejo de GM, sugiere que toda toma de decisión debe
sustentarse no sólo en la experiencia de los involucrados, sino en bases sólidas de hechos
medibles y cuantificables. 2 Lo anterior implica que son necesarios métodos duros que
proporcionen información estadísticamente tratable para fundamentar la toma de decisiones.
En la actualidad existe una gran variedad de metodologías útiles para tratar datos y
proporcionar información. Su naturaleza depende de los problemas que intentan solucionar, por
lo que es posible encontrar desde técnicas estadísticas sencillas hasta modelaciones matemáticas
complejas.
Esta tesis se enfocará en las estrategias men;adológicas para captación de clientes en las
organizaciones Business to Consumer4, las cuales tienen un comportamiento singular ya que el
mercado potencial contiene múltiples tipos de clientes, cada uno con distintas características. Este
1
Haas, Elizabeth. Enseñanzas de Peter Drucker. 2007, pp.212
2
Haas, Elizabeth. Enseñanzas de Peter Drucker. 2007, pp.237
3
Hicks, Philip. Ingeniería Industrial y Administración, una nueva perspectiva. 2002, pp. 361
4
Estrategia de mercado donde se interrelaciona directamente con el consumidor, en una cadena logística que
consta de fabricantes, mayoristas, minoristas y consumidores.
Barshel, Hauke. B2B versus B2C Marketing - Majar differences along the supply chain of fast moving consumer
goods. Grin, 2004.
11
5
• Costo de oportunidad : Se da al limitar los recursos desinados a la promoción de un
producto y no cubrir un mercado potencial nuevo. Este riesgo ocasiona pérdidas virtuales
al no percibir los beneficios de un nicho sin explotar.
• Pérdida de capital: Se da al invertir en una estrategia mercadológica más recursos que los
recuperados por consecuencia directa del esfuerzo de mercadeo. Este riesgo es causado
por cubrir un nicho de mercado con poca propensión al consumo.
5
Viscencio, Héctor. Economía para la toma de decisiones. 2002, pp. 212
6
Abad, Raúl. Centro para empresas y profesionales. microsoft.com. Consultado el 02 de febrero de 2009.
12
La elección de la estrategia mercadológica a seguir siempre ocasiona costos, por lo que uno de
los indicadores que se utiliza para medir su efectividad es el Costo de Adquisición de Clientes 7
(CAC). Este indicador representa el costo total incurrido para que un prospecto o cliente pague
por el producto o servicio ofrecido. Generalmente, las estrategias de publicidad masiva generan
altos CAC que merman las utilidades netas de las organizaciones, mientras que la utilización de
mercadotecnia directa 8 genera menores costos. 9
Relacionando el CAC con los riesgos financieros antes mencionados, altos costos de
oportunidad y pérdida de capital son inherentes a una toma de decisiones no fundamentada, con
estrategias mercadológicas poco efectivas. Podría decirse que si estos riesgos son minimizados
durante una campaña de mercadotecnia directa, el CAC asociado tenderá a ser menor debido a la
optimización en la selección de prospectos.
7
Bolaños, Ricardo. Costo de adquisición de clientes. pyme.com.mx. Consultado el 02 de febrero de 2009.
8
La mercadotecnia directa es un sistema interactivo de mercadeo que emplea medios publicitarios medibles y
actividades controladas para acercarse a posibles consumidores previamente seleccionados.
Figueroa, Romeo. Cómo hacer publicidad, un enfoque teórico práctico. Editorial Pearson, México, 1999.
9
Fiare y Collins, 2001. deltaasesores.com. Consultado el 02 de febrero de 2009.
13
No obstante, las empresas B2C afrontan un grave problema al lidiar con la mercadotecnia
directa, la complejidad y el elevado costo de las herramientas actualmente disponibles suelen
disuadir a las organizaciones de su implementación. Estas herramientas, comúnmente llamadas
Marketing Scoring, requieren de la asistencia de firmas consultoras y desarrolladoras de software,
por lo que su costo asciende considerablemente dependiendo de la industria y organización en
que se apliquen.
El problema que esta tesis aborda es la actual limitación técnica y económica que las
pequeñas empresas B2C enfrentan al implementar metodologías de discriminación de clientes
potenciales durante la elaboración de estrategias de mercadotecnia directa.
1.3 Objetivo
Esta tesis tiene por objetivo desarrollar una metodología cuantitativa, que sustente de manera
eficaz la toma de decisiones para elaborar estrategias de mercadotecnia directa, las cuales
disminuyan los riesgos de pérdida de capital y costo de oportunidad asociados a la adquisición de
clientes nuevos.
Utilizar una metodología de esta naturaleza engloba distintas características del mercado y
pone al alcance de pequeñas organizaciones la modelación de sistemas complejos que ayuden a
fundamentar su toma de decisiones. Las estrategias generadas a partir de ésta, contribuirían a
minimizar el CAC, razón por la cual son relevantes para su panorama financiero organizacional.
14
Durante la fase de pruebas, la investigación limitará la profundidad del análisis con base
en las restricciones de los paquetes computacionales utilizados y la base de datos mostrada.
Análisis adicionales con información de mercado real no se llevarán a cabo debido a las
limitaciones existentes para la adquisición de datos. Asimismo, la metodología propuesta estará
basada en la optimización de los riesgos de pérdida de capital y costo de oportunidad bajo la
analogía de errores estadísticos tipo I y 11. Para analizar su eficacia, el modelo será comparado
contra un modelo de Regresión Logística, mostrando las similitudes y diferencias entre sus
resultados.
°
1
Customer Relationship Management. Estrategia de negocio enfocada en el consumidor que permite la medición
de comportamientos y seguimiento a cada cliente de la organización.
Anton, Jon. Customer Relationship Management, Making hard decisions with soft numbers. Prenctice Hall, USA
1996.
15
Si bien las actividades en que se enfoca la mercadotecnia son muy diversas, esta tesis se
dirige esencialmente a la promoción de productos, y de forma más específica, a la adquisición de
clientes objetivo para el consumo de dichos productos. Esta actividad es sumamente importante
debido a que en los últimos años los consumidores han demandado una orientación hacia el
11
Stanton, William; Etzel, Michael y Walker, Bruce. Fundamentos de Marketing. Ed. McGraw Hill, 13ª edición.
México, 2006.
16
mercado que satisfaga las necesidades de todos y cada uno de ellos, lo cual, debido a la
competencia y la globalización, significa un número inimaginable de distintas tendencias,
necesidades y gustos distintos para cada cliente potencial.
La situación anterior plantea dos grandes interrogantes. La primera se relaciona con las
actividades propias de la organización, "¿puede la organización impactar de manera eficiente la
mente del consumidor?" La segunda, por otro lado, se relaciona directamente con las necesidades
del mercado, "¿es el producto o servicio ofrecido lo que realmente necesito?". Si las respuestas a
ambas preguntas no son positivas es imposible concretar una venta, por lo que las organizaciones
deben utilizar técnicas y herramientas que ayuden a influenciar la mente del cliente y crear
necesidades que propicien el consumo.
Dos de las técnicas más importantes para lograr esta influencia sobre el mercado son las
llamadas mercadotecnia masiva y mercadotecnia directa. Estos términos son usualmente
utilizados para la actividad propia de la promoción del producto o servicio, por lo que la decisión
de compra del consumidor depende en gran medida de cómo la organización las pone en práctica.
Como mercadotecnia masiva deben entenderse los medios tradicionales de promoción, tales
como medios de comunicación y espectaculares; mientras que la mercadotecnia directa se
explicará a mayor detalle en la siguiente sección, dado que en ella se basará esta tesis para el
análisis de las decisiones de una organización.
17
12
Ver página 12
13
Glosario de Mercadotecnia. www.asociacionmexicanademercadotecniadirecta.org.mx. consultado el 25 de
febrero de 2009.
18
reglas específicas para segmentar clientes, sin embargo existen herramientas que pueden ayudar a
tomar estas decisiones.
La mercadotecnia directa debe adecuarse a las características del mercado potencial para
obtener beneficios, tanto comerciales como financieros, ya que la reducción del CAC depende de
la correcta selección de clientes rentables para los fines de las campañas mercadológicas. 15
Debido a esta circunstancia se requiere un profundo conocimiento de las características
principales del cliente que lo conviertan en un consumidor potencial.
14
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
15
Malthouse, Edward. Shrinkage Estimation and Direct Marketing Scoring. Journal of lnteractive Marketing, 17 de
Julio de 1998
19
La principal herramienta de esta categoría es conocida como Lead Scoring, útil para
organizaciones con una cartera de clientes limitada u homogénea en necesidades. Esta
17
herramienta permite enfocar la fuerza de venta a los clientes con mayor propensión de compra
al segmentar a los clientes en "Leads" o pasos, los cuales se caracterizan por establecer
especificaciones de rangos de presupuesto, horizonte de toma de decisiones y nivel del tomador
18
de decisiones.
Sin embargo, al tratar con carteras de clientes más diversificadas, como las presentes en
organizaciones B2C, Lead Scoring no logra entender la complejidad de características que
presentan los consumidores. Es por esto que desde 1998 comienzan a adaptarse herramientas de
utilización crediticia, llamadas Credit Scoring para analizar la calidad - riesgo de un cliente
mediante la ponderación de características observables y la aplicación de modelos estadísticos,
que predicen el riesgo financiero. 19 Al darles un enfoque mercadológico, estos modelos cambian
de nombre a Marketing Scoring y tratan de responder a la pregunta "¿ Quién debe recibir cierta
oferta?", contraponiéndose al enfoque principal de la mercadotecnia masiva2°, en la cual las
campañas publicitarias buscan impactar una gran cantidad de personas sean o no clientes
potenciales de la organización.
16
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
17
Deal, Barney. Lead Scoring, Marketing's answer to sales. www.searchcrm.com, 08 de agosto de 2007.
18
Azizuddin, Mohammed. Siebel Functional Guide.
19
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
20
Malthouse, Edward. Shrinkage Estimation and Direct Marketing Scoring. Journal of lnteractive Marketing, 17 de
Julio de 1998
21
Deal, Barney. Lead Scoring, Marketing's answer to sales. www.searchcrm.com, 08 de agosto de 2007
22
Malthouse, Edward. Shrinkage Estimation and Direct Marketing Scoring. Journal of lnteractive Marketing, 17 de
Julio de 1998
20
23
ambas partes , por lo que las tendencias buscan mantener relaciones estrechas con todos los
clientes, comprendiendo sus motivadores de compra)' las necesidades existentes en el mercado.
No obstante, realizar una selección específica de clientes objetivos implica grandes costos
24
de inversión, operación y mantenimiento , lo que puede afectar el flujo financiero cuando las
organizaciones no logran generar volúmenes de venta suficientes para absorber estos costos. Esta
situación es común en empresas pequeñas, por lo que muchas veces es imposible aplicar
herramientas avanzadas de análisis tales como el Marketing Scoring sin impactar negativamente
las economía de estas organizaciones.
Existen fuentes de información internas y externas, cada una de ellas con distintas
implicaciones de costo y funcionalidad. La elección de la fuente adecuada para sustentar la toma
de decisiones dependerá del tipo de análisis que se desea realizar, el presupuesto asignado y la
disponibilidad.
23
Stanton, William; Etzel, Michael y Walker, Bruce. Fundamentos de Marketing. Ed. McGraw Hill, 13ª edición.
México, 2006.
24
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
25
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
26
Peña, Gustavo. La inteligencia tecnoeconómica: una ventana hacia el futuro. Espacios Vol. 13 (2) 1992.
21
27
encuestas de servicio al cliente, entre otros. Sus principales ventajas son la facilidad para
obtenerse y su disponibilidad. Sin embargo, su alcance puede ser limitado y significativo sólo
para el entorno organizacional.
Gracias a los avances tecnológicos de las últimas dos décadas, las organizaciones han
podido utilizar Bases de Datos para almacenar toda la información relacionada no solamente con
la empresa misma, sino también con el mercado, de manera que conforman una de las fuentes de
información internas que pueden proporcionar información histórica del desempeño en una
organización. Al almacenar el historial de cada uno de los clientes, permiten analizar diversas
variables y características que influyen en su propensión de compra, algunas de ellas se muestran
en la tabla a continuación.
27
Peña, Gustavo. La inteligencia tecnoeconómica: una ventana hacia el futuro. Espacios Vol. 13 (2) 1992.
28
Weber, Klaus y Sutcliffe, Kathleen. El alto costo de la información exacta. Harvard Business Review, ISSN 0717-
9952, Vol. 81. N!!. 5, 2003 , págs. 56-64
22
Las variables mencionadas no son exhaustivas y no existe una metodología única para
seleccionar las variables adecuadas, por el contrario, cada estrategia mercadológica requiere del
análisis de distintas variables. Dentro de las organizaciones B2C, es común encontrar un
departamento a cargo de la recolección de estos datos, comúnmente denominado CRM.
Si bien el desarrollo de una estrategia CRM en una organización depende de los objetivos
que se pretenden lograr, existen 3 grandes denominaciones 32 para los usos designados de la
información obtenida:
• CRM operacional: tiene como objetivo realizar de forma eficiente las operaciones de
rutina relacionadas con el servicio al cliente, tales como calendarizar citas, dar
seguimiento a compras realizadas y generar campañas de tele marketing.
• CRM analítico: tiene como objetivo evaluar toda la información disponible de cada
cliente, tal como compras realizadas, historial de pago y opiniones previas. Con esta
información es posible evaluar indicadores de servicio y financieros relacionados con
cada uno de los clientes, así como generar patrones de lealtad y satisfacción.
• CRM de colaboración: tiene como objetivo facilitar la comunicación de dos vías entre el
mercado y la organización mediante herramientas como chal rooms, correos electrónicos
y redes sociales, entre otros.
29
Generalmente se asocia erróneamente el concepto de CRM con el software que ayuda a gestionar las relaciones
con el cliente.
Burnett, Ken. Gestión de la relación con el cliente clave. Prenctice Hall. España, 2002.
30
García, Ignacio. CRM Gestión de la Relación con los Clientes. FC Editorial. Madrid, 2001.
31
Anton, Jon. Customer Relationship Management, Making hard decisions with soft numbers. Prenctice Hall, USA
1996.
32
Stanton, William; Etzel, Michael y Walker, Bruce. Fundamentos de Marketing. Ed. McGraw Hill, 13ª edición.
México, 2006.
23
Aplicación Query
Clientes que han comprado múltiples productos
Fidelización del Cliente
C lientes con mayor número de visitas
Ventas on line por mes comparadas con las totales
Rentabilidad del Cli ente
Información on line y off line relacionada del cliente
Visitas recibidas como consecuencias de publicidad on line
Análisis Click Stream Número de páginas visitadas por cliente
Páginas de entrada y salida más utilizadas
Reclamaciones de c li entes por tipo comercial y región
T iempo medio de resolución de una reclamación en Call
Servicio al Cliente
Center
Informes por producto y organización de servicios
Informe de resultado de las ventas correspondientes a las
Gestión de Campañas de promociones existentes
Mercadeo Volumen de ventas durante periodo promociona! y no
promociona!
Tabla 3. Ejemplo de CRM
Gracias a esta versatilidad, las bases de datos CRM analíticas contienen variables útiles
para obtener información referente a la propensión de compra de sus clientes, la cual puede
aplicarse a estrategias de mercadotecnia directa. El modelo que se sugerirá a lo largo de este
trabajo contempla este tipo de CRM debido a su funcionalidad y disponibilidad de datos clave del
mercado existente. Sin embargo, se requiere analizar a detalle esta información para determinar la
significancia y utilidad de sus variables, por lo que las herramientas tradicionales pueden no
explicar la complejidad real del mercado, mermando las ventajas que se pueden obtener de la
mercadotecnia directa.
33
García, Ignacio. CRM Gestión de la Relación con los Clientes. FC Editorial. Madrid, 2001.
34
Ponzoa, José Manuel. Los 100 Errores del CRM. Editorial ESIC. Madrid, 2005.
24
Una de las disciplinas que más ha explotado estas herramientas es el mercado crediticio,
con los llamados Credit Scoring. Estos modelos son relativamente similares a las herramientas
utilizadas por la mercadotecnia, por lo que es factible adecuarlos a los modelos de Marketing
Scoring para ser utilizados en estrategias de mercadotecnia directa. Adicionalmente, la
implementación y desarrollo de estos modelos puede realizarse de forma sencilla gracias a que su
amplia utilización ha ayudado a difundir información acerca de su naturaleza y de las diversas
técnicas utilizadas para su generación.
35
Nettleton, David. Análisis de datos comerciales. Ediciones Díaz de Santos. España, 2003.
25
36
Gutiérrez, Matías Alfredo. Modelos de Credit Scoring - Qué, cómo, cuándo y por qué - . Banco Central de la
República Argentina. Octubre de 2007.
27
divida el rango de los clientes buenos del rango de los clientes malos. Un score por encima del
Cut Off significa que el sujeto de estudio es un cliente bueno y generalmente se le es asignado el
37
crédito. En el ejemplo anterior, si el Cut Off fuese de 400, significaría que el cliente se
encuentra en el rango 200 a 400, es decir de clientes malos, al haber obtenido un score de tan sólo
350.
No existen rangos de seores o Cut Off predefinidos, sino que cada organización establece
su propio espacio de referencia, de acuerdo a sus necesidades y sus posturas con respecto al
riesgo. La media de las organizaciones crediticias utiliza rangos de 300 a 850 puntos con un Cut
Off de 723, pero no es un estándar que deba seguirse en todas la~ organizaciones. 38
Generalmente, las organizaciones con mayor aversión al riesgo, establecerán un Cut Off más
elevado que las propensas al riesgo, mientras que el rango de seores dependerá de la metodología
utilizada.
Los modelos Credit Scoring surgieron desde la década de 1970, sin embargo no fueron
ampliamente difundidos y utilizados hasta la década de 1990 gracias a las nuevas herramientas de
cálculo computacional. Debido a que requieren múltiples operaciones y supuestos para cada
individuo analizado, las computadoras y el software estadístico se vuelven fundamentales para
poder hacer de los modelos Credit Scoring una herramienta de uso cotidiano en las
organizaciones. Sin embargo, aún con los adelantos tecnológicos, estos modelos no han llegado a
sustituir al juicio humano, por el contrario, funcionan como herramientas de apoyo para la toma
de decisiones, ya que los analistas utilizan su propio juicio y experiencia, ocupando al modelo
39
como una prueba a favor o en contra de su razonamiento.
Existen tres enfoques distintos a los cuales dirigir los resultados de estos modelos, clientes
nuevos, clientes existentes y clientes morosos. Para cada uno de estos enfoques el mercado
40
crediticio ha destinado un modelo diferente.
37
Business G/ossary. Barron's Educational Series, 2006.
38
Gutner, Toddi. Anatomy of a Credit Score. Business Week, 28 de noviembre de 2005.
39
Gutiérrez, Matías Alfredo. Modelos de Credit Scoring - Qué, cómo, cuándo y por qué - . Banco Central de la
República Argentina. Octubre de 2007.
40
Scorto. www.scorto.com/spanish/credit_scoring.htm
28
Con el paso del tiempo, los modelos han evolucionado, permitiendo a las organizaciones
adoptar el modelo más adecuado a sus necesidades. Tradicionalmente se basaban en técnicas de
análisis discriminante, pero con la introducción de nuevas tecnologías de información, han
surgido nuevas técnicas de regresión logística con modelos Probit y Logit, modelos no
29
Esta diversidad permite que cada metodología se adapte a las distintas necesidades de las
42
empresas. Actualmente, uno de los métodos más utilizados es la regresión lineal, debido a la
simplicidad de su operación y la aplicabilidad en casi todas las organizaciones. 43 Debido a lo
anterior, esta tesis enfocará su marco de referencia en el estudio de los modelos Credit Scoring
con metodologías de regresión lineal buscando que la adecuación al problema estudiado se pueda
realizar de forma sencilla y con una interpretación directa de la calificación score.
Su metodología es sistemática, con tres pasos principales que permiten iterar con la
información disponible 45 :
\;,
··~
Donde Pk es la probabilidad de que el elemento k tome valor I en el modelo. Esta
probabilidad se comporta bajo una distribución Poisson debido a la naturaleza binaria del
modelo, pero puede ser utilizado otro tipo de distribución para casos nominales.
Para formular el modelo se crea una ecuación lineal que explique la variable dependiente
Z, correspondiente a la calificación Scoring, mediante las probabilidades de ocurrencia de las
variables explicativas. Consideremos los vectores columna Xy /J, correspondientes a las variables
46
Bonilla, María; Olmeda, Ignacio; Puertas, Rosa. Modelos paramétricos y no paramétricos en problemas de Credit
Scoring. Revista Española de Financiación y Contabilidad, Vol. 32 No. 118. Julio - Septiembre 2003.
47
Guitiérrez, Matías. Modelos de Credit Scoring - Qué, cómo, cuándo y para qué-. Banco Central de la República
Argentina, 2007.
31
Z=f3TX+E
Donde E(Ek) =o
E(EklXk) =O
Considerando que: pk = 13rxk
Esta ecuación establece la relación lineal existente entre cada variable independiente y la
calificación scoring del modelo, sin embargo, para estimar los valores de pes necesario optimizar
la recta resultante mediante los métodos de mínimos cuadrados o bien de máxima verosimilitud.
Si se utilizaran variables que no cumplen estas características, aun cuando los supuestos
estadísticos se respeten, existirían divergencias entre la teoría del análisis discriminante y la
práctica. Estas divergencias serían producto de los datos no paramétricos que no pueden
someterse a las herramientas explicadas previamente.
48
Álvarez, Rafael. Estadística multivariante y no paramétrica cor, SPSS. Editorial Diaz de Santos. España, 1995.
33
49
Casas Guillén, Mercedes. Los modelos de ecuaciones estructurales y su aplicación en el Índice Europeo de
Satisfacción al Cliente. Facultad de Económicas - Universidad San Pablo.
50
Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
34
51
Lescouflair, Edric. Sewa/1 Wright: Darwin's successor - Evolutioriory theorist. Harvard Col/ege, 2003
52
El Path Analysis fue sugerido por Sewall Wright en 1918, aunque criticado por otros científicos al no comprender
los objetivos y procedimientos de esta técnica. En general se plantea como una herramienta flexible para relacionar
los coeficientes de correlación entre variables con las relaciones funcionales entre ellas. Para más información ver
Wright, Sewall. The Method of Path Coefficients. The Annals of Mathematical Statistics. Vol.5, No. 3. Septiembre
1934.
53
Silva, Claudio; Schiattino, Irene. Modelos de Ecuaciones Estructurales ¿Qué es eso?. www.cienciaytrabajo.cl
54
SSI Scientific Software lnternational. www.ssicentral.com/workshops/instructors.html
55
Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
35
Existen tres tipos de relaciones bajo las cuales interactúan las variables de un modelo,
directas, indirectas y espurias. Cada uno de estos tipos de relación tiene características diferentes
y afectan de manera distinta al comportamiento del modelo.
Relación directa: se refiere a la relación existente entre una variable independiente y una
variable de respuesta en la que el efecto ocasionado no se ve modificado por ningún otra variable
de por medio.
Relación espuria: se refiere a la relación existente entre dos variables al ser estas
impactadas por otras variables en común, aun cuando las variables en cuestión no tienen efecto
alguno una sobre la otra.
56
Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
36
~
Relación causal espuria
Este tipo de relaciones obedecen a variables que pueden ser medidas directa o
indirectamente, aunque existe cierto tipo de variables que no puede cuantificarse mediante su
observación, sino que su magnitud responde a indicadores tanto cuantitativos como cualitativos.
Este tipo de variables son llamadas constructos, variables latentes o factores y son el resultado de
las interacciones de al menos dos variables observables. 57
57
Casas Guillén, Mercedes. Los modelos de ecuaciones estructurales y su aplicación en el Índice Europeo de
Satisfacción al Cliente. Facultad de Económicas - Universidad San Pablo.
58
Silva, Claudio; Schiattino, Irene. Modelos de Ecuaciones Estructurales ¿Qué es eso? www.cienciaytrabajo.cl
37
entre las variables del modelo. Bajo esta definición, puede pensarse en un modelo de regresión
lineal múltiple que calcula coeficientes regresionados, sin embargo la diferencia entre estos
modelos y lo de estructuras de covarianza radica en que éstos últimos calculan coeficientes de
trayectorias y de covarianzas, dando como resultado un conjunto de ecuaciones que describen el
comportamiento complejo del modelo. 59
60
Las características principales de los modelos de estructuras de covarianza son cinco y
pueden definirse de la siguiente manera:
59
Silva, Claudia; Schiattino, Irene. Modelos de Ecuaciones Estructurales ¿Qué es eso? www.cienciaytrabajo.cl
60
Batista, Joan Manuel; Coenders, Germa. Modelas de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
61
Procedimiento estadístico para reducir la redundancia en un conjunto de puntuaciones intercorrelacionadas. Una
de sus principales técnicas, el método de componentes principales, obtiene el número de factores comunes que
pueden explicar un conjunto de puntuaciones intercorrelacionadas.
Kaplan, Robert; Saccuzzo, Den nis. Pruebas psicológicas. Principios, aplicaciones y temas. Ed. Thomson, México,
2006.
62
Casas Guillén, Mercedes. Los modelos de ecuaciones estructura/es y su aplicación en el Índice Europeo de
Satisfacción al Cliente. Facultad de Económicas - Universidad San Pablo.
38
y= a+ py + y(x +E)+ ó
61 ~ Y11
-Q,--- E¡
Y11 Y12
~12 ~1--- Ez
f2 >~Yzz
Yz
Yn
Mantener el nivel de complejidad del modelo al mínimo permite la holgura suficiente para
garantizar se encuentren formulaciones apropiadas para el fenómeno estudiado. Por esta razón es
común fijar las intersecciones estructurales en cero, de manera que no intervengan en las
ecuaciones lineales del sistema.
39
datos, la confiablidad de la información y el ajuste de las regresiones lineales son las pruebas más
significativas para confirmar su verosimilitud y utilidad.
;·
Tabla 5. Indicadores
63
Ledesma, Rubén; Molina, Gabriel; Valero, Pedro. Análisis de consistencia interna mediante Alfa de Cronbach: un
programa basado en gráficos dinámicos. Psico USF volumen 7, numero 2. Diciembre 2002.
64
http://www.ucm.es recuperado el 18 de Noviembre de 2009.
40
1. Especificación
• Conocimiento teórico del objeto de estudio
o
2. Identificación
o
3. Recolección de datos
•Recopilación de información relativa a covarianzas entre variables
o
4. Estimación
• Cálculo de indicadores
5. Diagnóstico
• Evaluación de discrepancias de los valores estimados con los valores
observados
o
6. Utilización
• Aplicación del modelo en casos reales
65
Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
41
Una estrategia efectiva debe considerar los riesgos relacionados, es decir el costo de
oportunidad y la pérdida de capital. Al representar gráficamente estos riesgos se observan dos
curvas contrapuestas que determinan el costo financiero total del error de la estrategia, donde la
optimización del riesgo financiero se da al encontrar el punto de equilibrio entre ambas curvas y
seleccionar los recursos necesarios para alcanzarlo. Sin embargo esta optimización varía de
acuerdo al contexto en que se tome la decisión de la estrategia mercadológica, por ejemplo, los
recursos que se deben destinar a una botana que se comercializará dentro de una escuela primaria
es distinto a los que se utilizarán al promocionar una herramienta de alta tecnología a nivel
nacional. Por esta razón, es necesario utilizar una metodología flexible que permita adecuar
diversos entornos bajo una misma visión de solución, la cual considere tanto variables
cualitativas como cuantitativas, ya que la naturaleza del problema corresponde a una situación de
comportamiento humano.
42
...o
QJ I
·¡:¡
e
111
----------------- L _
e
¡.:; I
..."'
o .11
--7-¡--- - Costo de Oportunidad
o
u
,,. /: - - Pérdida de Capital
-r T
--
Cantidad de Recursos
Hit: Se refiere a aquellos clientes que al ser expuestos a la mercadotecnia directa reaccionan de
manera favorable y realizan la compra o adquisición del producto o servicio promocionado.
Costo de Adquisición de Clientes (CAC): Se refiere al costo total incurrido por cliente que
·
reacciona · d"1recta, pue d e ca 1cu 1arse como CAC
a (a merca d otecma = CostoHtts
.total .
Variable: Con este término se referirá a las características inherentes de los consumidores
expuestos a la estrategia mercadológica, por ejemplo edad o género. Cada variable es única y
puede ser tanto cuantitativa como cualitativa. Este último tipo de variables se pueden medir
mediante escalas de Likert o escalas nominales.
Factor: Este término hace referencia a una variable de orden superior, conformada por otras
variables básicas y que no mantiene una conceptualización real o medible. Es el resultado de la
combinación lineal de un grupo de variables y representa una idea o concepto intangible.
Calificación Score: Se trata de una calificación arbitraria, asignada por la combinación lineal de
un grupo de variables y factores. Representa la afinidad del elemento analizado para convertirse
43
en un Hit. Por sí sola, la Calificación Score no tiene ningún significado, sino que debe ubicarse
dentro de un intervalo de referencia para que sea útil en la toma de decisiones.
Cut Off: Este ténnino se refiere a un punto específico en el intervalo de referencia en que se
ubican las Calificaciones Score. Este punto divide en dos a las posibles calificaciones: del Cut
Off en adelante se trata de Hits Pronosticados, del Cut Off hacia atrás se trata de No Hits
Pronosticados. Este punto de referencia es asignado arbitrariamente y determinará qué tan estricta
es la política de rechazos.
Clientes Buenos: Se refiere a aquellos clientes que han sido clasificados a priori como futuros hit
debido a su comportamiento histórico.
Clientes Malos: Se refiere a aquellos clientes que no han sido clasificados a priori como futuros
hit debido a su comportamiento histórico.
Hits Pronosticados: Son aquellos individuos analizados por el modelo cuyo resultado establece
que serán un Hit en la campaña mercadológica con una Calificación Score superior al Cut Off.
No Hits Pronosticados: Son aquellos individuos analizados por el modelo cuyo resultado
establece que no serán un Hit en la campaña mercadológica con una Calificación Score inferior al
Cut Off. Estos individuos, en caso de incluirse en la campaña de mercadotecnia directa, suponen
un aumento en el CAC, mas no en la respuesta esperada de compra.
Etapa de Selección
depende de la perspectiva del negocio considerar lo que sería un Hit. Por ejemplo, una posible
definición de Cliente Bueno sería: "aquel cliente cuyas compras en un periodo de I mes posterior
a la última campaña publicitaria sean mayores a $1,000".
Etapa de Modelación
Durante esta etapa la metodología establece las interrelaciones existentes entre las
variables definidas en la Muestra de Entrenamiento, las cuales pueden ser de naturaleza
cuantitativa o cualitativa, utilizando modelos de estructuras de covarianza. De forma conjunta, la
metodología simplifica al máximo el modelo propuesto mediante la introducción factores y
agrupación de las variables involucradas.
Como resultado de esta etapa, se obtiene un Path Diagram de las variables y factores a
considerar durante la elaboración de la estrategia de mercadeo directo, con los cálculos
correspondientes a la intensidad de las interrelaciones existentes, representado como un sistema
de ecuaciones lineales.
Etapa de Calificación
Esta etapa contempla los procesos para definir una Calificación Score que posteriormente
dará la pauta para definir a los Hits Pronosticados y a los No Hits Pronosticados. Utilizando el
sistema de ecuaciones obtenido en la etapa de modelación se analizan las interacciones existentes
y se determinan las variables directamente relacionadas con la propensión de compra, así como
45
su peso relativo para poder asignar una Calificación Score tanto en la Muestra de Entrenamiento
como en la Muestra de Test.
El resultado de esta etapa consiste en la cuantificación de las aportaciones que cada una
de las variables utilizadas brinda a la Calificación Score de cada elemento evaluado, ubicada
dentro de un máximo y un mínimo definidos por el mismo Modelo Scoring. A menor
calificación, menor propensión de compra; a mayor calificación, mayor propensión de compra.
Etapa de Calibración
Ésta es la última de las etapas de la metodología, en ella se define el Cut Off más
adecuado y se evalúa la funcionalidad del modelo. El Cut Off, se define de manera arbitraria, por
lo que puede establecerse según la experiencia del analista o bien tomando en cuenta las
calificaciones Score de la Muestra de Entrenamiento.
Una vez definido el Cut Off, es necesario validar el modelo con la Muestra de Test, este
proceso consiste en comparar las calificaciones de esta muestra con el Cut Off establecido y
buscar similitudes o diferencias con la Muestra de Entrenamiento. Al realizar estos pasos,
obtenemos dos grupos de calificaciones, los Hits Pronosticados y los No Hits Pronosticados.
.
• Tipo de vivienda
• Datos nominales • Comunidad
Social
• Estrato socioeconóm ico
• Nivel de estudios
• Ingreso anual
• Datos nominales
• Tamaño de vivienda
Económica • Datos discretos
• Autos
• Datos continuos
• Créditos otorgados
• Edad
• Datos nominales • Género
Demográfica
• Datos discretos • Estado civil
• Nacionalidad
• Tiempo desde última compra
• Datos nominales • Monto total facturado
Comercial • Datos discretos • Departamento con más compras
• Datos continuos • Producto más consumido
• Cantidad promedio de compra
• Hits anteriores
• Datos nominales
• Tiempo desde última campaña
Mercadológica • Datos discretos
• Inversión en publicidad
• Datos continuos
• Tipo de publicidad más común
Tabla 6. Información disponible en un CRM
47
Multivariado (MANO V A)
66
para cada x; de manera que p ~ 0.15 67
3. Consistencia en los datos: Toda variable debe contener datos de un solo tipo, es decir,
nominales, discretos o continuos. Cualquier inconsistencia en los datos o información
faltante puede contribuir a fallas en la estimación del modelo.
4. Independencia: Todas las variables elegidas deben ser independientes entre sí, de manera
que la covarianza implícita en el modelo no se vea afectada por variables directamente
dependientes. Por ejemplo X 1 = 2X2 establece dependencia entre ambas variables.
5. Aleatoriedad: Todos los elementos de la muestra deben ser elegidos de manera aleatoria,
sin ningún orden específico y bajo ninguna relación condicional.
66
Multivariate Analysis of Variance, análisis de 2 o más variables independientes que relaciona la suma del
cuadrado de los errores con el error cuadrado medio, proporcionando un nivel de significancia mediante la
distribución F de Fisher.
Hutner, Michael, et. al. Applied Linear Statistical Models. Editorial McGraw Hill. Singapur, 2005.
67
=
P value, probabilidad de que la hipótesis nula H0 :Xi *
Xj, "ífi j no se rechace en una prueba de hipótesis con
distribución F de Fisher.
48
Zc1-a)/22Max(o-q)2 )
n ~ Max ( E2 , 100
Donde
Los niveles de u y E son a elección del analista, pero puede usarse el estándar a = O.OS y
E = 0.1, siendo a el valor de la desviación estándar poblacional más alto calculado para las
diversas variables en Q.
68
McDaniel, Carl; Gates, Roger. Investigación de Mercados. Editorial Thomson. Sexta edición. México, 200S.
49
La Muestra de Entrenamiento elegida se utilizará para el cálculo del modelo, mientras que
la Muestra de Test para su calibración y ajustes.
valores de cada elemento de la muestra para cada variable considerada; y íl.nE( nnE x 1) = Y,
correspondiente a la clasificación de cada uno de los elementos de la muestra realizada a priori en
la etapa de selección.
manera que obtengamos el conjunto {X1 ,X2 , ... ,Xq}- De esta manera, es posible realizar un
análisis MANOV A considerando el conjunto de variables para determinar su significancia ante el
modelo preliminar lineal Y = ¿ f3X. Esta discriminación permitirá utilizar sólo aquellas variables
cuya varianza aporte de manera significativa a la selección de Clientes Buenos y Clientes Malos.
so
69
Para realizar el análisis MANOVA se deben establecer las siguientes hipótesis :
El Path Diagrama realizar siempre tendrá como factor de orden superior a Y, partiendo de
ella las interrelaciones respectivas entre factores de primer orden y variables observables. Esta
interrelación se observa en el siguiente diagrama:
69
Bray, James; Maxwell, Scott. Multivariate Analysis of Variance. Sage University. EUA, 1985.
51
Los factores permiten introducir distintos tipos de información al modelo sin incurrir en
incoherencias matemáticas, considerándose los siguientes puntos para esta propuesta:
1. Podrán definirse diversos niveles de factores, siendo los de primer orden los más cercanos
a la variable de respuesta.
2. Las interrelaciones existentes se realizarán de la siguiente manera:
a. Variable de respuesta - Factor de primer orden
b. Factor - Variable observable
c. Factor de orden superior - Factor de orden inferior
3. Los errores de cálculo de los factores se fijarán en O.O
4. El error de medición de las variables corresponderá al error estándar de la muestra.
5. Todas las relaciones existentes corresponderán a una ecuación lineal.
Ya incorporados las variables y los factores al modelo, la última actividad de esta etapa es
la cuantificación de los coeficientes de correlación, denominados ~ y y respectivamente para los
factores y las variables. Estos coeficientes son calculados mediante mínimos cuadrados
ponderados al establecer el conjunto de ecuaciones siguiente:
Y = f]y + yx + 8 + YE
:. Y= {Jy + y(x + E)
Desarrollando obtenemos el siguiente sistema:
Clientes
Buenos
Clientes
Malos
70
Agresti, Alan. An introduction to categorical data analysis. Ed. Wiley, 2007.
53
La calibración del modelo propuesto busca maximizar los valores de los cuadrantes B - H
y M - NH, los cuales corresponden a predicciones correctas de clientes Buenos y Malos,
respectivamente, aunque es posible considerar un rango de respuestas aceptables para cada
cuadrante dependiendo de la finalidad de la estrategia mercadológica. Dependiendo de la
aversión al riesgo del analista se pueden elegir distintos niveles de Cut Off: para una perspectiva
protectora, es recomendable elegir un Cut Off que identifique a la mayoría de los No Hits
Pronosticados, para una perspectiva más agresiva se buscará un Cut Off que maximice los Hits
Pronosticados. Una perspectiva conservadora busca el equilibrio entre ambos.
Perspectiva protectora
Perspectiva agresiva
Definido el nivel de Cut Off deseado, es necesario comprobar que el modelo identifica de
manera veraz casos externos a la muestra de entrenamiento. Para ello se evalúa mediante una
matriz de confusión las calificaciones score obtenidas para los elementos de la muestra de test
nT. Las matrices de confusión resultantes en ambas muestran deben ser semejantes para poder
considerar el modelo como coherente, es decir, cada uno de los cuadrantes de la matriz de
confusión de fh debe ser similar a su correspondiente con la matriz de nE.
3. Las variables utilizadas no son significativas para la variable de respuesta. Esta causa es
probable si los p values de las pruebas MANOVA realizadas son mayores al nivel de
significancia deseado. Para solucionar esta causa es necesario validar que las variables
observables no sean constantes y presenten un comportamiento pseudonormal, aunque
este último puede relajarse con el fin de permitir la entrada de más variables al modelo.
SS
Modificar la escala de las variables para estandarizarlas con el resto de la muestra puede
ser necesario para garantizar su significancia.
Si bien estas causas no son exhaustivas, representan las razones más comunes y sencillas
de solucionar durante la implementación del modelo propuesto para cualquier estrategia de
mercadotecnia directa planteada. Es importante recordar que al trabajar con datos reales los
supuestos estadísticos aplicables pueden relajarse para permitir la libre interacción entre variables
y factores, por lo que la experiencia del analista es de suma importancia para identificar los
errores que afectan los resultados del modelo.
Una vez que ambas matrices de confusión son semejantes y no se presenta ninguno de los
errores mencionados, se puede asumir coherencia en el modelo y puede aplicarse a casos externos
a la base de datos. Sin embargo, su calibración debe realizarse de forma cotidiana para asegurar
la veracidad del modelo en todo momento, ya que el comportamiento del mercado objetivo puede
variar con respecto al tiempo introduciendo errores en el pronóstico. La frecuencia de calibración
es a elección del analista, pues depende de la variabilidad observada en el mercado, de la
constancia de los clientes y de la calidad de la información existente en la base de datos.
56
sistemática, por lo que la representación lógica de sus cuatro etapas se muestra en la Ilustración 9. Su
seguimiento paso a paso garantiza la obtención de resultados confiables y de fácil interpretación para la
Con base en este modelo, el siguiente capítulo pone a prueba el desarrollo planteado en
las secciones anteriores, basándose en información real para la ejecución de cada una de las
etapas propuestas. La utilización de software especializado facilitó el análisis de datos, aunque no
necesariamente se debe disponer de esa paquetería específica para su tratamiento.
57
Uno de los ejercicios presentados se adapta a las necesidades de estudio de esta tesis, pues
su problemática consiste en la predicción de clientes potenciales para la compra de un seguro
para casas rodantes. Mediante la metodología propuesta se analizará la información disponible en
la base de clientes de la compañía de seguros y se identificarán las variables necesarias para
obtener una Calificación Score respecto a la propensión de compra de este seguro en específico.
Dentro del marco conceptual de este caso, entiéndase que la correcta predicción será
crucial para llevar a cabo una campaña mercadológica dirigida a los posibles compradores. De
esta manera el CAC y los riesgos financieros estarán definidos mediante:
Costo de campaña
CAC = - - -Hits
----
valores iguales a cero, por lo que puede eliminarse del conjunto de datos a utilizar debido a su
falta de variabilidad.
Una vez seleccionadas aquellas variables con un comportamiento cuasi normal y sin
relaciones lineales entre ellas, es posible analizar su significancia con respecto a la variable de
respuesta Y mediante el análisis de sus distribuciones de frecuencias y estudios de Análisis de
Varianza. De esta manera, al observar las distribuciones de frecuencia de las variables de este
estudio, presentadas en el Anexo 3, se encuentra un comportamiento similar en los Clientes
Buenos y Clientes Malos de acuerdo al nivel de cada una de las variables independientes. Este
comportamiento tan correlacionado puede ocasionar errores en la interpretación del modelo, por
lo que es conveniente seleccionar solo aquellas variables que presentan una diferencia entre
ambas clases, permitiendo al análisis de covarianza a realizar identificar las características que
discriminen a los Hits pronosticados de los No hits pronosticados.
todos los factores involucrados. Las variables seleccionadas tras este análisis son
UNIVERSIDAD, PRIMARIA, RENTACASA, RESPCIVIL y SEGUROAUTO.
Variables Porcentaje
Significativas 5 23%
No significativas 17 77%
Tabla 9. Variables significativas
El análisis factorial de los datos fue realizado en SPSS, software estadístico que permite la
reducción de datos analizando su varianza. El Anexo 5 muestra la matriz de componentes de los 2
factores resultantes, los cuales comprenden el 60% de la varianza del modelo. Esta distribución
será utilizada por el Path Diagram para realizar el modelo de estructuras de covarianza.
El análisis de las variables observables y los factores obtenidos se lleva a cabo mediante
software especializado que permite generar modelos de estructuras de covarianza. La paquetería
utilizada durante el desarrollo de este trabajo fue Lisrel, un programa estadístico que existe desde
hace cerca de 18 años y que permite generar modelos complejos de esta naturaleza, razón por la
71
cual es ampliamente utilizado en estudios de psicología, biología y ciencia naturales. La sintaxis
del programa utilizado para este modelo, así como la solución arrojada, se encuentran en el
Anexo 6, donde se aprecia la interacción definida entre los elementos del modelo.
El Path diagram resultante muestra los componentes para cada nivel del modelo,
relacionados entre sí para generar un modelo lineal de covarianza. Puede observarse que los
factores se muestran en óvalos, mientras que las variables observables se encuentran a la derecha
del modelo representadas con rectángulos. CONTRATA, la variable de respuesta, se localiza en
el extremo izquierdo y su coeficiente no afecta las ecuaciones del modelo al ser de magnitud
unitaria.
IUNIVERSil---1. 17
1.50
].19
EGUROA o .31
71
http://www.ssicentral.com/lisrel/history.html recuperado el 04 de Octubre de 2011.
62
Al transcribir los coeficientes del modelo en un sistema de ecuaciones lineales se obtienen las
expresiones mostradas a continuación, las cuales serán utilizadas para calcular las Calificaciones
Score de los individuos analizados en el modelo.
Donde
De esta manera, los riesgos financieros no dependen solamente del nivel de Cut Off
elegido, sino de la utilidad por cliente esperada y el costo unitario de la campaña mercadológica.
Para efectos de análisis, considérense ambas cantidades proporcionales, de manera que el punto
óptimo de la estrategia estará dado por la intersección de las curvas B-H y M-NH en una gráfica
de Clientes vs Cut Off.
64
~ 600 - B-H
~ \ I
5 400 [····-· ........,~\.---·····-·· ····-·················-···-··-·----·
I \
-B-NH
I ' M-H
20: ¡ . _.,.,, ~'. . . ,s:=----·· M-NH
En la segunda gráfica puede observarse que la intersección de las curvas B-H y M-NH se
da a un nivel de Cut Off igual a -193. En este nivel, los porcentajes de Hits y No Hits
Pronosticados que fueron acertados son superiores a aquellos que fueron erróneos, impactando
directamente a los riesgos financieros de Costo de Oportunidad y Pérdida de Capital de forma
65
positiva. Cualquier otra Calificación Score utilizada desplazaría las curvas de su punto de
equilibrio, por ende incrementando el valor del riesgo financiero total.
Una vez seleccionado el nivel de Cut Off adecuado, es necesario comparar las matrices de
confusión para ne y QT, de manera que un modelo consistente debe arrojar resultados similares
en ambas muestras, a pesar de tratarse de conjuntos distintos. Las siguientes matrices de
confusión fueron obtenidas con un Cut Off de -193 y son presentadas en porcentajes para permitir
una comparación estandarizada. Puede observarse un comportamiento similar entre ambas
pruebas, con una diferencia de -3 puntos porcentuales entre las muestras .QE y QT con relación a
los Clientes Buenos clasificados corno Hits, pero sin grandes variaciones en la evaluación general
de los datos.
Clientes
Buenos
Clientes
Malos
72
En el capítulo 3.6 se mencionan previamente algunas técnicas de análisis existentes.
66
ef3o+f31x
E(Ylx) = rr(x) = 1 + e /3 +/3
O 1X
rr(x) ]
g(x) = ln [ 1 _ rr(x) = /3 0 + {3 1 x
Para un modelo con variable de respuesta dicotómica 74 , como lo es este caso de estudio
con la variable CONTRATA, existe un indicador llamado Odds Ratio (OR), también conocido
como Relación de Probabilidades, el cual determina la razón con que los valores esperados
E(Ylx) varían de acuerdo a los valores de x que toma el modelo, es decir, un OR=2 significa que
la variable de respuesta es 2 veces más propensa a tener un valor de I en presencia de la variable
independiente que en su ausencia. De fonna general, siendo x E {0,1} la razón OR se determina
de la siguiente manera:
rr(l) ]
[
OR = 1 - rr(l)
rr(O) ]
[ 1 - rr(O)
73
Hosmer, David; Lemeshow, Stanley. Applied Logistic Regression. Ed. Wiley, segunda edición. EUA, 2000.
74
Que puede tomar dos valores mutuamente excluyentes.
67
Los OR de la regresión logística son análogos a los coeficientes del modelo scoring con un
enfoque de ecuaciones de covarianza, correspondiendo OR > 1 a coeficientes positivos y OR < 1
a coeficientes negativos.
De manera general, puede concluirse que un cliente potencial tiene una aversión al riesgo
elevada, con al menos una póliza de automóviles y/o responsabilidad civil contratadas, con
formación universitaria y dueño de su propia casa. Sin embargo, la información disponible
muestra que estas características no son suficientes para contratar una póliza de casas rodantes, ya
que existen clientes con las mismas características que no forman parte del mercado objetivo.
Esta cualidad es propia de modelos dicotómicos 7 5, por lo que es factible clasificar la propensión a
la compra más que la certeza de ésta.
75
Hosmer, David; Lemeshow, Stanley. Applied Logistic Regression. Ed. Wiley, segunda edición. EUA, 2000.
69
tales como el uso de datos ya existentes, relación con bases de datos análogas y apoyo de
corporaciones en el diseño de modelos matemáticos; así como de sus desventajas, tales como
altos costos de implementación y mantenimiento, limitantes de variables cuantitativas y
dificultades en la desarrollo de modelos específicos para los mercados Business to Consumer.
Abordando el objetivo planteado al inicio de esta tesis de generar una metodología que
fundamentara la toma de decisiones en estrategias de mercadotecnia directa de forma sistemática
y robusta, el modelo propuesto toma los mejores aspectos de dos de las herramientas más
representativas del mercado crediticio y de las ciencias sociales: Modelos Scoring, utilizados
comúnmente para la evaluación financiera de candidatos a créditos bancarios; y modelos de
estructuras de covarianza, utilizados generalmente en estudios biológicos, médicos y psicológicos
por la flexibilidad que brindan en el estudio de variables cualitativas. La combinación de estas
dos herramientas da como resultado un modelo scoring con un enfoque de estructuras de
covarianza, el cual permite un análisis ágil y sistemático de información cuantitativa y cualitativa
del comportamiento histórico de los clientes, aplicado en esta ocasión al sustento de la toma de
decisiones en estrategias de mercadotecnia directa.
La comparación del modelo propuesto con un modelo de regresión logística muestra que
la metodología utilizada es consistente con esta técnica de análisis, la cual es ampliamente
utilizada en problemas con un enfoque médico y sociopolítico. Esta correspondencia demuestra
que el modelo propuesto presenta una robustez similar a la de otros modelos previamente
probados y utilizados en la industria. La eficacia de la predicción del modelo propuesto resultó
muy similar a la de la regresión logística, con la ventaja de que las modificaciones en el nivel Cut
Off permiten modificar el grado de discriminación que se desea alcanzar.
70
Debido a lo anterior pueden generarse tres grandes conclusiones, las cuales están dirigidas
a la utilización e interpretación de la herramienta definida en esta tesis:
8.3 Limitaciones
Como se ha mencionado a lo largo esta tesis, el modelo analizado se enfoca
exclusivamente en modelos lineales entre variables observables, factores y variables de respuesta.
Esta característica puede ocasionar que relaciones no lineales de las variables observables pasen
desapercibidas y afecten la funcionalidad del modelo, ya que generalmente existen variables cuya
interacción es significativa para el comportamiento de la variable de respuesta. Aun cuando la
introducción de factores en el modelo propuesto tiene la función de interactuar con el conjunto de
variables observables que los conforman, no existen relaciones no lineales propiamente dichas,
sino solamente proporciones definidas en que puede combinarse la información existente.
Este enfoque puede ser abordado por medio de modelos de segundo orden que consideren
también el efecto de variables combinatorias, aunque se requeriría de un estudio más extenso para
poder establecer el modelo resultante y evaluar su desempeño.
implementación de este modelo en otras áreas de una organización puede ayudar a elegir
rumbos de acción de forma rápida y basada en casos pasados, complementando la
información actualmente obtenida por medio de sistemas de inteligencia de negocios.
• Modificación de las ecuaciones lineales. El modelo actual corresponde exclusivamente a
la interacción existente entre variables observables, factores y variables de respuesta de
fonna lineal, por lo que un modelo complejo con ecuaciones no lineales pude brindar un
punto de vista distinto en la predicción de las calificaciones score de los clientes
evaluados.
Deseo que este trabajo de tesis sea de utilidad para aquellas personas y organizaciones que
se enfrentan en el día a día con tomas de decisiones ambiguas o difíciles de realizar debido a la
complejidad de la información existente. La continua evolución de los modelos predictivos, así
como de las herramientas tecnológicas que permiten su desarrollo, proporcionará oportunidades
de mejora a las metodologías existentes, o de inclusive desarrollar nuevas técnicas que ayuden a
optimizar la eficiencia de procesos mercadológicos, administrativos y productivos.
76
Vollmann, Thomas. Sistemas de planificación y control de la fabricación. Editorial lrwin. 3~ edición, 1995.
73
Anexos
ESTRATO
74
ESTLOVl>A NIÑOS
fSTILOVIOA NIÑOS
UNrvERSl)AO
c•SADO UNY'ERSIDAD
RELLBRE
í•
:.
SOLTERO EMPRENDEDOR
SOLTERO EMPRENDEDOR
75
GRANJERO TRANSPORTE
G~AO TRANSPORTE
RENTACASA SALUOPUBL
RENTACASA SALUOPUBl
OUEÑOCASA SALUOPRfV
fe'
:.
OUEÑOCASA SALUDPRIV
COCHE INGRESO
COCHE INGRESO
76
POOCOMPRA RESPCrvL
POOCOMPRA RESPCML
SEG~OAl/TO SEGUROGMM
SEGUROAU TO SEGUROGMM
~ ~
ro ro
·u ·u
e: 40% e: 40%
QI
:::,
-1 QI
:::,
-1
u 20% u
...
~ - o ....QI 20%
... - o
0% 0%
0123456789 0123456789
RELLIBRE SOLTERO
40% 60%
~
ro
·¡:¡ "'e:
·¡:¡
É
e: 40%
QI
:::, 20% -1 QI
:::, -1
u u 20%
...
~
0%
- o .......
QI
0%
- o
0123456789 0123456789
77
.............
NIÑOS UNIVERSIDAD
ta
30% ¡
40%
-~ 20% ! ---h\.- "'
·¡:¡
e:
i ·:: l~
- 1 ~ 20% - 1
u
- o C1I
- o
.t 0%
012 3 456789 01 2 3456789
PRIMARIA EMPRENDEDOR
30%
"' 20%
·g ·g 100% E
C1I
:::1
- 1 ~ 50% - 1
~ 10% u
.... - o ~ - o
0% .... 0%
O1 2 3 4 5 6 7 8 9 0123456789
GRANJERO RENTACASA
60%
f:E 0123456789
-
-
1
o
·g"' 40%
C1I
a~ 20%
....
0%
0123456789
-
-
1
COCHE SALUDPRIV
30%
- 1
·"'g 20%
C1I - 1
:::1
~ 10%
- o - o
.t 0%
0123456789 0123456789
INGRESO
100% ·- ·- · · -· ·- -·
RESPCIVIL
E
"'e:
·¡:¡
- 1 - 1
~ 50%
u
- o ~
.... - o
0%
0123456789 0123456789
SEGUROAUTO
- 1
- o
0123456789
78
Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Criterio de prueba F Núm Denom P
De Wilks 0.99365 1.135 5 888 0.340 De Wilks 0.97594 2.433 9 888 0.010
Lawley-Hotelling 0.00639 1.135 5 888 0.340 Lawley-Hotelling 0.02465 2.433 9 888 O.O IO
De Pillai 0.00635 1.135 5 888 0.340 De Pillai 0.02406 2.433 9 888 0.010
De Roy 0.00639 De Roy 0.02465
Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Criterio de prueba F Núm Denom P
De Wilks O. 98836 1.162 9 888 0.316 De Wilks 0.98337 1.669 9 888 0.092
Lawley-Hotelling 0.01177 1.162 9 888 0.316 Lawley-Hotelling 0.01691 1.669 9 888 0.092
De Pillai O.O I I 64 1.162 9 888 0.316 De Pillai 0.01663 1.669 9 888 0.092
De Roy 0.01177 De Roy 0.01691
Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Ciiterio de prueba F Núm Denom P
De Wilks 0.99200 0.796 9 888 0.620 De Wilks 0.99320 1.216 5 888 0.299
Lawley-Hotelling 0.00806 0.796 9 888 0.620 Lawley-Hotelling 0.00685 1.216 5 888 0.299
De Pillai 0.00800 0.796 9 888 0.620 De Pillai 0.00680 1.216 5 888 0.299
De Roy 0.00806 De Roy 0.00685
Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Criterio de prueba F Núm Denom P
De Wilks 0.99665 0.332 9 888 0.965 De Wilks 0.98985 1.301 7 888 0.247
Lawley-Hotelling 0.00336 0.332 9 888 0.965 Lawley-Hotelling 0.01026 1.301 7 888 0.247
De Pillai 0.00335 0.332 9 888 0.965 De Pillai 0.01015 1.301 7 888 0.247
De Roy 0.00336 De Roy 0.01026
Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Criterio de prueba F Núm Denom P
De Wilks 0.99378 0.618 9 888 0.782 De Wilks 0.98095 1.916 9 888 0.046
Lawley-Hotelling 0.00626 0.618 9 888 0.782 Lawley-Hotelling O.O I 942 l. 916 9 888 0.046
De Pillai 0.00622 0.618 9 888 0.782 De Pillai 0.01905 1.916 9 888 0.046
De Roy 0.00626 De Roy O.O 1942
79
Estadística GL
Criterio de prueba F Núm De11om P
De Wilks 0.99151 0.845 9 888 0.575
Lawley-llotelling 0.00856 0.845 9 888 0.575
De l'illai 0.00849 0.845 9 888 0.575
De Roy 0.00856
Componente
1 2
UNIVERSIDAD -.873 -.023
PRIMARIA .879 .031
RENTACASA .598 .006
RESPCIVIL -.040 .743
SEGUROAUTO -.028 .749
% de la % de la
Total varianza % acumulado Total varianza % acumulado
Gráfico de sedim,rntación
2.
1.5
.
!
o
~ 1 .0
2::,
<t
0 .5
Covariance Matrix
UNIVERSI 3.562
PRIMARIA -3.855 7.576
RENTACAS -2.205 3.541 13.143
RESPCIVI 0.023 -0.045 0.034 0.127
SEGUROAU 0.007 0.046 -0.122 0.036 0.345
CONTRATA 0.263 -0.375 -0.797 0.090 0.090 1.000
Parameter Specifications
LAMBDA-Y
ESTUDIOS RIESGO
UNIVERSI O O
PRIMARIA I O
RENTACAS 2 O
RESPCIVI O O
SEGUROAU O 3
GAMMA
CONTRATA
ESTUDIOS 4
RIESGO 5
PHI
CONTRATA
PSI
ESTUDIOS RIESGO
7 8
THETA-EPS
9 10 11 12 13
82
Number of lterations = 13
LAMBDA-Y
ESTUDIOS RIESGO
UNIVERSI 1.548
PRIMARIA -2.486
(0.199)
-12.520
RENTACAS -1.465
(0.124)
-11.824
RESPCIVI 0.197
SEGUROAU 0.194
(0.088)
2.214
GAMMA
CONTRATA
ESTUDIOS O. 134
(0.066)
2.030
RIESGO 0.480
(0.134)
3.582
ESTUDIOS 1.000
RIESGO 0.064 1.000
CONTRATA 0.134 0.480 1.000
PHI
CONTRATA
1.000
(0.032)
31.627
PSI
Note: This matrix is diagonal.
83
ESTUDIOS RIESGO
0.982 0.770
(0.085) (0.450)
11.502 1.711
ESTUDIOS RIESGO
0.018 0.230
ESTUDIOS RIESGO
0.018 0.230
THETA-EPS
Degrees of Freedom = 8
Minimum Fit Function Chi-Square = 13.332 (P = 0.1 O1)
Estimated Non-centrality Parameter (NCP) = 5.332
90 Percent Confidence Interval for NCP = (O.O ; 19 .51 O)
Standardized Solution
LAMBDA-Y
ESTUDIOS RIESGO
UNIVERSI 1.548
PRIMARIA -2.486
RENTACAS -1.465
RESPCIVI 0.197
SEGUROAU 0.194
GAMMA
CONTRATA
ESTUDIOS 0.134
RIESGO 0.480
ESTUDIOS 1.000
RIESGO 0.064 1.000
CONTRATA 0.134 0.480 1.000
85
PSI
Note: This matrix is diagonal.
ESTUDIOS RIESGO
0.982 0.770
CONTRATA
ESTUDIOS 0.134
RIESGO 0.480
Relación de IC95%
Predictor Cocf Coef. de EE z p probabilidades Inferior
Constan le -2.79624 0.576480 -4.85 0.000
UNIVERSIDAD 0.0302527 0.100993 0.30 0.765 1.03 0.85
PRIMARIA -0.0498651 0.0860492 -0.58 0.562 0.95 0.80
RENTACASA -0.128048 0.0519502 -2.46 0.014 0.88 0.79
RESPCIVIL 0.841630 0.279699 3.01 0.003 2.32 1.34
SEGUROAUTO 0.320854 0.228573 1.40 0.160 1.38 0.88
86
Predictor Superior
Constante
UNIVERSIDAD 1.26
PRIMARIA 1.13
RENTACASA 0.97
RESPCIVIL 4.01
SEGUROAUTO 2.16
Log-verosimilitud = -206.737
Probar que todas las pendientes son cero: G = 23.789, GL = 5, valor P = 0.000
Método Chi-cuadrada GL p
Pearson 682.753 588 0.004
Desviación 319.974 588 1.000
Hosmer-Lemeshow 6.541 8 0.587
Grupo
Valor 2 3 4 5 6 7 8 9 IO Total
1
Obs 3 3 4 3 4 1 5 8 9 17 57
Exp 1.6 2.4 3.1 3.7 4.3 5.1 6.1 7.3 9.7 13.6
o
Obs 98 98 98 98 97 100 97 92 91 74 943
Exp 99.4 98.6 98.9 97.3 96.7 95.9 95.9 92.7 90.3 77.4
Total 101 101 !02 IOI 101 101 102 IO0 IO0 91 1000
Medidas de asociación:
(Entre la variable de respuesta y las probabilidades pronosticadas)
Bibliografía
1. Abad, Raúl. Centro para empresas y profesionales. microsoft.com. Consultado el 02 de
febrero de 2009.
2. Agresti, Alan. An introduction to categorical data analysis. Ed. Wiley, 2007.
3. Álvarez, Rafael. Estadística multivariante y no paramétrica con SPSS. Editorial Díaz de
Santos. España, 1995.
4. Anton, Jon. Customer Relationship Management, Making hard decisions with soft
numbers. Prenctice Hall, USA, 1996.
5. Azizuddin, Mohammed. Siebel Functional Guide.
6. Barshel, Hauke. B2B versus B2C Marketing - Major differences along the supply chain
of fast moving consumer goods. Grin, 2004.
7. Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La
Muralla. Madrid, 2000.
8. Bolaños, Ricardo. Costo de adquisición de clientes. pyme.com.mx. Consultado el 02 de
febrero de 2009.
9. Bonilla, María; Olmeda, Ignacio; Puertas, Rosa. Modelos paramétricos y no paramétricos
en problemas de credit scoring. Revista Española de Financiación y Contabilidad, Vol. 32
No. 118. Julio - Septiembre 2003.
10. Bray, James; Maxwell, Scott. Multivariate Analysis of Variance. Sage University. EUA,
1985.
11. Burnett, Ken. Gestión de la relación con el cliente clave. Prenctice Hall. España, 2002.
12. Business Glossary. Barron's Educational Series, 2006.
13. Casas Guillén, Mercedes. Los modelos de ecuaciones estructurales y su aplicación en el
Índice Europeo de Satisfacción al Cliente. Facultad de Económicas - Universidad San
Pablo.
14. Deal, Barney. Lead Scoring, Marketing's answer to sales. www.searchcrm.com, 08 de
agosto de 2007.
15. Figueroa, Romeo. Cómo hacer publicidad, un enfoque teórico práctico. Editorial Pearson,
México, 1999.
16. Fiore y Collins, 2001. deltaasesores.com. Consultado el 02 de febrero de 2009.
17. García, Ignacio. CRM Gestión de la Relación con los Clientes. FC Editorial. Madrid,
2001.
18. Glosario de Mercadotecnia. www.asociacionmexicanademercadotecniadirecta.org.mx,
consultado el 25 de febrero de 2009.
19. Guitiérrez, Matías. Modelos de Credit Scoring- Qué, cómo, cuándo y para qué-. Banco
Central de la República Argentina, 2007.
20. Gutner, Toddi. Anatomy of a Credit Score. Business Week, 28 de noviembre de 2005.
21. Haas, Elizabeth. Enseñanzas de Peter Drucker. Ed. McGraw-Hill, 2007.
88
22. Hicks, Philip. Ingeniería Industrial y Administración, una nueva perspectiva. Ed. CECSA,
2002.
23. Hosmer, David; Lemeshow, Stanley. Applied Logistic Regression. Ed. Wiley, segunda
edición. EUA, 2000.
24. http://www.ssicentral.com/lisrel/history.html recuperado el 04 de Octubre de 2011.
25. http://www.ucm.es recuperado el 18 de Noviembre de 2009.
26. Hutner, Michael, et. al. Applied Linear Statistical Models. Editorial McGraw Hill.
Singapur, 2005.
27. Kaplan, Robert; Saccuzzo, Dennis. Pruebas psicológicas. Principios, aplicaciones y temas.
Ed. Thomson, México, 2006.
28. Ledesma, Rubén; Molina, Gabriel; Valero, Pedro. Análisis de consistencia interna
mediante Alfa de Cronbach: un programa basado en gráficos dinámicos. Psico USF
volumen 7, numero 2. Diciembre 2002.
29. Lescouflair, Edric. Sewall Wright: Darwin's successor - Evolutionary theorist. Harvard
College, 2003.
30. Malthouse, Edward. Shrinkage Estimation and Direct Marketing Scoring. Joumal of
Interactive Marketing, 17 de Julio de 1998
31. Nettleton, David. Análisis de datos comerciales. Ediciones Díaz de Santos. España, 2003.
32. Peña, Gustavo. La inteligencia tecnoeconómica: una ventana hacia el futuro. Espacios Vol
13 (2) 1992.
33. Ponzoa, José Manuel. Los 100 Errores del CRM. Editorial ESIC. Madrid, 2005.
34. Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com.
Consultado el 12 de febrero de 2009.
35. Scorto. www.scorto.com/spanish/credit_scoring.htm. Consultado el 12 de febrero de
2009.
36. Silva, Claudio; Schiattino, Irene. Modelos de Ecuaciones Estructurales ¿Qué es eso?.
www.cienciaytrabajo.cl
37. SSI Scientific Software Intemational. www.ssicentral.com/workshops/instructors.html
38. Stanton, William; Etzel, Michael y Walker, Bruce. Fundamentos de Marketing. Ed.
McGraw Hill, 13ª edición. México, 2006.
39. Viscencio, Hector. Economía para la toma de decisiones. Editorial Thomson, 2002.
40. Vojtek, Martin. Credit Scoring Methods. Czech Journal of Economics and Finance, 2006
41. Vollmann, Thomas. Sistemas de planificación y control de la fabricación. Editorial Irwin.
3ª edición, 1995.
42. Weber, Klaus y Sutcliffe, Kathleen. El alto costo de la información exacta. Harvard
Business Review, ISSN 0717-9952, Vol. 81, Nº. 5, 2003.
43. Wright, Sewall. The Method of Path Coefficients. The Annals of Mathematical Statistics.
Vol.5, No. 3. Septiembre 1934.