Está en la página 1de 87

:1

TECNOLÓGICO
• DE MONTERREY

Biblioteca
Clrnptm Ciudad de r.Mu:o

INSTITUTO TECNOLÓGICO Y DE ESTUDIOS


SUPERIORES DE MONTERREY
Campus Ciudad de México

Escuela de Graduados en Ingeniería y Arquitectura

Maestría en Ciencias con Especialidad en Ingeniería Industrial

Tesis de Maestría

"Modelos Scoring con un Enfoque de Estructuras de


Covarianza Aplicados a la Mercadotecnia Directa"

Autor: Ing. Gibrán Sayeg Sánchez


Asesora: Dra. Oiga López Ríos

México D.F., octubre de 2011


3

Contenido
Prólogo ............................................................................................................................................ 7

Resumen Ejecutivo .......................................................................................................................... 8

Capítulo l. Introducción y Problema ............................................................................................. 1O

1.1 Introducción ......................................................................................................................... 1O

1.2 Fundamentos del problema .................................................................................................. 11

1.3 Objetivo ............................................................................................................................... 13

1.4 Alcance de la investigación ................................................................................................. 14

Capítulo 11. Teoría y Antecedentes de Mercadotecnia .................................................................. 15

2.1 Introducción al capítulo ....................................................................................................... 15

2.2 Rol de la 1nercadotecnia ....................................................................................................... 15

2.3 Toma de decisiones mercadológicas .................................................................................... 17

2.4 Sustento de la toma de decisiones ........................................................................................ 18

2.5 Naturaleza de la información ............................................................................................... 20

2.6 CRM en la organización ...................................................................................................... 22

2.7 Limitaciones en la elaboración actual de estrategias ........................................................... 24

Capítulo 111. Fundamentos de los Modelos Credit Scoring ........................................................... 25

3.1 Introducción al capítulo ....................................................................................................... 25

3.2 Decisiones crediticias y sus similitudes con la mercadotecnia ............................................ 25

3.3 Conceptos del credit scoring ................................................................................................ 26

3.4 Scoring de aprobación ......................................................................................................... 28

3.5 Scoring de comportamiento ................................................................................................. 28

3.6 Scortng de cobranza ............................................................................................................. 28

3.7 Descripción de los modelos de regresión lineal. .................................................................. 29

3.8 Análisis mate1nático ............................................................................................................. 30

3.9 Limitaciones para su aplicación mercadológica .................................................................. 31


4

Capítulo IV. Fundamentos de los Modelos de Estructuras de Covarianza ................................... 33

4.1 Introducción al capítulo ....................................................................................................... 33

4.2 Necesidad de técnicas avanzadas de análisis ....................................................................... 33

4.3 Origen de los modelos de estructuras de covarianza ........................................................... 34

4.4 Descripción de los modelos de estructuras de covarianza .... ............................................... 35

4.5 Análisis mate,nático ............................................................................................................. 38

4.6 Limitaciones para su utilización .......................................................................................... 40

Capítulo V. Propuesta de Metodología de Análisis ....................................................................... 41

5.1 Introducción al capítulo ....................................................................................................... 41

5.2 Necesidad de una nueva metodología .................................................................................. 41

5.3 Estandarización de conceptos ............................................................ .................................. 42

5.4 Descripción de la metodología propuesta ............................................................................ 43

Capítulo VI. Desarrollo del Modelo Propuesto ............................................................................. 46

6.1 Introducción al capítulo ..................................................................... .................................. 46

6.2 Estatutos y condiciones ............................ ................................... ......................................... 46

6.3 Paso l. Etapa de Selección ................................................................................................... 48

6.4 Paso 11. Etapa de Modelación .............................................................................................. 49

6.5 Paso III. Etapa de Calificación ............................................................................................ 52

6.6 Paso IV. Etapa de Calibración ............................................................................................. 52

6. 7 Implementación del modelo .................. ........................................... ......................... ........... 56

Capítulo VII. Aplicación Práctica del Modelo Propuesto ............................................................. 57

7.1 Introducción al capítulo ....................................................................................................... 57

7.2 Caso de estudio .................................................................................................................... 57

7 .3 Etapa de selección ................................................................................................................ 5 8

7.4 Etapa de modelación ..................................................................... ....................................... 58

7.5 Etapa de calificación ............................. ............................................................................... 62


5

7.6 Etapa de calibración ............................................................................................................. 63

7 .6 Comparación del modelo con la regresión logística ............................................................ 65

Capítulo VIII. Conclusiones .......................................................................................................... 68

8.1 Interpretación del caso de estudio ........................................................................................ 68

8.2 Conclusiones de la tesis ....................................................................................................... 68

8.3 Limitaciones ......................................................................................................................... 71

8.4 Investigaciones posteriores .................................................................................................. 71

8.5 Palabras finales .................................................................................................................... 72

Anexos ........................................................................................................................................... 73

Anexo 1. Diccionario de variables ............................................................................................. 73

Anexo 2. Histogramas de variables ........................................................................................... 73

Anexo 3. Gráficos de frecuencia ................................................................................................ 76

Anexo 4. Análisis de varianza ................................................................................................... 78

Anexo 5. Análisis factorial ........................................................................................................ 79

Anexo 6. Sintaxis de Lisrel ........................................................................................................ 80

Anexo 7. Estadísticas descriptivas de calificaciones score ........................................................ 85

Anexo 8. Modelo de regresión logística .................................................................................... 85

Bibliografia .................................................................................................................................... 87
6

Tabla de ilustraciones
Ilustración 1. Gráfica del Costo de Adquisición de Clientes ......................................................... 12

Ilustración 2. Decisiones mercadológicas ..................................................................................... 16

Ilustración 3. Tipos de relaciones causales entre dos o más variables .......................................... 36

Ilustración 4. Path Diagram ........................................................................................................... 38

Ilustración 5. Metodología SEM ................................................................................................... 40

Ilustración 6. Riesgos financieros de la toma de decisiones .......................................................... 42

Ilustración 7. Matriz de confusión ................................................................................................. 52

Ilustración 8. Desplazamientos del Cut Off................................................................................... 53

Ilustración 9. Mapeo del modelo propuesto .................................................................................. 56

Ilustración I O. Path Diagram del caso de estudio .......................................................................... 61

Ilustración 11. Cambios en la matriz de confusión ....................................................................... 64

Ilustración 12. Cambios porcentuales en la matriz de confusión .................................................. 64

Ilustración 13. Matrices de confusión del caso de estudio ............................................................ 65


7

Prólogo
Es común que se relacione la Ingeniería Industrial y de Sistemas con piso de producción, sin
embargo, la influencia de esta ingeniería ha abarcado no solamente a las industrias
manufactureras, sino también al comercio y los servicios, de manera que el Ingeniero Industrial
puede aplicar sus conocimientos a procesos susceptibles de optimización en diversas ramas de la
industria.

En m1 experiencia profesional me he encontrado con distintas empresas dedicadas al


servicio que invertían grandes cantidades de recursos en la realización de campañas de
mercadotecnia directa, cuyo impacto era despreciable, Una respuesta no mayor al 2% era el logro
obtenido tras largos esfuerzos y dinero invertido, por lo que me comencé a preguntar si sería
posible encontrar un patrón o modelo matemático que permitiera elegir de forma eficaz
solamente a aquellos clientes cuya propensión al consumo fuese mayor y optimizar los recursos
utilizados en la estrategia.

Lamentablemente, pronosticar con certeza este tipo de comportamientos es imposible, por


lo que como todo proceso con riesgos asociados, al final del camino es necesario tomar una
decisión, la cual tendrá consecuencias positivas o negativas con relación a las finanzas, la
percepción del cliente o inclusive la competitividad de la organización. La única manera de
reducir el riesgo en esta toma de decisiones es contar con información veraz y oportuna, por lo
que si en las organizaciones mencionadas se contara con un modelo predictivo, la decisión de a
quién someter a mercadeo y a quien no resultaría más sencilla y menos riesgosa.

Por estas razones, además de tener un interés particular por la mercadotecnia y su relación
con la ingeniería, he decidido abordar este tema de tesis, el cual espero sea de utilidad para
lectores relacionados con la Ingeniería Industrial y de Sistemas así como con la Mercadotecnia.
8

Resumen Ejecutivo
Las empresas que mantienen relaciones comerciales directamente con los consumidores finales
suelen enfrentarse al problema de anunciar sus productos y servicios a costos competitivos que
les permitan mantener su liquidez. Lamentablemente, los medios tradicionales de mercadeo tales
como la televisión, la radio o los medios impresos generan costos excesivamente altos, que en
casos de empresas pequeñas, pueden ser inclusive superiores al nivel de facturación que estas
organizaciones podrían lograr.

Como respuesta a este dilema surge la mercadotecnia directa, una técnica que permite
dirigir la publicidad a clientes específicos seleccionados con base en sus características y
propensión de compra. Los métodos para realizar esta selección pueden modelarse
matemáticamente y existen empresas dedicadas al desarrollo exclusivo de este tipo de
herramientas; lamentablemente el costo de implementación de sus modelos generados suele ser
también demasiado elevado para los presupuestos asignados a la publicidad y mercadotecnia.

Tomando como idea central el problema mencionado, esta tesis toma los aspectos más
significativos de dos herramientas de análisis utilizadas en la industria crediticia y en las ciencias
sociales, los Modelos Credit Scoring y los Modelos de Estructuras de Covarianza. El modelo
resultante consta de 4 grandes etapas que se interrelacionan para calcular la propensión de
compra de los clientes de una organización.

• Etapa de selección: Se identifican los clientes a analizar con base en información


histórica.
• Etapa de modelación: Se desarrolla el modelo matemático bajo la forma

Donde

Y ~ Variable de respuesta
F ~ Factores de primer orden
V ~ Variables observables
r ~ Errores
9

• Etapa de calificación: Se sustituyen los valores reales de los clientes analizados en el


modelo para obtener una Calificación Score.
• Etapa de calibración: Se calcula un nivel mínimo de aceptación denominado Cut Off y se
analizan los resultados obtenidos mediante una matriz de confusión. Se realizan ajustes al
modelo en caso de ser necesario.

Para probar el modelo propuesto se analizó un caso de estudio tomado de la competencia


CoIL 2000, realizada en Estados Unidos, cuyo objetivo es identificar a aquellos clientes, tomados
de una base de datos, propensos a la contratación de un seguro de casas rodantes. Posteriormente
se compararon los resultados obtenidos con un análisis de Regresión Logística para verificar la
eficiencia de la metodología.

El modelo propuesto y su aplicación práctica llevan a la conclusión de que es factible


utilizar información cualitativa para pronosticar la propensión de compra de un cliente utilizando
las cuatro etapas descritas, sí y solo sí la interpretación de la información es correcta y el modelo
cumple con los supuestos estadísticos de variabilidad de los datos.

Finalmente, el campo de investigación se abre como un amplio panorama para continuar


con el análisis y desarrollo de este tipo de modelos que coadyuven a la toma de decisiones no
solo en las estrategias mercadológicas sino en otros ámbitos profesionales.
10

Capítulo l. Introducción y Problema

1.1 Introducción
Al lanzar una campaña mercadológica, las empresas necesitan controlar sus riesgos financieros
para incrementar sus posibilidades de éxito, ya que como mencionaba Peter Drucker, considerado
el padre de la administración, es necesario dirigir los esfuerzos hacia los riesgos correctos, los
1
cuales no son necesariamente los más pequeños. Controlar los riesgos implica necesariamente
tomar decisiones, las cuales ayudarán a coordinar eficaz111ente las estrategias a seguir dentro de
cada campaña.

Alfred P. Sloan, presidente del consejo de GM, sugiere que toda toma de decisión debe
sustentarse no sólo en la experiencia de los involucrados, sino en bases sólidas de hechos
medibles y cuantificables. 2 Lo anterior implica que son necesarios métodos duros que
proporcionen información estadísticamente tratable para fundamentar la toma de decisiones.

En la actualidad existe una gran variedad de metodologías útiles para tratar datos y
proporcionar información. Su naturaleza depende de los problemas que intentan solucionar, por
lo que es posible encontrar desde técnicas estadísticas sencillas hasta modelaciones matemáticas
complejas.

Sin embargo, la toma de decisiones enfocada a la creación de estrategias mercadológicas


es un tema tradicionalmente abordado por técnicas cualitativas y metodologías basadas en la
experiencia. Es posible adoptar una visión ingenieril 3 al introducir mediciones cuantitativas y
tratamientos estadísticos de la información, ya que la dupla ingeniería industrial - mercadotecnia
puede permitir enfoques multidimensionales y estructurados que fundamenten estas decisiones.

Esta tesis se enfocará en las estrategias men;adológicas para captación de clientes en las
organizaciones Business to Consumer4, las cuales tienen un comportamiento singular ya que el
mercado potencial contiene múltiples tipos de clientes, cada uno con distintas características. Este

1
Haas, Elizabeth. Enseñanzas de Peter Drucker. 2007, pp.212
2
Haas, Elizabeth. Enseñanzas de Peter Drucker. 2007, pp.237
3
Hicks, Philip. Ingeniería Industrial y Administración, una nueva perspectiva. 2002, pp. 361
4
Estrategia de mercado donde se interrelaciona directamente con el consumidor, en una cadena logística que
consta de fabricantes, mayoristas, minoristas y consumidores.
Barshel, Hauke. B2B versus B2C Marketing - Majar differences along the supply chain of fast moving consumer
goods. Grin, 2004.
11

comportamiento hace difícil fundamentar la toma de decisiones mediante técnicas tradicionales y


ocasiona riesgos financieros considerablemente elevados, los cuales serán explicados mediante
los siguientes conceptos:

5
• Costo de oportunidad : Se da al limitar los recursos desinados a la promoción de un
producto y no cubrir un mercado potencial nuevo. Este riesgo ocasiona pérdidas virtuales
al no percibir los beneficios de un nicho sin explotar.
• Pérdida de capital: Se da al invertir en una estrategia mercadológica más recursos que los
recuperados por consecuencia directa del esfuerzo de mercadeo. Este riesgo es causado
por cubrir un nicho de mercado con poca propensión al consumo.

Estadísticamente el riesgo de Costo de Oportunidad puede compararse con el error


estadístico alfa o Tipo 1, suponer que el nicho de mercado no explotado no traería beneficios a la
organización cuando en realidad si lo haría. Asimismo, la Pérdida de Capital puede equipararse al
error beta o Tipo 11, suponer que un nicho de mercado al cual se dirige la mercadotecnia generará
utilidades cuando en realidad se convierte en un costo hundido.

1.2 Fundamentos del problema


Existen dos tipos de relaciones entre organizaciones y clientes, Business to Business (828) y
Business to Consumer (B2C). Las organizaciones 828 son aquellas que mantienen relaciones
comerciales con otras organizaciones, generalmente sus carteras de clientes son reducidas y con
un gran volumen de venta. Las organizaciones 82C son aquellas que tratan directamente con el
consumidor final, sus carteras comerciales suelen ser más amplias y por lo regular mantienen un
pequeño volumen de venta por cliente.

Las organizaciones asignan un presupuesto definido a la generación de estrategias


mercadológicas, este oscila entre un 3% y 5% para empresas con relaciones B28; y entre 5% y
10% para empresas con relaciones B2C. 6 Esta diferencia de costos radica en la variabilidad
inherente a su mercado meta. La relación Business to Consumer tiene la peculiaridad de poseer
múltiples perfiles de mercado a los cuales es necesario tratar con estrategias específicas para
poder captar a todos los distintos tipos de clientes.

5
Viscencio, Héctor. Economía para la toma de decisiones. 2002, pp. 212
6
Abad, Raúl. Centro para empresas y profesionales. microsoft.com. Consultado el 02 de febrero de 2009.
12

La elección de la estrategia mercadológica a seguir siempre ocasiona costos, por lo que uno de
los indicadores que se utiliza para medir su efectividad es el Costo de Adquisición de Clientes 7
(CAC). Este indicador representa el costo total incurrido para que un prospecto o cliente pague
por el producto o servicio ofrecido. Generalmente, las estrategias de publicidad masiva generan
altos CAC que merman las utilidades netas de las organizaciones, mientras que la utilización de
mercadotecnia directa 8 genera menores costos. 9

Costo de Adquisición de Clientes


$1,600
$1,400
$1,200
.,,
11).
$1,000
::::,
$800
u $600
<(
u $400
$200
$-
Sistema de Publicidad Correo Re laciones Publicidad Pu blicidad
Afiliados en Línea Electrónico Públicas Impresa en Radio
II CAC $9 $21 $24 $82 $958 $1,457

Ilustración l. Gráfica del Costo de Adquisición de Clientes

La mercadotecnia directa utiliza medios de comunicación más personales y selectivos que


la mercadotecnia masiva. De esta manera, la elección del mercado objetivo se torna la actividad
más importante para lograr el éxito, de forma que es necesario cuestionarse "¿qué cliente resulta
rentable para la organización?". Mediante herramientas estadísticas complejas que provean de
información a los tomadores de decisiones mercadológicas es posible obtener una respuesta, de la
cual dependerán los costos e ingresos de la campaña.

Relacionando el CAC con los riesgos financieros antes mencionados, altos costos de
oportunidad y pérdida de capital son inherentes a una toma de decisiones no fundamentada, con
estrategias mercadológicas poco efectivas. Podría decirse que si estos riesgos son minimizados
durante una campaña de mercadotecnia directa, el CAC asociado tenderá a ser menor debido a la
optimización en la selección de prospectos.

7
Bolaños, Ricardo. Costo de adquisición de clientes. pyme.com.mx. Consultado el 02 de febrero de 2009.
8
La mercadotecnia directa es un sistema interactivo de mercadeo que emplea medios publicitarios medibles y
actividades controladas para acercarse a posibles consumidores previamente seleccionados.
Figueroa, Romeo. Cómo hacer publicidad, un enfoque teórico práctico. Editorial Pearson, México, 1999.
9
Fiare y Collins, 2001. deltaasesores.com. Consultado el 02 de febrero de 2009.
13

No obstante, las empresas B2C afrontan un grave problema al lidiar con la mercadotecnia
directa, la complejidad y el elevado costo de las herramientas actualmente disponibles suelen
disuadir a las organizaciones de su implementación. Estas herramientas, comúnmente llamadas
Marketing Scoring, requieren de la asistencia de firmas consultoras y desarrolladoras de software,
por lo que su costo asciende considerablemente dependiendo de la industria y organización en
que se apliquen.

Al prescindir de estas herramientas durante la toma de decisiones, las organizaciones


suelen realizar análisis estadísticos básicos mediante herramientas sencillas, tales como hojas de
cálculo, que no contemplan la complejidad de las variables necesarias para determinar el mercado
objetivo. Al realizar este tipo de análisis, el ahorro en la implementación de herramientas
avanzadas suele verse opacado con el elevado riesgo financiero que supone una sustentación
deficiente en la toma de decisiones.

El problema que esta tesis aborda es la actual limitación técnica y económica que las
pequeñas empresas B2C enfrentan al implementar metodologías de discriminación de clientes
potenciales durante la elaboración de estrategias de mercadotecnia directa.

Estas limitaciones ocasionan que la elección de recursos no sea óptima y se incurra en un


Costo de Adquisición de Clientes alto. A lo largo de este trabajo, se describirá como la Ingeniería
Industrial puede aportar a la Mercadotecnia conceptos y teorías útiles para la optimización del
riesgo de forma económica y práctica para los tomadores de decisiones.

1.3 Objetivo
Esta tesis tiene por objetivo desarrollar una metodología cuantitativa, que sustente de manera
eficaz la toma de decisiones para elaborar estrategias de mercadotecnia directa, las cuales
disminuyan los riesgos de pérdida de capital y costo de oportunidad asociados a la adquisición de
clientes nuevos.

Utilizar una metodología de esta naturaleza engloba distintas características del mercado y
pone al alcance de pequeñas organizaciones la modelación de sistemas complejos que ayuden a
fundamentar su toma de decisiones. Las estrategias generadas a partir de ésta, contribuirían a
minimizar el CAC, razón por la cual son relevantes para su panorama financiero organizacional.
14

1.4 Alcance de la investigación


Las estrategias mercadológicas pueden desarrollarse para una gran cantidad de objetivos
particulares y con base en diversas fuentes de información. Esta tesis abarcará las estrategias de
mercadotecnia directa enfocadas en la generación de clientes nuevos con base en información a
1
priori obtenida de bases de datos CRM º.

El enfoque metodológico a utilizar será una adaptación de dos herramientas propias de la


optimización en la toma de decisiones, los Modelos Credit Scoring y los Modelos de Estructuras
de Covarianza. La definición y conceptualización de Modelos Credit Scoring se limitará al
mercado crediticio. Asimismo se tratarán de manera genérica sin hacer alusión a ninguna
organización o software específico, sólo se considerarán los supuestos estadísticos y las
metodologías utilizadas.

La investigación realizada considerará el análisis y la crítica de los supuestos estadísticos


utilizados tradicionalmente y la propuesta de estándares aplicables al modelo sugerido de
fundamentación para la toma de decisiones, así como las recomendaciones e indicadores de
calibración.

Durante la fase de pruebas, la investigación limitará la profundidad del análisis con base
en las restricciones de los paquetes computacionales utilizados y la base de datos mostrada.
Análisis adicionales con información de mercado real no se llevarán a cabo debido a las
limitaciones existentes para la adquisición de datos. Asimismo, la metodología propuesta estará
basada en la optimización de los riesgos de pérdida de capital y costo de oportunidad bajo la
analogía de errores estadísticos tipo I y 11. Para analizar su eficacia, el modelo será comparado
contra un modelo de Regresión Logística, mostrando las similitudes y diferencias entre sus
resultados.

De acuerdo con lo estipulado anteriormente, el siguiente capítulo da inicio al análisis del


problema que esta tesis aborda, enfocándose en el riesgo financiero inherente a la toma de
decisiones para la elaboración de estrategias de mercadotecnia directa.

°
1
Customer Relationship Management. Estrategia de negocio enfocada en el consumidor que permite la medición
de comportamientos y seguimiento a cada cliente de la organización.
Anton, Jon. Customer Relationship Management, Making hard decisions with soft numbers. Prenctice Hall, USA
1996.
15

Capítulo II. Teoría y Antecedentes de


Mercadotecnia

2.1 Introducción al capítulo


Para lograr una venta es necesario cautivar al cliente, por lo que la mercadotecnia ha desarrollado
diversas maneras de lograrlo. Una de estas maneras es el mercadeo, ya sea directo o masivo, a
empresas o a consumidores finales. A continuación se presentan algunas de las herramientas
utilizadas comúnmente para desarrollar campañas de mercadotecnia directa de forma exitosa, sus
ventajas, desventajas y características principales.

2.2 Rol de la mercadotecnia


Continuamente existen intercambios entre organizaciones y personas, ya que son éstos una forma
eficiente en que el ser humano puede satisfacer sus necesidades. Sin embargo los intercambios no
se dan de forma natural, sino que las personas que conforman el mercado deben ser influenciadas
por las organizaciones para consumir sus productos. Es en esta serie de interacciones que la
mercadotecnia toma un rol de suma importancia, ya que ayuda a dirigir los esfuerzos de la
organización hacia los deseos de los clientes. Es posible definir a la mercadotecnia como un
sistema de actividades de negocios que nos ayuda a cumplir las metas de una organización,
considerando las siguientes tareas 11 :

• Planificar productos que satisfagan las necesidades del mercado.


• Asignar precios acordes a los productos comercializados.
• Promover los productos en el mercado objetivo.
• Distribuir los productos a los consumidores.

Si bien las actividades en que se enfoca la mercadotecnia son muy diversas, esta tesis se
dirige esencialmente a la promoción de productos, y de forma más específica, a la adquisición de
clientes objetivo para el consumo de dichos productos. Esta actividad es sumamente importante
debido a que en los últimos años los consumidores han demandado una orientación hacia el

11
Stanton, William; Etzel, Michael y Walker, Bruce. Fundamentos de Marketing. Ed. McGraw Hill, 13ª edición.
México, 2006.
16

mercado que satisfaga las necesidades de todos y cada uno de ellos, lo cual, debido a la
competencia y la globalización, significa un número inimaginable de distintas tendencias,
necesidades y gustos distintos para cada cliente potencial.

La situación anterior plantea dos grandes interrogantes. La primera se relaciona con las
actividades propias de la organización, "¿puede la organización impactar de manera eficiente la
mente del consumidor?" La segunda, por otro lado, se relaciona directamente con las necesidades
del mercado, "¿es el producto o servicio ofrecido lo que realmente necesito?". Si las respuestas a
ambas preguntas no son positivas es imposible concretar una venta, por lo que las organizaciones
deben utilizar técnicas y herramientas que ayuden a influenciar la mente del cliente y crear
necesidades que propicien el consumo.

Ilustración 2. Decisiones merc:adológicas

Dos de las técnicas más importantes para lograr esta influencia sobre el mercado son las
llamadas mercadotecnia masiva y mercadotecnia directa. Estos términos son usualmente
utilizados para la actividad propia de la promoción del producto o servicio, por lo que la decisión
de compra del consumidor depende en gran medida de cómo la organización las pone en práctica.
Como mercadotecnia masiva deben entenderse los medios tradicionales de promoción, tales
como medios de comunicación y espectaculares; mientras que la mercadotecnia directa se
explicará a mayor detalle en la siguiente sección, dado que en ella se basará esta tesis para el
análisis de las decisiones de una organización.
17

2.3 Toma de decisiones mercadológicas


Es común encontrar que el estudio de las decisiones mercadológicas se centra en las decisiones
efectuadas por el consumidor, ya que es él quien dirige al mercado. Pero es necesario recordar
que para que el cliente efectúe esa decisión es fundamental que las organizaciones decidan a su
vez la forma más eficiente de utilizar sus recursos para lograr influenciar al consumidor. Esta
tesis se enfoca exclusivamente en las decisiones organizacionales referentes a la adquisición de
clientes nuevos que conformen un mercado meta para un producto o servicio determinado, y de
forma más específica, a las distintas necesidades que se busca satisfacer por medio de la llamada
mercadotecnia directa.

En el capítulo anterior se mencionaba que el Costo de Adquisición de Clientes (CAC) 12 es


un indicador útil para medir los recursos utilizados en convertir a un cliente potencial en un
comprador real. Es precisamente la elección adecuada de las estrategias para adquirir nuevos
clientes la que ayuda a reducir el CAC de las campañas mercadológicas, por lo que conocer el
entorno y las características del mercado resulta necesario para realizar esta toma de decisiones.

La mercadotecnia directa es una técnica de mercadeo que supone la interrelación directa


entre el consumidor y la organización. Se caracteriza por mantener una comunicación personal
con el cliente, el cual recibe información específica de acuerdo a sus necesidades por medio de
correo electrónico, atención a domicilio o llamadas telefónicas, entre otros. Cuando para
determinar la segmentación de clientes que se expondrán a este tipo de mercadotecnia se utiliza
información histórica contenida en Bases de Datos, también se le puede llamar mercadotecnia de
bases de datos. 13 Este tipo de mercadeo es sensiblemente afectado por las decisiones
mercadológicas, ya que al dirigirse exclusivamente a un segmento reducido es relativamente
sencillo obtener un fracaso como resultado si la campaña se dirige al mercado erróneo.

La implementación de la mercadotecnia directa requiere conocimientos previos del


comportamiento y propensión de compra de los clientes para el desarrollo de estrategias, ya que
de ello dependerá la eficacia de las acciones llevadas a cabo. La identificación de los clientes
meta es, por tanto, resultado de la percepción organizacional del mercado potencial. No existen

12
Ver página 12
13
Glosario de Mercadotecnia. www.asociacionmexicanademercadotecniadirecta.org.mx. consultado el 25 de
febrero de 2009.
18

reglas específicas para segmentar clientes, sin embargo existen herramientas que pueden ayudar a
tomar estas decisiones.

SAS, empresa dedicada al desarrollo de herramientas de análisis de datos masivos,


muestra un caso ejemplo 14 de la utilización de su herramienta para segmentar clientes, donde
compara la mercadotecnia masiva con la mercadotecnia directa, siendo el resultado un
incremento del ingreso neto en casi un 33% mediante la segunda estrategia.

~ ,;. +l ·:&;1ei"Y;t!;.,tr~ ,,t;;llY Estrategia Tradici_Ó "'l Estrategia dirigida '


Envío selectivo al
Descripción Envío masivo de ofertas 30% de los
potenciales clientes
Ofertas 100,000 30,000
Respuestas 1,300 350
Tasa de Respuesta 1.30% 1.17%
Aceptaciones 220 80
Tasa de aceptación 17% 23%
Tasa deabandono 12% 8%
Ingresos Brutos 1,000,000 820,000
Costo de campaña 450,000 200,000
Costo administrativo 100,000 20,000
>\
lngrese>s Netos '1' 4.50,000 600,000

Tabla l. Caso ejemplo de SAS

La mercadotecnia directa debe adecuarse a las características del mercado potencial para
obtener beneficios, tanto comerciales como financieros, ya que la reducción del CAC depende de
la correcta selección de clientes rentables para los fines de las campañas mercadológicas. 15
Debido a esta circunstancia se requiere un profundo conocimiento de las características
principales del cliente que lo conviertan en un consumidor potencial.

2.4 Sustento de la toma de decisiones


Durante los últimos l O años, firmas consultoras y desarrolladoras de software han tratado de
satisfacer la necesidad de cuantificar la propensión de compra mediante herramientas
cuantitativas que segmentan la cartera de clientes. La mayoría de estas herramientas son

14
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
15
Malthouse, Edward. Shrinkage Estimation and Direct Marketing Scoring. Journal of lnteractive Marketing, 17 de
Julio de 1998
19

aplicables a organizaciones Business to Business (B2B), pero pueden adaptarse a organizaciones


Business to Consumer (B2C). 16

La principal herramienta de esta categoría es conocida como Lead Scoring, útil para
organizaciones con una cartera de clientes limitada u homogénea en necesidades. Esta
17
herramienta permite enfocar la fuerza de venta a los clientes con mayor propensión de compra
al segmentar a los clientes en "Leads" o pasos, los cuales se caracterizan por establecer
especificaciones de rangos de presupuesto, horizonte de toma de decisiones y nivel del tomador
18
de decisiones.

Sin embargo, al tratar con carteras de clientes más diversificadas, como las presentes en
organizaciones B2C, Lead Scoring no logra entender la complejidad de características que
presentan los consumidores. Es por esto que desde 1998 comienzan a adaptarse herramientas de
utilización crediticia, llamadas Credit Scoring para analizar la calidad - riesgo de un cliente
mediante la ponderación de características observables y la aplicación de modelos estadísticos,
que predicen el riesgo financiero. 19 Al darles un enfoque mercadológico, estos modelos cambian
de nombre a Marketing Scoring y tratan de responder a la pregunta "¿ Quién debe recibir cierta
oferta?", contraponiéndose al enfoque principal de la mercadotecnia masiva2°, en la cual las
campañas publicitarias buscan impactar una gran cantidad de personas sean o no clientes
potenciales de la organización.

En la práctica, estas herramientas reflejan una reducción en el número de contactos


requeridos para realizar una venta hasta en un 90%, generando ventajas competitivas para la
organización al aumentar su productividad. 21 Del mismo modo, el cliente puede percibir una
mejora en la calidad del servicio, fortaleciendo las relaciones comerciales y la lealtad hacia la
organización. 22 En la actualidad se ha encontrado que la lealtad y la relación existente entre
consumidor y empresa es fundamental para construir lazos sólidos y relaciones rentables para

16
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
17
Deal, Barney. Lead Scoring, Marketing's answer to sales. www.searchcrm.com, 08 de agosto de 2007.
18
Azizuddin, Mohammed. Siebel Functional Guide.
19
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
20
Malthouse, Edward. Shrinkage Estimation and Direct Marketing Scoring. Journal of lnteractive Marketing, 17 de
Julio de 1998
21
Deal, Barney. Lead Scoring, Marketing's answer to sales. www.searchcrm.com, 08 de agosto de 2007
22
Malthouse, Edward. Shrinkage Estimation and Direct Marketing Scoring. Journal of lnteractive Marketing, 17 de
Julio de 1998
20

23
ambas partes , por lo que las tendencias buscan mantener relaciones estrechas con todos los
clientes, comprendiendo sus motivadores de compra)' las necesidades existentes en el mercado.

No obstante, realizar una selección específica de clientes objetivos implica grandes costos
24
de inversión, operación y mantenimiento , lo que puede afectar el flujo financiero cuando las
organizaciones no logran generar volúmenes de venta suficientes para absorber estos costos. Esta
situación es común en empresas pequeñas, por lo que muchas veces es imposible aplicar
herramientas avanzadas de análisis tales como el Marketing Scoring sin impactar negativamente
las economía de estas organizaciones.

2.5 Naturaleza de la información


Para generar estrategias de mercadotecnia directa es importante analizar datos relevantes para
sustentar la toma de decisiones, pero es también esencial que su origen garantice la calidad de la
información obtenida. Los datos pueden provenir de diversas fuentes de información y presentar
distintos comportamientos, por lo que es necesario distinguir qué tipos de datos son útiles para
estudiar el comportamiento del mercado y estructurar un perfil de compra. 25

Existen fuentes de información internas y externas, cada una de ellas con distintas
implicaciones de costo y funcionalidad. La elección de la fuente adecuada para sustentar la toma
de decisiones dependerá del tipo de análisis que se desea realizar, el presupuesto asignado y la
disponibilidad.

Las fuentes externas de información contemplan bases de datos de terceros, publicaciones


gubernamentales e información teórica de libros y revistas, entre otros. 26 Generalmente este tipo
de información tiene un costo relacionado a su especificidad, por lo que su enfoque puede no ser
lo suficientemente dirigido para sustentar una toma de decisiones.

Las fuentes internas de información son aquellas provenientes de la misma organización o


de terceros contratados por ésta. Contempla estudios de mercado, bases de datos internas y

23
Stanton, William; Etzel, Michael y Walker, Bruce. Fundamentos de Marketing. Ed. McGraw Hill, 13ª edición.
México, 2006.
24
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
25
Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com. Consultado el 12 de febrero de
2009.
26
Peña, Gustavo. La inteligencia tecnoeconómica: una ventana hacia el futuro. Espacios Vol. 13 (2) 1992.
21
27
encuestas de servicio al cliente, entre otros. Sus principales ventajas son la facilidad para
obtenerse y su disponibilidad. Sin embargo, su alcance puede ser limitado y significativo sólo
para el entorno organizacional.

Klaus Weber, profesor asociado de la Escuela de Administración en la Universidad de


Kellogg, y Kathleen Sutcliffe, profesora de la Escuela de Administración de Negocios en la
Universidad de Michigan, comentan que la exactitud de la información no es tan relevante como
28
su interpretación y capacidad de análisis. Esto sugiere que la toma de decisiones puede
enfocarse en datos obtenidos a un bajo costo, siempre y cuando permitan su estudio cuantitativo y
cualitativo de manera eficaz. Para fines de la mercadotecnia directa, la información requerida
debe abarcar las características generales del mercado objetivo, considerando todas las posibles
combinaciones de datos existentes. Las fuentes de información que pueden contener estas
variables son comúnmente internas, ya que recopilan su contenido directamente del entorno
organ izacional.

Gracias a los avances tecnológicos de las últimas dos décadas, las organizaciones han
podido utilizar Bases de Datos para almacenar toda la información relacionada no solamente con
la empresa misma, sino también con el mercado, de manera que conforman una de las fuentes de
información internas que pueden proporcionar información histórica del desempeño en una
organización. Al almacenar el historial de cada uno de los clientes, permiten analizar diversas
variables y características que influyen en su propensión de compra, algunas de ellas se muestran
en la tabla a continuación.

Características Características Características Características de


geográficas demográficas socioeconómicas mercado
País Edad Nivel de estudios Nivel de compra
Estado Sexo Ingreso Frecuencia de compra
Ciudad Nacionalidad Tipo de vivienda Gasto promedio
Localidad Estado civil Autos propios Estacionalidad
C lima Ocupación Gasto promedio Artícu los adquiridos
Altura Número de familiares Nivel de crédito Antigüedad
Tabla 2. Variables de Bases de Datos

27
Peña, Gustavo. La inteligencia tecnoeconómica: una ventana hacia el futuro. Espacios Vol. 13 (2) 1992.
28
Weber, Klaus y Sutcliffe, Kathleen. El alto costo de la información exacta. Harvard Business Review, ISSN 0717-
9952, Vol. 81. N!!. 5, 2003 , págs. 56-64
22

Las variables mencionadas no son exhaustivas y no existe una metodología única para
seleccionar las variables adecuadas, por el contrario, cada estrategia mercadológica requiere del
análisis de distintas variables. Dentro de las organizaciones B2C, es común encontrar un
departamento a cargo de la recolección de estos datos, comúnmente denominado CRM.

2.6 CRM en la organización


29
CRM son las siglas en inglés de Customer Relationship Management y se refieren a la
estrategia de negocio que implica la gestión automatizada de todos los puntos de contacto con el
cliente, permitiendo su captación, retención y desarrollo de lealtad efectivas. 30 Esta estrategia
permite dar seguimiento al cliente durante toda su vida en la organización, cuantificar su grado de
lealtad o bien generar alertas previas a su salida de la cartera de clientes, de manera que el
fortalecimiento de las relaciones existentes con cada uno de los clientes de la organización
coadyuve a la retención y a incentivar compras futuras de productos actuales o nuevos. 31

Si bien el desarrollo de una estrategia CRM en una organización depende de los objetivos
que se pretenden lograr, existen 3 grandes denominaciones 32 para los usos designados de la
información obtenida:

• CRM operacional: tiene como objetivo realizar de forma eficiente las operaciones de
rutina relacionadas con el servicio al cliente, tales como calendarizar citas, dar
seguimiento a compras realizadas y generar campañas de tele marketing.
• CRM analítico: tiene como objetivo evaluar toda la información disponible de cada
cliente, tal como compras realizadas, historial de pago y opiniones previas. Con esta
información es posible evaluar indicadores de servicio y financieros relacionados con
cada uno de los clientes, así como generar patrones de lealtad y satisfacción.
• CRM de colaboración: tiene como objetivo facilitar la comunicación de dos vías entre el
mercado y la organización mediante herramientas como chal rooms, correos electrónicos
y redes sociales, entre otros.

29
Generalmente se asocia erróneamente el concepto de CRM con el software que ayuda a gestionar las relaciones
con el cliente.
Burnett, Ken. Gestión de la relación con el cliente clave. Prenctice Hall. España, 2002.
30
García, Ignacio. CRM Gestión de la Relación con los Clientes. FC Editorial. Madrid, 2001.
31
Anton, Jon. Customer Relationship Management, Making hard decisions with soft numbers. Prenctice Hall, USA
1996.
32
Stanton, William; Etzel, Michael y Walker, Bruce. Fundamentos de Marketing. Ed. McGraw Hill, 13ª edición.
México, 2006.
23

La elección del CRM a utilizar se realiza según el criterio de cada organización y


generalmente se asigna a un departamento específico las actividades relacionadas con su
funcionamiento. Este departamento gestiona toda la relación con la cartera de clientes y registra
los datos más significativos de su actividad histórica para cumplir con los objetivos de la
estrategia. A continuación se muestra una tabla ejemplo de informes posibles originados por el
CRM de una organización de ventas por internet. 33

Aplicación Query
Clientes que han comprado múltiples productos
Fidelización del Cliente
C lientes con mayor número de visitas
Ventas on line por mes comparadas con las totales
Rentabilidad del Cli ente
Información on line y off line relacionada del cliente
Visitas recibidas como consecuencias de publicidad on line
Análisis Click Stream Número de páginas visitadas por cliente
Páginas de entrada y salida más utilizadas
Reclamaciones de c li entes por tipo comercial y región
T iempo medio de resolución de una reclamación en Call
Servicio al Cliente
Center
Informes por producto y organización de servicios
Informe de resultado de las ventas correspondientes a las
Gestión de Campañas de promociones existentes
Mercadeo Volumen de ventas durante periodo promociona! y no
promociona!
Tabla 3. Ejemplo de CRM

El almacenaje de la información recopilada durante una estrategia CRM es realizado


mediante bases de datos, por lo que se le llama Data Base Marketing. Su finalidad es
proporcionar la mayor cantidad de información del cliente con un mínimo de entradas, es decir,
34
las bases de datos se alimentan de la operación diaria y del trato cotidiano con los clientes.

Gracias a esta versatilidad, las bases de datos CRM analíticas contienen variables útiles
para obtener información referente a la propensión de compra de sus clientes, la cual puede
aplicarse a estrategias de mercadotecnia directa. El modelo que se sugerirá a lo largo de este
trabajo contempla este tipo de CRM debido a su funcionalidad y disponibilidad de datos clave del
mercado existente. Sin embargo, se requiere analizar a detalle esta información para determinar la
significancia y utilidad de sus variables, por lo que las herramientas tradicionales pueden no
explicar la complejidad real del mercado, mermando las ventajas que se pueden obtener de la
mercadotecnia directa.

33
García, Ignacio. CRM Gestión de la Relación con los Clientes. FC Editorial. Madrid, 2001.
34
Ponzoa, José Manuel. Los 100 Errores del CRM. Editorial ESIC. Madrid, 2005.
24

2. 7 Limitaciones en la elaboración actual de estrategias


Actualmente existen metodologías y herramientas útiles para elaborar estrategias de
mercadotecnia directa. Sin embargo, tienen dos grandes limitantes que impiden su utilización en
organizaciones B2C:

• Su construcción es demasiado compleja y requiere de personal experto que las adecúe y


mantenga.
• Su costo es demasiado alto ya que se invierte en infraestructura, asesoría y servicio de
firmas expertas.

Actualmente existen diversas metodologías capaces de tratar grandes cantidades de


información de forma estandarizada y económica, tales como la minería de datos, las redes
35
neuronales y el clustering de datos, entre otros. Cada una de estas metodologías ayuda a
analizar datos masivos utilizados para distintos fines estratégicos en diversos ámbitos de negocio.

Una de las disciplinas que más ha explotado estas herramientas es el mercado crediticio,
con los llamados Credit Scoring. Estos modelos son relativamente similares a las herramientas
utilizadas por la mercadotecnia, por lo que es factible adecuarlos a los modelos de Marketing
Scoring para ser utilizados en estrategias de mercadotecnia directa. Adicionalmente, la
implementación y desarrollo de estos modelos puede realizarse de forma sencilla gracias a que su
amplia utilización ha ayudado a difundir información acerca de su naturaleza y de las diversas
técnicas utilizadas para su generación.

En el siguiente capítulo se analizarán los modelos Cresit Scoring utilizados en


instituciones financieras, de manera que sus semejanzas con las campañas de mercadotecnia
directa ayudarán a definir los fundamentos de una metodología que facilite la toma de decisiones
para la elaboración de estrategias mercadológicas.

35
Nettleton, David. Análisis de datos comerciales. Ediciones Díaz de Santos. España, 2003.
25

Capítulo 111. Fundamentos de los Modelos


Credit Scoring

3.1 Introducción al capítulo


Las instituciones crediticias enfrentan retos similares a la selección de clientes para mercadeo
directo, ya que la minimización de sus riesgos financieros depende de la correcta elección de
clientes a quienes otorgar un crédito. Una de las herramientas más utilizadas para fundamentar
esta toma de decisiones es el Credit Scoring, cuya definición y funcionamiento general se explica
a lo largo de este capítulo.

3.2 Decisiones crediticias y sus similitudes con la


mercadotecnia
Una organización crediticia lleva a cabo diversas operaciones, tales como la apertura de cuentas,
otorgamiento de créditos, modificaciones en el límite de crédito, acceso a nuevos productos y
beneficios o bien la cobranza de saldos moratorias. Estas actividades requieren de una toma de
decisiones previa para llevarse a cabo, es durante esta fase que el riesgo potencial se controla y se
optimiza la ganancia esperada.

El Credit Scoring es la herramienta utilizada por este tipo de instituciones para


fundamentar su toma de decisiones de una manera ágil y eficiente, con el objetivo de reducir la
morosidad esperada en sus clientes. Este objetivo es análogo al de la mercadotecnia directa, la
cual busca reducir el CAC de sus campañas. La siguiente tabla relaciona algunos de los
componentes similares entre ambas disciplinas.
26

Concepto Mercadotecnia directa Crédito a personas físicas


Tipo de -:licnk:-, i,Oué cii,:;1Lc--; dchc11 recibir un
'
decisiones ._·, 1n"ídcr,ir-;c ._'n L1 crcdit()'_'
¿Qué clientes son propensos a ¿Qué clientes pueden acceder
la compra de un producto o a otros productos?
servicio? <,()ué el icl1lL''> ckh..::11 ser
rcmítid,h c1 cubranz:l'.)
Tipo de mercado ('[)CP!.CS dÍVL'.l'"i;_lS Diversas necesidades de
Compras al por menor crédito
( ·,m1crn1·,1 Ícd" (1nk,h Sen íci,1s cspccialízadíl,
Patrones definidos de Características únicas
comportamiento 1lisl(,rÍa ctdilicia
Tipo de riesgo Custo de qinnunid:1d Morosidad
Pérdida de capital Cuentas perdidas
Saldos incobrables
Enfoque al Cliente" imhidu:ik:-, Clientes indivídudlc<;
problema Características de consumo Historial crediticio sano
Tabla 4. Similitud entre mercadotecnia directa y crédito a personas fijas

Tanto la mercadotecnia directa como el crédito a personas fisicas deben manipular


información característica de cada cliente para realizar la toma de decisiones, con base en la
historia del mercado en general. Esta perspectiva de lo general a lo particular es la piedra angular
de los modelos Credit Scoring.

3.3 Conceptos del credit scoring


Un modelo de Credit Scoring es un algoritmo matemático que evalúa el riesgo de forma
automatizada, definiendo si un individuo es bueno o malo mediante el análisis objetivo de las
características únicas de los clientes. Posteriormente el algoritmo asigna una calificación o score
dentro de un espacio de referencia. Por ejemplo, un score de 350 puede significar que el sujeto de
estudio se encuentra en el nivel 350 de una escala de 200 a 800, donde 200 corresponde a mayor
riesgo y 800 a menor riesgo. En este ejemplo, el hecho de que el individuo analizado sea un
cliente bueno o malo depende de la postura de la organización, ya que el resultado del modelo
36
Credit Scoring no tiene una interpretación única y funciona sólo como un sistema de referencia.

La identificación de los individuos como clientes buenos o malos está sujeta a la


asignación de un Cut Off del modelo, es decir, un límite dentro de la escala de referencia que

36
Gutiérrez, Matías Alfredo. Modelos de Credit Scoring - Qué, cómo, cuándo y por qué - . Banco Central de la
República Argentina. Octubre de 2007.
27

divida el rango de los clientes buenos del rango de los clientes malos. Un score por encima del
Cut Off significa que el sujeto de estudio es un cliente bueno y generalmente se le es asignado el
37
crédito. En el ejemplo anterior, si el Cut Off fuese de 400, significaría que el cliente se
encuentra en el rango 200 a 400, es decir de clientes malos, al haber obtenido un score de tan sólo
350.

No existen rangos de seores o Cut Off predefinidos, sino que cada organización establece
su propio espacio de referencia, de acuerdo a sus necesidades y sus posturas con respecto al
riesgo. La media de las organizaciones crediticias utiliza rangos de 300 a 850 puntos con un Cut
Off de 723, pero no es un estándar que deba seguirse en todas la~ organizaciones. 38
Generalmente, las organizaciones con mayor aversión al riesgo, establecerán un Cut Off más
elevado que las propensas al riesgo, mientras que el rango de seores dependerá de la metodología
utilizada.

Los modelos Credit Scoring surgieron desde la década de 1970, sin embargo no fueron
ampliamente difundidos y utilizados hasta la década de 1990 gracias a las nuevas herramientas de
cálculo computacional. Debido a que requieren múltiples operaciones y supuestos para cada
individuo analizado, las computadoras y el software estadístico se vuelven fundamentales para
poder hacer de los modelos Credit Scoring una herramienta de uso cotidiano en las
organizaciones. Sin embargo, aún con los adelantos tecnológicos, estos modelos no han llegado a
sustituir al juicio humano, por el contrario, funcionan como herramientas de apoyo para la toma
de decisiones, ya que los analistas utilizan su propio juicio y experiencia, ocupando al modelo
39
como una prueba a favor o en contra de su razonamiento.

Existen tres enfoques distintos a los cuales dirigir los resultados de estos modelos, clientes
nuevos, clientes existentes y clientes morosos. Para cada uno de estos enfoques el mercado
40
crediticio ha destinado un modelo diferente.

37
Business G/ossary. Barron's Educational Series, 2006.
38
Gutner, Toddi. Anatomy of a Credit Score. Business Week, 28 de noviembre de 2005.
39
Gutiérrez, Matías Alfredo. Modelos de Credit Scoring - Qué, cómo, cuándo y por qué - . Banco Central de la
República Argentina. Octubre de 2007.
40
Scorto. www.scorto.com/spanish/credit_scoring.htm
28

3.4 Scoring de aprobación


Este modelo cuantifica el riesgo asociado a las solicitudes de crédito. Es el enfoque más utilizado
por las organizaciones crediticias y trata de establecer una diferenciación entre los clientes
buenos y malos con respecto a su comportamiento pronosticado, es decir, se les aplica a clientes
potenciales que aún no forman parte de la cartera de la organización.

3.5 Scoring de comportamiento


Analiza los patrones de comportamiento histórico de los clientes existentes en la cartera actual de
la organizadón. Su utilización es muy diversa y puede ayudar a identificar la conducta futura de
cada tipo de cliente. Algunas de sus aplicaciones más comunes son:

• Riesgo crediticio: Predice la probabilidad que un cliente caiga en mora en un tiempo


determinado.
• Deserción: Identifica a los clientes cuya probabilidad de cancelar sus cuentas en un
tiempo determinado es alta.
• Rentabilidad: Ordena a los clientes por su nivel de ingreso potencial a la organización.
• Venta cruzada: Identifica a clientes ya existentes que podrían comprar nuevos productos
o utilizar determinados canales de comunicación con una alta probabilidad.

3.6 Scoring de cobranza


Segmenta en grupos similares a los clientes con diferentes niveles de insolvencia. Este modelo
discrimina a los clientes que requieren de acciones decisivas para recuperar los saldos en mora,
de aquellos clientes que no necesitan atención inmediata o bien el riesgo de que su saldo se
vuelva incobrable es bajo.

Con el paso del tiempo, los modelos han evolucionado, permitiendo a las organizaciones
adoptar el modelo más adecuado a sus necesidades. Tradicionalmente se basaban en técnicas de
análisis discriminante, pero con la introducción de nuevas tecnologías de información, han
surgido nuevas técnicas de regresión logística con modelos Probit y Logit, modelos no
29

paramétricos de suavizado, programación matemática, cadenas de Markov, árboles de decisión,


sistemas expertos, algoritmos genéticos y redes neuronales. 41

Esta diversidad permite que cada metodología se adapte a las distintas necesidades de las
42
empresas. Actualmente, uno de los métodos más utilizados es la regresión lineal, debido a la
simplicidad de su operación y la aplicabilidad en casi todas las organizaciones. 43 Debido a lo
anterior, esta tesis enfocará su marco de referencia en el estudio de los modelos Credit Scoring
con metodologías de regresión lineal buscando que la adecuación al problema estudiado se pueda
realizar de forma sencilla y con una interpretación directa de la calificación score.

3. 7 Descripción de los modelos de regresión lineal


Estos modelos basan su funcionalidad en el estudio discriminante de datos, buscando relaciones
existentes entre las variables de grupos predefinidos. 44 Generalmente, durante su aplicación en
modelos de aprobación y de comportamiento, estos grupos son clientes buenos y clientes malos,
aunque pueden existir otros grupos.

Su metodología es sistemática, con tres pasos principales que permiten iterar con la
información disponible 45 :

1. Seleccionar dos muestras de la base de datos, la primera de ellas se denomina muestra de


entrenamiento y es utilizada para obtener las funciones discriminantes. La segunda es
llamada muestra de test y es utilizada para probar el desempeño del modelo.
2. Identificar a priori los grupos o clases en que se dividen las dos muestras. Esta
clasificación puede darse de acuerdo a la estrategia de la organización y se realiza
mediante la asignación de un identificador a cada individuo.
3. Encontrar la combinación lineal de variables que maximice la variabilidad entre los
grupos y minimice la variabilidad dentro de los grupos. Esta combinación de variables se
denota como s(x) = L wkxk, donde w es el peso atribuido a cada variable x del modelo.
41
Gutiérrez, Matías Alfredo. Modelos de Credit Scoring - Qué, cómo, cuándo y por qué - . Banco Central de la
República Argentina. Octubre de 2007.
42
Gutiérrez, Matías Alfredo. Modelos de Credit Scoring - Qué, cómo, cuándo y por qué - . Banco Central de la
República Argentina. Octubre de 2007.
43
Malthouse, Edward. Shrinkage Estimation and Direct Marketing Scoring. Journal of lnteractive Marketing, 17 de
Julio de 1998
44
Vojtek, Martín. Credit Scoring Methods. Czech Journal of Economics and Finance, 2006
45
Bonilla, María; Olmeda, Ignacio; Puertas, Rosa. Modelos paramétricos y no paramétricos en problemas de Credit
Scoring. Revista Española de Financiación y Contabilidad, Vol. 32 No. 118. Julio - Septiembre 2003.
30

Al tratarse de modelos paramétricos, se utilizan datos duros que conllevan restricciones


para su correcta aplicación y funcionalidad. Para que estos modelos puedan dar resultados
46
óptimos, es necesario que se cumplan los siguientes supuestos estadísticos :

• Las k variables independientes tienen una distribución normal multivariante.


• Existe igualdad en las matrices de varianzas - covarianzas de las variables independientes
de cada uno de los grupos.
• El vector de medias, las matrices de covarianzas, las probabilidades a priori y la magnitud
del error son todas ellas variables conocidas.
• Las muestras extraídas de la población son aleatorias.

3.8 Análisis matemático


Al establecer un modelo scoring se toma en cuenta la relación lineal multivariada entre sus
elementos, ubicándose dentro de un rango de respuestas determinado, limitando así la escala de
respuestas posibles como Score de los individuos evaluados. Este rango de respuestas suele ser
binomial o nominal, dependiendo del tipo de modelo creado. Para efectos de esta tesis se
analizará el modelo binomial para simplificar su explicación.

Considérese un conjunto de respuestas posibles)., siendo este una matriz de 2 x k, con k el


número de variables a utilizar. De esa manera, el valor esperado de cada una de las variables del
modelo estaría representado por la siguiente ecuación 47 :

\;,
··~
Donde Pk es la probabilidad de que el elemento k tome valor I en el modelo. Esta
probabilidad se comporta bajo una distribución Poisson debido a la naturaleza binaria del
modelo, pero puede ser utilizado otro tipo de distribución para casos nominales.

Para formular el modelo se crea una ecuación lineal que explique la variable dependiente
Z, correspondiente a la calificación Scoring, mediante las probabilidades de ocurrencia de las
variables explicativas. Consideremos los vectores columna Xy /J, correspondientes a las variables

46
Bonilla, María; Olmeda, Ignacio; Puertas, Rosa. Modelos paramétricos y no paramétricos en problemas de Credit
Scoring. Revista Española de Financiación y Contabilidad, Vol. 32 No. 118. Julio - Septiembre 2003.
47
Guitiérrez, Matías. Modelos de Credit Scoring - Qué, cómo, cuándo y para qué-. Banco Central de la República
Argentina, 2007.
31

dependientes y su coeficiente lineal, respectivamente. La relación dada entre estas matrices se


observa de la siguiente manera:

Z=f3TX+E

Donde E(Ek) =o

E(EklXk) =O
Considerando que: pk = 13rxk
Esta ecuación establece la relación lineal existente entre cada variable independiente y la
calificación scoring del modelo, sin embargo, para estimar los valores de pes necesario optimizar
la recta resultante mediante los métodos de mínimos cuadrados o bien de máxima verosimilitud.

La interpretación del modelo resultante se basa en los valores de Z, ubicándolos en la


escala posible de la sumatoria de p y comparándose con un valor de Cut Off previamente
asignado de acuerdo a la estrategia de la organización, el cual funciona como discriminante de
clientes buenos y clientes malos.

La ecuación Z = /3 0 + {3 1 X1 + {32 X2 + ··· + f3kXk funciona como eJe fundamental del


modelo scoring, donde las probabilidades de ocurrencia de cada una de las variables
independientes agregan valor a la variable dependiente Z. La relación existente entre este score y
el nivel de riesgo que se busca optimizar está dada según la muestra y suele tener un
comportamiento no lineal.

3.9 Limitaciones para su aplicación mercadológica


Las variables utilizadas en este tipo de modelos son paramétricas y cumplen con una serie de
características esenciales para su funcionalidad, que en caso de no cumplirse pueden ocasionar
errores estadísticos que resten confiabilidad al modelo Credit Scoring. Las características
esenciales que deben presentarse en cualquier conjunto de infonnación se muestran a
continuación:

• Cuantitativas: Información numérica con unidades definidas, como tiempo, dinero,


número de solicitudes.
32

• Medibles: Puede calcularse su magnitud de manera directa, no requiere de cálculos o


suposiciones.
• Objetivas: No requiere de interpretaciones o puntos de referencia variables.
• Históricas: Tiene un comportamiento definido en el tiempo y pueden recuperarse datos
pasados.

Si se utilizaran variables que no cumplen estas características, aun cuando los supuestos
estadísticos se respeten, existirían divergencias entre la teoría del análisis discriminante y la
práctica. Estas divergencias serían producto de los datos no paramétricos que no pueden
someterse a las herramientas explicadas previamente.

Generalmente, la información relevante en las estrategias mercadológicas resulta no


paramétrica al combinar datos nominales (género, estrato social, zona geográfica) con datos
discretos (edad, número de compras, número de visitas). Este tipo de información no puede
tratarse mediante técnicas paramétricas de Credit Scoring, como lo es la regresión lineal, ya que
no cumple con al menos una de las características mencionadas anteriormente. Sin embargo,
mediante técnicas avanzadas de análisis discriminante, es posible adecuar los modelos Credit
Scoring a este tipo de información.

Existen diversas metodologías de análisis discriminante, tales como el análisis de clusters,


análisis factorial, regresión logística, entre otros 48 , pero una de ellas tiene la peculiaridad de
introducir en los modelos analizados una perspectiva confirmatoria, es decir, que evalúa si los
modelos propuestos son correctos; junto con una perspectiva predictiva, es decir, permite
cuantificar la probabilidad de ocurrencia de eventos futuros. Esta técnica es conocida como
modelos de estructuras de covarianza, los cuales se explicarán en el siguiente capítulo.

48
Álvarez, Rafael. Estadística multivariante y no paramétrica cor, SPSS. Editorial Diaz de Santos. España, 1995.
33

Capítulo IV. Fundamentos de los Modelos de


Estructuras de Covarianza

4.1 Introducción al capítulo


Utilizados desde 1970, los modelos de estructuras de covarianza han sido de gran utilidad para
estudiar fenómenos humanísticos, tales como la política y la psicología, gracias a la flexibilidad
de sus metodologías y robustez de sus resultados. A lo largo de este capítulo se explicarán los
orígenes, fundamentos y pasos para elaborar un modelo de estructuras de covarianza.

4.2 Necesidad de técnicas avanzadas de análisis


En ocasiones, es necesario analizar datos recolectados de la observación directa de fenómenos, es
decir, de aquellos en los que no es posible controlar las variables que intervienen en el proceso.
Podemos encontrar dentro de estos fenómenos los pertenecientes a las ciencias sociales y a la
· 49
ciencia del comportamiento, sin embargo su información disponible para el análisis y
modelación muchas veces no cumple con las características básicas para su tratamiento
estadístico.

La mercadotecnia directa es un ejemplo de estos fenómenos, para elaborar su estrategia es


necesario considerar variables tales como percepción, opiniones sobre un producto o servicio,
intereses o clases sociales, las cuales son más fáciles de representar desde un punto de vista
cualitativo o bien utilizando herramientas como la Escala de Likert, la cual facilita la
interpretación de este tipo de información.

El comportamiento de distintos grupos de individuos suele enfrentarse a procesos con


teoría relativamente pobre y carecer de medios para controlar experimentalmente la recolección
de información. 50 Para enfrentar este problema, una de las herramientas utilizadas son los
Modelos de Estructuras de Covarianza, también conocidos como Modelos de Ecuaciones
Estructurales.

49
Casas Guillén, Mercedes. Los modelos de ecuaciones estructurales y su aplicación en el Índice Europeo de
Satisfacción al Cliente. Facultad de Económicas - Universidad San Pablo.
50
Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
34

4.3 Origen de los modelos de estructuras de covarianza


En la década de 1970 comienzan a surgir nuevas tendencias en el análisis de datos, basadas en las
técnicas de análisis de factores existentes en aquellos años. Estas nuevas tendencias se esforzaban
por explicar las relaciones causales existentes entre variables observadas directamente del
entorno, es decir, no experimentales. Durante esta época, el genetista norteamericano Sewall
Wright 51 comienza a fundamentar este tipo de modelos explicativos en el denominado Path
Analysis5 2, una representación gráfica de las interrelaciones existentes entre diversas variables y
factores no observables. 53 Esta herramienta fonnula conjuntos de ecuaciones lineales entre
diversas variables, dotándolas de una dirección lógica representada por medio de una flecha
dirigida desde la variable de respuesta hasta la variable independiente que permite conocer su
influencia.

A partir de estos avances, Karl Joreskog 54 , estadístico sueco y profesor emérito de la


Universidad de Uppsala, comienza a hablar de los actuales Modelos de Covarianza como
modelos que describen las relaciones entre diversas variables mediante regresiones lineales que
toman en cuenta sus interrelaciones complejas. Durante el desarrollo de estas teorías surgen
distintos programas computacionales capaces de analizar las relaciones mencionadas, tales como
EQS, AMOS y LISREL, éste último desarrollado por Karl Joreskog, los cuales siguen siendo
utilizados en la actualidad y ayudan a estimar los coeficientes y valores de los modelos.

Desde sus orígenes y con la ayuda de los paquetes computacionales mencionados,


expertos investigadores han utilizado los modelos de estructuras de covarianza para analizar
fenómenos y comportamientos complejos. Dentro de los campos de estudio más recurrentes
encontramos a las ciencias sociales, la psicología y la politología, 55 quienes tienen en común el
análisis de fenómenos con múltiples variables interrelacionadas y datos cualitativos, permitiendo
la realización de evaluaciones del comportamiento de votantes, estudio del comportamiento de
grupos y análisis de tendencias sociales.

51
Lescouflair, Edric. Sewa/1 Wright: Darwin's successor - Evolutioriory theorist. Harvard Col/ege, 2003
52
El Path Analysis fue sugerido por Sewall Wright en 1918, aunque criticado por otros científicos al no comprender
los objetivos y procedimientos de esta técnica. En general se plantea como una herramienta flexible para relacionar
los coeficientes de correlación entre variables con las relaciones funcionales entre ellas. Para más información ver
Wright, Sewall. The Method of Path Coefficients. The Annals of Mathematical Statistics. Vol.5, No. 3. Septiembre
1934.
53
Silva, Claudio; Schiattino, Irene. Modelos de Ecuaciones Estructurales ¿Qué es eso?. www.cienciaytrabajo.cl
54
SSI Scientific Software lnternational. www.ssicentral.com/workshops/instructors.html
55
Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
35

4.4 Descripción de los modelos de estructuras de covarianza


Al establecer un modelo para cualquier fenómeno determinado, es necesario establecer relaciones
causales veraces y significativas para que éste sea de utilidad, 56 por lo que la correcta definición
de las variables dependientes e independientes permitirá una utilización adecuada del modelo y
un análisis correcto de sus resultados. Sin embargo, la formulación de las relaciones entre
variables no es siempre sencilla y puede complicarse tanto como la naturaleza del fenómeno
estudiado.

Existen tres tipos de relaciones bajo las cuales interactúan las variables de un modelo,
directas, indirectas y espurias. Cada uno de estos tipos de relación tiene características diferentes
y afectan de manera distinta al comportamiento del modelo.

Relación directa: se refiere a la relación existente entre una variable independiente y una
variable de respuesta en la que el efecto ocasionado no se ve modificado por ningún otra variable
de por medio.

Relación indirecta: se refiere a la relación resultante de una serie de interacciones entre


dos o más variables gracias a las cuales la variable de respuesta se ve modificada por una variable
independiente con quien no tiene una dependencia de primer nivel.

Relación espuria: se refiere a la relación existente entre dos variables al ser estas
impactadas por otras variables en común, aun cuando las variables en cuestión no tienen efecto
alguno una sobre la otra.

56
Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
36

0---+ 0 Relación causal directa

0 0 Relación causal indirecta

~
Relación causal espuria

Ilustración 3. Tipos de relaciones causalei; entre dos o más variables

Este tipo de relaciones obedecen a variables que pueden ser medidas directa o
indirectamente, aunque existe cierto tipo de variables que no puede cuantificarse mediante su
observación, sino que su magnitud responde a indicadores tanto cuantitativos como cualitativos.
Este tipo de variables son llamadas constructos, variables latentes o factores y son el resultado de
las interacciones de al menos dos variables observables. 57

Los modelos de estructuras de covarianza utilizan variables observables y variables


latentes o factores. Las variables latentes corresponden a conceptos teóricos del modelo,
cuantificables a partir de algunas variables observables que se ubican en un nivel inferior de
58
complejidad. Su utilización ayuda a simplificar la estructura del modelo al disminuir las
interacciones lineales existentes en cada nivel de detalle.

La representación de las interacciones que intervienen en el modelo es realizada mediante


el Path Analysis descrito anteriormente, el cual muestra la lógica del modelo y la estructura de las
variables. La fuerza de las interacciones definidas en el Path Analysis es representada en los
modelos de estructuras de covarianza por coeficientes calculados a partir de una relación lineal

57
Casas Guillén, Mercedes. Los modelos de ecuaciones estructurales y su aplicación en el Índice Europeo de
Satisfacción al Cliente. Facultad de Económicas - Universidad San Pablo.
58
Silva, Claudio; Schiattino, Irene. Modelos de Ecuaciones Estructurales ¿Qué es eso? www.cienciaytrabajo.cl
37

entre las variables del modelo. Bajo esta definición, puede pensarse en un modelo de regresión
lineal múltiple que calcula coeficientes regresionados, sin embargo la diferencia entre estos
modelos y lo de estructuras de covarianza radica en que éstos últimos calculan coeficientes de
trayectorias y de covarianzas, dando como resultado un conjunto de ecuaciones que describen el
comportamiento complejo del modelo. 59

60
Las características principales de los modelos de estructuras de covarianza son cinco y
pueden definirse de la siguiente manera:

1. Trabajan con constructos.


2. Consideran la verdadera complejidad de los fenómenos.
3. Consideran conjuntamente medida y predicción.
4. Introducen una perspectiva confirmatoria.
5. Descomponen covarianzas observadas, no sólo varianzas.

Para el desarrollo exitoso de los modelos de estructuras de covarianza, se requiere conocer


el marco teórico que define las interrelaciones existentes. Debido a la naturaleza confirmatoria de
estos modelos es necesario introducir datos con una estructura previa para reducir el tiempo de
procesamiento y evitar errores de cálculo. La manera más sencilla de proveer la estructura de
estas interrelaciones es mediante el conocimiento experimental o histórico de las variables
61
analizadas, aunque otro método muy eficaz es el Factor Analysis o Análisis de Factores , técnica
a partir de la cual surgieron los modelos de estructuras de covarianza y que se utiliza en un
carácter exploratorio. No obstante, aún con la utilización del análisis de factores, es muy
importante mencionar que la claridad del modelo depende directamente del conocimiento teórico
del fenómeno y de la naturaleza de las variables. 62

59
Silva, Claudia; Schiattino, Irene. Modelos de Ecuaciones Estructurales ¿Qué es eso? www.cienciaytrabajo.cl
60
Batista, Joan Manuel; Coenders, Germa. Modelas de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
61
Procedimiento estadístico para reducir la redundancia en un conjunto de puntuaciones intercorrelacionadas. Una
de sus principales técnicas, el método de componentes principales, obtiene el número de factores comunes que
pueden explicar un conjunto de puntuaciones intercorrelacionadas.
Kaplan, Robert; Saccuzzo, Den nis. Pruebas psicológicas. Principios, aplicaciones y temas. Ed. Thomson, México,
2006.
62
Casas Guillén, Mercedes. Los modelos de ecuaciones estructura/es y su aplicación en el Índice Europeo de
Satisfacción al Cliente. Facultad de Económicas - Universidad San Pablo.
38

4.5 Análisis matemático


Los modelos de estructuras de covarianza están conformados por conjuntos de ecuaciones que
establecen relaciones lineales simultáneas entre todas las variables involucradas. Estas ecuaciones
pueden representarse mediante un sistema matricial que de manera genérica se observa de la
siguiente manera:

y= a+ py + y(x +E)+ ó

Donde y = [p x 1] "7 Variables latentes

x = [q x 1] "7 Variables observables

a = [p x 1] "7 Intersecciones estructurales


p = [p x p] "7 Coeficiente de relación de variables latentes

y = [p x q] "7 Coeficiente de relación de variables latentes con observables

E = [q x 1] "7 Error de medición de variables observables

ó = [p x 1] "7 Error de estimación de variables latentes

61 ~ Y11
-Q,--- E¡

Y11 Y12
~12 ~1--- Ez

f2 >~Yzz
Yz
Yn

Ilustración 4. Path Diagram

Mantener el nivel de complejidad del modelo al mínimo permite la holgura suficiente para
garantizar se encuentren formulaciones apropiadas para el fenómeno estudiado. Por esta razón es
común fijar las intersecciones estructurales en cero, de manera que no intervengan en las
ecuaciones lineales del sistema.
39

Establecido el sistema, su afinidad debe ser medida y analizada mediante diversos

indicadores para asegurar su correspondencia con el fenómeno estudiado. La normalidad de los

datos, la confiablidad de la información y el ajuste de las regresiones lineales son las pruebas más
significativas para confirmar su verosimilitud y utilidad.

Indicador Formu la Utilidad

Confirma la consistencia interna de la


a- -k- ( 1 IS/)
. - --
- (k _1) 2 Ssum información, validando la confiabilidad
Alfa de
63
Donde de la recopilación de datos. Sus valores
Cronbach
k es el número de elementos oscilan entre O y 1, siendo 1 la máxima
S es la desviación estándar confiabilidad.

Prueba que compara el estadístico de


prueba con la distribución Chi cuadrada
Chi para comprobar la normalidad de los
Donde
64
cuadrada datos introducidos al modelo. Cuanto
O es la densidad observada
más cercano a cero, mayor
E la densidad esperada
verosimilitud.

í:f¡(xi - i)(yi -y)


<5xy = N Esta matriz determina la fuerza de las
interrelaciones entre las variables del
Matriz de Donde
modelo y desagrega la varianza total
Covarianza / es la frecuencia de cada par xy
del modelo. A mayor magnitud, mayor
x y y son las variables a relacionar
relación entre·variables.
N es el número de datos totales

Tabla 5. Indicadores

63
Ledesma, Rubén; Molina, Gabriel; Valero, Pedro. Análisis de consistencia interna mediante Alfa de Cronbach: un
programa basado en gráficos dinámicos. Psico USF volumen 7, numero 2. Diciembre 2002.
64
http://www.ucm.es recuperado el 18 de Noviembre de 2009.
40

Considerando lo anterior y para una representación sistemática, pueden considerarse seis


65
etapas de la modelación de estructuras de covarianza, representadas en el siguiente diagrama :

1. Especificación
• Conocimiento teórico del objeto de estudio

o
2. Identificación

' • Modelación de la realidad en un Path Diagram

o
3. Recolección de datos
•Recopilación de información relativa a covarianzas entre variables

o
4. Estimación
• Cálculo de indicadores

5. Diagnóstico
• Evaluación de discrepancias de los valores estimados con los valores
observados

o
6. Utilización
• Aplicación del modelo en casos reales

Ilustración 5. Metodología SEM

4.6 Limitaciones para su utilizacibn


Los modelos de estructuras de covarianza son de mucha utilidad para tratar problemas complejos
ya que permiten encontrar relaciones implícitas en el contexto de las variables y generar
constructos que simplifiquen la estructura del modelo. Sin embargo, para su correcta aplicación
en el sustento de la toma de decisiones para estrategias mercadológicas, esta metodología no
puede utilizarse por sí sola, ya que solamente permitiría conocer la estructura de decisión del
consumidor pero no formular una metodología de decisión efectiva para cualquier otro caso. Es
por esto que en el siguiente capítulo se propone una metodología que combine las técnicas
analizadas de Credit Scoring y los Modelos de Estructura de Covarianza para lograr un modelo
predictivo que ayude a comprender la propensión de compra de los clientes potenciales.

65
Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La Muralla. Madrid, 2000.
41

Capítulo v. Propuesta de Metodología de


Análisis

5.1 Introducción al capítulo


Tras analizar las características de las herramientas más utilizadas en la toma de decisiones
mercadológicas, el mercado crediticio y las ciencias sociales, es posible replantear la utilización
de dichas herramientas en un ámbito distinto, la mercadotecnia directa. El presente capítulo toma
los aspectos más relevantes de estas disciplinas y los combina para generar una metodología
especializada en la discriminación de clientes con propensión al consumo.

5.2 Necesidad de una nueva metodología


La toma de decisiones en la generación de estrategias de mercadotecnia directa depende de
muchas variables complejas que interactúan entre ellas, por lo que es dificil sustentar la toma de
decisiones con datos duros y exactos. En la práctica, se apela más a la experiencia y sentido
común para desarrollar estrategias específicas de mercadeo debido a la falta de disponibilidad de
información.

Una estrategia efectiva debe considerar los riesgos relacionados, es decir el costo de
oportunidad y la pérdida de capital. Al representar gráficamente estos riesgos se observan dos
curvas contrapuestas que determinan el costo financiero total del error de la estrategia, donde la
optimización del riesgo financiero se da al encontrar el punto de equilibrio entre ambas curvas y
seleccionar los recursos necesarios para alcanzarlo. Sin embargo esta optimización varía de
acuerdo al contexto en que se tome la decisión de la estrategia mercadológica, por ejemplo, los
recursos que se deben destinar a una botana que se comercializará dentro de una escuela primaria
es distinto a los que se utilizarán al promocionar una herramienta de alta tecnología a nivel
nacional. Por esta razón, es necesario utilizar una metodología flexible que permita adecuar
diversos entornos bajo una misma visión de solución, la cual considere tanto variables
cualitativas como cuantitativas, ya que la naturaleza del problema corresponde a una situación de
comportamiento humano.
42

Riesgo financiero de la toma de decisiones

...o
QJ I
·¡:¡
e
111
----------------- L _
e
¡.:; I
..."'
o .11
--7-¡--- - Costo de Oportunidad
o
u
,,. /: - - Pérdida de Capital

-r T
--
Cantidad de Recursos

Ilustración 6. Riesgos financieros de la toma de decisiones

5.3 Estandarización de conceptos


La metodología propuesta utilizará ciertos conceptos que es necesario definir para facilitar su
comprensión y limitar el alcance de esta tesis.

Hit: Se refiere a aquellos clientes que al ser expuestos a la mercadotecnia directa reaccionan de
manera favorable y realizan la compra o adquisición del producto o servicio promocionado.

Costo de Adquisición de Clientes (CAC): Se refiere al costo total incurrido por cliente que
·
reacciona · d"1recta, pue d e ca 1cu 1arse como CAC
a (a merca d otecma = CostoHtts
.total .
Variable: Con este término se referirá a las características inherentes de los consumidores
expuestos a la estrategia mercadológica, por ejemplo edad o género. Cada variable es única y
puede ser tanto cuantitativa como cualitativa. Este último tipo de variables se pueden medir
mediante escalas de Likert o escalas nominales.

Factor: Este término hace referencia a una variable de orden superior, conformada por otras
variables básicas y que no mantiene una conceptualización real o medible. Es el resultado de la
combinación lineal de un grupo de variables y representa una idea o concepto intangible.

Calificación Score: Se trata de una calificación arbitraria, asignada por la combinación lineal de
un grupo de variables y factores. Representa la afinidad del elemento analizado para convertirse
43

en un Hit. Por sí sola, la Calificación Score no tiene ningún significado, sino que debe ubicarse
dentro de un intervalo de referencia para que sea útil en la toma de decisiones.

Cut Off: Este ténnino se refiere a un punto específico en el intervalo de referencia en que se
ubican las Calificaciones Score. Este punto divide en dos a las posibles calificaciones: del Cut
Off en adelante se trata de Hits Pronosticados, del Cut Off hacia atrás se trata de No Hits
Pronosticados. Este punto de referencia es asignado arbitrariamente y determinará qué tan estricta
es la política de rechazos.

Clientes Buenos: Se refiere a aquellos clientes que han sido clasificados a priori como futuros hit
debido a su comportamiento histórico.

Clientes Malos: Se refiere a aquellos clientes que no han sido clasificados a priori como futuros
hit debido a su comportamiento histórico.

Hits Pronosticados: Son aquellos individuos analizados por el modelo cuyo resultado establece
que serán un Hit en la campaña mercadológica con una Calificación Score superior al Cut Off.

No Hits Pronosticados: Son aquellos individuos analizados por el modelo cuyo resultado
establece que no serán un Hit en la campaña mercadológica con una Calificación Score inferior al
Cut Off. Estos individuos, en caso de incluirse en la campaña de mercadotecnia directa, suponen
un aumento en el CAC, mas no en la respuesta esperada de compra.

5.4 Descripción de la metodología propuesta


La siguiente metodología utiliza mediciones cualitativas y cuantitativas para formular un modelo
de decisión considerando los riesgos de costo de oportunidad y pérdida de capital. La
metodología propuesta puede dividirse en cuatro grandes etapas: Selección, Modelación,
Calificación y Calibración. Cada una de ellas recurre a herramientas ya existentes en otros
ámbitos de estudios, pero serán aplicadas a la mercadotecnia directa. La descripción general de
cada una de las etapas se encuentra a continuación.

Etapa de Selección

El primer paso de la metodología consiste en definir las variables a utilizar y discriminar a


los Clientes Buenos de los Clientes Malos en la base de Datos. Al obtener esta información de
una base CRM o de un sistema similar, es relativamente sencillo hacer esta selección, ya que
44

depende de la perspectiva del negocio considerar lo que sería un Hit. Por ejemplo, una posible
definición de Cliente Bueno sería: "aquel cliente cuyas compras en un periodo de I mes posterior
a la última campaña publicitaria sean mayores a $1,000".

Definidas las variables y seleccionados los Clientes Buenos y Clientes Malos, la


información debe dividirse en dos grupos. El primero de ellos se denomina Muestra de
Entrenamiento y no debe ser mayor al 50% de la información disponible. El segundo grupo se
denomina Muestra de Test, este grupo puede estar conformado con la totalidad o una parte de la
información no utilizada en la Muestra de Entrenamiento. Ambos grupos deben ser seleccionados
de manera aleatoria y contar con la misma proporción de Clientes Buenos y Clientes Malos para
que el resto de la metodología pueda ser realizada con éxito.

Etapa de Modelación

Durante esta etapa la metodología establece las interrelaciones existentes entre las
variables definidas en la Muestra de Entrenamiento, las cuales pueden ser de naturaleza
cuantitativa o cualitativa, utilizando modelos de estructuras de covarianza. De forma conjunta, la
metodología simplifica al máximo el modelo propuesto mediante la introducción factores y
agrupación de las variables involucradas.

Como resultado de esta etapa, se obtiene un Path Diagram de las variables y factores a
considerar durante la elaboración de la estrategia de mercadeo directo, con los cálculos
correspondientes a la intensidad de las interrelaciones existentes, representado como un sistema
de ecuaciones lineales.

La principal utilidad de esta etapa consiste en la apreciación de la estructura de la


problemática y la definición de las interrelaciones representativas para introducirse en un Modelo
Credit Scoring. Gracias a esta modelación se puede definir la estructura de decisión necesaria
para optimizar los riesgos financieros en los que se incurría.

Etapa de Calificación

Esta etapa contempla los procesos para definir una Calificación Score que posteriormente
dará la pauta para definir a los Hits Pronosticados y a los No Hits Pronosticados. Utilizando el
sistema de ecuaciones obtenido en la etapa de modelación se analizan las interacciones existentes
y se determinan las variables directamente relacionadas con la propensión de compra, así como
45

su peso relativo para poder asignar una Calificación Score tanto en la Muestra de Entrenamiento
como en la Muestra de Test.

El resultado de esta etapa consiste en la cuantificación de las aportaciones que cada una
de las variables utilizadas brinda a la Calificación Score de cada elemento evaluado, ubicada
dentro de un máximo y un mínimo definidos por el mismo Modelo Scoring. A menor
calificación, menor propensión de compra; a mayor calificación, mayor propensión de compra.

Etapa de Calibración

Ésta es la última de las etapas de la metodología, en ella se define el Cut Off más
adecuado y se evalúa la funcionalidad del modelo. El Cut Off, se define de manera arbitraria, por
lo que puede establecerse según la experiencia del analista o bien tomando en cuenta las
calificaciones Score de la Muestra de Entrenamiento.

Una vez definido el Cut Off, es necesario validar el modelo con la Muestra de Test, este
proceso consiste en comparar las calificaciones de esta muestra con el Cut Off establecido y
buscar similitudes o diferencias con la Muestra de Entrenamiento. Al realizar estos pasos,
obtenemos dos grupos de calificaciones, los Hits Pronosticados y los No Hits Pronosticados.

Por último, para validar que la metodología pronostique de manera correcta el


comportamiento de los individuos analizados, los resultados se someten a una Matriz de
Confusión en las que se comparan los Clientes Buenos y Clientes Malos, definidos a priori en la
Etapa de Selección, con los Hits Pronosticados y No Hits Pronosticados, obtenidos en esta última
etapa. Sí y sólo sí los Clientes Buenos y los Hits Pronosticados se encuentran alineados, así como
los Clientes Malos y los No Hits Pronosticados, el modelo es correcto, de otra manera, es
necesario recalibrar el Cut Off o bien las interrelaciones del modelo.

Las actividades descritas anteriormente se analizarán a profundidad en el siguiente


capítulo, estableciendo los supuestos estadísticos y los pasos necesarios para la ejecución del
modelo. Si bien su aplicación se mostrará más adelante en esta tesis, las siguientes líneas son
importantes para comprender la lógica y la naturaleza de cada una de las etapas propuestas.
46

Capítulo VI. Desarrollo del Modelo Propuesto

6.1 Introducción al capítulo


A partir de los supuestos y condiciones establecidos en el capítulo anterior, se plantea paso a paso
el desarrollo de un modelo scoring con un enfoque de estructuras de covarianza que simplifique
la toma de decisiones para la generación de estrategias de mercadotecnia directa. Si bien las
herramientas utilizadas están fundamentadas en metodologías ya existentes, su utilización en un
ámbito distinto a su original plantea un gran reto para el nuevo modelo.

6.2 Estatutos y condiciones


Considérese una muestra aleatoria de n elementos no relacionados entre sí, provenientes del
sistema CRM de una organización y con información sin omisiones referente a datos de
consumidores ya existentes dentro de la cartera de clientes. La información disponible puede
incluir variables como las que se muestran en la Tabla 6.

Ram_a d_<: ~a in!o_r!D.a~ió~JI Ji o d~ <!~to~,~"". - --- - Ejemplosde


~-~- --- variables
- - -
V

.
• Tipo de vivienda
• Datos nominales • Comunidad
Social
• Estrato socioeconóm ico
• Nivel de estudios
• Ingreso anual
• Datos nominales
• Tamaño de vivienda
Económica • Datos discretos
• Autos
• Datos continuos
• Créditos otorgados
• Edad
• Datos nominales • Género
Demográfica
• Datos discretos • Estado civil
• Nacionalidad
• Tiempo desde última compra
• Datos nominales • Monto total facturado
Comercial • Datos discretos • Departamento con más compras
• Datos continuos • Producto más consumido
• Cantidad promedio de compra
• Hits anteriores
• Datos nominales
• Tiempo desde última campaña
Mercadológica • Datos discretos
• Inversión en publicidad
• Datos continuos
• Tipo de publicidad más común
Tabla 6. Información disponible en un CRM
47

La lista anterior es demostrativa mas no exhaustiva, ya que la selección de variables a


utilizar debe ser realizada por el analista de acuerdo a su conocimiento del mercado. No obstante,
toda información recopilada debe contemplar las siguientes condiciones estadísticas para
garantizar su validez dentro del modelo:

1. Comportamiento normal: Toda variable debe mantener un comportamiento cuasi


normal de manera que se adapte a las prácticas matemáticas del modelo.
2. Varianza significativa: Toda variable debe mantener una dispersión mínima entre sus
elementos que la haga significativa durante la modelación, ya que un sesgo dentro de la
muestra contribuiría a una mala estimación. Considérese un Análisis de Varianza

Multivariado (MANO V A)
66
para cada x; de manera que p ~ 0.15 67
3. Consistencia en los datos: Toda variable debe contener datos de un solo tipo, es decir,
nominales, discretos o continuos. Cualquier inconsistencia en los datos o información
faltante puede contribuir a fallas en la estimación del modelo.
4. Independencia: Todas las variables elegidas deben ser independientes entre sí, de manera
que la covarianza implícita en el modelo no se vea afectada por variables directamente
dependientes. Por ejemplo X 1 = 2X2 establece dependencia entre ambas variables.
5. Aleatoriedad: Todos los elementos de la muestra deben ser elegidos de manera aleatoria,
sin ningún orden específico y bajo ninguna relación condicional.

Siguiendo las condiciones anteriores, para mejorar el desempeño del modelo es


conveniente utilizar tamaños de muestra grandes, es decir, mayores a 100 elementos. Esta acción
facilita el comportamiento normal de la información y permite manipular de una mejor manera la
Muestra de Entrenamiento y la Muestra de Test. Conforme mayor sea la muestra, mayor será la
factibilidad del modelo, ya que al realizar aproximaciones lineales se genera un error promedio
en el pronóstico cuyo valor esperado se busca sea cero.

66
Multivariate Analysis of Variance, análisis de 2 o más variables independientes que relaciona la suma del
cuadrado de los errores con el error cuadrado medio, proporcionando un nivel de significancia mediante la
distribución F de Fisher.
Hutner, Michael, et. al. Applied Linear Statistical Models. Editorial McGraw Hill. Singapur, 2005.
67
=
P value, probabilidad de que la hipótesis nula H0 :Xi *
Xj, "ífi j no se rechace en una prueba de hipótesis con
distribución F de Fisher.
48

6.3 Paso l. Etapa de Selección


Considérese una población de p elementos denominada 8, donde p ~ 100. Esta población debe
estar ubicada dentro de una base de datos accesible y disponible bajo un sistema CRM de la
organización, conteniendo información para cada elemento de la base referente a sus
características sociales, económicas, demográficas, comerciales y mercadológicas.

Considérese también la matriz Q, con q elementos que representen las variables a


introducir en el modelo. Esta matriz puede modificarse posteriormente según el comportamiento
de las variables.

De la población 8 existente, debe elegirse una muestra .Q de n elementos la cual sea


representativa de 8 y donde n ~ 100. De esta manera, la muestra puede elegirse de la siguiente
68
forma :

Zc1-a)/22Max(o-q)2 )
n ~ Max ( E2 , 100

Donde

a~ Nivel de cofianza deseado

E ~ Error permisible expresado en proporción

o- ~ Desviación estándar poblacional

Los niveles de u y E son a elección del analista, pero puede usarse el estándar a = O.OS y
E = 0.1, siendo a el valor de la desviación estándar poblacional más alto calculado para las
diversas variables en Q.

Una vez elegida la muestra aleatoria n, se procede a la selección a priori de Clientes


Buenos y Clientes Malos. Esta selección debe registrarse en el vector columna A., donde íl(n x
1) 3 {0,1}, siendo O y 1 valores nominales correspondientes a Clientes Malos y Clientes Buenos,
respectivamente.

68
McDaniel, Carl; Gates, Roger. Investigación de Mercados. Editorial Thomson. Sexta edición. México, 200S.
49

Seleccionados los valores de A se divide n en la Muestra de Entrenamiento QE y la


Muestra de Test nr. Al seleccionar la Muestra de Entrenamiento deben tomarse en consideración
las siguientes restricciones:

• La proporción de Clientes Buenos en la Muestra de Entrenamiento debe ser igual o


semejante a la proporción de Clientes Buenos en la muestran.

• El tamaño de la Muestra de Entrenamiento no debe rebasar el 50% de los elementos en la


muestran.

nnE < 0.5


n

La Muestra de Entrenamiento elegida se utilizará para el cálculo del modelo, mientras que
la Muestra de Test para su calibración y ajustes.

6.4 Paso 11. Etapa de Modelación


De la Muestra de Entrenamiento QE se obtienen las matrices X( nnE x q ), correspondiente a los

valores de cada elemento de la muestra para cada variable considerada; y íl.nE( nnE x 1) = Y,
correspondiente a la clasificación de cada uno de los elementos de la muestra realizada a priori en
la etapa de selección.

Inicialmente es necesario seleccionar las variables representativas para el modelo.


Considérese la matriz X como q variables independientes con nnE elementos cada una de ellas, de

manera que obtengamos el conjunto {X1 ,X2 , ... ,Xq}- De esta manera, es posible realizar un
análisis MANOV A considerando el conjunto de variables para determinar su significancia ante el
modelo preliminar lineal Y = ¿ f3X. Esta discriminación permitirá utilizar sólo aquellas variables
cuya varianza aporte de manera significativa a la selección de Clientes Buenos y Clientes Malos.
so
69
Para realizar el análisis MANOVA se deben establecer las siguientes hipótesis :

h 1 : Xi * X1 para al menos un par (i,j)


Las variables significativas del modelo permitirán la formulación del Path Diagram, sin
embargo para comprender sus interrelaciones es conveniente realizar un Análisis de Factores,
también denominados Componentes Principales. Este análisis consiste en separar las variables
del modelo según su covarianza en factores. La varianza explicada por cada uno de los factores
permitirá la elección de los niveles adecuados del modelo y dependerá del juicio del analista,
dado por los valores Eigenvalues o Autovalores.

Un Eigenvalue es un indicador matricial definido por det[A - Ji!.] = O, donde al despejar


'A. (distanta a la matriz de calificación a priori) de la ecuación se obtienen los Eigenvalues de la
matriz A. Es conveniente obtenerlos mediante software estadístico especializado, el cual permite
agrupar las variables en sus Componentes Principales de manera sencilla. Esta agrupación
definirá las interrelaciones del Path Diagram.

El Path Diagrama realizar siempre tendrá como factor de orden superior a Y, partiendo de
ella las interrelaciones respectivas entre factores de primer orden y variables observables. Esta
interrelación se observa en el siguiente diagrama:

Variable latente de Variable observable Variable latente de

Tabla 7. Path diagram del modelo propuesto

69
Bray, James; Maxwell, Scott. Multivariate Analysis of Variance. Sage University. EUA, 1985.
51

Los factores permiten introducir distintos tipos de información al modelo sin incurrir en
incoherencias matemáticas, considerándose los siguientes puntos para esta propuesta:

1. Podrán definirse diversos niveles de factores, siendo los de primer orden los más cercanos
a la variable de respuesta.
2. Las interrelaciones existentes se realizarán de la siguiente manera:
a. Variable de respuesta - Factor de primer orden
b. Factor - Variable observable
c. Factor de orden superior - Factor de orden inferior
3. Los errores de cálculo de los factores se fijarán en O.O
4. El error de medición de las variables corresponderá al error estándar de la muestra.
5. Todas las relaciones existentes corresponderán a una ecuación lineal.

Ya incorporados las variables y los factores al modelo, la última actividad de esta etapa es
la cuantificación de los coeficientes de correlación, denominados ~ y y respectivamente para los
factores y las variables. Estos coeficientes son calculados mediante mínimos cuadrados
ponderados al establecer el conjunto de ecuaciones siguiente:

Y = f]y + yx + 8 + YE
:. Y= {Jy + y(x + E)
Desarrollando obtenemos el siguiente sistema:

Donde Y ~ Variable de respuesta


F ~ Factores de primer orden
V ~ Variables
E~Errores
Al resolver este sistema mediante mínimos cuadrados ponderados obtenemos los valores
de ~ y y que mejor ajusten el modelo a la muestra de entrenamiento obtenida. La solución puede
obtenerse mediante software estadístico especializado, por lo que para motivos de esta tesis no se
explicará a detalle el procedimiento de mínimos cuadrados ponderados.
52

6.5 Paso 111. Etapa de Calificación


Las matrices p y y obtenidas en la etapa de modelación representan la magnitud que aporta cada
unidad de las variables y factores a la variable de respuesta, lo que permite analizar las
calificaciones de cada elemento de las muestras QE y QT para obtener la distribución de la
Calificación Score. Esta distribución equivale a la evaluación de todas las variables utilizadas
dentro del modelo por todos y cada uno de los elementos de la muestra.

Dado que el sistema de ecuaciones de donde provienen las matrices p y y se trata de un


sistema lineal con variable dependiente A, encontramos que el rango permisible de respuestas es
ilimitado sobre todo R70 , aun cuando al tratarse de un modelo predictivo es conocido que los
valores definidos a priori tienen un comportamiento binario p. , [0,1]}. Para facilitar el análisis del
modelo y su interpretación es posible transformar el rango natural de Calificaciones Score al
multiplicar por un factor de I OO. Esta transformación permite una interpretación más natural del
modelo y elimina la necesidad de ajustes en la variable de respuesta Y al representarse como un
rango discreto de respuestas.

6.6 Paso IV. Etapa de Calibración


Calificados todos los elementos de la muestra de entrenamiento QE es posible definir el nivel
adecuado de Cut Off. Para ello se utilizará una herramienta denominada Matriz de Confusión, la
cual identifica los aciertos y errores predictivos del modelo. Esta herramienta cuenta con 4
cuadrantes, en cada uno de ellos se determina un porcentaje de acierto o error, definidos según la
siguiente figura.

Clientes
Buenos

Clientes
Malos

Hits oronosticados No hit~. nronoc;tic;:irloc;


Ilustración 7. Matriz de c,>nfusión

70
Agresti, Alan. An introduction to categorical data analysis. Ed. Wiley, 2007.
53

• El cuadrante B - H considera a aquellos clientes Buenos que fueron pronosticados como


Hits, correspondiente a los casos cuyo valor).,_ es igual a I y su calificación score superior
al Cut Off.
• El cuadrante B - NH considera a aquellos clientes Buenos que fueron pronosticados
como No Hits, correspondiente a los casos cuyo valor ).,_ es igual a I y su calificación
score inferior al Cut Off.
• El cuadrante M - H considera a aquellos clientes Malos que fueron pronosticados como
Hits, correspondiente a los casos cuyo valor).,_ es igual a O y su calificación score superior
al Cut Off.
• El cuadrante M - NH considera a aquellos clientes Malos que fueron pronosticados como
No Hits, correspondiente a los casos cuyo valor ).,_ es igual a O y su calificación score
inferior al Cut Off.

La calibración del modelo propuesto busca maximizar los valores de los cuadrantes B - H
y M - NH, los cuales corresponden a predicciones correctas de clientes Buenos y Malos,
respectivamente, aunque es posible considerar un rango de respuestas aceptables para cada
cuadrante dependiendo de la finalidad de la estrategia mercadológica. Dependiendo de la
aversión al riesgo del analista se pueden elegir distintos niveles de Cut Off: para una perspectiva
protectora, es recomendable elegir un Cut Off que identifique a la mayoría de los No Hits
Pronosticados, para una perspectiva más agresiva se buscará un Cut Off que maximice los Hits
Pronosticados. Una perspectiva conservadora busca el equilibrio entre ambos.

Perspectiva protectora

Perspectiva agresiva

Ilustración 8. Desplazamientos del Cut Off


54

Definido el nivel de Cut Off deseado, es necesario comprobar que el modelo identifica de
manera veraz casos externos a la muestra de entrenamiento. Para ello se evalúa mediante una
matriz de confusión las calificaciones score obtenidas para los elementos de la muestra de test
nT. Las matrices de confusión resultantes en ambas muestran deben ser semejantes para poder
considerar el modelo como coherente, es decir, cada uno de los cuadrantes de la matriz de
confusión de fh debe ser similar a su correspondiente con la matriz de nE.

En caso de existir diferencias entre las matrices de confusión de ambas muestras es


necesario analizar la raíz del problema, por lo que modificar ligeramente el nivel de Cut Off
utilizado para analizar ambas muestras puede ayudar a analizar el comportamiento de ambas
matrices de confusión e identificar el problema. Diferencias en los cuadrantes superiores o
inferiores de estas matrices indican una falta de coherencia en el modelo predictivo. En orden
ascendente de complejidad, las posibles causas de variabilidad se listan a continuación.

1. La relación estructural es errónea, es decir, no refleja las verdaderas interrelaciones


existentes entre variables y factores. Esta causa es probable si el error esperado de los
errores es distinto a cero, las pruebas de bondad de ajuste del modelo no son significativas
o los coeficientes de las relaciones estructurales es cercano a cero. Para solucionar esta
causa es necesario reorganizar las relaciones estructurales con base en el análisis de
factores realizado o bien de acurdo a la experiencia del analista.

2. Los factores no representan a las variables observables correctamente. Esta causa es


probable si la varianza explicada del modelo utilizando los factores existentes es menor al
70%. Para solucionar esta causa es necesario modificar el análisis factorial, ya sea rotando
los resultandos, modificando el Eigenvalue mínimo para considerar un factor o utilizando
una metodología de extracción de componentes principales diferente.

3. Las variables utilizadas no son significativas para la variable de respuesta. Esta causa es
probable si los p values de las pruebas MANOVA realizadas son mayores al nivel de
significancia deseado. Para solucionar esta causa es necesario validar que las variables
observables no sean constantes y presenten un comportamiento pseudonormal, aunque
este último puede relajarse con el fin de permitir la entrada de más variables al modelo.
SS

Modificar la escala de las variables para estandarizarlas con el resto de la muestra puede
ser necesario para garantizar su significancia.

4. Las muestras de entrenamiento y de test no son homogéneas, es decir, la proporción de


clientes buenos en ambas no es igual. Esta causa es probable si la frecuencia de clientes
buenos y clientes malos en cada uno de los grupos es distinta. Para solucionar esta causa
es necesario regenerar .QE y .QT.

5. La muestra .Q no es significativa de la población. Para solucionar esta causa es necesario


regenerar la información verificando que los datos seleccionados sean aleatorios y que el
nivel de confianza y el error utilizados para el cálculo del tamaño de muestra sean
adecuados para el volumen de la población.

Si bien estas causas no son exhaustivas, representan las razones más comunes y sencillas
de solucionar durante la implementación del modelo propuesto para cualquier estrategia de
mercadotecnia directa planteada. Es importante recordar que al trabajar con datos reales los
supuestos estadísticos aplicables pueden relajarse para permitir la libre interacción entre variables
y factores, por lo que la experiencia del analista es de suma importancia para identificar los
errores que afectan los resultados del modelo.

Una vez que ambas matrices de confusión son semejantes y no se presenta ninguno de los
errores mencionados, se puede asumir coherencia en el modelo y puede aplicarse a casos externos
a la base de datos. Sin embargo, su calibración debe realizarse de forma cotidiana para asegurar
la veracidad del modelo en todo momento, ya que el comportamiento del mercado objetivo puede
variar con respecto al tiempo introduciendo errores en el pronóstico. La frecuencia de calibración
es a elección del analista, pues depende de la variabilidad observada en el mercado, de la
constancia de los clientes y de la calidad de la información existente en la base de datos.
56

6.7 Implementación del modelo


La implementación del modelo propuesto para cualquier caso de estudio debe realizarse de forma

sistemática, por lo que la representación lógica de sus cuatro etapas se muestra en la Ilustración 9. Su

seguimiento paso a paso garantiza la obtención de resultados confiables y de fácil interpretación para la

predicción de hits y no hits durante la elaboración de una estrategia de mercadotecnia directa.

Calcular tamaño de muestra

Elegir variables significativas

Elegir nivel adecuado de Cut Off

Ilustración 9. Mapeo del modelo propuesto

Con base en este modelo, el siguiente capítulo pone a prueba el desarrollo planteado en
las secciones anteriores, basándose en información real para la ejecución de cada una de las
etapas propuestas. La utilización de software especializado facilitó el análisis de datos, aunque no
necesariamente se debe disponer de esa paquetería específica para su tratamiento.
57

Capítulo VII. Aplicación Práctica del Modelo


Propuesto

7.1 Introducción al capítulo


La aplicación del modelo propuesto es fundamental para evaluar su desempeño, no solo a nivel
metodológico sino también por su funcionalidad. Los escenarios en que puede probarse la
metodología- son muy diversos, pero en este capítulo se analizará a detalle un caso particular para
la venta de seguros de casas rodantes en Estados Unidos. Los pasos a seguir serán la selección de
muestras de entrenamiento y de test, desarrollo del modelo matemático, evaluación de ambas
muestras y comparación de resultados mediante matrices de confusión.

7.2 Caso de estudio


En el año 2000 se realizó una competencia a nivel nacional en Estados Unidos, denominada CoIL
2000, la cual consistía en la formulación de diversos modelos matemáticos que lograsen
pronosticar comportamientos, encontrar valores perdidos e identificar variables comunes
mediante la técnica de Minería de Datos.

Uno de los ejercicios presentados se adapta a las necesidades de estudio de esta tesis, pues
su problemática consiste en la predicción de clientes potenciales para la compra de un seguro
para casas rodantes. Mediante la metodología propuesta se analizará la información disponible en
la base de clientes de la compañía de seguros y se identificarán las variables necesarias para
obtener una Calificación Score respecto a la propensión de compra de este seguro en específico.

Dentro del marco conceptual de este caso, entiéndase que la correcta predicción será
crucial para llevar a cabo una campaña mercadológica dirigida a los posibles compradores. De
esta manera el CAC y los riesgos financieros estarán definidos mediante:

Costo de campaña
CAC = - - -Hits
----

Costo de oportunidad = E(Utilidad)(Pronost. MaloslClientes Buenos)


Pérdida de capital= (Costo unitario)(Pronost.BuenoslClientes Malos)
58

7.3 Etapa de selección


La compañía aseguradora del caso de estudio posee una base de datos compleja donde se registra
toda la información demográfica y comercial de sus clientes por medio de variables nominales y
discretas. Para este estudio de caso se utilizará un total de 22 variables cuya descripción completa
puede observarse en el Anexo 1.

La cantidad de datos disponibles es una muestra Q de 4000 datos, la cual ha sido


seleccionada previamente de la base de datos 0 de la compañía. De esta muestra, se toma una
muestra de entrenamiento QE de 1000 datos para analizar sus distintas variables y modelar su
comportamiento.

Las variables utilizadas en este estudio son ESTRATO, CASA, ESTILOVIDA,


CASADO, RELLIBRE, SOLTERO, NIÑOS, UNIVERSIDAD, PRIMARIA, EMPRENDEDOR,
GRANJERO, RENTACASA, DUEÑOCASA, COCHE, TRANSPORTE, SALUDPUBL,
SALUDPRIV, INGRESO, PODCOMPRA, RESPCIVlL, SEGUROAUTO y SEGUROGMM.
Para comprender la naturaleza de los datos puede observarse la siguiente tabla:

Tipo de variable Cantidad de variables


Nominal 2
Discreta 20
Tabla 8. Variables totales

Adicional a estas variables se cuenta con un conjunto CONTRATA de variables de


respuesta predefinidas, correspondiente a la matriz 1c del modelo, donde los clientes malos son
representados por O y los clientes buenos son representados por 1. La selección de clientes
buenos y clientes malos es determinada a priori según contrataciones de seguros de casas
rodantes realizadas por los clientes de la base de datos.

7.4 Etapa de modelación


Para aceptar a las variables existentes dentro del modelo, éstas deben presentar una variabilidad
inherente que se adapte a los modelos de estructuras de covarianza. Mediante el análisis de
histogramas de cada una de las variables, presentado en el Anexo 2, se observa una variabilidad
significativa en todas las variables mencionadas, excepto en SEGUROGMM, correspondiente a
la contratación de seguros de gastos médicos mayores. Esta variable presenta más de un 99% de
59

valores iguales a cero, por lo que puede eliminarse del conjunto de datos a utilizar debido a su
falta de variabilidad.

Adicionalmente, al analizar el comportamiento de pares pueden observarse tanto variables


directamente proporcionales, como conjuntos de variables complementarias, es decir, son
linealmente dependientes con una correlación negativa. Tomando en cuenta los coeficientes de
correlación siguientes puede observarse la dependencia existente entre estos pares de datos.

RENTA CASA - DUEÑOCASA: -1.000, con una significancia de O.O 1

SALUDPUBL- SALUDPRIV: -1.000, con una significancia de 0.01

ESTILOVIDA - ESTRATO: 0.993, con una significancia de 0.01

COCHE-TRANSPORTE: -0.713, con una significancia de 0.01

PODCOMPRA - ESTRATO: -0.604, con una significancia de O.O 1

Al tratarse de variables directa o inversamente relacionadas, el análisis de estos pares


puede generar inconsistencias en los modelos lineales, por lo que es recomendable seleccionar
sólo una de las variables correspondientes. Para efectos de este estudio, se contemplarán las
variables RENTACASA, SALUDPRIV, ESTRATO, COCHE.

Una vez seleccionadas aquellas variables con un comportamiento cuasi normal y sin
relaciones lineales entre ellas, es posible analizar su significancia con respecto a la variable de
respuesta Y mediante el análisis de sus distribuciones de frecuencias y estudios de Análisis de
Varianza. De esta manera, al observar las distribuciones de frecuencia de las variables de este
estudio, presentadas en el Anexo 3, se encuentra un comportamiento similar en los Clientes
Buenos y Clientes Malos de acuerdo al nivel de cada una de las variables independientes. Este
comportamiento tan correlacionado puede ocasionar errores en la interpretación del modelo, por
lo que es conveniente seleccionar solo aquellas variables que presentan una diferencia entre
ambas clases, permitiendo al análisis de covarianza a realizar identificar las características que
discriminen a los Hits pronosticados de los No hits pronosticados.

Utilizando Minitab, mediante un análisis de varianza múltiple MANOV A, se obtienen 5


variables significativas a un nivel de confiabilidad del 15%, considerando la combinación de
60

todos los factores involucrados. Las variables seleccionadas tras este análisis son
UNIVERSIDAD, PRIMARIA, RENTACASA, RESPCIVIL y SEGUROAUTO.

Las variables significativas mostradas anteriormente serán consideradas en las siguientes


fases de la metodología, omitiendo aquellas que por su comportamiento estadístico no son aptas
para considerarse en el modelo de estructuras de covarianza. El Anexo 4 muestra los resultados
del análisis de varianza realizado, el cual arroja el siguiente comportamiento.

Variables Porcentaje
Significativas 5 23%
No significativas 17 77%
Tabla 9. Variables significativas

Después de la selección previa de variables significativas, la modelación del Path


Diagram es mucho más sencilla dado que sólo se utilizará el 23% de las variables originales del
caso de estudio. De esta manera, el siguiente paso para generar el modelo consiste en encontrar
los factores o constructos adecuados, mediante un análisis de factores.

El análisis factorial de los datos fue realizado en SPSS, software estadístico que permite la
reducción de datos analizando su varianza. El Anexo 5 muestra la matriz de componentes de los 2
factores resultantes, los cuales comprenden el 60% de la varianza del modelo. Esta distribución
será utilizada por el Path Diagram para realizar el modelo de estructuras de covarianza.

Al analizar el comportamiento de los factores resultantes pueden clasificarse de acuerdo al


contexto de las variables involucradas en cada uno de ellos. Para efecto de esta tesis,
considérense los siguientes factores en las etapas siguientes del caso de estudio.

Factor Variables involucradas


UNIVERSIDAD
ESTUDIOS PRIMARIA
RENTACASA
RESPCIVIL
RIESGO
SEGUROAUTO
Tabla 10. Factores

El factor ESTUDIOS se refiere al grado de estudios del cliente, incrementa de acuerdo al


grado de preparación a nivel básico, mientras que disminuye conforme aumenta la preparación
universitaria. De igual manera, la renta de una casa se incluye dentro de este factor, existiendo
una correlación de magnitud 0.3 entre estas variables.
61

El factor RIESGO considera la aversión al riego del cliente, incrementándose al adquirir


seguros de responsabilidad civil y de automóviles.

El análisis de las variables observables y los factores obtenidos se lleva a cabo mediante
software especializado que permite generar modelos de estructuras de covarianza. La paquetería
utilizada durante el desarrollo de este trabajo fue Lisrel, un programa estadístico que existe desde
hace cerca de 18 años y que permite generar modelos complejos de esta naturaleza, razón por la
71
cual es ampliamente utilizado en estudios de psicología, biología y ciencia naturales. La sintaxis
del programa utilizado para este modelo, así como la solución arrojada, se encuentran en el
Anexo 6, donde se aprecia la interacción definida entre los elementos del modelo.

El Path diagram resultante muestra los componentes para cada nivel del modelo,
relacionados entre sí para generar un modelo lineal de covarianza. Puede observarse que los
factores se muestran en óvalos, mientras que las variables observables se encuentran a la derecha
del modelo representadas con rectángulos. CONTRATA, la variable de respuesta, se localiza en
el extremo izquierdo y su coeficiente no afecta las ecuaciones del modelo al ser de magnitud
unitaria.

IUNIVERSil---1. 17
1.50

].19

EGUROA o .31

Ilustración 10. Path Diagram del caso de estudio

71
http://www.ssicentral.com/lisrel/history.html recuperado el 04 de Octubre de 2011.
62

Al transcribir los coeficientes del modelo en un sistema de ecuaciones lineales se obtienen las
expresiones mostradas a continuación, las cuales serán utilizadas para calcular las Calificaciones
Score de los individuos analizados en el modelo.

CONTRATA= 0.134 ESTUDIOS+ 0.480 RIESGO

ESTUDIOS= 1.548 UNIVERSIDAD - 2.486 PRIMARIA - 1.465 RENTACASA

RIESGO= 0.197 RESPCIVIL + 0.194 SEGUROAUTO

7.5 Etapa de calificación


Durante esta etapa, las muestras de test QE y fh son evaluadas utilizando las ecuaciones de
covarianza resultantes, debido a la naturaleza de la información es posible obtener como
Calificación Score valores tanto negativos como positivos, generalmente de una longitud no
mayor a 1 dígito. Para facilitar la interpretación de: esta medida, se multiplica por un factor
constante que no afecte su distribución, sino solamente la magnitud de su escala; el factor
utilizado en este análisis es 1OO. Las estadísticas descriptivas de las calificaciones score de ambas
muestras se localiza en el Anexo 7, donde se observa una distribución casi simétrica, con media
en -192.32 y desviación estándar de 137.56, en la muestra de entrenamiento QE. Esta desviación
estándar tan elevada permite la variabilidad entre clientes de la muestra, por lo que al analizar
cada elemento de manera independiente se pueden apreciar combinaciones de factores distintas,
cada una con su Calificación Score correspondiente. Sin embargo, aún con esta variabilidad, la
tendencia central de QE y QT tiene una variación de tan solo 1.4%, así como su dispersión tiene
una variación de tan solo 4.5%. Para determinar la exactitud de este modelo, los análisis
posteriores confirmarán su coherencia y repetitividad en casos distintos a QE
63

7.6 Etapa de calibración


La calibración del modelo depende del nivel elegido del Cut Off, ya que la matriz de confusión
resultante se encuentra en función de la interacción entre éste y la Calificación Score. En general
la clasificación de los clientes se estratifica de la siguiente manera:

B - H H calificación score ~ cut off, A= 1


B - NH H calificación score < cut off ,A= 1
{ M - H H calificación score ~ cut off, A= O
M-NH H calificaciónscore < cut off ,A= O

Donde

B-H: Clientes buenos pronosticados como hits


B-NH: Clientes buenos pronosticados como no hits
M-H: Clientes malos pronosticados como hits
M-NH: Clientes malos pronosticados como no hits
Sustituyendo estas estratificaciones en las ecuaciones de riesgos financieros antes
mencionadas, es posible evaluar los siguientes indicadores:

Costo de oportunidad = E(Utilidad)(Pronost. MaloslClientes Buenos)


= E(Utilidad)(B - NH)
Pérdida de capital= (Costo unitario)(Pronost. BuenoslClientes Malos)
= (Costo unitario)(M - H)

De esta manera, los riesgos financieros no dependen solamente del nivel de Cut Off
elegido, sino de la utilidad por cliente esperada y el costo unitario de la campaña mercadológica.
Para efectos de análisis, considérense ambas cantidades proporcionales, de manera que el punto
óptimo de la estrategia estará dado por la intersección de las curvas B-H y M-NH en una gráfica
de Clientes vs Cut Off.
64

Las ilustraciones 11 y 12 muestran el cambio en la proporción de los estratos


mencionados a medida que se modifica el nivel de Cut Off. Nótese que los valores en el eje y
resultantes para cada nivel del Cut Off en el eje x son equivalentes a los valores arrojados por una
matriz de confusión, mostrando cada estrato la información encontrada en cada cuadrante de la
matriz.

Cambios en la Matriz de Confusión


1000 ¡- - - - - - · - - -·-····-······-·-······ ························-····

ªºº r l- - ...... .\ , . , . , , . , , ... - · -

~ 600 - B-H
~ \ I
5 400 [····-· ........,~\.---·····-·· ····-·················-···-··-·----·
I \
-B-NH

I ' M-H
20: ¡ . _.,.,, ~'. . . ,s:=----·· M-NH

-600 -400 -200 o 200 400


Cut Off

Ilustración 11. Cambios en la matriz de confusión

Cambio porcentual en la Matriz de


Confusión
120%
100%
...."'eQ¡ 80% - B-H
-~
iJ 40%
60%
-B-NH
"#.
20% M -H
0%
M -NH
-600 -400 -200 o 200 400
Cut Off

Ilustración 12. Cambios porcentuales en la matriz de confusión

En la segunda gráfica puede observarse que la intersección de las curvas B-H y M-NH se
da a un nivel de Cut Off igual a -193. En este nivel, los porcentajes de Hits y No Hits
Pronosticados que fueron acertados son superiores a aquellos que fueron erróneos, impactando
directamente a los riesgos financieros de Costo de Oportunidad y Pérdida de Capital de forma
65

positiva. Cualquier otra Calificación Score utilizada desplazaría las curvas de su punto de
equilibrio, por ende incrementando el valor del riesgo financiero total.

Una vez seleccionado el nivel de Cut Off adecuado, es necesario comparar las matrices de
confusión para ne y QT, de manera que un modelo consistente debe arrojar resultados similares
en ambas muestras, a pesar de tratarse de conjuntos distintos. Las siguientes matrices de
confusión fueron obtenidas con un Cut Off de -193 y son presentadas en porcentajes para permitir
una comparación estandarizada. Puede observarse un comportamiento similar entre ambas
pruebas, con una diferencia de -3 puntos porcentuales entre las muestras .QE y QT con relación a
los Clientes Buenos clasificados corno Hits, pero sin grandes variaciones en la evaluación general
de los datos.

Muestra de entrenamiento Muestra de test

Clientes
Buenos

Clientes
Malos

Hits No hits Hits No hits


pronosticados pronosticados pronosticados pronosticados

Ilustración 13. Matrices de confusión del caso de estudio

7.6 Comparación del modelo con la regresión logística


Si bien en la sección anterior se compararon las matrices de confusión de las muestras de
entrenamiento y de test mostrando resultados similares, es decir, probando la coherencia del
modelo, es necesario considerar otras técnicas de análisis existentes cuya factibilidad y
metodología hayan sido ya probadas por estudios anteriores para determinar la efectividad del
72
modelo propuesto. Una de estas técnicas es la regresión logística , la cual analiza los valores

72
En el capítulo 3.6 se mencionan previamente algunas técnicas de análisis existentes.
66

esperados de una variable de respuesta dada la presencia de una variable independiente en


particular. 73 La media condicional resultante se denota como 1C(x) y se ajusta a una distribución
logística, de manera que el modelo resultante es:

ef3o+f31x
E(Ylx) = rr(x) = 1 + e /3 +/3
O 1X

Donde {30 : Coeficiente de la ordenada al origen


{31 : Coeficiente de la variable independiente
Para simplificar la ecuación anterior se realiza una transformación lineal de 1C(x),
denominada transformación logit, la cual arroja un modelo lineal g(x) de la media condicional
más un error aleatorio cuya media tiende cero. Es este último modelo el utilizado durante la
regresión logística para determinar los valores esperados de la variable dependiente.

rr(x) ]
g(x) = ln [ 1 _ rr(x) = /3 0 + {3 1 x

Para un modelo con variable de respuesta dicotómica 74 , como lo es este caso de estudio
con la variable CONTRATA, existe un indicador llamado Odds Ratio (OR), también conocido
como Relación de Probabilidades, el cual determina la razón con que los valores esperados
E(Ylx) varían de acuerdo a los valores de x que toma el modelo, es decir, un OR=2 significa que
la variable de respuesta es 2 veces más propensa a tener un valor de I en presencia de la variable
independiente que en su ausencia. De fonna general, siendo x E {0,1} la razón OR se determina
de la siguiente manera:

rr(l) ]
[
OR = 1 - rr(l)
rr(O) ]
[ 1 - rr(O)

Para cuestiones de análisis, la regresión logística aplicada a los datos de la muestra de


entrenamiento QE utilizados en el modelo propuesto se realizó mediante el software estadístico
Minitab, donde sus resultados, mostrados en el Anexo 8, permiten observar una clara relación
entre el comportamiento de la variable dependiente CONTRATA y cada una de las variables
independientes UNIVERSIDAD, PRIMARIA, RENTACASA, RESPCIVIL y SEGUROAUTO.

73
Hosmer, David; Lemeshow, Stanley. Applied Logistic Regression. Ed. Wiley, segunda edición. EUA, 2000.
74
Que puede tomar dos valores mutuamente excluyentes.
67

Los OR de la regresión logística son análogos a los coeficientes del modelo scoring con un
enfoque de ecuaciones de covarianza, correspondiendo OR > 1 a coeficientes positivos y OR < 1
a coeficientes negativos.

Variable Odds Ratio (OR) Coeficiente y


UNIVERSIDAD 1.03 1.548
PRIMARIA 0.95 -2.486
RENTACASA 0.88 -1.465
RESPCIVIL 2.32 0.197
SEGUROAUTO 1.38 0.194
Tabla 11. Relación de indicadores de la regresión logística con el modelo propuesto

De la misma manera que los coeficientes y de las variables observables se relacionan


directamente con la aportación de cada variable a la propensión de compra del cliente, los
coeficientes p de los factores del modelo propuesto tienen la labor de regular dichas aportaciones
al presentarse como nivel intermedio entre las variables observables y la variable de respuesta.
Adicionalmente es posible comparar las efectividades de ambos modelos para determinar si el
modelo propuesto permite un análisis similar al de las técnicas ya existentes al evaluar los
indicadores finales de pares concordantes para la regresión logística y la matriz de confusión para
el modelo propuesto.

La regresión logística muestra una asociación de variables independientes con las


probabilidades pronosticadas de 67.3% de pares concordantes, es decir, la frecuencia de éxito con
que los Clientes Buenos son identificados. En la matriz de confusión mostrada en la Ilustración
12, se observa que el porcentaje de Clientes Buenos identificados como Hits Pronosticados es de
65%, cifra muy cercana al indicador de la regresión logística. Es importante recordar que la
matriz de confusión fue obtenida al utilizar una estrategia conservadora, pero puede variar al
utilizar niveles de Cut Off más protectores o agresivos, por lo que puede alcanzar niveles de
eficiencia tan altos como los de la regresión logística si se sacrifica la identificación de Clientes
Malos.

Estas comparaciones muestran similitudes entre ambos modelos que sugieren


correspondencias entre las predicciones de propensión de compra, evidenciando la utilidad del
modelo propuesto como herramienta efectiva para la selección de clientes potenciales, de acuerdo
a las condiciones y supuestos establecidos a lo largo de esta tesis. En el siguiente capítulo se
muestran las conclusiones resultantes del desarrollo de este trabajo, mencionando ventajas,
desventajas e investigaciones futuras relacionadas con el modelo propuesto.
68

Capítulo VIII. Conclusiones


8.1 Interpretación del caso de estudio
El caso de estudio presentado brinda información referente al comportamiento del consumidor de
seguros para casas rodantes, basada en las muestras disponibles de clientes históricos en la
organización bajo análisis. Puede observarse que las variables de interés para seleccionar posibles
contratantes de este tipo de seguros están segmentadas en dos grandes agrupaciones, variables
relacionadas con la preparación académica del cliente y variables relacionadas con su aversión al
riesgo. La combinación lineal de estas agrupaciones genera un indicador de propensión al
consumo, denominado Calificación Score, el cual es comparado con una constante arbitraria
denominada Cut Off para detenninar la clasificación del cliente.

De manera general, puede concluirse que un cliente potencial tiene una aversión al riesgo
elevada, con al menos una póliza de automóviles y/o responsabilidad civil contratadas, con
formación universitaria y dueño de su propia casa. Sin embargo, la información disponible
muestra que estas características no son suficientes para contratar una póliza de casas rodantes, ya
que existen clientes con las mismas características que no forman parte del mercado objetivo.
Esta cualidad es propia de modelos dicotómicos 7 5, por lo que es factible clasificar la propensión a
la compra más que la certeza de ésta.

El nivel de Cut Off definido en -193 corresponde a una estrategia conservadora,


desplazamientos hacia arriba incrementarán los No Hits Pronosticados, reduciendo la Pérdida de
Capital; desplazamientos hacia abajo incrementarán los Hits Pronosticados, reduciendo el Costo
de Oportunidad. La elección del Cut Off a utilizar depende de la evaluación financiera con datos
reales del costo unitario de la campaña y la utilidad esperada por cada Cliente Bueno, cuya
optimización reducirá el Costo de Adquisición de Clientes de la campaña mercadológica.

8.2 Conclusiones de la tesis


Al inicio de la tesis se plantea el problema de fundamentar la toma de decisiones referente a la
cantidad de recursos destinados a una estrategia de mercadotecnia por lo que a lo largo de los
capítulos anteriores se han mostrado diversas herramientas tanto mercadológicas como crediticias
que actualmente se utilizan para optimizar este tipo de decisiones, con sus respectivas ventajas,

75
Hosmer, David; Lemeshow, Stanley. Applied Logistic Regression. Ed. Wiley, segunda edición. EUA, 2000.
69

tales como el uso de datos ya existentes, relación con bases de datos análogas y apoyo de
corporaciones en el diseño de modelos matemáticos; así como de sus desventajas, tales como
altos costos de implementación y mantenimiento, limitantes de variables cuantitativas y
dificultades en la desarrollo de modelos específicos para los mercados Business to Consumer.

Abordando el objetivo planteado al inicio de esta tesis de generar una metodología que
fundamentara la toma de decisiones en estrategias de mercadotecnia directa de forma sistemática
y robusta, el modelo propuesto toma los mejores aspectos de dos de las herramientas más
representativas del mercado crediticio y de las ciencias sociales: Modelos Scoring, utilizados
comúnmente para la evaluación financiera de candidatos a créditos bancarios; y modelos de
estructuras de covarianza, utilizados generalmente en estudios biológicos, médicos y psicológicos
por la flexibilidad que brindan en el estudio de variables cualitativas. La combinación de estas
dos herramientas da como resultado un modelo scoring con un enfoque de estructuras de
covarianza, el cual permite un análisis ágil y sistemático de información cuantitativa y cualitativa
del comportamiento histórico de los clientes, aplicado en esta ocasión al sustento de la toma de
decisiones en estrategias de mercadotecnia directa.

Tras el desarrollo y prueba de este modelo se observa que su implementación es factible y


económicamente viable, presentando beneficios tales como la reducción en los costos de
implementación al utilizar información preexistente de la compañía bajo estudio y un modelo
robusto de fácil elaboración; así como la simplificación de su mantenimiento al realizarse con
herramientas de uso cotidiano, tales como software libres y hojas de cálculo.

La comparación del modelo propuesto con un modelo de regresión logística muestra que
la metodología utilizada es consistente con esta técnica de análisis, la cual es ampliamente
utilizada en problemas con un enfoque médico y sociopolítico. Esta correspondencia demuestra
que el modelo propuesto presenta una robustez similar a la de otros modelos previamente
probados y utilizados en la industria. La eficacia de la predicción del modelo propuesto resultó
muy similar a la de la regresión logística, con la ventaja de que las modificaciones en el nivel Cut
Off permiten modificar el grado de discriminación que se desea alcanzar.
70

Debido a lo anterior pueden generarse tres grandes conclusiones, las cuales están dirigidas
a la utilización e interpretación de la herramienta definida en esta tesis:

• Es posible recopilar información cualitativa que aporte significancia a un modelo


predictivo. Su tratamiento con escalas de Likert y su estudio basado en covarianzas
permite una mejor manipulación y asociación en factores, los cuales determinan el
comportamiento final del modelo scoring con un enfoque de ecuaciones de covarianza. La
metodología propuesta permite un análisis sistemático de esta información de forma
robusta y flexible para adaptarse a distintos conjuntos de datos donde la interacción de las
variables puede modelarse con respecto a su estructura funcional, permitiendo así una
interpretación más clara y sencilla de la relevancia de la información.
• La propensión de compra de un cliente no puede determinarse de forma absoluta, factores
externos no considerados en el modelo generan variabilidad en el comportamiento
esperado de los clientes evaluados. La interpretación de los resultados es por tanto de
suma importancia para encontrar el perfil adecuado del mercado meta y enfocar la toma
de decisiones hacia objetivos acotados. La matriz de confusión utilizada para la validación
del modelo propuesto permite evaluar el grado de predicción que brinda el modelo al
comparar los valores a priori de la variable de respuesta de la base de datos con los
valores predichos por el modelo. La evaluación continua de esta matriz garantiza la
funcionalidad del modelo a lo largo de su vida útil.
• Los resultados del modelo deben considerarse más como una ayuda en la toma de
decisiones que como un canon a seguir para la selección de clientes objetivo. La
experiencia y conocimiento del analista deben ser complementados por el modelo mas no
sustituidos. Del mismo modo, la selección inicial de variables a utilizar dentro de la
metodología propuesta depende en gran medida del conocimiento a priori que tenga el
analista del mercado evaluado, ya que las interacciones entre variables son distintas en
cada caso analizado, aun cuando los estudios de varianza generados puedan aplicar a
cualquier conjunto de datos. Los Path Diagram generados permiten introducir una visión
confirmatoria de la relación existente entre variables y factores, arrojando no solo un
valor predictivo como resultado final, sino también una estructura de relaciones que
facilite la comprensión del fenómeno estudiado y por ende la toma de decisiones
asociada.
71

8.3 Limitaciones
Como se ha mencionado a lo largo esta tesis, el modelo analizado se enfoca
exclusivamente en modelos lineales entre variables observables, factores y variables de respuesta.
Esta característica puede ocasionar que relaciones no lineales de las variables observables pasen
desapercibidas y afecten la funcionalidad del modelo, ya que generalmente existen variables cuya
interacción es significativa para el comportamiento de la variable de respuesta. Aun cuando la
introducción de factores en el modelo propuesto tiene la función de interactuar con el conjunto de
variables observables que los conforman, no existen relaciones no lineales propiamente dichas,
sino solamente proporciones definidas en que puede combinarse la información existente.

Este enfoque puede ser abordado por medio de modelos de segundo orden que consideren
también el efecto de variables combinatorias, aunque se requeriría de un estudio más extenso para
poder establecer el modelo resultante y evaluar su desempeño.

8.4 Investigaciones posteriores


Esta tesis brinda tan solo una propuesta de modelos aplicables a la toma de decisiones
mercadológicas, sin embargo el campo de investigación al que pertenece es mucho más amplio y
con diversas vertientes no analizadas en este documento. Algunos de los posibles rumbos a seguir
incluyen la aplicación en la toma de decisiones de ámbitos distintos a la mercadotecnia, así como
la modificación de las ecuaciones utilizadas por modelos de relaciones no lineales. En particular,
identifico tres grandes vertientes que pueden derivarse de este trabajo de tesis:

• Aplicación del modelo en casos de empresas reales. La recolección de información a


partir de bases de datos CRM y la selección de .Q de manera estadísticamente confiable
generará una visión más amplia de la utilidad del modelo para fundamentar la toma de
decisiones. Así mismo, sería posible evaluar los impactos financieros de las decisiones
tomadas basadas en respuestas reales del mercado. Por motivos de disponibilidad de
información, esta tesis no abarca un estudio de campo aplicado, sino el análisis de una
base de datos predefinida.
• Aplicación del modelo en ámbitos de negocio distintos. La aplicación estudiada en este
trabajo se enfocó en la toma de decisiones mercadológicas, sin embargo es posible
verificar la robustez del modelo al utilizarlo en un ambiente diferente relacionado con las
decisiones estratégicas, la producción y la administración, entre otras. El éxito en la
72

implementación de este modelo en otras áreas de una organización puede ayudar a elegir
rumbos de acción de forma rápida y basada en casos pasados, complementando la
información actualmente obtenida por medio de sistemas de inteligencia de negocios.
• Modificación de las ecuaciones lineales. El modelo actual corresponde exclusivamente a
la interacción existente entre variables observables, factores y variables de respuesta de
fonna lineal, por lo que un modelo complejo con ecuaciones no lineales pude brindar un
punto de vista distinto en la predicción de las calificaciones score de los clientes
evaluados.

8.5 Palabras finales


A lo largo de este trabajo se han mostrado herramientas y situaciones que tradicionalmente eran
ajenas a la Ingeniería Industrial, pero en la actualidad la optimización de recursos y la toma de
decisiones mercadológicas forman un rol importante dentro de cualquier organización, el cual
puede ser abarcado por la Ingeniería Industrial considerando que es el fin de toda compañía no
76
solo manufacturar, sino distribuir sus productos optimizando el costo, tiempo y calidad.

Deseo que este trabajo de tesis sea de utilidad para aquellas personas y organizaciones que
se enfrentan en el día a día con tomas de decisiones ambiguas o difíciles de realizar debido a la
complejidad de la información existente. La continua evolución de los modelos predictivos, así
como de las herramientas tecnológicas que permiten su desarrollo, proporcionará oportunidades
de mejora a las metodologías existentes, o de inclusive desarrollar nuevas técnicas que ayuden a
optimizar la eficiencia de procesos mercadológicos, administrativos y productivos.

76
Vollmann, Thomas. Sistemas de planificación y control de la fabricación. Editorial lrwin. 3~ edición, 1995.
73

Anexos

Anexo l. Diccionario de variables


Variable Tipo Significado
ESTRATO Nominal Estrato social al que pertenece el cliente
CASA Discreta Tamaño de la casa habitación del cliente
ESTILO VIDA Nominal Estilo de vida del cliente
CASADO Discreta Preferencia por el matrimonio
RELLIBRE Discreta Preferencia por relaciones libres
SOLTERO Discreta Preferencia por soltería
NIÑOS Discreta Percentil de hjjos según estadísticas estadounidenses
UNIVERSIDAD Discreta Desempeño en estudios superiores
PRIMARIA Discreta Desempeño en estudios básicos
EMPRENDEDOR Discreta Desarrollo de actividades independientes
GRANJERO Discreta Desarrollo de actividades en la agricultura
RENTACASA Di screta Tendencia a rentar casa o departamento
OUEÑOCASA Discreta Tendencia a comprar casa propia
COCHE Discreta Tendencia a utilizar auto propio
TRANSPORTE Discreta Tendencia a utilizar transporte público
SALUDPUBL Discreta Tendencia a utilizar servicios de salud pública
SALUDPRIV Discreta Tendencia a utilizar servicios privados de salud
INGRESO Discreta Percentil del ingreso promedio según estadísticas estadounidenses
PODCOMPRA Discreta Percentil de poder de compra según estadísticas estadounidenses
RESPCIVIL Discreta Número de pólizas de responsabilidad civil
SEGUROAUTO Discreta Número de pólizas de seguros de auto
SEGUROGMM Discreta Número de pólizas de gastos médicos mayores

Anexo 2. Histogramas de variables


ESTRATO CASA

ESTRATO
74

ESTLOVl>A NIÑOS

fSTILOVIOA NIÑOS

UNrvERSl)AO

c•SADO UNY'ERSIDAD

RELLBRE

í•
:.

SOLTERO EMPRENDEDOR

SOLTERO EMPRENDEDOR
75

GRANJERO TRANSPORTE

G~AO TRANSPORTE

RENTACASA SALUOPUBL

RENTACASA SALUOPUBl

OUEÑOCASA SALUOPRfV

fe'
:.

OUEÑOCASA SALUDPRIV

COCHE INGRESO

COCHE INGRESO
76

POOCOMPRA RESPCrvL

POOCOMPRA RESPCML

SEG~OAl/TO SEGUROGMM

SEGUROAU TO SEGUROGMM

Anexo 3. Gráficos de frecuencia


CASA CASADO
60% 60%

~ ~
ro ro
·u ·u
e: 40% e: 40%
QI
:::,
-1 QI
:::,
-1
u 20% u
...
~ - o ....QI 20%
... - o
0% 0%
0123456789 0123456789

RELLIBRE SOLTERO
40% 60%

~
ro
·¡:¡ "'e:
·¡:¡

É
e: 40%
QI
:::, 20% -1 QI
:::, -1
u u 20%
...
~
0%
- o .......
QI

0%
- o
0123456789 0123456789
77
.............

NIÑOS UNIVERSIDAD

ta
30% ¡
40%
-~ 20% ! ---h\.- "'
·¡:¡
e:

i ·:: l~
- 1 ~ 20% - 1
u
- o C1I
- o
.t 0%
012 3 456789 01 2 3456789

PRIMARIA EMPRENDEDOR
30%
"' 20%
·g ·g 100% E
C1I
:::1
- 1 ~ 50% - 1
~ 10% u
.... - o ~ - o
0% .... 0%
O1 2 3 4 5 6 7 8 9 0123456789

GRANJERO RENTACASA
60%

f:E 0123456789
-

-
1

o
·g"' 40%
C1I

a~ 20%
....
0%
0123456789
-

-
1

COCHE SALUDPRIV
30%

- 1
·"'g 20%
C1I - 1
:::1
~ 10%
- o - o
.t 0%
0123456789 0123456789

INGRESO

100% ·- ·- · · -· ·- -·
RESPCIVIL

E
"'e:
·¡:¡
- 1 - 1
~ 50%
u
- o ~
.... - o
0%
0123456789 0123456789

SEGUROAUTO

- 1

- o
0123456789
78

Anexo 4. Análisis de varianza


MANO VA para CASA MANOVA para UNIVERSIDAD
s= Im = 1.5 n = 443.0 S"I m = 3.5 n = 443.0

Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Criterio de prueba F Núm Denom P
De Wilks 0.99365 1.135 5 888 0.340 De Wilks 0.97594 2.433 9 888 0.010
Lawley-Hotelling 0.00639 1.135 5 888 0.340 Lawley-Hotelling 0.02465 2.433 9 888 O.O IO
De Pillai 0.00635 1.135 5 888 0.340 De Pillai 0.02406 2.433 9 888 0.010
De Roy 0.00639 De Roy 0.02465

MANOV A para CASADO MANO VA para PRIMARIA


s = 1 m = 3.5 n = 443.0 s ,, I m = 3.5 11 = 443.0

Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Criterio de prueba F Núm Denom P
De Wilks O. 98836 1.162 9 888 0.316 De Wilks 0.98337 1.669 9 888 0.092
Lawley-Hotelling 0.01177 1.162 9 888 0.316 Lawley-Hotelling 0.01691 1.669 9 888 0.092
De Pillai O.O I I 64 1.162 9 888 0.316 De Pillai 0.01663 1.669 9 888 0.092
De Roy 0.01177 De Roy 0.01691

MANO VA para RELLIBRE MANO VA para EMPRENDEDOR


s = I m = 3.5 11 = 443.0 s = 1 m = 1.5 n = 443.0

Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Ciiterio de prueba F Núm Denom P
De Wilks 0.99200 0.796 9 888 0.620 De Wilks 0.99320 1.216 5 888 0.299
Lawley-Hotelling 0.00806 0.796 9 888 0.620 Lawley-Hotelling 0.00685 1.216 5 888 0.299
De Pillai 0.00800 0.796 9 888 0.620 De Pillai 0.00680 1.216 5 888 0.299
De Roy 0.00806 De Roy 0.00685

MANO V A para SOL TERO MANO V A para GRANJERO


s = I m = 3.5 n = 443.0 scc I m = 2.5 n = 443.0

Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Criterio de prueba F Núm Denom P
De Wilks 0.99665 0.332 9 888 0.965 De Wilks 0.98985 1.301 7 888 0.247
Lawley-Hotelling 0.00336 0.332 9 888 0.965 Lawley-Hotelling 0.01026 1.301 7 888 0.247
De Pillai 0.00335 0.332 9 888 0.965 De Pillai 0.01015 1.301 7 888 0.247
De Roy 0.00336 De Roy 0.01026

MANOV A para NIÑOS MANOVAparaRENTACASA


s = I m = 3.5 n = 443.0 s = I m = 3.5 n = 443.0

Estadística GL Estadística GL
Criterio de prueba F Núm Denom P Criterio de prueba F Núm Denom P
De Wilks 0.99378 0.618 9 888 0.782 De Wilks 0.98095 1.916 9 888 0.046
Lawley-Hotelling 0.00626 0.618 9 888 0.782 Lawley-Hotelling O.O I 942 l. 916 9 888 0.046
De Pillai 0.00622 0.618 9 888 0.782 De Pillai 0.01905 1.916 9 888 0.046
De Roy 0.00626 De Roy O.O 1942
79

MANOV A para COCHE


s = 1 111 = 3.0 11 = 443.0 MANOVA para RESPCIYIL
s = 1 111 = O.O 11 = 443.0
Estadística GL
Criterio de prueba r Núm Deno111 P Estadística GL
De Wilks 0.99219 0.874 8 888 0.538 Criterio de prneba F Núm Deno111 P
Lawley-1-Iotelling 0.00787 0.874 8 888 0.538 De Wilks 0.98878 5.039 2 888 0.007
De Pillai 0.00781 0.874 8 888 0.538 Lawley-1-Iotelli11g 0.01135 5.039 2 888 0.007
De Roy 0.00787 De Pillai O.O 1122 5.039 2 888 0.007
De Roy 0.01135

MANOVA para SALUDPRIV


s = 1 111 = 3.5 11 = 443.0 MANOVA para SEGUROAUTO
s = 1 m = 0.5 11 = 443.0
Estadística GL
Criterio de prueba F Núm De11om P Estadística GL
De Wilks 0.99202 0.794 9 888 0.622 Criterio de prueba F Núm De11om P
Lawley-Hotelling 0.00805 0.794 9 888 0.622 De Wilks 0.99353 1.928 3 888 0.124
De Pillai 0.00798 0.794 9 888 0.622 Lawley-Hotelli11g 0.00651 1.928 3 888 0.124
De Roy 0.00805 De Pillai 0.00647 1.928 3 888 0.124
De Roy 0.00651

MANOVA para INGRESO


s = 1 111 = 3.5 11 = 443.0

Estadística GL
Criterio de prueba F Núm De11om P
De Wilks 0.99151 0.845 9 888 0.575
Lawley-llotelling 0.00856 0.845 9 888 0.575
De l'illai 0.00849 0.845 9 888 0.575
De Roy 0.00856

Anexo 5. Análisis factorial


Matnz
1 . de componentes

Componente

1 2
UNIVERSIDAD -.873 -.023
PRIMARIA .879 .031
RENTACASA .598 .006
RESPCIVIL -.040 .743
SEGUROAUTO -.028 .749

Método de extracción: Análisis de


componentes principales.
a. 2 componentes extraídos
80

Varianza total explicada

Componente Sumas de las saturaciones al cuadrado de la


Autovalores iniciales extracción

% de la % de la
Total varianza % acumulado Total varianza % acumulado

1 1.896 37 .917 37.917 1.896 37 .917 37 .917

2 1.115 22 .303 60.220 1.115 22 .303 60 .220

3 .917 18.330 78 .550


-
4 .760 15.196 93.74E>

5 .313 6.254 100.000

Método de extracción: Análisis de Componentes principales.

Gráfico de sedim,rntación

2.

1.5

.
!
o
~ 1 .0
2::,
<t

0 .5

Anexo 6. Sintaxis de Lisrel


SEM Model - Ordinal
Observed Variables:
UNIVERSIDAD PRIMARIA RENTACASA RESPCIVIL SEGUROAUTO CONTRATA
Covariance Matrix from File Data.COY
Asymptotic Covariance Matrix from Fi le Data.ACM
Sample Size: 1000
Latent Variables: ESTUDIOS RIESGO
Relationships:
UNIVERSIDAD PRIMARIA RENTA CASA = ESTUDIOS
RESPCIVIL SEGUROAUTO = RIESGO
RIESGO ESTUDIOS = CONTRATA
LISREL Output: ND=3 SC ME=WLS
Path Diagram
End of Problem
81

SEM Model - Ordinal

Covariance Matrix

UNIVERSI PRIMARIA RENT ACAS RESPCIVI SEGUROAU CONTRATA

UNIVERSI 3.562
PRIMARIA -3.855 7.576
RENTACAS -2.205 3.541 13.143
RESPCIVI 0.023 -0.045 0.034 0.127
SEGUROAU 0.007 0.046 -0.122 0.036 0.345
CONTRATA 0.263 -0.375 -0.797 0.090 0.090 1.000

SEM Model - Ordinal

Parameter Specifications

LAMBDA-Y

ESTUDIOS RIESGO

UNIVERSI O O
PRIMARIA I O
RENTACAS 2 O
RESPCIVI O O
SEGUROAU O 3

GAMMA

CONTRATA

ESTUDIOS 4
RIESGO 5

PHI

CONTRATA

PSI

ESTUDIOS RIESGO

7 8

THETA-EPS

UNIVERSI PRIMARIA RENT ACAS RESPCIVI SEGUROAU

9 10 11 12 13
82

SEM Model - Ordinal

Number of lterations = 13

LISREL Estimates (Weighted Least Squares)

LAMBDA-Y

ESTUDIOS RIESGO

UNIVERSI 1.548
PRIMARIA -2.486
(0.199)
-12.520
RENTACAS -1.465
(0.124)
-11.824
RESPCIVI 0.197
SEGUROAU 0.194
(0.088)
2.214

GAMMA

CONTRATA

ESTUDIOS O. 134
(0.066)
2.030
RIESGO 0.480
(0.134)
3.582

Covariance Matrix ofETA and KSI

ESTUDIOS RIESGO CONTRATA

ESTUDIOS 1.000
RIESGO 0.064 1.000
CONTRATA 0.134 0.480 1.000

PHI

CONTRATA

1.000
(0.032)
31.627

PSI
Note: This matrix is diagonal.
83

ESTUDIOS RIESGO

0.982 0.770
(0.085) (0.450)
11.502 1.711

Squared Multiple Correlations for Structural Equations

ESTUDIOS RIESGO

0.018 0.230

Squared Multiple Correlations for Reduced Form

ESTUDIOS RIESGO

0.018 0.230

THETA-EPS

UNIVERSI PRIMARIA RENTACAS RESPCIVI SEGUROAU

1.166 1.398 10.997 0.088 0.307


(0.234) (0.555) (0.548) (0.019) (0.023)
4.987 2.516 20.051 4.520 13.396

Squared Multiple Correlations for Y - Variables

UNIVERSI PRIMARIA RENTACAS RESPCIVI SEGUROAU

0.673 0.816 0.163 0.305 0.109

Goodness of Fit Statistics

Degrees of Freedom = 8
Minimum Fit Function Chi-Square = 13.332 (P = 0.1 O1)
Estimated Non-centrality Parameter (NCP) = 5.332
90 Percent Confidence Interval for NCP = (O.O ; 19 .51 O)

Minimum Fit Function Yalue = 0.0133


Population Discrepancy Function Yalue (FO)= 0.00534
90 Percent Confidence Interval for FO = (O.O ; O.O 195)
Root Mean Square Error of Approximation (RMSEA) = 0.0258
90 Percent Confidence Interval for RMSEA =(O.O; 0.0494)
P-Value for Test ofClose Fit (RMSEA <O.OS)= 0.955

Expected Cross-Yalidation Index (ECVI) = 0.0394


90 Percent Confidence lnterval for ECVI = (0.0340 ; 0.0536)
ECVI for Saturated Model = 0.0420
ECVI for Independence Model = 1.873
84

Chi-Square for lndependence Model with 15 Degrees ofFrcedorn = 1859.475


lndependence AIC = 1871.475
Model AIC = 39.332
Saturated AIC = 42.000
lndependence CAIC = 1906.921
Model CAIC = 116.133
Saturated CAIC = 166.063

Nonned Fit lndex (NFI) = 0.993


Non-Nonned Fit lndex (NNFI) = 0.995
Parsirnony Nonned Fit Index (PNFI) = 0.530
Cornparative Fit lndex (CFI) = 0.997
Incremental Fit lndex (IFI) = 0.997
Relative Fit lndex (RFI) = 0.987

Critica) N (CN) = 1506.531

Root Mean Square Residual (RMR) = 0.138


Standardized RMR = 0.0412
Goodness of Fit lndex (GFI) = 0.998
Adjusted Goodness ofFit lndex (AGFI) = 0.996
Parsimony Goodness ofFit lndex (PGFI) = 0.380

SEM Model - Ordinal

Standardized Solution

LAMBDA-Y

ESTUDIOS RIESGO

UNIVERSI 1.548
PRIMARIA -2.486
RENTACAS -1.465
RESPCIVI 0.197
SEGUROAU 0.194

GAMMA

CONTRATA

ESTUDIOS 0.134
RIESGO 0.480

Correlation Matrix of ETA and KSI

ESTUDIOS RIESGO CONTRATA

ESTUDIOS 1.000
RIESGO 0.064 1.000
CONTRATA 0.134 0.480 1.000
85

PSI
Note: This matrix is diagonal.

ESTUDIOS RIESGO

0.982 0.770

Regression Matrix ET A on X (Standardized)

CONTRATA

ESTUDIOS 0.134
RIESGO 0.480

Anexo 7. Estadísticas descriptivas de calificaciones score


Calificación Score - Muestra Calificación Score -
de entrenamiento Muestra de test
Mean -192.32 Mean -195.08
Standard Error 4.35 Standard Error 2.40
Median -201.82 Median -200.24
Mode -199.87 Mode -199.87
Standard Deviation 137.56 Standard Deviation 131.39
Sample Variance 18923.96 Sample Variance 17264.21
Kurtosis -0.29 Kurtosis -0.10
Skewness 0.28 Skewness 0.25
Range 663.18 Range 672.64
Minimum -476.49 Minimum -476.49
Maximum 186.69 Maximum 196.14
Sum -192318.02 Sum -585229.82
Count 1000 Count 3000

Anexo 8. Modelo de regresión logística


Variable Valor Conteo
CONTRATA I 57 (Evento)
O 943
Total 1000

Tabla de regresión logística

Relación de IC95%
Predictor Cocf Coef. de EE z p probabilidades Inferior
Constan le -2.79624 0.576480 -4.85 0.000
UNIVERSIDAD 0.0302527 0.100993 0.30 0.765 1.03 0.85
PRIMARIA -0.0498651 0.0860492 -0.58 0.562 0.95 0.80
RENTACASA -0.128048 0.0519502 -2.46 0.014 0.88 0.79
RESPCIVIL 0.841630 0.279699 3.01 0.003 2.32 1.34
SEGUROAUTO 0.320854 0.228573 1.40 0.160 1.38 0.88
86

Predictor Superior
Constante
UNIVERSIDAD 1.26
PRIMARIA 1.13
RENTACASA 0.97
RESPCIVIL 4.01
SEGUROAUTO 2.16

Log-verosimilitud = -206.737
Probar que todas las pendientes son cero: G = 23.789, GL = 5, valor P = 0.000

Pruebas de bondad del ajuste

Método Chi-cuadrada GL p
Pearson 682.753 588 0.004
Desviación 319.974 588 1.000
Hosmer-Lemeshow 6.541 8 0.587

Tabla de frecuencias observadas y esperadas:


(Véase la prueba Hosmer-Lemeshow para la estadística de chi-cuadrada de
Pearson)

Grupo
Valor 2 3 4 5 6 7 8 9 IO Total
1
Obs 3 3 4 3 4 1 5 8 9 17 57
Exp 1.6 2.4 3.1 3.7 4.3 5.1 6.1 7.3 9.7 13.6
o
Obs 98 98 98 98 97 100 97 92 91 74 943
Exp 99.4 98.6 98.9 97.3 96.7 95.9 95.9 92.7 90.3 77.4
Total 101 101 !02 IOI 101 101 102 IO0 IO0 91 1000

Medidas de asociación:
(Entre la variable de respuesta y las probabilidades pronosticadas)

Pares Número Porcentaje Medidas de resumen


Concordante 36198 67.3 D de Somer.; 0.36
Discordante 16659 31.0 Gamma de Goodman-Kruskal 0.37
Empates 894 1.7 Tau-a de Kendall 0.04
Total 53751 100.0
87

Bibliografía
1. Abad, Raúl. Centro para empresas y profesionales. microsoft.com. Consultado el 02 de
febrero de 2009.
2. Agresti, Alan. An introduction to categorical data analysis. Ed. Wiley, 2007.
3. Álvarez, Rafael. Estadística multivariante y no paramétrica con SPSS. Editorial Díaz de
Santos. España, 1995.
4. Anton, Jon. Customer Relationship Management, Making hard decisions with soft
numbers. Prenctice Hall, USA, 1996.
5. Azizuddin, Mohammed. Siebel Functional Guide.
6. Barshel, Hauke. B2B versus B2C Marketing - Major differences along the supply chain
of fast moving consumer goods. Grin, 2004.
7. Batista, Joan Manuel; Coenders, Germa. Modelos de Ecuaciones Estructurales. Ed. La
Muralla. Madrid, 2000.
8. Bolaños, Ricardo. Costo de adquisición de clientes. pyme.com.mx. Consultado el 02 de
febrero de 2009.
9. Bonilla, María; Olmeda, Ignacio; Puertas, Rosa. Modelos paramétricos y no paramétricos
en problemas de credit scoring. Revista Española de Financiación y Contabilidad, Vol. 32
No. 118. Julio - Septiembre 2003.
10. Bray, James; Maxwell, Scott. Multivariate Analysis of Variance. Sage University. EUA,
1985.
11. Burnett, Ken. Gestión de la relación con el cliente clave. Prenctice Hall. España, 2002.
12. Business Glossary. Barron's Educational Series, 2006.
13. Casas Guillén, Mercedes. Los modelos de ecuaciones estructurales y su aplicación en el
Índice Europeo de Satisfacción al Cliente. Facultad de Económicas - Universidad San
Pablo.
14. Deal, Barney. Lead Scoring, Marketing's answer to sales. www.searchcrm.com, 08 de
agosto de 2007.
15. Figueroa, Romeo. Cómo hacer publicidad, un enfoque teórico práctico. Editorial Pearson,
México, 1999.
16. Fiore y Collins, 2001. deltaasesores.com. Consultado el 02 de febrero de 2009.
17. García, Ignacio. CRM Gestión de la Relación con los Clientes. FC Editorial. Madrid,
2001.
18. Glosario de Mercadotecnia. www.asociacionmexicanademercadotecniadirecta.org.mx,
consultado el 25 de febrero de 2009.
19. Guitiérrez, Matías. Modelos de Credit Scoring- Qué, cómo, cuándo y para qué-. Banco
Central de la República Argentina, 2007.
20. Gutner, Toddi. Anatomy of a Credit Score. Business Week, 28 de noviembre de 2005.
21. Haas, Elizabeth. Enseñanzas de Peter Drucker. Ed. McGraw-Hill, 2007.
88

22. Hicks, Philip. Ingeniería Industrial y Administración, una nueva perspectiva. Ed. CECSA,
2002.
23. Hosmer, David; Lemeshow, Stanley. Applied Logistic Regression. Ed. Wiley, segunda
edición. EUA, 2000.
24. http://www.ssicentral.com/lisrel/history.html recuperado el 04 de Octubre de 2011.
25. http://www.ucm.es recuperado el 18 de Noviembre de 2009.
26. Hutner, Michael, et. al. Applied Linear Statistical Models. Editorial McGraw Hill.
Singapur, 2005.
27. Kaplan, Robert; Saccuzzo, Dennis. Pruebas psicológicas. Principios, aplicaciones y temas.
Ed. Thomson, México, 2006.
28. Ledesma, Rubén; Molina, Gabriel; Valero, Pedro. Análisis de consistencia interna
mediante Alfa de Cronbach: un programa basado en gráficos dinámicos. Psico USF
volumen 7, numero 2. Diciembre 2002.
29. Lescouflair, Edric. Sewall Wright: Darwin's successor - Evolutionary theorist. Harvard
College, 2003.
30. Malthouse, Edward. Shrinkage Estimation and Direct Marketing Scoring. Joumal of
Interactive Marketing, 17 de Julio de 1998
31. Nettleton, David. Análisis de datos comerciales. Ediciones Díaz de Santos. España, 2003.
32. Peña, Gustavo. La inteligencia tecnoeconómica: una ventana hacia el futuro. Espacios Vol
13 (2) 1992.
33. Ponzoa, José Manuel. Los 100 Errores del CRM. Editorial ESIC. Madrid, 2005.
34. Productos y Soluciones SAS. Marketing y Riesgo: Credit Scoring. www.sas.com.
Consultado el 12 de febrero de 2009.
35. Scorto. www.scorto.com/spanish/credit_scoring.htm. Consultado el 12 de febrero de
2009.
36. Silva, Claudio; Schiattino, Irene. Modelos de Ecuaciones Estructurales ¿Qué es eso?.
www.cienciaytrabajo.cl
37. SSI Scientific Software Intemational. www.ssicentral.com/workshops/instructors.html
38. Stanton, William; Etzel, Michael y Walker, Bruce. Fundamentos de Marketing. Ed.
McGraw Hill, 13ª edición. México, 2006.
39. Viscencio, Hector. Economía para la toma de decisiones. Editorial Thomson, 2002.
40. Vojtek, Martin. Credit Scoring Methods. Czech Journal of Economics and Finance, 2006
41. Vollmann, Thomas. Sistemas de planificación y control de la fabricación. Editorial Irwin.
3ª edición, 1995.
42. Weber, Klaus y Sutcliffe, Kathleen. El alto costo de la información exacta. Harvard
Business Review, ISSN 0717-9952, Vol. 81, Nº. 5, 2003.
43. Wright, Sewall. The Method of Path Coefficients. The Annals of Mathematical Statistics.
Vol.5, No. 3. Septiembre 1934.

También podría gustarte