Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CF Mendez MC
CF Mendez MC
PROFESOR GUIA:
LUIS ABURTO LAFOURCADE
MIEMBROS DE LA COMISIN:
RICHARD WEBER HAAS
MANUEL REYES JARA
SANTIAGO DE CHILE
MARZO 2013
RESUMEN DE LA MEMORIA
PARA OPTAR AL TITULO DE
INGENIERO CIVIL INDUSTRIAL
POR: MARCELA MNDEZ CASTRO
FECHA: 22/03/2013
PROF. GUIA: SR. LUIS ABURTO L.
i1
Tabla de Contenido
I. Introduccin 3
I.I. El mercado en Chile 4
I.III. Los Clientes de Consorcio 5
II. Contexto del proyecto 7
II.I. Origen del proyecto 7
II.II. Definicin del proyecto 8
II.III. Justificacin del proyecto 8
II.IV. Objetivos 9
II.V. Alcances del proyecto 9
II.VI. Resultados esperados 10
III. Enfoque metodolgico 10
III.I. Introduccin 10
III.II. Metodologa 12
III.II.I Etapas de la modelacin 13
IV. Conclusiones 32
V. Referencias bibliogrficas y electrnicas 34
VI. Anexos 36
Anexo A: Definicin de seguro 36
Anexo B: Tablas del Modelo de datos 38
ii 2
I. INTRODUCCIN
1
Informacin consolidada a partir de datos reportados por las compaas aseguradoras a SVS.
3
Generales, Consorcio Crditos Hipotecarios, Consorcio Corredores de Bolsa, Compaa
de Seguros CNLife, Consorcio AGF y Consorcio Administradora de Tarjetas de Crdito.
4,5
4
3,5
3
2,5
2
1,5
1
0,5
0
1985
1987
1989
1991
1995
1997
1999
2001
2003
2005
1993
De la grfica, se observa que tanto para las lneas de vida como generales, hoy
el mercado se encuentra por debajo de los peak histricos alcanzados en el horizonte
de tiempo comprendido desde 1985 a la fecha. En este sentido, las estrategias
comerciales que predominan en el proceso de consolidacin en participacin de
mercado de cada compaa, son bsicamente 2:
1
Actitudes de Consumidores y Comportamientos de Compra, Lori Chester (Senior Analyst), 2005
2
Cerca de un 4% del PIB anual, seguido de Argentina con un ndice cercano al 2%.
3
Fuente: www.svs.cl
4
Es claro que antes de aumentar la participacin de mercado va incorporacin de
nuevos clientes, est el interesante desafo de rentabilizar de una manera ms eficiente
a los clientes actuales de las compaas. Existen 2 mecanismos bsicos para abordar
esta problemtica:
Ambos casos, pueden producirse tanto por accin espontnea de los clientes (al
solicitar a su ejecutivo de venta la asesora cuando el lo estime) como por resultado de
la ejecucin de acciones de marketing directo. Para este proyecto, una de las
consecuencias directas de su aplicacin es el aumento en los niveles de cross selling
observados dentro de la cartera total de clientes vigentes de Consorcio Financiero, a
travs de la aplicacin de acciones de marketing directo.
Tabla n1: Clientes por lnea de Negocio Consorcio Financiero, Junio de 2007
5
Lnea Vida
a) Seguros de Vida Tradicional: Los seguros tradicionales son aquellos que operan
del modo en que fueron originalmente pactados, sin permitir que, en el
transcurso del perodo de vigencia y/o segn las necesidades del cliente, las
condiciones puedan ser modificadas. No incluyen el concepto de ahorro y son
seguros de riesgo, es decir, orientados exclusivamente a la proteccin del (los)
asegurado(s) en una pliza. Entre ellos estn: Temporales, Vida Entera y
Dotales2.
Lnea Generales
1
Considerando los planes base, es decir, sin las variantes de ellos.
2
Nombres comerciales de los distintos planes de seguros disponibles dentro de la oferta actual de Consorcio.
6
Cruce entre Lneas
Factores N
N Contratos Vigentes 175,888
N Clientes Vigentes 140,819
CS: Cross Selling 1.2490
Particularmente, dentro de las lneas Vida y Generales existen 4,866 clientes que
actualmente tienen vigente al menos 1 producto de la lnea vida y 1 de la lnea
generales. Estos clientes representan el 15,78% del total de clientes de generales y un
6,72% de los clientes de la lnea vida.
7
II.II. DEFINICIN DEL PROYECTO
1
En funcin del perfil de los clientes Consorcio.
2
Complementado al juicio experto e interpretacin de los resultados obtenidos.
8
embargo, existe la latente posibilidad de utilizar la data disponible para la cartera de
clientes, para la modelacin cuantitativa del problema y definir en base a ella una
herramienta de seleccin.
II.IV. OBJETIVOS
Objetivo General
Objetivos Especficos
1
En trminos de rentabilidad asociada a los productos. Una pliza de vida es en promedio aproximadamente 3 veces ms valiosa
que una de generales en trminos de valor presente. Fuente: Gerencia Tcnica, Consorcio Nacional de Seguros.
2
Para los clientes vigentes de la lnea vida en el producto fullcar.
9
empresa (accin comercial). En este contexto, es necesario definir la secuencia
metodolgica que permita implementar desde la construccin del conjunto de registros
(clientes y variables), la seleccin de las variables relevantes y los resultados de la
corrida del modelo seleccionado.
Por razones de tiempo, el proyecto no contempla la realizacin de pilotos o
pruebas en ambiente real.
III.I. INTRODUCCIN
2) Modelos de Regresin: en los que la variable a predecir puede ser explicada por
un conjunto de variables independientes. Estos modelos, generalmente,
corresponden a la formalizacin de una teora que explica las relaciones
subyacentes entre la variable en estudio y el conjunto de variables
independientes. En este caso, se utiliza una funcin que es la que se aplica
sobre los datos para determinar el valor de la variable predictiva.
Comparacin de enfoques
Resultados observados
III.II. METODOLOGA
1
La subgerencia desarrolla y gestiona desde hace aprox. 1 ao los modelos de fuga de cliente, basados en rboles de decisin.
2
En el marco del desarrollo del proyecto se documentar la secuencia de ejecucin del modelo.
12
III.II.I. ETAPAS DE LA MODELACIN
Para el caso de este proyecto se utilizar una versin extendida del proceso
KDD, que se caracteriza por explicitar la estrecha relacin, interaccin y coherencia que
debe existir entre el proyecto de data mining y la naturaleza y objetivos del negocio.
15
incertidumbre de la eventual perdida de datos en el proceso migratorio entre sistemas.
Esta premisa, reduce el universo de ms de 54.000 clientes vigentes de vida a 37.403.
Flujo de contratacin: Dentro del universo total de datos correspondientes a los clientes
vigentes de la cartera Consorcio, se considerar para la modelacin el Conjunto I
(Inicial) definido como:
I = (VA) U (V)
Donde:
a) Conjunto VA: Todos1 los clientes naturales Cj que actualmente tienen contratado
un seguro de vida (V) y un seguro automotriz (A). El conjunto A, se explica por
las consideraciones comerciales que definen el proyecto: es el flujo de
contratacin que se desea activar y/o potenciar como resultado de la aplicacin
del modelo predictivo. Dadas las condiciones antes definidas, el conjunto VA
contiene 1.201 clientes, los que representan un 3.2% de la base de clientes vida
vigentes a partir de enero de 2004.
b) Conjunto V: Todos los clientes que actualmente tienen contratado slo seguros
de vida, los que suman un total de 36.202, conteniendo al 96.8% del total de los
clientes de la lnea vida.
Tal como est definido, el conjunto I tiene como foco central la caracterizacin
del perfil de los clientes que cumplen con tenencia de ambos productos (seguro de vida
y seguro automvil). El hecho de excluir de I el conjunto de clientes que contrataron el
seguro automotriz producto de la aplicacin de una campaa de referidos a la gestin
de call center, tiene como objetivo independizar al modelo del factor humano: resulta
metodolgicamente complejo incorporar este factor a la modelacin, y adicionalmente,
el foco central del proyecto se basa en el perfil de compra, por lo que la ganancia en
trminos reales de introducir factores adicionales no se justifica.
1
Todos menos los clientes que contrataron seguro automotriz producto de una campaa de referidos. Este conjunto ser utilizado
posteriormente para medir la efectividad de la prediccin del modelo.
16
Variables socio demogrficas
Nombre Descripcin
Fecha de nacimiento Fecha (dd/mm/aaaa) de los clientes dueos de las
plizas
Gnero Gnero del titular de la pliza
Estado Civil Estado civil del cliente titular de la pliza
Variables de comportamiento
Nombre Descripcin
Fecha Inicio/ Trmino Fecha de inicio de la relacin contractual y fecha estipulada (o real) de trmino de la misma.
Coberturas Tipo de coberturas extras asociadas a cada uno de los productos.
Porcentaje de pagos Porcentaje de pagos al da, de acuerdo a la antigedad, frecuencia de pago y nmero de pagos de cada
al da pliza
Medio de pago Va de pago elegida por el cliente para realizar los pagos correspondientes a su pliza.
Frecuencia de pago Frecuencia de tiempo elegida por el cliente para realizar los pagos de las plizas a su haber.
PeopleSoft Software CRM con el que interacta el cliente de forma presencial, telefnica o por internet. Se registran
todas las interacciones de los clientes en este sistema; la variable usada es si existi interaccin (YES) o
no (NO) por parte del cliente con el sistema, en cualquiera de sus vas.
Otro producto vigente Esta variable se refiere a la posesin efectiva de algn otro producto dentro de la empresa que est en
estado VIGENTE. Esta variable incluye a los productos Generales o de Vida, para todo el horizonte de
tiempo analizado. Para un mejor anlisis de la variable posteriormente, sta se desglosa en productos de
Vida o Generales con un horizonte de tiempo de seis meses (caso que se consider representativo del
estado actual) y para todo el rango de tiempo analizado.
Otro producto Esta variable se refiere a la posesin efectiva de algn otro producto dentro de la empresa que est en
terminado estado TERMINADO. Esta variable incluye a los productos Generales o de Vida, para todo el horizonte de
tiempo analizado. Para un mejor anlisis de la variable posteriormente se desglosa en productos de Vida o
Generales con un horizonte de tiempo de seis meses (caso que se consider representativo del estado
actual) y para todo el rango de tiempo analizado.
17
Variables de entorno
Nombre Descripcin
Nmero de Identificador primario, la prediccin se hace en base a la pliza y no al
pliza cliente, debido a que la unidad de negocio con que opera la institucin
aseguradora son las plizas.
Rut Identificador secundario, es el nmero de cdula de identidad del cliente,
el cual posee un nmero determinado de plizas. Se usa principalmente
para establecer la relacin del cliente con otros productos.
Edad
Rango de Edad Clientes con FullCar Clientes sin FullCar
Rango = 1, Edad <=31 18.03% 20.31%
Rango = 2, 32<=Edad<=36 25.79% 23.91%
Rango = 3, 37<=Edad<=41 20.96% 18.49%
Rango = 4, 42<=Edad<=48 14.68% 18.36%
Rango = 5, Edad>=48 20.54% 18.93%
Para la variable edad, los puntos de corte para cada intervalo fueron
construidos utilizando la una funcionalidad especfica de la herramienta SPSS,
que permite a travs de la aplicacin de un criterio predeterminado como input,
segmentar y categorizar las variables numricas y as pasar de un conjunto con
mltiples valores a un espacio ms reducido.
18
Gnero de los Clientes
Sexo Clientes Clientes con Fullcar Clientes sin Fullcar
1 (Mujer) 42.35% 46.22%
2 (Hombre) 57.65% 53.77%
Estado civil
Estado Civil Clientes Clientes con Fullcar Clientes sin Fullcar
1 (Casado) 66.04% 63.88%
2 (Soltero) 29.77% 32.20%
3 (Viudo) 1.47% 1.00%
4 (Divorciado) 1.68% 2.13%
5 (No Informado) 1.05% 0.79%
Ciudad de residencia
Residencia con Fullcar % Residencia sin Fullcar %
43 (Santiago) 49.90% 43 (Santiago) 47.54%
11 (Concepcin) 7.55% 11 (Concepcin) 6.98%
52 (Via del Mar) 5.03% 52 (Via del Mar) 4.66%
5 (Calama) 3.98% 34 (Punta Arenas) 4.08%
34 (Punta Arenas) 2.94% 49 (Valparaso) 3.47%
49 (Valparaso) 2.94% 44 (Talca) 3.34%
9 (Chilln) 2.73% 32 (Puerto Montt) 2.40%
44 (Talca) 2.73% 45 (Temuco) 2.40%
36 (Rancagua) 2.52% 9 (Chilln) 2.29%
45 (Temuco) 2.52% 26 (osorno) 1.98%
20 (Linares) 2.31% 2 (Antofagasta) 1.87%
32 (Puerto Montt) 2.10% 19 (La Serena) 1.73%
19
b) Consideraciones de desarrollo: Dado que la cartera de vida congrega ms de 1
producto con diferentes caractersticas (principalmente en cuanto a la naturaleza
del negocio), para esta etapa se consider el anlisis por separacin de cartera,
las cuales se distribuyen de la siguiente manera:
20
En tanto que las variables utilizadas fueron:
21
Donde cada uno de los conglomerados se caracteriza principalmente por:
22
III.II.I.VI. Revisin de la data y resolucin de problemas1
Etapa de preprocesamiento
Missing values: Dado que la prediccin se realizar sobre los clientes de la lnea
vida y, se tendr como entrada las variables disponibles para esa lnea de
negocios, no se tienen valores perdidos para las variables relacionadas a los
clientes (como sexo, edad) ya que son variables fundamentales en la evaluacin
e ingreso de los negocios de esa lnea. Slo se encontraron valores perdidos en
ciudad (51) los cuales fueron completados por la moda de la variable (Santiago).
Etapa de transformacin
1) Edad del cliente: Variable numrica a partir de la fecha de nacimiento del cliente
(dd/mm/aaaa) se construy la variable edad del cliente de la siguiente forma:
1
Bibliografa Principal: The Data Ware House ETL Toolkit; Ralph Kimball & Joe Caserta.
23
2) Antigedad de la pliza Vida (primera): Variable numrica que determina la
antigedad del cliente en la lnea vida, a partir de la fecha de inicio de vigencia
de la pliza ms antigua vigente:
3) Nmero total de plizas vida (N Total vida): Tenencia total de plizas vida hoy
para cada cliente Cj:
4) Prima total mensual: Variable numrica que adiciona todas las primas en
productos vida que el cliente Cj desembolsa de manera mensual
Prima total mensual (Cj) = Suma (prima i), donde i = 1,...,n con n= nmero de plizas
vigentes
24
Extraer la mayor cantidad de informacin de cada modelo desarrollado a fin de
aprender de cada uno de ellos.
25
Arquitectura eficiente
Con el objetivo de evitar el sobre ajuste del modelo, se utiliz cross validation en
la corrida en SPSS de cada arquitectura.
Sensibilidad Especificidad
Exactitud
2
1
Fuente: Han, J., Lamber, M. Data mining: Concepts and techniques.
26
Para los datos de la modelacin a travs de rboles de decisin, se obtuvieron
las siguientes mediciones para cada indicador:
Para la eleccin del modelo que mejor se ajusta al problema, se prioriz el nivel
del indicador % Precisin ya que es el que mejor permite cuantificar los casos que
posteriormente se convertirn en contratacin del producto, y en ese sentido, permite
cuantificar a priori el valor aportado por la campaa a realizar.
27
Matriz de confusin
Condicin Real
No contrata Contrata
Prediccin
No contrata 350 129
Contrata 165 370
(370)
ClaseContrata 74.14%
(370 129)
(350)
ClaseNoContrata 67.96%
(350 165)
(350 370)
AciertoClases 71%
(350 165 129 370)
28
Anlisis de sensibilidad sobre el modelo de rboles
Curva ROC
29
Cabe destacar que el ptimo se obtiene para un Threshold de 49.83%
obteniendo un TPR de 89.54% y un FPR de 17.7%.
Variables relevantes dentro del modelo
1
Katharina Morik and Hanna Kopcke (2004), Analysing custumer churn in Insurance data
2
Modelos desarrollados en el software estadstico WEKA.
30
Comparacin algoritmos clasificacin total
31
IV. CONCLUSIONES
33
V. REFERENCIAS BIBLIOGRFICAS Y ELECTRNICAS
ACUA, E. y RODRIGUEZ, A. 2004. The treatment of missing values and its effect in
the classifier accuracy. University of Puerto Rico at Mayaguez, Puerto Rico.
ART, MARY. 2007. Using data to drive sales: database marketing company practices.
LIMRA.
EIBEN, AE., EUVERMAN, W., PEELEN, E., SLISSER, F., WESSELING, J. 1996.
Comparing Adaptive and traditional techniques for direct marketing. 4th European
Congress on Intelligent Techniques and Soft Computing, Verlag Mainz.
HAN, J., LAMBER, M. 2001, Data mining: Concepts and techniques. Morgan Kaufman
Publishers, San Francisco.
34
Otros
Apuntes del curso IN60E, Profesor Richard Weber, semestre Otoo 2005.
Apuntes del curso IN72O, Profesor Richard Weber, semestre Primavera 2005.
Pgina de la Superintendecia de Valores y Seguros: www.svs.cl
Pgina de Consorcio Nacional de Seguros: www.consorcio.cl
35
VI. ANEXOS
Conceptos Bsicos
1
Basado en Manual Autoinstructivo de Productos Consorcio, Gerencia de Recursos Humanos Consorcio Financiero, 2006.
36
Clasificacin de los Seguros
37
ANEXO B: TABLAS DEL MODELOS DE DATOS
Las tablas que sern fuente central para este estudio y sus respectivos atributos
principales son:
39