Está en la página 1de 1

Arquitectura CRM en la Banca: Caso prctico del segmento de Tarjetahabientes

de una Institucin Financiera


Ral Fernndez Naranjo
Escuela Politcnica Nacional

Resultados

En la actualidad los bancos cuentan con amplios


repositorios de informacin sobre sus clientes, por
lo que es posible aplicar tcnicas de CRM analtico
a travs de la combinacin de herramientas estadsticas para identificar patrones de comportamiento
en los clientes y definir criterios y reglas sobre los
mismos. Las estrategias de administracin de la
relacin con el cliente, conocidas como CRM, ayudan a los bancos a mantener sus clientes actuales,
atraer nuevos clientes y fidelizar a aquellos clientes
propensos a abandonar la organizacin, as se conseguirn elevados beneficios y una mejor posicin
frente a sus competidores mediante la gestin efectiva de sus clientes. La principal ventaja del CRM
analtico es que facilita a los administradores bancarios la toma de decisiones referentes a los clientes
y brinda un fuerte respaldo tcnico en comparacin
con otra estrategias administrativas.

Una vez calculadas las nuevas variables por categora


se procedi a realizar un Anlisis de Componentes Principales (ACP) considerando nicamente las variables de Monto Total, Monto Promedio
y Frecuencia de uso en cada categora. La finalidad
de esta accin es reducir la dimensionalidad de las
variables y obtener un nuevo conjunto que explique
la interaccin de todos los atributos inicialmente considerados. Para la eleccin de las variables que explican la relacin entre las diversas variables se tomaron
aquellos componentes cuya varianza acumulada es al
menos de 70%. De los 24 componentes obtenidos el
nmero se redujo a 7 componentes, los cuales tienen
alta correlacin con las diferentes categoras de consumo con tarjeta de crdito. Los componentes derivados del ACP se emplearn en un Modelo de mixtura para clustering, de esta manera se obtendrn
segmentos de clientes y tales segmentos sern refinados
mediante el uso de Mquinas de Soporte vectorial y rboles de decisin.

El modelo de mixtura empleado para clustering produjo los segmentos que se detallan a continuacin:
Segmento 1 (8135 clientes).- Usuarios Ocasionales. Contribuyen en un 0.64% al monto total gastado con tarjeta de crdito. Ingreso promedio de
305.34 dlares y una cuenta abierta en la Institucin
Financiera por 10.58 aos.
Segmento 2 (9564 clientes).- Usuarios Tpicos.
Contribuyen en un 17.74% al monto total gastado con
tarjeta de crdito. Ingreso promedio de 367.42 dlares
y una cuenta abierta en la Institucin Financiera por
10.93 aos.
Segmento 3 (10895 clientes).- Clientes de Familia. Contribuye en un 38.20% al monto total gastado con tarjeta de crdito. Ingreso promedio de
441.88 dlares y una cuenta abierta en la Institucin
Financiera por 11.39 aos.
Segmento 4 (4846 clientes).- Jvenes consumidores. Contribuyen en un 15.40% al monto total
gastado con tarjeta de crdito. Ingreso promedio de
444.27 dlares y una cuenta abierta en la Institucin
Financiera por 10.86 aos.
Segmento 5 (3113 clientes).- Clientes Gold.
Contribuyen en un 28.02% al monto total gastado con
tarjeta de crdito. Ingreso promedio de 735.99 dlares
y una cuenta abierta en la Institucin Financiera por
12.03 aos.

Problema
Los clientes tarjetahabientes de la Institucin Financiera en anlisis pueden emplear sus tarjetas de
crdito en diferentes sitios. El principal inconveniente
de la Institucin Financiera es que al no conocer cuales
son las preferencias de consumo de los clientes no
puede generar acciones personalizadas sobre estos y
pierde valiosas oportunidades en el mercado de tarjetas de crdito. Para el estudio se dispone de una base
de datos de 36672 clientes con las variables Monto
cargado a tarjeta y Establecimiento. Con el objeto de una mejor interpretacin de los resultados las
transacciones de los clientes fueron agrupadas en 8
categoras: Hogar, Entretenimiento, Familia, ATMs,
Pagos e Impuestos, Telefona, Viajes y Otros. En cada
categora se procedi a calcular las variables Monto
total gastado por categora, Monto promedio gastado por categora, Frecuencia de uso por categora
y Porcentaje de gasto por categora. Una vez que se
tienen dichas variables se implementarn herramientas estadsticas a fin de definir patrones y generar
conocimiento sobre los clientes.

Mquinas de Soporte Vectorial


Dado un conjunto de individuos de entrenamiento,
donde cada individuo pertenece a una de las clases
asignada por la variable objetivo (por ejemplo M o
N), se procede a recodificar la etiqueta para cada individuo de acuerdo al conjunto Y = {1, +1}; el
conjunto de individuos de entrenamiento esta dado
p
por {(x1, y1), . . . , (xn, yn)} con xi R y yi Y ,
i = 1, . . . , n. Este conjunto de individuos se dice linealmente separable si es posible encontrar un hiperplano en Rn que puede separar las dos clases del conjunto de individuos de entrenamiento con un mximo
margen. Como se desea hallar una separacin mxima, para asegurar que el hiperplano de mximo margen se pueda encontrar se debe resolver el siguiente
problema de optimizacin:
2
(1)
max
w,b kwk
s.a.

yi(w xi + b) 1,

i = 1, . . . , n

La resolucin del problema de optimizacin permite


clasificar nuevos individuos y maximizar la separacin
entre clases.

Distribucin de Clientes con los


Segmentos Originales

40
Segmento

Frecuencia de uso

Aplicacin

30

2
3

20

4
5

10

0
0

500

1000

1500

Monto gastado con tarjeta de crdito

Distribucin de Clientes aplicando


Mquinas de Soporte Vectorial

40
Clasificacion

Frecuencia de uso

Resumen

30

2
3

20

4
5

10

0
0

500

1000

1500

Monto gastado con tarjeta de crdito

rbol de Decisin aplicado sobre


los segmentos de clientes refinados

Validacin
Con los 5 segmentos antes descritos se implementaron
modelos de Mquina de Soporte Vectorial empleando
los dos mtodos de los que dispone: Uno contra uno
y Uno contra todos. La capacidad predictiva de las
diferentes configuraciones se evalu con la medida AUROC multiclase, una variante del AUROC empleado
para evaluar a modelos de clasificacin cuya variable
dependiente posee dos clases. Para los dos casos se
consigui el mayor AUROC en 0.6 y correspondi a
una combinacin de un ncleo de transformacin radial y un costo de penalizacin de los individuos mal
clasificados de 10. El modelo con dichos antecedentes
refinar los segmentos para tener menos variabilidad
dentro de los mismos.

yes Rango = 1

no

3
30% of 21,931
2

cl_md_ingreso_mensual < 87

cl_des_nivel_academico = FIOT,M/S,PRI,SIE

1
39% of 3,829

3
32% of 18,102

1
42% of 3,491

cl_md_ingreso_mensual < 900

cl_md_edad >= 44

3
31% of 2,836

3
33% of
10

3
41% of

3
32% of 15,266

338
11

163

5
42% of

175

12

13

3
33% of 5,526

cl_md_ingreso_mensual < 376


3
31% of 9,740
26

27

2
31% of 3,728

3
33% of 6,012

Rattle 2013may07 20:41:00 Ral Fernndez

Referencias
[1] J. M. Smith and A. B. Jones.
Book Title.
Publisher, 7th edition, 2012.
[2] A. B. Jones and J. M. Smith.
Article Title.
Journal title, 13(52):123456, March 2013.