Está en la página 1de 17

Machine Learning

“Caja Los Andes”


Fases del proyecto
Comprensión

Negocios y Datos

Evaluación y Desarrollo Preparación

Evaluación y puesta en Datos


marcha de los modelos

Modelado

Métodos Tradicionales y
No Tradicionales
1. Planteamiento del Problema
● Negocio: BankPeru se encuentra en el Rubro banca empresarial y
personal, pero quiere hacer más eficiente la gestión de su
portafolio de clientes en el segmento de tarjetas de crédito como
prioridad número uno.

● Segmento de Clientes : El segmento de Clientes está enfocado


en personas que tengan una tarjeta de Crédito y están en el rango
de edad de 18 a 55 años.
1. Planteamiento del Problema
● Hipótesis : Es posible reducir la tasa de morosidad dentro de la
cartera de clientes, a través de una estrategia de prevención de
que los clientes no caigan en Mora Crediticia en «BankPeru».

● Que acciones se tomaran con los entregables: las acciones a


tomar son la siguientes:
● Segmentar de una manera eficiente nuestra cartera de clientes de
tarjetas de créditos.
● Prevenir que el cliente caiga en mora y este le ocasiona una pérdida al
negocio en sus utilidades.
● Definir estrategias de marketing enfocadas en la prevención para la
reducción de la morosidad en la cartera de clientes: reduccion de Linea
de Crediticia de TC, Contactarse con el cliente para informarles sobre
sus pagos
1. Planteamiento del Problema
● Que acciones se tomarán con los entregables:
● También comparamos modelos Tradicionales vs los modelos
no Tradicionales.
● la medición de Eficiencia de los modelos mencionados.
2.Acceso a datos

● Tipos de Datos , se van a manejar los datos de clientes, los


score de como se encuentran actualmente y en su historia,
Dias de Mora, Flag de Mora, fechas de facturacion y
Montos sobre lo que tiene de TC por Pagar y Consumir
● Estructurados
● No Estructurados
3. Modelo de Machine Learning
● El modelo para este trabajo será enfocado en desarrollar
modelos Tradicionales y no Tradicionales.

● Para darle soporte a estos modelos predictivos podemos


generar previamente modelos del tipo árboles de
decisión o cluster para poder segmentar adecuadamente
nuestro portafolio de clientes

● El comparativo de estos modelos para ver si existe alguna


diferencia o mejora entre estas.
4. Preparación y análisis de los datos
Variables Cuantitativas
Disponemos de un dataset de 856 variables

Deuda_ Línea Línea Línea Saldo Para la variable Línea Actual


prestamo Actual Rapicash Supercash Normal vemos que el promedio de
Línea es S/ 3 499. Sin
Q25 0 700 80 0 195 embargo, la mitad de los
usuarios no disponen de una
Media 5738 3499 2406 1375 1218 línea por debajo de los S/ 1
600.
Mediana 0 1600 480 0 564
Un 25% de los clientes tienen
Q75 3494 3600 2200 0 1345 una línea que supera los S/ 3
600
4. Preparación y análisis de los datos

A partir del 2010, el número de clientes se duplico, en tanto que hacia el 2015, este
número se aproximaba hacia los 2,500 clientes
4. Preparación y análisis de los datos

A partir del 2010, el número de clientes se duplico, en tanto que hacia el 2015, este
número se aproximaba hacia los 2,500 clientes
4. Preparación y análisis de los datos
4. Preparación y análisis de los datos

50.2%
49.8%

47.8% 52.2%
4. Preparación y análisis de los datos
Clientes

Evolución de la tasa de morosidad


No Clientes

Evolución de la tasa de morosidad


5. Método Tradicional
Decision Trees Medidas del modelo

precision recall f1-score support


No moroso 0.94 0.83 0.88 889

Moroso 0.90 0.97 0.93 1360

% respecto 0.91 0.91 0.91 2249


total

Matriz de confusión
Predicho No Moroso Total Modelo sin tuning de parámetros
Real moroso
Accuracy (A) = 91.1%
Recall (R) = 96.7%
No moroso 736 153 889
Precision (P) = 89.6%

Moroso 45 1315 F1S = 92.9%


1360
Total 781 1468 2249
Contacto

@jonnychambi

facebook/jonny.chambi

linkedin.com/in/jonnychambi

Jonny.chambi@dmc.pe

17

También podría gustarte