Documentos de Académico
Documentos de Profesional
Documentos de Cultura
I. BUSINESS UNDERSTANDING
1. Context
Sin lugar a duda los modelos predictivos y las teorías de la decisión juegan un papel muy importante para el sector
financiero hoy en día. El credit scoring es tan solo una de sus tantas aplicaciones, definido como un sistema predictivo,
automatizado y personalizado para soportar la elección de decisiones crediticias de los clientes. El scoring tiene como
objetivo realizar los procesos de análisis de datos y valoración de préstamos sobre un solicitante, en el cual se puede
recomendar su aprobación o rechazo.
Los datos adquiridos para la toma de decisiones son generalmente facilitados por el cliente (solicitados en entrevistas
o formularios), aunque también pueden ser adquiridos por fuentes terceras. En Colombia estas fuentes se conocen
como centrales de información o centrales de riesgo, en donde se almacena y se procesa información sobre el
comportamiento de pago de las obligaciones de las personas naturales y/o jurídicas.
Hoy en día los bancos tradicionales llevan a cabo el Scoring por medio del analista, quien es el encargado final de la
toma de decisión para otorgar un crédito. Las variables mínimas que suelen contemplarse son las siguientes:
Finalidad del
crédito
% de Ingresos
Patrimonio Vs. Pagos
comprometidos
Tasa de
Declaración de
Endudamiento
bienes
Vs. Patrimonio
Por otro lado, existen entidades que poco a poco han evolucionado para obtener un scoring de una forma más
automatizada y menos dependiente del analista. En España se le conoce como online scoring, en donde a partir de la
predicción obtenida por el modelo, se toma la decisión manual de retener o no la solicitud del crédito en cuestión. Al
tratarse de una “máquina” la que está decidiendo, las entidades financieras pueden agregar la cantidad de variables
que consideran relevante para realizar un scoring con alta precisión, como por ejemplo metadatos de las redes sociales,
análisis de comportamiento en las redes sociales, número de conocidos, etc. [2].
Se puede argumentar que el scoring surge como la necesidad de eliminar el sesgo humano (afinidad, sentimientos) y
en dicha medida, reducir la mala calificación y homogenizar las respuestas a las solicitudes de crédito. Cuando las
1
entidades no utilizan scoring, aumenta el riesgo de que la persona a la cual se le esté prestando el monto incumpla, lo
cual repercute en pérdidas para el negocio.
Según BBVA [2] es muy importante asegurar la calidad de los datos ingresados en el modelo de predicción de scoring,
ya que puntos críticos o atípicos harán que el modelo no funcione correctamente. Por esta razón, es necesario hacer
una validación previa sobre la coherencia de los datos que ingresan al modelo. Del mismo modo, de acuerdo con
TransUnion USA, los scoring tienen una función vital en el crecimiento de la economía, ya que ayudan a ampliar al
acceso de mercados de crédito, reducen el valor de la prima y disminuyen las tasas de morosidad en los bancos.
Gracias a los scoring las decisiones de otorgamiento de préstamos son más rápidas y justas, además que la velocidad
con la que se puede otorgar un crédito utilizando este modelo se ve traducido en una reducción de costos relacionados
con el papeleo y procedimientos engorrosos que ya no se utilizarán [1].
2. Business Objectives
De acuerdo con la situación actual y los beneficios que trae el scoring en el sector financiero se presentan los siguientes
objetivos para el negocio:
Nota: Se define un valor mayor de sensibilidad que de precisión ya que de acuerdo con el contexto del negocio, es
preferible predecir correctamente aquellos clientes que no van a pagar, a predecir correctamente aquellos que si van
a pagar.
2
Autocontrol Cuantitativa discreta Mediante una prueba escrita se mide el nivel de autocontrol de la
persona, en puntaje de 0 a 100
Impulsividad Cuantitativa discreta Mediante una prueba escrita se mide el nivel de impulsividad de la
persona, en puntaje de 0 a 100
Confianza Cuantitativa discreta Mediante una prueba escrita se mide el nivel de confianza en sí misma
de la persona, en puntaje de 0 a 100
Incumplimiento Cualitativa nominal Cumplimiento (0), Incumplimiento (1)
Tabla II-1 Descripción Base de Datos
2. Data Exploration
A continuación se muestran las medidas de tendencia central:
§ Se observa que para el caso de las variables Autocontrol, Impulsividad y Confianza, las distribuciones son muy
similares y con un comportamiento casi simétrico (skew y kurtosis con valores de cero). De esta manera, se
concluye que la mayoría de los clientes toma una postura neutra (puntaje 50) en las encuestas realizadas por el
banco.
§ La variable Tiempo_empleado presenta una cantidad considerable de puntos atípicos positivos. De esta manera,
se concluye que a pesar de que la edad tendencia de los clientes es de 5 años, hay personas hasta con 48 años
solicitando un crédito. En una mayor medida, la variable Saldo_cuenta es altamente asimétrica, con montos que
van desde los $0.05 hasta los $550000.
§ La tendencia del monto de los créditos es de $2474, con la presencia de algunos puntos atípicos con valores mucho
más pequeños a esta cifra. Del mismo modo, la tendencia del número de cuentas en otros bancos es de 1, a pesar
de que hay clientes con hasta 7 cuentas más en otros bancos.
Para la identificación de patrones entre las variables predictoras y la variable objetivo, se procedió a graficar los
diagramas de cajas de cada una, separando los clientes que incumplieron o no con el pago de sus créditos. Los
resultados obtenidos fueron los siguientes:
§ Las variables Autocontrol, Impulsividad y Confianza no aparentan tener un gran efecto en el pago de los clientes,
ya que hay personas que incumplen y tienen altos niveles de confianza y autocontrol, así como también personas
que cumplen y tienen altos niveles de impulsividad.
3
Figura II-1 Comportamiento de las variables clasificado por incumplimiento.
§ El saldo de la cuenta y el valor de préstamo tampoco parecen tener una relación significativa con el incumplimiento
del pago. Si bien es cierto que los clientes tienden a incumplir más cuando se les presta un poco menos, el patrón
no es lo suficientemente claro para afirmar que sea una de las causas principales.
§ El tiempo de empleo de los clientes tampoco denota un patrón decisivo para describir si los clientes incumplen o
no. Como se puede ver en la gráfica, las medianas de las cajas son similares y en ambos casos existen puntos
atípicos positivos con valores similares.
§ La cantidad de cuentas en otros bancos demuestra un claro patrón en el cumplimiento del crédito. Absolutamente
todos los clientes con más de una cuenta en otro banco hacen los pagos oportunamente, mientras que la mayoría
de los que incumplen es porque tienen una o ninguna cuenta adicional.
4
De acuerdo con lo hallado en el punto anterior, la variable que prácticamente decide si un cliente paga oportunamente
o no es la cantidad de cuentas en otros bancos. No obstante, existen observaciones de clientes que no tienen cuentas
extras y sin embargo pagan sus créditos de forma puntual.
Basados en esta premisa, se decidió hacer una exploración más profunda de este conjunto de datos, con el objetivo
de identificar que patrones diferencian a esos clientes que incumplen y no tienen cuentas, a los que cumplen y tampoco
tienen cuentas.
§ Las variables Confianza, Autocontrol, Impulsividad, Saldo_cuenta, Valor_prestamo y Tiempo_empleo para el grupo
de clientes que no tienen cuentas no revela patrones ni diferencias importantes con relación a las cajas graficadas
anteriormente:
Figura II-4 Comportamiento de las variables clasificado por incumplimiento y sin deuda activa.
Sin embargo, al cruzar cada una de las variables numéricas con la variable Valor_prestamo (gráfico de puntos) se
hacen dos descubrimientos:
b. Existe un conjunto de datos atípicos (más de 2 desviaciones por debajo de la media) que rompen con el patrón
de agrupación por clústeres descrito en el literal a. Estos hacen alusión montos de préstamos con valor 0.
5
Figura II-5 Tendencias de las variables con respecto a la variable Valor_prestamo
- Existen registros donde la variable Empleado es 1 (el cliente tiene trabajo) y la variable Tiempo_empleado es 0 (0
años de experiencia). Estos datos posiblemente hacen alusión a clientes que efectivamente están empleados pero
que no han cumplido el primer año de trabajo.
- Tal y como se descubrió en la exploración de datos, existen clientes que fueron catalogados con incumplimiento
(Incumplimiento = 1) y sin embargo el valor del préstamo diligenciado es 0 (Valor_prestamo=0). Esta relación no
tiene sentido en el contexto del negocio, y como no se proporciona información adicional sobre este tipo de
condiciones, se excluirán estos datos en la construcción del modelo.
- No existe un criterio con la suficiente certeza que permita corregir estos puntos (ej. Considerar que se trata de
clientes que van a quedar en mora de su primer crédito)
- Dichos registros afectan la relación de las otras variables con la variable Valor_prestamo, de acuerdo con las
gráficas visualizadas.
- De los 6000 registros eliminados, solamente un bajo porcentaje (10%) corresponden a clientes que no tienen
cuentas en otros bancos (Cuentas_otros = 0). De esta forma, no se pierde información relevante para el modelo a
construir ya que la mayoría de los datos desechados son registros en donde ya se sabe que va a cumplir el pago.
IV. MODELING
1. Build Model
- Consideraciones
6
Para realizar un modelo de clasificación existen un gran número de algoritmos a utilizar. A partir del alcance del
presente curso y por las características de la base de datos en cuestión (variables explicativas y variable objetivo) las
posibilidades de elección fueron KNN, Naive bayes y regresión logística.
Se descartó la técnica de Naive Bayes dado que este método supone la independencia en todas las variables
explicativas que existen la base de datos, lo cual en el presente contexto no sucede y podría afectar de forma
significativa el desempeño del clasificador. Del mismo modo, el algoritmo de KNN fue desechado en la medida que es
un algoritmo exigente computacionalmente y que además, no se comportaría adecuadamente en bases de datos tan
desbalanceadas como la del problema.
Se decidió entonces aprovechar las ventajas que trae consigo el modelo de la regresión logística (de naturaleza
binaria), teniendo en cuenta las siguientes consideraciones:
Tal y como se esperaba según la exploración de los datos, la variable Cuenta_otros es la que mayor coeficiente tiene
en el modelo, y por ende, la que mayor aumenta la probabilidad de que el cliente cumpla. En menor medida, las
variables Confianza e Impulsividad son los predictores que clasificarán el cliente cuando este no tenga cuentas en
otros bancos (Aumenta la probabilidad de cumplimiento si tiene mayor confianza, y disminuye la probabilidad de
cumplimiento si tiene mayor impulsividad). Finalmente, se observa que la variable Autocontrol fue descartada del
modelo y que todos los predictores seleccionados tienen una alta significancia en la prueba de hipótesis.
2. Assess Model
1. Criterio 1 - FSCORE: Para nuestro caso será el punto de partida para la elección del modelo ya que es una
métrica que muestra la relación entre la precisión y el Recall por medio de una ponderación igual a las dos métricas.
7
Además es el criterio de evaluación del concurso en Kaggle. Para nuestro caso debe ser mayor a 0.80. (Entre
mayor sea el F-SCORE mayor rendimiento mostrará el modelo)
2. Criterio 2 - Precisión: Se desea que el modelo generado obtenga una alta precisión y que por lo menos esta sea
mayor que el 70 %. Con esto estamos asegurando que la mayoría de los clientes que van a incumplir sean
catalogados como tal (Disminuimos la tasa de error en la clasificación)
3. Criterio 3 - Sensibilidad o Recall . Se desea que la proporción de personas predichas con incumplimiento en su
deuda correctamente clasificada sea grande. La sensibilidad también ayuda como marco para aumentar la tasa de
Verdaderos Positivos. Esto es bastante interesante ya que entre más grande sea este valor, mayores ganancias
se obtendrán de este modelo predictivo. Para este criterio hemos definido un criterio de aceptación mayor al 80%.
La base de datos de validación fue construida con el 30% de los datos totales. Se aseguró que el 80% de los datos a
validar correspondieran a la clase Incumplimiento = 0 (Clientes que cumplen) y el restante a los que incumplen. Estas
proporciones de validación simulan la que posiblemente va a aparecer en el set de pruebas.
Antes de evaluar las medidas de desempeño definidas en los criterios de aceptación, fue necesario ajustar el
Thereshold utilizando la curva ROC con las predicciones del set de datos de validación:
Como se mencionó en la sección Build Model, lo que se busca evaluar de este parámetro es aumentar el valor de la
sensibilidad (true positive rate) y disminuir el False Positive Rate. Se puede observar que un punto que cumple esta
condición es cuando el False Positive Rate toma un valor aproximado de 0.0625 (codo de la gráfica). El thereshold
utilizado en ese punto fue de 0.2353276.
8
V. EVALUATION
1. Evaluate results Mining Results
La proporción de clientes que cumplieron e incumplieron según las predicciones de la base de datos de prueba fueron
las siguientes:
Se hace necesario aclarar que la base de pruebas con la cual se calificará de manera definitiva el modelo se liberará
después de haber entregado el presente reporte (Resultado Kaggle con el 70% de los datos). De esta manera, se
presentan los resultados obtenidos por con el 30% del dataset de prueba proporcionado por el banco:
Como se puede ver, los resultados parciales con el dataset de prueba sugieren que el modelo no solamente está
prediciendo bien aquellos clientes que incumplen, sino también aquellos que cumplen.
2. Resumen de recomendaciones
Objetivo Respuestas
1. Clasificar por cliente, si va a incurrir en un Se logra clasificar a 3114 clientes como aquellos que van
incumplimiento del pago por la deuda. a incumplir con el pago de su deuda.
2. Clasificar por cliente, si va a cumplir en el pago Se logra clasificar a 3048 clientes como aquellos que van
por la deuda. a cumplir con el pago de su deuda.
3. Pronosticar el número de créditos aprobados El número de créditos que pueden ser aprobados con la
para futuros ciclos. base de datos completa va a ser ≥ 3114 créditos.
Dependiendo del número de analistas y el número de
solicitudes que en promedio se reciben por año, es
posible realizar marcar un número mínimo de aprobación
4. Fijar metas para los analistas de crédito para la de créditos por trimestre (3 meses). Lo ideal sería
obtención de un número mínimo de créditos repartir el número pronosticado de créditos que se
aprobados. pueden aprobar entre el número de analistas de crédito
del área. Así se obtiene el número de créditos mínimo de
aprobación en el año. Luego utilizando 4 trimestres para
llevar un control de la meta trazada.
VI. REFERENCES
[1] TransUnion, “La importancia de los scoring para el crecimiento económico”, TransUnion White Papper, Chicago, Illinois, 2007, [Online].
Available: https://www.transunion.com/docs/interstitial/scoringWhitepaper_Mexico.pdf
[2] BBVA, (2019), Scoring, el programa que aprueba tu crédito. (Articulo de blog) [Online],Available: https://www.bbva.com/es/lo-saber-la-psd2/