Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Leer PDF
Leer PDF
Estefanía Meza Saldaña (FCFM, BUAP), Dra. Hortensia Reyes Cervantes (FCFM, BUAP),
Dra. Blanca Rosa Pérez Salvador (UAM, Iztapalapa), Dr. Francisco Solano Tajonar Sanabria
(FCFM, BUAP).
Resumen— La Estadística tiene una importante crédito, y el deudor no puede pagar su deuda por
presencia dentro de las Ciencias Sociales, Economía diferentes factores, [6].
y Finanzas principalmente, aportando herramientas La modelación de la falla financiera, tanto en
para un mejor desarrollo de soluciones a problemas personas como en empresas, ha sido un problema
que se susciten dentro de estos ramos, con la ayuda
altamente estudiado en la literatura [1]. Se han
de los avances tecnológicos al aumentar la capacidad
de almacenaje de información y un mejor manejo de
desarrollado modelos matemáticos y estadísticos
bases de datos. que buscan predecir el desempeño que tendría una
En Finanzas, se encuentra el concepto de riesgo, el persona si se le otorgase un crédito mediante la
cual está relacionado con la posibilidad de que asignación de un puntaje estimado a partir de la
suceda un evento que se traduzca en pérdidas para información del cliente, llamando a esta
los participantes involucrados. Existen diferentes problemática como Credit Scoring, [7].
tipos de riesgo, entre ellos está, el riesgo de crédito, La utilización de modelos de Credit Scoring para
el cual se da cuando existe un contrato de crédito y la evaluación del riesgo de crédito, es decir, para
existe la posibilidad de que el deudor no pueda estimar probabilidades de incumplimiento y
pagar su deuda por diferentes factores.
ordenar a los deudores y solicitantes de
En las últimas décadas, se han desarrollado avances
dentro de la automatización de la decisión sobre la financiamiento en función de su riesgo de
aceptación o rechazo de una solicitud de crédito a incumplimiento se ha desarrollado dentro de las
través de modelos analíticos, matemáticos y últimas cuatro décadas [2], esto debido al
estadísticos que buscan predecir el desempeño que desarrollo de mejores recursos estadísticos y
tendría una persona si se le otorgase un crédito computacionales.
mediante la asignación de un puntaje estimado a Dentro de los métodos estadísticos más comunes
partir de la información disponible del cliente. A este para el desarrollo de Credit Scorings se
problema se le conoce como Credit Scoring. encuentran: Análisis Discriminante, Modelo de
Dentro de los métodos estadísticos que existen, se
Probabilidad Lineal, Modelo Logit, Modelos de
encuentran los Modelos Logit, método utilizado en
este trabajo para la estimación de la probabilidad de Programación Lineal, Redes Neuronales, Arboles
incumplimiento de un cliente para cierta entidad de decisión, entre otros.
financiera. La predicción del incumplimiento de un préstamo
tiene una utilidad muy práctica. De hecho, la
Palabras clave: Regresión logística, Credit identificación del riesgo de incumplimiento parece
Scoring, Riesgo de crédito, Modelos de Respuesta ser de suma importancia para los emisores de
Binaria. créditos financieros.
En este trabajo se desarrolla un modelo estadístico
I. INTRODUCCIÓN integrado para evaluar un préstamo otorgado por
una entidad financiera, mediante el análisis de la
En Finanzas, el riesgo está relacionado con la información que se tiene de cada uno de los
posibilidad de que suceda un evento que se clientes, a través de un Modelo de Regresión
traduzca en pérdidas para los participantes Logística, para obtener las características más
involucrados. Existen diferentes tipos de riesgo en significativas y poder establecer una regla de
los mercados financieros, entre ellos se aceptación, con la ayuda de una base de datos
encuentran, el riesgo de mercado, riesgo de alemana de 1994 (disponible en la red).
operación, riesgo de contraparte y riesgo de
crédito, este último es el que se maneja en este
trabajo, definiéndolo como caso particular del
riesgo de contraparte, cuando el contrato es uno de
II. PRELIMINARES Lo cual implica que la varianza de los
En esta sección se presenta parte de la teoría errores depende de las x’s y no es
principal para el desarrollo de un modelo de constante.
Regresión Logística para un Credit Scoring. Normalidad: Por lo general es la
II.I Modelos para variables de Respuesta Binaria. distribución binomial, la que modela a
los errores.
Las variables dependientes binarias son muy Predicciones sin sentido: Los valores
comunes dentro de las ciencias sociales, existen estimados de y en el modelo pueden ser
diversos modelos para el análisis de estas negativos o mayores a 1.
variables, a continuación se presentan: El Modelo II.I.II Modelos Probit y Logit.
de Probabilidad Lineal, el Modelo Probit y el Para evitar las limitaciones del Modelo de
Modelo Logístico. Probabilidad Lineal, se considera una clase de
II.I.I Modelo de Probabilidad Lineal modelos de la forma;
𝑃𝑃(𝑦𝑦 = 1|𝑥𝑥) = 𝐺𝐺 (𝛽𝛽0 + 𝛽𝛽1 𝑥𝑥1 + ⋯ + 𝛽𝛽𝑘𝑘 𝑥𝑥𝑘𝑘 ).
De acuerdo a [5] la estructura del modelo aplicado En donde G es una función que toma valores
a una variable dependiente binaria es: estrictamente entre cero y uno para todos los
𝑦𝑦𝑖𝑖 = 𝑥𝑥𝑖𝑖𝑇𝑇 𝛽𝛽 + 𝜖𝜖𝑖𝑖 . números reales. Esto asegura que las
En donde 𝑥𝑥𝑖𝑖 es un vector de variables explicativas probabilidades de respuesta estimadas están
estrictamente entre cero y uno.
para la observación i-ésima, 𝛽𝛽 es un vector de
parámetros y 𝜖𝜖𝑖𝑖 es el término de error.
En el modelo Probit, G es la función de
distribución acumulada normal estándar,
Considerando a la Esperanza condicional de y, 𝑧𝑧
𝐸𝐸(𝑦𝑦|𝒙𝒙), se observa que para la observación i- 𝐺𝐺 (𝑧𝑧) = Φ(𝑧𝑧) = � 𝜑𝜑(𝑣𝑣)𝑑𝑑𝑑𝑑.
ésima: −∞
1� (−𝑧𝑧 2� )
𝐸𝐸 (𝑦𝑦𝑖𝑖 |𝑥𝑥𝑖𝑖 ) = [1×𝑃𝑃(𝑦𝑦𝑖𝑖 = 1|𝑥𝑥𝑖𝑖 )] Donde 𝜑𝜑(𝑧𝑧) = (2𝜋𝜋)− 2 𝑒𝑒 2 .
+ [0×𝑃𝑃(𝑦𝑦𝑖𝑖 = 0|𝑥𝑥𝑖𝑖 )]
= 𝑃𝑃(𝑦𝑦𝑖𝑖 = 1|𝑥𝑥𝑖𝑖 ). En el modelo Logit, G es la función logística:
Por lo tanto, el valor esperado de y dado x, es la exp(𝑧𝑧)
probabilidad de y = 1 dado x. 𝐺𝐺 (𝑧𝑧) = .
1 + exp(𝑧𝑧)
Por lo que reescribiendo el Modelo de
Probabilidad Lineal queda: II.I.III Modelo de Regresión Logística.
𝑃𝑃(𝑦𝑦𝑖𝑖 = 1|𝑥𝑥𝑖𝑖 ) = 𝑥𝑥𝑖𝑖𝑇𝑇 𝛽𝛽.
Generalmente los resultados binarios provienen
Interpretación: de una relación no-lineal entre la variable
“por cada unidad que incremente 𝑥𝑥𝑘𝑘 , el cambio respuesta y las variables independientes del
esperado en la probabilidad de que ocurra el modelo.
evento, es 𝛽𝛽𝑘𝑘 , manteniendo las variables restantes
constantes.” Dado que el modelo es lineal, un La Regresión Logística es un modelo
cambio unitario en 𝑥𝑥𝑘𝑘 siempre resultará en el probabilístico, y es una de las técnicas más
mismo cambio en la probabilidad. utilizadas en algunos modelos de Credit Scoring,
Existen diferentes desventajas en la aplicación de usando este modelo para calcular la probabilidad
este modelo, la principal es que: de que un sujeto sea merecedor de un crédito.
Las probabilidades estimadas pueden ser menores Se basa en la Función Logística, la cual expresa
a cero o mayores a uno. una relación entre dos o más variables de forma
Mientras que la interpretación de los parámetros que a cada elemento x del conjunto
no cambia al tener una variable de respuesta independiente, X, le corresponde un único
binaria, varias suposiciones del modelo son elemento 𝜋𝜋(𝑥𝑥) y está representada por:
quebrantadas, [5].
Heterocedasticidad: La varianza 1 𝑒𝑒 𝑥𝑥 (1)
condicional de y dado x es: 𝜋𝜋(𝑥𝑥) = =
1 + 𝑒𝑒 −𝑥𝑥 1 + 𝑒𝑒 𝑥𝑥
𝑉𝑉𝑉𝑉𝑉𝑉(𝑦𝑦|𝑥𝑥) = 𝑃𝑃(𝑦𝑦 = 1|𝑥𝑥)[1
− 𝑃𝑃 (𝑦𝑦 = 1|𝑥𝑥)] Su gráfica es una curva S o Sigmoidea, tiene un
= 𝑥𝑥𝑥𝑥 (1 − 𝑥𝑥𝑥𝑥 ). único punto de inflexión en el que cambia la
concavidad y la rapidez del crecimiento ver la
Figura (2.1).
Y dado que las n observaciones son
independientes, la densidad conjunta o la
función de verosimilitud de (𝑌𝑌1 , 𝑌𝑌2 , … , 𝑌𝑌𝑛𝑛 ) es,
𝑙𝑙(𝛽𝛽0 , 𝛽𝛽1 ) = 𝑓𝑓1 (𝑦𝑦1 )×𝑓𝑓2 (𝑦𝑦2 )× ⋯×𝑓𝑓𝑛𝑛 (𝑦𝑦𝑛𝑛 )
𝑛𝑛
9. Género-EdoCivil: Clasificación
1 = Hombre: Divorciado/Separado. La tabla de clasificación indica paso a paso
2 = Mujer: Divorciada/Separada/Casada. la clasificación de clientes cumplidos
3 = Hombre: Soltero. (Buenos) e incumplidos (Malos). En ella se
4 = Hombre: Casado/ Viudo. pueden ver el total de proporciones
5 = Mujer: Soltera. correctamente clasificadas en cada uno de
los grupos.
10. Otros planes de pago: Tipo de crédito
simultáneo.
1 = Bancario.
2 = Tiendas departamentales.
3 = Ninguno.
Poder Discriminatorio
Es la capacidad que tiene el modelo para
poder clasificar de manera correcta los
Tabla 1 préstamos.
La curva ROC brinda una representación
En la Tabla 1 se muestra cada escalón con gráfica del poder discriminatorio de un
los valores obtenidos, se obtuvo un nivel sistema de Scoring.
de bondad de ajuste del 67.5% en tercer y
último escalón, con lo cual se puede decir
que el modelo tiene un buen ajuste.
Poder Predictivo
El poder predictivo del modelo es la
capacidad que tiene de predecir la variable
dependiente, sustentado en los valores de
las variables independientes.
Tabla 2
30% de los datos contiene una proporción similar
de buenos y malos como la muestra del 70%.
Cuando se estimaron los coeficientes se aplica el
modelo a esta muestra con el mismo punto de
corte. Los resultados revelaron una sensibilidad
del 92:86% y una especificidad del 42.22 %, con
una clasificación total correcta del 77.7%
Tabla 4