Está en la página 1de 9

Alumno: Cristhian Jair Rosadio Aranibar

a) Selección de la muestra
La base de datos (BBDD) contiene información de 4000 registros sobre 830 empresas del sector manufactura
de una Financiera ABC importante en el país. La información contiene registros desde 1999 a 2004.

Existen 3 métodos de validación: Resubstitution Method, Holdout Method y Cross Validation. El primer
método se utiliza la muestra total para validar el modelo, la desventaja es que no es un buen indicador para
un performance a futuro en otras palabras no sabemos cómo se comportará nuestro modelo con data futura,
el segundo método es el más utilizado lo cual se reserva una cantidad para el testing y usar la restante para
el training, y en el tercer método los datos se dividen en K subconjuntos (folds). Uno de los subconjuntos se
utiliza como datos de prueba y el resto (K-1) como datos de entrenamiento, será repetido durante k
iteraciones, la desventaja es que la programación se vuelve mucho más complicada además el tiempo de
ejecución puede ser muy alto debido a que se genera “n” modelos.

Según se indica en la tabla N°1 aplicaremos el método de Holdout Method. La muestra fue dividida
aleatoriamente en dos submuestras sin reemplazo. Usualmente se utiliza un tercio para testing y el resto
para el training. Ambos son muestras representativas del problema subyacente. La intención es realizar una
validación a posteriori sobre los modelos a utilizar, destinando el 70% de los casos totales a la estimación del
modelo estadístico y el 30% restante a la validación del mismo.

TRAIN
TOTAL (70%)

(100%)
TEST
(30%)

Hemos considerado que en ambas muestras se aproximen de manera igual los porcentajes de buenos (0) y
malos (1).

Tabla N°1. Selección de la muestra

Financiera ABC
Periodo de estudio : 830 empresas
Observaciones (N) ~ 4000
Pagos (0) Impagos (1) Totales
98.2% 1.8% 100%
Train (70%)
98.21% 1.79% 100%
Test ( 30%)
98.17% 1.83% 100%

Una vez definido las submuestras, se definirán las variables para desarrollar el scoring. La variable
dependiente(default) mientras las variables independientes se seleccionó 5 variables (liquidez, rentabilidad,
apalancamiento, solvencia y actividad) que juntas brindarán el mejor resultado en la predicción de la
insolvencia y permitirán llegar al valor del coeficiente Z. Ver Figura N°1
Figura N°1. Definición Variables Explicativas

Variable Definición
independient
e
Mide la relación de capital de trabajo, entendido como el efectivo que
posee la empresa en caja, cuentas corrientes, cuentas por cobrar a 1
CT/ AT año, tras haber pagado sus deudas en el corto plazo con sus activos
disponibles.
UR/TA La medida de rentabilidad acumulada que se logra con este indicador
es a veces llamada una “nueva” razón en virtud de que la edad de la
empresa es explícitamente considera dentro de la misma.
Es una medida del rendimiento puro de los activos de la empresa sin
tener en cuenta la forma de financiación de los mismos.
UAII/TA
Compara el valor de mercado de acciones con el total de la deuda,
cuanto mayor sea menor será el endeudamiento en relación al valor
VLP/TP
del mercado de acciones.
Mide la habilidad de generación de ventas a partir de los activos de la
V/TA empresa, razón por la cual, es considerada como una medida de la
capacidad de la administración para lidiar con las condiciones
competitivas.

En resumen, los problemas de liquidez son medidos con X1, los derechos de los accionistas contra los activos
de la empresa son medidos X2 (cuando el indicador es baja significa que la empresa está altamente
endeudada), la rentabilidad se mide en X3, la confianza de los accionistas o propietarios (reflejada en el
precio de la acción) con relación a la deuda es medida por X4 (la misma será baja para una empresa
excesivamente apalancada); y por último la utilización de los activos en medida por X5.

b) Estimación del modelo.


Se estimará 3 modelos para nuestra muestra de tratamiento. Ver figura N°2

Figura N°2. Ventajas y Desventajas de las técnicas Paramétricas

Ventajas Desventajas
Análisis  Buen rendimiento para  Problemas estadísticos y
Discriminante grandes muestras. estimadores ineficientes.
 Técnicamente conveniente en  No arroja probabilidad de
la estimación. impago.
Modelo de  Buen rendimiento para  Estimadores ineficientes.
Lineal prob. lineal grandes muestras.
 Parámetros fácilmente  Las probabilidades estimadas
interpretables. podrían quedar fuera del
Técnicas  Sugieren probabilidad de intervalo (0,1).
paramétricas impago.
Modelo Logit  Muy buenas propiedades  Dificultad de interpretación
estadísticas y no son estrictos de los parámetros.
No lineal con las hipótesis sobre los
datos.
 Gran rendimiento.
Modelo Probit  Muy buenas propiedades  Procesos de estimación
estadísticas y no son estrictos relativamente complicado.
con las hipótesis sobre los
datos.
 Muestran prob. De impago.
c) Resultados de la estimación

1. Modelo de regresión lineal.

 Formula

α 1∗CT α 2∗UR α 3∗UAII α 4∗VLP


Z=β+ + + + + α 5∗V /TA
TA tA TA TP

Tabla N°2. Variables de la ecuación en el modelo lineal

Coeficientes Error típico Estadístico t Prob


Interpretación 0.0387 0.00578 6.70207 0.00%
CT/TA -0.0152 0.01547 -0.98299 32.57%
UR/TA -0.0735 0.00799 -9.20119 0.00%
UAII/TA -0.3106 0.09768 -3.17940 0.15%
VLP/TP 0.0002 0.00083 0.22405 82.27%
V/TA 0.0405 0.01225 3.30302 0.10%
R2 ajustado 4.45%

 Modelo mejorado.
Observamos que en el modelo hay dos variables que no son significativas: CT/TA y VLP/TP. Lo
cual para mejor el modelo eliminaremos dichas variables, obteniendo el modelo mejorado.

α 1∗UR α 2∗UAII
Z=β+ + +α 3∗V /TA
tA TA

Tabla N°3. Variables de la ecuación en el modelo lineal mejorado

Coeficientes Error típico Estadístico t Prob


Interpretación 0.0378 0.00568 6.65447 0.00%
UR/TA -0.0747 0.00781 -9.55999 0.00%
UAII/TA -0.3066 0.09448 -3.24450 0.12%
V/TA 0.0376 0.01186 3.16985 0.16%
R2 ajustado 4.51%

0.747∗UR 0.3066∗UAII
Z¿−0.0378− tA

TA
+0.0376∗V /TA
Interpretación:
 Un aumento de una unidad en la variable Utilidades retenidas/ Total de activos le
corresponde en promedio, una disminución 0.747 en la variable default. En otras palabras,
cuando una empresa usa una mayor financiación propia será menos riesgoso entrar en
default.
 Un aumento de una unidad en la variable Utilidades antes de impuestos/ Total de activos le
corresponde en promedio, una disminución 0.3066 en la variable default. En otras palabras,
cuando una empresa tiene una mayor rentabilidad será menos riesgoso entrar en default.
 Un aumento de una unidad en la variable Ventas/ Total de activos le corresponde en
promedio, un aumento de 0.3076 en la variable default. En otras palabras, cuando una
empresa sea más eficiente en utilizar sus activos para generar ingresos será más riesgoso
entrar en default.

2. Modelo de Regresión Logística.

 Formula

ln ( 1−pp )=B + B x + B x +…+ B x


0 1 1 2 2 k k

1
^p= −(¿ B0 +B1 x1 +B2 x2 +…+Bk x k )
1+e ¿

Z= ^β 0+ ^β1 x 1+ β^ 2 x2 +…+ ^β k x k

Tabla N°4. Variables de la ecuación en el modelo Logit

Coeficientes SE(B) Estadístico t Prob


Interpretación -2.87398 0.30011 -9.57648 0.00%
CT/TA -0.48929 0.63228 0.77385 43.90%
UR/TA -1.46324 0.27392 -5.34176 0.00%
UAII/TA -6.67756 3.17045 -2.10619 3.52%
VLP/TP -1.09831 0.30787 -3.56739 0.04%
V/TA 0.59388 0.37495 3.30302 11.32%
Pseudo R2 17.8%

 Modelo mejorado.
Observamos que en el modelo hay dos variables que no son significativas: CT/TA y V/TA. Lo
cual para mejor el modelo eliminaremos dichas variables, obteniendo el modelo mejorado.
Z= ^β 0+ ^β1 x 1+ β^ 2 x2 +…+ ^β k x k

Tabla N°5. Variables de la ecuación en el modelo Logit mejorado.

Coeficientes SE(B) Estadístico t Prob


Interpretación -2.652 0.26834 -9.88432 0.00%
UR/TA -1.410 0.26741 -5.27451 0.00%
UAII/TA -5.789 3.18796 -1.81589 6.94%
VLP/TP -1.114 0.30947 -3.59966 0.03%
Pseudo R2 17.3%

1.410∗UR 5.789∗UAII
Z=−2.652− − −1.114∗VLP/TP
tA TA
Interpretación:

A partir de los coeficientes del modelo modificado de la tabla 7, se observa que 3 variables (UR/TA,
UAII/TA, VLP/TP) influyen negativamente en la probabilidad de que una empresa entre en default.
Cuando el signo del estimador es negativo significa que, cuando la variable independiente aumenta
en una unidad, el logaritmo de las probabilidades de ser un cliente entre en default disminuye y
viceversa para los estimadores positivos. Con respecto al impacto del estadístico y el signo de los
coeficientes, todas las variables presentan un p-value inferior al nivel crítico fijado en 5%. Por tanto,
todas las variables independientes del modelo influyen en el comportamiento de pago del cliente
del microcrédito.

3. Modelo Probit

Tabla N°6. Variables de la ecuación en el modelo Probit

Coeficientes
Interpretación -1.8620
CT/TA 0.1438
UR/TA - 0.2370
UAII/TA - 0.8248
VLP/TP - 4.3332
V/TA 0.7422

0.1438∗CT 0.2370∗UR 0.8248∗V 4.3332∗VLP


Z¿−1.8620+ − − − +0.7422∗V /TA
TA TA TA TP
Interpretación:

A partir de los coeficientes del modelo modificado de la tabla 8, se observa que 4 variables (UR/TA,
UAII/TA, VLP/TP) influyen negativamente en la probabilidad de que una empresa entre en default y
2 variables (CT/TA, V/TA) influyen de manera positiva. Cuando el signo del estimador es negativo
significa que, cuando la variable independiente aumenta en una unidad, el logaritmo de las
probabilidades de ser un cliente entre en default disminuye y viceversa para los estimadores
positivos. Con respecto al impacto del estadístico y el signo de los coeficientes, debido a las
limitaciones que se presentó al no tener una función en Excel sobre el modelo Probit se realizó una
estimación considerando todas las variables lo cual asumiremos que son significativas a 5%.

d) Validación del modelo

Utilizaremos el 30% restando de la muestra para poder validar el modelo lo cual hallaremos el Z del modelo
lineal, logit, probit y además agregaremos el modelo Z de altman. (Ver Excel)

Una vez obtenido los Z score vamos a definirlos en dos valores. Aquellas empresas que tiene un historial de
mal manejo del crédito con alta probabilidad de impago se definieron como estado (1) y aquellas empresas
que no presentan problemas de impago como estado (0). Vamos a realizar un Backtesting del Threshold
value por cada modelo con la finalidad de encontrar el corte óptimo. (Ver Excel)

Se consideró 5 valores de corte para el análisis: 4.50%, 4.75%, 5%, 5.25%, 5.75%. Lo cual se consideró como el
corte optimo el valor de 4.50% para cada modelo por 2 motivos:

 Un mayor porcentaje global de acierto en cada caso.


 Un menor porcentaje en el error tipo II con la finalidad de no otorgar créditos a empresas
en donde el modelo considera que no están en default, pero en realidad presentan
incapacidad de pago eso conlleva a que la financiera reduzca sus provisiones.

Tabla N°7. Porcentaje de acierto en el proceso de validación del modelo lineal

Threshold Value: 4.5%

Observado Pronosticado Porcentaje


Pago (0) Impago (1)
Pago(0) 1087 91** 92.28%
Impago(1) 6* 16 72.73%
Porcentaje global 83%
de acierto

** Error tipo I *Error tipo II


Tabla N°8. Porcentaje de acierto en el proceso de validación del modelo Logit

Threshold Value: 4.5%

Observado Pronosticado Porcentaje


Pago (0) Impago (1)
Pago(0) 1122 56** 95.25%
Impago(1) 6* 16 27.27%
Porcentaje global 84%
de acierto

** Error tipo I *Error tipo II

Tabla N°9. Porcentaje de acierto en el proceso de validación del modelo Probit

Threshold Value: 4.5%

Observado Pronosticado Porcentaje


Pago (0) Impago (1)
Pago(0) 1122 56** 95.25%
Impago(1) 11* 11 50.00%
Porcentaje global
de acierto 72.6%

** Error tipo I *Error tipo II

Ahora vamos a comparar aquellos datos que no coincidieron con el modelo y verificaremos que modelo se
ajusta mejor a los objetivos de la financiera ABC. Ver tabla N°10

En el error tipo I el modelo que presenta un mayor número de datos es el lineal con 91 datos, dicho error
significa que el modelo catalogó a la empresa como default, pero en realidad en ese año la empresa obtuvo
una calificación buena que es otorgable para un crédito.

En el error tipo II el modelo que presenta un mayor número de datos es el Probit con 11 datos, dicho error
significa que el modelo catalogó a las empresas aptas para un crédito, pero en realidad en ese año la
empresa se encontró en default.

La Financiero ABC tiene pensado reducir las provisiones lo cual nos enfocaremos en el Error tipo II,
evitaremos dar créditos a empresas que realmente están en default. El modelo lineal y el modelo Logit
presentan cada uno 6 datos de error tipo II.

Ahora nos enfocaremos en el error tipo I, la financiera ABC necesita expandir su cuota de mercado por ende
es preferible minimizar el error tipo I, la idea es no rechazar a empresas que presentan buena calificación. El
modelo Logit y el modelo Probit presentan cada uno 56 datos del error tipo I.

El objetivo de la financiera es minimizar el error tipo I y el error tipo II, reducir sus provisiones y aumentar su
cuota de mercado por ende se elegirá el modelo Logit por cumple con dichos objetivos.
Tabla N°10. Error tipo I y II de los modelos estimados.
Modelo Lineal Modelo Logit Modelo Probit
Error tipo I 91 56 56
Error tipo II 6 6 11

Ahora para referirnos al Modelo de Z de Altman vamos a utilizar la fórmula para empresas privadas que no
cotizan en bolsa:

Z = 0,717 X1 + 0,847 X2 + 3,107 X3 + 0,420 X4 + 0,998X5

La ecuación muestra que el valor z del modelo es el modo lineal combinado con cada factor de X1 a X5,
detallado anteriormente.

En la figura N°1, se observa el área de solvencia. Cuando el resultado se encuentra por debajo de 1.23
(Distress Zone) la empresa estaría propensa a la quiebra. Si este se encuentra en 1.23 y 2.90 (Grey Zone) es
probable que la empresa se encuentre en bancarrota. Por último, si este se encuentra por encima de 2.90
(Safe Zone) es altamente probable que la empresa continúe en el mercado y con un buen desempeño
financiero.

Para este caso, cuando la empresa obtenga un valor Z menor que 2.00 no se le otorgará un crédito debido a
que mientras más se aproxime al valor de 1.23 la empresa puede entrar en bancarrota. En conclusión, el
corte óptimo será de 2.00. Ver Figura N°3

Figura 3. Nivel de solvencia estimado para empresas privadas

“ Safe” Zone
2.90

“Grey” Zone
2.00
1.23

“ Distress” Zone

Una vez obtenido los Z score mediante el modelo de Altman vamos a


realizar la Matriz de confusión. Ver tabla N°11

Tabla N°11. Porcentaje de acierto en el proceso de validación del modelo Z de altman.

Threshold Value: Mayor a 2.00

Observado Pronosticado Porcentaje


Pago (0) Impago (1)
Pago(0) 271 907** 23.01%
Impago(1) 0* 22 100%
Porcentaje global 61.5%
de acierto
** Error tipo I *Error tipo II

Observamos que 907 datos no han sido pronosticados correctamente y además la financiera ABC no otorgará
créditos a empresas que tienen buen comportamiento ya que en el modelo los cataloga en default. Por otro
lado, es un buen indicador de que el error tipo I presente 0% ya que la financiera va tener que provisionar
menos, pero el error tipo II presenta 907 datos lo cual nos indica que está perdiendo cuota de mercado ya
que no está otorgando créditos a clientes con buen historial. No se elegirá este modelo por lo dicho
anteriormente y además el porcentaje global de aciertos es de 61.5% lo cual es demasiado bajo a
comparación de los demás modelos.

e) Conclusión

El modelo logit es una herramienta muy importante cuando se refiere a variables explicativas. Este modelo
se utiliza para pronosticar la probabilidad de que ocurra o no un suceso determinado, además se puede
analizar el impacto que tiene cada uno de las variables explicativas.

El modelo de credit scoring es una herramienta complementaria al proceso de otorgamiento de crédito, da


conocer un panorama del futuro comportamiento de pago del cliente. Este proceso funciona con
probabilidades y no con certeza.

Los modelos pueden adaptarse a las condiciones de cada organización, se deberá ajustar al nivel de riesgo
que desean asumir y a las condiciones del entorno, a través del tiempo se tendrá que monitorear de forma
regular para medir la eficiencia del modelo, y de ser necesario deberá ajustarse.

f) Recomendaciones

En esta ocasión las variables explicativas fueron con datos números mas no con datos dicotómicas, lo cual
para próximas investigaciones se agregará más variables.

También podría gustarte