Lcapitulo 2

17
CAPTULO II
Marco Terico
2.1 INTRODUCCIN
El objetivo de ste captulo, es el de exponer los fundamentos
estadsticos matemticos de la Regresin Logstica, que permitir
determinar los factores de riesgo de las entidades financieras que
estudiaremos; y con estos factores construir el indicador sistemtico,
que nos ayudar a obtener la probabilidad de riesgo para conocer si la
entidad se encuentra funcionando bien o est enfrentando problemas,
es decir, que en un futuro pueda llevarla a la quiebra. A pesar de tener
gran cantidad de informacin disponible en el mercado, no existe un
indicador que permita incorporar todos los datos que proporcionan la
18
Superintendencia de Bancos y el Banco Central Del Ecuador, de una

manera cuantitativa.
2.2 EXPLICACIN DEL MODELO DE REGRESIN LOGSTICA

Esta tcnica permite garantizar que la respuesta prevista est entre 0
y 1 (cumpliendo con la propiedad de la probabilidad 0,1 ) es utilizar
una funcin de enlace no lineal que sea montona, creciente y
acotada entre dichos valores.
Para el caso de esta investigacin se construir un modelo que

describa la relacin entre una serie de caractersticas que conforman
un conjunto de variables independientes de tipo cuantitativas y una
variable dependiente dicotmica o binaria que slo puede tomar dos
valores
que
definen
opciones
caractersticas
opuestas
mutuamente excluyentes.
La Regresin Logstica, suple las limitaciones del modelo de regresin

lineal respecto a la naturaleza dicotmica de la variable dependiente.
El modelo de regresin logstica es un procedimiento por medio del
cual se intenta analizar las relaciones de asociacin entre una variable
dependiente
dicotmica
(binaria
dummy)
independientes (regresores o predictores) Xn
variables
cuantitativas.
Los
19
objetivos de este modelo es determinar la existencia o ausencia de

relacin entre una o ms variables independientes y la variable
dependiente; medir la magnitud de dicha relacin y estimar o predecir
la probabilidad de que se produzca (o no) el suceso definido por la
variable dependiente en funcin de los valores que adopten las
variables independientes.
Para este caso y en base a los datos que tenemos, necesitamos

conocer cuales son los factores que incidieron en la quiebra de
nuestras entidades bancarias en el ao 1999.
Empezaremos explicando este modelo, definiendo conceptos bsicos

que utiliza la regresin logstica: ventaja y preferencia.
La preferencia permite elegir la opcin uno de la variable respuesta

frente a la opcin cero.
Y la ventaja o tambin llamado ODD RATIO (OR), que lo

explicaremos ms adelante.
Nosotros por lo general trabajamos con probabilidad o riesgo,

conocido tambin como Riesgo Relativo.
20
Riesgo Relativo:
p
Nmero de casos en que el evento ocurre

Total de casos
Mientras que la Oportunidad o ventaja es:
Nmero de casos en que el evento ocurre

Nmero de casos en que no ocurre el evento
Por supuesto que no es tan fcil de interpretar el ODD RATIO (OR)

como lo es el RIESGO RELATIVO (RR), siempre que la probabilidad
de que ocurra el evento es cercana a cero, estos valores son
similares; pero cuando la probabilidad del evento no es cercana a
cero, ambas cantidades no son iguales y hay que tener mucho
cuidado de no confundirse.
A pesar de no ser un concepto tan natural el ODD RATIO (OR)

debemos recordar lo siguiente:
1) Un valor de OR = 1 se interpreta como que no hay tal factor de

riesgo en este caso que un banco llegue a quebrar; ya que la
21
oportunidad para los expuestos es la misma para los no

expuestos.
2) Tenemos que localizar factores de riesgo, eso corresponde a
buscar valores de OR mayores que uno. Se interpreta como
que se ha localizado un factor de riesgo, pues es mayor la
oportunidad de que ocurra el evento a los expuestos al factor
que a los controles.
3) Para reducir la frecuencia de un evento en este caso se buscan

valores de OR menores que uno; es decir que sea menor la
oportunidad de que ocurra el evento en los individuos
expuestos al tratamiento que a los controles.
2.3 PROPIEDADES MATEMTICAS
DE LA REGRESIN
LOGSTICA
El uso de la OR es importante por tener muy buenas propiedades

matemticas, que a continuacin presentamos:
22
1) Es adecuado para ser modelado matemticamente por que la

OR toma valores entre cero e infinito, sobre todo si tomamos su
logaritmo, ya que en ese caso cualquier valor es posible.
2) El Modelo de regresin logstica puede usarse para determinar

intervalos de confianza para la OR; si dichos intervalos
contienen al valor OR=1, no puede rechazarse que el factor de
riesgo no sea tal.; o en otro caso decimos que aumenta o
disminuye la oportunidad del evento en funcin de que el
intervalo de confianza sea de valores mayores o menores que
uno respectivamente.
3) Cuando se evala la eficacia de una prueba diagnstica es

razonablemente simple conocer la sensibilidad y especificidad
de la misma.
2.4 Construccin de un Modelo de Regresin Logstica

Para nuestra investigacin tenemos una variable que describe una
respuesta en dos posibles eventos (banco quiebra o no), y
deseamos estudiar el efecto que otras variables independientes tienen
sobre ellas (por ejemplo liquidez, morosidad de cartera vencida,
rentabilidad); este modelo nos resulta de gran utilidad como ya lo
23
mencionamos al empezar este captulo, pues dado los valores de las

variables independientes, es posible estimar la probabilidad de que se
presente el evento que buscamos (quiebra del banco);
adems
podemos evaluar la influencia que cada variable tiene sobre la

respuesta, es decir que si nuestro ODD RATIOS es mayor que uno
indica que aumenta la probabilidad de que ocurra el evento; y si es
menor es el efecto contrario.
Para poder construir este modelo necesitamos:
Un conjunto de variables independientes o predictoras; muy en

el estilo de la regresin lineal mltiple.
Una variables respuesta dicotmica; sta es la diferencia con el

modelo de regresin mltiple por que sta usa variables
numricas.
2.5 REQUISITOS
Los parmetros del modelo se calculan usando una estimacin
de mxima verosimilitud.
Ninguna variable relevante debe ser excluida.
24
Hay que tener mucho cuidado con la colinealidad porque al

igual que en la regresin lineal mltiple es un problema.
2.6 INTERPRETACIN DEL MODELO

Variable dependiente (si el banco quiebra o no)
1 Si ocurre el evento
Y (dicotmica)
0 Si no ocurre el evento
Variables independientes: factores de riesgo
x1 , x2 ,, xn
y = f x1 , x2 , , xn
y = b0 b1 x1 b2 x2 ... bn xn
n
Grupo de Control
x1 = x 2 = x3 == x n = 0
p P (Y 1)
1 Si ocurre el evento
y
0 Si no ocurre el evento
b0 b1 x1 b2 x2 bn xn 0
n1
e
p=
b0 b1x1 b2 x2 bn xn 0
1 e n1
25
eb0
p0
1 eb0
p0 1 eb0 eb0
p0 eb0 1 p0
1 p0 q0
p0
e b0
q0
O0 eb0
Ahora si x1 0
x2 x3 ... xn 0
x1 1
eb0 b1x1
p1
1 eb0 b1x1
eb0 b1
p1
1 eb0 b1
p1 1 e b0 b1 eb0 b1
10
p1 eb0 b1 p1eb0 b1
11
p1 eb0 b1 1 p1
12
1 p1 q1
13
p1
e b0 e b1
q1
14
Donde
Odds Ratio
26
15
O1
e b1
O0
2.7 CODIFICACIN DE LAS VARIABLES

En el Modelo de Regresin Logstica tenemos la variable dependiente
y las variables independientes.
La variable dependiente o dicotmica se codifica como UNO la

ocurrencia del evento de inters y como CERO la ausencia; para el
caso de ste estudio la variable dependiente ser, la quiebra o no de
un banco.
Las variables independientes pueden ser dicotmicas, categricas y

numricas, en este caso usaremos las variables independientes
numricas, por que la regresin logstica nos permite usar la variable
tal cual est en el modelo.
2.8
CONTRASTE
SIGNIFICACIN
REGRESIN.
DE
DE
HIPTESIS
LOS
SOBRE
LA
COEFICIENTES
DE
27
Cuando ya se ha ajustado el modelo y estimado sus coeficientes,

debemos concentrar la atencin en comprobar si las variables
independiente que lo integran estn relacionadas significativamente
con la variable respuesta o dependiente. Como en el caso del modelo
de regresin lineal, esto implica plantear y contrastar hiptesis
estadsticas sobre los coeficientes de regresin, ya sea de forma
individual o conjunta.
Las pruebas de significacin de las variables se formulan en los

siguientes trminos: contrastar la hiptesis nula, H0
coeficiente de regresin o u
de que un
conjunto de ellos es cero contra la
hiptesis alternativa H1 , derivada del rechazo de lo establecido por H0.

H0: 1 2 3 ... n 0
Vs.
H1: Rechazo H0.
Una manera de contrastar la hiptesis de un coeficiente de regresin

es cero (H0: = 0) se basa en el estadstico W de Wald, que para un
grado de libertad es igual al cuadrado de la razn entre estimador
maximoverosmil del coeficiente de la variable independiente de un
estimador de un error estndar:
28
i
W
SE ( i )
16
4
4 Magdalena Ferrn Aranaz. (2001), SPSS para Windows Anlisis Estadstico,

Editorial Osborne Mc Graw-Hill, Universidad Cloputense de Madrid, Espaa.
El estadstico resultante, bajo la hiptesis nula de que
0,
sigue
una distribucin ji-cuadrado (X2).
2.9 BONDAD DE AJUSTE: CONTRASTE DE HIPTESIS.
Usaremos la prueba de Hosmer-Lemeshow; esta prueba es adecuada

para evaluar la bondad de ajuste de aquellos modelos que incluyan
una o ms variables independientes y que cuenta con un nmero de
elementos predictores prcticamente igual al nmero de casos
observados (M N), que ordena de menor a mayor las N
probabilidades estimadas, una para cada caso observado, y a
continuacin las congregan en diez grupos, de tal modo que en el
primero estn los n1 N / 10 entes con las probabilidades estimadas
ms bajas, y en el ltimo n10 N / 10 entes con las probabilidades ms
elevadas, a stos grupos se los conoce como deciles de riesgo.
El estadstico de bondad de ajuste de Hosmer-Lemeshow, C , ste se

obtiene calculando el estadstico ji-cuadrado de Pearson referida a las
29
frecuencias observadas y estimadas para cada uno de los diez

grupos.
10
o nk p k
C k
k 1 n k p k 1 p k
2
17
Donde n k es el nmero de patrones de predictores del grupo k-simo,

nk
ok yi
18
i 1
Es decir, el nmero de respuestas afirmativas registradas para la

variable respuesta Y 1 para los nk elementos de predictores, y
nk
pk
i 1
mi p i
nk
19
La media de la probabilidad estimada.

Las hiptesis que se van a contrastar en esta prueba son las
siguientes:
H0: El Modelo ajusta bien a los datos
Vs.
H1: Rechazo H0.
2.10 DEFINICIN DE INDICADORES SINTTICOS.

Los indicadores sintticos se construyen en base a otros indicadores,
el indicador sinttico que se va a disear es el correspondiente al
30
riesgo que nos proporciona la regresin logstica y el mismo que se

define de la siguiente manera:
e 0 1x1 ... n xn
p
1 e 0 1x1 ... n xn
20
Donde:
p representa la probabilidad de riesgo
x1 , x 2 , x 3 ,...x n
Factores de riesgo
0 , 1 , 2 ,... n Coeficientes ponderados de los factores de riesgo
i > 1 significa que es factor de riesgo

i < 1 significa que es factor de proteccin
Sea
0 1 x1 ... n x n x
ex
f x
1 ex
Por qu p tiene la forma dada en la ecuacin (22)?

Lim
e/x
0
0
x
1 e/
1
X=0
e0
1
f x
0.5
0
1 e
2
ex
x
1 e
( 21)
(22)
31
Lim
x
Por regla de LHospital
Lim
ex
1
ex
Por esta razn, esta funcin es adecuada para representar a una

probabilidad de riesgo.

Lcapitulo 2

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Lcapitulo 2

Cargado por

Copyright:

Formatos disponibles

17

Superintendencia de Bancos y el Banco Central Del Ecuador, de una

2.2 EXPLICACIN DEL MODELO DE REGRESIN LOGSTICA

Para el caso de esta investigacin se construir un modelo que

La Regresin Logstica, suple las limitaciones del modelo de regresin

independientes (regresores o predictores) Xn

objetivos de este modelo es determinar la existencia o ausencia de

Para este caso y en base a los datos que tenemos, necesitamos

Empezaremos explicando este modelo, definiendo conceptos bsicos

La preferencia permite elegir la opcin uno de la variable respuesta

Y la ventaja o tambin llamado ODD RATIO (OR), que lo

Nosotros por lo general trabajamos con probabilidad o riesgo,

Nmero de casos en que el evento ocurre

Mientras que la Oportunidad o ventaja es:

Nmero de casos en que el evento ocurre

Por supuesto que no es tan fcil de interpretar el ODD RATIO (OR)

A pesar de no ser un concepto tan natural el ODD RATIO (OR)

1) Un valor de OR = 1 se interpreta como que no hay tal factor de

oportunidad para los expuestos es la misma para los no

3) Para reducir la frecuencia de un evento en este caso se buscan

2.3 PROPIEDADES MATEMTICAS

El uso de la OR es importante por tener muy buenas propiedades

1) Es adecuado para ser modelado matemticamente por que la

2) El Modelo de regresin logstica puede usarse para determinar

3) Cuando se evala la eficacia de una prueba diagnstica es

2.4 Construccin de un Modelo de Regresin Logstica

mencionamos al empezar este captulo, pues dado los valores de las

podemos evaluar la influencia que cada variable tiene sobre la

Para poder construir este modelo necesitamos:

Un conjunto de variables independientes o predictoras; muy en

Una variables respuesta dicotmica; sta es la diferencia con el

Ninguna variable relevante debe ser excluida.

Hay que tener mucho cuidado con la colinealidad porque al

2.6 INTERPRETACIN DEL MODELO

2.7 CODIFICACIN DE LAS VARIABLES

La variable dependiente o dicotmica se codifica como UNO la

Las variables independientes pueden ser dicotmicas, categricas y

Cuando ya se ha ajustado el modelo y estimado sus coeficientes,

Las pruebas de significacin de las variables se formulan en los

conjunto de ellos es cero contra la

hiptesis alternativa H1 , derivada del rechazo de lo establecido por H0.

Una manera de contrastar la hiptesis de un coeficiente de regresin

4 Magdalena Ferrn Aranaz. (2001), SPSS para Windows Anlisis Estadstico,

El estadstico resultante, bajo la hiptesis nula de que

una distribucin ji-cuadrado (X2).

2.9 BONDAD DE AJUSTE: CONTRASTE DE HIPTESIS.

Usaremos la prueba de Hosmer-Lemeshow; esta prueba es adecuada

El estadstico de bondad de ajuste de Hosmer-Lemeshow, C , ste se

frecuencias observadas y estimadas para cada uno de los diez

Donde n k es el nmero de patrones de predictores del grupo k-simo,

Es decir, el nmero de respuestas afirmativas registradas para la

La media de la probabilidad estimada.

2.10 DEFINICIN DE INDICADORES SINTTICOS.

riesgo que nos proporciona la regresin logstica y el mismo que se

0 , 1 , 2 ,... n Coeficientes ponderados de los factores de riesgo

i > 1 significa que es factor de riesgo

Por qu p tiene la forma dada en la ecuacin (22)?

Por esta razn, esta funcin es adecuada para representar a una

También podría gustarte