Está en la página 1de 15

17

CAPTULO II

Marco Terico
2.1 INTRODUCCIN
El objetivo de ste captulo, es el de exponer los fundamentos
estadsticos matemticos de la Regresin Logstica, que permitir
determinar los factores de riesgo de las entidades financieras que
estudiaremos; y con estos factores construir el indicador sistemtico,
que nos ayudar a obtener la probabilidad de riesgo para conocer si la
entidad se encuentra funcionando bien o est enfrentando problemas,
es decir, que en un futuro pueda llevarla a la quiebra. A pesar de tener
gran cantidad de informacin disponible en el mercado, no existe un
indicador que permita incorporar todos los datos que proporcionan la

18

Superintendencia de Bancos y el Banco Central Del Ecuador, de una


manera cuantitativa.

2.2 EXPLICACIN DEL MODELO DE REGRESIN LOGSTICA


Esta tcnica permite garantizar que la respuesta prevista est entre 0
y 1 (cumpliendo con la propiedad de la probabilidad 0,1 ) es utilizar
una funcin de enlace no lineal que sea montona, creciente y
acotada entre dichos valores.

Para el caso de esta investigacin se construir un modelo que


describa la relacin entre una serie de caractersticas que conforman
un conjunto de variables independientes de tipo cuantitativas y una
variable dependiente dicotmica o binaria que slo puede tomar dos
valores

que

definen

opciones

caractersticas

opuestas

mutuamente excluyentes.

La Regresin Logstica, suple las limitaciones del modelo de regresin


lineal respecto a la naturaleza dicotmica de la variable dependiente.
El modelo de regresin logstica es un procedimiento por medio del
cual se intenta analizar las relaciones de asociacin entre una variable
dependiente

dicotmica

(binaria

dummy)

independientes (regresores o predictores) Xn

variables

cuantitativas.

Los

19

objetivos de este modelo es determinar la existencia o ausencia de


relacin entre una o ms variables independientes y la variable
dependiente; medir la magnitud de dicha relacin y estimar o predecir
la probabilidad de que se produzca (o no) el suceso definido por la
variable dependiente en funcin de los valores que adopten las
variables independientes.

Para este caso y en base a los datos que tenemos, necesitamos


conocer cuales son los factores que incidieron en la quiebra de
nuestras entidades bancarias en el ao 1999.

Empezaremos explicando este modelo, definiendo conceptos bsicos


que utiliza la regresin logstica: ventaja y preferencia.

La preferencia permite elegir la opcin uno de la variable respuesta


frente a la opcin cero.

Y la ventaja o tambin llamado ODD RATIO (OR), que lo


explicaremos ms adelante.

Nosotros por lo general trabajamos con probabilidad o riesgo,


conocido tambin como Riesgo Relativo.

20

Riesgo Relativo:
p

Nmero de casos en que el evento ocurre


Total de casos

Mientras que la Oportunidad o ventaja es:

Nmero de casos en que el evento ocurre


Nmero de casos en que no ocurre el evento

Por supuesto que no es tan fcil de interpretar el ODD RATIO (OR)


como lo es el RIESGO RELATIVO (RR), siempre que la probabilidad
de que ocurra el evento es cercana a cero, estos valores son
similares; pero cuando la probabilidad del evento no es cercana a
cero, ambas cantidades no son iguales y hay que tener mucho
cuidado de no confundirse.

A pesar de no ser un concepto tan natural el ODD RATIO (OR)


debemos recordar lo siguiente:

1) Un valor de OR = 1 se interpreta como que no hay tal factor de


riesgo en este caso que un banco llegue a quebrar; ya que la

21

oportunidad para los expuestos es la misma para los no


expuestos.
2) Tenemos que localizar factores de riesgo, eso corresponde a
buscar valores de OR mayores que uno. Se interpreta como
que se ha localizado un factor de riesgo, pues es mayor la
oportunidad de que ocurra el evento a los expuestos al factor
que a los controles.

3) Para reducir la frecuencia de un evento en este caso se buscan


valores de OR menores que uno; es decir que sea menor la
oportunidad de que ocurra el evento en los individuos
expuestos al tratamiento que a los controles.

2.3 PROPIEDADES MATEMTICAS

DE LA REGRESIN

LOGSTICA

El uso de la OR es importante por tener muy buenas propiedades


matemticas, que a continuacin presentamos:

22

1) Es adecuado para ser modelado matemticamente por que la


OR toma valores entre cero e infinito, sobre todo si tomamos su
logaritmo, ya que en ese caso cualquier valor es posible.

2) El Modelo de regresin logstica puede usarse para determinar


intervalos de confianza para la OR; si dichos intervalos
contienen al valor OR=1, no puede rechazarse que el factor de
riesgo no sea tal.; o en otro caso decimos que aumenta o
disminuye la oportunidad del evento en funcin de que el
intervalo de confianza sea de valores mayores o menores que
uno respectivamente.

3) Cuando se evala la eficacia de una prueba diagnstica es


razonablemente simple conocer la sensibilidad y especificidad
de la misma.

2.4 Construccin de un Modelo de Regresin Logstica


Para nuestra investigacin tenemos una variable que describe una
respuesta en dos posibles eventos (banco quiebra o no), y
deseamos estudiar el efecto que otras variables independientes tienen
sobre ellas (por ejemplo liquidez, morosidad de cartera vencida,
rentabilidad); este modelo nos resulta de gran utilidad como ya lo

23

mencionamos al empezar este captulo, pues dado los valores de las


variables independientes, es posible estimar la probabilidad de que se
presente el evento que buscamos (quiebra del banco);

adems

podemos evaluar la influencia que cada variable tiene sobre la


respuesta, es decir que si nuestro ODD RATIOS es mayor que uno
indica que aumenta la probabilidad de que ocurra el evento; y si es
menor es el efecto contrario.

Para poder construir este modelo necesitamos:

Un conjunto de variables independientes o predictoras; muy en


el estilo de la regresin lineal mltiple.

Una variables respuesta dicotmica; sta es la diferencia con el


modelo de regresin mltiple por que sta usa variables
numricas.

2.5 REQUISITOS
Los parmetros del modelo se calculan usando una estimacin
de mxima verosimilitud.

Ninguna variable relevante debe ser excluida.

24

Hay que tener mucho cuidado con la colinealidad porque al


igual que en la regresin lineal mltiple es un problema.

2.6 INTERPRETACIN DEL MODELO


Variable dependiente (si el banco quiebra o no)

1 Si ocurre el evento
Y (dicotmica)
0 Si no ocurre el evento
Variables independientes: factores de riesgo
x1 , x2 ,, xn

y = f x1 , x2 , , xn
y = b0 b1 x1 b2 x2 ... bn xn
n
Grupo de Control
x1 = x 2 = x3 == x n = 0
p P (Y 1)

1 Si ocurre el evento
y
0 Si no ocurre el evento
b0 b1 x1 b2 x2 bn xn 0
n1
e
p=
b0 b1x1 b2 x2 bn xn 0
1 e n1

25

eb0
p0
1 eb0

p0 1 eb0 eb0
p0 eb0 1 p0

1 p0 q0

p0
e b0
q0

O0 eb0
Ahora si x1 0

x2 x3 ... xn 0

x1 1

eb0 b1x1
p1
1 eb0 b1x1

eb0 b1
p1
1 eb0 b1

p1 1 e b0 b1 eb0 b1

10

p1 eb0 b1 p1eb0 b1

11

p1 eb0 b1 1 p1

12

1 p1 q1

13

p1
e b0 e b1
q1

14

Donde

Odds Ratio

26

15

O1
e b1
O0

2.7 CODIFICACIN DE LAS VARIABLES


En el Modelo de Regresin Logstica tenemos la variable dependiente
y las variables independientes.

La variable dependiente o dicotmica se codifica como UNO la


ocurrencia del evento de inters y como CERO la ausencia; para el
caso de ste estudio la variable dependiente ser, la quiebra o no de
un banco.

Las variables independientes pueden ser dicotmicas, categricas y


numricas, en este caso usaremos las variables independientes
numricas, por que la regresin logstica nos permite usar la variable
tal cual est en el modelo.

2.8

CONTRASTE

SIGNIFICACIN
REGRESIN.

DE
DE

HIPTESIS
LOS

SOBRE

LA

COEFICIENTES

DE

27

Cuando ya se ha ajustado el modelo y estimado sus coeficientes,


debemos concentrar la atencin en comprobar si las variables
independiente que lo integran estn relacionadas significativamente
con la variable respuesta o dependiente. Como en el caso del modelo
de regresin lineal, esto implica plantear y contrastar hiptesis
estadsticas sobre los coeficientes de regresin, ya sea de forma
individual o conjunta.

Las pruebas de significacin de las variables se formulan en los


siguientes trminos: contrastar la hiptesis nula, H0
coeficiente de regresin o u

de que un

conjunto de ellos es cero contra la

hiptesis alternativa H1 , derivada del rechazo de lo establecido por H0.


H0: 1 2 3 ... n 0
Vs.
H1: Rechazo H0.

Una manera de contrastar la hiptesis de un coeficiente de regresin


es cero (H0: = 0) se basa en el estadstico W de Wald, que para un
grado de libertad es igual al cuadrado de la razn entre estimador
maximoverosmil del coeficiente de la variable independiente de un
estimador de un error estndar:

28

i
W

SE ( i )

16
4

4 Magdalena Ferrn Aranaz. (2001), SPSS para Windows Anlisis Estadstico,


Editorial Osborne Mc Graw-Hill, Universidad Cloputense de Madrid, Espaa.

El estadstico resultante, bajo la hiptesis nula de que

0,

sigue

una distribucin ji-cuadrado (X2).

2.9 BONDAD DE AJUSTE: CONTRASTE DE HIPTESIS.

Usaremos la prueba de Hosmer-Lemeshow; esta prueba es adecuada


para evaluar la bondad de ajuste de aquellos modelos que incluyan
una o ms variables independientes y que cuenta con un nmero de
elementos predictores prcticamente igual al nmero de casos
observados (M N), que ordena de menor a mayor las N
probabilidades estimadas, una para cada caso observado, y a
continuacin las congregan en diez grupos, de tal modo que en el
primero estn los n1 N / 10 entes con las probabilidades estimadas
ms bajas, y en el ltimo n10 N / 10 entes con las probabilidades ms
elevadas, a stos grupos se los conoce como deciles de riesgo.

El estadstico de bondad de ajuste de Hosmer-Lemeshow, C , ste se


obtiene calculando el estadstico ji-cuadrado de Pearson referida a las

29

frecuencias observadas y estimadas para cada uno de los diez


grupos.
10
o nk p k
C k
k 1 n k p k 1 p k
2

17

Donde n k es el nmero de patrones de predictores del grupo k-simo,


nk

ok yi

18

i 1

Es decir, el nmero de respuestas afirmativas registradas para la


variable respuesta Y 1 para los nk elementos de predictores, y
nk

pk
i 1

mi p i
nk

19

La media de la probabilidad estimada.


Las hiptesis que se van a contrastar en esta prueba son las
siguientes:
H0: El Modelo ajusta bien a los datos
Vs.
H1: Rechazo H0.

2.10 DEFINICIN DE INDICADORES SINTTICOS.


Los indicadores sintticos se construyen en base a otros indicadores,
el indicador sinttico que se va a disear es el correspondiente al

30

riesgo que nos proporciona la regresin logstica y el mismo que se


define de la siguiente manera:

e 0 1x1 ... n xn
p
1 e 0 1x1 ... n xn

20

Donde:
p representa la probabilidad de riesgo
x1 , x 2 , x 3 ,...x n

Factores de riesgo

0 , 1 , 2 ,... n Coeficientes ponderados de los factores de riesgo

i > 1 significa que es factor de riesgo


i < 1 significa que es factor de proteccin

Sea
0 1 x1 ... n x n x

ex
f x
1 ex

Por qu p tiene la forma dada en la ecuacin (22)?


Lim

e/x
0
0
x
1 e/
1

X=0
e0
1
f x
0.5
0
1 e
2
ex

x
1 e

( 21)

(22)

31

Lim

x
Por regla de LHospital
Lim

ex
1
ex

Por esta razn, esta funcin es adecuada para representar a una


probabilidad de riesgo.

También podría gustarte