Está en la página 1de 18

Universidad Privada de Tacna

Facultad de Ciencias Empresariales


Escuela de Economía y Microfinanzas

CURSO Econometría II

Modelos Logit

Dr. Elmer Limache Sandoval


• Hay 2 tipos de variables que se usan para
modelizar:
• las variables cuantificables o medibles
como precios, cantidades, estatura, etc.

• Las variables que indican ausencia o


presencia de una cualidad o atributo como
sexo, estado civil, religión, raza.
• Las variables cualitativas o “dummy” toman los valores
de “1” para indicar la presencia de la cualidad y “0” para
indicar ausencia.
• “1” puede indicar la misma facilidad que las variables
cuantitativas.

• ¿Cómo se crean las variables Dummy?

• Si se tiene una variable como sexo la llamaremos Di,


esta tiene 2 categorías; varon y mujer, luego
• 1 si es hombre
• 0 si es mujer
VARIABLES DEPENDIENTES CUALITATIVAS

• La variable dependiente requiere una respuesta


afirmativa o negativa.
• Ejemplo; una familia posee una casa o no la
posee

• Y= 1 si posee una casa


• 0 si no la posee.
Plantéese un modelo con variable dependiente Y i
cualitativa.
Por ejemplo:

Y= β0 + β1 X

Donde Y Posee una casa propia toma valores 1 si lo


posee y 0 si no lo posee.
X es el ingreso.
Esto no puede resolverse por modelos regresión lineal
comunes. En este caso usamos regresiones logísticas.
1
Pi 
1  e (  0  1 X i ) Haciendo Zi= 0+1X
Curva Logística

P=Y

X
 
1 ez
Pi  z

1 e 1 ez

1
1  Pi 
1 ez

Pi 1  e Zi
  e Zi

1  Pi 1  e  Z i

 Pi 
Li  ln   Z i
 1  Pi 
• Li es el logaritmo de la razón de probabilidades y es
lineal en los parámetros.

En los modelos Logit se pueden añadir varias regresoras X1, X2, …


Xk.
Tanto Z como L varían de – a +
Si L el Logit es positivo, significa que cuando el valor de las regresoras se
incrementa, aumenta la posibilidad que la regresada sea igual a 1 (lo cual
indica que sucederá algo de interés). Si L es negativo, las posibilidades de que
la regresada iguale a 1 disminuyen conforme el valor de X se incrementa en
magnitud.
La interpretación del Logit es: 1 la pendiente, mide el cambio en L
ocasionado por un cambio unitario en X. Dice cómo el Logaritmo de la razón
de probabilidades a favor de poseer una casa cambia a medida que el ingreso
cambia en una unidad.
La intersección no tiene sentido físico.
Si se desea estimar la probabilidad de poseer una casa usar la expresión:
1 ez
Pi  z

1 e 1 ez

Para lo cual debe disponerse previamente de Zi= 0+1X


Ejemplo:
• El departamento de comercialización de una agencia de
viajes y entretenimiento que opera mediante tarjetas de
crédito está a punto de iniciar una campaña para convencer
a los actuales clientes que poseen una tarjeta de crédito
estándar de la compañía para que la cambien por una de
sus tarjetas premium. La principal decisión que enfrenta el
departamento de comercialización tiene que ver con la
cuestión de saber a cuáles de los clientes con tarjeta
estándar debe dirigirse la campaña. Los datos disponibles
correspondientes a una muestra de 30 poseedores de
tarjeta, que fueron contactados durante la campaña del año
anterior, indican lo siguiente:
• El poseedor pasó de tener una estándar a una tarjeta
premium: 1= SI, 0= No (Variable X1)
• Cantidad total de adquisiciones por tarjeta el año anterior,
estuvo medida en miles de dólares gastados (variable X2).
• Si el poseedor de tarjetas de crédito estándar tiene tarjetas
adicionales para otros miembros de su familia: 1= Si lo tiene,
0= No lo tiene. Los datos son los siguientes:
Posesión de Posesión de
Comportami tarjeta de Comportami tarjeta de
ento de Gastos crédito ento de Gastos crédito
adquisición anuales adicional adquisición anuales adicional
0 32.1007 0 0 23.7609 0
1 34.3706 1 0 35.0388 1
0 4.3706 0 1 49.7388 1
0 8.1263 0 0 24.7372 0
0 12.9783 0 1 26.1315 1
0 16.0471 0 0 31.322 1
0 20.6648 0 1 40.1967 1
1 42.0483 1 0 35.3899 0
0 42.2264 1 0 30.228 0
1 37.9900 1 1 50.3778 0
1 53.6063 1 0 52.7713 0
0 38.7936 0 0 27.3728 0
0 27.9999 0 1 59.2146 1
1 42.1694 0 1 50.0686 1
1 56.1997 1 1 35.4234 1
a) Ajuste un modelo de regresión logística para predecir
la probabilidad de Adquirir una Tarjeta Premium
basándose en los Gastos anuales y si Posee o no
Tarjetas Adicionales para otros miembros de la familia.
b) Explique el significado de los coeficientes de regresión
para el modelo ajustado.
c) Prediga la probabilidad de que un cliente con Tarjeta
Estandar que ha cargado S/. 36,000 el año anterior y
que no posee tarjetas adicionales para los miembros
de su familia, adquiera la Tarjeta Premium durante la
campaña de comercialización.
d) Al nivel de significación del 0.05, ¿existe evidencia de
que un modelo logístico que utilice las variables
indicadas anteriormente es un modelo bien ajustado?
e) Al nivel de significación de 0.05 ¿existe evidencia de
que cada una de las variables hace una contribución
significativa al modelo de regresión?
El ejemplo y los datos provienen de Estadística Básica en Administración de
Mark Berenson. Pág. 838.
Ingrese los datos al SPSS y luego utilice los siguientes comandos:

Comandos SPSS:
Analizar
Regresión
Logística binaria
Dependiente
P839_COM
Covariables
P839_GAS
P839_TAR
Guardar
Desvianza
Continuar
Aceptar
Model Summary

-2 Log Cox & Snell Nagelkerke


Step likelihood R Square R Square
1 20.077a .503 .675
a. Estimation terminated at iteration number 6 because
parameter estimates changed by less than .001.

Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step
a
P839GAS .139 .068 4.198 1 .040 1.150
1 P839_TAR 2.774 1.193 5.411 1 .020 16.028
Constant -6.940 2.947 5.545 1 .019 .001
a. Variable(s) entered on step 1: P839GAS, P839_TAR.
a) El modelo de regresión logística ajustado es:
1
Pi 
1  e ( 6.940 0.139GAS  2.774TAR )
b) Si el individuo pasa de 0 a 1, es decir pasa de no poseer a
POSEER una Tarjeta de crédito adicional la probabilidad de
adquirir la Tarjeta Premium se incrementa en 2.77%.
Si el individuo incrementa su Gasto en 1 mil S/. La probabilidad de
adquirir la tarjeta premium se incrementa en 0.139%.
c) 1
Pi 
1  e [ 6.940 0.139 (36.0)  2.774(1)]
1
Pi  [ 0.838]
 0.6980
1 e
La probabilidad que adquiera la tarjeta premium es 69.80%
d) La estadística de desviación sigue una distribución
CHI2 con n-k-1 grados de libertad.

Las Hipótesis son:


H0: EL modelo tiene buen ajuste
H1: El modelo no tiene buen ajuste

Si Desviación >CHI2 , (n-k-1) Rechazar H0.

Obsérvese que 20.05, (30-3-1)=38.89


Por tanto 20.077<38.89. No se rechaza H0.
El modelo tiene buen ajuste
e) En el caso de la variable Gasto: para la significancia
0.05
Las hipótesis son:
H0: El parámetro es cero (0)
H1: El parámetro es diferente de cero (0)

El p_valor del estadístico de Wald es 0.04


0.04<0.05 por tanto se rechaza la Hipótesis nula.
Por tanto, la variable Gasto hace una contribución
significativa al modelo.

En el caso de la Variable POSEE tarjeta adicional, el


p_valor del estadístico de Wald es 0.02 <0.05, con lo que
se rechaza la H0.
Por tanto la variable Posee Tarjeta de crédito adicional
hace una contribución significativa al modelo.
FIN

También podría gustarte