Documentos de Académico
Documentos de Profesional
Documentos de Cultura
M etodología cuantitativa I V
Bruno Arpino
(Despacho: 20.182; email: bruno.arpino@upf.edu)
Clase 8: regresión logistica
Probabilidades pronosticadas
2
Clase 8: regresión logistica
Estar en el paro o no
Votar sí o no a un referéndum
3
Clase 8: regresión logistica
Las variables son significativas. Hay una relación lineal entre edad y P de haber votado,
y años de estudio y P de haber votado. en ambos casos la relación es positiva
El modelo lineal no es apropiado en todos los casos, tenemos otra función con los casos
limitados entre 0 y 1
Modelo de regresión logística (binaria)
Foto gràfica!!!!
El modelo logístico establece la siguiente relación entre la probabilidad de
que ocurra el suceso (variable dependiente = 1) y las variables
independientes: La relación entre
Así, los X y Y no es lineal,
valores 1 no es constante.
numérico P (Y = 1) =
s no se
pueden
1 + e −( β 0 + β1 X 1 + β 2 X 2 +...+ β k X k )
Este modelo empieza con la regresión lineal pero se hace una transformación
interpreta para que el resultado final siempre esté entre 0 y 1
r donde e es el número de Euler o constante de Napier (2.71828)
directame
(http://es.wikipedia.org/wiki/N%C3%BAmero_e). La constante tampoco se puede
nte (a
interpretar directamente
diferencia
del Los signos de los coeficientes de cada variable independiente indican si hay
modelo un efecto positivo o negativo sobre la probabilidad de que Y sea 1 cuando
lineal)
aumentan los valores de cada variable independiente.
En ese sentido, por esta razón solo cogemos 16 CCAA en vez de 17. Porque si
sabemos 16 podemos calcular ya la 17
9
Clase 8: regresión logistica
Probabilidades pronosticadas
Después haber estimado los coeficientes del modelo logístico y utilizando la
formula
1
P (Y = 1) = − ( β 0 + β1 X 1 + β 2 X 2 +...+ β k X k )
1+ e
2. Imponer valores a las variables (las X), por ejemplo los valores que nos interesen
Por ejemplo, utilizando las estimaciones del modelo logístico anterior SPSS
indica que la probabilidad de votar para una persona de 38 años, que ha
estudiado 11 años y que vive en el País Vasco es igual a 61,25%.
11
Clase 8: regresión logistica
Para practicar
En el año 2014, un investigador ha encuestado una muestra de
2000 trabajadores que perdieron el trabajo después el comienzo de
la crisis del 2008. El investigador ha recopilado datos sobre el
estado ocupacional en 2014 (empleado = 1; desempleado = 0), la
edad y el nivel de estudios (primario =1; segundario =2; terciario =
3, grupo de referencia). El investigador ha utilizado una regresión
logística (véase la tabla abajo) para analizar si la edad y el nivel de
estudio influyen en la probabilidad de encontrado trabajo.
¿Se puede afirmar que a cada año más de edad, corresponde una
reducción de 5 puntos porcentuales
en la probabilidad de encontrar Tabla
trabajo? B Sig.
¿Al aumentar del nivel de estudios, a
Paso 1 edad -0,053 ,002
Referencias
Santiago de la Fuente Fernandez, Regresion logistica
http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/C
UALITATIVAS/LOGISTICA/regresion-logistica.pdf
13
Si algo no queda claro
o escribirme un email
14
Modelo de regresión logística (binaria)
El modelo logístico se conoce también como modelo logit porque se puede
escribir como:
P (Y = 1)
logit[ P (Y = 1)] = Log = β 0 + β1 X 1 + β 2 X 2 + ... + β k X k
P (Y = 0)
15