Está en la página 1de 28

T4.

Modelos con variables cualitativas


Ana J. L opez y Rigoberto P erez
Dpto Econom a Aplicada. Universidad de Oviedo

Curso 2010-2011

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

1 / 28

Indice

Las variables cualitativas en el ambito econ omico

La trampade las variables cticias

Variables cualitativas dependientes Modelos Logit

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

2 / 28

Modelos con variables cualitativas


Competencias

Este tema analiza la posibilidad de incorporar caracter sticas cualitativas para mejorar la capacidad explicativa de los modelos y presenta a t tulo introductorio los modelos de variable cualitativa dependiente. Se pretende que a su nalizaci on los alumnos hayan adquirido las siguientes competencias: Denir e interpretar las variables dummy Comprender las razones que impiden plantear modelos de regresi on con variables dependientes cualitativas Interpretar los coecientes estimados de un modelo logit

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

3 / 28

Las variables cualitativas en el ambito econ omico

Las variables cualitativas en el ambito econ omico

Algunas variables econ omicas pueden depender de caracter sticas tales como el g enero, el sector de actividad, el lugar de residencia, la ideolog a pol tica...
Ejemplos: Discriminaci on salarial por g enero, impacto sobre el gasto del tipo de gobierno

En el an alisis temporal pueden existir efectos asociados a la estacionalidad, o cambios de tendencia que tambi en ser an recogidos mediante variables cualitativas
Ejemplos: Estacionalidad en el turismo, impacto de la ampliaci on de la Uni on Europea, ...

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

4 / 28

Las variables cualitativas en el ambito econ omico

Incorporaci on de variables cualitativas

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

5 / 28

Las variables cualitativas en el ambito econ omico

Incorporaci on de variables cualitativas

Introducci on de variable dummy: D =

1 0

si el trabajador es hombre si el trabajador es mujer


Curso 2010-2011 6 / 28

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Las variables cualitativas en el ambito econ omico

Modelos con variable dummy: Y = 1 + 2 X + 3 D + u

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

7 / 28

Las variables cualitativas en el ambito econ omico

Modelos con variable dummy: Y = 1 + 2 X + 3 D + 4 DX + u

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

8 / 28

Las variables cualitativas en el ambito econ omico

Modelos con variable dummy: Y = 1 + 2 X + 3 D + 4 DX + u

En estos gr acos, 3 y 4 son signicativos?


Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas Curso 2010-2011 9 / 28

La trampade las variables cticias

La trampade las variables cticias


DA = 1 0 1 0 1 0 1 0 si el trabajador pertenece al sector agricultura en otro caso si el trabajador pertenece al sector industria en otro caso si el trabajador pertenece al sector construcci on en otro caso si el trabajador pertenece al sector servicios en otro caso

DI =

DC =

DS =

Y = 1 + 2 X + 3 DA + 4 DI + 5 DC + 6 DS + u
Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas Curso 2010-2011 10 / 28

La trampade las variables cticias

La trampade las variables cticias


Y = 1 + 2 X + 3 DA + 4 DI + 5 DC + 6 DS + u DAi + DIi + DCi + DSi = 1 , i = 1, . . . , n 1 X1 DA1 DI 1 DC 1 DS 1 1 X2 DA2 DI 2 DC 2 DS 2 X = . . . . . . . . . . . . . . . . . . 1 Xn DAn DIn DCn DSn Relaci on lineal o Multicolinealidad entre las variables explicativas (rango no pleno (X) = k ; |X X| = 0 X X no es invertible, EMC no denidos ) SOLUCION: Excluir una de las r categor as consideradas, deniendo r-1 variables dummy (la categor a excluida es la referencia para la interpretaci on de coecientes).
Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas Curso 2010-2011 11 / 28

La trampade las variables cticias

Modelo salarial en funci on de experiencia y sector econ omico: Y = 1 + 2 X + 3 DI + 4 DC + 5 DS + u


1 + 2 X + 5 1 + 2 X + 4 1 + 2 X + 3 1 + 2 X

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

12 / 28

La trampade las variables cticias

Ilustraci on: Variable dummy asociada al g enero


Modelo 1: MCO, usando las observaciones 1--50 Variable dependiente: salario Coeficiente const experiencia 831.818 36.5540 Desv. T pica 310.984 9.19926 2010.320 20997328 0.247523 15.78935 394.6440 797.1120 Estad stico t 2.6748 3.9736 Valor p 0.0102 0.0002 754.6359 661.3958 0.231847 0.000237 793.2880 794.7442

Media de la vble. dep. Suma de cuad. residuos R2 F (1, 48) Log-verosimilitud Criterio de Schwarz

D.T. de la vble. dep. D.T. de la regresi on R2 corregido Valor p (de F ) Criterio de Akaike Hannan--Quinn

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

13 / 28

La trampade las variables cticias

Ilustraci on: Variable dummy asociada al g enero


Modelo 2: MCO, usando las observaciones 1--50 Variable dependiente: salario Coeficiente const experiencia masculino 185.252 33.8524 1264.94 Desv. T pica 89.3293 2.52513 52.0198 Estad stico t 2.0738 13.4062 24.3165 Valor p 0.0436 0.0000 0.0000 754.6359 181.3726 0.942234 2.98e30 664.8555 667.0398

Media de la vble. dep. Suma de cuad. residuos R2 F (2, 47) Log-verosimilitud Criterio de Schwarz

2010.320 1546114 0.944592 400.6285 329.4277 670.5915

D.T. de la vble. dep. D.T. de la regresi on R2 corregido Valor p (de F ) Criterio de Akaike Hannan--Quinn

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

14 / 28

La trampade las variables cticias

Ilustraci on: Variable dummy asociada al g enero


Modelo 3: MCO, usando las observaciones 1--50 Variable dependiente: salario Coeficiente const experiencia masculino exp masc 857.022 12.6705 225.344 32.4578 Desv. T pica 64.4528 1.95120 80.9078 2.41534 2010.320 313882.3 0.988751 1347.808 289.5657 594.7795 Estad stico t 13.2969 6.4937 2.7852 13.4382 Valor p 0.0000 0.0000 0.0077 0.0000 754.6359 82.60465 0.988018 8.19e45 587.1314 590.0438

Media de la vble. dep. Suma de cuad. residuos R2 F (3, 46) Log-verosimilitud Criterio de Schwarz

D.T. de la vble. dep. D.T. de la regresi on R2 corregido Valor p (de F ) Criterio de Akaike Hannan--Quinn

Los trabajadores de g enero MASCULINO ven aumentado su salario esperado y tambi en el efecto marginal de la experiencia sobre el salario
Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas Curso 2010-2011 15 / 28

La trampade las variables cticias

Ilustraci on: Variable dummy asociada a la estacionalidad


700000

600000

500000

turismo

400000

300000

200000

100000

1960

1970

1980

1990

2000
Curso 2010-2011 16 / 28

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

La trampade las variables cticias

Ilustraci on: Variable dummy asociada a la estacionalidad

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

17 / 28

La trampade las variables cticias

Ilustraci on: Variable dummy asociada a la estacionalidad


Modelo 3: MCO, usando las observaciones 1983:3--2004:4 (T = 86) Variable dependiente: turismo Coeficiente const dq2 dq3 dq4 239171. 74095.4 75382.9 108457. Desv. T pica 28294.6 40014.7 39557.3 39557.3 248803.2 1.38e+12 0.262667 9.737208 1132.432 2282.681 0.528413 Estad stico t 8.4529 1.8517 1.9057 2.7418 Valor p 0.0000 0.0677 0.0602 0.0075 148313.1 129662.3 0.235691 0.000014 2272.864 2276.815 0.942326

Media de la vble. dep. Suma de cuad. residuos R2 F (3, 82) Log-verosimilitud Criterio de Schwarz

D.T. de la vble. dep. D.T. de la regresi on R 2 corregido Valor p (de F ) Criterio de Akaike Hannan--Quinn Durbin--Watson

Respecto al primer trimestre el turismo aumenta sistem aticamente el segundo trimestre y tambi en el tercero. Por el contrario en el cuarto se reduce
Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas Curso 2010-2011 18 / 28

Variables cualitativas dependientes

Modelos de variable cualitativa dependiente

En algunas ocasiones nuestro objetivo es explicar una variable dependiente cualitativa: Con dos modalidades: Modelos binomiales Con m as de dos modalidades: Modelos multinomiales Con varias modalidades que presentan un orden natural: Modelos ordenados Con modalidades asociadas a una decisi on que condiciona las siguientes: Modelos secuenciales

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

19 / 28

Variables cualitativas dependientes

Modelos de variable cualitativa dependiente


El modelo lineal y = X + u no es aplicable para variables dependientes dicot omicas Las perturbaciones u son dicot omicas y por tanto no normales Al ser y dicot omica se cumple E (y) = p No est a garantizado que E (y) = X adopte valores entre 0 y 1
1 Y = 0.473 + 0.000478t

0.8

0.6

0.4

0.2

1985

1990

1995

2000

2005

2010

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

20 / 28

Variables cualitativas dependientes

Modelos de variable cualitativa dependiente


SOLUCION:

Introducir una variable auxiliar ( variable ndice ) Z continua que se interpreta como propensi on a la categor a investigada (encontrar empleo, aliarse a un sindicato, realizar una compra, ...) Y = pi 1 pi 1, 0, si Z > 0 si Z 0

= P (Y = 1) = P (Z > 0) = P (x + u > 0) = P (u > x ) = 1 Fu (x ) = P (Y = 0) = P (Z 0) = P (x + u 0) = P (u x ) = Fu (x )

Asumiendo ciertas distribuciones probabil sticas para u (log stica, Normal, uniforme, ... ) es posible conocer la distribuci on de probabilidad de la variable Y.
Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas Curso 2010-2011 21 / 28

Variables cualitativas dependientes

Modelos Logit, Probit y Uniforme

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

22 / 28

Variables cualitativas dependientes

Modelos Logit

Modelos Logit
Funci on log stica de distribuci on de los errores: Fu (x ) = pi = P (Yi = 1) = 1 Fu (xi ) = 1

1 1 + e x

e xi 1 = 1 + e xi 1 + e xi pi 1 pi

pi 1 + e xi = e xi e xi =

ln e xi = ln

pi 1 pi

= xi

ln

pi 1 pi

= 1 + 2 X2i + + k Xki

Logit expresados como funci on lineal de las variables explicativas


Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas Curso 2010-2011 23 / 28

Variables cualitativas dependientes

Modelos Logit

Ilustraci on: Modelo logit para el empleo

Modelo logit para explicar si una persona est a ocupada en funci on de sus estudios

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

24 / 28

Variables cualitativas dependientes

Modelos Logit

Ilustraci on: Modelo logit para el empleo

Iteraci on 0: log-verosimilitud = -504.571221559 Iteraci on 1: log-verosimilitud = -491.183952849 Iteraci on 2: log-verosimilitud = -491.172320140 Iteraci on 3: log-verosimilitud = -491.172320124 Criterio de parada basado en Log-Verosimilitud

Modelo 2: Logit, usando las observaciones 1--740 Variable dependiente: empleo Coeficiente const estudios 1.74855 0.168757 Desv. T pica 0.429247 0.0347109 z 4.0735 4.8618 Pendiente . 0.0410787 0.243419 0.021094 986.3446 989.8969

Media de la vble. dep. R 2 de McFadden Log-verosimilitud Criterio de Schwarz

0.578378 0.025064 491.1723 995.5579

D.T. de la vble. dep. R 2 corregido Criterio de Akaike Hannan--Quinn

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

25 / 28

Variables cualitativas dependientes

Modelos Logit

Ilustraci on: Modelo logit para el empleo


402 403 404 405 423 424 429 430 431 432 433 434 435 436 437 438 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.000000 0.401674 0.648864 0.568697 0.568697 0.754049 0.484760 0.568697 0.721430 0.568697 0.568697 0.568697 0.568697 0.609520 0.568697 0.568697 0.484760 0.598326 0.351136 0.431303 0.431303 0.245951 0.515240 -0.568697 -0.721430 -0.568697 -0.568697 -0.568697 -0.568697 -0.609520 -0.568697 -0.568697 -0.484760 Falso negativo

Falso negativo Falso Falso Falso Falso Falso Falso Falso Falso Falso positivo positivo positivo positivo positivo positivo positivo positivo positivo

Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas

Curso 2010-2011

26 / 28

Variables cualitativas dependientes

Modelos Logit

Bondad de los modelos Logit


Medida basada en raz on de verosimilitudes 2 ln LNR LR ln LNR ln LR

Medida de Mc Fadden (1974)

R2 = 1

Proporci on de aciertos

N um, predicciones correctas N um. observaciones

LNR: M ax de L respecto a todos los par ametros LR: M aximo de L restringido (con i = 0, i ) La raz on de verosimilitudes contrasta la nulidad de
Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas Curso 2010-2011 27 / 28

Variables cualitativas dependientes

Modelos Logit

Ilustraci on: Modelo logit para el empleo


Coeficiente const estudios 1.74855 0.168757 Desv. T pica 0.429247 0.0347109 z 4.0735 4.8618 Pendiente . 0.0410787 0.243419 0.021094 986.3446 989.8969

Media de la vble. dep. R 2 de McFadden Log-verosimilitud Criterio de Schwarz

0.578378 0.025064 491.1723 995.5579


Evaluado

D.T. de la vble. dep. R 2 corregido Criterio de Akaike Hannan--Quinn

en la media

N umero de casos correctamente predichos = 442 (59.7 percent) f ( X ) en la media de las variables independientes = 0.243 Contraste de raz on de verosimilitudes: 2 (1) = 25.254 [0.0000] Predicho 0 1 64 248 50 378

Observado

0 1

Este modelo logit clasifica correctamente 442 casos (casi el 60 %). Hay 248 falsos positivos (34 %) y 50 falsos negativos (6 %)
Ana J. L opez y Rigoberto P erez (Dpto Econom a T4. Aplicada. Modelos Universidad con variables de Oviedo) cualitativas Curso 2010-2011 28 / 28

También podría gustarte