Está en la página 1de 19

Economía Aplicada

Aplicación de Variables Instrumentales


Angrist y Krueger, The Quarterly Journal of Economics, 1991
Does compulsory school attendance aect schooling and earnings?

Departamento de Economía
Universidad Carlos III de Madrid

Ver también Angrist y Pischke (cap. 4)


Introducción

Retorno a la educación

Un ejemplo típico de endogeneidad se presenta al querer estimar el

retorno a la educación regresando ingresos sobre nivel educativo. Una

variable omitida en dicha ecuación es la capacidad o habilidad de los

individuos.

Si las personas más capaces tienen en promedio mayor nivel educativo

y a la vez mayores ingresos, el nivel educativo estará correlacionado

con el término de error y MCO no arrojará estimaciones conables.

Angrist y Krueger en este artículo proponen solucionar el problema de

endogeneidad de la variable educación usando variables instrumentales.

El instrumento propuesto es la fecha de nacimiento medida por el

trimestre de nacimiento.

1 / 18
Idea

Idea de la legislación en EEUU

La idea surge del sistema de educación obligatoria en EEUU: la ley

obliga a asistir a la escuela hasta cumplir 16 años. Y los niños

comienzan la escuela el año calendario en el que cumplen 6 años.

Por ejemplo un estudiante nacido en enero, comienza la escuela con 6

años (y 8 meses) y al cumplir 16 tendrá 9 años completos de

escolarización. Un estudiante nacido en diciembre, comienza la escuela

con 5 años (y 9 meses) y al cumplir 16 tendrá 10 años completos de

escolarización.

Dependiendo de la fecha de nacimiento, los estudiantes estarán en

niveles diferentes al cumplir la edad legal mínima para abandonar la

educación.

2 / 18
Instrumento

Validez del instrumento

Exógeno: la fecha de nacimiento no debería afectar los ingresos de

manera directa (no correlacionado con habilidad, motivación,

conexiones familiares, etc.).

Relevante: correlacionado con el nivel educativo alcanzado.

Angrist y Krueger usan datos del censo de 1980 en EEUU para

hombres nacidos entre 1930 y 1959. Para replicar el artículo usaremos

datos obtenidos de Joshua Angrist Dataverse, un extracto para

hombres nacidos entre 1930-1939.

Presentan la siguiente gura y argumentan que el nivel educativo

medio es generalmente más bajo para los individuos nacidos en los

primeros trimestres del año.

3 / 18
Grácamente

Educación y fecha de nacimiento

Describe la primera etapa de MC2E (condicional en el año de nacimiento).

Además de la tendencia creciente de la educación, se observa el patrón

relacionado al trimestre de nacimiento.


4 / 18
Grácamente

Ingresos y fecha de nacimiento

Muestra la forma reducida de la relación entre el instrumento y la variable

dependiente.
5 / 18
Grácamente

Intuición

En promedio, los hombres nacidos en los primeros trimestres ganan

menos que los que nacieron más tarde en el año.

Esta relación imita el patrón encontrado para la educación.

En general, analizar la primera etapa y la forma reducida ayuda a

entender la posible causalidad en la relación y a motivar el uso de los

instrumentos propuestos.

En este caso, el argumento es que las diferencias de ingresos por

trimestre de nacimiento se deben solamente a las diferencias en nivel

educativo.

6 / 18
Más formalmente 1/2

Para simplicar usaremos como instrumento una variable binaria que vale

uno si el individuo nació en el primer trimestre y cero si no (Z debajo).

Una representación matemática de los grácos podría ser:

Primer gráco (variable dependiente educación, primera etapa de

MC2E):

EDUCi = π0 + π1 Zi + π2 Y1930 + ...π10 Y1938 + vi ,


donde Yj es una variable binaria que vale uno si el individuo nació en
el año j . El parámetro π1 captura el efecto del trimestre de nacimiento

en la variable endógena, condicional en el año de nacimiento.

7 / 18
Más formalmente 2/2

Segundo gráco (variable dependiente salario):

log (wi ) = γ0 + γ1 Zi + γ2 Y1930 + ...γ10 Y1938 + εi , donde el parámetro γ1


captura el efecto directo del trimestre de nacimiento (Z ) en la variable

dependiente (log (wi )), condicional en el año de nacimiento.

Nota: a las VI se les suele llamar también instrumentos excluidos, en

oposición a los instrumentos incluidos que son los regresores exógenos en la

ecuación original. La primera etapa regresa la variable endógena en los

instrumentos excluidos e incluidos.

8 / 18
Más formalmente 2/2

Primeras estimaciones

Las estimaciones de las ecuaciones anteriores presentadas en el

artículo encuentran que los hombres nacidos en el primer trimestre

tienen aproximadamente 1/10 menos de educación y ganan 1, 1%

menos que los hombres nacidos en trimestres posteriores.

Replicamos las estimaciones que realizan los autores para llegar a estas

conclusiones.

Es necesario crear variables binarias para el primer trimestre y para los

controles (presentamos los resultados sin controles, para replicar la

Tabla III, panel B).

9 / 18
Más formalmente 2/2

Replicando las primeras estimaciones

Estimaciones en gretl:

\ = 12.797 − 0.109
EDUC QB1
(0.0066) (0.0133)

\
LWKLYWGE = 5.903 − 0.011 QB1
(0.0014) (0.0027)

Tabla III en el artículo:

10 / 18
MCO vs. VI

Principales resultados

La ecuación básica estimada en el artículo es:

log (wi ) = β0 + β1 Xi + ∑c ξc Yic + ρ Ei + µi ,


con una primera etapa dada por:

Ei = π0 + π1 Xi + ∑c δc Yic + ∑c θcj Yic Qij + εi


Si el error de la ecuación de salarios está correlacionado con los años

de educación, las estimaciones de MCO del retorno a la educación no

serán consistentes.

Los instrumentos entonces son interacciones entre trimestre y año de

nacimiento .

Los autores agregan controles adicionales: variables binarias para el

lugar de nacimiento, edad y edad al cuadrado, raza, estado civil. Los

resultados son similares en todas las especicaciones.


11 / 18
MCO vs. VI

Estimaciones MCO vs. VI

12 / 18
MCO vs. VI

Estimaciones MCO vs. VI

Comentarios de los autores:

En todas las especicaciones mostradas los modelos están

sobreidenticados. Llevando a cabo un contraste de Sargan, no se

rechaza en ninguna de las especicaciones las restricciones de

sobreidenticación.

Las estimaciones de 2SLS son generalmente similares a las

estimaciones MCO correspondientes.

Las pequeñas diferencias encontradas sugieren que las estimaciones

MCO si acaso subestiman los retornos de la educación. En general

este resultado sugiere que la existencia de variables omitidas no parece

ser un problema muy importante.

13 / 18
Críticas

En Economía Aplicada

¾Que hubiéran hecho vosotros luego de las clases de Economía Aplicada?

Miremos a los resultados de las columnas (3) y (4).

La exogeneidad se analiza con Sargan y aparece en la tabla: χ 2 = 23.1


¾Los instrumentos son relevantes? Ver primera etapa: F = 1.5909.
¾Conclusión?

La consecuencia de que los instrumentos tengan poco poder

explicativo es incrementar el sesgo de los estimadores de VI. Si ese

poder explicativo es débil` las propiedades asintóticas fallan.

En general este resultado sugiere que la existencia de variables

omitidas no parece ser un problema muy importante.` ¾Entonces

usamos MCO o VI? Contraste de Hausman: p-valor = 0.864908.


¾Conclusión?
14 / 18
Críticas en la literatura

Críticas: Exogeneidad

¾Es la fecha de nacimiento una variable exógena?

Buckles y Hungerman en The Review of Economics and Statistics en

2013 argumentan que existe estacionalidad en las características de las

madres. Controlando por el entorno famliar se logra explicar casi la

mitad de la correlación entre fecha de nacimiento y resultados

posteriores.

Los autores encuentran que las mujeres que tienen bebés en invierno

son signicativamente más jóvenes, con menor nivel educativo y con

una menor probabilidad de estar casadas.

15 / 18
Críticas en la literatura

Estacionalidad en características de las madres

16 / 18
Críticas en la literatura

Críticas: Instrumento débil BJB

Bound, Jaeger y Baker, en un artículo en el Journal of the American

Statistical Association en 1995 argumentan que es un caso de

instrumento débil: la fecha de nacimiento está muy poco

correlacionada con el nivel educativo una vez se controla por ciertas

variables.

BJB utilizaron un instrumento verdaderamente irrelevante: se asignó

una fecha de nacimiento aleatoria a cada individuo y se usó esa fecha

como instrumento (sugerido por Krueger). Los autores argumentan

que los resultados de MC2E fueron similares a los obtenidos con la

fecha real (ver la Tabla 3).

Pero también reconocen que se podría detectar el problema en la

primera etapa.
17 / 18
Críticas en la literatura

Estimaciones BJB

Las dos primeras columnas son comparables a las columnas (6) y (8) de la Tabla V
de AK. Las otras dos incluyen instrumentos adicionales.
18 / 18

También podría gustarte