Está en la página 1de 38

Microeconometría

Jorge Catepillan
September 1, 2022
Universidad de Piura
Variables Instrumentales
Variables Instrumentales: 1 regresor 1 instrumentos

• Supongamos el siguiente modelo:

yi = β0 + β1 xi + ui

• Recordar, si sólo observamos xi e yi , necesitamos que ui sea exógena para


poder identificar β.

• Si esto no se cumple (ej, por variables omitidas) una solución es agregar


más controles. Sin embargo, si estos no están disponibles, ¿qué se puede
hacer?

1
Variables Instrumentales: 1 regresor 1 instrumentos

• Supongamos que existe una variable zi que está correlacionada con xi (es
relevante), pero no con ui (es exógena). Entonces,

Cov(yi , zi ) = β1 Cov(xi , zi ) + Cov(ui , zi )


= β1 Cov(xi , zi )

Cov(yi , zi )
β1 =
Cov(xi , zi )
• Y con esto identificamos el efecto causal de xi en yi !

2
Ejemplo 1:

Angrist, Lifetime Earnings and the Vietnam Era Draft Lottery: Evidence from
Social Administrative Records.

• Supongamos que queremos saber el efecto de hacer servicio el servicio militar (xi = 0 o 1)en
los salarios futuros de los conscriptos.

• ¿Es la decisión de hacer el servicio militar endógena o no?

• En la guerra de Vietnam, hubo un llamado al servicio militar obligatorio en USA. A cada


hombre ”joven” se le asigna un número que determina el orden en el que son llamados al
servicio.

• Luego de ser llamados, algunas personas son rechazadas por motivos de salud.

• Supongamos que zi es el número de la lotería. ¿Es relavante para xi ?

• Si zi es asignado al azar, ¿es exógeno?

3
Ejemplo 2:

Algo que muchos investigadores han tratado de responder es ¿cuál es el efecto


de invertir en educación (Xi , por ejemplo, ir a la universidad) en los salarios (Yi )

• ¿Existe endogeneidad en este tipo de problemas? ¿Qué cosas podrían


explicar eso? ¿Es la razón de esa exogeneidad observable o no?

• Dos instrumentos ampliamente utilizados. Primero, distancia de la casa de


los padres a la universidad más cercana. ¿Es relevante? ¿Es exógeno?

• Segundo, educación del padre/madre. ¿Por qué podría ser relevante y


exógeno?

4
Ejemplo 3:

The Colonial Origins of Comparative Development: An Empirical Investigation;


Daron Acemoglu, Simon Johnson, James A. Robinson

• Los autores quieren responder como afectan distintas ”instituciones” (ej, derechos de
propiedad) a variables económicas como PIB per cápita.

• Sin embargo, analizar esto en un corte transversal genera problemas de endogenidad.

• Bajo la premisa de que las buenas instituciones persisten en el tiempo, elaboran una teoría
que les permite ocupar como instrumento la mortalidad de los primeros colonos europeos.

5
Ejemplo 3:

The Colonial Origins of Comparative Development: An Empirical Investigation;


Daron Acemoglu, Simon Johnson, James A. Robinson

• El mecanismo es el siguiente, si la mortalidad de los colonos es baja, entonces los colonos


que llegan quieren desarrollar las mismas instituciones que en sus países de origen.

• A esta situación, le denominan instituciones ”productivas”, que aseguran derechos de


propiedad, balance de poderes etc.

• Si la mortalidad de los colonos es alta, entonces los pocos que sobreviven desarrollan
instituciones ”extractivas”.

• Argumentan que estas instituciones perduran en el tiempo, y afectan las instituciones


actuales, pero no afectan a nada más que podría afectar al crecimiento.

6
Estimación

El estimador de variables instrumentales en este caso es el equivalente


muestral a β1 .

\ ∑
Cov(y i , zi ) (y − ȳ)(zi − z̄)
β̂IV = =∑ i
\
Cov(x , z ) (xi − x̄)(zi − z̄)
i i

• Si se cumplen las condiciones de relevancia y exogeneidad del instrumento,


más condicione de i.i.d. entonces el estimador es consistente.

• Si hay 4tos momentos acotados, entonces N(β̂IV − β1 ) converge a una
distribución normal.

7
Estimación: Regresión en Dos Etapas

Esto es equivalente a:

• Primero, regresionar xi en zi y una constante, y obtener x̂i

• Notar que vamos a obtener la parte de xi que está explicada por zi .

• Segundo, regresionar yi en x̂i .

• Así se obtiene el estimador β̂IV cuando hay un instrumento y un regresor!

• En general, existen estimadores alternativos de variables instrumentales.


Sin embargo, en este caso simple, podemos ocupar el estimador de dos
etapas, que es fácil de generalizar

8
Modelo general: Estimación en Dos Etapas (MCO2E)

Supongamos el siguiente modelo:

yi = x′i β + w′i γ + ui

Con xi ∈ Rk , wi ∈ Rr
• xi son endógenos (E(ui |xi ) ̸= 0) y wi son exógenos.
• zi ∈ Rm son variables excluídas que son exógenas.
• Necesitamos al menos un instrumento por cada variable endógena.
1. m < k se dice que el modelo está sub-identificado.
2. m = k, se dice que el modelo está identificado.
3. m! = k, se dice que el modelo está sobre-identificado.
• Si el modelo está sub-identificado MCO2E no va a producir estimaciones consistentes. Si el
modelo está sobre identificado, podemos testear cosas interesantes.
9
Modelo general: Estimación en Dos Etapas (MCO2E)

• Para cada componente de xi , Xij , corremos el siguiente modelo:

Xij = z′i πj + w′i δj + Vij

• A partir de eso, encontramos π̂j y δ̂j , con lo que obtenemos estimaciones de


x̂ij .
• La segunda etapa es regresionar yi en x̂i y wi .
• Stata hace esto automáticamente.
• Bajo condiciones que veremos en la siguiente slide, este estimador es
consistente y asintóticamente normal.
• Hay que hacer ciertos ajustes en los errores por la doble estimación.
ivregress 2sls [depvar] ([end vars] = [instrs]) [ctrls], robust

10
Supuestos: Estimación en Dos Etapas (MCO2E)

• Linealidad.

• Exogeneidad de wi : E[ui |wi , zi ] = 0

• IID: (yi , xi , wi , zi ) son iid.

• Cuartos momentos finitos.


• Que se cumplan las condiciones del instrumento:
1. Relevancia: No hay multicolinealidad entre (x̂i , wi ). Si k = 1, esto es
equivalente a que π ̸= 0.

2. Endogeneidad: E[ui |zi ] = 0.

11
Ejemplo: m = k, r = 0

• β̂MCO2E = (X′ Z(Z′ Z)−1 Z′ X)−1 X′ Z(Z′ Z)−1 Z′ Y = (X′ PZ X)−1 X′ PZ Y

• La condición de relevancia es que X′ PZ X es invertible. ¿Cuál es la intuición ?

• Con los supuestos anteriores, ¿es este estimador consistente, insesgado?

• ¿Cuál es la varianza del estimador? ¿Cómo es la distribución asintótica de



n(β̂MCO2E − β) ?

12
Ejemplo: Demanda y Oferta

• Supongamos que la demanda y oferta de un bien se comportan de acuerdo a las siguientes


ecuaciones:

qdi = β0 + β1 pi + udi
qsi = π0 + π1 pi + usi

• Lo que observamos es el equilibrio, entonces qdi = qsi

• Sin embargo, existe correlación entre el precio y los errores! Intuitivamente, cuando Ud es
grande, q es grande. Pero cuando q es grande, entonce p es grande. Lo opuesto para Us

• Además: en la regresión lineal, lo que hacemos es encontrar la línea que se acopla de mejor
manera a (pi , qi ). Pero, cuál de las dos líneas ? No podemos hacerlo con la oferta y demanda
al mismo tiempo. Existen muchos valores de β0 , β1 , π0 y π1 que podrían explicar los datos.

13
Ejemplo: Demanda y Oferta

Tres realizaciones de (Ud , Us ), pero que terminan con el mismo q! El estimador de MCO
encontraría que la relación entre el precio y cantidad es cero, lo cual no es ni la pendiente de la
demanda ni la de la oferta. 14
Ejemplo: Demanda y Oferta

• Variables instrumentales permite solucionar este problema.

• Supongamos que existe una variable zi que mueve la oferta. Por ejemplo, las condiciones
climáticas en el mar en el mercado de pescados. Malas condiciones aumentan el costo o
peligro de pescar, reduciendo la oferta.

• Malas condiciones climáticas deberían estar correlacionadas con el precio. (esto se puede
testear).

• Tenemos que asumir que estas no están correlacionadas con los shocks de demanda (Ud ).
(esto no lo podemos testear)

• Si las condiciones se cumplen, entonces regresionando q en p con Z de variable


instrumental, podemos estimar consistentemente la pendiente de la demanda.

• Sin embargo, esto no va a permitir identificar a la oferta.

15
Ejemplo: Demanda y Oferta

Supongamos que Z mueve la curva de oferta en π2 . Se puede determinar la curva de demanda


mirando a los puntos cafés y negros?
16
Chequeando que los instrumentos sean válidos.

Recuerdo, para que los instrumentos sean válidos se necesitan dos supuestos
claves.

• Relevancia: ”movimientos en Z inducen cambios en X.”

• Exogeneidad: ”movimientos en Z no afectan al error U”

17
Relevancia: Instrumentos Débiles

• Recordar, para obtener estimaciones buenas de β1 es necesario observar


variaciones de los datos.
• Si los instrumentos no ”mueven” mucho al regresor endógeno, entonces:
1. Los estimadores de la primera etapa tienen mayor varianza, (como en el caso
en que X no varía mucho en MCO clásico).
2. Las aproximaciones que se hacen ocupando el teorema central del límite y la
ley de los grandes números pueden no ser muy buenas. Esto hace que el
”sesgo de consistencia” sea grande, y que los test no sean correctos.
3. En el caso de los cigarrillos que vimos la semana pasada, un instrumento que
podría ser débil es la distancia del estado a la planta de cigarrillos. ¿Por qué?

18
Relevancia: Instrumentos Débiles

• Ejemplo: 1 regresor 1 instrumento. Si la Cov(X, Z) tiende a 0, entonces en el


límite, β̂2sls es la división de dos normales.

• El caso anterior es dificil de verlo en la práctica, pero si hace que surja la


pregunta, ¿cuán relevante tiene que ser el instrumento para que las
aproximaciones que estamos haciendo sean buena?

• Una estrategia usada por algunos investigadores cuando hay sólo un


regresor endógeno es testear si en la primera etapa de la regresión, todos
los coeficientes son cero. Esto se hace observando el estadístico F, y
rechazando la hipótesis de no-relevancia si su valor es mayor a 10.

19
Relevancia: Instrumentos Débiles

¿Cómo proceder en caso de tener instrumentos débiles?

• Si tenemos muchos instrumentos con algunos débiles y otros fuertes,


entonces eliminar los débiles.
• Si tenemos identificación exacta, entonces no se pueden eliminar
instrumentos (igual número de instrumentos que de regresores endógenos).
• Si son muchos los instrumentos débiles, tampoco.
• Solución 1: buscar otros instrumentos
• Solución 2: proceder con métodos distintos a MCO2E. Stock Watson
Apéndice 12.5.

20
Ejemplo: Instrumentos Débiles

• Estimación del retorno a la educación. Relación entre el logaritmo de los


sueldos con los años de educación.
• Como hemos discutido, esa regresión presenta endogeneidad.
• Angrist y Krueger (1991) propusieron que el cumpleaños era un buen
instrumento.
• Idea: La ley en USA establece que la gente tiene que estar en el colegio
hasta los 16 años. Entonces, si alguien cumple años antes de que termine el
año escolar, tiene menos probabilidades de terminar ese grado que alguien
que cumple años justo después de que termine el año escolar.
• Ellos usaron una muestra muy grande (más de 300,000 observaciones) , y
controlaron por otras variables.
• Sin embargo, los instrumentos parecen débiles, o no?
21
Ejemplo: Instrumentos Débiles

• Bound, Jaeger y Baker (1995) pensaron que los instrumentos eran débiles.

• Para mostrarlo, asignaron fechas de nacimiento al azar, y rehicieron el


análisis de Angrist y Krueger.

• El resultado fue prácticamente el mismo que en el paper de Angrist y


Kruger! Las estimaciones eran muy precisas, pero no tenían sentido pues el
instrumento no era relevante.

• El problema de Angrist y Krueger era que en algunas de las regresiones, el


estadístico F de la primera etapa era muy pequeño.

22
Tests
Testear instrumentos débiles

• Testear instrumentos débiles es equivalente a testear que la correlación


entre X y Z sea lo ”suficientemente” grande.

• Para el caso de la regresión en dos etapas, se testea que los coeficientes del
intrumentos sean sifnificativos (Estadístico F > 10).

• estat firststage

23
Test de endogeneidad de X

• Al igual que en panel, podemos ocupar un test de Hausmann para testear


endogeneidad del regresor X.

• Idea, si no hay endogeneidad, y el instrumento es válido, entonces el


estimador de MCO y IV deberían ser parecidos.

• Si son parecidos, entonces el estimador de MCO es mejor.

• Si son distintos, entonces deberian haber indicios de endogeneidad.

• estat endogeneous

24
Instrumentos endógenos

• Si los instrumentos son endógenos, entonces las estimaciones no van a ser


consistentes, y los test no van a ser muy útiles.
• El problema es que no observamos Ui , por lo que es dificil testear si la
condición de exogeneidad se cumple.
• Sin embargo, si hay más instrumentos que regresores endógenos, se puede
construir un test de sobre identificación que permite testear si alguno de
los instrumentos son endógenos.
• De todos modos, para justificar que un instrumento es exógeno, es
necesario hacer un juicio experto basado en el conocimiento personal de la
aplicación.

25
Test de sobreidentificación

• Si hay más instrumentos que regresores endógenos, podemos construir más


de un estimador de MCO2E.
• Si están convergiendo a cosas que ”no se parecen”, entonces al menos uno
de los instrumentos no es exógeno.
• Un test de sobreidentificación compara la realización del estadístico con su
distribución asintótica bajo la hipótesis nula (no hay exogeneidad). Si el
valor es muy grande, entonces la rechaza.
• Si eso pasa, sólo significa que al menos uno es exógeno, pero no dice cuál
de todos!
• estat overid

26
¿Cómo obtener instrumentos válidos?

• Variables instrumentales solucionan muchos de los problemas que


discutimos en clases anteriores.
• Sin embargo, para eso, es necesario tener instrumentos que sean relevantes
y exógenos, y esto no siempre es tarea fácil.
• Principalmente, existen dos formas de obtener buenos instrumentos:
1. A partir de la teoría económica (ejemplo, cosas que afecten la oferta pero no
la demanda).
2. Buscar variaciones de X que se hayan producido al azar. Por ejemplo, un
terremoto podría afectar la cantidad de alumnos por sala de clases, pero es
difícil que afecte resultados de test estandarizados.

27
Ejemplo 1:

¿Encarcelar a los criminales reduce los crímenes?

• Idea: encarcelar un criminal hace que deje de delinquir, y sirve para evitar que otros
delincan.

• Cuál es entonces el efecto en la tasa de criminalidad de aumentar en un 1% la cantidad de


gente en la cárcel?

• Estrategia: regresionar la tasa de criminalidad en la tasa de prisioneros. ¿Problemas de


simultaneidad?

28
Ejemplo 1:

¿Encarcelar a los criminales reduce los crímenes?

• Levitt (1996) propone como instrumento la cantidad de demandas o quejas para disminuir la
sobrepoblación en las prisiones.

• Idea: como toma tiempo construir una prisión, estados con sobre-población se pueden ver
forzados a liberar prisioneros prematuramente, disminuyendo las tasas de prisioneros.

• El muestra que mayor cantidad de demandas reduce el crecimiento de la cantidad de


prisioneros en la dar.

• Hace test de sobre-identificación sin encontrar problemas.

• Estima que el efecto es bastante grande, tres veces el estimado por MCO.

29
Ejemplo 2:

¿Disminuir el tamaño de las clases mejora los resultados en test


estandarizados?

• Hemos hablado de este problema.

• Solución 1, ocupar más controles para asi evitar el problema de variables omitidas.

• Sin embargo, esto puede no ser suficiente.

• Hoxby (2000) propone ocupar la variación de cantidad de niños en edad de entrar a


kindergarten en un distrito como instrumento.

30
Ejemplo 2:

¿Disminuir el tamaño de las clases mejora los resultados en test


estandarizados?

• La idea es que hay variaciones naturales en el número de niños potenciales que pueden
entrar a un grado y que son exógenas a los resultados del test.

• Sin embargo, como los padres podrían estar moviéndose debido a que los resultados son
mejores en un distrito, ocupa las variaciones con respecto a la tendencia de largo plazo,
porque, argumenta, que el movimiento de los padres debería ser constante y en el largo
plazo, si es por esa razón.

• Muestra que su instrumento es relevante.

• Muestra que los efectos son del tamaño de la clase son muy pequeños.

31
Ejemplo 3:

¿El tratamiento ”agresivo” a ataques al corazón hace que los pacientes vivan
más?

• Ejemplo: introducción de un catéter en el corazón para obtener información del corazón y


las arterias coronarias.

• Idea, antes de que un procedimiento como ese se apruebe, se realizan ensayos clínicos.

• Despues, se hace una regresión entre la edad de los pacientes, en si tuvo el tratamiento, y
otras variables que afectan la mortalidad.

32
Ejemplo 3:

¿El tratamiento ”agresivo” a ataques al corazón hace que los pacientes vivan
más?

• El problema es que este tipo de procedimientos no se le aplican a los pacientes en forma


aleatoria. Tanto el doctor como el paciente tienen que estar de acuerdo en realizarlo. Si la
decisión se basa en no observables relacionados con la longevidad, o si los pacientes más
sanos son los que toman el procedimiento, entonces la estimación no es buena.

• McClellan, McNeil y Newhouse (1994) sugieren ocupar la distancia relativa entre el hospital
más cercano que ofrece el procedimiento con el hospital más cercano como instrumento. La
idea es que esto afecta la probabilidad de que pacientes con ataques al corazón hayan
recibido el tratamiento.

33
Ejemplo 3:

¿El tratamiento ”agresivo” a ataques al corazón hace que los pacientes vivan
más?

• Ellos muestran evidencia empírica de que el instrumento no es débil, y para mostrar que es
exógeno ocupan su conocimiento médico para mostrar que esa medida no debería estar
correlacionada con nada que afecte la probabilidad de tener ataques al corazón que no sea
observable,y que no tiene que ver con variables observables que afectan la longevidad.

• Sus resultados muestran que el efecto de este procedimiento es casi cero, en contraste con
MCO que muestra que es positivo y por mucho.

34
Ejemplo 3:

¿El tratamiento ”agresivo” a ataques al corazón hace que los pacientes vivan
más?

• Importante, como es MCO2E, la estimación es como si en vez de usar el tratamiento se usara


un predictor del tratamiento.

• Esta interpretación tiene dos implicancias:


1. Los efectos que se estiman no son en un paciente elegido al azar, si no en
pacientes para los cuales la distancia al tratamiento importa mucho en la
decisión de tomarlo.
2. Sugiere una forma de encontrar instrumentos. Elegir uno que afecte la
probabilidad de tener el tratamiento , pero sólo esté relacionada a la variable
dependiente a través de ese mecanismo.

35

También podría gustarte