Está en la página 1de 36

ECONOMETRÍA I

SESIÓN 12: Regresión con variables instrumentales


Otros temas relacionados con el análisis de regresión

Profesor: Javier Hualde

1
ÍNDICE
1. Motivación de la estimación por variables instrumentales (VI)
2. VI con regresor e instrumento únicos
3. El modelo general de regresión VI
4. Verificación de la validez de instrumentos
5. Ejemplos

2
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – MOTIVACIÓN DE LA
ESTIMACIÓN POR VARIABLES INSTRUMENTALES (VI)
 Tres de las amenazas más importantes a la validez interna son:
 Sesgo de variable omitida, debido a una variable correlada con X pero que no es
observable (no se puede incluir en la regresión) y para la que no hay variables de
control efectivas
 Sesgo de causalidad simultánea (X causa a Y, Y causa a X);
 Sesgo por errores de medida (X se mide con error)
 Estos tres problemas implican que 𝑐𝑜𝑣(𝑢, 𝑋) ≠ 0 por lo que 𝐸 𝑢 𝑋 no es constante
 𝑐𝑜𝑣 𝑢, 𝑋 ≠ 0 ⟹ 𝛽1 inconsistente
 𝐸 𝑢 𝑋 no es constante⟹ 𝛽1 sesgado
 La regresión con variables instrumentales (VI) puede eliminar estos problemas mediante la
utilización de una variable instrumental (VI), Z
3
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
 Modelo
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
 La regresión VI divide X en dos partes: una que puede estar correlada con u, y otra que no lo está. De
esta forma, aislando la parte que no esta correlada con u, es posible estimar β1 de forma adecuada
 Esto se hace usando una variable instrumental, Zi que está correlada con Xi pero no con ui
 Terminología
 Una variable endógena es aquella que está correlada con u
 Una variable exógena es aquella que no está correlada con u
 La regresión VI se basa en el caso en el que X es endógena mientras que el instrumento, Z, es exógeno
 “Endógeno” quiere decir literalmente “determinado dentro del sistema.” Si X se determina de manera
conjunta con Y, una regresión de Y en X está sujeta a sesgo de causalidad simultánea. Pero esta
definición de endogeneidad es demasiado restrictiva porque la regresión VI se puede usar para resolver
otros sesgos, como el de variable omitida o el de errores de medida
4
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Dos condiciones para la validez de un instrumento

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖

 Para que una variable instrumental (“instrumento”) Z sea válida, debe satisfacer dos
condiciones:
 Relevancia: corr(Zi , Xi) ≠ 0
 Exogeneidad: corr(Zi , ui) = 0
 Supongamos que disponemos de un variable Zi para la que las condiciones se cumplen
(discutiremos más adelante cómo encontrar instrumentos)
 ¿Cómo podemos usar Zi para estimar β1?
5
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Derivación del VI
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
 Supongamos que 𝑍𝑖 es un instrumento válido para el regresor endógeno 𝑋𝑖
 En este caso, usando la exogeneidad de 𝑍𝑖

𝑐𝑜𝑣 𝑌𝑖 , 𝑍𝑖 = 𝑐𝑜𝑣 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖 , 𝑍𝑖 = 𝑐𝑜𝑣 𝛽0 , 𝑍𝑖 + 𝛽1 𝑐𝑜𝑣 𝑋𝑖 , 𝑍𝑖 + 𝑐𝑜𝑣 𝑢𝑖 , 𝑍𝑖 = 𝛽1 𝑐𝑜𝑣 𝑋𝑖 , 𝑍𝑖

 Usando la relevancia de 𝑍𝑖
𝑐𝑜𝑣 𝑌𝑖 , 𝑍𝑖
𝛽1 =
𝑐𝑜𝑣 𝑋𝑖 , 𝑍𝑖
 El estimador VI reemplaza las covarianzas poblacionales por covarianzas muestrales

𝑛
𝑖=1 𝑍𝑖 − 𝑍 𝑌𝑖 − 𝑌
𝛽1𝑉𝐼 = 𝑛
𝑖=1 𝑍𝑖 − 𝑍 𝑋𝑖 − 𝑋 6
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Estimador de mínimos cuadrados en dos etapas (MC2E)
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
 Como lo indica su nombre, MC2E se calcula en dos etapas (dos regresiones):
1. Aisla la parte de X que no está correlada con u mediante la regresión de X en Z usando MCO
𝑋𝑖 = π0 + π1 𝑍𝑖 + 𝑣𝑖
 Dado que Zi no está correlado con ui , π0 + π1 𝑍𝑖 no está correlado con ui
 No conocemos π0 o π1 pero los hemos estimado, así que podemos calcular el valor
predicho de 𝑋𝑖
𝑋𝑖 = π0 + π1 𝑍𝑖 , 𝑖 = 1, … , 𝑛
2. Regresa Y en una constante y en 𝑋𝑖 usando MCO obteniendo 𝛽1𝑀𝐶2𝐸
 Argumento heurístico: 𝑋𝑖 es la parte del regresor endógeno 𝑋𝑖 no correlada con el error 𝑢𝑖
 Este estimador se denomina estimador de mínimos cuadrados en dos etapas (MC2E)
¡¡IMPORTANTE!! 𝜷𝑴𝑪𝟐𝑬
𝟏 = 𝜷 𝑽𝑰
𝟏
7
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES –VI CON REGRESOR E
INSTRUMENTO ÚNICOS
RESULTADO CLAVE: EL ESTIMADOR VI SUELE SER SESGADO PERO ES CONSISTENTE
Ejemplo 1: efecto del estudio en las calificaciones
 ¿Cuál es el efecto en las calificaciones de un estudio adicional de una hora al día?
 Stinebrickner, Ralph and Stinebrickner, Todd R. (2008) "The Causal Effect of Studying on Academic
Performance," The B.E. Journal of Economic Analysis & Policy: Vol. 8: Iss. 1 (Frontiers), Article 14
 n = 210 estudiantes en el Berea College (Kentucky) en 2001
 Y = Nota media del primer semestre
 X = tiempo medio de estudio (horas) al día (encuesta)
 ¿Se esperaría que el estimador MCO de β1 fuese insesgado y consistente? ¿Por qué?
 Instrumento: Z = 1 si el compañero de habitación trajo una consola de video juegos, = 0 si no
 Los compañeros de habitación se asignaron aleatoriamente
 ¿Es Zi un instrumento válido?: es decir, ¿es relevante (correlado con X) y exógeno (no correlado con u)?
8
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS

Ejemplo 2: oferta y demanda de mantequilla


 La regresión con VI se desarrolló inicialmente para estimar elasticidades de demanda de
productos agrarios, por ejemplo, mantequilla
ln(𝑄𝑖 ) = 𝛽0 + 𝛽1 ln(𝑃𝑖 ) + 𝑢𝑖
 β1 = elasticidad precio de la mantequilla = cambio porcentual en la cantidad por una
variación del precio del 1% (especificación log-log)
 Datos: observaciones de precio y cantidad de mantequilla vendida en diferentes regiones
 La regresión MCO de ln(𝑄𝑖 ) en ln(𝑃𝑖 ) sufre de sesgo de causalidad simultánea. ¿Por qué?

9
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Ejemplo 2: oferta y demanda de mantequilla
El sesgo de causalidad simultánea en la regresión MCO de ln(𝑄𝑖 ) en ln(𝑃𝑖 ) se debe a que el
precio y la cantidad se determinan por la interacción de demanda y oferta

10
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Ejemplo 2: oferta y demanda de mantequilla
La interacción entre demanda y oferta produce datos como los siguientes. Una regresión
usando estos datos, ¿produciría una curva de demanda?

11
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Ejemplo 2: oferta y demanda de mantequilla
Pero…¿qué ocurre si solo se desplaza la curva de oferta?
 VI estima la curva de
demanda aislando los
cambios en la cantidad
y el precio que se
derivan de cambios en
la oferta, manteniendo
la demanda fija

 Z es una variable que


mueve la oferta pero no
la demanda

12
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Ejemplo 2: oferta y demanda de mantequilla
ln(𝑄𝑖 ) = 𝛽0 + 𝛽1 ln(𝑃𝑖 ) + 𝑢𝑖
 Posible instrumento Z = cantidad de lluvia en las regiones que producen mantequilla
 ¿Es Z un instrumento válido?
 ¿Relevante? ¿corr(ln 𝑃𝑖 , 𝑍𝑖 ) ≠ 0? Plausible: poca lluvia implica poco pasto, lo que implica
poca leche y poca mantequilla por lo que su precio sube
 ¿Exógeno? ¿corr(𝑢𝑖 , 𝑍𝑖 ) = 0? Plausible: que llueva o no, no tiene por que estar relacionado
con factores que afectan a la demanda de mantequilla (otros que el precio)
 Estimador de mínimos cuadrados en dos etapas
 Etapa 1: regresa ln(𝑃𝑖 ) en 𝑍𝑖 , obteniendo ln(𝑃𝑖 ): aisla cambios en el log precio que se
deben a cambios en la oferta (al menos en parte de la oferta)

 Etapa 2: regresa ln(𝑄𝑖 ) en una constante y ln(𝑃𝑖 ): este es el equivalente en términos de


regresión a usar cambios en la curva de oferta para trazar la curva de demanda 13
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Ejemplo 3: notas y tamaño de las clases
 El ejemplo de California todavía podría tener sesgo de variable omitida (ej., compromiso de los padres)
 En principio, este sesgo puede ser eliminado por una regresión con VI (o MC2E), pero requiere encontrar un
instrumento válido
 Posible instrumento
 Algunos distritos que sufrieron las consecuencias de un terremoto ocurrido en verano, tuvieron que
cerrar parte de sus instalaciones para llevar a cabo reparaciones
 Esto significó doblar el número de alumnos por clase. Definamos Zi = 1 si distrito afectado por
terremoto, = 0 si no
 ¿Es un instrumento válido?
 El terremoto provoca un efecto como si los distritos participaran en un experimento aleatorizado. La
variación en REM debida al terremoto es exógena
 La primera etapa del MC2E regresa REM en Z, aislando la parte de REM que es exógena (esa parte
que es “como si” fuera asignada aleatoriamente) 14
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Consistencia del VI
1 𝑛
𝑛
𝑍 − 𝑍 𝑌 − 𝑌 𝑍𝑖 − 𝑍 𝑢𝑖 − 𝑢
= 𝛽1 + 𝑛
𝑖=1𝑖 𝑖 𝑖=1
𝛽1𝑉𝐼 = 𝑛
𝑍𝑖 − 𝑍 𝑋𝑖 − 𝑋 1 𝑛
𝑖=1 𝑍 − 𝑍 𝑋𝑖 − 𝑋
𝑛 𝑖=1 𝑖
 Las covarianzas muestrales son consistentes (usando la ley de los grandes números)
1 𝑝
𝑛
 𝑖=1 𝑍𝑖 − 𝑍 𝑢𝑖 − 𝑢 𝑐𝑜𝑣(𝑍𝑖 , 𝑢𝑖 )
𝑛
1 𝑝
𝑛
 𝑖=1 𝑍𝑖 − 𝑍 𝑋𝑖 − 𝑋 𝑐𝑜𝑣(𝑍𝑖 , 𝑋𝑖 )
𝑛
 Usando el teorema de Slutzky
𝑝 𝑐𝑜𝑣(𝑍𝑖 , 𝑢𝑖 )
𝛽1𝑉𝐼 𝛽1 + = 𝛽1
𝑐𝑜𝑣(𝑍𝑖 , 𝑋𝑖 )
 Claves para este resultado: exogeneidad y la relevancia del instrumento
Insesgadez del VI: requiere que 𝐸 𝑢𝑖 𝑍𝑖 , 𝑋𝑖 = 0 ⟹ no es plausible porque esta condición implica
𝐸 𝑢𝑖 𝑋𝑖 = 0 con lo que el MCO sería insesgado y consistente ⟹ el VI sería innecesario 15
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
 En muestras grandes, la distribución muestral del estimador VI es aproximadamente normal para muestras
grandes
 La inferencia (contrastes, intervalos de confianza) se lleva a cabo de la forma habitual: [ 𝛽1𝑉𝐼 ± 1,96ES(𝛽1𝑉𝐼 )]
 La intución detrás de la aproximación normal para el VI es que, como los otros estimadores que hemos
considerado, involucra a una suma de variables aleatorias i.i.d. con media cero, a la que podemos aplicar el
teorema central del límite
 Por supuesto todo esto depende de que el instrumento sea válido
 Nota importante sobre errores estándar
 Los errores estándar MCO de la regresión de segunda etapa no son correctos porque no tienen
en cuenta la estimación de la primera etapa (𝑋𝑖 es estimado).
 Por tanto hay que usar un comando (disponible en cualquier software) que calcula VI
directamente, con ES correctos
 Como es habitual hay que usar errores estándar robustos a heterocedasticidad
16
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EL MODELO GENERAL
DE REGRESIÓN VI
 Extenderemos el marco anterior a
 Múltiples regresores endógenos (X1,…,Xk)
 Múltiples variables exógenas (o controles) incluidas (W1,…,Wr), para evitar el sesgo de
variable omitida
 Múltiples instrumentos (Z1,…,Zm). El uso de más instrumentos (relevantes) puede reducir
la varianza del VI
 Modelo
Yi = β0 + β1X1i + … + βkXki + βk+1W1i + … + βk+rWri + ui
• X1i,…, Xki son los regresores endógenos (potencialmente correlados con ui)
• W1i,…,Wri son regresores exógenos incluidos (no correlados con ui) o variables de control (tal que los
instrumentos no están correlados con ui una vez que los controles se han incluido)
• Z1i,…,Zmi son las m variables instrumentales (variables exógenas excluidas) 17
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EL MODELO GENERAL
DE REGRESIÓN VI
Nueva terminología: identificación y sobreidentificación
 En general, se dice que un parámetro está identificado si diferentes valores valores del parámetro
producen diferentes distribuciones de los datos
 En regresión VI, la identificación de los parámetros depende de la relación entre el número de
instrumentos (m) y el número de regresores endógenos (k) ⟹ si hay menos instrumentos que
regresores endógenos, no podemos estimar adecuadamente β1,…,βk
 Los coeficientes β1,…, βk están:
 exactamente identificados si m = k: número exacto de instrumentos para estimar
β1,…,βk
 sobreidentificados si m > k: hay más instrumentos de los necesarios para estimar β1,…,
βk. En este caso, se puede contrastar la exogeneidad de los instrumentos (contraste de
“sobreidentificación de restricciones”)
 subidentificados si m < k: se necesitan más instrumentos para estimar β1,…, βk
18
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EL MODELO GENERAL
DE REGRESIÓN VI
MC2E con regresor endógeno único
Yi = β0 + β1X1i + β2W1i + … + β1+rWri + ui
 m instrumentos: Z1i ,…, Zmi
 Primera etapa
 Regresar X1 en todas las variables exógenas e instrumentos (W1 ,…,Wr , Z1 ,…, Zm) y una
constante, por MCO
 Calcula los valores predichos 𝑋1𝑖 , 𝑖 = 1, … , 𝑛
 Segunda etapa
– Regresa Y en 𝑋1𝑖 , W1 ,…, Wr y una constante, por MCO
– Los coeficientes estimados en esta segunda etapa son los MC2E, pero los ES no son correctos
 Para conseguir ES correctos, único paso en software de regresión
19
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS

Validez de los instrumentos


Yi = β0 + β1X1i + … + βkXki + βk+1W1i + … + βk+rWri + ui

 Exogeneidad: corr(Z1i,ui) = 0,…, corr(Zmi,ui) = 0


 Relevancia: caso especial para un X: al menos un Z debe ser útil para predecir X dado W

20
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
Los supuestos de la regresión por VI
Yi = β0 + β1X1i + … + βkXki + βk+1W1i + … + βk+rWri + ui
 Supuesto 1: E(ui|W1i ,…,Wri) = 0
Esencialmente implica que “los regresores exógenos son exógenos”
 Supuesto 2: (Yi ,X1i ,…,Xki ,W1i ,…,Wri , Z1i , …,Zmi) son i.i.d.
 Supuesto 3: los X’s, W’s, Z’s, e Y tienen cuartos momentos finitos
 Supuesto 4: los instrumentos (Z1i,…,Zmi) son válidos

 Bajo los supuestos 1-4, VI y los estadísticos t correspondientes se distribuyen aproximadamente como
una normal
 El requisito crítico es que los instrumentos sean válidos
21
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS

El papel de las variables de control W


 El Supuesto 1 podría ser sustituido por un requisito menos fuerte: que las W’s sean
variables de control efectivas para producir un instrumento exógeno (las W’s podrían no
ser exógenas)
 Técnicamente, la condición para que las W’s sean variables de control efectivas es que la
media condicional de ui dado Wi no dependa de Zi, es decir :
E(ui|Wi , Zi) = E(ui|Wi) (alternativa al supuesto 1)
 Ésta es la versión VI de la independencia en media condicional que vimos anteriormente
 Idea clave: en muchas aplicaciones hay que incluir variables de control (W’s) para que Z
sea plausiblemente exógena (no correlada con u)

22
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS

Verificación de la validez de los instrumentos


 Recordemos los dos requisitos para la validez de instrumentos
 Relevancia (para un X): al menos un instrumento debe formar parte de la versión
poblacional de la regresión de primera etapa
 Exogeneidad: ningún instrumento debe estar correlado con el error: corr(Z1i ,ui) =
0,…, corr(Zmi ,ui) = 0

 ¿Se pueden verificar los supuestos?


 Si se disponen de varios instrumentos, ¿cuáles se deben usar?

23
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS

Verificación de la relevancia de los instrumentos


 Para un regresor endógeno único
Yi = β0 + β1Xi + β2W1i + … + β1+rWri + ui

 Regresión de primera etapa


Xi = π0 + π1Z1i +…+ πmZmi + πm+1W1i +…+ πm+kWki + vi

 Los instrumentos son relevantes si al menos uno de los π1 ,…, πm es distinto de cero
 Se dice que los instrumentos son débiles si todos los π1,…, πm son cero o cercanos a cero
 Los instrumentos débiles explican muy poco acerca de la variación en X, más allá de la explicada
por las W’s

24
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
Consecuencias de los instrumentos débiles
 Si los instrumentos son débiles, la distribución muestral de VI y sus estadísticos t no se aproximan
por normales incluso para n muy grandes
 Considera el caso simple
Yi = β0 + β1Xi + ui
Xi = π0 + π1Zi + ui
𝑛
𝑍𝑖 −𝑍 𝑌𝑖 −𝑌
 El estimador VI es 𝛽1𝑉𝐼 = 𝑖=1
𝑛
𝑖=1 𝑍𝑖 −𝑍 𝑋𝑖 −𝑋

 Si la cov(X,Z) es cero o muy pequeña (instrumento débiles), el denominador cercano a cero


 En ese caso, la distribución muestral de 𝛽1𝑉𝐼 (y de los estadísticos t) no se ajusta bien a su
aproximación normal de muestras grandes
25
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
Evaluando la fortaleza de los instrumentos en la práctica: el estadístico F de primera etapa
 Regresa X en Z1,..,Zm,W1,…,Wk (suponemos solo un regresor endógeno)
 Instrumentos totalmente irrelevantes ⟹ todos los coeficientes de Z1,…,Zm son cero
 El estadístico F de primera etapa contrasta la hipótesis de que Z1 ,…,Zm no entran en la regresión de
primera etapa
 Regla práctica: si el estadístico F de primera etapa es menor que 10, el conjunto de instrumentos es
débil
 En este caso, el estimador VI tendrá en muestras pequeñas un sesgo sustancial y la inferencia (errores
estándar, contrastes, intervalos de confianza) puede llevar a conclusiones equivocadas
 ¿Por qué se compara el estadístico F de primera etapa con 10? Un simple rechazo de la hipótesis nula de
que los coeficientes de las Z’s son cero no es suficiente ⟹ se necesita un contenido predictivo sustancial
para que la aproximación normal sea adecuada
26
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS

Verificación de la exogeneidad de los instrumentos

 Exogeneidad: ningún instrumento está correlado con el error


corr(Z1i , ui) = 0,…, corr(Zmi ,ui) = 0
 Si los instrumentos están correlados con el error, la primera etapa del MC2E no puede
aislar un componente de X que no esté correlado con el error ⟹ 𝑋 está correlado con u
y el MC2E es inconsistente

 Si hay más instrumentos que regresores endógenos, es posible contrastar parcialmente


la exogeneidad

27
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
Verificación de la exogeneidad de los instrumentos: el contraste J de
sobreidentificación de restricciones
 Consideremos el caso más simple
Yi = β0 + β1Xi + ui
 Supongamos que hay dos instrumentos: Z1i , Z2i
 Se puede calcular dos estimadores VI
 Intuitivamente, si los dos estimadores VI son muy diferentes, algo no funciona: al
menos un instrumento debe ser inválido
 El contraste J de sobreidentificación de restricciones hace esta comparación de una
forma estadísticamente precisa
 Solo se puede hacer si #Z’s > #X’s (sobreidentificación)
28
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
El contraste J de sobreidentificación de restricciones

Yi = β0 + β1X1i + … + βkXki + βk+1W1i + … + βk+rWri + ui

 Asumimos que #instrumentos = m > # X’s = k (sobreidentificación)


 Receta
 Estimar la ecuación de interés por MC2E empleando todos los m instrumentos; calcular los
valores predichos 𝑌 (usando los X’s actuales, no los 𝑋’s usados para estimar la segunda etapa)
 Calcular los residuos 𝑢𝑖 = 𝑌𝑖 − 𝑌𝑖
 Regresar los residuos contra Z1i ,…,Zmi, W1i ,…,Wri
 Calcular el estadístico F contrastando la hipótesis de que los coeficientes de Z1i ,…,Zmi son
todos cero
 El estadístico J es J = mF 29
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS

El contraste J de sobreidentificación de restricciones

 Bajo la hipótesis nula de que todos los instrumentos son exógenos, J tiene una
distribución chi-cuadrado con m–k grados de libertad (para n grande)
 Si algunos instrumentos son exógenos y otros son endógenos, el estadístico J será
grande, y la nula de exogeneidad de todos los instrumentos será rechazada
 Supuesto central: existen al menos tantos instrumentos exógenos como regresores
endógenos
 Este supuesto no puede ser contrastado: corresponde al investigador empírico decidir si
este supuesto es razonable

30
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EJEMPLOS

¿De dónde provienen los instrumentos válidos?

 El aspecto más delicado de un análisis con VI es encontrar instrumentos válidos


 Método #1: “variables en otra ecuación” (por ejemplo, factores que cambian la
oferta pero que no afectan la demanda)
 Método #2: busca una fuente exógena de variación en X que surja de un fenómeno
aleatorio que induce cambios en el regresor endógeno
 Los dos métodos son diferentes formas de tratar el mismo asunto
 La cantidad de lluvia cambia la curva de oferta de mantequilla pero no la curva de
demanda; la cantidad de lluvia es “como si” fuera asignada aleatoriamente
 Los daños de un terremoto aumentan el tamaño de las clases “como si” ese aumento
fuera asignado aleatoriamente
31
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EJEMPLOS
¿Cuando se debe usar una regresión VI? Cuando X esté correlado con u y se disponga de al menos un
instrumento válido. Las razones fundamentales para la correlación entre X y u son:
 Variable(s) omitida(s) que implican sesgo de variable omitida: habilidad natural en un estudio de
rendimientos a la educación
 Error de medida: años de educación
 Sesgo de selección: pacientes eligen tratamiento
 Sesgo de causalidad simultánea: oferta y demanda de mantequilla
¿Cuáles son las amenazas a la validez interna de una regresión VI? La principal amenaza es que los
instrumentos no sean válidos. Dado un conjunto de variables de control W, los instrumentos son válidos si
son relevantes y exógenos
 La relevancia consiste en evaluar si los instrumentos son débiles o fuertes: ¿es el estadístico F de
primera etapa > 10?
 La exogeneidad puede ser evaluada con el estadístico J (pero si ya dispones de m instrumentos
exógenos con los que empezar). En general, la exogeneidad debe ser valorada usando un
conocimiento profundo del ejemplo a considerar
32
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EJEMPLOS

Ejemplo 1: efecto de estudio en calificaciones

Yi = β0 + β1Xi + ui
Y = nota media del primer semestre
X = tiempo diario de estudio (horas)
Z = 1 si el compañero de habitación tiene consola de video juegos, = 0 si no. Los
compañeros fueron asignados aleatoriamente (mismo género)
 ¿Puede estar Z correlada con u? Una posibilidad hipotética: género
 Las mujeres, para las mismas horas de estudio, sacan mejores notas
 Es más probable que un hombre tenga una consola de video juegos que una mujer

33
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EJEMPLOS

Ejemplo 1: efecto de estudio en calificaciones

 Este razonamiento lleva a concluir que corr(Zi , ui) < 0: los hombres tienen más
probabilidad de tener un compañero con video juego y además tienden a tener peores
notas, para el mismo tiempo de estudio
 Esto es una versión del sesgo de variable omitida. La solución es controlar (o incluir) la
variable omitida, en este caso, género
 Esta lógica lleva a incluir W = género como una variable de control en la regresión VI:

Yi = β0 + β1Xi + β2Wi + ui

34
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EJEMPLOS

Ejemplo 2: cateterismo cardíaco


 McClellan, Mark, Barbara J. McNeil, and Joseph P. Newhouse (1994), “Does More Intensive Treatment of
Acute Myocardial Infarction in the Elderly Reduce Mortality?” Journal of the American Medical Association,
vol. 272, no. 11, pp. 859 – 866
 Un cateterismo cardíaco, ¿mejora la longevidad de las víctimas de ataques al corazón?
 Modelo
Yi = β0 + β1Xi + ui

 Yi = duración (en días) de la supervivencia de una víctima de ataque al corazón


 Xi = 1 si la víctima recibe cateterismo cardíaco; = 0 si no los recibe
 ¿Es el MCO insesgado? La decisión de tratar a un paciente con un cateterismo es endógena, es tomada
por un médico y depende de ui (que captura características no observadas de la salud del paciente)
 Si los pacientes más sanos reciben el tratamiento, el MCO sufre sesgo de causalidad simultánea y el MCO
sobreestima el efecto del cateterismo
35
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EJEMPLOS

Ejemplo 2: cateterismo cardíaco


 Posible instrumento: distancia al hospital más cercano en el que se aplica el tratamiento (CC)
menos la distancia a un hospital “normal”
 Z = distancia relativa a un hospital CC
 ¿Relevante? Si el hospital CC más cercano está muy lejos, menos posibilidades de ser
tratado
 ¿Exógeno? La distancia relativa no relacionada con factores que afectan a la
supervivencia, por lo que corr(distancia,u) = 0
 Si la localización de los pacientes es aleatoria, el diferencial de distancia es “como si”
fuese asignado aleatoriamente
 Resultados:
– MCO: estimadores significativos y efecto del CC grande
– VI: estimadores no significativos y efecto del CC insignificante
36

También podría gustarte