Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sesión 12
Sesión 12
1
ÍNDICE
1. Motivación de la estimación por variables instrumentales (VI)
2. VI con regresor e instrumento únicos
3. El modelo general de regresión VI
4. Verificación de la validez de instrumentos
5. Ejemplos
2
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – MOTIVACIÓN DE LA
ESTIMACIÓN POR VARIABLES INSTRUMENTALES (VI)
Tres de las amenazas más importantes a la validez interna son:
Sesgo de variable omitida, debido a una variable correlada con X pero que no es
observable (no se puede incluir en la regresión) y para la que no hay variables de
control efectivas
Sesgo de causalidad simultánea (X causa a Y, Y causa a X);
Sesgo por errores de medida (X se mide con error)
Estos tres problemas implican que 𝑐𝑜𝑣(𝑢, 𝑋) ≠ 0 por lo que 𝐸 𝑢 𝑋 no es constante
𝑐𝑜𝑣 𝑢, 𝑋 ≠ 0 ⟹ 𝛽1 inconsistente
𝐸 𝑢 𝑋 no es constante⟹ 𝛽1 sesgado
La regresión con variables instrumentales (VI) puede eliminar estos problemas mediante la
utilización de una variable instrumental (VI), Z
3
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Modelo
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
La regresión VI divide X en dos partes: una que puede estar correlada con u, y otra que no lo está. De
esta forma, aislando la parte que no esta correlada con u, es posible estimar β1 de forma adecuada
Esto se hace usando una variable instrumental, Zi que está correlada con Xi pero no con ui
Terminología
Una variable endógena es aquella que está correlada con u
Una variable exógena es aquella que no está correlada con u
La regresión VI se basa en el caso en el que X es endógena mientras que el instrumento, Z, es exógeno
“Endógeno” quiere decir literalmente “determinado dentro del sistema.” Si X se determina de manera
conjunta con Y, una regresión de Y en X está sujeta a sesgo de causalidad simultánea. Pero esta
definición de endogeneidad es demasiado restrictiva porque la regresión VI se puede usar para resolver
otros sesgos, como el de variable omitida o el de errores de medida
4
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Dos condiciones para la validez de un instrumento
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
Para que una variable instrumental (“instrumento”) Z sea válida, debe satisfacer dos
condiciones:
Relevancia: corr(Zi , Xi) ≠ 0
Exogeneidad: corr(Zi , ui) = 0
Supongamos que disponemos de un variable Zi para la que las condiciones se cumplen
(discutiremos más adelante cómo encontrar instrumentos)
¿Cómo podemos usar Zi para estimar β1?
5
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Derivación del VI
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
Supongamos que 𝑍𝑖 es un instrumento válido para el regresor endógeno 𝑋𝑖
En este caso, usando la exogeneidad de 𝑍𝑖
Usando la relevancia de 𝑍𝑖
𝑐𝑜𝑣 𝑌𝑖 , 𝑍𝑖
𝛽1 =
𝑐𝑜𝑣 𝑋𝑖 , 𝑍𝑖
El estimador VI reemplaza las covarianzas poblacionales por covarianzas muestrales
𝑛
𝑖=1 𝑍𝑖 − 𝑍 𝑌𝑖 − 𝑌
𝛽1𝑉𝐼 = 𝑛
𝑖=1 𝑍𝑖 − 𝑍 𝑋𝑖 − 𝑋 6
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Estimador de mínimos cuadrados en dos etapas (MC2E)
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
Como lo indica su nombre, MC2E se calcula en dos etapas (dos regresiones):
1. Aisla la parte de X que no está correlada con u mediante la regresión de X en Z usando MCO
𝑋𝑖 = π0 + π1 𝑍𝑖 + 𝑣𝑖
Dado que Zi no está correlado con ui , π0 + π1 𝑍𝑖 no está correlado con ui
No conocemos π0 o π1 pero los hemos estimado, así que podemos calcular el valor
predicho de 𝑋𝑖
𝑋𝑖 = π0 + π1 𝑍𝑖 , 𝑖 = 1, … , 𝑛
2. Regresa Y en una constante y en 𝑋𝑖 usando MCO obteniendo 𝛽1𝑀𝐶2𝐸
Argumento heurístico: 𝑋𝑖 es la parte del regresor endógeno 𝑋𝑖 no correlada con el error 𝑢𝑖
Este estimador se denomina estimador de mínimos cuadrados en dos etapas (MC2E)
¡¡IMPORTANTE!! 𝜷𝑴𝑪𝟐𝑬
𝟏 = 𝜷 𝑽𝑰
𝟏
7
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES –VI CON REGRESOR E
INSTRUMENTO ÚNICOS
RESULTADO CLAVE: EL ESTIMADOR VI SUELE SER SESGADO PERO ES CONSISTENTE
Ejemplo 1: efecto del estudio en las calificaciones
¿Cuál es el efecto en las calificaciones de un estudio adicional de una hora al día?
Stinebrickner, Ralph and Stinebrickner, Todd R. (2008) "The Causal Effect of Studying on Academic
Performance," The B.E. Journal of Economic Analysis & Policy: Vol. 8: Iss. 1 (Frontiers), Article 14
n = 210 estudiantes en el Berea College (Kentucky) en 2001
Y = Nota media del primer semestre
X = tiempo medio de estudio (horas) al día (encuesta)
¿Se esperaría que el estimador MCO de β1 fuese insesgado y consistente? ¿Por qué?
Instrumento: Z = 1 si el compañero de habitación trajo una consola de video juegos, = 0 si no
Los compañeros de habitación se asignaron aleatoriamente
¿Es Zi un instrumento válido?: es decir, ¿es relevante (correlado con X) y exógeno (no correlado con u)?
8
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
9
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Ejemplo 2: oferta y demanda de mantequilla
El sesgo de causalidad simultánea en la regresión MCO de ln(𝑄𝑖 ) en ln(𝑃𝑖 ) se debe a que el
precio y la cantidad se determinan por la interacción de demanda y oferta
10
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Ejemplo 2: oferta y demanda de mantequilla
La interacción entre demanda y oferta produce datos como los siguientes. Una regresión
usando estos datos, ¿produciría una curva de demanda?
11
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Ejemplo 2: oferta y demanda de mantequilla
Pero…¿qué ocurre si solo se desplaza la curva de oferta?
VI estima la curva de
demanda aislando los
cambios en la cantidad
y el precio que se
derivan de cambios en
la oferta, manteniendo
la demanda fija
12
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VI CON REGRESOR E
INSTRUMENTO ÚNICOS
Ejemplo 2: oferta y demanda de mantequilla
ln(𝑄𝑖 ) = 𝛽0 + 𝛽1 ln(𝑃𝑖 ) + 𝑢𝑖
Posible instrumento Z = cantidad de lluvia en las regiones que producen mantequilla
¿Es Z un instrumento válido?
¿Relevante? ¿corr(ln 𝑃𝑖 , 𝑍𝑖 ) ≠ 0? Plausible: poca lluvia implica poco pasto, lo que implica
poca leche y poca mantequilla por lo que su precio sube
¿Exógeno? ¿corr(𝑢𝑖 , 𝑍𝑖 ) = 0? Plausible: que llueva o no, no tiene por que estar relacionado
con factores que afectan a la demanda de mantequilla (otros que el precio)
Estimador de mínimos cuadrados en dos etapas
Etapa 1: regresa ln(𝑃𝑖 ) en 𝑍𝑖 , obteniendo ln(𝑃𝑖 ): aisla cambios en el log precio que se
deben a cambios en la oferta (al menos en parte de la oferta)
20
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
Los supuestos de la regresión por VI
Yi = β0 + β1X1i + … + βkXki + βk+1W1i + … + βk+rWri + ui
Supuesto 1: E(ui|W1i ,…,Wri) = 0
Esencialmente implica que “los regresores exógenos son exógenos”
Supuesto 2: (Yi ,X1i ,…,Xki ,W1i ,…,Wri , Z1i , …,Zmi) son i.i.d.
Supuesto 3: los X’s, W’s, Z’s, e Y tienen cuartos momentos finitos
Supuesto 4: los instrumentos (Z1i,…,Zmi) son válidos
Bajo los supuestos 1-4, VI y los estadísticos t correspondientes se distribuyen aproximadamente como
una normal
El requisito crítico es que los instrumentos sean válidos
21
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
22
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
23
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
Los instrumentos son relevantes si al menos uno de los π1 ,…, πm es distinto de cero
Se dice que los instrumentos son débiles si todos los π1,…, πm son cero o cercanos a cero
Los instrumentos débiles explican muy poco acerca de la variación en X, más allá de la explicada
por las W’s
24
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
Consecuencias de los instrumentos débiles
Si los instrumentos son débiles, la distribución muestral de VI y sus estadísticos t no se aproximan
por normales incluso para n muy grandes
Considera el caso simple
Yi = β0 + β1Xi + ui
Xi = π0 + π1Zi + ui
𝑛
𝑍𝑖 −𝑍 𝑌𝑖 −𝑌
El estimador VI es 𝛽1𝑉𝐼 = 𝑖=1
𝑛
𝑖=1 𝑍𝑖 −𝑍 𝑋𝑖 −𝑋
27
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
Verificación de la exogeneidad de los instrumentos: el contraste J de
sobreidentificación de restricciones
Consideremos el caso más simple
Yi = β0 + β1Xi + ui
Supongamos que hay dos instrumentos: Z1i , Z2i
Se puede calcular dos estimadores VI
Intuitivamente, si los dos estimadores VI son muy diferentes, algo no funciona: al
menos un instrumento debe ser inválido
El contraste J de sobreidentificación de restricciones hace esta comparación de una
forma estadísticamente precisa
Solo se puede hacer si #Z’s > #X’s (sobreidentificación)
28
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – VERIFICACIÓN DE LA
VALIDEZ DE INSTRUMENTOS
El contraste J de sobreidentificación de restricciones
Bajo la hipótesis nula de que todos los instrumentos son exógenos, J tiene una
distribución chi-cuadrado con m–k grados de libertad (para n grande)
Si algunos instrumentos son exógenos y otros son endógenos, el estadístico J será
grande, y la nula de exogeneidad de todos los instrumentos será rechazada
Supuesto central: existen al menos tantos instrumentos exógenos como regresores
endógenos
Este supuesto no puede ser contrastado: corresponde al investigador empírico decidir si
este supuesto es razonable
30
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EJEMPLOS
Yi = β0 + β1Xi + ui
Y = nota media del primer semestre
X = tiempo diario de estudio (horas)
Z = 1 si el compañero de habitación tiene consola de video juegos, = 0 si no. Los
compañeros fueron asignados aleatoriamente (mismo género)
¿Puede estar Z correlada con u? Una posibilidad hipotética: género
Las mujeres, para las mismas horas de estudio, sacan mejores notas
Es más probable que un hombre tenga una consola de video juegos que una mujer
33
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EJEMPLOS
Este razonamiento lleva a concluir que corr(Zi , ui) < 0: los hombres tienen más
probabilidad de tener un compañero con video juego y además tienden a tener peores
notas, para el mismo tiempo de estudio
Esto es una versión del sesgo de variable omitida. La solución es controlar (o incluir) la
variable omitida, en este caso, género
Esta lógica lleva a incluir W = género como una variable de control en la regresión VI:
Yi = β0 + β1Xi + β2Wi + ui
34
SESIÓN XII - REGRESIÓN CON VARIABLES INSTRUMENTALES – EJEMPLOS