Documentos de Académico
Documentos de Profesional
Documentos de Cultura
César Alonso
Y = β 0 + β 1 X1 + β 2 X2 + · · · + β K XK + ε
Si se cumple que
E (ε|X1 , X2 , . . . , XK ) = 0, ∀X1 , X2 , . . . , XK ,
β 0 = E (Y ) − β 1 E (X ∗ ) β 1 = C (X ∗ , Y )/V (X ∗ ).
Sin embargo, X ∗ se mide con error, de modo que observamos
X = X ∗ + v1 , siendo v1 el error de medida.
Sustituyendo X ∗ = X − v1 , tenemos:
Y = β 0 + β 1 X + ( ε − β 1 v 1)
| {z }
u
donde C (u, X ) 6= 0 ⇒ X es endógena.
César Alonso (UC3M) ECONOMETRIA. Tema 6 4 / 70
Endogeneidad
log(salario ) = β 0 + β 1 educ + u,
Ejemplo 3: Simultaneidad
Es bastante habitual que las realizaciones de distintas variables
económicas estén relacionadas entre sı́.
Esto supone que la ecuación de la variable dependiente en que
estamos interesados forma parte de un sistema de ecuaciones
simultáneas:
algunas variables que aparecen en el lado derecho de la ecuación de
interés aparecen como variables dependientes en otras ecuaciones, y
viceversa.
Y = β0 + β1 X + ε (1)
p lim n1 ∑i xi yi p lim n1 ∑i xi ( β 1 xi + ε i )
p lim β 1 =
b =
p lim n1 ∑i xi2 p lim n1 ∑i xi2
1
n ∑i xi ε i
p lim C (X , ε )
= β1 + 1
= β1 + 6= β 1
n ∑i xi
p lim 2 V (X )
con: yi = Yi − Y , xi = Xi − X .
César Alonso (UC3M) ECONOMETRIA. Tema 6 11 / 70
Variables instrumentales
Definición: variables instrumentales (VI)
En el modelo:
Y = β0 + β1 X + ε (2)
donde C (X , ε) 6= 0,
C (Z , Y ) = β 1 C (Z , X ) + C (Z , ε )
C (Z , Y )
β1 =
C (Z , X )
C (Z , Y )
β 0 = E (Y ) − β 1 E (X ) = E (Y ) − E (X )
C (Z , X )
SYZ ∑ zy
βe1 = = i i i
SXZ ∑ i zi xi
βe0 = Y − βe1 X
con: yi = Yi − Y , xi = Xi − X , zi = Zi − Z .
p lim n1 ∑i zi ε i
C (Z , ε )
= β1 + 1
= β1 + = β1
p lim n ∑i zi xi C (Z , X )
X = π0 + π1 Z + v ,
H0 : π1 = 0 frente a H1 : π1 6= 0
σ2 Sz2 σ2
sβe2 ≡ Vb ( βe1 ) =
e e
2
= ,
1 nSZX n rZX SX2
2
donde
SZX
rZX =
SZ SX
es el coeficiente de correlación muestral entre Z y X (que mide el
grado de relación lineal entre X y Z en la muestra).
siendo b
ε i el residuo de la estimación de MCO.
Si X es en realidad exógena, los estimadores MCO son consistentes, y
en tal caso
σ2 = p lim e
p lim b σ2 = σ2 .
Como 0 < |rZX | < 1, esto implica que: s e2 > s b2 (y la diferencia será
β β 1 1
tanto mayor cuanto menor sea rZX en valor absoluto).
Y = β 0 + β 1 X + ε.
V ( ε |Z ) = σ 2 = V ( ε ),
βe1 − β 1
e· N (0, 1)
sβe1
∑i e
ε2i
R2 = 1 − ,
∑i yi2
donde e
ε i son los residuos de VI.
Sin embargo, cuando X y ε están correlacionadas esta fórmula del R 2
no es correcta. El R 2 de la estimación de VI:
puede ser negativo si ∑i eε2i > ∑i yi2 .
no tiene una interpretación natural, porque si C (X , ε) 6= 0, no
podemos descomponer la varianza de Y como β21 V (X ) + V (ε).
no puede utilizarse para construir el estadı́stico de contraste W 0 (hay
que usar la Suma de cuadrados de los residuos).
C (Z , ε )
p lim βe1 = β 1 +
C (Z , X )
C (X , ε )
p lim βb1 = β 1 +
V (X )
Donde
LBWGHT = logaritmo del peso del bebé al nacer,
MALE = variable binaria que vale 1 si el bebé es varón y 0 en otro caso,
PARITY = orden de nacimiento (entre sus hermanos) del bebé,
LFAMINC = logaritmo de la renta familiar en miles de dólares,
PACKS = número medio de cajetillas diarias fumadas por la madre
durante el embarazo.
Puede que PACKS esté correlacionado con otros hábitos de salud y/o
con un buen cuidado prenatal ⇒ PACKS y el término de error podrı́an
estar correlacionados.
Posible variable instrumental para PACKS: precio medio de los
cigarrillos en el Estado de residencia (CIGPRICE).
Supondremos que CIGPRICE no está correlacionado con el término de
error (aunque las ayudas estatales a la salud podrı́an estar
correlacionadas con los impuestos al tabaco).
La teorı́a económica sugiere que C (PACKS,CIGPRICE) < 0.
Sea el modelo:
Y = β0 + β1 X + ε donde C (X , ε) 6= 0,
C (Z1 , ε) = 0, C (Z2 , ε) = 0,
C (Z1 , X ) 6= 0, C (Z2 , X ) 6= 0.
Sean πb0 , π
b1 , π
b2 los estimadores MCO de dicha forma reducida.
Los valores ajustados de X a partir de dichas estimaciones son:
Xb = π
b0 + π
b1 Z1 + π
b2 Z2 .
Aunque en ambos casos los coeficientes son los mismos, los errores
estándar al obtener MC2E secuencialmente son incorrectos.
La razón es que el término de error de la segunda etapa, u, incluye v ,
pero los errores estándar comprenden la varianza de ε solamente.
La mayorı́a de los paquetes econométricos tienen instrucciones
especiales para llevar a cabo MC2E, por lo que no es preciso realizar
las dos etapas secuencialmente.
Y = β 0 + β 1 X1 + β 2 X2 + ε
donde:
E (ε) = 0, C (X1 , ε) = 0,
C (X2 , ε) 6= 0.
Es decir: X1 es una variable exógena
pero X2 es una variable endógena.
C (Z , ε) = 0.
X2 = π0 + π1 X1 + π2 Z + v .
Y = β 0 + β 1 X1 + β 2 X2 + β 3 X3 + ε
Y = β0 + β1 X + ε
H0 : C (X , ε) = 0 (exogeneidad)
H1 : C (X , ε) 6= 0 (endogeneidad)
X = π0 + π1 Z + v ,
C (X , ε ) = C ( π0 + π1 Z + v , ε ) = C (v , ε ) ⇒
C (X , ε ) = 0 ⇔ C (v , ε ) = 0
v + ξ0
Y = β 0 + β 1 X + αb (5)
con vb = X − (π
b0 + π
b1 Z ) (residuo MCO de la forma reducida), se
estima por MCO.
La hipótesis nula es que X es exógena, es decir: H0 : α = 0.
Por tanto, si rechazamos que α es cero en el modelo (5),
concluiremos que X es endógena.
Generalización:
El contraste de Hausman para el caso de r variables potencialmente
endógenas consistirı́a en:
estimar las r formas reducidas correspondientes para cada una de
dichas variables,
obtener los residuos de cada forma reducida,
incluir como r regresores adicionales cada uno de estos residuos en el
modelo de interés,
y contrastar la significación conjunta de dichos residuos mediante el
estadı́stico W 0 :
SRR − SRS
W0 = n × e· χ2r
SRS
donde
SRR es la suma de los cuadrados de los residuos del modelo original sin
los residuos de las formas reducidas,
SRS es la suma de los cuadrados de los residuos del modelo ampliado
que incluye los residuos de cada una de las formas reducidas como
regresores adicionales con dichos residuos
r es el número de variables potencialmente endógenas.
Si se concluye que los residuos de las formas reducidas son
conjuntamente significativos,
ello indica que al menos una de las variables explicativas
potencialmente endógenas lo es en realidad.
Ejemplo
Como ilustración, supongamos que tenemos el modelo
Y = β 0 + β 1 X1 + β 2 X2 + β 3 X3 + ε
Y = β 0 + β 1 X1 + β 2 X2 + β 3 X3 + α1 vb1 + α2 vb2 + ξ 0 ,
Y = β 0 + β 1 X1 + β 2 X2 + β 3 X3 + ε,
Sea la ecuación:
ln(salario) = γ0 + γ1 educ + u
con u = β 2 cap + ε
⇒γ b1 será un estimador inconsistente de β 1 .
Si disponemos de una variable instrumental para educ podremos
estimar por VI.
ln(\
salario) = 0.286 + 0.083 educ
(0.120) (0.009)
[
educ = 9.799 + 0.282 educp
(0.198) (0.021)
R 2 = 0.196
es decir, se rechaza H0 : π1 = 0.
Por tanto, la educación de la mujer (educ) está significativamente
correlacionada con la educación del padre (educp).
Estimación de VI:
ln(\
salario) = 0.363 + 0.076 educ
(0.289) (0.023)
Contraste de Hausman
A partir de la forma reducida, generamos la variable vb como el residuo
de dicha ecuación estimada:
ln(salario) = β 0 + β 1 educ + αb
v + e,
obteniendo:
ln(\
salario) = βb0 + βb1 educ + 0.007 vb + eb
(0.024)
ln(salario) = β 0 + β 1 educ + αb
υ + e,
obteniendo:
ln(\
salario) = βb0 + βb1 educ + 0.0107 υb + eb
(0.022)
Contrastamos H0 : α = 0 (educ es exógena).
t = 0.0107/0.022 ' 0.5.
⇒ No se rechaza la exogeneidad de educ.
César Alonso (UC3M) ECONOMETRIA. Tema 6 64 / 70
Ejemplo: ecuación de salarios
Contraste de Sargan
nRue2 = 0.1008,
que tiene un valor muy bajo para una distribución aproximada χ21 , con
lo que no rechazamos la hipótesis nula de no correlación de los
instrumentos con el término de error del modelo.
En consecuencia, no hay evidencia en contra de la validez de los
instrumentos.