Está en la página 1de 13

REGRESORES ESTOCÁSTICOS Y VARIABLES INSTRUMENTALES

De acuerdo a la matriz X, consideremos 2 posibilidades:


1. LAS X SON FIJAS.
̂ = 𝜷 + (𝑿′ 𝑿)−𝟏 𝑿′𝒖
Partimos de la expresión 𝜷
̂ ) = 𝜷 + (𝑿′ 𝑿)−𝟏 ′𝑬(𝒖)
Fácilmente se prueba que 𝐸(𝜷
̂) = 𝜷
𝐸(𝜷

Además,
̂ ) = 𝜎 2 (𝑿′ 𝑿)−1
𝑉𝑎𝑟(𝜷
y,
−𝟏
𝑿′ 𝑿 𝑿′ 𝒖
̂ = 𝜷 + 𝑝𝑙𝑖𝑚 (
𝑝𝑙𝑖𝑚 𝜷 ) ∗ 𝑝𝑙𝑖𝑚 ( )
𝒏 𝒏
̂= 𝜷
𝑝𝑙𝑖𝑚 𝜷
En resumen, si suponemos que los regresores son fijos en muestreos repetido, los
estimadores de MCO serán insesgados, eficientes y consistentes (Como ya sabíamos). Pero,
¿qué sucede si ya no suponemos X fijas?

2. LAS X SON ESTOCÁSTICAS.


Dentro de esta posibilidad tenemos tres casos:
2.1. Las X son estocásticas pero independientes de 𝒖.
Seguiremos asumiendo que 𝐸(𝒖⁄𝑿) = 𝟎, lo que nos lleva directamente a:
̂ ⁄𝑿) = 𝐸[𝜷 + (𝑿′ 𝑿)−𝟏 𝑿′ 𝒖⁄𝑿]
𝐸(𝜷
̂ ⁄𝑿) = 𝜷 + 𝐸[(𝑿′ 𝑿)−𝟏 𝑿′ 𝒖⁄𝑿]
𝐸(𝜷
̂ ⁄𝑿) = 𝜷 + 𝐸[(𝑿′ 𝑿)−𝟏 𝑿′ ⁄𝑿] ∗ 𝐸[𝒖⁄𝑿]
𝐸(𝜷
̂ ⁄𝑿) = 𝜷
𝐸(𝜷

Utilizando la Ley de esperanzas iteradas,


̂ ) = 𝐸𝑋 [𝐸(𝜷
𝐸(𝜷 ̂ ⁄𝑿)]

̂) = 𝜷
𝐸(𝜷
Es decir que aun cuando las X son estocásticas, esto no afecta la propiedad de
insesgamiento del os estimadores de MCO.

Además, si 𝑉𝑎𝑟(𝜷 ̂ ⁄𝑿) = 𝜎 2 (𝑿′ 𝑿)−1 , la varianza incondicional se encuentra utilizando la


expresión para la descomposición de la varianza.
̂ ) = 𝐸𝑋 [𝑉𝑎𝑟(𝜷
𝑉𝑎𝑟(𝜷 ̂ ⁄𝑿)] + 𝑉𝑿 [𝐸(𝜷
̂ ⁄𝑿)]

̂ ) = 𝐸𝑋 [𝜎 2 (𝑿′ 𝑿)−1 ] + 𝑉𝑿 (𝜷)


𝑉𝑎𝑟(𝜷
̂ ) = 𝜎 2 𝐸𝑋 (𝑿′ 𝑿)−1
𝑉𝑎𝑟(𝜷

En todo caso, este resultado implica que las X utilizadas en la muestra deben ser lo
suficientemente representativa del promedio
̂= 𝜷
Finalmente, como ya se demostró antes, 𝑝𝑙𝑖𝑚 𝜷
Esto quiere decir que aun cuando las X son estocásticas, pero independientes de las 𝒖, los
estimadores de MCO siguen siendo insesgados, eficientes y consistentes.

2.2. X son estocásticas y dependientes contemporáneamente de 𝒖.

̂ ⁄𝑿) = 𝜷 + ⏟
𝐸(𝜷 𝐸𝑋 [(𝑿′ 𝑿)−𝟏 𝑿′ 𝒖⁄𝑿]
𝑠𝑒𝑠𝑔𝑜

−𝟏
𝑿′ 𝑿 𝑿′ 𝒖
̂ = 𝜷 + 𝑝𝑙𝑖𝑚 (
𝑝𝑙𝑖𝑚 𝜷 ) ∗ 𝑝𝑙𝑖𝑚 ( )
𝒏 𝒏

𝑿′ 𝒖
̂ = 𝜷 + 𝐐−𝟏
𝑝𝑙𝑖𝑚 𝜷 𝐱𝐱 ∗ 𝑝𝑙𝑖𝑚 ( )
𝒏

En este caso los estimadores de MCO son sesgados e inconsistentes, es decir que el sesgo no
desaparece aunque la muestra aumente indefinidamente.

2.3. X son estocásticas y dependen no contemporáneamente de 𝒖.


Este caso es común en modelos de series de tiempo, específicamente en modelos
autorregresivos, y será estudiando oportunamente. Sin embargo, podemos adelantar su
principal conclusión: los estimadores de MCO serán sesgados pero consistentes.
¿Bajo qué circunstancias es posible que se puede presentar una relación entre X y 𝒖, es
decir que no sean independientes? (Problema de la endogeneidad)
Sin afán de ser exhaustivos, es esta sección revisaremos algunos casos, quizá los más
comunes, donde se presenta el llamado problema de la endogeneidad.

i) Cuando existen variable(s) relevante(s) omitida(s) correlacionadas con alguna(s)


variable(s) incluida(s) en el modelo. Analicemos el siguiente ejemplo

Modelo Verdadero: 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑢𝑖


Modelo con variable 𝑋3𝑖 omitida: 𝑌𝑖 = 𝑏1 + 𝑏2 𝑋2𝑖 + 𝑣𝑖 , 𝑐𝑜𝑛 𝑣𝑖 = 𝑢𝑖 + 𝛽3 𝑋3𝑖

ii) Modelo autorregresivo con autocorrelación


𝑌𝑡 = 𝛽1 + 𝛽2 𝑋𝑡 + 𝛼1 𝑌𝑡−1 + 𝑢𝑡 , 𝑐𝑜𝑛 𝑢𝑡 = 𝑝𝑢𝑡−1 + 𝜀𝑡
Es fácil ver que en este caso el shock rezagado afecta tanto a 𝑢𝑡 como a 𝑌𝑡−1

iii) Problema de la simultaneidad


Considere el siguiente sistema de ecuaciones simultáneas
𝑌1𝑖 = 𝛼1 + 𝛼2 𝑌2𝑖 + 𝑋′𝑖 𝜷 + 𝑢1𝑖

𝑌2𝑖 = 𝛾0 + 𝛾2 𝑌1𝑖 + 𝑋′𝑖 𝜹 + 𝑢2𝑖

¿Cuál el proceso que genera el problema de endogeneidad?

iv) Sesgo de selección.


𝑊𝑖 = 𝛼1 + 𝛼𝐸𝑖 + 𝑿′ 𝒊 𝜷 + 𝑢𝑖
𝐸𝑖 = 𝛾1 + 𝒁′𝜹 + 𝑣𝑖
En este ejemplo 𝑊 representa el nivel de salarios de un individuo y 𝐸 sus años de educación.
𝑿 y 𝒁 son vectores de regresores, que pueden de hecho, compartir muchas variables. La
idea fundamental es que existe un conjunto de atributos no observables del individuo, tales
como habilidades, destrezas, inteligencia, entre otros, que seguramente afectan tanto a su
salario como a su nivel de educación. Estos atributos estarán incluidos en 𝑢𝑖 y en 𝑣𝑖 .
Debería quedar claro a estas alturas que 𝐶𝑜𝑣(𝑣𝑖 , 𝑢𝑖 ) ≠ 0 y que finalmente, 𝑢𝑖 y 𝐸 están
relacionadas.

v) Variables medidas con error (Tema de exposición)

¿CÓMO SE ENFRENTA EL PROBLEMA DE LA ENDOGENEIDAD? EL MÉTODO DE


VARIABLES INSTRUMENTALES
En general se suele utilizar el Método de Variables Instrumentales (VI). VI consiste en
utilizar una matriz 𝐙(n∗r) , que contiene a todas las variables de X que no están
correlacionadas con el error, además de un conjunto de variables, llamadas instrumentos,
en un número al menos igual a los regresores correlacionados con el error.
La idea básica de este método es que:
𝒁′ 𝑿
𝑝𝑙𝑖𝑚 ( ) = Ʃ𝒁𝑿 < ∞ (1)
𝒏

𝒁′ 𝒖
𝑝𝑙𝑖𝑚 ( ) = 𝟎 (𝒁 𝑒𝑠 𝑜𝑟𝑡𝑜𝑔𝑜𝑛𝑎𝑙 𝑎 𝒖) (2)
𝒏

Partimos del modelo 𝒀 = 𝑿𝜷 + 𝒖, con 𝐶𝑜𝑣(𝑿, 𝒖) ≠ 0 (Endogeneidad).


Suponiendo que Z cumple (1) y (2), pre multiplicamos el modelo por Z’:
𝐙’𝒀 = 𝐙’𝑿𝜷 + 𝐙’𝒖 , dividiendo por “n”
𝐙’𝒀 𝐙’𝑿 𝐙’𝒖
( )=( )𝜷 + ( ),
𝒏 𝒏 𝒏

Dados (1) y (2), tenemos que, asintóticamente:

𝐙’𝑿 −𝟏 𝐙’𝒀
̂ 𝑽𝑰 = (
𝜷 ) ∗( )
𝒏 𝒏

Que es el estimador de variables instrumentales.


Nótese que este estimador requiere que el número de instrumentos debe ser igual al
número de regresores endógenos, es decir que 𝑟 = 𝑘 (¿Por qué?)
Este estimador no es válido en muestras pequeñas, ya que en ese caso no necesariamente
𝐙’𝒖
se cumple que ( )≠𝟎
𝒏

CONSISTENCIA DEL ESTIMADOR DE VI

𝐙’𝑿 −𝟏 𝐙’(𝑿𝜷 + 𝒖)
̂ 𝑽𝑰 = ( ) ∗ (
𝜷 )
𝒏 𝒏
𝐙’𝑿 −𝟏 𝐙’𝑿 𝐙’𝑿 −𝟏 𝐙’𝒖
̂ 𝑽𝑰 = ( ) ( ) 𝜷 + ( ) ( )
𝜷
⏟𝒏 𝒏 𝒏 𝒏
𝑰

𝐙’𝑿 −𝟏 𝐙’𝒖
̂ 𝑽𝑰
𝜷 =𝜷+( ) ( )
𝒏 𝒏
Obteniendo el 𝑝𝑙𝑖𝑚:

𝐙’𝑿 −𝟏 𝐙’𝒖
̂ 𝑽𝑰
𝑝𝑙𝑖𝑚 𝜷 = 𝜷 + 𝑝𝑙𝑖𝑚 ( ) ∗ 𝑝𝑙𝑖𝑚 ( )
𝑛 𝑛
Dado el supuesto (2)
̂ 𝑽𝑰 = 𝜷 + Ʃ𝒁𝑿 −𝟏 ∗ 𝟎
𝑝𝑙𝑖𝑚 𝜷

̂ 𝑽𝑰 = 𝜷
𝑝𝑙𝑖𝑚 𝜷

DISTRIBUCION ASINTÓTICA DEL ESTIMADOR VI


Partimos de la expresión
−𝟏 𝐙’𝒖
̂ 𝑽𝑰 = 𝜷 + (𝐙’𝑿)
𝜷 ( ). Reordenando términos y multiplicando por √𝑛
𝑛 𝑛

𝐙’𝑿 −𝟏 𝐙’𝒖
̂ 𝑽𝑰 − 𝜷) = ( ) ( )
√𝑛(𝜷
𝑛 √𝑛
Utilizando el teorema de Mann – Wold, tenemos que
𝐙’𝒖 𝒅
( ) → 𝑁(𝟎; 𝜎 2 Ʃ𝒁𝒁 )
√𝑛
Donde:
𝐙’𝒁
Ʃ𝒁𝒁 = 𝑝𝑙𝑖𝑚 ( )
𝑛
Entonces
𝒅
̂ 𝑽𝑰 − 𝜷) → Ʃ𝒁𝑿 −𝟏 𝑁(𝟎; 𝜎 2 Ʃ𝒁𝒁 )
√𝑛(𝜷
𝒅
̂ 𝑽𝑰 − 𝜷) → 𝑁(𝟎; 𝜎 2 Ʃ𝒁𝑿 −𝟏 Ʃ𝒁𝒁 Ʃ𝑿𝒁 −𝟏 )
√𝑛(𝜷

𝒂 𝜎2 −𝟏
̂ 𝑽𝑰 → 𝑁 (𝜷;
𝜷 Ʃ𝒁𝑿 −𝟏 Ʃ𝒁𝒁 Ʃ𝑿𝒁 )
𝑛

̂
En la práctica se utiliza 𝜎̂ 2 (𝒁′ 𝑿)−𝟏 (𝒁′ 𝒁)(𝑿′ 𝒁)−𝟏 = 𝐴𝑠𝑦 ̂ 𝑽𝑰 )
𝑉𝑎𝑟 (𝜷

̂2 = ̂ ´𝒖
𝒖 ̂
Donde 𝜎
𝑛

MÁS INSTRUMENTOS QUE REGRESORES ENDÓGENOS


¿Qué sucede si el número de instrumentos es igual o mayor al número de regresores
endógenos (𝑟 ≥ 𝑘)?
Nótese que en este caso, si (𝑟 > 𝑘) entonces 𝒁′ 𝑿 no es invertible (No es una matriz
cuadrada).

Dada la expresión 𝐙’𝒀 = 𝐙’𝑿𝜷 + 𝐙’𝒖 , sea 𝐯 = 𝐙’𝒖

Entonces 𝐸(𝐯𝐯 ′ ) = 𝐄(𝐙’𝒖𝒖′ 𝒁) = 𝒁′ 𝑬(𝒖𝒖′ )𝒁

𝐸 (𝐯𝐯 ′ ) = 𝝈𝟐 𝒁′𝒁

𝜴

Aplicando MCG (𝛀 conocido) obtenemos el estimador de VI para (𝑟 ≥ 𝑘)

̂ 𝑽𝑰 = [𝑿′ 𝒁(𝒁′ 𝒁)−𝟏 𝒁′ 𝑿]−𝟏 [𝑿′ 𝒁(𝒁′ 𝒁)−𝟏 𝒁′ 𝒀]


𝜷

Sea 𝑷𝒁 = 𝒁(𝒁′ 𝒁)−𝟏 𝒁′ una matriz de proyección (simétrica e idempotente).


𝑷′𝒁 = 𝑷𝒁

𝑷𝟐𝒁 = 𝑷𝒁
𝑷′𝒁 𝑷𝒁 = 𝑷𝒁

Entonces:
̂ 𝑽𝑰 = [𝑿′ 𝑷𝒁 𝑿]−𝟏 [𝑿′ 𝑷𝒁 𝒀]
𝜷
̂ 𝑽𝑰 = [𝑿′ 𝑷′𝒁 𝑷𝒁 𝑿]−𝟏 [𝑿′ 𝑷′𝒁 𝒀]
𝜷

̂ , la matriz de pronósticos de 𝑿 utilizando 𝒁 como regresores


Ya que 𝑷𝒁 𝑿 = 𝑿

̂ 𝑽𝑰 = [𝑿
𝜷 ̂ ′𝑿
̂ ]−𝟏 𝑿
̂ ′ 𝒀,

Que es el estimador de Variables Instrumentales, expresado como un estimador de MCO


̂ , donde 𝑿
de 𝒀 con respecto a 𝑿 ̂ son los pronósticos de la regresión por MCO entre 𝑿 y 𝒁.
Es por esta razón que a este estimador se los conoce también como el Estimador de
Mínimos Cuadrados en 2 Etapas (MC2E)

DEMOSTRACIONES
̂ 𝑽𝑰 = [𝑿′ 𝒁(𝒁′ 𝒁)−𝟏 𝒁′ 𝑿]−𝟏 [𝑿′ 𝒁(𝒁′ 𝒁)−𝟏 𝒁′ 𝒀] es igual a lo anterior
1. Demuestre que 𝜷
−𝟏 𝐙’𝒀
̂ 𝑽𝑰 = (𝐙’𝑿)
cuando r=K, es decir a 𝜷 ( ).
𝒏 𝒏

̂ 𝑽𝑰 = [𝑿′ 𝒁(𝒁′ 𝒁)−𝟏 𝒁′ 𝑿]−𝟏 [𝑿′ 𝒁(𝒁′ 𝒁)−𝟏 𝒁′ 𝒀]


𝜷
̂ 𝑽𝑰 = (𝒁′ 𝑿)−𝟏 (𝒁′ 𝒁) (𝑿
𝜷 ⏟ ′ 𝒁)−𝟏 (𝑿′ 𝒁) (𝒁′ 𝒁)−𝟏 (𝒁′ 𝒀)
𝑰

̂ 𝑽𝑰 = (𝒁′ 𝑿)−𝟏 (𝒁
𝜷 ⏟ ′ 𝒁)(𝒁′ 𝒁)−𝟏 (𝒁′ 𝒀)
𝑰

̂ 𝑽𝑰 = (𝒁′ 𝑿)−𝟏 (𝒁′ 𝒀)


𝜷
Dividiendo y multiplicando para n
−𝟏
𝒁′ 𝑿 𝒁′ 𝒀
̂ 𝑽𝑰 = (
𝜷 ) ( )
𝒏 𝒏

2. Demuestre la Consistencia y Distribución Asintótica del estimador de VI con 𝑟 ≥ 𝑘

Consistencia

̂ 𝑽𝑰 = [𝑿′ 𝑷𝒁 𝑿]−𝟏 [𝑿′ 𝑷𝒁 𝒀]


𝜷

̂ 𝑽𝑰 = [𝑿′ 𝑷𝒁 𝑿]−𝟏 [𝑿′ 𝑷𝒁 (𝑿𝜷 + 𝒖)]


𝜷

̂ 𝑽𝑰 = [𝑿′ 𝑷𝒁 𝑿]−𝟏 [𝑿′ 𝑷𝒁 𝑿]𝜷 + [𝑿′ 𝑷𝒁 𝑿]−𝟏 [𝑿′ 𝑷𝒁 𝒖]


𝜷

̂ 𝑽𝑰 = 𝜷 + [𝑿′ 𝒁(𝒁′ 𝒁)−𝟏 𝒁′ 𝑿]−𝟏 [𝑿′ 𝒁 (𝒁′ 𝒁)−𝟏 𝒁′ 𝒖].


𝜷

−𝟏 −𝟏 −𝟏
𝑿′ 𝒁 𝒁′ 𝒁 𝒁′ 𝑿 𝑿′ 𝒁 𝒁′ 𝒁 𝒁′ 𝒖
̂ 𝑽𝑰
𝜷 = 𝜷 + [( )( ) ( )] [( )( ) ( )]
𝒏 𝒏 𝒏 𝒏 𝒏 𝒏

−𝟏
𝑿′ 𝒁 𝒁′ 𝒁
𝒑𝒍𝒊𝒎 𝜷 ̂ 𝑽𝑰 = 𝜷 + [𝑝𝑙𝑖𝑚 ( ) ∗ 𝑝𝑙𝑖𝑚 ( )
𝒏 𝒏
−𝟏 −𝟏
𝒁′ 𝑿 𝑿′ 𝒁 𝒁′ 𝒁 𝒁′ 𝒖
∗ 𝑝𝑙𝑖𝑚 ( )] [𝑝𝑙𝑖𝑚 ( ) ∗ 𝑝𝑙𝑖𝑚 ( ) ∗ 𝑝𝑙𝑖𝑚 ( )]
𝒏 𝒏 𝒏 𝒏

−𝟏
𝜷𝑽𝑰 = 𝜷 + [Ʃ𝑿𝒁 Ʃ−𝟏
𝒑𝒍𝒊𝒎 ̂ 𝒁𝒁 Ʃ𝒁𝑿 ] ∗ [Ʃ𝑿𝒁 Ʃ−𝟏
𝒁𝒁 𝟎]

̂ 𝑽𝑰 = 𝜷
𝒑𝒍𝒊𝒎 𝜷

Distribución Asintótica

−𝟏 −𝟏 −𝟏
𝑿′ 𝒁 𝒁′ 𝒁 𝒁′ 𝑿 𝑿′ 𝒁 𝒁′ 𝒁 𝒁′ 𝒖
̂ 𝑽𝑰
√𝑛(𝜷 − 𝜷) = [( )( ) ( )] [( )( ) ( )]
𝑛 𝑛 𝑛 𝑛 𝑛 √𝑛

Aplicando Mann – Wald


𝐙’𝒖 𝒅
( ) → 𝑵(𝟎; 𝜎 2 Ʃ𝒁𝒁 )
√𝑛
𝒅 −𝟏
̂ 𝑽𝑰 − 𝜷) → [Ʃ𝑿𝒁 Ʃ−𝟏
√𝒏(𝜷 𝒁𝒁 Ʃ𝒁𝑿 ] Ʃ𝑿𝒁 Ʃ−𝟏 2
𝒁𝒁 𝑵(𝟎; 𝜎 Ʃ𝒁𝒁 )

𝒅 −𝟏 −𝟏
̂ 𝑽𝑰 − 𝜷) → 𝑵 { 𝟎; 𝜎 2 { [Ʃ𝑿𝒁 Ʃ−𝟏
√𝒏(𝜷 𝒁𝒁 Ʃ𝒁𝑿 ] Ʃ𝑿𝒁 Ʃ−𝟏 −𝟏
Ʃ𝒁𝒁 Ʃ𝒁𝒁
𝒁𝒁 ⏟ Ʃ𝒁𝑿 [Ʃ𝑿𝒁 Ʃ−𝟏
𝒁𝒁 Ʃ𝒁𝑿 ] }}
𝑰

𝒅 −𝟏 −𝟏
̂ 𝑽𝑰 − 𝜷) → 𝑵 { 𝟎; 𝜎 2 {[Ʃ
√𝒏(𝜷 −𝟏 −𝟏 −𝟏
⏟ 𝑿𝒁 Ʃ𝒁𝒁 Ʃ𝒁𝑿 ] Ʃ𝑿𝒁 Ʃ𝒁𝒁 Ʃ𝒁𝑿 [Ʃ𝑿𝒁 Ʃ𝒁𝒁 Ʃ𝒁𝑿 ] }}
𝑰

𝒅 −𝟏
̂ 𝑽𝑰 − 𝜷) → 𝑵 { 𝟎; 𝜎 2 [Ʃ𝑿𝒁 Ʃ−𝟏
√𝒏(𝜷 𝒁𝒁 Ʃ𝒁𝑿 ] }

𝒂 𝜎2
̂ 𝑽𝑰 → 𝑵 { 𝜷 ;
𝜷 −𝟏
[Ʃ𝑿𝒁 Ʃ𝒁𝒁 Ʃ𝒁𝑿 ]−𝟏 }
𝑛

En la práctica trabajamos con:

̂
𝑉𝑎𝑟 𝐴𝑠𝑦 = 𝜎̂ 2 [(𝑿′ 𝒁)(𝒁′ 𝒁)−𝟏 (𝒁′ 𝑿)]−1

Dónde:

̂ 𝑽𝑰 )′(𝒀 − 𝑿𝜷
(𝒀 − 𝑿𝜷 ̂ 𝑽𝑰 )
𝜎̂ 2 =
𝑛

¿Qué sucede si el modelo original es 𝒀 = 𝑿𝜷 + 𝒖, con 𝐸(𝒖𝒖′ ) = 𝜎 2 𝜴 y 𝜴 diagonal?

Se recomienda en este caso obtener estimadores robustos de las varianzas-covarianzas. En


este caso:

̂ 𝑽𝑰 ) = 𝑛[𝑿′ 𝑷𝒛 𝑿]−𝟏 (𝑿′ 𝒁)(𝒁′ 𝒁)−𝟏 ̂


𝑉𝑎𝑟𝐴𝑠𝑦(𝜷 𝑺(𝒁′ 𝒁)−𝟏 (𝒁′ 𝑿)[𝑿′ 𝑷𝒛 𝑿]−𝟏

𝟏
̂ = ∑ 𝑢̂𝑖2 𝒛𝒊 𝒛′𝒊
Dónde: 𝑺
𝑛
Nótese que en el caso de la regresión simple 𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑢𝑖

𝜎2 𝜎𝑍2
̂ 𝑽𝑰 ) =
𝑉𝑎𝑟𝐴𝑠𝑦(𝜷 ∗
𝑛 [𝐶𝑜𝑣(𝑋, 𝑍)]2

𝜎2 𝜎𝑍2
̂ 𝑽𝑰 ) =
𝑉𝑎𝑟𝐴𝑠𝑦(𝜷 ∗ 2 2 2
𝑛 𝜌𝑋𝑍 𝜎𝑋 𝜎𝑍

𝜎2
̂ 𝑽𝑰 ) =
𝑉𝑎𝑟𝐴𝑠𝑦(𝜷 2
𝑛 𝜌𝑋𝑍 𝜎𝑋2

Compárese con

𝜎2
̂𝟐 𝑴𝑪𝑶 ) =
𝑉𝑎𝑟𝐴𝑠𝑦 (𝜷
𝑛 𝜎𝑋2

En general

̂𝟐 𝑴𝑪𝑶 )
̂ 𝑽𝑰 ) ≥ 𝑉𝑎𝑟𝐴𝑠𝑦 (𝜷
𝑉𝑎𝑟𝐴𝑠𝑦(𝜷

EJEMPLO:

𝑙𝑛𝑊𝑖 = 𝛽1 + 𝛽2 𝑒𝑑𝑢𝑖 + 𝛽3 ℎ𝑎𝑏𝑖 + 𝑢𝑖

Donde "𝑊" representa los salarios nominales del individuo i-ésimo

"𝑒𝑑𝑢" es una variable que recoge el efecto de la educación

"ℎ𝑎𝑏" recoge las habilidades y destrezas del individuo

1. Utilizamos “𝑖𝑞𝑖 " (coeficiente intelectual) como proxy de “hab”, entonces tenemos:

𝑙𝑛𝑊𝑖 = 𝛽1 + 𝛽2 𝑒𝑑𝑢𝑖 + 𝛽3 𝑖𝑞𝑖 + 𝑢𝑖

2. Si no disponemos datos de la variable “𝑖𝑞𝑖 " el modelo es:

𝑙𝑛𝑊𝑖 = 𝛽1 + 𝛽2 𝑒𝑑𝑢𝑖 + 𝑣𝑖 𝑑𝑜𝑛𝑑𝑒 𝑣𝑖 = 𝑢𝑖 + 𝛽3 ℎ𝑎𝑏𝑖


Cuando hablamos de Instrumentos debemos pensar en dos cosas:

i. Correlacionado con “edu” (RELEVANCIA)


ii. No correlacionado con “hab” (VALIDEZ)

Por ejemplo:
Instrumento 1 = Número del último dígito de la cédula; no está correlacionado con “edu”.
Instrumento 2= Coeficiente Intelectual; está correlacionado con “hab”
Instrumento 3= Educación Padre (Madre).

TEST EN ENDOGENEIDAD

Relacionados con el problema de endogeneidad existen tres grupos de test que podemos
aplicar:

1. Test de Endogeneidad, entre los que tenemos al test de Hausman y al test Durbin-
Wu-Hausman
2. Test de restricciones sobreidentificadas (Validez de los instrumentos), donde
encontramos el test de Hansen-Sargan
3. Test para diagnosticar instrumentos débiles (Relevancia de los instrumentos). Para
ello tenemos el test de Stock y Yogo, entre otros

Endogeneidad: Test de Hausman

Este test es para detectar si existe o no un problema de endogeneidad. Hausman plantea


dos estados (escenarios) posibles suponiendo que se tienen dos estimadores alternativos:
̂y𝛉
𝛉 ̃.

̂y𝛉
E1 = En este escenario 𝛉 ̃ son consistentes, sin embargo 𝛉
̂ es más eficiente que 𝛉
̃.

̂ cumple con la Cota de Cramer-Rao.


De hecho se asume que 𝛉

̃ es consistente, mientras que 𝛉


E2 = Acá, el estimador 𝛉 ̂ no es consistente.

̃−𝛉
Intuitivamente el test de Hausman compara los dos estimadores obteniendo (𝛉 ̂)

Formalmente:

̃−𝛉
𝐻0 : 𝑝𝑙𝑖𝑚(𝛉 ̂) = 𝟎 𝐸𝑥𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑

̃−𝛉
𝐻𝑎 : 𝑝𝑙𝑖𝑚(𝛉 ̂) ≠ 𝟎 𝐸𝑑𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑
El estadístico de prueba es:

𝐻 = (𝛉 ̂)′ [𝑽(𝛉
̃−𝛉 ̃−𝛉
̂)]−𝟏 (𝛉
̃−𝛉
̂ ) ~ 𝝌𝟐

̃−𝛉
Con grados de libertad = dim(𝛉 ̂)

̂ es un
Hausman demuestra que bajo ciertas condiciones (básicamente que el estimador 𝛉
estimador eficiente bajo la hipótesis nula de exogeneidad)

̃−𝛉
𝑽(𝛉 ̂) = 𝑽(𝛉
̃) − 𝑽(𝛉
̂)

Siendo así:

𝐻 = (𝛉 ̂)′ [𝑽(𝛉
̃−𝛉 ̃) − 𝑽(𝛉
̂)]−𝟏 (𝛉
̃−𝛉
̂)

̃𝒚𝛉
En el caso de que 𝛉 ̂ sean escalares, entonces:

2
(θ̃ − θ̂)
𝐻= ~ 𝜒 2 (1 𝑔𝑙)
̃
𝑉(θ) − 𝑉(θ) ̂

Aplicando este test en el problema de regresión que nos compete, comparamos el


estimador de MCO con el estimador de VI, en el modelo 𝒀 = 𝑿𝜷 + 𝒖, con 𝐸(𝒖𝒖′ ) = 𝜎 2 𝐼

El estadístico correspondiente es:

𝐻 = (𝜷 ̂ 𝑴𝑪𝑶 )′ [𝑽𝒂𝒓. 𝑨𝒔𝒚(𝜷


̂ 𝑽𝑰 − 𝜷 ̂ 𝑽𝑰 ) − 𝑽𝒂𝒓. 𝑨𝒔𝒚(𝜷
̂ 𝑴𝑪𝑶 )]−𝟏 (𝜷
̂ 𝑽𝑰 − 𝜷
̂ 𝑴𝑪𝑶 )

¿Qué sucede si 𝐸(𝒖𝒖′ ) = 𝜎 2 𝜴 ?


En este caso puede utilizar test alternativos, tal como el test de Durbin-Wu-Hausman
(DWH). (Se deja la revisión del test al estudiante)

Test para verificar restricciones sobreidentificadas


Lastimosamente, la validez de un instrumento no puede ser testeada en un modelo
exactamente identificado (es decir en un modelo con r = k). Sin embargo, si es posible
testear la validez de instrumentos sobreidentificados en modelos sobreidentificados,
siempre y cuando los parámetros del modelo hayan sido estimados mediante el método
generalizado de momentos (GMM). No entraremos en este curso a analizar la teoría detrás
del método generalizado de momentos, pero podemos aplicarlo en STATA e interpretar sus
resultados.

Instrumentos débiles
Sea 𝚭 una matriz n × r de instrumentos.
1. 𝚭 sea independiente de 𝒖 (Validez de los instrumentos).
2. 𝚭 esté correlacionada con 𝚾 (Relevancia de los instrumentos).
3. Si 𝚭 está débilmente correlacionada con 𝚾, decimos que los instrumentos son débiles
(Weak Instruments).

Los resultados que hemos obtenido para los estimadores de VI (consistencia, insesgamiento
asintótico, normalidad asintótica, etc.) son resultados asintóticos. El problema es que en la
práctica los tamaños de muestra con los que generalmente trabajamos distan mucho de ser
muy grandes. En este sentido el estimador de VI puede tener sesgo y su distribución real
puede diferir de su distribución asintótica.
Además de todo esto, el problema alcanza su clímax si trabajamos con instrumentos
débiles. El detalle de los test para evaluar si tenemos instrumentos débiles quedará para
otro momento, por ahora solo veremos su aplicación.