Está en la página 1de 35

Análisis de datos políticos

Lunes 5 de noviembre

1
Violación supuesto
Varianza constante
Heterocedasticidad

2
Supuesto homocedasticidad
• Varianza condicional del error constante
𝑉 𝜇𝑖 |𝑥 = 𝜎 2 ∀ 𝑖

3
¿Qué es la heterocedasticidad?
• Supuesto: la varianza condicional en las
variables explicativas del error no observado 𝜇
es constante.

• Si esto no se cumple: la varianza de 𝜇 es


diferente para diferentes valores de los x’s: los
errores son heterocedasticos.

4
Ejemplo de heterocedasticidad
f(y|x)

E(y|x) = b0 + b1x

x1 x2 x3 x
5
Ejemplo de heterocedasticidad

6
Consecuencias heterocedasticidad
• 𝛽𝑗 : insesgados y consistentes
• 𝑉(𝛽𝑗 ): sesgada e inconsistente.
• Por lo tanto:
– No es válido para IC ni test de hipótesis
– Estadístico t ya no se distribuye t
– No se puede utilizar para tests F ni LM.
– Problemas no se resuelven al aumentar el tamaño
de muestra (son inconsistentes).

7
Diagnóstico

– Lo anterior es equivalente:

– Si asumimos que la relación entre los errores al cuadrado y las


variables explicativas es lineal:

– Entonces lo anterior equivale a:

– Y realizamos test F o LM

– Como no conocemos el error, debemos estimarlo en base a los


residuos.

8
Diagnóstico: Test de Breush-Pagan
• Estimar modelo por MCO
• Obtener los residuos al cuadrado de la regresión.
• Estimar
• Obtener el estadístico F o el estadístico LM
– 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝐹~𝐹 𝑘, 𝑛 − 𝑘 − 1
– 𝐿𝑀~𝜒 2 (𝑘)
• Si se rechaza Ho, se rechaza homocedasticidad.

9
Diagnóstico: Test de Breush-Pagan
• Estimar modelo por MCO
• Obtener los residuos al cuadrado de la regresión.
• Estimar

• Obtener el estadístico F

10
Diagnóstico: Test de Breush-Pagan
• Estimar modelo por MCO
• Obtener los residuos al cuadrado de la regresión.
• Estimar
• Obtener estadístico LM

Bajo Ho:
𝐿𝑀~𝜒 2 (𝑘)

• Si se rechaza Ho, se rechaza homocedasticidad.

11
Test de White

• Test de Breusch-Pagan detecta cualquier forma lineal de


heterocedasticidad.

• El test de White permite evaluar relacional no lineales


usando los cuadrados y los prodocutos de todos los
regresores (las x’s).

• Se testea la significancia conjunta de todos los xj, xj2, y


xjxh por test F o LM.

• Se vuelve díficil de manejar rápidamente

12
Forma alternativa del test de White
• Los valores predichos de MCO, ŷ, son una función
de todos los x’s

• Por lo tanto, ŷ2 es una función de los cuadrados y


productos cruzados, por lo que ŷ e ŷ2 son una
proxy para xj, xj2, y xjxh
• Por lo tanto, corra una regresión de los residuos
al cuadrado con variables explicativas ŷ y ŷ2 y
utilize R2 para test F o LM .

• Note que sólo está testeando por 2 restricciones.

13
Test de White

• Alternativa:

• Se testea ya sea con estadístico F o LM la


siguiente hipótesis nula:

• Donde
– 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝐹~𝐹 2, 𝑛 − 𝑘 − 1
– 𝐿𝑀~𝜒 2 (2)

14
Inferencia en presencia de
heterocedasticidad
• Errores estándares robustos: robustos ante
heterocedasticidad de forma desconocida.

• Test F robusto a heterocedasticidad

• Test ML robusto a heterocedasticidad

15
Errores estándares robustos
• No es necesario conocer la forma de la heterocedasticidad.

• Derivación matemática asumiendo que todos los supuestos


Gauss-Markov se cumplen, excepto el de homocedasticidad,
aplicando LGN y TLC.

• Consistentes asintóticamente, por lo que sólo se pueden usar


en muestra grande.

• Usualmente se le atribuyen a White (1980). Pero dado que trabajos anteriores de


Eicker (1967) y Huber (1967), postularon la posibilidad de obtener errores robustos,
también se les llama errores estándar robustos White, Huber, or Eicker o una
combinación.

16
Errores estándares robustos
• Modelo:
• Se cumplen todos los supuestos excepto
homocedasticidad:

• Se deriva estimador asintóticamente


consistente.
17
Errores estándares robustos
• Error estándar robusto – estimador
asintóticamente consiste:
𝑛 2 𝜇2
(𝑥
𝑖=1 𝑖 −𝑥 ) 𝑖
𝑉(𝛽1 ) =
𝑆𝐶𝑇𝑥 2

• Recordando, bajo homocedasticidad:

𝜎2 𝜎2
𝑉(𝛽1 ) = 𝑛 2 =
𝑖=1(𝑥𝑖 −𝑥) 𝑆𝐶𝑇𝑥
18
Errores estándares robustos
• Para el caso de la regresión múltiple:
𝑛 2 𝑛
𝑟
𝑖=1 𝑖𝑗 𝜇𝑖2 𝑟 2
𝑖=1 𝑖𝑗 𝜇𝑖2
𝑉(𝛽𝑗 ) = 2 =
𝑆𝑅𝐶𝑥𝑗 [𝑆𝐶𝑇𝑥𝑗 1 − 𝑅𝑗2 ]2
• Donde:
– 𝑟𝑖𝑗2 es el residuo de la regresión de 𝑥𝑗 sobre las
demás variables explicativas.
– 𝑆𝑅𝐶𝑥𝑗 = 𝑛𝑖=1 𝑟𝑖𝑗2 ∶ la suma de los residuos al
cuadrado de la regresión de 𝑥𝑗 sobre las demás
variables explicativas
19
Errores estándares robustos
• Para el caso de la regresión múltiple:
𝑛 2
𝑟
𝑖=1 𝑖𝑗 𝜇𝑖2
𝑉(𝛽𝑗 ) =
[𝑆𝐶𝑇𝑥𝑗 1 − 𝑅𝑗2 ]2

• Recordando para bajo homocedasticidad:

𝜎2 𝜎2
𝑉(𝛽𝑗 ) = 𝑛 2 = 2
𝑖=1(𝑥𝑗𝑖 − 𝑥 ) (1 − 𝑅𝑗 ) 𝑆𝐶𝑇𝑥𝑗 (1 − 𝑅𝑗 )
2

20
Errores estándares robustos
• No es necesario conocer la forma de la heterocedasticidad.
• Son consistentes asintóticamente, por lo que sólo se pueden
usar en muestra grande.

𝑛 2 2
𝑖=1 𝑟𝑖𝑗 𝜇𝑖
• Note que 𝑉(𝛽𝑗 ) = , por lo tanto, también
𝑆𝐶𝑇𝑥𝑗 (1−𝑅𝑗2 )
aumentar en presencia de multicolinealidad alta.

• Algunas veces la varianza es corregida por los grados de


libertad multiplicando por n/(n – k – 1)
• Con n → ∞ no hace mucha diferencia.

• Usar la disponible en su programa estadístico.


21
Errores estándares robustos
Ejemplo Wooldridge

• ¿Qué se puede concluir sobre la relación entre errores


estándares y errores estándares robustos? (i.e. es uno siempre
menor/mayor que el otro)
22
Test de hipótesis robusto a
heterocedasticiad

• Test t asintótico usando el estimador del error


estándar robusto a la heterocedasticidad.

𝛽𝑗 − 𝛽𝑗
∼ 𝑡𝑛−𝑘−1
𝑠𝑒(𝛽𝑗 )

23
Test F robusto a heterocedasticidad
• Solo válido asintóticamente: es decir, muestra
grande.

• También se conoce como estadístico de Wald


robusto a la heterocedasticidad.

• Fórmula completa, usar si disponible en


programa estadístico.
24
Test ML robusto a la heterocedasticidad
𝛾 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥3 + 𝛽4 𝑥4 + 𝛽5 𝑥5 + 𝜇

𝐻0 : 𝛽1 = 0, 𝛽5 = 0

• El cálculo de la versión robusta a la heterocedasticidad es más


complejo.

• Requiere estimar el modelo restringido, obtener los residuos


del modelo restringido – como en la versión no robusta.
• Luego, estimar cada variable excluida en base a las variables
incluidas, y obtener los residuos. Luego multiplicar cada uno
de esos residuos por los residuos del modelo restringido y
estimar 1 en función de las variables sin intercepto.
• Bajo Ho, (𝑛 − 𝑆𝐶𝑅)se distribuye aproximadamente 𝜒 2 (𝑞)
Otras soluciones
• Mínimos Cuadrados Ponderados

• Mínimos Cuadrados Generalizados Factibles

26
Mínimos Cuadrados Ponderados
• Si se conoce la forma de la
heterocedasticidad:
– 𝑉 𝜇 𝑥 = 𝜎 2 ℎ(𝑥),
• ℎ 𝑥 > 0 ∀ 𝑥 (¿por qué?)

• Podemos usar esta información para obtener


una nueva regresión con errores
homocedásticos.

27
Mínimos Cuadrados Ponderados
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + ⋯ 𝛽𝑘 𝑥𝑖𝑘 + 𝜇𝑖

• Cumple todos los supuestos, excepto


homocedasticidad, en particular, la varianza tiene
la forma:
– 𝑉 𝜇𝑖 𝑥𝑖 = 𝜎 2 ℎ(𝑥𝑖 )
• Podemos ponderar por 1 ℎ 𝑥𝑖 :
𝑦𝑖 ℎ(𝑥𝑖 )
= 𝛽0 + 𝛽1 𝑥𝑖1 ℎ(𝑥𝑖 ) + 𝛽2 𝑥𝑖2 ℎ(𝑥𝑖 )
+ ⋯ 𝛽𝑘 𝑥𝑖𝑘 ℎ(𝑥𝑖 ) + 𝜇𝑖 ℎ(𝑥𝑖 )
28
Mínimos Cuadrados Ponderados
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖1 + 𝛽2 𝑥𝑖2 + ⋯ 𝛽𝑘 𝑥𝑖𝑘 + 𝜇𝑖

𝑉 𝜇𝑖 𝑥𝑖 = 𝜎 2 ℎ(𝑥𝑖 )

Podemos ponderar por 1 ℎ 𝑥𝑖 :


𝑦𝑖 ℎ(𝑥𝑖 )
= 𝛽0 + 𝛽1 𝑥𝑖1 ℎ(𝑥𝑖 ) + 𝛽2 𝑥𝑖2 ℎ(𝑥𝑖 )
+ ⋯ 𝛽𝑘 𝑥𝑖𝑘 ℎ(𝑥𝑖 ) + 𝜇𝑖 ℎ(𝑥𝑖 )

29
Mínimos Cuadrados Ponderados
• 𝑦′𝑖 = 𝛽0 + 𝛽1 𝑥′𝑖1 + 𝛽2 𝑥′𝑖2 + ⋯ 𝛽𝑘 𝑥′𝑖𝑘 + 𝜇′𝑖

2
• 𝑉 𝜇′𝑖 𝑥𝑖 = 𝑉 𝜇𝑖 ℎ 𝑥𝑖 =𝐸 𝜇𝑖 ℎ 𝑥𝑖 =

2 1 2 1
𝐸(𝜇𝑖 ) ∗ = 𝜎 ℎ 𝑥𝑖 ∗ = 𝜎2
ℎ 𝑥𝑖 ℎ 𝑥𝑖

• Es decir: 𝑉 𝜇′𝑖 𝑥𝑖 = 𝜎 2

30
Relación con Mínimos Cuadrados Ordinarios

• Si buscamos los estimadores que minimizan


las suma de cuadrados ponderados por el
inverso de la varianza:

• Es lo mismo que estimas por MCO nuestro


nuevo modelo:

31
Relación con Mínimos Cuadrados
Ordinarios
• Interpretación:
– 𝛽𝑘
– Test t y test F
– 𝑅2 : cuidado

• ¿Y si no tenemos la función de la varianza?:


Mínimos Cuadrados Generalizados Factibles

32
Mínimos Cuadrados Generalizados Factibles
• Si no conocemos, debemos estimarla,
siguiendo Wooldridge:
𝑉 𝜇𝑖 𝑥𝑖 = 𝜎 2 exp(𝛿0 + 𝛿1 𝑥𝑖1 + 𝛿2 𝑥𝑖2 + ⋯ 𝛿𝑘 𝑥𝑘𝑖 )
• Es decir ℎ 𝑥𝑖 = exp(𝛿0 + 𝛿1𝑥𝑖1 + 𝛿2𝑥𝑖2 + ⋯ 𝛿𝑘 𝑥𝑘𝑖 )
• Si 𝑉 𝜇𝑖 𝑥𝑖 tiene esa forma, entonces:
𝜇𝑖 2 = 𝜎 2 exp(𝛿0 + 𝛿1 𝑥𝑖1 + 𝛿2 𝑥𝑖2 + ⋯ 𝛿𝑘 𝑥𝑘𝑖 )𝑣
– Suponiendo además que 𝐸 𝑣 𝒙 = 1 y 𝑣 es independiente
de todos los x:
log(𝜇𝑖 2 ) = ao + 𝛿1 𝑥𝑖1 + 𝛿2 𝑥𝑖2 + ⋯ 𝛿𝑘 𝑥𝑘𝑖 + 𝑒𝑖
𝐸(𝑒𝑖 ) = 0, independiente de los x; cumple los supuestos G-M
33
Mínimos Cuadrados Generalizados
Factibles
• Por lo tanto, podemos estimar ℎ 𝑥𝑖 usando los
residuos de la regresión original.
• Estimamos:
log(𝜇𝑖 2 ) = ao + 𝛿1 𝑥𝑖1 + 𝛿2 𝑥𝑖2 + ⋯ 𝛿𝑘 𝑥𝑘𝑖 + 𝑒𝑖
Y obtenemos una estimación de la función ℎ 𝑥𝑖 y
con eso estimamos a través de Mínimos Cuadrados
Ponderados.
Pero, dado que ℎ 𝑥𝑖 es estimada, nuestros
estimadores sólo son asintóticamente consistente
(i.e. no son insesgados)
34
Mínimos Cuadrados Generalizados
Factibles
• Diferencias entre MCO y MCGF:
– Pueden indicar problemas de especificación
𝐸 𝜇 𝑥 ≠ 0 , es decir,

En ese caso: estimadores MCGF ya no son


consistentes.

35

También podría gustarte