Está en la página 1de 35

Clase 12.

Heterocedasticidad y modelos robustos

Nerys Ramı́rez Mordán

Pontificia Universidad Católica Madre y Maestra


Econometrı́a II (EC-411-T)

25 de septiembre de 2018

1
Contenido

1 Introducción

2 Test de heterocedasaticidad
Test gráfico de los residuos y varianza condicional
Test Breusch-Pagan
Test de White

3 Tratamiento de la heterocedasticidad
Mı́nimos cuadrados ponderados (MCP)
Mı́nimos cuadrados generalizados (MCG)
Mı́nimos cuadrados generalizados factibles (MCGF)
Estimación consistente de White
Mı́nimos cuadrados absolutos

4 Referencias

2
Introducción

3
Preliminares: varianza condicional

La varianza condicional es el momento condicionado de segundo


orden, centrado en la media.

V ar[X|Y ] = E[(X − E[X|Y ])2 |Y ] = E[X 2 |Y ] − (E[X|Y ])2 (1)

E[X 2 |Y = y0 ] = 2
P
x x [X = x|Y = y0 ].

4
Preliminares: varianza condicional
Suponga la siguiente distribución conjunta:

x/y y=0 y=1 Pr[X = xi ]


x=0 0.3 0.3 0.6
x=1 0.3 0.1 0.4
Pr[Y = yi ] 0.6 0.4

V ar[x] = E[X 2 ] − (E[X])2 = 0.4 − 0.42 = 0.24


V ar[X|Y = 1] = E[X 2 |Y = 1] − (E[X|Y = 1])2 =
12 ∗ 0.25 − 0.0625 = 0.1875

5
Heterocedasticidad

Dado el modelo de regresión múltiple:

yi = β 0 X =  (2)
El error tiene la misma varianza para cualquier valor de las
variables explicativas: V ar(|x) = σ2 , donde σ2 es la varianza
incondicional de  o varianza del error.
Este supuesto establece que la dispersión del error alrededor de la
recta de regresión será la misma, siendo los datos muestrales
igualmente válidos, sin necesidad de ponderarlos.

Ejemplo: heterocedasticidad en la ecuación de salarios

6
Heterocedasticidad

La homocedasticidad (homo=igual, cedasticidad=dispersión)


implica que la varianza de cada termino de perturbación ui ,
condicionada a las variables explicativas y, es constante.

E[2i ] = σi2 i = 1, 2, 3, ..., n (3)

La varianza incondicional puede venir derivada de un factor de


proporcionalidad Z −que puede o no ser una variable explicativa o
función de esta−.

7
Heterocedasticidad: causas

La heterocedasticidad puede surgir como respuesta a:


1 Valores atı́picos.
2 Omisión de una variable relevante, que quedará modelada en el
error.
3 Formas funcionales incorrectas.
4 Asimetrı́a en la distribución en alguna de las variables
independientes.
5 Problemas en el proceso de recolección de datos.
Antes de corregir el problema, es necesario estar seguro de utilizar
la forma funcional correcta.

8
Heterocedasticidad: efectos

El estimador de Mı́nimos Cuadrados Ordinarios sigue siendo


lineal, insesgado y consistente, pero deja de ser eficiente (varianza
mı́nima) (Arce et al., 2008).
Las estimaciones (fórmulas) de varianza de los estimadores no son
válidas en presencia de heterocedasticidad, lo que inválida los test
de hipótesis tradicionales.

V (β̂) = σ 2 (X 0 X)−1 (4)

9
Test de heterocedasaticidad

10
Heterocedasticidad: test gráfico

Los test formales de heterocedasticidad intentan verificar si los


residuos mı́nimo cuadráticos ordinarios al cuadrado son de algún
modo función de los regresores (heteroscedasticidad).
Obtener la varianza condicional de los residuos del modelo
estimado por MCO, por grupos seleccionados, suele ser una
primera aproximación.
El gráfico de dispersión de los residuos (2 ) contra los valores
estimados de y (ŷ) permite una primera aproximación a la
presencia de heterocedasticidad en el modelo.

11
Heterocedasticidad: test Breusch-Pagan

Como los gráficos y los valores por grupo, pueden ser difı́cil de
interpretar, el test Breusch-Pagan permite identificar
heterocedasticidad. El test analiza si la varianza esperada de los
residuos depende de las variables independientes.
yi = β0 + β1 x1i + i
ˆ2 se obtiene
 2 como el cuadrado de los residuos estandarizados
ze2i = σ̂i  . Posteriormente, se estima este modelo en función del
resto de variables sobre las que deseamos identificar
heterocedasticidad:
2i = θ0 + θ1 x1i + ... + θp xpi + ui

12
Heterocedasticidad: test Breusch-Pagan

La hipótesis nula del test es la homocedasticidad del residuo.


Mientras que el estadı́stico de prueba se obtiene a partir de:

N xR2 ∼ χ2 (p) (5)


Verifica la significancia global del modelo auxiliar, siendo
h0 : θ0 = θ1 = ... = θk = 0, mientras que ha : al menos una es
distinta de cero.

H0 : V ar(ui |Xi ) = E[u2 |Xi ] = σ 2 (6)


Cuando se rechaza H0 , E[u2 |Xi ] no es constante, si no que será
función de algunas (o todas) variables explicativas:

Ha : V ar(ui |Xi ) = E[u2 |Xi ] = g(Z) = σi2 (7)

13
Heterocedasticidad: test Breusch-Pagan

La regla de rechazo es idéntica a la tradicional (Tabla tomada de


Wooldrige, 2009, p.829).

14
Heterocedasticidad: test Breusch-Pagan

Pasos:
1 Se estima el modelo y = β0 + β1 x1 + e, y se estiman los residuos.
2 Luego se estima e2i = δ0 + δ1 Z11 + ... + δp Z1p + v.
3 El estadı́stico de contraste N R2 ∼ χ2p .

15
Heterocedasticidad: test Breusch-Pagan

El R2 bajo indica que el poder explicativos de las variables en su


conjunto sobre las variaciones de las perturbaciones aleatorias es
escaso. Por tanto, valores cercanos a cero, son indicativos de
homocedasticidad.
El test de Breusch-Pagan solo permite identificar formas lineales
de heterocedasticidad.

16
Heterocedasticidad: test de White

El test White mantiene el espı́ritu de Breusch-Pagan, analiza si la


varianza esperada de los residuos de una regresión
(y = β0 + β1 xi + β1 xj + ) depende de las variables independientes,
su cuadrado y su iteracciones.

ˆ2 = θ0 + θ1 xi + θ1 xj + θ2 x2i + θ2 x2j + θ1 xi xj + u (8)

Su h0 (homocedasticidad), se verifica a partir del estadı́stico


2
N xRaux ∼ χ2 k(aux) . Donde, Raux
2 es el coeficiente de determinación
de la regresión auxiliar, y χ tienen el número de regresoras (sin
constante) del modelo auxiliar como grados de libertad.

17
Heterocedasticidad: test de White ajustado

Una prueba que preserve mejor los gl, se obtiene utilizando los
valores ajustados (ŷ) de las regresiones auxiliares, que representen
la combinaciones de las variables explicativas del modelo,
manteniendo la H0 de homocedasticidad.

ˆ2 = θ0 + θ1 ŷ + θ1 ŷ 2 + u (9)

18
Tratamiento de la heterocedasticidad

19
Alternativas

Transformación logarı́tmica de las variables.


Utilizar estimadores consistentes.
1 Errores robustos
2 Mı́nimos cuadrados ponderados
3 Mı́nimos cuadrados robustos

20
Alternativas (1) MCP

Al mı́n ni=1 u2 todos los residuos recibı́an igual ponderación, sin


P

embargo, es ideal que diéramos más ponderación a las


observaciones provenientes de poblaciones con menor varianza,
para alcanzar mayor representatividad de los valores medios.
Aprovecha el conocimiento existente sobre la variabilidad de los
datos alrededor de las X −por ejemplo, ingreso-educación,
ahorros-ingresos...− a partir de un esquema de estimación donde
las observaciones con mayor variabilidad reciban menor peso.

21
Alternativas (1) MCP

La heterocedasticidad se produce por la dependencia de la


varianza de las perturbaciones de una o más variables:

σ̂2 = f (σ 2 , Z) (10)
El método intenta operar convenientemente las variables para
eliminar la fuente de heterocedasticidad, dividiendo las variables
del modelo por la forma estimada de la función de varianza.

22
Alternativas (1) MCP

Partiendo del modelo:

Yi = β0 X0 + βi X1 + ui (11)

Por lo que, conociendo las varianzas heterocedasticas y dividiendo


a ambos lados por las desviación tı́pica de las perturbaciones (σi2 ),
se obtiene el MCP:

Ŷi∗ X0 X1
2 = β̂0∗ 2 + β̂i∗ 2 + û∗i (12)
σi σi σi

23
Ejemplo: heterocedasticidad en la ecuación de salarios
Suponga la ecuación de salario presenta una estructura de verianza
σ̂2 = f (σ 2 , educ). Se obtiene esta función de varianza a partir de la
varianza condicional de la variable que genera la
heterocedasticidad.
Por lo que, las observaciones con mayor varianza presentan menor
peso en el modelo.

24
Alternativas (1) MCP

n n
u2∗ Ŷ ∗ X0 X1
( i2 − β̂0∗ 2 − β̂i∗ 2 )2
X X
mı́n = mı́n (13)
i=1
σi2 i=1
σi σi σi

Por lo que, el MCG se resume a minimizar una suma pondera por


hi = σ1i , de aquı́ que este método se conozca como el de mı́nimo
cuadrados ponderados (1969).

n n
wi (Yi − β0∗ X0 − βi∗ X1 )2
X X
wi û2i = (14)
i=1 i=1

25
Alternativas (1) Mı́nimos Cuadrados Generalizados
Factibles

Mı́nimos Cuadrados Generalizados es un MCP donde cada residuo


al cuadrado es ponderado por la inversa de V ar(ui |xi ).
n
1
(Yi − β0∗ X0 − βi∗ X1,i − ... − βk∗ XX k,i )2
X
(15)
i=1
hi
Dado que suele ser difı́cil conocer hi , empı́ricamente se desarrolla
el método de Mı́nimos Cuadrados Generalizados Factibles (FGLS),
donde V ar(ui |xi ) se estima a partir de:

V ar(ui |xi ) = σ 2 exp[δ0 + δ1 X1 + δ2 X2 + ... + δk Xk ] (16)

26
Alternativas (1) Mı́nimos Cuadrados Generalizados

La expresión (15) se modifica a un modelo lineal que pueda ser


estimado por MCO.

log(2 ) = log(σ 2 ) + δ1 X1 + δ2 X2 + ... + δk Xk + e (17)

1 2 ).
Regresamos Y = f (X) y se obtiene ˆ. Se calcula log(ˆ
2
2  ) = f (X) para obtener ĝi .
Regresamos log(ˆ
1
3 Se estima por MCP utilizando exp(ĝ) como ponderador.

27
Mı́nimos Cuadrados Generalizados
El método factible, permite además obtener los coeficientes
asociados a las funciones de varizanza.
Suponga σi2 = E[u2i |xi ] = σ 2 xαi , donde xi es uno de los regresores
del modelo.
Se estima la regresión auxiliar log(e2i ) = log(σ 2 ) + α log(xi ), para
obtener α, y de ahı́ se obtiene:

ŵi = xα̂i (18)

28
Alternativas (2) Matriz de covarianza robusta

En los casos en donde no se conoce la forma de la


heterocedasticidad, se suele utilizar errores robustos a la
heterocedasticidad (White, 1980).

Pn 2 2
i=1 r̂i,j ûi
var(β̂j ) = (19)
SECj2

2 es el cuadrado del i-ésimo residuo de la regresión auxiliar


r̂i,j
correspondiente (es decir de Xj en función de las demás variables
independientes), SECj2 de la regresión auxiliar, y por último, û2i es
el cuadrado del residual estimado en el MCO original.

29
Alternativas (2) Matriz de covarianza robusta

Ahora, se estima el estadı́stico t se calcula con el error estándar


robusto del respectivo estimador.

β̂j − βh
tβ̂j = r Pn 2 0 ∼ tk−1 (20)
r̂ û2
i=1 i,j i
SECj2

30
Errores robustos en la ecuación de precios de viviendas
Ejercicio 8.7 de Wooldridge. Se estima el precio de las casas en
función del tamaño de la casa, los pies cuadrados de la casa y el
número de habitaciones.

Variables MCO Robusto


lotsize .0020677 .0020677
.0006421 .0012514
sqrft .1227782 .1227782
.0132374 .0177253
bdrms 13.85252 13.85252
9.010145 8.478625
consta -21.77031 -21.77031
29.47504 37.13821
N 88 88
R-squared 0.6724 0.6724
F-prob 0.000 0.000

31
Alternativas (2) Matriz de covarianza robusta

Se debe evitar usar esta técnica en muestras pequeñas, dado que


con muestras pequeñas, los errores robustos pueden tener
distribuciones alejadas de la t.
Los estimadores coinciden con la estimación de MCO.

32
Alternativas (3) MCO absolutos

No se minimiza el sumatorio de los cuadrados de los residuos, sino


otra función elegida de forma adecuada como el valor absoluto
(Laplace, 1799), que estima la media por medio de la mediana.

X X
mı́n |u| = mı́n |β̂x − ŷ| (21)

¿Por qué no usarlo siempre? Porque los errores estándar y los


estadı́sticos, solo se justifican si la muestra es grande (Wooldridge,
2009, p.268), mientras en MCO los estadı́sticos tienen muestras
exactas independientemente al tamaño de la muestra.
Es cada vez más común, presentar solamente los estadı́sticos
robustos.

33
Referencias

34
Referencias

1 Frost, Jim (2013). Heteroscedasticity in Regression Analysis. Consultado


24.9.2018. http:
//statisticsbyjim.com/regression/heteroscedasticity-regression/.
2 Román, Patricia. Cálculo de medias y varianzas condicionadas para un vector
aleatorio bidimensional discreto. Grado en estadı́stica. Consultado 24.9.2018.
Disponible en https://www.ugr.es/˜proman/ProbII/2012-2013/PDF/
MediasVarianzasCondicionadasCasoBidimensional.pdf.
3 Wooldridge, J. (2009). Introducción a la econometrı́a: un enfonque moderno.
4 Yamano, Takashi (2009). Lecture 9: Heteroskedasticity and Robust Estimators.
Lecture Notes on Advanced Econometrics.
http://www3.grips.ac.jp/˜yamanota/Lecture_Note_9_Heteroskedasticity.

35

También podría gustarte