Está en la página 1de 56

TEMA 6:

HETEROCEDASTICIDAD
MARIOLA ESTUDILLO MARTNEZ
DPTO. ESTADSTICA E INVESTIGACIN OPERATIVA
(BASADO EN LOS APUNTES DE ANTONIO CONDE SNCHEZ)

NATURALEZA DEL PROBLEMA


Una de las hiptesis bsicas del modelo de regresin lineal
general es que la varianza de los trminos de la perturbacin
aleatoria es constante e igual a 2. Se trata de la hiptesis de
homocedasticidad:
Var ui 2, i 1,...,n
Sin embargo, no siempre se cumple dicha hiptesis. En caso de
que no se verifique, estamos en el caso de heterocedasticidad:

Var ui i2, i 1,...,n


es decir, la matriz de varianzas-covarianzas tiene la siguiente
expresin:
12

0
0

2
2
0
0
V u E uu'

2
0
n
0

NATURALEZA DEL PROBLEMA


Por tanto, las perturbaciones aleatorias siguen
independientes pero no tienen la misma varianza.

siendo

Por tanto, diremos que el modelo y X u es heterocedstico.

CAUSAS
La heterocedasticidad es un problema tpico de modelos que
utilizan datos de corte transversal. Las causas ms frecuentes
de la heterocedasticidad son las siguientes:
1. El trmino de error est afectado por los valores que toma
una de las variables: cuanto mayor son los valores de alguna de
las variables explicativas mayor ser la dispersin del mismo.
Existe un efecto de escala.

NATURALEZA DEL PROBLEMA


CAUSAS
2. La presencia de datos atpicos (observaciones que son muy
diferentes con relacin a las dems observaciones de la
muestra) provoca una mayor variabilidad del error.
3. Cuando se promedian los valores de Y para conjuntos de
observaciones. Las varianzas dependen del nmero de
observaciones que se promedian, por lo que no existe
homocedasticidad.
4. Error de especificacin en el modelo. La omisin de variables
importantes en el modelo o una forma funcional incorrecta
puede ocasionar que al efectuar la regresin, los residuos que
se obtienen presenten heterocedasticidad.

NATURALEZA DEL PROBLEMA


CONSECUENCIAS
2
1. Estimacin sesgada de la varianza,

2. Los estimadores MCO son insesgados, pero menos eficientes


que los MCG (es decir, no tienen varianza mnima).
3. Los intervalos de confianza y los estadsticos utilizados para
resolver contrastes de hiptesis ya no son fiables. Por tanto,
existe la posibilidad de extraer conclusiones errneas.
Por tanto, en presencia de heterocedasticidad es conveniente
utilizar los estimadores MCG.

DETECCIN DE LA
HETEROCEDASTICIDAD
No es fcil detectar la heterocedasticidad en una situacin
concreta, ya que i2 slo se puede conocer si tenemos toda la
poblacin de Y correspondiente al valor Xi.
En algunas ocasiones la propia naturaleza del problema sugiere si
es probable que exista heterocedasticidad. Por ejemplo, cuando
hay efecto de escala o se promedian los valores de Y.
Disponemos de varias herramientas de diagnstico que nos
pueden ayudar a detectar la heterocedasticidad. Se clasifican
en:
Procedimientos informales
Procedimientos formales

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS INFORMALES
Son algo subjetivos y exigen la representacin grfica de los
residuos:
Calcular los residuos estimando el modelo por MCO.
y
X y y

Representar los ui o ui 2 frente a los valores estimados i o bien


frente a la variable que se cree que provoca la
heterocedasticidad, con la idea de encontrar algn patrn en el
comportamiento de los mismos.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS INFORMALES
Si los puntos se disponen en el grfico de forma aleatoria, no
hay evidencia de que se incumpla la hiptesis de
homocedasticidad.
Si el grfico muestra un patrn de comportamiento (lineal,
cuadrtico, exponencial, etc.) es probable que haya
heterocedasticidad entre los trminos del error aleatorio.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS INFORMALES
Ejemplo

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS INFORMALES
En el grfico podemos observar que los residuos dependen
linealmente de la variable X. En consecuencia, los residuos al
cuadrado y su varianza dependen de forma cuadrtica de la
variable X2. Esto permite proponer el siguiente modelo para la
varianza de los trminos de error aleatorio:

Var ui 2Xi 2
siendo 2 una constante positiva desconocida.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS INFORMALES
Ejemplo
La siguiente tabla presenta los gastos de consumo, Y, y el
ingreso, X, de 20 familias.
Xi 22.3 32.3 36.6 12.1 42.3

6.2

44.7 26.1 10.3 40.2

Yi

6.1

38.6 25.5 10.3 38.8

19.9 31.2 31.8 12.1 40.7

Xi

8.1

Yi

34.5

38

14.1 16.4 24.1 30.1 28.3 18.2 20.1

33.1 33.5 13.1 14.8 21.6 29.3

Queremos ajustar el modelo:

25

Yi 0 1Xi ui

17.9 19.8

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS INFORMALES
20
X' X
505

505

15446.3

471.1
X' y

14319

y ' y 13307.55

0.847052
1

X' X X' y

0
899325
.

Yi 0.847052 0.899325Xi

s .e 0.703355 0.025309

R 2 0.985944

El modelo explica un alto porcentaje de la variacin de Y. Parece


adecuado, pero vamos a representar grficamente los residuos
para ver si se incumple la hiptesis de homocedasticidad.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS INFORMALES
Los valores estimados de Y junto con los residuos aparecen en la
siguiente tabla:

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS INFORMALES

El grfico de los residuos frente a los valores estimados de Y


muestra una cierta tendencia lineal creciente. La disposicin no
es aleatoria, de modo que sospechamos que, en efecto, la variable
X provoca heterocedasticidad entre los trminos de error.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
Es preferible utilizar un procedimiento formal para adoptar una
decisin definitiva, ya que los grficos slo nos dan una idea de
qu es lo que puede estar ocurriendo y no siempre son
concluyentes.
Los procedimientos formales son procedimientos objetivos ya que
se trata de contrastes de hiptesis.
Existen diversos contrastes de heterocedasticidad, cada uno de
los cuales parte de un determinado supuesto acerca del posible
patrn de heterocedasticidad.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
Algunos de ellos son constructivos, es decir, que una vez
rechazada la hiptesis de homocedasticidad aportan informacin
sobre la forma que tendr la matriz de varianzas-covarianzas.
Los contrastes de hiptesis que vamos a ver son:
Contraste de Goldfeld-Quandt
Contraste de Glesjer
Contraste de White

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GOLDFELD-QUANT
Supuesto
La heterocedasticidad viene determinada por una de las variables
explicativas del modelo de regresin.
Bsicamente consiste en comparar los residuos del modelo
obtenidos al emplear los valores pequeos y grandes de la
variable
explicativa
presumiblemente
causante
de
la
heterocedasticidad. Se supone que para los valores pequeos la
varianza ser menor que para los valores grandes.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GOLDFELD-QUANT
Pasos
1. Ordenar todos los valores de todas las variables del modelo de
acuerdo al orden creciente de los valores de Xj, donde se
supone que sta es la variable explicativa causante de la
heterocedasticidad.
2. Eliminar las c observaciones centrales.
3. Realizar dos estimaciones por MCO utilizando las (n-c)/2
primeras observaciones y las (n-c)/2 ltimas observaciones,
donde (n-c)/2 > k+1.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GOLDFELD-QUANT
Pasos
4. Calcular la suma de cuadrados del error o de los residuos
asociados a las dos estimaciones: SCE1 y SCE2.
5. Bajo el supuesto de homocedasticidad se verifica que

SCE2
Fn c
n c
k 1 ,
k 1
SCE1
2
2
Con lo cual, fijado un nivel de significacin rechazaremos la
hiptesis de homocedasticidad si
SCE2
F n c
n c
1 ,
k 1 ,
k 1
SCE1
2
2

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GOLDFELD-QUANT
Inconvenientes
El contraste se efecta suponiendo que si hay
heterocedasticidad, sta no es inversa (es decir, existe una
relacin directa entre la magnitud de la variable Xj y la
dispersin del modelo). Sin embargo, si se obtiene que
SCE1>SCE2, el estadstico del contraste se debe reformular
como SCE1/SCE2, tomando como hiptesis alternativa del
contraste la existencia de heterocedasticidad inversa.
No es un procedimiento constructivo porque no tenemos
informacin respecto a la matriz V.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GOLDFELD-QUANT
Inconvenientes
Cmo elegir c? La omisin de las c observaciones centrales se
efecta para acentuar las magnitudes relativas de SCE1 y
SCE2. Si c es pequeo, la disparidad entre los dos grupos
puede no ser sustancial y si c es elevado, la potencia del test
disminuir. Se suele elegir un valor de c n/3.
Y si no conocemos cul es la variable Xj causante de la
heterocedasticidad o se sospecha de varias variables a la vez?
Habr que realizar dicho contraste para todas las variables
explicativas del modelo.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GOLDFELD-QUANT
Ejemplo
Continuando el ejemplo anterior, vamos
analticamente la hiptesis de homocedasticidad.

H0 : Homocedasticidad
H1 : Heterocedasticidad
1. Ordenamos los valores de X de menor a mayor.

contrastar

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GOLDFELD-QUANT
2. Eliminamos c observaciones centrales. Quedan entonces dos
grupos de datos.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GOLDFELD-QUANT
3. Estimamos los coeficientes por MCO:

4. Calculamos las sumas de cuadrados del error:

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GOLDFELD-QUANT
5. Estadstico, criterio de rechazo y conclusin:

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GLESJER
Supuesto
La heterocedasticidad es debida a una nica variable. Adems, se
propone una funcin para la heterocedasticidad.
Pasos
1. Estimar el modelo por MCO y obtener los residuos.
2. Realizar una regresin por MCO entre los valores absolutos de
los residuos y la variable Xmh es decir:

ui 0 1Xmih vi

donde Xm es la variable causante de la heterocedasticidad y h


una constante que se determina a partir del mtodo grfico.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GLESJER
Pasos
3. Contrastar la heterocedasticidad equivale a contrastar:

H0 : 1 0
H1 : 1 0
Se rechaza H0 si

texp


Var
1

1 ,n k 1
2

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GLESJER
En caso de rechazar H0, el esquema para la varianza de los
trminos de la perturbacin aleatoria es:

ui dependen de Xmih ui 2 dependen de Xmi2h

Var [ui ] depende de Xmi2h

Var [ui ] 2Xmi2h


con 2 constante desconocida

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GLESJER
Inconvenientes
El trmino de la perturbacin aleatoria vi puede ser
heterocedstico y presenta algunos problemas en relacin al
cumplimiento de los supuestos bsicos del modelo de regresin
En la prctica es til para muestras grandes.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GLESJER
Ejemplo
Continuando el ejemplo anterior, vamos
analticamente la hiptesis de homocedasticidad.

contrastar

H0 : Homocedasticidad
H1 : Heterocedasticidad
En este ejemplo, la nica variable que puede causar
heterocedasticidad es X. Podemos considerar que los residuos
dependen linealmente de la variable X, o bien que son los residuos
al cuadrado los que dependen linealmente de X. Vamos a probar
ambos modelos.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GLESJER
1. Ya hemos estimado el modelo y los residuos anteriormente.
2. Los modelos que debemos estimar son:

1
2

ui 0 1Xi vi
ui 0 1Xi 1/2 vi

con h 1
con h 1 / 2

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GLESJER
Los resultados obtenidos son los siguientes:

1
2

0.209761

.
0
051196

s .e.

1.23249

.
0
47532

s .e.

0.094048

.
0
003384

R 2 0.927082

0.185769

.
0
036970

R 2 0.901803

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GLESJER
3. Estadsticos, criterio de rechazo y conclusin:

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE GLESJER
Tenemos entonces dos posibles modelos para la estructura de la
matriz de varianzas-covarianzas. En el primer caso se tiene que

Var [ui ] 2Xi 2


En el segundo caso tenemos que

Var [ui ] 2Xi


Dado que el modelo (1) tiene un coeficiente de determinacin algo
mayor, podemos en principio preferir dicho modelo.

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE WHITE
Supuesto
La heterocedasticidad es debida a una o ms variables del
modelo.
Pasos
1. Estimar el modelo por MCO y obtener los residuos.
2. Realizar una regresin por MCO de los residuos al cuadrado
con respecto a todas las variables explicativas, sus cuadrados
y todos sus productos cruzados. Por ejemplo, para un modelo
con dos v. explicativas tenemos
ui 2 0 1X1i 2X2i 3X12i 4X22i 5X1i X2i vi

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE WHITE
Pasos
3. Contrastar la heterocedasticidad equivale a realizar el
contraste de significacin global en el modelo anterior.
4. Equivalentemente, White demostr que bajo H0: nR 2 p2
donde R2 es el coeficiente de determinacin de la regresin
auxiliar anterior y p es el nmero de variables explicativas de
dicha regresin.
5. Se rechaza la hiptesis de homocedasticidad si

nR 2 12 , p

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE WHITE
Inconvenientes
Tiene poca potencia frente a las otras opciones.
Puede recoger problemas relativos a una mala especificacin
del modelo.
El nmero de regresores en el contraste es muy grande,
incluso con pocas variables explicativas. Sin embargo, es
posible obtener un contraste que sea ms sencillo de llevar a
cabo mediante la regresin:
u2 Y Y2 v
i

1 i

2 i

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE WHITE
Ejemplo
Continuando el ejemplo anterior, vamos
analticamente la hiptesis de homocedasticidad.

contrastar

H0 : Homocedasticidad
H1 : Heterocedasticidad

1. Ya hemos estimado el modelo y los residuos anteriormente.


2. Se hace la regresin de los residuos al cuadrado con respecto
a X y su cuadrado, obteniendo:

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE WHITE
ui 2 0.487531 0.070145Xi 0.001061Xi 2

s .e . 0.617666 0.054809 0.001061


3. Estadstico:
Coeficiente de determinacin: R 2 0.8781

Estadstico

nR 2 17.562

DETECCIN DE LA
HETEROCEDASTICIDAD
PROCEDIMIENTOS FORMALES
CONTRASTE DE WHITE
4. Criterio de rechazo y conclusin:
Criterio de rechazo
Rechazo H0 si nR 2 02.95,2 5.995
Conclusin
Al 5% significacin rechazo H0, luego no se verifica la
hiptesis de homocedasticidad.

ESTIMACIN BAJO
HETEROCEDASTICIDAD
OBJETIVO
Estimar el vector de parmetros del modelo lineal general:
y X u

donde la matriz de varianzas-covarianzas del error aleatorio


tiene la forma siguiente:
12

0
V u V

22

2
n

ESTIMACIN BAJO
HETEROCEDASTICIDAD
MTODO DE ESTIMACIN
V CONOCIDA
Si V es conocida los parmetros se estiman por MCG:

G X'V1 X

X'V1 y

donde:

1 / 12
0

1 / 22
0

0
0

0
P'P

2
1 / n
0

ESTIMACIN BAJO
HETEROCEDASTICIDAD
MTODO DE ESTIMACIN
V CONOCIDA
De forma equivalente se pueden estimar los parmetros por MCO
en el modelo transformado dado por:
y X u Py PX Pu y * X * u*

donde:
1 / 1
0

1 / 2
0
P

0
0

1 / n
0

ESTIMACIN BAJO
HETEROCEDASTICIDAD
MTODO DE ESTIMACIN
V CONOCIDA
Explcitamente el modelo transformado es:

Yi * 0 X 0*i 1X1i* k Xki* ui *


donde:

Y
Yi i ,
i
*

X ji
*

X ji
i

ui *

ui
i

Se trata de un modelo sin trmino independiente con k+1


variables explicativas.

ESTIMACIN BAJO
HETEROCEDASTICIDAD
MTODO DE ESTIMACIN
V DESCONOCIDA

1. Se puede emplear el esquema de la varianza obtenido al


realizar el contraste de Glesjer:

Var [ui ] 2Xmi2h ,

i 1,..., n

con 2 una constante desconocida. De esta forma, la matriz de


varianzas-covarianzas es de la forma:

V 2

donde

Xm21h

Xm22h

0
es conocida

2h
Xmn

ESTIMACIN BAJO
HETEROCEDASTICIDAD
MTODO DE ESTIMACIN
V DESCONOCIDA

Entonces el estimador de MCG de se obtiene como:

G X' 1 X

X' 1 y

De forma equivalente se pueden estimar los parmetros por MCO


en el modelo transformado dado por:
y X u Py PX Pu y * X * u*

donde:

1 / Xmh1
0

h
0
1
/
X
m2
P

0
0

h
1 / Xmn

ESTIMACIN BAJO
HETEROCEDASTICIDAD
MTODO DE ESTIMACIN
V DESCONOCIDA

Explcitamente el modelo transformado es:

Yi * 0 X 0*i 1X1i* k Xki* ui *


donde:

Yi
Yi h ,
Xmi
*

X ji

ui
X ji h , ui h
Xmi
X mi
*

ESTIMACIN BAJO
HETEROCEDASTICIDAD
MTODO DE ESTIMACIN
V DESCONOCIDA

2. Se puede hacer la regresin propuesta por White:


u2 Y Y2 v
i

1 i

2 i

y calcular los valores estimados para la matriz de varianzascovarianzas como


i2 0 1Yi 2Yi 2
para los coeficientes significativos en la regresin anterior.
y se pueden obtener los estimadores MCGF.
As tenemos

ESTIMACIN BAJO
HETEROCEDASTICIDAD
MTODO DE ESTIMACIN
V DESCONOCIDA

es que obtengamos
Un problema que puede surgir al estimar
algn valor negativo. Esto se puede evitar utilizando una
regresin de la forma:
ln ui 2 0 1Yi 2Yi 2 vi
y calcular los valores estimados para la matriz de varianzascovarianzas como

i2 exp 0 1Yi 2Yi 2

ESTIMACIN BAJO
HETEROCEDASTICIDAD
MTODO DE ESTIMACIN
V DESCONOCIDA

3. Por ltimo, una nueva especificacin del modelo puede reducir


la heterocedasticidad. Por ejemplo, si efectuamos la regresin
en forma logartmica o bien si incluimos una nueva variable
explicativa.

ESTIMACIN BAJO
HETEROCEDASTICIDAD
EJEMPLO
Continuando con el ejemplo anterior, como no conocemos la
matriz de varianzas y covarianzas, vamos a utilizar el esquema
proporcionado por el contraste de Glesjer.

ESTIMACIN BAJO
HETEROCEDASTICIDAD
EJEMPLO

ESTIMACIN BAJO
HETEROCEDASTICIDAD
EJEMPLO

ESTIMACIN BAJO
HETEROCEDASTICIDAD
EJEMPLO

ESTIMACIN BAJO
HETEROCEDASTICIDAD
EJEMPLO

TEMA 6:
HETEROCEDASTICIDAD
MARIOLA ESTUDILLO MARTNEZ
DPTO. ESTADSTICA E INVESTIGACIN OPERATIVA
(BASADO EN LOS APUNTES DE ANTONIO CONDE SNCHEZ)

También podría gustarte