Está en la página 1de 8

TEMA 8: HETEROSCEDASTICIDAD

8.1 Naturaleza del problema


8.2 Causas y consecuencias
8.3 Formas de detectas el problema

Objetivos del Tema 8:


• Saber explicar en qué consiste la heteroscedasticidad
• Propiedades de los estimadores bajo el problema de la heteroscedasticidad
• Contrastes de heteroscedasticidad
• Estimadores óptimos
• Estimación de la matriz de varianzas-covarianzas consistente
8.1 Naturaleza del problema

La heteroscedasticidad es un problema que es más probable que aparezca con datos de


corte transversal.

Bajo la hipótesis de homoscedasticidad (suponiendo no autocorrelación), la matriz de


varianzas-covarianzas de las perturbaciones es:

σ 2 0 L 0 
 
 0 σ2 L 0 

E (uu ) = = σ 2I
 M M O M 
 
 0 0 L σ 2 

La variabilidad o volatilidad es la misma para todos los individuos. En este caso, en el


MRL se deben estimar k+1 parámetros: k coeficientes más la varianza de las
perturbaciones ( σ 2 ).

Bajo la hipótesis de heteroscedasticidad (suponiendo no autocorrelación), la matriz de


varianzas-covarianzas de las perturbaciones es:

σ 2 0 L 0 
 1 
0 σ 22 L 0 
E (uu ′) =  = σ 2Ω
 M M O M 
 
 0 0 L σ T2 

La varianza es distinta para cada individuo. En este caso tendremos que estimar k+T
parámetros; k coeficientes más las T varianzas de las perturbaciones. Dado que el
tamaño muestral es T, se tiene que el número de parámetros a estimar es mayor que el
número de observaciones disponibles. No es posible estimar y en ese caso es necesario
suponer que la heteroscedasticidad sigue un determinado esquema de comportamiento.

Por ejemplo, σ i2 = λX ji . En este caso el número de parámetros a estimar sería de


nuevo k+1.

8.2. Causas y consecuencias

La causa fundamental de que exista heteroscedasticidad es “simplemente” que los


individuos son heterogéneos.

Por ejemplo, si analizamos la investigación en las empresas: las empresas pequeñas


tiene pocas posibilidades de invertir cantidades elevadas en I+D y las oscilaciones del
gasto entre ellas es poco relevante. Sin embargo, las empresas grandes pueden invertir

2
gran cantidad de sus ingresos en I+D o no invertir nada por lo que habrá una elevada
volatilidad.

Otro ejemplo sería la demanda de un bien de lujo entre distintos consumidores que
difieren en el nivel de renta. Cabe esperar que conforme aumente la renta de los
consumidores aumenta la variabilidad del comportamiento de los consumidores.

Consecuencias:

Bajo las h.e.b: var(βˆ ) = σ 2 ( X ′X ) −1

Con heteroscedasticidad: var(βˆ ) = σ 2 ( X ′X ) −1 X ′ΩX ( X ′X )−1

El estimador de MCO no es óptimo. Hay un método mejor para estimar los parámetros
del modelo: MCG

Los intervalos de confianza y contrastes que se construyan utilizando la expresión


var(βˆ ) = σ 2 ( X ′X ) −1 no serán válidos.

8.3. Formas de detectar el problema

Como una primera aproximación puede analizarse el gráfico de los residuos mínimo-
cuadráticos en función de la variable endógena estimada o en función de la variable
explicativa que supuestamente genera la heteroscedasticidad.

A continuación se recoge el gráfico de dispersión de los residuos en valor absoluto del


modelo: valacct = β1 + β 2 valcont + u t (Uriel et al. Pág. 93) y VALCON.

3
El siguiente gráfico es el gráfico de dispersión de los residuos en valor absoluto del
modelo: Lvalacct = β1 + β 2 Lvalcont + u t (Uriel et al. Pág. 123) y LVALCON

Contraste de Goldfeld y Quandt:

Se ha estimado un modelo y se sospecha que puede haber heteroscedasticidad:

Yi = β1 + β 2 X 2i + β 3 X 3i + L + β k X ki + u i

H0: σ i2 = σ 2 ∀i
H1: σ i2 = f ( X ji )

Las etapas a seguir en la aplicación del contraste son:

1) Se ordenan las observaciones de acuerdo con los valores crecientes de la variable


explicativa Xj a la que presumiblemente está ligada la heteroscedasticidad (por ejemplo
X2).
2) Se omiten observaciones centrales (entre 1/5 y 1/3 de la muestra), separando las
observaciones en dos grupos: las observaciones con valores bajos de Xj (T1)y las
observaciones con altos valores de Xj (T2). Los grupos tienen que tener
aproximadamente el mismo tamaño.
3) Se estima el modelo por separado para las observaciones del grupo I y para las
observaciones del grupo II.
4) Se calcula el estadístico:

4
SCR2 /(T2 − k ) uˆ 2′ uˆ 2 /(T2 − k )
GC = =
SCR1 /(T1 − k ) uˆ1′ uˆ1 /(T1 − k )

el cual se distribuye como una F con T2-k grados de libertad en el numerador y T1-k
grados de libertad en el denominador.

Cuanto más elevado sea el valor del estadístico GQ, es mas probable que se rechace la
hipótesis nula, lo que indicaría que tenemos un problema de heteroscedasticidad. Si no
se rechaza la hipótesis nula quiere decir que “no existe evidencia para aceptar el
esquema concreto de heteroscedasticidad planteado”. NO quiere decir que el modelo sea
homocedástico.

Contraste de White

Se ha estimado un modelo y se sospecha que puede haber heterocedasticidad:

Yi = β1 + β 2 X 2i + β 3 X 3i + u i

H0: σ i2 = σ 2 ∀i
H1: σ i2 = f ( X 2i , X 3i )

Los pasos que se requieren en este contraste son los siguientes:

1) Se efectúa una regresión auxiliar. En esta regresión auxiliar el regresando serán los
residuos al cuadrado del modelo original, y los regresores serán los regresores del
modelo original, los regresores del modelo original al cuadrado y ópcionalmente los
productos cruzados de los regresores del modelo original. O sea, en nuestro ejemplo:

u t2 = α1 + α 2 X 2i + α 3 X 3i + α 4 X 22i + α 5 X 32i + α 6 X 2i X 3i + η i

En la regresión auxiliar siempre debe haber término independiente y hay que eliminar
las redundancias.
2
2) Designando por R RA al coeficiente de determinanción de la regresión auxiliar se
calcula el siguiente estadístico:

2
TR RA

Bajo la hipótesis nula de homoscedasticidad este estadístico se distribuye


asintoticamente como una chi-cuadrado con m grados de libertad, siendo m el numero
de regresores en la regresión auxiliar excluyendo el término independiente (número de
regresores menos 1).

5
Ejemplo:

Con una muestra de 74 escuelas se ha obtenido la siguiente estimación:

∧ ∧ ∧
C i = 51,3 − 4, 6 Pi + 151,9 N i + 284,1Pi xN i ; u' u = 24, 2; R 2 = 0, 68

donde C es el coste, P es una variable ficticia que toma el valor 1 si la escuela es pública
y 0 si es privada y N es el número de alumnos/as.

Posteriormente, se realiza una regresión con las 25 escuelas de menor tamaño de


alumnado obteniendo una SCR de 7,2 y otra regresión con la muestra de las 27 escuelas
de mayor tamaño obteniendo una SCR de 6,9.

a) Explique brevemente el posible problema de heteroscedasticidad en este modelo.


b) Contrastar la existencia de heteroscedasticidad, explicando el procedimiento
detalladamente.
c) ¿Qué limitaciones tiene el contraste aplicado?. Razone la respuesta.
d) Proponga un procedimiento de contraste de heteroscedasticidad alternativo,
explicando las ventajas en este caso.

8.4 Tratamiento de la heteroscedasticidad

¿Qué hacemos si hemos estimado un modelo por MCO y los contrastes de


heteroscedasticidad (White y GQ) nos indican que hay problemas de
heteroscedásticidad? Recordad que si existe heteroscedasticidad, los estimadores
mínimo-cuadráticos son no óptimos y la inferencia no es válida.

Hay dos posibles formas de actuar:

1. Estimar el modelo por MCG (o de forma equivalente transformar el modelo y


estimar el “modelo transformado” por MCO). Para ello es necesario conocer o
estimar la varianza de las perturbaciones. En este caso obtenemos estimadores
óptimos y la inferencia es válida.
2. Si aún existiendo heteroscedasticidad, se continúa estimando los parámetros por
MCO, al menos tendremos que corregir la matriz de varianzas-covarianzas de
los estimadores MCO. Es decir, tendremos que obtener una matriz de
varianzas-covarianzas de los estimadores consistente. En este caso la
inferencia es válida pero los estimadores mínimo-cuadráticos no son óptimos.

Con heteroscedasticidad: var(βˆ ) = σ 2 ( X ′X ) −1 X ′ΩX ( X ′X )−1 . Una estimación consistente


de esta matriz propuesta por White es:

T
vâr( βˆ ) = ( X ′X ) −1 Σˆ ( X ′X )−1 siendo Σˆ = ∑ uˆ i2 xi xi′ , donde xi es un vector columna
i =1
correspondiente a la i-ésima observación.

6
Ejemplo:
(Examen 6/2/2007)

Con una muestra de 100 individuos se ha estimado la siguiente función de demanda del
bien Y:

LYi = β 1 + β 2 LI i + β 3 NE i + β 4 SEX i + β 5 SINGLE i + β 6 HIJOi + β 7 E i I + β 8URBi + u t

donde: LY= Logaritmo del gasto anual en el bien Y


LI= Logaritmo del ingreso anual
NE= Nivel de estudios medido por el número de años dedicados a la formación
SEX= Variable dicotómica que toma valor 1 si el individuo es un hombre y 0 si
es una mujer
SINGLE= Variable dicotómica que toma valor 1 si el individuo tiene pareja y 0
si no la tiene
HIJO= número de hijos
E= Edad en años
URB= variable dicotómica que toma valor 1 si el individuos viene en un núcleo
urbano y 0 si vive en un núcleo rural

A la vista de los resultados proporcionados en los Cuadros:

a) Explique y contraste la heteroscedasticidad en este modelo.


b) Explique la razón por la que cree que el modelo ha sido estimado con una matriz
consistente con heteroscedasticidad y qué consecuencias se derivan de ello.

Cuadro 1

7
Cuadro 2. Contraste de White

También podría gustarte