Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Heteroscedasticidad PDF
Heteroscedasticidad PDF
HETEROSCEDASTICIDAD
Autores:
ESQUEMA DE CONTENIDOS
________________________
Problemtica:
1. Matriz Var[U]
2. Estimadores MCO
Causas de la Heterosc.
Heteroscedasticidad
Clculo estimadores
MCG con Minitab
Deteccin de Heteroscedast.
con Minitab
Contraste de Hiptesis
Mtodos grficos
Test de Breusch-Pagan
Test de Golfeld-Quandt
INTRODUCCIN
___________________
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Heteroscedasticidad
OBJETIVOS
________________________
Saber obtener los estimadores MCG (en el caso de heteroscedasticidad) con ayuda de
Minitab.
CONOCIMIENTOS PREVIOS
___________________________________
Aparte de estar iniciado en el uso del paquete estadstico Minitab, resulta muy conveniente haber
ledo con profundidad los siguientes math-blocks:
Introduccin al MRLG
CONCEPTOS FUNDAMENTALES
______________________________
El problema de la Heteroscedasticidad
Como se coment en el math-block Introduccin al MRLG, cuando se utiliza el modelo de
regresin lineal mltiple (donde usamos la notacin X1 = 1 para la variable que acompaa al
trmino independiente):
Y = 1 + 2 X 2 + ... + k X k + u
resulta habitual suponer que el trmino de perturbacin presenta varianza constante
(hiptesis de homoscedasticidad), i.e.:
[ ]
Var [u i ] = Var u j = 2
i j
Var[U ] =
...
...
...
... 2
...
...
...
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Heteroscedasticidad
Cuando no se cumpla la hiptesis de varianza constante para el trmino de perturbacin,
diremos que el modelo presenta problemas de heteroscedasticidad. En tal caso, no todos
los trminos de la diagonal principal de la matriz de varianzas y covarianzas sern iguales.
En presencia de heteroscedasticidad, y suponiendo que s se cumple la hiptesis de No
Autocorrelacin (i.e.: que los trminos fuera de la diagonal principal son ceros), la matriz de
varianzas y covarianzas ser de la forma:
1 2
0
Var[U ] =
...
0
donde
0
2
2
...
0
1 2
... 0
... 0
2 0
=
...
... ...
2
... n
0
0
2
2
...
0
... 0
... 0
= 2 n
... ...
2
... n
u2 , ser sesgado.
B MCG = X 1 X
) (X
1
-1
Por tanto, resulta imprescindible conocer la matriz (la inversa, salvo factor escalar, de la
-1
matriz de varianzas y covarianzas) o, alternativamente, la matriz T = P tal que
= P P (recordemos que otra opcin alternativa para hallar los estimadores MCG es
aplicar MCO sobre el modelo transformado mediante T).
-1
Var [u i ] = i = 2 f (i )
2
(donde f es una funcin que slo depende de la variable i), entonces las matrices T y
sern de la forma:
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
-1
Heteroscedasticidad
1
f (1)
0
T =
...
0
0
1
f (2)
...
0
...
...
...
...
...
1
f (n)
0
1
f (1)
0
=
...
...
1
f ( n)
...
1
...
f (2)
...
...
0
...
En el math-block introduccin al MRLG ya vimos cmo era posible usar Excel para hallar
los estimadores MCG mediante operaciones con matrices. En el caso de
heteroscedasticidad, sin embargo, Minitab nos facilita bastante la obtencin de los
estimadores MCG. Para ello, tan slo ser necesario introducir en el programa una columna
-1
de pesos compuesta por los elementos que configuran la diagonal principal de la matriz .
Vemoslo con un ejemplo:
Ejemplo: Supongamos que pretendemos explicar el consumo familiar (C) en funcin del nivel
de renta (R) mediante el modelo siguiente:
C = 1 + 2 R + u
Para ello disponemos de las siguientes observaciones:
Regression Analysis
The regression equation is
C = 6,2 + 1,10 R
Var[u i ] = 2 Ri
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Heteroscedasticidad
Finalmente, realizaremos la regresin por MCG. Para ello, deberemos indicar -en el men de
opciones de regresin- la columna que contiene los pesos a usar:
Obtendremos el siguiente output, en el cual se muestran los estimadores MCG para los
coeficientes del modelo (observar que difieren bastante de los estimadores MCO que
habamos obtenido anteriormente):
Regression Analysis
Weighted analysis using weights in PESOS
The regression equation is
C = 2,72 + 1,26 R
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Heteroscedasticidad
Causas de la Heteroscedasticidad
S = 1 + 2 Y + u
Es de esperar que la varianza en S (y, por tanto, en el trmino de perturbacin)
dependa del nivel de ingresos Y: en aquellos casos de familias con bajos ingresos, los
niveles de ahorro sern bastante similares (puesto que una gran proporcin de los
ingresos estarn destinados a cubrir las necesidades bsicas). Sin embargo, en el caso
de familias con ingresos elevados, encontraremos mucha ms variedad (desde familias
que dedican gran parte de sus ingresos al ahorro, hasta familias que dedican al
consumo inmediato la prctica totalidad de lo que ingresan):
S
Causas muestrales: en muchas ocasiones, no ser posible disponer de todos los datos
que componen una muestra, sino que slo se tendr acceso a valores medios o a
valores agregados correspondientes a submuestras de la muestra total. As, p.e., si
estuviramos interesados en realizar un estudio sobre el uso que de Internet hacen las
familias espaolas, podra ocurrir que no dispusisemos de la informacin para cada
una de las familias que componen la muestra total y que nos tuvisemos que conformar
con los valores medios o agregados por provincias.
Pues bien, el trabajo con submuestras de diferentes tamaos propiciar la aparicin de
heteroscedasticidad en el modelo. Ms concretamente, se puede demostrar que:
[ ] = n1
En el caso de usar submuestras de valores agregados, Var [u ] = n
Var u i
2.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Heteroscedasticidad
DESCRIPCIN
Precio (en euros) del producto A
VARIABLE
DESCRIPCIN
X2
Ln(PA)
PB
X3
Ln(PB)
PC
X4
Ln(PC)
YD
X5
Ln(YD)
QA
Ln(QA)
A fin de comprender cmo vara la demanda del producto A en funcin de los precios
asociados a cada uno de los tres productos y de los ingresos disponibles, usaremos el
siguiente modelo lineal:
Y = 1 + 2 X 2 + 3 X 3 + 4 X 4 + 5 X 5 + u
Emplearemos Minitab para realizar la estimacin por MCO y el anlisis grfico de los residuos
estandarizados a fin de determinar si existe o no heteroscedasticidad en el modelo (le
pediremos al programa que nos muestre un grfico de los residuos estandarizados frente a
los valores estimados de la variable dependiente, as como un grfico de los residuos
estandarizados frente a cada una de las variables explicativas):
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Heteroscedasticidad
Stat > Regression > Regression:
Al analizar algunos de los grficos resultantes, podemos observar indicios claros de que la
hiptesis de homoscedasticidad no se cumple. As, p.e., en el grfico siguiente se aprecia
claramente cmo la varianza de los residuos va aumentando conforme mayor es el valor de la
variable explicativa X5:
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Heteroscedasticidad
Test de Golfeld-Quandt: este test se suele utilizar cuando se sospecha que la varianza
del trmino de perturbacin es directa o inversamente proporcional al valor de una de las
variables explicativas, i.e.: cuando pensemos que el modelo:
Y = 1 + 2 X 2 + ... + k X k + u
verifica una de las siguientes cuatro relaciones:
Proporcin directa:
Var [u ] = X j
Var [u ] = X j
Proporcin inversa:
Var [u ] =
1
Xj
Var [u ] =
1
Xj
GQ =
ErrorSS 3
nc
nc
(bajo Ho) F
k,
k
2
ErrorSS1
2
Una vez calculado el estadstico GQ, y para un nivel de significacin dado, usaremos la
siguiente regla de decisin:
Rechazamos Ho (i.e.: existe heterosced.) si
nc
nc
GQ > F
k,
k ;
2
2
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Heteroscedasticidad
Ejemplo: Continuando con el ejemplo anterior, el grfico de los residuos no slo pareca
indicar la presencia de heteroscedasticidad en el modelo, sino que adems apuntaba la
idea de que la varianza del trmino de perturbacin era directamente proporcional al valor
de la variable X5 (a mayor valor de la variable X5, mayor varianza se observaba en el
valor de los residuos). Aplicaremos ahora el test de Golfeld-Quandt para contrastar
empricamente la existencia de heteroscedasticidad:
En primer lugar, ordenaremos de menor a mayor segn los valores de la variable X5- las
observaciones de las variables X2, X3, X4, X5 e Y, guardando los datos resultantes en
las nuevas variables SX2, SX3, SX4, SX5 e SY:
Manip > Sort:
Tras realizar la operacin anloga para obtener las nuevas variables que configuran el
tercer grupo (usando las filas 20 a 30) obtendremos las siguientes columnas de datos:
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
10
Heteroscedasticidad
El nuevo paso es realizar la regresin por MCO para cada uno de los grupos, a fin de
obtener el correspondiente Error SS. En el caso del primer grupo, obtenemos el siguiente
output, con un valor de Error SS1 = 0,02891:
Regression Analysis
The regression equation is
1SY = 4,96 - 1,96 1SX2 + 1,59 1SX3 - 1,35 1SX4 + 1,62 1SX5
Analysis of Variance
Source
Regression
Residual Error
Total
DF
4
6
10
SS
0,43741
0,02891
0,46632
MS
0,10935
0,00482
F
22,70
P
0,001
Al realizar la regresin por MCO sobre el tercero de los grupos, obtendremos un Error
SS3 = 0,20030.
As pues, el estadstico GQ = Error SS3 / Error SS1 = 6,93.
Por otra parte, para un nivel de significacin = 0,05, el estadstico F con (n-c)/2 = 11
grados de libertad en numerador y denominador es:
Inverse Cumulative Distribution Function
F distribution with 11 DF in numerator and 11 DF in denominator
P( X <= x)
0,9500
x
2,8179
Dado que GQ = 6,93 > F(11,11;0,05) = 2,82 se sigue que hay indicios suficientes como
para rechazar la hiptesis nula, i.e.: el test confirma la sospecha de que el modelo
presenta heteroscedasticidad, y que la variable X5 (que era el logaritmo neperiano de la
variable ingresos disponibles) tiene mucho que ver en ello.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
11
Heteroscedasticidad
Var [u ] = 0 + 1 Z 1 + 2 Z 2 + ... + p Z p
Los pasos a seguir para obtener el estadstico BP, el cual seguir -bajo la hiptesis nula2
una distribucin con p grados de libertad, son:
1. Estimar
por
MCO
el
modelo
original
Y = 1 + 2 X 2 + ... + k X k + u ,
ErrorSS
~ 2 =
n
4. Definir el estadstico
BP =
e2
= 0 + 1 Z 1 + 2 Z 2 + ... + p Z p + v
~ 2
RegressionSS
(bajo Ho) 2p
2
Una vez calculado el estadstico BP, y para un nivel de significacin dado, usaremos la
siguiente regla de decisin:
Rechazamos Ho (i.e.: existe heterosced.) si
BP > 2p ,
Analysis of Variance
Source
Regression
Residual Error
Total
DF
4
25
29
SS
1,71925
0,34139
2,06063
MS
0,42981
0,01366
F
31,48
P
0,000
ErrorSS
~ 2 =
= 0,34139 / 30 = 0,01138.
n
e2
:
~ 2
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
12
Heteroscedasticidad
Calc > Calculator:
Lo siguiente ser realizar la regresin por MCO de esta nueva variable respecto a la
variable X5:
Regression Analysis
The regression equation is
Y2 = - 8,20 + 2,00 X5
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
28
29
SS
9,011
101,259
110,270
MS
9,011
3,616
F
2,49
P
0,126
x
3,8415
Se puede concluir pues que s hay indicios que nos llevan a rechazar la hiptesis nula de
homoscedasticidad, ya que BP = 4,51 > 3,84.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
13
Heteroscedasticidad
Coef
1480,0
0,78848
S = 422,3
StDev
449,6
0,02685
R-Sq = 96,9%
T
3,29
29,37
P
0,003
0,000
R-Sq(adj) = 96,7%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
28
29
SS
153872818
4994182
158867000
MS
153872818
178364
F
862,69
P
0,000
Sin embargo, el siguiente grfico de los residuos frente a la variable explicativa parece indicar
la existencia de heteroscedasticidad en el modelo:
Para salir de dudas, decidimos realizar -con ayuda de Minitab- el test de Golfeld-Quandt,
eliminando un total de c = 6 observaciones centrales. Tras ordenar los datos y crear los tres
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
14
Heteroscedasticidad
grupos de observaciones (de forma anloga a como se ha explicado anteriormente),
obtenemos los siguientes outputs de regresin MCO para los grupos primero y tercero:
Regression Analysis
The regression equation is
1SC = 847 + 0,837 1SI
Predictor
Constant
1SI
Coef
847
0,83667
S = 327,0
StDev
1144
0,08442
R-Sq = 90,8%
T
0,74
9,91
P
0,476
0,000
R-Sq(adj) = 89,8%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
10
11
SS
10500167
1069000
11569167
MS
10500167
106900
F
98,22
P
0,000
Regression Analysis
The regression equation is
3SC = 2307 + 0,747 3SI
Predictor
Constant
3SI
S = 578,3
Coef
2307
0,7467
StDev
2916
0,1493
R-Sq = 71,4%
T
0,79
5,00
P
0,447
0,001
R-Sq(adj) = 68,6%
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
10
11
SS
8362667
3344000
11706667
MS
8362667
334400
F
25,01
P
0,001
As pues, Error SS1 = 1.069.000 y Error SS3 = 3.344.000, de lo cual se sigue que el
estadstico GQ = Error SS3 / Error SS1 = 3.13.
Dado que n = 30, c = 6, y k = 2, bajo la hiptesis Ho (homoscedasticidad), el estadstico GQ
se distribuir segn una F de Snedecor con (30-6)/2 2 = 10 grados de libertad en el
numerador y los mismos grados de libertad en el denominador.
Por su parte, para un nivel de significacin = 0,05, tenemos que el valor crtico ser
F(10,10;0,05), el cual podemos hallar con ayuda de Minitab:
x
2,9782
Como GQ = 3,13 > 2,98 rechazaremos la hiptesis nula, i.e.: hay indicios claros de
heteroscedasticidad en el modelo.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
15
Heteroscedasticidad
Var [u i ] = 2 I i
Regression Analysis
Weighted analysis using weights in PESOS
The regression equation is
C = 1421 + 0,792 I
Predictor
Constant
I
S = 0,02447
Coef
1421,3
0,79210
StDev
395,5
0,02514
R-Sq = 97,3%
T
3,59
31,51
P
0,001
0,000
R-Sq(adj) = 97,2%
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
16
Heteroscedasticidad
BIBLIOGRAFA
______________________________________________
[1]
Arts, M.; Suriach, J.; et al (2002): Econometra. Ed. Fundaci per a la Universitat Oberta de
Catalunya. Barcelona.
[2]
Carter, R.; Griffiths, W.; Judge, G. (2000): Using Excel for Undergraduate Econometrics.
ISBN: 0-471-41237-6
[3]
Doran, H. (1989): Applied Regression Analysis in Econometrics. Ed. Marcel Dekker, Inc.
ISBN: 0-8247-8049-3
[4]
[5]
[6]
[7]
[8]
[9]
Uriel, E. (1990): Econometra: el modelo lineal. Ed. AC. Madrid. ISBN 84-7288-150-4
[10]
ENLACES
___________________________________
http://www.uam.es/departamentos/economicas/econapli/pdf/heterocedasticidad.pdf
Heterocedasticidad con E-Views
http://www.feweb.vu.nl/econometriclinks/index.html
The Econometrics Journal On-Line
http://www.elsevier.com/hes/books/02/menu02.htm
Libro on-line: Handbook of Econometrics Vols. 1-5
http://elsa.berkeley.edu/users/mcfadden/discrete.html
Libro on-line: Structural Analysis of Discrete Data and Econometric Applications
http://www.oswego.edu/~kane/econometrics/stud_resources.htm
Online Resources for Econometric Students
http://www.econ.uiuc.edu/~morillo/links.html
Econometric Sources: a collection of links in econometrics and computing. University of Illinois
http://www.econometrics.net/
Econometrics, Statistics, Mathematics, and Forecasting
http://ideas.uqam.ca/EDIRC/ectrix.html
Economics Departments, Institutes and Research Centers in the World: Econometrics,
Mathematical Economics.
Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
17