Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Auto Corre L
Auto Corre L
DE LA AUTOCORRELACIN: Introduccin al
concepto de no estacionariedad y regresin espuria
Ramn Maha
Marzo 2006
El objetivo de este documento es de ilustrar en un contexto prctico las ideas expuestas
en clase en torno a la cuestin de la deteccin y correccin del problema de la
autocorrelacin. Por otro lado, el documento sirve tambin para profundizar en algunos
de los conceptos tericos ms relevantes en torno a esta cuestin y para introducir, an
de forma bsica, una cuestin de extrema importancia en la prctica de la modelizacin
economtrica: la presencia de no estacionariedad en las series de datos.
Std. Error
t-Statistic
2537.860 -22.39049
0.166913 -0.897365
0.100670
12.56854
3.582319
8.599948
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
Prob.
0.0000
0.3722
0.0000
0.0000
21327.70
12136.72
17.64190
17.75605
1597.883
0.000000
1/11
A la vista de esta falta de sintona evidente, cabe sospechar que estamos ante un error de
especificacin. Efectivamente, y aunque se ver con detalle ms adelante, un simple
vistazo al valor del DW indica una fuerte autocorrelacin positiva que, seguramente,
viene causada por una indebida especificacin en niveles.
Resulta muy probable que la ecuacin exhiba, as mismo, problemas de
multicolinealidad, heterocedasticidad u otros incumplimientos bsicos pero, por el
momento, nos concentraremos en utilizar este ejemplo con el fin de ilustrar el problema
de la autocorrelacin.
4000
10000
2000
0
-2000
-4000
82
84
86
88
Residual
90
92
94
Actual
2/11
96
98
00
Fitted
02
DW 2 (1 ) 1
Ec. (1)
DW
0,85
2
Prob.
0.0000
-14.75610
1577.299
16.27624
16.30497
2.120850
Se deja al alumno, como ejercicio voluntario, la realizacin del contraste de Wallis, dada la naturaleza
trimestral de los datos utilizados.
2
Aunque en las sesiones tericas de clase se han establecido los lmites inferior y superior del estadstico
DW en 0 y 4 respectivamente, debe observarse que, en realidad, estos lmites son slo vlidos cuando se
dispone de una muestra suficientemente grande. As, por ejemplo, si slo dispusiramos de 5 datos, el
lmite inferior se situara en 0.382 y el lmite superior en 3,62.
3/11
Si bien Granger y Newbold (1974) no explicitaron estadsticamente las razones que explicaban el fallo
de los procedimiento habituales, esto puede encontrarse con detalle en Phillips (1986).
4/11
terico, debe saberse que los supuestos clsicos en los que se apoya la regresin como
estrategia analtica exigen la estacionariedad en media y varianza de las series
implicadas en un ejercicio de este tipo. Si bien la presencia de tendencias deterministas
en las variables (variables no estacionarias en media o variables estacionarias alrededor
de una tendencia4) resulta generalmente un problema fcil de afrontar y resolver en la
modelizacin con variables en niveles5, la presencia de races unitarias en las variables
(no estacionariedad en varianza) impide su utilizacin en niveles. Si se realiza una
estimacin en niveles de una ecuacin de regresin entre dos variables No Estacionarias
(tambin se denominan integradas) corremos un alto riesgo de encontrarnos ante una
regresin espuria; La forma ms clara de ilustrar el problema es utilizar los resultados
del ejemplo expuesto por Newbold y Davies (1978) y Granger y Newbold (1986) y
reutilizado despus en numerosos textos como Charemza y Deadman (1992).
Supongamos dos variables yt y xt independientemente generadas por paseos aleatorios:
y t y t 1 1t
x t x t 1 2 t
Suele denominarse a estas variables trend stationary TS a diferencia de aquellas que son NO
estacionarias en varianza que suelen denominarse con el acrnimo DS difference stationary.
5
Las regresiones espurias, no obstante, no slo se producen por la aparicin de tendencias estocsticas
en las series: las tendencias deterministas tambin pueden ser un problema. Si hacemos depender una
serie yt lineal (1,2,3,4..... 50) de otra xt con tendencia cuadrtica (1,4,.......502) el resultado en trminos de
R2 es de 0,94 cuando en realidad queda claro que el patrn de evolucin de la serie cuadrtica acabar
por divergir de forma definitiva cuando el nmero de datos tienda a infinito. Para ajustar
adecuadamente una regresin al caso de variables con tendencias deterministas basta con incorporar
una variable de tiempo t que recoja la tendencia comn de ambas series o bien filtrar de tendencia
los datos antes de su utilizacin en la regresin.
6
Estos datos se refieren a la prueba efectuada por Charemza y Deadman (1992). En el experimento
original de Granger y Newbold (1974) el porcentaje de regresiones con parmetro significativo al 5% fue
del 75%.
5/11
i 0
i 0
et 1i a1 2i
Por tanto, es obvio que estamos ante una secuencia e t no estacionaria en varianza. Si
esto es as, et presenta una tendencia estocstica, lo que quiere decir que el error
cometido en t no se diluye en t+1, t+2... t+s ;es imposible que una regresin en la que
los errores se acumulan de forma permanente pueda tener algn inters.
Ntese que en esta situacin se violan un buen nmero de hiptesis bsicas asumidas en
los procesos de inferencia habituales en el contexto del Modelo Bsico de Regresin
Lineal:
-
plim
x
i 1
2
i
n cte
El tratamiento clsico de la estacionariedad propuesto por Box Jenkins (1970) en el contexto del
anlisis multivariante, implica la diferenciacin de las series a fin de evitar las regresiones espurias
provocadas por la existencia de tendencias estocsticas. La diferenciacin de las series temporales, sin
embargo, supone una renuncia explcita a considerar sus relaciones a largo plazo, ya que estas
manifiestan necesariamente en sus niveles tal y como pusieron de manifiesto, entre otros, Sargan (1964),
Hendry y Mizon (1978) y Davidson et al (1978) . En este contexto, y aunque los modelos de correccin de
error propuestos por Sargan (1964) fueron siempre una alternativa muy valiosa para combinar el corto y
el largo plazo en el anlisis dinmico de series, la formalizacin del concepto de cointegracin por parte
de Engle y Granger (1987) fue decisiva. La posibilidad de combinar niveles de series integradas de
forma tal que esa combinacin resultase estacionaria, se ha convertido en una de las aportaciones
conceptuales ms interesantes y en las que se ha apoyado de forma incuestionable el avance reciente de
la econometra moderna.
6/11
introductorio como este pero, en cualquier caso, debe recordarse siquiera el trmino
cointegracin como una aportacin interesante. La trascendencia de esta definicin es
inmediata. Si dos series no estacionarias estn cointegradas, esto significar que entre
ambas existe un vnculo estable y compatible con las tendencias individuales de cada
una de ellas, o sea, una relacin de equilibrio a largo plazo. A esa ligazn, representada
por el denominado vector de cointegracin, no le afectan ms que de forma temporal
los shocks que inciden en cada una de las series de forma permanente y, por tanto, cabe
pensar en la idea de un equilibrio estacionario en el que las desviaciones sean
exclusivamente temporales.
Algunos autores distinguen esta situacin de aquella en la que la autocorrelacin no viene provocada
por una deficiente especificacin. Gujarati, por ejemplo, define esta situacin como Autocorrelacin
Pura.
9
Existen varios contrastes muy utilizados para detectar la No Estacionariedad en varianza de las series.
Los ms sencillos y populares son los contrates DF y ADF (Dickey-Fuller y Augmented Dickey-Fuller),
el contraste PP (Phillips Perron), ambos incluidos desde hace tiempo en el software E-Views.
10
7/11
Prob.
0.0000
0.0000
0.7737
0.6936
434.3882
541.4910
15.11643
15.23138
12.97361
0.000001
Prob.
0.0000
0.0000
0.2822
0.4148
0.021866
0.027025
-4.718590
-4.603641
13.96121
0.000000
La utilizacin de tasas interanuales tambin sera posible en este caso al tratarse de variables
trimestrales. Sin embargo, salvo que se compruebe la existencia de races unitarias (no estacionariedad)
estacionales, esta tasa no resolvera el problema de la no estacionariedad en la componente regular (no
estacional).
8/11
Prob.
0.0223
0.0909
0.0262
0.0054
0.0000
21493.54
12110.32
15.31549
15.45918
12406.11
0.000000
Efectivamente, aunque el valor del nuevo DW parece ahora aceptable, debe recordarse
que, en realidad, en presencia de autocorrelacin, se propone utilizar el estadstico h
de Durbin en lugar del estadstico DW original.
h
n
1 n 2 (b1 )
n
85
0.283
2.798
2
1 n (b1 )
1 85 (0.039181) 2
El valor de este estadstico se contraste suponiendo una distribucin normal (0,1), as,
con un nivel de significacin del 5%, el valor a superar es 1,645. Si el estadstico
calculado supera este valor, debe rechazarse la hiptesis de autocorrelacin nula; en
nuestro caso, el valor 2.798 supera ampliamente el valor crtico por lo que,
evidentemente, la h de Durban refleja la existencia de autocorrelacin por mucho que
el valor del DW haya mejorado artificialmente.
9/11
Std. Error
t-Statistic
2599.656 -6.129892
0.085707 -12.81990
0.225190
19.74694
12.79506
1.093865
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
Prob.
0.0000
0.0000
0.0000
0.2773
21493.54
12110.32
17.97895
18.09390
1115.159
0.000000
j1
1 2
En realidad, dado que el clculo directo del rho implica cierta probabilidad de error,
suele ser conveniente utilizar el procedimiento de clculo iterativo de conocido como
Cochrane Orcutt descrito en clase. Esto implicara un proceso sucesivo de re-clculo
de rho a partir de los nuevos resultados del DW obtenidos en esta regresin, y una
nueva transformacin de las variables previamente transformadas ES decir, en
nuestro ejemplo, el nuevo valor del DW es ahora 1.97 lo que implica un valor del de
0.015; podra utilizarse ese nuevo valor para transformar de nuevo las variables y
reestimar nuevamente la ecuacin.12
En todo caso, no merece la pena insistir en un procedimiento de correccin que se ha
ilustrado convenientemente con este ejemplo.
12
Este procedimiento iterativo finaliza cuando entre dos estimaciones sucesivas de rho no existe una
diferencia significativa o bien cuando no existe un cambio notable en los parmetros de las exgenas de
la regresin.
10/11
11/11