Está en la página 1de 15

CONCEPTOS BSICOS SOBRE LA AUTOCORRELACIN EN EL MODELO

BSICO DE REGRESIN LINEAL



Ramn Maha
Dpto. de Economa Aplicada
Universidad Autnoma de Madrid
ramon.mahia@uam.es

Marzo 2010

Referencias bsicas utilizadas para la elaboracin de este texto:

- Wooldridge, J.F. (2003). Introductory Econometrics. Captulo 12
- Econometra. D.N. Gujarati. Ed. McGraw Hill. Captulo 12.
- Anlisis Economtrico. W.H. Green.Captulo 13
- Dougherty, C. (1992). Introduction to Econometrics. Capitulo 12.

I.-Definicin: Autocorrelacin
1
en el marco de los modelos de series
temporales

En el caso de los modelos transversales, el carcter exgeno de los regresores garantizaba el
sesgo y/o la consistencia de los parmetros MCO en el marco del MBRL. As mismo, la
homocedasticidad de la perturbacin aleatoria era necesaria para asegurar el carcter
insesgado del estimador de la varianza de los parmetros. Ninguna de estas hiptesis se refera
especficamente a la autocorrelacin como causa de sesgo en la estimacin de los parmetros
o de sus desviaciones estndar.

En el marco de un modelo transversal, la relacin entre perturbaciones aleatorias
correspondientes a distintos individuos (particulares, empresas, sectores,.) es menos
probable
2
pero, sin embargo se vuelve ms verosmil en el caso de un modelo de series
temporales; la razn estriba en que las propias variables exgenas y la variable endgena
contienen reflejan en mayor o menor medida cierta persistencia temporal, lo que dificulta que
los errores cometidos en un perodo no conecten en alguna medida con los cometidos en
perodos previos.

La existencia de autocorrelacin se define, por tanto, como la existencia de correlacin entre
perturbaciones aletaorias correspondientes a perodos (u observaciones) distintas:

( ) j i 0 = = =
ij j i
U U Cov o


En un plano intuitivo, la autocorrelacin conecta con la idea de que los errores contienen
cierta persistencia y, por tanto, no se deben a factores puramente aleatorios, desconectados
los unos de los otros. As pues, cuando existe autocorrelacin, el error cometido en un
momento del tiempo est influido por el error de perodos previos.


1
El problema de la autocorrelacin se denomina tambin frecuentemente de correlacin serial.
2
Salvando el caso de la denominada autocorrelacin espacial, es decir, una correlacin existente las
perturbaciones de elementos prximos en el espacio, ms que en el tiempo.
Cuando existe autocorrelacin, y en un plano puramente analtico, la matriz de varianzas-
covarianzas de las perturbaciones de un modelo contiene ahora elementos no nulos fuera de
la diagonal principal:

Matriz de varianza y covarianzas Homocedstica e Incorrelacionada

n
n n n
I
u E u u E u u E
u E u u E
u E
UU E
2
2
2
2
2
2 1
2
2 1 2
2
1
... 0 0
0 ... 0 0
0 ... 0
0 ... 0
) ( ... ) ( ) (
...
... ) ( ) (
. ... ) (
) ' ( o
o
o
o
=
(
(
(
(
(

=
(
(
(
(
(

=



Matriz de varianza y covarianzas Heterocedstica pero Incorrelacionada

E = =
(
(
(
(
(

=
(
(
(
(
(

=
2 2
2
2
2
2
1
2
2 1
2
2 1 2
2
1
... 0 0
0 ... 0 0
0 ... 0
0 ... 0
) ( ... ) ( ) (
...
... ) ( ) (
. ... ) (
) ' ( o o
o
o
o
n i
n n n n
I
u E u u E u u E
u E u u E
u E
UU E


Matriz de varianza y covarianzas Heterocedstica y con Autocorrelacin

( ) ( )
( ) ( )
( ) ( ) ( )
( ) ( )
E = =
(
(
(
(
(

=
(
(
(
(
(

=
2 2
2
2 1
3 2 3 1 3
2
2
2 1 2
1 2 1
2
1
2
2 1
2
2 1 2
2
1
...
...
...
...
) ( ... ) ( ) (
...
... ) ( ) (
. ... ) (
) ' ( o o
o
o
o
n i
n n n
n
n
n
n n n
I
U U Cov U U Cov
U U Cov U U Cov U U Cov
U U Cov U U Cov
U U Cov U U Cov
u E u u E u u E
u E u u E
u E
UU E


II.- Consecuencias de la autocorrelacin en el MBRL estimado con MCO

En trminos generales los efectos de la presencia de autocorrelacin sobre el MBRL estimado
con Mnimos Cuadrados Ordinarios son extremadamente similares a los analizados para la
Heterocedasticidad:

- El estimador de Mnimos Cuadrados Ordinarios sigue siendo lineal, insesgado y
consistente. Como ya dijimos para el caso de la heterocedasticidad, debe recordarse
que la autocorrelacin de la perturbacin no juega ningn papel relevante en la
insesgadez o la consistencia.

- Sin embargo, y como primer efecto (defecto) las varianzas de los parmetros
estimados por Mnimos Cuadrados Ordinarios no pueden estimarse con la expresin
utilizada en presencia de autocorrelacin. Dicho de otro modo, la expresin
3
de la
varianza de los estimadores MCO es un estimador sesgado de la verdadera varianza

3
Recuerde que en su forma matricial esta expresin es
( )
1 2
' )

(

= X X V o |
o para un nico
parmetro
| |
( )( )
2
2
1

j j
u
j
R x V
V

=
o
|


de los parmetros. La naturaleza (tamao y signo) del sesgo en la estimacin de la
varianza depende de la forma especfica de autocorrelacin en la perturbacin pero,
generalmente
4
, el sesgo en el clculo incorrectamente realizado tiende a ser negativo
en muchas aplicaciones, es decir, subestima el verdadero tamao de la varianza de los
parmetros.

- En todo caso, sea el sesgo positivo o negativo, partiendo de una expresin incorrecta
de la varianza de los parmetros, se cometer, como en el caso de la
heterocedasticidad, un error en el contraste t de significatividad individual, que
puede llevarnos a errores en el rechazo o aceptacin de las variables como
significativas. Si el sesgo ms frecuente es por subestimacin, ser tambin frecuente
que la autocorrelacin nos lleve al falso rechazo de la hiptesis nula en el contraste
t, es decir, a la falsa aceptacin de variables como relevantes que en realidad, no lo
son. Los clculos del estadsticos muestral t ya no podrn comprarse con los valores
de referencia correctos de las distribuciones t y, en realidad, lo mismo ocurrir con
el resto de clculos derivados de la estimacin de la varianza de la perturbacin
aleatoria: el contraste F ya no se distribuir como una F o los contrastes LM ya no
seguirn una Chi-Cuadrado.

- Una segunda consecuencia de la presencia de autocorrelacin sobre el estimador
MCO es que este pierde su eficiencia, deja de ser el ms preciso entre los
insesgados. En presencia de autocorrelacin, el estimador eficiente es el estimador de
MCG, el mismo presentado cuando se introdujo la cuestin de la heterocedasticidad:

( ) Y X X X
MCG
1
1
1
' '
~

E E = |


Intuitivamente, la razn de que exista un estimador sin sesgo ms preciso reside en
que, si conocemos los patrones de evolucin de los residuos, podemos utilizar estos
patrones para dar ms o menos importancia a las observaciones asociadas a residuos
ms separados de la lnea de regresin (de media residual nula) en lugar de ponderar
todas las observaciones por igual (como hace MCO).

- Por otro lado, y con relacin a los modelos que contienen variables dependientes
retardadas, debe recordarse que la presencia de autocorrelacin en estos modelos
puede impactar adems en la inconsistencia de los parmetros (este aspecto fue
debidamente comentado y desarrollado en el texto referido al problema de los
regresores estocsticos).



III.- Causas frecuentes de autocorrelacin


4
El tamao y signo del sesgo en la estimacin de la varianza depende bsicamente de dos factores: del
tamao y el signo de la autocorrelacin en las perturbaciones y del tamao y el signo de la
autocorrelacin en los propios regresores. La autocorrelacin de carcter ms general es que responde
a un modelo autorregresivo AR(1) positivo en la perturbacin; por otro lado, la autocorrelacin de las
propias variables exgenas suele ser tambin, cuando existe, de naturaleza positiva. En estas
condiciones, relativamente frecuentes, puede comprobarse que el sesgo suele infravalorar el verdadero
valor de la varianza de los parmetros estimados.
Al igual que en el resto de hiptesis, debe decirse que la presencia de autocorrelacin es un
caracterstica esencialmente natural en todos los modelos de series temporales, los factores
que se encuentran en la perturbacin aleatoria (los errores) tienen inevitablemente
conexiones temporales, es decir, una cierta persistencia y esto sucede, de forma inevitable,
porque los fenmenos de causalidad analizados con perspectiva temporal y los
acontecimientos imprevisibles que impactan en esas relaciones muestran tambin cierta
persistencia.

Este fenmeno natural es tanto ms frecuente cuanto mayor es la frecuencia de los datos;
en datos de frecuencia baja, la posibilidad de que un acontecimiento que impact en una
perturbacin extienda sus efectos a la siguiente es menor.

En todo caso, y ms all de la autocorrelacin natural, y como siempre repetimos, conviene
identificar algunas situaciones especficas, habituales en la econometra emprica, asociadas al
riesgo de autocorrelacin.

1.- Omisin de variables relevantes en el modelo especificado.

Esta es, sin duda alguna, la principal causa de autocorrelacin en un MBRL hasta el punto de
que las pruebas de autocorrelacin se consideran generalmente pruebas para evaluar si una
especificacin es completa o no.

Efectivamente, si omitimos una variable relevante, su efecto quedar recogido en la
perturbacin aleatoria y en la medida en que esa variable omitida muestre una mnima
persistencia y/o una evolucin sistemtica, la perturbacin quedar contagiada
inevitablemente de ella.

En el caso de series temporales, la omisin de variables relevantes implica notables problemas
de autocorrelacin en tanto que algunas series presentan comportamientos temporales
especialmente persistentes (clara tendencia) o sistemticas (estacionales, o cclicas por
ejemplo) de modo que, en ausencia de variables adecuadas que expliquen esos movimientos
sistemticos, la persistencia o el artefacto acenta la autocorrelacin residual.

En el grfico siguiente, por ejemplo, la variable analizada es claramente estacional; si omitimos
las variables que conectan con esa estacionalidad, el error contendr un patrn estacional
inevitable:

Ilustracin grfica de un ajuste que ha omitido variables estacionales
-6000
-4000
-2000
0
2000
4000
6000
5000
10000
15000
20000
25000
99 00 01 02 03 04 05
Residual Actual Fitted

2.- Asincrona temporal causa efecto cuando los datos se miden en forma discreta, no
continua

En algunos fenmenos temporales, los cambios en las variables exgenas no se transmiten
siempre de forma instantnea a la variable endgena, lo cual genera un riesgo de inducir un
cierto patrn autocorrelacionado en el error; si el efecto de un cambio en Xt se retrasa total o
parcialmente a t+1, el efecto sobre Yt estar subestimado (error positivo) en tanto que el
efecto en Yt+1 estar sobre estimado (error negativo).

Evitar este tipo de problemas no es fcil en la prctica pero requiere atender cuidadosamente
a la seleccin de la frecuencia de anlisis correcta y/o a considerar la posibilidad de incluir
retardos / adelantos de exgenas / endgenas en la especificacin temporal del modelo, es
decir, optar por un modelo dinmico en lugar de esttico.
5


3. Forma funcional incorrecta

Una vez ms, la utilizacin de una forma funcional incorrecta, por ejemplo la utilizacin de una
funcin lineal en lugar de una logartmica o potencial, puede provocar que la calidad del
ajuste de la regresin (y por tanto los errores) muestre comportamientos sistemticos en el
tiempo, ajustando, por ejemplo, adecuadamente los valores pasados y mal los recientes,
inducindose de esta manera una autocorrelacin positiva.

Ilustracin grfica de la relacin NO LINEAL entre produccin y coste y resultado de un ajuste
lineal para datos anuales entre 1975 y 2008


5
Un ejemplo de asincrona csico es el debido a Kaldor, 1934 con relacin al modelo la teora cobweb
que explicaba las fluctuaciones cclicas de precios y los movimientos asincrnicos oferta demanda en
aquellos mercados en los que la oferta ha de decidirse antes de conocer los precios reales y, por tanto,
ha de basarse en expectativas sobre precios. Cuando estas expectativas son adaptativas en lugar de
racionales, los productores utilizarn los precios en t para decidir su oferta en t+1 generando
excesos o contracciones de oferta asincrnicas y cclicas y cclicos movimientos de precios.
0
500
1000
1500
2000
0 2 4 6 8 10
PRODUC
C
O
S
T
E

-200
-100
0
100
200
300
-500
0
500
1000
1500
2000
75 80 85 90 95 00 05
Residual Actual Fit ted


La relacin lineal, subestima el coste de produccin de los ltimos aos , que ha crecido
potencialmente con la produccin y sobrestima el coste de los aos intermedios.


4. Transformaciones incorrectas de los datos.

Manipular incorrectamente los datos creando artefactos temporales puede generar modelos
con riesgo de autocorrelacin. As, por ejemplo, tomar en un modelo primeras diferencias,
genera una perturbacin autocorrelacionada an cuando la perturbacin del modelo en
niveles no lo estuviera.
6


5. No estacionariedad de las series

Como se ver ms adelante, la utilizacin de series no estacionarias (especialmente en
varianza) en el anlisis de regresin implica un alto riesgo de que el error se muestre tambin
no estacionario mostrando, por tanto, una inevitable autocorrelacin.

IV.- Cmo se detecta la presencia de Autocorrelacin?

Antes de plantear los mtodos de deteccin de la autocorrelacin, conviene especificar qu
tipo concreto de autocorrelacin es, de todas las posibles, la ms probable en un modelo de
regresin. Slo de este modo, concretando la naturaleza del problema, podremos proponer
mtodos suficientemente eficaces de deteccin.

Trabajaremos para ello con la hiptesis del modelo ms simple y frecuente de autocorrelacin,
el conocido como modelo autorregresivo de orden 1 AR(1):

t t t
u u c + =
1


||<1

El coeficiente autorregresivo se entiende menor que la unidad en valor absoluto
7
lo que
sugiere que cuando se produce un shock de naturaleza aleatoria de tamao u en un

6
La transformacin de un modelo en diferencias es una prctica habitual en econometra. Las primeras
diferencias reflejan el crecimiento (bruto, no porcentual) de una serie entre dos observaciones.
7
En el caso en que fuese superior a 1, las perturbaciones en t seran mayores que en t-1 lo que
indicara que los shocks o perturbaciones aleatorias, cuando ocurren, no tienen un efecto limitado en el
momento t del tiempo, este shock queda reducido al perodo siguiente a un menor
tamao u
t
; es decir, el shock aletaorio va diluyndose progresivamente con el tiempo.

Este modelo, sugiere que slo existe correlacin parcial entre la perturbacin aleatoria de un
perodo (t) y la del perodo anterior (t-1) conforme a una sencilla forma funcional lineal. En
concreto, el valor de la perturbacin aleatoria en t es una fraccin del valor de la
perturbacin previa t-1 dado que es menor que la unidad.

Cuando el valor del coeficiente es positivo, dos perturbaciones consecutivas comparten
valores similares y del mismo signo
8
y decimos entonces que existe autocorrelacin positiva.
Cuando el valor del coeficiente es negativo, las perturbaciones mantienen tambin valores
similares pero van alternando sus signos; decimos entonces que existe autocorrelacin
negativa.

La relacin entre cada perturbacin u
t
y la previa no es exacta, determinista, sino que viene
condicionada por la existencia de una nueva perturbacin aleatoria
t
de carcter esfrico:

| | 0 =
t
E c

| | .
2
cte V
t
= =
c
o c

| | s t, 0 , =
s t t
Cov c c


Aunque cabra pensar que el proceso real de autocorrelacin fuera ms complejo, por ejemplo
un AR de orden superior AR(p) o un proceso de medias mviles MA(q), lo cierto es que este
modelo de autocorrelacin simple, captura con facilidad la mayor parte de las situaciones
reales de autocorrelacin. En primer lugar, la perturbacin no puede seguir un proceso regular
AR de orden superior, por ejemplo un AR(2), sin mostrar tambin una correlacin parcial con el
retardo de orden uno;
9
es decir, el proceso verosmil sera:

t t t t
u u u c + + =
2 2 1 1

y nunca:
t t t
u u c + =
2 2


Por otro lado, en caso de existir un patrn de autocorrelacin MA (de medias mviles), por
ejemplo un MA(1) del tipo:

t t t
u c c + =
1



tiempo, sino que inician un proceso de crecimiento progresivo en los sucesivos perodos; una situacin,
poco verosmil y que generara dems, desde el punto de vista tcnico, importantes problemas que se
analizarn en una seccin posterior del curso.
8
Obsrvese que esta propiedad no significa que TODOS los errores tengan siempre el mismo signo. La
relacin entre u
t
y u
t-1
es de naturaleza estocstica est influida por la presencia del componente
aleatorio
t
que puede tomar aleatoriamente valores positivos y negativos. Por otro lado, conviene
adems recordar que la perturbacin aleatoria u
t
conserva su media nula, de modo que sera imposible
que todos sus valores sean de un mismo signo.
9
Esto se conoce como ergodicidad; una propiedad necesaria para garantizar que un proceso
estocstico temporal sea ergdico es que la correlacin entre las observaciones tienda a cero al
aumentar la separacin entre ellas.

debe recordarse que, merced al teorema de Wald, siempre podr expresarse ese proceso
MA(q) como un proceso AR(p).

A. Contrastes Grficos

A.1) Grfica temporal del error

La presencia de una autocorrelacin severa puede observarse grficamente analizando el
grfico secuencial (temporal) de los residuos. En una serie sin autocorrelacin, el valor del
residuo hoy no informa sobre dnde estar el valor del residuo maana. As, en una serie
puramente aleatoria, no autocorrelacionada, los datos cambian frecuentemente de tamao y
signo, de positivos a negativos, de grandes a pequeos y viceversa, cruzando la media nula con
asiduidad y sin mostrar ningn patrn reconocible; cuando se produce un error puntual muy
elevado, la serie no tiene memoria y retorna al valor nulo promedio con facilidad. Sin
embargo, en presencia de autocorrelacin imprime un comportamiento sistemtico en la serie
de residuos que normalmente es visible. Los residuos muestran comportamientos predecibles
en valor y en signo:

- En el caso de la autocorrelacin positiva, los residuos consecutivos comparten valores
y signos similares, mostrndose amplias zonas de sobrestimacin y subestimacin lo
que genera visibles patrones de ondas.

- En el caso de autocorrelacin negativa, los residuos muestran valores semejantes
entre observaciones pero alternando el signo constantemente, generndose de este
modo patrones dentados.

A.2) Grfica de dispersin del error con su retardo

Un grfico an ms ilustrativo es el grfico de dispersin (Scat) del residuo con sus retardos
(generalmente con el primero). Si existe autocorrelacin, la nube de puntos que ilustra la
conexin entre los residuos en t y los resiudos en t-1 mostrar un aspecto creciente o
decreciente muy ilustrativo de esa relacin.


GRFICOS SECUENCIALES DE RESIDUOS Y GRFICOS DE DISPERSIN
Ejemplo de series residuales con distinto grado de autocorrelacin

NO autocorrelacin
-1,2
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
1
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
5
3
5
7
6
1
6
5
6
9
7
3
7
7
8
1
8
5
8
9
9
3
9
7

-1,5
-1
-0,5
0
0,5
1
1,5
-1,5 -1 -0,5 0 0,5 1 1,5



Autocorrelacin AR(1) POSITIVA muy dbil =0.25 Autocorrelacin AR(1) NEGATIVA muy dbil =0.25
-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
1
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
5
3
5
7
6
1
6
5
6
9
7
3
7
7
8
1
8
5
8
9
9
3
9
7

-1,5
-1
-0,5
0
0,5
1
1,5
-1,5 -1 -0,5 0 0,5 1 1,5

-1
-0,8
-0,6
-0,4
-0,2
0
0,2
0,4
0,6
0,8
1
1,2
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
5
3
5
7
6
1
6
5
6
9
7
3
7
7
8
1
8
5
8
9
9
3
9
7

-1,5
-1
-0,5
0
0,5
1
1,5
-1,5 -1 -0,5 0 0,5 1 1,5

Autocorrelacin AR(1) POSITIVA dbil =0.5 Autocorrelacin AR(1) NEGATIVA dbil =0.5
-1,5
-1
-0,5
0
0,5
1
1,5
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
5
3
5
7
6
1
6
5
6
9
7
3
7
7
8
1
8
5
8
9
9
3
9
7

-2
-1,5
-1
-0,5
0
0,5
1
1,5
-2 -1,5 -1 -0,5 0 0,5 1 1,5

-1,5
-1
-0,5
0
0,5
1
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
5
3
5
7
6
1
6
5
6
9
7
3
7
7
8
1
8
5
8
9
9
3
9
7

-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
-2 -1,5 -1 -0,5 0 0,5 1 1,5 2

Autocorrelacin AR(1) POSITIVA moderada/alta =0.75 Autocorrelacin AR(1) NEGATIVA moderada/alta =0.75
-1,5
-1
-0,5
0
0,5
1
1,5
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
5
3
5
7
6
1
6
5
6
9
7
3
7
7
8
1
8
5
8
9
9
3
9
7

-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
-2 -1,5 -1 -0,5 0 0,5 1 1,5 2

-2
-1,5
-1
-0,5
0
0,5
1
1,5
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
5
3
5
7
6
1
6
5
6
9
7
3
7
7
8
1
8
5
8
9
9
3
9
7

-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
-2 -1,5 -1 -0,5 0 0,5 1 1,5 2

Autocorrelacin AR(1) POSITIVA severa =0.95 Autocorrelacin AR(1) NEGATIVA severa =0.95
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
3
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
5
3
5
7
6
1
6
5
6
9
7
3
7
7
8
1
8
5
8
9
9
3
9
7

-6
-5
-4
-3
-2
-1
0
1
2
3
4
-6 -4 -2 0 2 4

-3
-2
-1
0
1
2
3
1 5 9
1
3
1
7
2
1
2
5
2
9
3
3
3
7
4
1
4
5
4
9
5
3
5
7
6
1
6
5
6
9
7
3
7
7
8
1
8
5
8
9
9
3
9
7

-4
-3
-2
-1
0
1
2
3
4
-4 -3 -2 -1 0 1 2 3 4



B. Contrastes numricos


B.1) Contraste del Durbin - Watson

Uno de los tests ms estndar para la deteccin de la autocorrelacin es el conocido como test
o prueba de Durbin Watson. Este test, propuesto POR Durbin y Watson en 1950, propone
utilizar los residuos e
t
del modelo estimado para computar el siguiente coeficiente:

( )

=
=

=
n
t
t
n
t
t t
e
e e
DW
1
2
2
2
1


Para comprender los valores del DW indicativos de autocorrelacin positiva, vamos a realizar
una serie de sencillas transformaciones:


( )

=
=

=
=

=
=
=
=

=
=

+ =
+
=

=
n
t
t
n
t
t t
n
t
t
n
t
t
n
t
t
n
t
t
n
t
t
n
t
t t t t
n
t
t
n
t
t t
e
e e
e
e
e
e
e
e e e e
e
e e
DW
1
2
2
1
1
2
2
2
1
1
2
2
2
1
2
2
1
2
1
2
1
2
2
2
1
2
2


Los dos primeros trminos del anterior sumando son aproximadamente igual a la unidad:

=
=

+ ~
n
t
t
n
t
t t
e
e e
DW
1
2
2
1
2 1 1

Por otro lado, la ltima de las ratios es una aproximacin casi exacta a la expresin de la
correlacin muestral entre e
t
y e
t-1
:

( )( )
( ) ( )

=

=
=



=

n
t
t t
n
t
t t
n
t
t t t t
e e
e e e e
e e e e
r
t t
2
2
1 1
1
2
2
1 1
,
1

Considerando que la correlacin muestral entre e
t
y e
t-1
es un buen estimador del coeficiente
del proceso subyacente AR(1) en las perturbaciones aleatorias
10
tenemos entonces que:

( )

1 2
2 1 1
~
+ ~
DW
DW


As pues, ahora resulta ms fcil interpretar los valores lmites del DW:

- En caso de autocorrelacin mxima y positiva:



( ) 0 1 1 2 1 = ~ = DW DW


- En caso de autocorrelacin mxima y negativa:

( ) 4 ) 1 ( 1 2 1 = ~ = DW DW


- En caso de que no exista autocorrelacin:

( ) 2 0 1 2 0 = ~ = DW DW

Para evaluar si el valor del DW de un modelo de regresin refleja autocorrelacin positiva,
negativa o nula, no bastar con los valores extremos: qu ocurre, por ejemplo, si el DW toma
en nuestro modelo el valor 2,3?. Lo ideal sera disponer de la funcin de densidad de este
estadstico para poder contrastar hiptesis sobre su valor; sin embargo, Durbin y Watson
comprobaron que, lamentablemente, la distribucin de este estadstico no slo depende de
los grados de libertad con los que se calcula (como siempre ocurre con cualquier estadstico e
contraste) sino tambin de los valores de las variables exgenas x empleadas en la regresin.
Es decir, en algunas regresiones, el valor del estadstico DW tiende a acercarse ms a 2 que en
otras cuando =0, lo que impide utilizar valores tabulados exactos para contrastar la hiptesis
de ausencia de autocorrelacin. Pese a todo, existen unas tablas de Durbin Watson que, de
forma aproximada, permiten establecer reas de certeza alrededor de los valores lmites
examinados previamente.

Para un determinado nivel de significacin (o confianza) fijado por el analista, las tablas del DW
ofrecern siempre dos valores, uno inferior d
i
y otro superior d
s
que habrn de situarse del
siguiente modo alrededor de los valores lmite del DW:


10
Aunque no se han examinado todava en el curso las propiedades de un proceso AR(1) para una serie
genrica y
t
, puede demostrarse que el valor del coeficiente de un proceso de este tipo coincide con
el coeficiente de correlacin simple (y parcial) entre y
t
y y
t-1.

0 4 2
di ds 4-ds 4-di


Estos lmites, permiten as identificar, alrededor del 2, la zona consistente con la hiptesis nula
de ausencia de autocorrelacin H
0
:=0.

0 4 2
di ds 4-ds 4-di


Las zonas de rechazo de la hiptesis nula son las que circundan el valor 0 y el valor 4, es
decir, los valores que claramente indican autocorrelacin positiva o negativa:

0 4 2
di ds 4-ds 4-di


Lamentablemente, y por la limitacin antes mencionada, existen zonas de duda en las que el
estadstico DW no permite rechazar o aceptar la hipteis nula, son las zonas intermedias entre
d
i
y d
s
y entre 4-d
i
y 4-d
s
.

0 4 2
di ds 4-ds 4-di


Por un criterio de prudencia valorativa, si el valor del DW cae en zona de duda, conviene
quiz concluir que existe autocorrelacin y tratar de profundizar ms en su naturaleza y
corregirla, antes que arriesgar un diagnstico en sentido contrario.

B.2) Contraste t en el modelo AR(1) residual

Un test alternativo a la prueba DW consiste en estimar el modelo simple AR(1) utilizando los
residuos e de nuestra regresin:

t t t
e e c + =
1


El modelo puede estimarse con o sin trmino independiente y en todo caso, la hiptesis nula
de No Autocorrelacin se asociara con un valor estimado =0, algo que podemos verificar con
el contraste de significacin estadstica habitual t.

El valor estimado de es slo un estimador consistente del verdadero valor de por lo
que, para muestras grandes, podemos utilizar el resultado del test t como un buen indicador
de la presencia de autocorrelacin en la perturbacin.

B.3) Contraste t en presencia de regresores estocsticos y prueba de Breusch - Godfrey

El test DW expuesto previamente no slo presenta la importante limitacin de presentar zonas
de incertidumbres sino que, adems, exige el cumplimiento de algunas hiptesis adicionales.
Entre ellas, la ms relevante es la exigencia de exgenas deterministas en la regresin. En este
sentido, la presencia de exgenas relacionadas con la perturbacin u
t
o con u
t-1
invalida el
funcionamiento del test incluso para muestras grandes. Este problema, no slo concierne al
test DW, sin que afecta del mismo modo a la validez del contraste t sobre la regresin AR(1)
residual expuesto previamente.

La presencia de regresores estocsticos es una circunstancia relativamente habitual y
especialmente frecuente en el caso de las series temporales cuando se utilizan aproximaciones
dinmicas en las que se incluyen como explicativas las propias endgenas retardadas, como en
el siguiente ejemplo:

t t t t
u y x y + + + =
1 3 2 2 1
| | |

Para solucionar este problema, existen algunas pruebas adaptadas, como el estadstico h de
Durbin que no se analizar en este texto. Alternativamente, puede realizarse una sencilla
modificacin de la prueba t para el AR(1) residual expuesto previamente consistente en
incluir en la estimacin del modelo residual AR(1) todos los regresores del modelo original. Es
decir, si el modelo analizado es, por ejemplo:

t t t t
u y x y + + + =
1 3 2 2 1
| | |

Utilizamos los residuos e
t
de este modelo, y en lugar de estimar:

t t t
e e c + =
1


estimamos alternativamente:

t t t t t
e y x e c o o o + + + + =
1 1 3 2 2 1


De este modo, nuevamente podemos testar consistentemente la presencia de autocorrelacin
con el contraste t sobre el valor del coeficiente estimado para .

Alternativamente, Breusch y Godfrey propusieron utilizar esta regresin para computar el
estadstico LM a partir del valor de su R
2
. As, demostraron que si el tamao muestral es
suficientemente grande, bajo la nula de No Autocorrelacin:

2 2
) (
p
R p N _


donde p es el nmero de retardos residuales incluidos en la regresin. La razn de que
aparezcan hasta p retardos residuales es que, aunque nosotros hemos ejemplificado este
mtodo para el caso de una autocorrelacin AR(1)
11
, la prueba puede utilizarse para contrastar
modelos de autocorrelacin de orden superior AR(p) si sospechamos que estn presentes en
los datos. Determinar a priori el valor de los p retardos a incluir en la prueba no es fcil, por
lo que se recomienda probar con distintos valores de p (1,2 quiz 3) y comparar los
distintos resultados obtenidos.


11
De hecho, la prueba Breusch Godfrey se asocia generalmente a la existencia de un orden de
autocorrelacin superior a uno y cuando slo se incluye un retardo residual se conoce como M- de
Durbin.
V. Cmo se corrige

Una vez ms, como en los anteriores temas, debe decirse que la verdadera correccin de la
autocorrelacin pasa necesariamente por la solucin de su causa. En este sentido, debe
recordarse que, en muchas ocasiones
12
, la autocorrelacin es sntoma de una especificacin
inadecuada insuficiente y, por tanto, la correccin de la autocorrelacin implicara
necesariamente un replanteamiento de la misma.

No obstante, y desde un punto de vista estrictamente tcnico, pueden proponerse diversas
tcnicas adaptativas ante la incmoda presencia de autocorrelacin.

1.- Utilizacin de MCG factibles en presencia de autocorrelacin AR(1)

Una alternativa terica a la presencia de autocorrelacin es la utilizacin de MCG. Sin
embargo, como es sabido, la utilizacin de MCG exige disponer de informacin precisa sobre el
modelo de autocorrelacin existente y los parmetros que lo regulan. Desde un punto de vista
prctico, la utilizacin de MCG no es posible de modo que debemos conformarnos con una
versin factible de esos MCG que denominaremos, como ya ocurriera en el caso de la
heterocedasticidad MCGF.

La idea consiste, de hecho, en seguir utilizando el estimador MCO realizando previamente la
adecuada transformacin en los datos originales para que, el nuevo modelo transformado,
sea un modelo libre de autocorrelacin.

La transformacin propuesta en este caso consiste en utilizar las semidiferencias de los datos
originales a partir del valor del coeficiente de autocorrelacin:

1
*

=
t t t
y y y

1
*

=
jt jt jt
x x x


Esta transformacin se explica con facilidad si partimos del modelo original en el que
presuntamente existe autocorrelacin AR(1). Por simplicidad, imaginemos que ese modelo es:

t t t
u x y + + =
2 2 1
| |


con:
t t t
u u c + =
1


Entonces, se sigue que:

| |
t t t t t t t
u x y u x y c | | | | + + + = + + =
1 2 2 1 2 2 1

( ) | |
t t t t t
x y x y c | | | | + + + =
1 2 2 1 1 2 2 1

de modo que:
( ) ( )
t t t t t
x x y y c | | + + =
1 2 2 2 1 1
1
( )
t t t
x y c | | + + =
*
2 2 1
*
1



12
Algunos autores distinguen esta situacin de aquella en la que la autocorrelacin no viene provocada por
una deficiente especificacin. Gujarati, por ejemplo, define esta situacin como Autocorrelacin Pura.
donde recordemos, habamos definido la nueva perturbacin
t
como una perturbacin
aleatoria esfrica y, por tanto, sin autocorrelacin.

Utilizar los datos en semi diferencias, permite por tanto obtener estimaciones de los
parmetros y sus desviaciones aparentemente libres de autocorrelacin. Para el trmino
constante. Debe observarse que no se obtendr el verdadero valor de
1
. Para evitar este
problema, o bien utilizamos como trmino constante la expresin (1-) o bien realizmaos la
regresin con trmino constante:

t t t
x y c | o + + =
*
2 2 1
*


y despus obtenemos
1
como:
( )
o
|

=
1
1
1


Para la utilizacin de MCGF en la prctica conviene llamar la atencin sobre algunas cuestiones
importantes:

1.- Evidentemente, realizar la estimacin MCGF exige disponer del valor de , o dicho con
ms propiedad, de una estimacin de este valor. Esta estimacin puede obtenerse de varias
formas, todas ellas equivalentes o casi equivalentes. Podemos, por ejemplo, utilizar el valor
del DW y su relacin con
( )
2
1 1 2
DW
DW = ~

Alternativamente, podemos realizar la estimacin AR(1) residual y obtener por MCO:

t t t
e e c + =
1


Utilizar una estimacin de parece sencillo pero, sin embargo, entraa importantes
repercusiones. Efectivamente, la utilizacin de los datos transformados como propone MCGF
resuelve, tericamente, los problemas de la autocorrelacin pero debe sealarse que eso solo
ocurre si disponemos del verdadero valor de . Si, como sucede en la prctica, usamos una
estimacin de , el estimador MCGF presenta un comportamiento desconocido en muestras
pequeas. Es cierto que, en general, el esimador MCGF gana en eficiencia y suele ser
consistente, pero no es insesgado y los contrastes t y F no se ajustan en realidad
verdaderas distribuciones t y F an cuando la perturbacin aleatoria siga una normal.

2.- Normalmente, el clculo y la utilizacin de estos estimadores de suele realizarse de
forma iterativa, y no en un nico paso. As, comenzaremos por calcular un valor estimado de
a partir del modelo original y procederemos a realizar una primera correccin del modelo.
Una vez corregido, recalcularemos de nuevo el valor de con el nuevo conjunto de residuos
y realizaremos una segunda correccin sobre el modelo previamente corregido. El proceso
iterativo termina cuando entre dos estimaciones sucesivas de no exista una diferencia
significativa como para seguir con correcciones adicionales
13
. Este mtodo iterativo es
conocido habitualmente como Cochrane Orcutt.


13
Un valor de cambio en inferior a 0,05 es suficientemente pequeo para ser considerado
irrelevante Normalmente, esto sucede en dos o, a lo sumo, tres iteraciones.
3.- En tercer lugar, debe observarse que la transformacin de los datos en semi- diferencias
implica perder la primera de las observaciones de la muestra. Esta prdida no es
excesivamente relevante en la mayor parte de anlisis temporales en los que se cuente con
muestras de un tamao suficiente. No obstante, existe la posibilidad de recuperar esa
primera observacin realizando para ella una transformacin alternativa conocida como Prais
Winsten.

4.- En cuarto lugar, pero no por ello menos importante, debe observarse que la utilizacin de
MCGF puede generar parmetros sensiblemente diferentes a los obtenidos en el modelo
original. Este cambio en el valor de los parmetros resulta perturbador, dado que el analista
espera que la correccin de la autocorrelacin afecte a las varianzas de los parmetros y no a
su valor. Las diferencias pueden deberse a varios factores, como la utilizacin de muestras no
demasiado grandes o algunas propiedades de los regresores. En trminos generales, resulta
difcil saber si las diferencias entre la estimacin MCO y MCGF son estadsticamente relevantes
pero, como norma general, se desaconseja la utilizacin de MCGF si los resultados de los
parmetros difieren clara y visiblemente de los originales.

2.- Utilizacin de procedimientos de inferencia robustos a la autocorrelacin usando MCO

Conviene recordar que el mayor de los problemas derivados de la autocorrelacin es el clculo
incorrecto de la desviacin estndar de los parmetros MCO. En este sentido, una primera
propuesta adaptativa a la presencia de autocorrelacin es concentrar la correccin en el
clculo de la varianza de los parmetros con una propuesta de correccin similar a la
estimacin automtica corregida de heterocedasticidad de White, pero ideada para el
contexto en el que exista un problema de autocorrelacin.

El detalle tcnico sobre la propuesta de correccin excede la profundidad de este texto, debida
originalmente a Newey y West (1987), pero afortunadamente la mayor parte de los programas
informticos incorporan esta correccin automtica bajo la denominacin Estimador Newey
West o bien estimacin con errores estndar CHA (consistentes con la heterocedasticidad y la
autocorrelacin).

Ms all de los detalles tcnicos, interesa comprender las ventajas de esta estimacin frente a
la aplicacin de MCGF. Tal y como seala Wooldridge
14
esta estrategia es, en ocasiones,
preferible, dado que la consistencia de MCGF exige que todos los regresores sean
estrictamente exgenos y adems supone a priori la existencia de un modelo de
autocorrelacin AR(1). En sentido contrario, la utilizacin de procedimientos de inferencia
robustos slo es estrictamente vlido en presencia de muestras grandes, por lo que, quiz, la
solucin MCGF es la propicia cuando no se dispone de ellas.




14
Wooldridge, J.F. (2003). Introductory Econometrics. Epgrafe 12.5.

También podría gustarte