Está en la página 1de 10

AUTOCORRELACIN1

Ing. Lorenzo Castro Gmez2

Un supuesto importante del modelo clsico lineal presentado en el inicio del curso
es que no hay autocorrelacin o correlacin serial entre las perturbaciones i
consideradas dentro de la funcin de regresin poblacional. En este apartado, se
examinara en forma critica este supuesto con el fin de buscar respuestas a las
siguientes preguntas:
1. Cul es la naturaleza de la autocorrelacin?
2. Cules son las consecuencias tericas y practicas de la autocorrelacin?
3. Puesto que el supuesto de no autocorrelacin se relaciona con las
como se sabe que hay autocorrelacin en
perturbaciones no observables i,
cualquier situacin dada?
4. Cmo se puede remediar el problema de la autocorrelacin?
El lector encontrara en este apartado, similitudes en muchos aspectos con el
apartado anterior sobre heteroscedasticidad, puesto que en presencia de
autocorrelacin y de heteroscedasticidad, los estimadores, de mnimos cuadrados,
a pesar de ser insesgados, dejan de tener mnima varianza entre todos los
estimadores lineales insesgados. En resumen, dejan de ser mejores estimadores
lineales insesgados.

1. NATURALEZA DEL PROBLEMA


El trmino autocorrelacin se puede definir como la (correlacin entre miembros
de series de observaciones ordenadas en el tiempo [como en informacin de
series de tiempo] o en el espacio [como en informacin de corte transversal. En el
contexto de regresin, el modelo clsico de regresin lineal supone que no existe
tal autocorrelacin en las perturbaciones i, Simblicamente,
E (i j ) = 0

ij

Notas preparadas para la materia de Econometra (tomadas del libro de Damodar N. Gujarati, Econometra
3era Edicin. 1997. Mxico. Pgs. 393 442.
2
Maestro del Departamento de Economa Agrcola de la DCSE de la Universidad Autnoma Agraria Antonio
Narro. De Saltillo Coah., Mxico.

Expresado en forma sencilla, el modelo clsico supone que el trmino de


perturbacin relacionado con una observacin cualquiera no esta influenciado por
el trmino de perturbacin relacionado con cualquier otra observacin. Por
ejemplo, si s esta tratando con informacin trimestral de series de tiempo, para
efectuar una regresin de la produccin sobre los insumos trabajo y capital y si,
por ejemplo, hay una huelga laboral que afecta la produccin en un trimestre, no
hay razn para pensar que esta interrupcin afectara la produccin del trimestre
siguiente. Es decir, si la produccin es inferior este trimestre, no hay razn para
esperar que esta sea baja en el siguiente trimestre. En forma similar, si s esta
tratando con informacin de corte transversal que involucra la regresin del gasto
de consumo familiar sobre el ingreso familiar no se espera que el efecto de un
incremento en el ingreso de una familia sobre su gasto de consumo incida sobre el
gasto de consumo de otra. Sin embargo, si tal dependencia existe, se tiene
autocorrelacin. Simblicamente,
E (i j) 0

ij

En esta situacin, la interrupcin ocasionada por una huelga este trimestre puede
afectar muy fcilmente la produccin del siguiente trimestre, o los incrementos en
el gasto de consumo de una familia pueden inducir muy fcilmente a otra familia a
aumentar su gasto de consumo para no quedarse atrs de la primera.
Antes de encontrar la razn de la existencia de la autocorrelacin, es esencial
aclarar algunos aspectos de terminologa. Aunque, hoy en da, es prctica comn
tratar como sinnimos los trminos autocorrelacin y correlacin serial, algunos
autores prefieren diferenciar los dos trminos. Por ejemplo se define
autocorrelacin como (correlacin rezagada de una serie dada consigo
misma, rezagada por un nmero de unidades de tiempo), mientras que reserva
el trmino correlacin serial para (correlacin rezagada entre dos series
diferentes). Aunque la distincin entre los dos trminos puede ser de utilidad, en
este apartado se consideraran como sinnimos.
Se pueden visualizar algunos de los patrones razonables de autocorrelacin y de
no autocorrelacin, los cuales estn dados en la siguiente figura.

En las figuras a) a d) se ve que hay un patrn de distinguible entre las , mientras


que en la figura e) no existe tal patrn, apoyando el supuesto que no hay
autocorrelacin.

2. DETECCION DE LA AUTOCORRELACIN
La autocorrelacin es potencialmente un problema grave. Por consiguiente, las
medidas remdiales deben ser ciertamente apropiadas. Por supuesto, antes de
hacer algo, es esencial averiguar si existe autocorrelacin en una situacin dada.
En estos apuntes se consideraran algunas pruebas de correlacin serial usadas
comnmente.
1. Prueba d de Durbin- Watson3
La prueba mas conocida para detectar correlacin serial es la desarrollada por los
estadsticos Durbin y Watson. Es comnmente conocida como el estadstico d de
Durbin- Watson. el cual se define como
d = ( ut u t-1)2 / u2t
que es simplemente la razn de la suma de las diferencias al cuadrado de
residuales sucesivos sobre la SCR. Obsrvese que en el numerador d el nmero
de observaciones es n -1 porque una observacin se pierde al obtener las
diferencias consecutivas.
Una gran ventaja del estadstico d es que esta basado en los residuales
estimados, que aparecen sistematizados en los anlisis de regresin. Debido a
esta ventaja, es frecuente incluir el estadstico d de Durbin-Watson en los informes
de anlisis de regresin, junto con otros estadsticos resumen tales como el R2, el
R ajustado, las razones t, etc. Aunque el estadstico d es utilizado ahora en forma
sistematizada, es importante anotar los supuestos en los cuales este se basa:
1. El modelo de regresin incluye el trmino de intercepto. Si dicho trmino no
esta presente, como es el caso de la regresin a travs del origen, es
esencial efectuar nuevamente la regresin incluyendo el trmino del
intercepto para obtener la SCR.

En estos apuntes slo se considera esta prueba. (como medida de deteccin y para poder remediar el modelo
cuando aparezca autocorrelacin).

2. Las variables explicativas, x son no estocsticas, es decir, son fijas en


muestreo repetido.
3. Las perturbaciones t se generan mediante el esquema autorregresivo de
primer orden:
t = t-1 + t
4. El modelo de regresin no incluye valor(es) rezagado(s) de la variable
dependiente como una de las variables explicativas. Por tanto, la prueba es
inaplicable a modelos grandes.
5. No hay observaciones faltantes en los datos. Por tanto, en un ejemplo de
regresin de salarios- productividad para el perodo 1960-1991 si por
alguna razn faltaran las observaciones, por ejemplo para 1963 y 1972, el
estadstico d no permitira la ausencia de tales observaciones.
El muestreo exacto o la distribucin de probabilidad del estadstico d es difcil de
derivar porque, como lo han demostrado Durbin y Watson, depende de forma
compleja de los valores presentes de X en una muestra dada. Esta dificultad
puede ser entendida porque d es calculado a partir de t, los cuales, por supuesto,
dependen de las X dadas. Por consiguiente, a diferencia de las pruebas t, F o 2,
no hay un valor crtico nico que lleve al rechazo o a la aceptacin de la hiptesis
nula de que no hay correlacin serial de primer orden en las perturbaciones i. Sin
embargo, Durbin y Watson tuvieron xito al encontrar un limite inferior dL, y un
lmite superior dU, tales que si el valor d calculado cae por fuera de estos valores
crticos, puede tomarse una decisin con respecto a la presencia de correlacin
serial positiva o negativa. Adems, estos lmites solamente dependen del nmero
de observaciones n y del nmero de variables explicativas y no dependen de los
valores que adquieren estas variables explicativas. Estos lmites para n, de 6 a
200 y hasta 20 variables explicativas, han sido tabulados por Durbin y Watson.
(hasta 20 variables explicativas)
El procedimiento de prueba aplicado puede explicarse mejor con la ayuda de la
siguiente figura 1, la cual muestra que los lmites de d son 0 y 4. Estos pueden
establecerse expandiendo la siguiente ecuacin, para obtener
d = (u2j + u2t-1- 2 utu t-1) / u2t
Puesto que u2t y u2t-1 difieren solo en una observacin, estos son
aproximadamente iguales. Por consiguiente, haciendo u2t-1 = u2t puede
escribirse como
d 2[1 (utut-1/ u2t)]
Donde significa aproximadamente.
Se define ahora

= (utut-1) / (u2t)
como el coeficiente de autocorrelacin muestral de primer orden, un estimador de ,
es posible expresar como
d 2 (1 p)
pero puesto que 1 p 1, implica que, 0 d 4
Estos son los lmites de d; cualquier valor d estimado debe caer dentro de estos
lmites.
Cuadro 1.

Nota: Ho: No autocorrelacin positiva


Ha: No autocorrelacin negativa

Es deducible de la ecuacin s p = 0, d = 2; es decir, si no hay correlacin serial


(de primer orden), se espera que d este alrededor de 2. Por consiguiente, como
regla prctica, si en una aplicacin se encuentra que d es igual a 2, se puede
suponer que no hay autocorrelacin de primer orden, bien sea positiva o negativa.
Si p = + 1, indica una correlacin positiva perfecta en los residuales, d 0. Por
consiguiente, entre ms cercano este d a 0, mayor ser la evidencia de
correlacin serial positiva. Esta relacin debe ser evidente de ya que si hay
autocorrelacin positiva, las t aparecern agrupadas y sus diferencias, por
consiguiente, tendern a ser pequeas. Como resultado, la suma de cuadrados

del numerador ser menor en comparacin con la suma de cuadrados del


denominador, el cual es un valor que permanece fijo para cualquier regresin
dada.
Si p = p - 1 es decir, hay una correlacin negativa perfecta entre los valores
consecutivos de los residuales, d 4. Por tanto, entre mas se acerque d a 4,
mayor ser la evidencia de correlacin serial negativa. Nuevamente, al analizar
esto es entendible. Pues, si hay autocorrelacin negativa, t , positiva tendera a
estar seguida por t, negativo y viceversa, de tal forma que t t-1ser
usualmente mayor que t. Por consiguiente, el numerador de d ser
comparativamente mayor que el denominador.
El mecanismo de la prueba de Durbin - Watson es el siguiente, suponiendo que se
cumplen los supuestos sobre los cuales se basa la prueba:
1. Efectuar la regresin con mnimos cuadrados y obtener los residuales.
2. Calcular d a partir de la ecuacin d = ( ut u t-1)2 / u2t . La mayora de
los programas de computador incluyen este clculo.
3. Para un tamao de muestra dado y un nmero de variables explicativas
dado, encuntrense los valores crticos dL y dU
4. Sganse ahora las reglas de decisin dadas en la siguiente cuadro No. 1.
Para facilitar su entendimiento, estas reglas se resumen en el cuadro 2.
Cuadro 2
Hiptesis nula
No autocorrelacin +
No autocorrelacin +
No correlacin
No correlacin
No autocorrelacin, + o -

Decisin
Rechazar
No tomar decisin
Rechazar
No tomar decisin
No rechazar

S
0 < d < dL
dL < d < dU
4- dL < d < 4
4 dU < d < 4 dL
dU < d < 4 - dU

A pesar de ser muy popular, la prueba d tiene una gran desventaja: cuando cae en
la zona de indecisin o regin de ignorancia, no se puede concluir si la
autocorrelacin existe o no. Para resolver este problema, diversos autores han
propuesto modificaciones a la prueba d de Durbin - Watson pero son un poco
complicadas y estn por fuera del alcance de estos apuntes.

3. MEDIDAS REMDIALES
Puesto que en presencia de correlacin serial los estimadores de mnimos
cuadrados son ineficientes, es esencial buscar medidas remdiales. El remedio,
sin embargo, depende del conocimiento que se tenga sobre la naturaleza de la
interdependencia entre las perturbaciones. Se distinguen dos situaciones: cuando
la estructura de autocorrelacin es conocida y cuando no lo es.
a) Cuando la estructura de la autocorrelacin es conocida4
Puesto que las perturbaciones i no son observables, la naturaleza de la
correlacin serial es frecuentemente un asunto de especulacin o de exigencias
practicas. En la practica, usualmente se supone que las i siguen el esquema
autorregresivo de primer orden, a saber,
t = t-1 + t
donde I p I < 1 y donde las t siguen los supuestos mnimos cuadrados de valor
esperado cero, varianza constante y no autocorrelacin. Si se supone la validez de
la anterior ecuacin, el problema de correlacin serial puede ser resuelto
satisfactoriamente si se conoce p, el coeficiente de autocorrelacin. Para esto se
tiene en cuenta el modelo con dos variables,
Yt = + xt + t
Si es cierta en el tiempo t, tambin es cierta en t-1, por tanto,
Yt-1 = + xt-1 + t-1
Multiplicando por p a ambos lados, se obtiene
pYt-1 = p + pX t-1 + pt-1
Restando esta ecuacin de la inicial se tiene
(Yt pYt-1 = (1 p) + Xt pX t-1 + (t pt-1)
= (1 p) + (Xt pXt-1) + t
se puede expresar como
Y*t = * + *X*t + t
Donde * = (1 p), Y*t = (Yt pYt-1) y X*t = (Xt pXt-1).

El alcance de estos apuntes no contempla, cuando no es conocida es para cursos ms avanzados.

Puesto que t satisface todos los supuestos mnimos cuadrados, se puede


proceder a aplicar mnimos cuadrados sobre las variables transformadas Y* y X* y
obtener estimadores con todas las propiedades optimas, es decir, modelo de
estimacin lineal insesgado. En efecto, realizar la regresin es equivalente a
utilizar los mnimos cuadrados generalizados, Pero obsrvese que la primera
expresin (Y1, X1) es excluida. (Por que?).
La regresin, se conoce por el nombre de ecuacin en diferencia generalizada o <<cuasi>> -. Esta consiste en regresar Y sobre X, no en la forma original, sino en
forma de diferencia, lo cual se logra restando una proporcin (= p) del valor de una
variable en el periodo de tiempo anterior de su valor en el periodo de tiempo
actual. En este procedimiento de diferenciacin se pierde una observacin, puesto
que la primera observacin no tiene precedente. Para evitar esta perdida de una
observacin, la primera observacin sobre Y y X es transformada de la siguiente
manera: Y1 1 p2 y X1 1 p2. Esta transformacin es conocida como la
transformacin de Prais - Winsten.

4. RESUMEN Y CONCLUSIONES

1. Si se viola el supuesto del modelo clsico de regresin lineal de que los


errores o las perturbaciones i consideradas dentro del modelo de regresin
poblacional son aleatorios o no correlacinados, surge el problema de
autocorrelacin o de correlacin serial.
2. La autocorrelacin puede surgir por diversas razones, tales como la inercia
o lentitud de las series de tiempo econmicas, el sesgo de especificacin
resultante de excluir variables importantes del modelo o de utilizar la forma
funcional incorrecta, el fenmeno de la telaraa, el manejo de los datos etc.
3. Aunque los estimadores mnimos cuadrados continan siendo insesgados
y consistentes en presencia de autocorrelacin, estos dejan de ser
eficientes. Como resultado, las pruebas de significancia t y F usuales no
pueden aplicarse legtimamente. Por tanto, se hace necesaria la aplicacin
de medidas remediales. El remedio depende de la naturaleza de la
interdependencia entre las perturbaciones t. Pero como las t, no son
observables, la prctica comn es suponer que estas han sido generadas
por algn mecanismo.
4. El mecanismo comnmente adoptado es el esquema autorregresivo de
primer orden de Markov, que supone que la perturbacin en el periodo de
tiempo actual esta linealmente relacionada con el trmino de perturbacin
en el periodo de tiempo anterior, la medida de interdependencia esta dada
por el coeficiente de autocorrelacin. Este mecanismo se conoce como el
esquema AR(1).

5. Si el esquema AR(1) es valido y el coeficiente de autocorrelacin se


conoce, el problema de correlacin serial puede atacarse fcilmente
mediante la transformacin de los datos siguiendo el procedimiento de
diferencia generalizada. El esquema AR(1) puede generalizarse fcilmente
a un esquema AR(p). Tambin se puede suponer un mecanismo promedio
mvil (MA) o una mezcla de los esquemas AR y MA, conocido como ARMA.
6. Aun si se utiliza un esquema AR(1), el coeficiente de autocorrelacin p no
se conoce a priori. Consideramos diversos mtodos para estimar, tales
como el d de Dulrbin - Waton, el d modificado de Theil-Nagar, el
procedimiento de dos etapas de Cochrane - Orcutt (C-O), el procedimiento
iterativo C - O y el mtodo de dos etapas de Durbin. En muestras grandes,
estos mtodos generalmente producen estimaciones similares, aunque en
muestras pequeas, estos tienen un desempeo diferente. En la practica, el
mtodo iterativo C - O se ha vuelto bastante popular.
7. Claro esta, antes de remediar el problema de autocorrelacin es preciso
detectarlo. Hay diversos mtodos de deteccin, de los cuales el mas
conocido es el estadstico d de Durbin- Watson. Aunque son de uso
corriente y aparecen en los impresos de la mayora de los paquetes de
sofware de computador, el estadstico d tiene diversas limitaciones. Muy
frecuentemente, el estadstico d es indicador de la presencia de un sesgo
de especificacin, y no de autocorrelacin pura.

10

También podría gustarte