Está en la página 1de 26

Universidad Laica Eloy Alfaro De Manabí

Facultad

Ciencias Económicas

Carrera

Economía

Materia

Análisis de datos econométricos

Tema

Tarea 1 unidad 2

Profesora

Elvira Bernardita Rodríguez Ríos

Nombre

Vera Loor Neiva Lissette

8vo semestre “A”


Modelización ARIMA

El capítulo 5 se basa en la explicación de las 4 etapas de metodología de un modelo econométrico

ARIMA, con un ejemplo en base a una serie clásica de literatura Pieles de lince (1821-1930). Los

gráficos y resultados se realizaron mediante el sistema econométrico Gretl.

Estrategias de Modelización

Los capítulos anteriores, hacen referencia a las propiedades del modelo ARIMA tanto de los

estacionarios (d= 0) como de los no estacionarios (d > 0):

La serie temporal es una realización del tamaño T del proceso estocástico, se genera cuando los

parámetros se los conoce por medio de la prueba del ruido blanco y cuando se le da valores para (Y),

y a. De acuerdo con lo anterior, la estructura se define de la siguiente manera:

De una estructura se puede obtener varias realizaciones, sin embargo, el ruido blanco y la serie

temporal que se genere, serán totalmente distintas para cada una de ellas. Entonces, cuando una serie

temporal es generada de una estructura tendrá cierta similitud de comportamiento dinámico.


La metodología Box-Jenkins se trata de todo lo contrario, es decir, le da valores a la serie temporal

y trata de buscar la estructura del modelo ARIMA.

Existen 4 etapas para la construcción del modelo ARIMA que son las siguientes:

a) Identificación. De acuerdo a la información obtenida es que se intenta sugerir una

subclase de modelo ARIMA. Se determina p,d,q de la serie que se está estudiando y

se evalúa si se incluye la constante. Se pueden identificar más de un modelo

candidato para la serie.

b) Estimación. Con los datos de la serie se realiza la respectiva inferencia de los

parámetros para saber si el modelo investigado es el adecuado. En otras palabras, se

estima los parámetros estadísticos del modelo de estudio.

c) Validación. comprobación para verificar si el modelo propuesto se ajusta sí o no a

los datos, en el caso de que no se ajuste se procede a reflejar los posibles problemas

para mejorarlo.

d) Predicción. Se obtiene pronósticos de valores futuros de la variable. Se evalúa la

capacidad predictiva del modelo propuesto.


En base a la anterior metodología, existen dos principios: la selección de un modelo en forma iterativa

y el principio de paratrizacion escueta. El principio de la selección de un modelo en forma iterativa

trata de que en cada etapa se planteé la posibilidad de rehacer las etapas

previas.

El principio de parsimonia se basa en proponer un modelo que represente la base con el mínimo de

parámetros. En ciertos casos, para describir el comportamiento de base de datos se necesita ampliar

los parámetros.

Identificación

Se selecciona el modelo ARIMA (p,d,q) adecuado para la serie. Este etapa se divide en dos fases:

análisis de estacionariedad y la elección de los órdenes (p,d,q). La fase análisis de estacionariedad

propone la estacionariedad en varianza que son las trasformaciones estabilizadoras de la varianza, y,

la estacionariedad de la media es el número de diferencias para lograr que la serie sea estacionaria en

la media. La fase de elección de ordenes se da cuando la serie es estacionaria para determinar el

proceso estacionario ARMA (p,q) que se haya generado.

Para poner en práctica las dos fases de identificación se necesita de gráficos y Correlograma

muestrales de la serie original, de determinadas trasformaciones de la serie y contrastes de raíces

unitarias.

Análisis de Estacionariedad
Estacionariedad en varianza. Cuando hay una sola varianza para toda la serie

temporal, es estacionaria en varianza. En otras palabras, es cuando se mantiene a lo largo

del tiempo. Y cuando la serie no es estacionaria en varianza, se aplica el método de

Box.Cox. Este método de transformación tiene varias funciones y se lo utiliza para series

económicas.

Para analizar la estacionariedad en varianza de una serie se realiza por medio del grafico de la serie

original y las transformaciones correspondientes.

De acuerdo con la serie de Pieles de Lience, en el primer gráfico se puede observar que hay

una serie con comportamiento cíclico y que la amplitud de los ciclos va en función del

tiempo. El segundo gráfico, al ingresar lograr logarítmicos se puede observar que la amplitud

de estos ciclos se homogenizado y que la variabilidad esté en fusión del tiempo.

El siguiente gráfico se ilustra la serie de producción de tabaco desde el año 1872 hasta 1984

en niveles y en logaritmos.
Estacionariedad en media. Se identifica si los datos se oscilan en torno a un nivel

de manera constante o no, con relación a la media.

Una serie es estacionaria cuando:

 Existe una única media para toda la serie temporal, es decir que las fluctuaciones

vas a estar cerca o alrededor de la media.

 Decae de manera rápida y exponencial la función de autocorrelación.

Una serie no es estacionaria cuando:

 Presenta tendencia

 La función de autocorrelación muestral presenta un decaimiento lento Cuando la

serie no es estacionaria en media, se transforma tomando diferencias. Se toma las diferencias

necesarias de orden 1 sobre la serie hasta obtener una serie estacionaria:

Zt = (1 − L)d Yt

A continuación, se presenta los posibles problemas cuando se quiere identificar las

diferencias para transformar la serie a estacionaria.

 Raíz autorregresiva próxima a la unidad.

 Sobre diferenciación: se toma más diferencias de las que se necesita, por ejemplo, cuando se

elige un orden de integración d cuando la seria ya es estacionaria, es decir, que ya no era

necesario. Es necesario resaltar que el objetivo es determinar la menor cantidad de diferencias

para convertir una serie en estacionaria.


Para determinar cuál es el valor de d, se utilizan los siguientes instrumentos:

 Por medio del grafico: se observa si existe tendencia o no

 Correlograma: Se comprueba si la serie decrece de manera rápida hacia cero.

 Contraste de raíces unitarias: proporciona contrastes estadísticos que permiten hacer

inferencia sobre la posible existencia de una raíz unitaria en una serie. Si se toma la decisión

de rechazar la hipótesis nula de existencia unitaria en ∆d−1 Yt no se diferenciará más la serie,

pero si se acepta la hipótesis nula se tomará una diferencia más de orden 1

Los contrastes de raíces unitarias más utilizados en las series de datos económicos son el

contraste de Dickey Fuller y contraste de Dickey Fuller aumentado.

Contraste Dickey Fuller. El proceso Yt estacionaria si |φ| < 1 y no es estacionaria cuando

φ = 1. Un modelo de paseo aleatorio seria como el siguiente:

Para contrastar alguna hipótesis nula sobre el valor del parámetro φ en el modelo se debe

estimar la regresión de Yt sobre Yt-1, luego se utiliza el estadístico estándar para contrastar la

hipótesis nula. Si |φ| < 1, el modelo AR (1) es estacionario y el estimador de φ por Mínimos

Cuadrados Ordinarios, φˆ, es igual al estimador Máximo Verosímil y sigue asintóticamente

una distribución normal. El estadístico t tiene la siguiente distribución asintótica en relación

con la hipótesis nula:

Este estadístico se distribuye como un t de Student de (T-1) grados de libertad para muestras

pequeñas. En base a esto, se puede contrastar la hipótesis de existencia de raíz unitaria en la

serie Yt donde no existe estacionariedad, contrastando hipótesis nula en el modelo anterior

mencionado. Surge un problema cuando no se conoce si


el modelo bajo estudio es estacionario, cuando φ = 1, cuando es estimador φ está inclinado

hacia abajo y el estadístico t no sigue una distribución normal, por último, cuando se utilizan

los valores críticos de esta distribución se tiene a rechazar la hipótesis nula.

Contraste de hipótesis del modelo:

El estadístico Dickey Fuller no sigue una distribución conocida bajo la hipótesis nula de no

estacionariedad, calcula los percentiles del estadístico bajo la H O junto con los niveles críticos

correctos para el estadístico con relación al tamaño de la muestra y el nivel de significancia.

De acuerdo con el estadístico de Dickey Fuller, si existe la raíz unitaria a un nivel de

significancia si el valor muestral del estadístico t es menor que el valor critico se rechaza la

hipótesis nula. t< DFα.

Se consideran las hipótesis alternativas generalizadas que sean capaces de incluir

estacionariedad de una tendencia lineal en los casos de series económicas. Si el modelo AR

(1) tiene una constante:

Se resta Yt-1 de ambos lados y se obtiene lo siguiente:


Se plantea el contraste de la hipótesis nula de raíz unitaria del modelo

H0 : β = 0 Ha : β < 0

Estadístico de contraste

Donde β es el estimador MCO de β y Vˆ (βˆ) el de su varianza. Si el

modelo AR tiene tendencia lineal:

Un modelo que se estima por mínimos cuadrados ordinarios se refleja de la siguiente manera:

Se usa el estadístico t para poder contrastar la hipótesis nula de raíz unitaria H0.

Contraste de Dickey Fuller este es un proceso más general ARMA(p,q) que puede

acercarse hasta el grado de bondad necesario mediante un AR(p):

El proceso de un modelo AR(p) tiene una raíz unitaria, lo cual contrastar la hipótesis nula de

existencia de raíz unitaria es equivalente a contrastar la hipótesis en la


regresión. Dickey Fuller aumentado es un contraste de raíz unitaria y se basa en estimar el

MCO del parámetro β en el modelo bajo estudio.

Se procede a realizar el contraste de la hipótesis nula de raíz unitaria.

Como ejemplo, se analizará la información de Pieles de Lince que es estacionaria en varianza,

pero se hará por medio de la estacionariedad en media. Se puede observar en el grafico 5.3 la

serie en logaritmo y su primera diferencia. La serie estacionaria en media oscila de manera

cíclica alrededor del nivel promedio constante, sin embargo, al diferenciarla esto no modifica

su comportamiento, pero pasa a estar cerca del nivel promedio cero. El grafico 5.4 hace

referencia a el Correlograma de la serie estacionaria en media. En conclusión, aun

modificando la seria estacionaria en


varianza no modifica ni su comportamiento ni el Correlograma, es decir, que cuando una

seria es estacionaria no hace falta modificarla.


Identificación del modelo estacionario

Identificación de los órdenes de p, q. La función autocorrelación sirve para

identificar los órdenes p y q del modelo ARIMA. Los coeficientes de autocorrelación

muestral de Zt son:

Donde T*= T-d es la longitud de la serie estacionaria Zt

Para identificar los órdenes se comparan las funciones de autocorrelación muestral con las

FAC del modelo ARIMA, mismas que tienen las siguientes características:

El proceso de identificación depende el corte que presente el Correlograma muestral de la

serie. Si tiene un corte la identificación es sencilla y si no presenta ningún corte, pero es

decreciente siguiendo una estructura exponencial, la identificación se la denomina confusa.

Otro proceso que ayuda a identificar es la autocorrelación parcial. Este mide el grado de

relación lineal que existe entre las variables y sus funciones son las siguientes:

p0 = 1 y p1 = ρ1

Los coeficientes pk no dependen de unidades y son menores que la unidad en valor

absoluto.
La FACP es una función simétrica.

La FACP d de un proceso estocástico estacionario decrece rápidamente hacia cero

cuando k → ∞.

Para estimar la función de autocorrelación parcial se realiza a partir de los datos de la serie

como una función de los coeficientes de autocorrelación simple estimado. La estructura de la

función es la siguiente:

Estas son las características de una función de autocorrelación simple y parcial

Las estructuras de las FAC y FACP son importantes para para identificar el orden del proceso ARMA

(p, q) adecuado para la serie, realizando contrastes sobre la significación individual de los coeficientes

de autocorrelación simples y parcial estimados.

El estadístico se distribuye bajo la hipótesis nula de la siguiente manera:

Lo esencial de las funciones de autocorrelación se basa en buscar un modelo sencillo que reproduzca

las características de la serie bajo estudio. Existe la probabilidad que exista un coeficiente

significativo aun cuando los datos se generaron por medio del ruido blanco. Los
coeficientes de autocorrelación muestral están correlacionados entre sí. Entre mayor es el tamaño de

muestra más fácil es el proceso de identificación.

Siguiendo el ejemplo de Pieles Lience, en el grafico 5.7 muestra que la función autocorrelación

simple que está decreciendo en forma onda que sugiere un modelo con orden mayor o igual que 2. La

función de autocorrelación parcial muestra que los primeros coeficientes son significativos distintos

de cero pero el resto de los coeficientes no, decrece rápidamente a partir del retardo número 2 en

forma cíclica. Existen dos modelos que corresponde a (3) y (2,1).

Inclusión del término independiente

La media de un proceso estacionario está relacionado con la constante. Cuando la

constante es cero, la media también lo es. Se contrasta si la media es cero para poder

decidir si se incluye un término independente no nulo en el modelo.


Como ejemplo, en el gráfico 5.3 se muestra que las observaciones están alrededor de

la media diferente de cero.

La tabla anterior muestra los estadísticos principales descriptivos de la serie

estacionaria bajo estudio, mismos que sirven para contrastar si la media es nula o no.
La tabla anterior muestra los estadísticos principales descriptivos de la serie

estacionaria bajo estudio, mismos que sirven para contrastar si la media es nula o no.

Se recha la hipótesis nula y se incluye el termino constante en el modelo, en resumen

los modelos para la serie estacionaria quedan de las siguiente manera:

Estimación

Después del proceso de identificación se procede a el proceso de estimación:


Se puede estimar por el método de Mínimos Cuadrados Ordinarios o por el Método de Máxima

Verosimilitud. La función del Método De Mínimos Cuadrados es la siguiente:

La función del Método de Máxima Verosimilitud es la siguiente:

Estas dos funciones o métodos se derivan a partir de las innovaciones y para calcularlas se necesita de

un vector de parámetros no conocidos y se necesita de un conjunto de valores iniciales como Z0, Z1, .

. ., Zp−1 y a0, a1, . . ., aq−1.

Como siguiente paso, se debe aproximar a la innovación, pero con la condición sobre los valores

iniciales, y esto hace referencia a que las primeras observaciones de Zt son los valores iniciales y las

innovaciones previas a cero. Existen métodos para estimar Máxima Verosimilitud y Mininos

Cuadrados Ordinarios no condicionados que se basan en la máxima función de verosimilitud, que es

la combinación de la función de verosimilitud condicionada y la de densidad no condicionada para los

respectivos valores iniciales.

Estimación del modelo 1 propuesto para la transformación estacionaria


Estimación del modelo 2 propuesto para la transformación estacionaria

Validación del Modelo

Se evalúa la adecuación de los datos de los modelos estimados. Además, se considera si los

coeficientes son significativos, si cumplen las condiciones de estacionariedad y si los residuos tienen

un comportamiento parecido a las innovaciones (ruido blanco).

Análisis de coeficientes estimados

Se realiza el contraste de significancia de los coeficientes AR y MA para ver si el modelo

que se ha propuesto está sobre identificado.

Los contrastes para un modelo ARIMA constante son los siguientes:

Se utiliza el estadístico t de distribución normal para contrastar la hipótesis nula de no

significancia individual. Se rechaza la hipótesis nula:


Para saber si el modelo propuesto cumple estacionariedad e invertibilidad se calcula el

polinomio autorregresivo. Si alguna raíz esta próxima a la unidad se dice que falta

estacionariedad y/o invertibilidad.

Modelo AR (3). Análisis de los coeficientes.

Contrastes de significancia individual:

Estacionariedad del modelo AR (3)


Correlaciones de los coeficientes estimados son bajos

Modelo (2,1). Análisis de los coeficientes

Contrastes de significancia individual:


Estacionariedad e invertibilidad (2,1)

Las medias móviles cumplen la condición de invertibilidad:

Las correlaciones de los coeficientes son muy bajos:

Análisis de residuos

Los residuos son estimaciones, son una serie de contrataste de diagnóstico con la finalidad de conocer

si el comportamiento que ocurrió con ruido blanco también sucede cuando se aplica residuos, en

otras palabras, si la varianza en igual a cero y es contante y si las

autocorrelaciones son nulas. Contraste de hipótesis:

Como método para comprobar que la varianza sea cero, es por medio del análisis del gráfico de los

residuos. Si la gráfica muestra que los residuos están constantes, concluiremos que la varianza

permanece contaste. Pero si se comportan como la gráfica de ruido blanco, los coeficientes de

autocorrelación y autocorrelación parcial se denominan nulos para todos los


retardos. Y para comprobar aquello realiza lo siguiente, contrastes de significancia individual sobre

los coeficientes de autocorrelación:

Si los coeficientes de autocorrelación estimados están fuera del intervalo de significancia es

un ruido blanco. Así:

Otra manera de realizar un contraste de significancia cuando la hipótesis es nula es la

siguiente:

Se rechaza la hipótesis nula y si existiese correlación serial en los residuos del modelo se

concluiría que el modelo no es capaz de reproducir el patrón de comportamiento y que habría

que volver a reformularlo.

Para el contraste de normalidad, con mayor frecuencia se usa el estadístico de Jarque-Bera

que nos dice que la hipótesis nula de normalidad se distribuye asintóticamente y se rechaza la

hipótesis nula de significación del 5% en el caso de que el estadístico es < que 5.99.

Ejemplo Pieles de Lince

Gráficos y Correlograma:
En el gráfico de los residuos muestra que las observaciones oscilan en torno a cero con una varianza

bastante homogénea. El Correlograma de los dos modelos muestran que los estimados están dentro de

las bandas de no significación, los retardos son muy bajos.

Estadísticos descriptivos principales de los dos modelos estimados:


Estadístico de Box-Ljung:

No se rechaza la hipótesis nula y el contraste de Jarque-Bera queda de la siguiente

manera:

Se concluye que los dos modelos propuestos satisfacen los contrastes de diagnóstico, ambos

recogen la estructura del ejemplo Pieles de Lince.

También podría gustarte