Está en la página 1de 33

Esta obra esta bajo una licencia reconocimiento-no comercial 2.

5
Colombia de creativecommons. Para ver una copia de esta licencia,
visite http://creativecommons.org/licenses/by/2.5/co/ o envi una
carta a creative commons, 171second street, suite 30 San
Francisco, California 94105, USA

PAQUETES ESTADSTICOS
PARA MODELAR SERIES DE
TIEMPO

Autores:

Mnica Yolanda Mogolln Plazas


Director Unidad Informtica:

Henry Martnez Sarmiento

Tutor Investigacin:

Alejandro Nieto

Coordinadores:

Alvaro Schneider Guevara


Juan Felipe Reyes Rodrguez

Coordinador Servicios Web:

Miguel Ibaez

Analista de Infraestructura
y Comunicaciones:

Alejandro Bolivar

Analista de Sistemas de
Informacin:

MesiasAnacona Obando

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
BOGOT D.C.
JUNIO 2010

PAQUETES ESTADISTICOS PARA


LA MODELACIN DE SERIES DE
TIEMPO
Director Unidad Informtica:

Henry Martnez Sarmiento

Tutor Investigacin:

Alejandro Nieto

Auxiliares de Investigacin:
CAMILO ALBERTO ZAPATA MARTNEZ
DAVID FELIPE BELTRAN SNCHEZ
DAVID CAMILO SANCHEZ ZAMBRANO
DIEGO ARMANDO POVEDA ZAMORA
EDGAR ANDRS GARCIA HERNNDEZ
IVAN ALBEIRO CABEZAS MARTNEZ
JAVIER ALEJANDRO ORTIZ VARELA
JORGE ALBERTO TORRES VALLEJO
LAURA VANESSA HERNANDEZ CRUZ

JORGE LEONARDO LEMUS CASTIBLANCO


LILIANA CAROLINA HERRERA PRIETO
WILLIAM CAMILO CASTRO LOPEZ
CINDY LORENA PABON GMEZ
MONICA YOLANDA MOGOLLON PLAZAS
SANDRA MIREYA AGUILAR MAYORGA
SANDRA MILENA CASTELLANOS PEZ
JOS SANTIAGO APARICIO CASTRO
JUAN CARLOS TARAPUEZ ROA

Este trabajo es resultado del esfuerzo de todo el equipo


perteneciente a la Unidad de Informtica.
Se prohbe la reproduccin parcial o total de este documento,
por cualquier tipo de mtodo fotomecnico y/o electrnico,
sin previa autorizacin de la Universidad Nacional de
Colombia.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
BOGOT D.C.
JUNIO 2010

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

TABLA DE CONTENIDO
TABLA DE CONTENIDO......................................................................................................... 3
1.

RESUMEN ........................................................................................................................... 4

2.

ABSTRACT......................................................................................................................... 4

3.

INTRODUCCIN ............................................................................................................. 5

4.

Es el programa diseado para series? Presencia del componente Arima.......................... 6

5.

Metodologa Box Jenkins: comparacin de procedimientos............................................ 11


Descripcin de la serie a modelar........................................................................................ 11
Antes de comenzar: Transformacin de la serie y pruebas de raz unitaria. ...................... 11
Etapa 1: identificacin. .......................................................................................................... 18
Funcin de autocorrelacin.................................................................................................. 19
Criterios de informacin. ................................................................................................. 26
Etapa 2: Estimacin. .......................................................................................................... 26

6.

CONCLUSIONES ............................................................................................................ 32

7.

BIBLIOGRAFIA ................................................................................................................. 33

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
3

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

1. RESUMEN
Los modelos estadsticos para administrar series de tiempo son en la actualidad
herramientas prcticas para acercarse a la modelacin de series econmicas, para variables
que se cree tienen cambios en el tiempo permanentes. La mayora de paquetes estadsticos
en el mercado ofrecen algn componente para modelos Arima, pero no todos ofrecen la
misma gama de pruebas sobre los supuestos o capacidad de pronsticos. En este informe se
propone completar el informe pasado sobre las diferencias en la modelacin Arima a travs
de al metodologa Box Jenkins para los programas Stata 10, Winrats7.2, Matlab 7,9, Eviews 9,
R y Jmulti. El criterio para evaluar la capacidad del programa en series es la gama de
funcionalidades para llevar a cabo la metodologa Box Jenkins. Se podr observar que
mientras unos programas son especializados en series y por tanto ofrecen un comando para
ejecutar la estimacin y las pruebas de ruido blanco, otros permiten no tiene comandos
directos aunque permiten programar.

2. ABSTRACT

Statistical models to manage univariates time series are currently practical tools to bring
economic series, for which expected changes in time have a permanent impact. Most
statistical packages in the market offer some component for Arima models, but not all offer
the same range of evidence on the assumptions and forecasting capability.The criterion to
assess the programme capacity in series is the range of functionality for the Box Jenkins
methodology.In this report the propose is to study the differences in the Arima modeling
through the Box Jenkins methodology for Stata 10, Winrats7.2, Matlab 7.9, Eviews 9, R and
Jmulti programs. It will see programmes are specialized in series, and therefore to provide a
command to run the estimation and the white noise tests, others allow has no direct
commands while programming.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
4

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

3. INTRODUCCIN
Los paquetes estadsticostienen diferentes especialidades que es necesario reconocer para
hacer una eleccin adecuada a la hora de analizar una base de datos con un modelo
economtrico especfico. En el caso de la modelacin de series de tiempo univariadas todos
los paquetes analizados ofrecen algn componente o conjunto de herramientas para aj ustar
un modelo Arima, evaluar sus supuestos y hacer predicciones. Sin embargo la diferencia
entre paquetes radica en que algunos son diseados para los modelos de series de tiempo
como puede ser WinRats y JMulti, mientras que otros son tienen un rango ms amplio de
aplicacin dentro del campo estadstico, y esto hace que sus herramientas para series sean
muy bsicas, o que sea necesario programar las iteraciones para estimacin, que puede
tomar tiempo de aprendizaje y elaboracin al investigador.
El procedimiento ms comn para estimar y escoger un proceso Arma es a travs de la
metodologa Box Jenkins. Es muy usadaya que a travs de un proceso por etapas, conduce a
una modelacin que permite obtener el mejor modelo para el pronstico. Por tanto si un
programa permite efectuar todas las etapas Box-Jenkins con la mayor facilidad y el mayor
rango de pruebas para decidir, ser un criterio de capacidad adecuada del programa para la
aplicacin de herramientas economtricas a series de tiempo univariadas.
Esta metodologa propone en primer lugar transformar la serie objeto de anlisis para que
pueda ser estimado un proceso estocstico con las propiedades Arma. La serie tiene que ser
estacionaria por supuesto para lo cual se pueden aplicar transformaciones de varianza y de
nivel. El segundo paso es identificar un modelo, un proceso que no es muy preciso y
depende tanto de la intuicin del investigador como de las herramientas que dispone, en
este caso las pruebas y graficas que arroje cada programa. Despus de identificado un
modelo Arima, se procede a estimar los coeficientes, y es posible que difieran dependiendo
del mtodo de estimacin utilizado. Finalmente se verifican los supuestos sobre los
residuales, se corrigen los modelos si es necesario, y con el modelo (o los modelos)
resultantes se efectan las predicciones, que es el fin ltimo de todo el proceso1 . El modelo
escogido ser el que mejor ofrezca pronsticos de acuerdo a criterios estadsticos.
El propsito es entonces evaluarcomo se puede ejecutar la metodologa Box Jenkins para
series de tiempo, en cada paquete estadstico Stata 10, Winrats7.2,Matlab 7.9, Eviews 9, R y
Jmulti y dar un conclusin sobre los paquetes que serian mas prcticos y equipados para este
tipo de modelos.
1

Esta metodologa fue planteada por primera vez en Box, George and Jenkins, Gwilym (1970) Time series analysis: Forecasting and control, San Francisco: HoldenDay.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
5

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

4. Es el programa diseado para series? Presencia del


componente Arima
Antes de abordar los procedimientos de la metodologa Box-Jenkins debemos saber si los
paquetes en estudio ofrecen en su interfaz grfica o en su conjunto de comandos los
procedimientos
ya programados para la estimacin de modelos Arima y sus
correspondientes pruebas.
Stata 10.
Tiene un modulo de men para series Arima, que permite hacer la estimacin, escoger el
tipo de mtodo de estimacin, y hacer diversas pruebas de raz unitaria. No ofrece pruebas
directas de ruido blanco. Sin embargo da la apariencia de que el modulo de series no es el
nfasis de Stata, ya que su rango de accin se observa mas amplio en metodologas
estadsticas y en conjuntos panel.

Matlab
Ofrece un conjunto de herramientas (toolbox en el lenguaje de matlab) de econometra que
incluye la estimacin de modelos para series financieras y para series multivariadas, donde se
podra estimar un modelo Arima, pero este se hace como la media de un modelo en el que
originalmente se quera modelar la varianza, a travs del comando Garch.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
6

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Tambin ofrece un conjunto de herramientas para hacer el tratamiento inicial a las series de
tiempo. En este toolbox, se puede importar las series, se puede asignar una frecuencia de
tiempo, graficar y sacar correlaciones sin necesidad de utilizar el lenguaje de programacin.

En general Matlab no esta especficamente diseado para series, ya que dentro de su amplio
rango de aplicacin se encuentran muchos otros campos en las ciencias fsicas, adems de
que los procedimientos fundamentales como las pruebas de supuestos y los pronsticos
toca programarlos. No obstante, incorpora herramientas para un anlisis bsico de series.
Eviews.
Ofrece un men para realizar un tratamiento inicial las series, donde se encuentran pruebas
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
7

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

como las de raz unitaria y autocorrelaciones. En cuanto a los procesos de estimacin,


pruebas y pronsticos no ofrece facilidades de la interfaz y seria necesario programar.

Rats.
Es un programa especializado que soporta todos los modelos para manejar los problemas de
errores ruido blancos y rezagos en el tiempo como es el caso de toda la familia Arima, Var y
Garch. Permite configuraciones personalizadas para la estimacin no lineal, as como tambin
ofrece configurar modelos con cualquier tipo de rezagos. Ofrece programacin para mltiple
pruebas de raz unitaria y diversas pruebas de ruido blanco. Facilita todo tipo de
transformaciones a las series as como su fcil importacin. Permite hacer pronsticos
estticos y dinmicos a diferentes pasos adelante. En general ofrece todas las herramientas
en una manera personalizada y fcil de manipular.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
8

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

R.
Para el programa de licencia libre R, siempre se desarrollan de manera continua paquetes
que contienen funciones para los modelos economtricos recientes. Los modelos Arima no
son la excepcin, dentro de la comunidad de R se han desarrollado paquetes comofarma,
tseries,fseries, que permiten la manipulacin dentro del kernel de series de tiempo. Sin
embargo estas libreras requieren a su vez una lista larga de otras libreras lo que hace el
inicio del trabajo un esfuerzo innecesario por parte del investigador para cargar la
informacin necesaria. Por otro lado los paquetes desarrollados aunque ofrecen
herramientas avanzadas para la estimacin no proveen muchas funciones de prediccin.

Jmulti.
Es un programa especializado en modelacin de series pero su mayor fuerte son los
modelos de sistemas de ecuaciones Var. Para los modelos Arima ofrece un mdulo que
contiene pestaas para representar paso a paso las etapas de la modelacin. Permite
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
9

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

configurar algunos rezagos, generar de manera sencilla criterios de informacin, realizar


pruebas de ruido blanco y hace pronsticos estticos y dinmicos.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
10

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

5. Metodologa Box Jenkins: comparacin de


procedimientos.

Descripcin de la serie a modelar.


Para la comparacin de las etapas de la metodologa Box Jenkins, utilizamos la serie del
consumo trimestral ajustada en estaciones, para Alemania de 1960-1 a 1982-42 .
La grafica de la serie generada por defecto en algunos de los paquetes:
Grafica para el Consumo en Matlab

Grafica del Consumo en Eviews

Como se puede observar tiene una media que varia en el tiempo, y requiere
transformaciones para que la serie sea estacionaria.

Antes de comenzar: Transformacin de la serie y pruebas de raz unitaria.


A continuacin se muestra los procedimientos y resultados en los programas para
transformar una serie de tiempo cuando esta no es estacionaria. En primer lugar se puede

Esta serie es tomada de la bases de ejemplo de Helmut Ltkepohl (Editor), MarkusKrtzig (Editor), Applied
Time Series Econometrics (Themes in Modern Econometrics), Cambridge UniversityPress, 2004. Capitulo 2.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
11

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

aplicar pruebas de raz unitaria como una herramienta estadstica que permitira verificar si
una serie es estacionaria.
La prueba DickeyFuller contrasta la hiptesis de que el coeficiente de la siguiente
regresin sea igual a cero. Si ese coeficiente es cero quiere decir que el proceso tiene raz
unitaria, es decir que el rezago de la serie no provee informacin suficiente para explicar la
diferencia de la variable, en este caso la variable depende de su valor anterior ms un error
aleatorio. En caso contrario, la serie tendra rezagos que permiten explicar el valor actual. Si
la prueba es aumentada, tenemos una constante y un trmino de tendencia.

Para las series, se testea la hiptesis nula con el estadstico t, de que el proceso tenga raz
unitaria. Tambin se testea la existencia de tendencia.
En primer lugar se hace una transformacin logartmica de manera que se estabiliza la
varianza. Posteriormente se realiza la prueba de raz unitaria. En todos los programas esta
transformacin es fcil de realizar, aplicando la funcin logartmica sobre la serie u objeto.
A continuacin se muestra una comparacin de las pruebas disponibles mas comunes
(comandos o procedimientos listos para usar) para identificar la raz unitaria, en los paquetes
Rats, Eviews y Matlab. Es posible en los programas conducidos por comandos crear las
pruebas que no existan. Todas la pruebas buscan testear una ecuacin, pero varan en la
forma como especifican el error de dicha ecuacin.
Presencia de un comando de raz unitaria para cada prueba.
Paquete
Dickey - DickeyKwaitowsky
PhillipsEstadistico/matemtico Fuller
Fuller
Pherron
aumentada
Rats
x
x
x
x
Eviews
x
x
x
x
Matlab
x
x
x
Stata
x
x
x
R
x
x
x
JMulti
x
x
x

Schmidt
& Phillips

x
x

La prueba ms usada es la prueba DickeyFuller. En todos los programas se corrern con


cero rezagos de la diferencia. El propsito de esta prueba es solo comparativo, es decir para
observar los procedimientos
Eviews: el procedimiento es muy sencillo, est dentro del men quick, series statistics,
unitroot test. Este permite configurar los parmetros de la prueba y finalmente genera una
ventana con los resultados. Permite configurar parmetros de la ecuacin que se desea
testear, como la inclusin de tendencia y constante, indicar cuantos rezagos se incluyen o
dejar que se estimen criterios de informacin que indiquen cual es el nmero ptimo de
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
12

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

rezagos a incluir.
Dentro de los resultados se muestran los valores crticos de la funcin de distribucin
calculada en diferentes niveles de significancia. Pero adems muestra los resultados de la
regresin, y las pruebas de inferencia para los parmetros de la ecuacin.

Resultados.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
13

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Null Hypothesis: LCONS has a unit root


Exogenous: None
LagLength: 0 (Fixed)

Augmented Dickey-Fuller test statistic


Test criticalvalues:
1% level
5% level
10% level

t-Statistic

Prob.*

15.60972
-2.590622
-1.944404
-1.614417

1.0000

*MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation


Dependent Variable: D(LCONS)
Method: LeastSquares
Date: 05/28/10 Time: 13:22
Sample (adjusted): 2 92
Includedobservations: 91 afteradjustments
Variable
LCONS(-1)
R-squared
Adjusted R-squared
S.E. of regression
Sum squaredresid
Log likelihood
Durbin-Watson stat

Coefficient

Std. Error

t-Statistic

Prob.

0.002663

0.000171

15.60972

0.0000

-0.061761
-0.061761
0.011294
0.011479
279.3781
1.957701

Meandependentvar
S.D. dependentvar
Akaikeinfocriterion
Schwarzcriterion
Hannan-Quinncriter.

0.018678
0.010960
-6.118200
-6.090608
-6.107068

Matlab: Tiene un comando llamado dfARDTest que realiza la prueba de DickeyFuller.


Asume por hiptesis nula que el proceso tiene raz unitaria sin tendencia. Se debe crear una
matriz que contenga los resultados de la prueba. Esta es la escritura para efectuar la prueba
[H,pValue,TestStat,CriticalValue] = dfARTest(Y,Lags,Alpha,TestType)

Se le tiene que indicar al comando los rezagos, el nivel de significancia, el tipo de Test (si es
para Arima, y que estadstico se utiliza, t o f). La prueba genera una decisin lgica llamada
H, que es igual a 1 si se rechaza la hiptesis a un nivel de significancia dado. Genera tambin
los t estadsticos, p-valor y los valores crticos asociados a la decisin H.
Los resultados son muestran solo los elementos que se sealan en los comandos. De todos
los programas es el que menos resultados muestra, con solo un valor crtico y solo un
estadstico.
H=
0
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
14

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

pValue =
0.9990
TestStat =
15.6097
CriticalValue =
-1.9445

Rats: estima tiene una variada oferta de pruebas de raz unitaria, y que ofrece como
programas externos dentro de su pgina de internet. Se llama a un archivo externo llamado
dfunit, que ejecuta una prueba Dickey-Fuller.Ofrece realizar el procedimiento de la prueba
tanto desde un men, como el que se ve en la siguiente grfica, como desde un programa
externo que se descarga de la pgina Estima, que permite configurar los rezagos, el tipo de
hiptesis que se genera, los rezagos que se incluyen, las distribuciones del estadstico de
prueba, y la inclusin de trminos constantes.
source(noecho) dfunit.src
@dfunit(lags=0) dlx;
Los resultados son:
Dickey-Fuller Unit Root Test, Series DLX
Regression Run From 1960:03 to 1982:04
Observations
91
With intercept
Using 0 lags on the differences
Sig Level
1%(**)
5%(*)
10%

Crit Value
-3.50296
-2.89320
-2.58344

T-Statistic

-8.29546**

Stata: se puede ejecutar a travs del men, que genera la programacin en la ventana de
resultados. El comando utilizado es dfuller. Permite ajustar si tiene constante o tendencia, y
cuantos rezagos se incluyen. En los resultados se observan, si se desea los resultados de la
regresin. Se encuentran los valores de la distribucin generada para distintos niveles de
significancia.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
15

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Resultados para stata.


Dickey-Fuller test for unit root

Z(t)

Number of obs

Test
Statistic

1% Critical
Value

4.275

-3.523

91

Interpolated Dickey-Fuller
5% Critical
10% Critical
Value
Value
-2.897

-2.584

MacKinnon approximate p-value for Z(t) = 1.0000

R: Dentro del paquete tseries se encuentra un comando para efectuar la prueba de raz
unitaria, llamado adf.test.

Donde x significa el nombre de la serie a analizar, alternative es la hiptesis alternativa que


puede ser estacionaria o explosiva. K, es el nmero de rezagos a incluir, donde el valor por
defecto se indica con la operacin arriba mostrada. La ecuacin que se prueba contiene
constante y tendencia, eso no se puede modificar. Los p valor son interpolados de una tabla
predeterminada por Banerjiee(1993).
Jmulti: ofrece dentro del mdulo de anlisis inicial una pestaa para las pruebas de raz
unitaria. Permite escoger si se incluye tendencia y constante, permite determinar el nmero
de rezagos. La prueba genera los criterios de informacin para determinar los rezagos
ptimos. Es bastante fcil de generar, como todos los procedimientos en JMulti.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
16

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Los resultados incluyen las pruebas de inferencia sobre los coeficientes de la distribucin.
Incluyen los resultados ptimos para los criterios de informacin.
sample range:
[1960 Q4, 1982 Q4], T = 89
lagged differences:
2
no intercept, no time trend
asymptotic critical values
reference: Davidson, R. and MacKinnon, J. (1993),
"Estimation and Inference in Econometrics" p 708, table 20.1,
Oxford University Press, London
1%
5%
10%
-2.56
-1.94
-1.62
value of test statistic: 4.8402
regression results:
--------------------------------------variable
coefficient t-statistic
--------------------------------------x(-1)
0.0137
4.8402
dx(-1)
0.0110
0.1010
dx(-2)
0.1399
1.2578
RSS
17319.0676
OPTIMAL ENDOGENOUS LAGS FROM INFORMATION CRITERIA
sample range:
[1962 Q4, 1982 Q4], T = 81
optimal number of lags (searched up to 10 lags of 1. differences):
AkaikeInfoCriterion: 4
Final Prediction Error: 4
Hannan-QuinnCriterion: 3
SchwarzCriterion:
3

Finalmente, en el siguiente cuadro comparativo se muestra las funcionalidades que permite


cada programa para la prueba DickeyFuller.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
17

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Configuracin de la Prueba DickeyFuller


Paquete
Rats
Eviews
Matlab
Stata
Estadstico/matemtico
Especificar nmero de
rezagos
Calcular nmero ptimo
de rezagos
Especificar presencia de
constante y tendencia
Especificar hiptesis nula
Mostrar resultados de la
regresin
Mostrar varios valores
crticos a diferentes niveles
de significancia

JMulti

x
x

Dado que en todos los resultados se obtuvo raiz unitaria, procedemos a tomar la primera
diferencia de la serie. Esta transformacin se obtiene con facilidad en stata, rats, jmulti,
eviews, a travs de operaciones sobre la serie. Con una mayor dificultad en matlab y R. a
continuacin se observa cmo se genera una variable diferenciada en eviews.

La programacin para matlab sera:


>>dlcons=diff(lcons)
Etapa 1: identificacin.
Despus de tomar la serie transformada para cumplir las condiciones de estacionariedad
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
18

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

necesarias para este tipo de modelos Arima, procedemos a identificar un modelo. Existen
dos procedimientos para este fin: uno ms intuitivo a travs de las grficas de
autocorrelacin y a travs de la optimizacin de criterios de informacin.
Funcin de autocorrelacin
La funcin de autocorrelacin permite observar el comportamiento de la relacin entre las
observaciones para diferentes periodos del tiempo. Si estas correlaciones son
permanentemente mayores que cero, se puede decir que son procesos Permite detectar si
una serie es estacionaria o no. Si las autocorrelaciones decaen rpidamente a cero, la serie
es estacionaria.
Adems las grficas de autocorrelacin son una herramienta para identificar de manera
intuitiva los rdenes de un modelo Arima. La grfica de autocorrelacin simple permite
identificar el nmero de rezagos de medias mviles. La grafica de autocorrelacin parcial
permite identificar el nmero de rezagos autorregresivos.
Los procedimientos en cada programa varan, pero en general se muestran los mismos
resultados, solo que cambia su presentacin visual.
Eviews: una vez se tiene la serie en un Workfile, se ingresa al men Quick, Series Satistics,
Correlogram. Es un procedimiento sencillo y los resultados son bastante completos, adems
la grafica esta editada y lista para presentar. Genera tanto la grfica de autocorrelacin
parcial como la simple. Adems muestra una tabla con los nmeros exactos de las
correlaciones.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
19

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Matlab: se escribe el comando autocorr(cons) en el commandwindow y se genera una grfica


de la funcin de autocorrelacin simple, adems de que guarda una nueva variable con las
autocorrelaciones. Para obtener una grafica de barras toca personalizar la grfica con plot.
Para la grfica de autocorrelaciones parciales, se tiene el comando parcorr, que genera la
grfica y guarda una nueva variable con las autocorrelaciones parciales.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
20

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Matlab tambin ofrece una caja de herramientas, para series dentro de la cual se genera una
funcin de autocorrelacin. Esta es presentada de una manera diferente a las anteriores
grficas. No muestra los niveles de significancia, muestra una escala tanto para rezagos
positivos como negativos. Se observa parta el consumo alemn en la siguiente grfica:

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
21

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Autocorrelation: German consumption


1

0.95

0.9

0.85

0.8

0.75

0.7

0.65
-10

-8

-6

-4

-2

10

Lags

Rats: se escribe en el input el comando correlate para generar las correlaciones en una
nueva variable y luego se grafica la variable. La grafica se genera de acuerdo a la
personalizacin dada en el comando, donde se escoge barras para facilidad de interpretacin
y se pueden sombrear las autocorrelaciones que sean significativas segn un intervalo de
confianza. El procedimiento tambin se puede hacer mediante mens. Es decir se puede
generar la grfica mediante un icono de la opcin Series Window.
correlate(stderrs=se,number=24) lx / corr
setsignif 1 24 = abs(corr/se)>2.0
graph(style=bargraph,number=0,max=1.0,min=-1.0,shading=signif) 1
# corr 1 24

Las graficas obtenidas en rats tienen la siguiente presentacin grfica:

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
22

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

1.00
0.75
0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
0

10

15

20

-1.00

-0.50

0.00

0.50

1.00

Stata: tiene varios comandos que permiten generar una funcin de autocorrelacin. Ofrece
la facilidad de generar la grfica automticamente, con el comando ac, ofrece un sombreado
para las autocorrelaciones significativas de acuerdo a la frmula de Barlett para rezagos de
media mvil. Tambin est el comando pac que genera las autocorrelaciones parciales y su
respectiva grafica si necesidad de configurarla.

10

20
Lag

30

40

Bartlett's formula for MA(q) 95% confidence bands

R: en este programa las funciones de correlacin y correlacin parcial se obtienencon el


comandoacf y pacf del paquete fseries. Cada comando permite configurar el ttulo de la
grfica, los rezagos. El intervalo de confianza es generado por defecto. La presentacin de la
grfica no se puede editar.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
23

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

par(mfrow=c(2,1), mar=c(2, 4, 4, 2) + 0.1)


acf(as.matrix(r.TRM),lag.max=20,plot=T,lwd=2,xlab='',main='ACF de los Ret. TRM',na.action
= na.pass)
pacf(as.matrix(r.TRM),lag.max=20,plot=T,lwd=2,xlab='',main='PACF
TRM',na.action = na.pass)

de

los

Ret.

La grfica que se obtiene en R es del estilo:

Jmulti: en el mdulo de anlisis inicial en la pestaa de autocorrelaciones se obtienen con


solo un clic tanto la grfica de la funcin de autocorrelacin simple como la grfica de la
autocorrelacin parcial. Se puede escoger entre generar la grfica o generar las series
impresas. No crea las nuevas series como variables. La grfica generada muestra los
intervalos de confianza para los valores significativos, con estilo de barras. No se puede
personalizar el estilo de la grfica.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
24

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
25

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Criterios de informacin.
Los criterios de informacin permiten generar un criterio estadstico para escoger el
nmero ptimo de rezagos y puede ser menos subjetivo que la interpretacin de las
funciones de autocorrelacin parcial. Los criterios son una funcin de la varianza del error y
del nmero de parmetros incluidos dentro del modelo ARMA, promediados por algn
nmero que depende del tamao de la muestra. Entre menos parmetros se tendrn ms
grados de libertad y la varianza ser menor. Lutkepohl(2004) La idea es escoger el nmero
de parmetros que arroje el menor criterio, es decir tiene los parmetros ptimos para una
varianza del error menor.
Por el criterio AIC, aplicado a 12 rezagos en media mvil y en autorregresivos.
,

, donde k es el nmero de parmetros.

A continuacion se muestra una tabla comparativa que muestra la disponibilidad del clculo
de los criterios de informacin en cada programa como un comando especfico. Tambin se
menciona el comando necesario y que tipo de resultado genera .
Programa/criterio

Ackaicke

Schwartz

Rats
Eviews
Matlab
Stata
R
JMulti

Perzonalizar
criterios
x

Comando
necesario

@bjautofit

Los resultados obtenidos en Jmulti para la variable logaritmo del consumo, se obtienen en el modulo
de Arima, en la primera pestaa, a travs del met odo Hannan Kinnon.
original variable:
cons_log
order of differencing (d):
0
adjusted sample range:
[1962 Q4, 1982 Q4], T = 81
optimal lags p, q (searched all combinations where max(p,q) <= 3)
Akaike Info Criterion: p=3, q=0
Hannan-Quinn Criterion: p=3, q=0
Schwarz Criterion:
p=3, q=0

Etapa 2: Estimacin.
Los modelos Arima son ecuaciones no lineales que requiere un proceso de optimizaciones
iteradas para poder hallar un estimador. El estimador que se muestra es aquel que converge
de una iteracin a otra. Existen varias funciones que se pueden optimizar y varios algoritmos
que se pueden seguir para lograrlo.Se considera convergencia cuando el cambio de una
iteracin a otra es pequeo. Se calcula un cambio relativo entre los estimadores de cada
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
26

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

estimacin
Matlab: a travs del comando garchspec, se especifican los rdenes de la media, que
corresponde al modelo arima. Luego se utiliza el comando ajustarchfitpara ajustar un
modelo, incluyendo la opcin de estimar media, ya que el comando es para estimar la
varianza de los retornos.
Los resultados que se obtienen son los coeficientes estimados y el criterio de convergencia
C.
Coeff =
Comment: 'Mean: ARMAX(3,0,0); Variance: GARCH(0,0) '
Distribution: 'Gaussian'
R: 3
C: 0.0097
AR: [-0.0950 0.2519 0.3119]
VarianceModel: 'GARCH'
K: 1.0204e-004
Rats: tiene un comando de gran potencial por su nivel de precisin llamado Boxjenk. Estima
coeficientes de acuerdo al mtodo y algoritmo designado. Tiene entre sus opciones de
configuracin:
Constant: establece si se incluye constante
Ar: nmero de rdenes autorregresivos.
Ma: nmero de rdenes de media mvil
Diff: nmero de diferencias sobre la variable.
Sdiff= nmero de diferencias estacionales sobre la variable.
Sar, Sma: rdenesestacionales
Method=gauss,bfgs,simplex,genetic,initial. El mtodo es el algoritmo que se usa para
optimizar la funcin. Los primeros dos hacen derivadas de la funcin y tienes
diferentes transformaciones para acercarse al parmetro. Los dos ltimos no hacen
derivadas sino que hacen evaluaciones en la funcin.
Funcin a optimizar: por defecto es mnimos cuadrados. Pero se puede escoger
mxima verosimilitud con la opcin maxl.
El comando boxjenks tambin permite guardar los residuales, guarda los estimadores,
guarda la informacin sobre los estimadores.
Para nuestro caso los resultados mostrados, dado que no se modifica la configuracin
predeterminada, es decir el mtodo de estimacin es Gauss, y la funcin es mnimos
cuadrados. El valor de convergencia es 0.000010, es un alto nivel de precisin. Hace
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
27

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

inferencia sobre los estimadores.


Box-Jenkins - Estimation by LS Gauss-Newton
Convergence in 2 Iterations. Final criterion was 0.0000000<= 0.0000100
Dependent Variable LCONS
Quarterly Data From 1960:04 To 1982:04
Usable Observations
89
Degrees of Freedom 86
Centered R**2
0.999547
R Bar **2 0.999537
Uncentered R**2 0.999998
T x R**2
89.000
Mean of Dependent Variable
6.9577491350
Std Error of Dependent Variable 0.5118883190
Standard Error of Estimate
0.0110169426
Sum of Squared Residuals
0.0104380801
Log Likelihood
276.48090
Durbin-Watson Statistic
2.189968
Q(22-3)
40.027842
Significance Level of Q
0.00324489
Variable
CoeffStd Error
T-Stat
Signif
*******************************************************************************
1. AR{1}
1.020470711 0.103421930
9.86706 0.00000000
2. AR{2}
0.255006837 0.147228673
1.73205 0.08685067
3. AR{3}
-0.273620199 0.104731130 -2.61260 0.01060409

Stata: el comando de estimacin se denomina arima. Permite personalizar cualquier nivel de


rden para el modelo. El mtodo o algoritmo utilizado por defecto es Berndt-Hall-HallHausman (BHHH). Se puede personalizar el mtodo con la opcin tecnique. Tambin es
posible cambiar el nivel de convergencia. En los resultados se muestra por defecto las
iteraciones. Tambin hace inferencias sobre los estimadores. La funcin maximizada es
mxima verosimilitud y no se puede modificar.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
28

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO


(setting optimization to BHHH)
Iteration 0:
log likelihood = -564.37938
Iteration 1:
log likelihood = -434.03999
Iteration 2:
log likelihood = -408.89111
Iteration 3:
log likelihood = -394.23721
Iteration 4:
log likelihood = -392.52473
(switching optimization to BFGS)
BFGS stepping has contracted, resetting BFGS Hessian (0)
Iteration 5:
log likelihood = -391.40789
Iteration 6:
log likelihood = -390.64373
(backed up)
Iteration 7:
log likelihood = -390.26558
(backed up)
Iteration 8:
log likelihood = -389.36087
(backed up)
Iteration 9:
log likelihood = -387.92124
Iteration 10:
log likelihood = -387.89668
Iteration 11:
log likelihood = -387.87717
Iteration 12:
log likelihood = -387.87677
Iteration 13:
log likelihood = -387.87677
Iteration 14:
log likelihood = -387.87677
(switching optimization to BHHH)
Iteration 15:
log likelihood = -387.87677
Iteration 16:
log likelihood = -387.83734
Iteration 17:
log likelihood =
-387.8233
Iteration 18:
log likelihood = -387.82142
Iteration 19:
log likelihood = -387.82058
(switching optimization to BFGS)
BFGS stepping has contracted, resetting BFGS Hessian (1)
Iteration 20:
log likelihood =
-387.8201
Iteration 21:
log likelihood =
-387.82
(backed up)
Iteration 22:
log likelihood = -387.81981
(backed up)
Iteration 23:
log likelihood = -387.81978
Iteration 24:
log likelihood = -387.81938
Iteration 25:
log likelihood = -387.81912
Iteration 26:
log likelihood = -387.81912
Iteration 27:
log likelihood = -387.81912
Iteration 28:
log likelihood = -387.81912
BFGS stepping has contracted, resetting BFGS Hessian (2)
Iteration 29:
log likelihood =
-387.8191
(switching optimization to BHHH)
Iteration 30:
log likelihood =
-387.8191
(backed up)
Iteration 31:
log likelihood = -387.81866
Iteration 32:
log likelihood = -387.81862
Iteration 33:
log likelihood = -387.81851
Iteration 34:
log likelihood = -387.81848
(switching optimization to BFGS)
BFGS stepping has contracted, resetting BFGS Hessian (3)
Iteration 35:
log likelihood = -387.81847
Iteration 36:
log likelihood = -387.81847
(backed up)
Iteration 37:
log likelihood = -387.81847
(backed up)
Iteration 38:
log likelihood = -387.81846
Iteration 39:
log likelihood = -387.81845
Iteration 40:
log likelihood = -387.81845
ARIMA regression
Sample:

1960q1 - 1982q4

Number of obs
Wald chi2(3)
Prob > chi2

Log likelihood = -387.8185


OPG
Std. Err.

P>|z|

=
92
= 131429.05
=
0.0000

var1

Coef.

[95% Conf. Interval]

_cons

1338.049

866.5352

1.54

0.123

-360.3289

3036.427

ar
L1.
L2.
L3.

1.351572
.1368591
-.4893856

.0661285
.1372855
.0905313

20.44
1.00
-5.41

0.000
0.319
0.000

1.221963
-.1322155
-.6668236

1.481181
.4059337
-.3119476

/sigma

15.57939

.8512347

18.30

0.000

13.911

17.24778

var1
ARMA

Se puede observar los diferentes estimadores obtenidos por diferentes mtodos. Sin
embargo al correr el mismo mtodo en Stata, del que se corri en rats, no converge. Tras
estos problemas se modifican los criterios de convergencia.

R: permite a travs del comando armafit, del paquete fArma estimar parmetros Arima. Se
puede escoger la funcin a optimizar, si minimos cuadrados o mxima verosimilitud. Con la
opcin de formula se puede configurar los rdenes del modelo.
armaFit(formula, dat a, method = c("mle", "ols"), include.mean = TRUE, fixed = NULL, title = NULL,
description = NULL, ...).

JMulti: mediante el mdulo de Arima permite realizer la estimacin, aunque solo soporta
mximo 4 rdenes. Utiliza un algoritmo predeterminado llamado Ansenly(1979) . La funcin
que se maximiza es mxima verosimilitud, asumiendo errores normales.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
29

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

Los resultados mostrados, dan informacin sobre el proceso de iteracin, informacin de


inferencia sobre los coeficientes.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
30

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

A manera de resumen se muestra las funcionalidades de estimacin:


Configuracin de la estimacin para Arima.
Funcin/ programa
Rats
Eviews
Matlab
Especificar cualquier x
x
x
orden de rezago
Especificar cualquier
rezago estacional
Funcin de
optimizacin
disponible
Mtodos de
algoritmos
disponibles

x
MCO

Stata
x

JMulti

x
Mco

MAXVer
Gauss

MAXVer MaxVEr

MCO

Gauss

MAXVer
Gauss
Ansenly(1979)

BHHF

Bfgs

Bgfs

Simple
Gender

DavidonFletcherPowell
(DFP)

Posibilidad
de x
cambiar criterio de
convergencia
Nombre
del boxjenks
comando

R
x

equation

garchfit

gauss
x

arima

Armafit
(fArma)

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
31

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

6. CONCLUSIONES
Se generan herramientas para la escogencia estratgica de paquetes para el anlisis de series
de tiempo univariadas. Cada paquete tiene fortalezas y debilidades. Pero se encuentra que
Rats es el paquete mas flexible y completo en cuanto a modelacin Arima, porque ofrece
multiples pruebas de raz unitaria con amplia flexibilidad para modificarlas, ofrece posibilidad
de modificar grficos con precisin, y en la estimacin ofrece la posibilidad de cambiar
mtodos y funciones de optmizacin. Asi como de personalizar cualquier modelo deseado.

Entre los programas menos tiles para Arima se encuentra Matlab, porque no ofrece
facilidad en el tratamiento de series, no ofrece un comando especfico de estimacin, genera
resultados muy simples al investigador, no permite mayores configuraciones con facilidad. Se
podra programar nuevas funciones de maximizacin pero requiere de ms aprendizaje del
lenguaje de matlab.
JMulti a pesar de ofrecer un proceso organizado y sencillo, en realidad no ofrece flexibilidad
en la escogencia de mtodos y modelos. Adems en la estimacin puede generar resultados
muy diferentes a todos los programas porque utiliza un algoritmo poco popular. Su fuerte
no son los modelos Arima.
En cuanto a Eviews, ofrece facilidades en las pruebas de raz unitaria y en las funciones de
autocorrelacin, pero en la hora de la estimacin no es muy preciso. Finalmente Stata
termin con bastantes bondades salvo el defecto de la difcil importacin de datos de series
de tiempo.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
32

PAQUETES Estadsticos PARA MODELAR SERIES DE TIEMPO

7. BIBLIOGRAFIA

Helmut Ltkepohl (Editor), Markus Krtzig (Editor), Applied Time Series Econometrics (Themes in Modern
Econometrics), Cambridge University Press, 2004. Capitulo 2.
Michael N. Mitchell. Strategically using General Purpose Statistics Packages:A Look at Stata, SAS and
SPSS.Statistical Consulting Group.UCLA Academic Technology Services.Technical Report Series
DiethelmWuertz(2009) ARMA Time Series Mod elling.Package fArma. Version 2100.76
User Guide. (2009) Rats 7,2. Estima.Cap 7 Arima.
User Guide, (2009) And Help. Stata Press.

UNIVERSIDAD NACIONAL COLOMBIA


FACULTAD DE CIENCIAS ECONMICAS
UNIDAD DE INFORMTICA Y COMUNICACIONES
33

También podría gustarte