Está en la página 1de 26

Modelos estructurales de series de tiempo

Est. Laura I. Gimnez Universidad Nacional del Nordeste Instituto Nacional de Tecnologa Agropecuaria

Programa

Jueves, 30 de julio de 2009 Introduccin al anlisis de Series Temporales Ejemplos Modelos estructurales Modelos ARMA y ARIMA Componentes de los modelos estructurales: Nivel local y Tendencia lineal local

Viernes, 31 de julio de 2009 Estacionalidad e irregularidades Ciclos Variables explicativas Formas espacio de estado Filtrado y Suavizado Hiperparmetros - Prediccin Aplicacin a lluvias mensuales. Uso del programa Stamp

Bibliografa

1. Abril, J. C. (2004). Modelos para el Anlisis de las Series de Tiempo. Ediciones Cooperativas. Buenos Aires. ISBN 987-1076-54-1. 377 pp. 2. Abril, J.C. (1999) Anlisis de Series de Tiempo Basado en Modelos de Espacio de Estado. Editorial Universitaria de Buenos Aires. EUDEBA. ISBN 950-231024-1. 3. Feyerherm, A. M. and Bark, D. (1965). Statistical Methods for Persistent

Precipitation Patterns. Journal of Applied Meteorology. Vol.4. 4. Harvey, Andrew C. (1989). Forecasting, structural time series models and the Kalman filter. Cambridge Press University. 5. Harvey, Andrew C. (1994). Time Series Models MIT Press. Cambrige, Massachusetts. 6. Instituto Nacional de Meteorologa. www.inm.es 7. Pindyck, R. S. and Rubinfeld, D. L. (1976). Econometric models and economic forecasts. McGraw-Hill, Inc. Kogakusha LTD. 8. Uriel, Ezequiel (1985). Anlisis de Series Temporales modelos ARIMA. Coleccin Abaco. Paraninfo Madrid.

Serie temporales
Las series temporales consisten en observaciones realizadas a intervalos regulares de tiempo. Sus caractersticas salientes son: la tendencia, la cual representa el movimiento de la serie a largo de su recorrido y un patrn estacional el cual se repite, mas o menos, cada ao. Un modelo de la serie necesitar capturar estas caractersticas. El modelo puede formularse asumiendo que la serie puede descomponerse de la siguiente forma: Serie Observada=tendencia+estacionalidad+irregular Donde la componente irregular refleja los movimientos no sistemticos de la serie. Tambin podemos asumir un modelo multiplicativo, el cual es apropiado para algunas series, Serie Observada=tendencia*estacionalidad*irregular

Este modelo puede ser tratado como un modelo aditivo tomando logaritmo.

Para qu modelar? Hay dos razones para querer modelar una serie univariada. La primera es proveer una

descripcin de la serie en trminos de su componente de inters. Al examinar la tendencia,


veremos el movimiento principal de la serie. Puede ser de inters analizar el comportamiento estacional de la serie y, en algunos casos, puede ser interesante quitarlo para producir una serie ajustada estacionalmente. Un modelo estadstico explcito, apropiadamente formulado, clarifica los supuestos subyacentes y representa el movimiento de la serie, la cual puede tener un rango amplio de propiedades. El otro motivo subyacente de la construccin de un modelo es la prediccin de valores futuros. Las series de tiempo pueden contener otros componentes. En la grfica de observaciones anuales, adems de la tendencia, es comn observar comportamientos cclicos. Por ejemplo, los movimientos en economa pueden verse desde el inicio hasta el final una recesin. Hay cambios sociales que pueden no permanecer en el tiempo.

Modelos estructurales El modelo estructural de una serie temporal es uno que arranca en trminos de componentes, las cuales tienen una interpretacin directa. El mismo no intenta representar el proceso de generacin, ayuda a representar en forma estilizada la serie en trminos de descomposicin en componentes, tendencia, estacionalidad y ciclo. Ya que cada parte es de inters en si misma. La prediccin desde un modelo univariado es simple, en el sentido que es, slo una extrapolacin de los movimientos pasados. Un modelo estructural de serie de tiempo permite que sus componentes sean estocsticas, la idea es que sus componentes sean lo suficientemente flexibles que permitan responder a cambios en el tiempo. La formulacin estadstica de la componente de tendencia en un modelo estructural, ser lo suficientemente flexible para representar cambios generales en la direccin de la serie. En forma similar la componente estacional ser flexible de manera que permita responder a cambios en el patrn estacional. Un modelo estructural de serie de tiempo es aquel en el cual la tendencia, la estacionalidad, el ciclo y el error, mas otros componentes relevantes, son modelados explcitamente. Comparado con la filosofa subyacente de los modelos ARIMA, donde la tendencia y la estacionalidad son eliminadas mediante diferenciacin, el modelo estructural es lo opuesto. La facilidad de interpretacin de los modelos estructurales de series de tiempo, los que siempre pueden ser puestos en la forma de espacio de estado, junto con la informacin asociada que producen el filtro y el suavizador de Kalman, hacen de ellos el vehculo natural para el tratamiento de los datos de series de tiempo. La idea bsica de los modelos estructurales de series de tiempo (MEST) es que por medio de ellos se pueden expresar los componentes, tanto los observables como los no observables, de

una serie de tiempo como partes de modelos de regresin en donde las variables explicativas son funciones del tiempo con coeficientes que cambian a travs del tiempo. Entonces, dentro de un marco de regresin, una tendencia simple sera modelada en trminos de una constante por el tiempo con un disturbio, o error aleatorio, aditivo. Esto es

yt = + t + t , t=1,n
Este modelo es fcil de estimar usando mnimos cuadrados simple, pero sufre la desventaja de considerar a la tendencia determinstica. En general esto es muy restrictivo. En economa por ejemplo, si una variable es considerada que tiene tendencia determinstica significara que cualquier impulso econmico de cualquier intensidad no tendr efectos en el largo plazo, ya que todo retornar a su dada tendencia. La flexibilidad es introducida permitiendo que los coeficientes y evolucionen a travs del tiempo como procesos estocsticos. De esta forma la tendencia se puede adaptar a los cambios subyacentes. La estimacin actual, o filtrada, de la tendencia se la logra poniendo al modelo en su forma de espacio de estado y aplicndole luego el filtro de kalman. El filtrado significa computar el mejor estimador en cada momento t usando las observaciones disponibles hasta ese momento. Algoritmos relacionados se usan para hacer predicciones y para los suavizados. Esto ltimo significa computar el mejor estimador en todos los puntos de la muestra usando al conjunto total de observaciones. Los parmetros en los modelos de espacio de estado usualmente se denominan hiperparmetros, para distinguirlos de los elementos del vector de estado los cuales pueden pensarse como parmetros aleatorios. La magnitud por la cual los parmetros aleatorios pueden variar est gobernada por hiperparmetros. Ellos pueden ser estimados por mxima verosimilitud, la llave de esto es la forma de espacio de estado y el filtro kalman. Para el trabajo aplicado, el punto es entender qu hacen los modelos y cmo deben ser interpretados los resultados.

Enfoque clsico El enfoque clsico del modelado de series de tiempo, est basado en el hecho de que un modelo general para cualquier serie estacionaria no determinstica es el autorregresivopromedio mvil de orden (k,h), esto es

yt = 1 yt 1 + ... + k yt k + t + 1 t 1 + .. + h t h

t ~ IID(0, 2 )

Este es el conocido modelo ARMA(k,h) , la estrategia de modelado consiste primero en especificar los valores adecuados de k y h, sobre el anlisis de un correlograma muestral y otros estadsticos relevantes. Luego el modelo es estimado, bajo el supuesto de normalidad de los errores. Despus se examinan los residuos para ver si su apariencia corresponde a la aleatoriedad y de computan varios estadsticos de prueba. En particular el estadstico Q* de Box-Ljung, el cual est basado en las primeras k autocorrelaciones de los residuos, se lo usa para testar la correlacin serial de los residuos. Box y Jenkins (1976) se refieren a estos pasos como identificacin, estimacin y control de diagnstico. Si este control es satisfactorio, el modelo est listo para ser usado en las predicciones. Si no lo es, se deber intentar otra especificacin. Box y Jenkins enfatizan el rol de la parsimonia, en el sentido que al seleccionar k y h los mismos deben ser pequeos. Ahora bien muchas series no son estacionarias. Con el objeto de resolver estas situaciones Box y Jenkins proponen que una serie debe ser diferenciada para hacerla estacionaria. Luego de ajustar un modelo ARMA, a la serie diferenciada, el correspondiente modelo integrado es usado para las predicciones. Si la serie es diferenciada d veces, el modelo total de la serie es denotado como ARIMA(k,d,h). Efectos estacionales pueden ser capturados mediante la diferenciacin estacional. La metodologa de seleccin de modelos para los modelos estructurales es de alguna manera diferente, en el sentido que se pone menos nfasis en la observacin del correlograma de diversas transformaciones de la serie con el objeto de obtener una especificacin inicial. Esto

no significa que no se observe el correlograma, pero l puede ser difcil de interpretar sin un conocimiento previo de la naturaleza de la serie, y en muestras pequeas y/o con datos desordenados puede conducir a conclusiones errneas. En lugar de ello, el nfasis est en la formulacin del modelo en trminos de componentes cuya presencia estara sugerida por el conocimiento del fenmeno bajo estudio, de sus aplicaciones o por la inspeccin del grfico de la serie, por ejemplo, con observaciones mensuales, uno debera incorporar desde un principio una parte estacional dentro del modelo., y solamente la sacar si luego prueba que no es significativa. Una vez que el modelo estructural ha sido estimado, el mismo tipo de prueba de diagnstico que los usados para los modelos ARIMA pueden ser realizados con los residuos. En particular el estadstico de Box y Ljung puede ser computado siendo sus grados de libertad igual al nmero de autocorrelaciones residuales menos el nmero de hiperparmetros relativos. Pruebas estndares de falta de normalidad y heteroscedasticidad pueden ser

aplicadas, como as tambin la prueba de la calidad predictiva. Los grficos de los residuos pueden examinarse, de la misma manera por Box y Jenkins para la construccin de modelos ARIMA. En un modelo estructural de series de tiempo, estos grficos pueden ser complementados con grficos de los componentes suavizados. Estos, frecuentemente, suelen ser muy informativos puesto que permiten al investigador constatar si los movimientos en los componentes corresponden a lo que podra esperarse sobre la base del conocimiento previo. En las subsecciones siguientes se presentan los principales modelos estructurales de series de tiempo univariadas. Nivel Local Una serie de tiempo es un conjunto de observaciones y1, y2, y3,yn ordenadas en el tiempo. El modelo bsico para representar una serie de tiempo es el aditivo
yt = t + t + t + t con t=1..n

Donde t es la componente que cambia suavemente en el tiempo, t es el componente con perodo fijo llamado estacionalidad, t es el componente peridico con frecuencia menor a la estacionalidad llamado ciclo y t es un componente irregular llamado error. Cuando las componentes se combinan en forma multiplicativa, yt = t tt t los logaritmos de los valores, reduciendo este modelo a un modelo aditivo. El modelo estructural de series de tiempo mas simple presenta una situacin en la que no hay estacionalidad, ni ciclos y la tendencia est compuesta por el nivel de la serie que cambia a travs del tiempo. Ese nivel es modelado por un camino aleatorio random walk sobre el cual se le sobreimpone un error aleatorio o ruido blanco. Adems, todas las variables aleatorias se distribuyen normalmente. Esto da el modelo denominado modelo nivel local (NL)
yt = t + t t N (0, 2 )

se trabaja con

t = t 1 + t t N (0, 2 )

para t=1,..n, donde t y t son mutuamente independientes. Una caracterstica prctica muy importante del modelo es que el estimador del nivel, basado en la informacin disponible, est dado por un promedio mvil exponencialmente ponderado de las observaciones pasadas, donde la constante de suavizado es una funcin del cociente seal de ruido q= 2 / 2 . La prediccin de observaciones futuras, no importa cuantos pasos adelante, est dada por la misma expresin. Para un camino aleatorio puro, q es infinito, llegndose a que la prediccin es la ltima observacin. Cuando q tiende a cero la prediccin se acerca a la media muestral.

Tendencia lineal local Los modelos de tendencia lineal local (TLL) reemplazan la tendencia determinstica por una estocstica, la formulacin es

yt = t + t

t N (0, 2 )

t = t 1 + t 1 + t t N (0, 2 ) t = t 1 + t t N (0, 2 )

Para t=1, ..n con los errores t , del nivel, t y la pendiente, t mutuamente independientes. Las magnitudes por las cuales el nivel t y la pendiente t cambian a travs del tiempo, estn
2 gobernadas por los hiperparmetros relativos q = / 2 , y q = 2 / 2 . La funcin de

prediccin es la lnea recta a partir de las estimaciones del nivel y de la pendiente al final de la muestra.
2 Investigadores aplicados, cuando la tendencia no es clara, suelen establecer =0 para ajustar

el modelo con esta restriccin. Si 2 =0, tenemos que t = t 1 = t 2 .. = , si 0 , la tendencia es un camino aleatorio mas una constante, t = t 1 + + t . As con = 0 , se verifica que yt = + t + i + t .
i =1 t

Aqu el comportamiento de yt est gobernado por dos componentes no estacionarios, una tendencia lineal determinstica y la tendencia estocstica

.
i =1 i

Cuando 2 =0 y = 0 el modelo se reduce al modelo NL.

yt = + i + t
i =1

10

Ntese que todos los sucesivos shocks t tienen efecto permanente en la sucesin yt por el hecho que no hay un factor que decaiga y afecte los valores pasados de t .
2 Cuando 2 =0, = 0 y es diferente de cero, la tendencia es una funcin lineal

determinstica del tiempo, quedando el modelo para yt puede expresarse como clsico modelo de la tendencia lineal mas ruido

yt = + t + t
yt = 0 + 0t + (t j ) j + i + t
j =1 i =1 t 1 t

Aqu cada elemento de la sucesin yt contiene una tendencia determinstica, una tendencia estocstica y un componente irregular o error. Lo ms interesante de este modelo es la forma de la tendencia, en lugar de ser determinstica, los coeficientes del tiempo dependen de realizaciones pasadas de la sucesin j . Estos coeficientes pueden ser positivos para algunos valores de t y negativos para otros. En este caso como 2 y 2 >0, el nivel y la pendiente de la tendencia pueden variar suavemente en el tiempo.

Tendencia, estacionalidad e irregularidades La estacionalidad es un componente que se repite con periodicidad, dentro del tiempo bajo estudio. Las series pueden ser observaciones trimestralmente, mensualmente, diaria y estar sujetas a variaciones estacionales. Este componente necesita que se le permita que cambiar a travs del tiempo, de la misma manera que se le do mayor flexibilidad a la tendencia permitindole que sea estocstica. Sin embargo el argumento para que el componente estacional sea estocstico es menos fuerte que para la tendencia estocstica. Aunque es posibles que puedan suceder cambios en la estructura estacional.

11

Para modelar la estacionalidad supongase que hay s meses por ao. As para los datos mensuales s=12, para datos trimestrales s=4 y para datos diarios cuando se modela estructura semanal, s=7. Si el componente estacional es determinstico, debe tener la propiedad de sumar cero sobre el ao anterior, esto asegura que no se confunda con la tendencia. Se sigue que
s 1

t j = 0 , por
j =0

s 1

lo tanto t = t j , t=s,s+1,. En situaciones prcticas frecuentemente queremos que


j =1

exista la posibilidad de que el componente estacional cambie en el tiempo. Una manera simple de lograrlo es agregando un trmino de error wt es la ltima relacin, lo que da el modelo
2 t = t j + w j , t=1, ..n, donde los w j son independientes N (0, ).

s 1

j =1

Esta es la forma de variables ficticias (dummy) de la estacionalidad estocstica. Una alternativa es denotar el efecto de la estacin j en el momento de tiempo t mediante

jt y luego hacer que este trmino sea generado por un camino aleatorio. jt = j ,t 1 + jt , t=(i-1)s+j, i=1,2,j=1,..,s
Con un ajuste adecuado para asegurar que cada sucesivo conjunto de s componentes

estacionales suma cero. La estacionalidad puede expresarse tambin en su forma trigonomtrica, para estacionalidad constante es la siguiente:

jt = ( j . cos j t + * j . sen j t ), j =
j =1

s/2

2 j , j=1,s/2 s

Para estacionalidad que vara con el tiempo, esta puede hacerse estocstica agregando los trminos aleatorios. Sin los trminos del error este modelo estacional dar la misma estructura determinstica que el modelo estacional con variables ficticias. De cualquier manera, con estacionalidad

12

estocstica es un mejor modelo porque permite que el componente estacional evolucione con mayor suavidad. Se puede mostrar que la suma de las estacionalidades sobre el ao anterior sigue un modelo MA(s-2) en lugar de ser un ruido blanco. Los efectos estacionales estn combinados en forma aditiva con la tendencia y los componentes irregulares. Ahora bien, en muchas aplicaciones, son combinados de manera multiplicativa. De cualquier manera tomando logaritmos y trabajando con el logaritmo de los valores podemos llegar a la estructura aditiva. El modelo estructural bsico (MEB)

yt = t + t + t con t=1,n
Cada uno de los modelos estacionales presentados anteriormente puede ser combinado con cualquiera de los modelos de tendencia resultados un modelo estructural de serie de tiempo.

Forma de Espacio de Estado Se presenta a continuacin un enfoque unificado para el anlisis de series de tiempo. El tratamiento tcnico est basado en los mtodos de espacio de estado. Estos mtodos pueden ser aplicados a cualquier modelo lineal, incluyendo aquellos dentro de la clase de los autorregresivos integrados de promedios mviles. Todos los modelos lineales de series de tiempo tienen una representacin en la forma de espacio de estado. Esta representacin relaciona el vector de errores o disturbios t con el vector de observaciones yt va un proceso de Marcov. La expresin es

yt = Z t t + t , t N (0, H t )

t = Tt t 1 + Rtt , t N (0, Qt )

Donde yt es un vector de orden px1 de observaciones y t es un vector de orden mx1 inobservable, llamado vector de estado. La idea subyacente en el modelo es que el desarrollo del sistema en el tiempo est determinado por t . Pero debido a que t no puede ser

13

observado directamente, debemos basar nuestro anlisis en yt . Las matrices Z t , Tt , Rt , H t y

Qt se suponen inicialmente conocidas y los trminos del error se suponen que son
independientes entre si en todo momento de tiempo. Las matrices Z t y Tt pueden depender de y1,.yt-1. El estado inicial 0 se supone que es N(a0,P0) es independiente de 1 ,...., n y de

1 ,...,n , se suponen conocidos a0 yP0 .


Este modelo se llama modelo bsico de espacio de estado (MBEE) aunque tambin se lo conoce usualmente como modelo lineal gaussiano de espacio de estado. A la primera ecuacin se la denomina ecuacin de medida o ecuacin de observacin y a la segunda la ecuacin de transicin o relacin de transicin o ecuacin de estado. Es interesante destacar que la ecuacin de medida es equivalente a un modelo de regresin con coeficientes t estocsticos que satisfacen la ecuacin transicin. En muchas aplicaciones Rt es la matriz identidad. En modelos univariados p=1, por lo tanto Z t es un vector fila y H t es un escalar que se lo suele denotar como 2 . Un modelo tendencia lineal local (TLL) puede ser puesto en la forma de espacio de estado,
1 0 . Tt = 1 0 0 Rt = 0 . 0 1 . 1 . . . . . 0 . . . . . . . . 1 1 1 1 1 1 0 0 0 0 0 1 0 0 0 . . . . . 0 0 . 1 0 0

1 0 1 por ejemplo Z t' = , 0 . 0

t t t = t t 1 . t s+2

0 0 1 0 0 1 0 0 . . 0 0

14

Ciclos Un ciclo es un componente peridico con frecuencia menor a la estacionalidad. Un ciclo determinstico puede ser expresado como una onda sinusoidal, esto es

t = cos t + sent con t=1,..,n


Anteriormente se puntualiz que una estructura estacional puede ser modelada por un conjunto de tales ciclos definidos en las frecuencias estacionales. Agregando errores se permite que esta estructura cambie a travs del tiempo. Una situacin algo diferente puede suceder cuando queremos modelar el ciclo, el cual puede ser estocstico, y a diferencia de los ciclos estacionales, puede ser estacionario. La especificacin estadstica de tal ciclo t es como sigue
t cos c *= t senc senc t 1 kt + cos c t*1 kt*

Donde c es la frecuencia en radianes en el intervalo 0 c , k t* y k t* son 2 procesos ortogonales o ruido blanco mutuamente no correlacionados con media 0 y varianza comn

k2 y es un factor amortiguador, perteneciente al intervalo [0,1]. El perodo es 2 / c .


Variables explicativas y anlisis de intervencin Las variables explicativas pueden ser fcilmente incluidas en un modelo estructural. Se denominan tambin variables ficticias, ellas son usadas para el manejo de las observaciones faltantes y de los efectos de las intervenciones. Si xt es un vector de kx1 variables explicativas observadas y es el correspondiente vector de parmetros, el modelo

yt = t + xt + t , t=1,..n, este puede ser considerado un modelo de regresin con


componente de tendencia estocstica, t . Si las varianzas son cero, el modelo se reduce a una expresin lineal con constante y una tendencia lineal.

15

El algoritmo de Kalman Introduccin Se presenta un tratamiento general desde el punto devista de la inferencia clsica del modelo Gaussiano de espacio de estado. Las observaciones yt sern consideradas multivariadas y se discutir el filtrado, suavizado, la estimacin de los hiperparmetros y la prediccin. El filtrado tiene por finalidad actualizar nuestro conocimiento del sistema cada vez que una nueva observacin yt es obtenida. El suavizado nos permite basar las estimaciones de cantidades de inters en la muestra completa y1,.yn. Los parmetros en los modelos de espacio de estado usualmente se denominan hiperparmetros, presumiblemente para distinguirlos de los elementos del vector de estado los cuales pueden pensarse como parmetros aleatorios. Adems recordemos que la magnitud por la cual los parmetros aleatorios pueden variar estn gobernadas por estos hiperparmetros. La prediccin tiene importancia especial en muchas aplicaciones del anlisis de series de tiempo. Se pueden lograr resultados de las predicciones tomando a los valores futuros yn+1 yn+2 como observaciones faltantes. El anlisis estadstico de los modelos estructurales de series de tiempo est basado en la forma de espacio de estado. Los modelos gaussianos de espacio de estado pueden ser estudiados estadsticamente mediante el filtro de kalman y el suavizador asociado. La funcin de verosimilitud se la construye a partir del filtro de kalman en trminos de la prediccin un paso adelante, y es maximizada con respecto a los hiperparmetros por optimizacin numrica , el vector marcador (score) de los parmetros puede obtenerse a travs de un algoritmo de suavizado asociado con el filtro kalman. Una vez que los hiperparmetros han sido estimado el filtro es usado para lograr predicciones de los residuos un paso adelante, lo que no permite calcular los estadsticos de diagnstico para normalidad, correlacin serial y bondad de ajuste. Con los resultados del filtrado y suavizado se logran predicciones de la serie bajo estudio. El
16

suavizador es utilizado para estimar componentes no observables, tales como la tendencia y la estacionalidad, y para calcular estadsticos de diagnsticos que sirven para detectar observaciones atpicas y cambios estructurales. La forma de espacio de estado Todos los modelos lineales de series de tiempo tienen una representacin en la forma de espacio de estado. Esta representacin relaciona el vector de errores o disturbios t con el vector de observaciones yt a travs del proceso de Marcov t , la expresin es:

yt = Z t t + t , t N (0, H t )

t = Tt t 1 + Rtt , t N (0, Qt )
Donde yt es un vector de orden px1 y t es un vector de orden mx1 inobservable, llamado vector de estado. La idea subyacente en el modelo es que el desarrollo del sistema en el tiempo est determinado por t de acuerdo a la segunda ecuacin, pero debido a que t no puede ser observado directamente, debemos basar nuestro anlisis en las observaciones yt . Las otras matrices de la ecuacin, se suponen inicialmente conocidas y los trminos de error se suponen independientes entre si en todo momento del tiempo. Las matricez Z y T pueden depender de y1,.yt-1. El estado inical 0 se supone que es N(a0,P0) e independiente de los errores t y t . Este modelo inicial se lo denomina bsico de espacio de estado (MBEE), aunque tambin se lo conoce como modelo lineal gaussiano de espacio de estado. La primera se denomina ecuacin de observacin y a la segunda ecuacin de transicin o relacin de transicin. Es interesante destacar que la ecuacin de observacin es equivalente a un modelo de regresin con coeficientes t estocsticos que satisfacen la ecuacin de transicin.

17

Denotaremos como Yt-1 al conjunto de los y1,--yt-1, que es toda la informacin anterior al tiempo t=1. Comenzando en T=1 y construyendo la distribucin de t e yt recursivamente se puede demostrar que

p( yt / 1 ,..., t , Yt 1 ) = p( yt / t ) y p( t / 1 ,..., t 1 , Yt 1 ) = p( t / t 1 )
estableciendo con ello la verdadera naturaleza markoviana del modelo. Filtrado El objetivo del filtrado es actualizar nuestro conocimiento del sistema cada vez que se obtiene una nueva observacin yt . Una vez que el modelo ha sido puesto en su forma de espacio de estado, el camino est abierto para la aplicacin de un nmero importante de algoritmos. En el centro de ellos est el filtro de kalman. Este filtro es un procedimiento recursivo para computar el estimador ptimo del vector de estado en el momento t, basado en la informacin disponible hasta ese tiempo t. En ciertas aplicaciones de ingeniera el filtro kalman es importante debido a la posibilidad de lograr estimaciones sobre la marcha. El valor actual del vector de estado es de inters y el filtro kalman permite que la estimacin del vector de estado sea continuamente actualizada cada vez que una nueva observacin est disponible. Otra razn para el rol central del filtro Kalman es que cuando los errores y el vector de estado inicial estn normalmente distribuidos, permite que la funcin de verosimilitud sea calculada a travs de lo que se conoce como la descomposicin del error de prediccin. Esto abre el camino para la estimacin de cualquier parmetro desconocido en el modelo. Tambin provee las bases para los tests estadsticos y especificacin del modelo. La forma en que se deriva mas abajo el filtro kalman para el modelo de espacio de estado, se basa en el supuesto del estado inicial 0 se supone que es N(a0,P0) e independiente de los errores t y t . Luego es usado un resultado estndar sobre la distribucin normal multivariada para mostrar cmo es posible calcular recursivamente la distribucin sobre

18

t condicional a la informacin establecida en el tiempo t, para todo t de 1 a n. Estas


distribuciones condicionales son a su vez normales y por lo tanto estn completamente especificadas por sus matrices de medias y varianzas. Son estas cantidades las que el filtro de kalman computa. As, spongase que queremos obtener la distribucin a posteriori de t +1 dado

Yt . Puesto que todas las distribuciones condicionales son tambin normales. Supongamos que

t dado Yt 1 es N (at , Pt ) y la de t dado Yt es N (at / t , Pt / t ) . Nuestro objetivo es calcular


recursivamente at / t , Pt / t , at +1 , Pt +1 dado at , Pt Sea

vt = yt Z t at

este es el error de prediccin un paso adelante y satisface

vt = yt E ( yt / Yt 1 )
Iniciacin: como iniciar el filtrado cuando se desconocen los parmetros a0 y P0 de la distribucin de 0 . Se presenta entonce la distribucin difusa a priori, esto es, se fija a0 en un valor arbitrario y se hacen tender los elementos diagonales de P0 a infinito. Una aproximacin adecuada puede, con frecuencia, alcanzarse numricamente tomando a0 =0 y P0=KIm donde Im es la matriz identidad de orden m y K es un nmero finito grande. No obstante, en algunos casos esto conduce a inaceptables errores de redondeo, por lo que se requiere una tcnica mas precisa. Suavizado: considerando ahora la estimacin de 1 ,..., n dada la muestra completa Yn. El estimador con error cuadrtico medio mnimo (ECMM) de t es t = E ( t / Yn ) . Llamamos a esto el valor de suavizado de t y llamamos a la operacin de calcular esos alfas suavizado. Estimacin de los hiperparmetros: Como ya lo vimos, los parmetros en los modelos de espacio de estado usualmente se denomina hiperparmetros, presumiblemente para distinguirse del vector de estado los cuales pueden pensarse como parmetros aleatorios. Adems recordemos que la magnitud por la cual los parmetros aleatorios pueden variar est

19

gobernada por los hiperparmetros. Ahora debemos estimar por mxima verosimilitud los hiperparmetros del modelo de espacio de estado. Comenzamos construyendo la verosimilitud. Suponiendo que a0 y P0 son conocidos, la densidad conjunta de y1,..yn es
p(Yn) = p(y t /Yt-1 ) , donde p( yt / Yt 1 ) = N ( Z t at , Ft ) por lo tanto tomando los logaritmos

obtenemos log L =

np 1 n 1 n log(2 ) log Ft vt Ft 1vt 2 2 t =1 2 t =1

Esto se llama descomposicin del error de prediccin del logaritmo de la verosimilitud. Prediccin : Supongamos que y1,... yn que satisfacen el modelo de espacio de estado y queremos predecir yn +l , l= 1,2,..J. Queremos que la prediccin sea con mnimo error medio cuadrtico de prediccin dada la muestra completa es Yn.

20

Pasos realizados en la modelizacin 1. Sobre la base de la inspeccin grfica de las caractersticas saliente de la serie mensual, trimestral y anual, mas el conocimiento de la variabilidad de la variable bajo estudio. Se propone un modelo con un conjunto de componentes apropiados. Por ejemplo, las lluvias mensuales presentan gran variabilidad podra proponerse un modelo multiplicativo al cual se le aplicar la transformacin logartmica para hecerlo aditivo. 2. Incorporacin de las variables de intervencin que surgen del Modelo Estructural Bsico. Este modelo est compuesto por el nivel y la pendiente ambos aleatorios, la estacionalidad trigonomtrica aleatoria y un componente irregular. Esto se puede cambiar luego, pero inicialmente permitir detectar valores extremos. Las variables de intervencin surgen de la inspeccin de los residuos que pasan las bandas de confianza. 3. Estimacin de los hiperparmetros de todas las componentes del modelo. Esto permite decidir si la componente es fija o aleatoria. Cuando la estimacin del parmetro nos da Cero, significa que la componente correspondiente es fija. 4. Reformulacin del modelo a travs de anlisis del Estado Final, en el cual se analiza la significancia de los valores que toman los componentes al final de la muestra. Los estimadores de suavizado de los componentes de tendencia, estacionalidad y cclicos se obtienen utilizando toda la informacin de la muestra. Luego se analizan los residuos. 5. Anlisis de Regresin: Los estimadores de los parmetros de regresin, los parmetros de las variables de intervencin y las estimaciones fijas de estacionalidad. Estos estimadores pueden ser interpretados, en general, de la misma forma que un modelo de regresin estndar. Considerando que ellos son determinsticos (invariantes en el tiempo) y teniendo en cuenta el desvo estndar de las estimaciones, los t-valores deberan tener una distribucin t si los hiperparmetros (relativos) fueran conocidos. Aunque ellos son normales asintticamente. Una distribucin t puede proveer una mejor aproximacin a las propiedades para muestras pequeas. Los P valores estn basados en distribuciones normales. 6. Obtencin de los estadsticos resumen del modelo : a. H(h) : test de heterosedasticidad, distribuido aproximadamente como F(h,h) b. r(t) : la autocorrelacin residual a la distancia t (lag t) distribuida aproximadamente como N(0,1/T) c. DW : Durbin-Watson statistics, distribuido aproxidadamente como N(2,4/T) d. Q(P,d) : Box-Ljung Q-statistic basadas en los primeros P residuales de las correlaciones distribuidas aproximadamente como d y finalmente los coeficientes de determinacin mas apropiados. 7. Evaluacin de la bondad del modelo propuesto. Prediction error variance (PEV) la varianza o matriz de covarianza de error de prediccin logrado paso a paso. Normalidad de los residuis utilizando el estadstico de Bowman-sheton, distribuida aproximadamente como 2, 2 grados de libertad, AIC. 8. Prediccin extrapolacin de valores futuros.
2

21

Ejemplo
La serie analizada correponde a valores mensuales de la localidad de Monte Aloia, en la provincia de Pontevedra, Galicia. Esta serie consta de 204 observaciones de milmetros de lluvia cada mensual desde enero de 1991 hasta diciembre de 2007. Tabla 1. Mediana y desvos absolutos respecto de la mediana (MAD) de Mes ENE FEB MAR ABR MAY JUN JUL AGO SET OCT NOV DIC 173 86.5 136 59.5 166.8 60.7 53 70.8 27 64 129 67 270 122 262.2 360 133 145.8

Mediana 305.5 164 MAD 146.5 109

36.5 22

La precipitacin anual promedio es de 2576.9 milmetros, con una variabilidad entre aos de 483.92 mm. Figura 1. Lluvias mensuales de Monte Aloia y su logaritmo
Serie de lluvias
972.0

777.6

583.2

Monte aloia
388.8 194.4 0.0 01-01-91

01-06-94

01-11-97

01-04-01

01-09-04

fecha

22

Serie transformada
7.2

5.8

4.3

Logaritmo lluvias
2.9 1.4 0.0 01-01-91

01-06-94

01-11-97

01-04-01

01-09-04

fecha

Modelizacin
Se presenta a continuacin el modelo que surgi luego de la apreciacin visual de la serie temporal, de la consideracin de las estadsticas descriptivas mensuales y anuales, y despus de seguir la secuencia de pasos que conduce a un modelo adecuado: yt = t + t + t +

x
10 i i =1

( j)

+ t , con t=1,2,204

(1/1991 a 12/2007), siendo yt es el ln de las lluvias mensuales, t es la componente de tendencia,

t es la componente estacional, t es la componente cclica con frecuencia menor a la estacionalidad,


i y xi son el coeficiente y las variables de intervencin y t es la componente irregular llamada error. Anlisis de la tendencia Se estimaron los hiperparmetros, o varianzas de los disturbios correspondientes al nivel, y a la pendiente. Los hiperparmetros relativos, simbolizados qn y q , se obtienen del cociente de cada uno respecto de 2 . En este caso qn = 0 y q = 0 lo que significa que la tendencia est compuesta de nivel fijo y de una posible pendiente determinstica. Luego, al analizar la componente correspondiente a la pendiente, estimada con el filtrado y suavizado del vector de estado, se prueba la

hiptesis = 0 , mediante la aplicacin de una prueba T, que dio como resultado T=-0.139273, P-valor= 0.8894 aceptando la hiptesis nula. En el anlisis de la componente correspondiente al

23

nivel, se prueba la hiptesis t = 4.9920 una prueba T, que dio como resultado T=102.55, Pvalor=0.000. Luego la tendencia est guiada por un camino aleatorio sin pendiente descrita por un nivel fijo. La componente de tendencia en el perodo estimado es 147.226, expresada en trminos de la variable original. Anlisis de la estacionalidad Tambin la componente estacional se consider fija, teniendo en cuenta el valor de los hiperparmetros relativos. Esto significa que cada ao se repiten con presencia y con escasez de lluvias, dependiendo del mes. La prueba de 2 , realizada sobre los s-1 efectos estacionales bajo la hiptesis nula de no estacionalidad dio como resultado 2 =80.729, P-valor=0. Tabla 2. Aportes porcentuales promedio del patrn estacional al nivel de la serie mensual de Monte Aloia. EE APN 1
86.2

2
17.6

3
8.67

4
0.71

5
-0.5

6
-58.4

7
-64.8

8
-59.2

9
-9.6

10
107.2

11
86.1

12
102

EE : Efecto Estacional y APN: Aporte Porcentual al Nivel Los coeficientes estacionales que resultaron significativos fueron 1, 6, 7, 8, 10,11 y 12. Estos coeficientes representan los aportes promedio del patrn estacional al nivel de la serie mensual original. El resto de los meses el aporte es nulo. Anlisis del ciclo El hiperparmetro relativo del ciclo fue igual a cero por lo tanto se consider un componente fijo. El coeficiente =1. El perodo representa 1.6 aos. Incorporacin de las variables de intervencin En el modelo se incluyeron 10 variables de intervencin. Tabla 3. Momento en el tiempo y significancia de los coeficientes estimados de las variables de intervencin.

24

Ao y Mes
1992. 7 1993. 2 1993. 7 1997. 3 1997. 9 1998. 8 2001.11 2001.12 2004. 2 2007.10 [ [ [ [ [ [ [ [ [ [

P-valor
0.0003] 0.0000] 0.0000] 0.0000] 0.0000] 0.0000] 0.0000] 0.0114] 0.0002] 0.0000]

Las variables de intervencin, 4 de las cuales se producen 2 en febrero y 2 en julio. En marzo, agosto, setiembre, octubre, noviembre y diciembre se registran 1 en cada mes. Anlisis de la dependencia Temporal La tabla siguiente muestra 5 estadsticos que permiten el anlisis del modelo considerando la adecuacidad del mismo en funcin la autodependencia. Tabla 4 Estadsticos y su significancia del ln de lluvias Valor del Estadstico
H(67)= 0.90371

P-Valor
[0.66010117] [0.39877515] [0.49287836] [0.37396768] [0.55377382]

r( 1)= 0.01796
r(13)= 0.00125

DW=1.955
Q(13,10)= 8.773

Luego los P-valores que acompaan a los estadsticos no dan significativos. No hay autocorrelacin residual a la distancia 1, ni 13, r(1) y r(13). No hay evidencia de correlacin serial (DW), el estadstico H indica que se acepta la hiptesis de no heterosedasticidad y Q indica la adecuacidad de un modelo con 4 hipermarmetros. Medidas de Bondad de Ajuste y Anlisis de los residuos La variancia del error de prediccin PEV=0.409871,el criterio de informacin de Akaike, AIC=0.64682 y el coeficiente de determinacin de las diferencias fue R2d=0.80895.

Los residuos estimados para el modelo propuesto, tuvieron una Media=-0.024437 con un Desvo Estndar=0.946549. El test para el anlisis de normalidad de los mismos, se realiz con estadstico

25

de Bowman-Sheton cuyo resultado fue BS Chi2=3.3961, P-valor=0.1830 aceptacin la hiptesis de normalidad. Tabla 5. Ao, Mes, valor de prediccin y Desvo Estndar de las lluvias Perodo
2008. 1 2008. 2 2008. 3 2008. 4 2008. 5 2008. 6 2008. 7 2008. 8 2008. 9 2008.10 2008.11 2008.12

Prediccin
240.83 150.70 140.04 132.35 134.91 58.692 51.913 62.940 145.09 342.88 313.45 341.51

R.m.s.e.
234.91 147.02 136.63 129.13 131.63 57.262 50.644 61.395 141.52 334.40 305.68 333.02

26

También podría gustarte