Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3 Primer Paso Al Analizar Cualquier Serie De Tiempo 2. Modelos Clasicos De Series De Tiempo 2.1 Modelos De Descomposicin 2.2 Estimacin De La Tendencia 2.3 Estimacin De La Estacionalidad 3. Predicciones 3.1 Ejemplo Ilustrativo
Toda institucin, ya sea la familia, la empresa o el gobierno, tiene que hacer planes para el futuro si ha de sobrevivir y progresar. Hoy en da diversas instituciones requieren conocer el comportamiento futuro de ciertos fenmenos con el fin de planificar, prever o prevenir. La planificacin racional exige prever los sucesos del futuro que probablemente vayan a ocurrir. La previsin, a su vez, se suele basar en lo que ha ocurrido en el pasado. Se tiene pues un nuevo tipo de inferencia estadstica que se hace acerca del futuro de alguna variable o compuesto de variables basndose en sucesos pasados. La tcnica ms importante para hacer inferencias sobre el futuro con base en lo ocurrido en el pasado, es el anlisis de series de tiempo. Son innumerables las aplicaciones que se pueden citar, en distintas reas del conocimiento, tales como, en economa, fsica, geofsica, qumica, electricidad, en demografa, en marketing, en telecomunicaciones, en transporte, etc.
Series De Tiempo Ejemplos - Precios de un artculo - Tasas de desempleo - Tasa de inflacin - ndice de precios, etc. - Meteorologa - Cantidad de agua cada - Temperatura mxima diaria - Velocidad del viento (energa elica) - Energa solar, etc. - Series sismologas - Tasas de crecimiento de la poblacin - Tasa de natalidad, mortalidad - Resultados de censos poblacionales - Series de demanda, gastos, ofertas - Anlisis de seales - Series de trfico
1. Series econmicas:
2. Series Fsicas:
3. Geofsica:
Uno de los problemas que intenta resolver las series de tiempo es el de prediccin. Esto es dado una serie {x(t1),...,x(tn)} nuestros objetivos de inters
son describir el comportamiento de la serie, investigar el mecanismo generador de la serie temporal, buscar posibles patrones temporales que permitan sobrepasar la incertidumbre del futuro. En adelante se estudiar como construir un modelo para explicar la estructura y prever la evolucin de una variable que observamos a lo largo del tiempo. La variables de inters puede ser macroeconmica (ndice de precios al consumo, demanda de electricidad, series de exportaciones o importaciones, etc.), microeconmica (ventas de una empresa, existencias en un almacn, gastos en publicidad de un sector), fsica (velocidad del viento en una central elica, temperatura en un proceso, caudal de un ro, concentracin en la atmsfera de un agente contaminante), o social (nmero de nacimientos, matrimonios, defunciones, o votos a un partido poltico).
En muchas reas del conocimiento las observaciones de inters son obtenidas en instantes sucesivos del tiempo, por ejemplo, a cada hora, durante 24 horas, mensuales, trimestrales, semestrales o bien registradas por algn equipo en forma continua. Llamamos Serie de Tiempo a un conjunto de mediciones de cierto fenmeno o experimento registradas secuencialmente en el tiempo. Estas observaciones sern denotadas por {x(t1), x(t2), ..., x(tn)} = {x(t) : t T R} con x(ti) el valor de la variable x en el instante ti. Si T = Z se dece que la serie de tiempo es discreta y si T = R se dice que la serie de tiempo es continua. Cuando ti+1 - ti = k para todo i = 1,...,n-1, se dice que la serie es equiespaciada, en caso contrario ser no equiespaciada. En adelante se trabajar con series de tiempo discreta, equiespaciadas en cuyo caso asumiremos y sin perdida de generalidad que: {x(t1), x(t2), ..., x(tn)}= {x(1), x(2), ..., x(n)}.
El primer paso en el anlisis de series de tiempo, consiste en graficar la serie. Esto nos permite detectar las componentes esenciales de la serie. El grfico de la serie permitir:
a) Detectar Outlier: se refiere a puntos de la serie que se escapan de lo normal. Un outliers es una observacin de la serie que corresponde a un comportamiento anormal del fenmeno (sin incidencias futuras) o a un error de medicin. Se debe determinar desde fuera si un punto dado es outlier o no. Si se concluye que lo es, se debe omitir o reemplazar por otro valor antes de analizar la serie. Por ejemplo, en un estudio de la produccin diaria en una fabrica se present la siguiente situacin ver figura 1.1:
Figura 1.1 Los dos puntos enmarcados en un crculo parecen corresponder a un comportamiento anormal de la serie. Al investigar estos dos puntos se vio que correspondan a dos das de paro, lo que naturalmente afect la produccin en esos das. El problema fue solucionado eliminando las observaciones e interpolando. b) Permite detectar tendencia: la tendencia representa el comportamiento predominante de la serie. Esta puede ser definida vagamente como el cambio de la media a lo largo de un periodo (ver figura 1.2).
Figura 1.2 c) Variacin estacional: la variacin estacional representa un movimiento peridico de la serie de tiempo. La duracin de la unidad del periodo es generalmente menor que un ao. Puede ser un trimestre, un mes o un da, etc (ver figura 1.3).
Matemticamente, podemos decir que la serie representa variacin estacional si existe un nmero s tal que x(t) = x(t + ks). Las principales fuerzas que causan una variacin estacional son las condiciones del tiempo, como por ejemplo: 1) en invierno las ventas de helado 2) en verano la venta de lana 3) exportacin de fruta en marzo. Todos estos fenmenos presentan un comportamiento estacional (anual, semanal, etc.)
Figura 1.3 d) Variaciones irregulares (componente aleatoria): los movimientos irregulares (al azar) representan todos los tipos de movimientos de una serie de tiempo que no sea tendencia, variaciones estacionales y fluctuaciones cclicas.
Un modelo clsico para una serie de tiempo, supone que una serie x(1), ..., x(n) puede ser expresada como suma o producto de tres componentes: tendencia, estacionalidad y un trmino de error aleatorio. Existen tres modelos de series de tiempos, que generalmente se aceptan como buenas aproximaciones a las verdaderas relaciones, entre los componentes de los datos observados. Estos son: 1. Aditivo: X(t) = T(t) + E(t) + A(t) 2. Multiplicativo: X(t) = T(t) E(t) A(t) 3. Mixto: X(t) = T(t) E(t) + A(t) Donde: X(t) serie observada en instante t T(t) componente de tendencia E(t) componente estacional A(t) componente aleatoria (accidental)
Una suposicin usual es que A(t) sea una componente aleatoria o ruido blanco con media cero y varianza constante. Un modelo aditivo (1), es adecuado, por ejemplo, cuando E(t) no depende de otras componentes, como T(t), s por el contrario la estacionalidad vara con la tendencia, el modelo ms adecuado es un modelo multiplicativo (2). Es claro que el modelo 2 puede ser transformado en aditivo, tomando logaritmos. El problema que se presenta, es modelar adecuadamente las componentes de la serie. La figura 2.1 ilustra posibles patrones que podran seguir series representadas por los modelos (1), (2) y (3).
Figura 2.1
Supondremos aqu que la componente estacional E(t) no est presente y que el modelo aditivo es adecuado, esto es: X(t) = T(t) + A(t), donde A(t) es ruido blanco. Hay varios mtodos para estimar T(t). Los ms utilizados consisten en: 1) Ajustar una funcin del tiempo, como un polinomio, una exponencial u otra funcin suave de t. 2) Suavizar (o filtrar) los valores de la serie. 3) Utilizar diferencias.
Nota: i. la curva de tendencia debe cubrir un periodo relativamente largo para ser una buena representacin de la tendencia a largo plazo. ii. La tendencia rectilnea y exponencial son aplicable a corto plazo, puesto que una curva S a largo plazo puede parecer una recta en un perodo restringido de tiempo (por ejemplo).
Figura 2.2 En la figura 2.2 ambas curvas (recta y Gompertz) ajustan bien pero las proyecciones divergen enormemente a largo plazo. Ejemplo 1: En la tabla 2.1 se presentan los datos trimestrales de unidades habitacionales iniciadas en los Estados Unidos desde el tercer trimestre de 1964 hasta el segundo trimestre de 1972 [1]. (Es necesario advertir que para el anlisis de tendencia el periodo que se considera debera ser ms largo. Sin embargo, ya que el propsito principal es el de ilustrar el mtodo de descomposicin y las tcnicas para inferir partiendo de los elementos as descompuestos, la insuficiencia de los datos no tiene por qu interesar.) Tabla 2.1: Nuevas unidades habitacionales comenzadas en los Estados Unidos del tercer trimestre de 1964 al segundo trimestre de 1972 (en miles de unidades).
Ao 1964 1965 1966 1967 1968 I 283 274 218 298 II 454 392 382 452 III 398 392 290 382 423 IV 352 345 210 340 372 Total Anual 1,474 1,166 1,322 1,545
Sea t cada uno de los 32 trimestres que van de 1964 a 1972, o sea que t = 1 para el tercer trimestre de 1964, t = 2 para el cuarto trimestre, y as sucesivamente. As que el dominio de definicin de t es el conjunto de los enteros de 1 a 32 inclusive. Sea T(t) las iniciaciones de viviendas trimestralmente. Los valores de t y T(t) se dan en la tabla 2.2. Para calcular los valores de a y de b en la recta de tendencia
T(t) = a + bt
Se obtienen las siguientes cifras a partir de los datos de la tabla 2.1. Tabla 2.2: Clculo de la tendencia de las viviendas comenzadas en los Estados Unidos del tercer trimestre de 1964 al segundo trimestre de 1972
Ao trimestre 1964: 3 4 1965: 1 2 3 4 1966: 1 2 3 4 1967: 1 2 3 4 1968: 1 2 3 4 1969: 1 2 3 4 1970: 1 2 3 t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 T(t) Tendencia 398 291,73 352 298,07 283 304,41 454 310,75 392 317,09 345 323,43 274 329,77 392 336,11 290 342,45 210 348,79 218 355,13 382 361,47 382 367,81 340 374,15 298 380,49 452 386,83 423 393,17 372 399,51 336 405,85 468 412,19 387 418,53 309 424,87 264 431,21 399 437,55 408 443,89
4 1971: 1 2 3 4 1972: 1 2
26 27 28 29 30 31 32
Entonces, la recta de tendencia es T(t) = 285,39 + 6,34 t La figura 2.3 muestra grficamente la recta de tendencia ajustada a los datos trimestrales de la tabla 2.2. La recta de trazos despus de 1972 representa proyecciones (ver seccin 3 Predicciones).
Figura 2.3
Una forma de visualizar la tendencia, es mediante suavizamiento de la serie. La idea central es definir a partir de la serie observada un nueva serie que suaviza los efectos ajenos a la tendencia (estacionalidad, efectos aleatorios), de manera que podamos determinar la direccin de la tendencia (ver figura 2.4).
Figura 2.4 Lo que hacemos es usar una expresin lineal que transforma la serie X(t) en una serie suavizada Z(t): Z(t) = F(X(t)), t = 1,...,n
F
X(t)
Z(t)
de tal modo que F(X(t)) = T(t). La funcin F se denomina Filtro Lineal. El filtro lineal ms usado es el promedio mvil.
2.2.2.1 PROMEDIOS MVILES El objetivo es eliminar de la serie las componentes estacionales y accidentales. Para una serie mensual con estacionalidad anual (s = 12), la serie suavizada se obtiene,
(1) Para una serie trimestral, con estacionalidad anual (s = 4), la serie suavizada est dada por
(2) A este procedimiento se les llama: filtro simtrico finito. Nota: se suaviza cuando existen muchos cambios bruscos, movimientos irregulares.
Ejemplo 2: A partir de los datos del ejemplo1, se calcula un promedio mvil sumando los valores para un cierto nmero de periodos sucesivos y dividiendo luego la suma as obtenida por el nmero de perodos abarcados. En este caso se trata de una serie trimestral y para ello se ocupa la frmula (2). Tabla 2.3: Clculo del Promedio Mvil centrado de cuatro trimestres de las iniciaciones de viviendas en los EEUU, tercer trimestre 1964 a segundo trimestre de 1972 (en miles de unidades)
Ao por trimestre
(1)
398 352 283 454 392 345 274 392 290 210 218 382 382 340 298 452 423 372 336 468 387 309 264 399 408 396 389 604 579 513 510 661
1.487 1.481 1.474 1.465 1.403 1.301 1.166 1.110 1.100 1.192 1.322 1.402 1.472 1.513 1.545 1.583 1.599 1.563 1.500 1.428 1.359 1.380 1.467 1.592 1.797 1.968 2.085 2.206 2.263
372 370 369 366 351 325 292 278 275 298 331 351 368 378 386 396 400 391 375 357 340 345 367 398 449 492 521 552 566
371 369 367 359 338 308 285 276 287 314 341 359 373 382 391 398 395 383 366 348 342 356 382 424 471 507 536 559
En la tabla 2.3, por ejemplo, el promedio mvil de cuatro trimestres para el primer trimestre de 1965 se obtiene sumando los valores del tercer y cuarto trimestres de 1964 y el primero y segundo trimestres de 1965 y dividiendo luego
la suma por 4. El promedio para el segundo trimestre de 1965 se obtiene sumando los valores del cuarto trimestre de 1964 con los del primero, segundo y tercer trimestres de 1965 y luego dividiendo la suma por 4. As pues, para cada promedio sucesivo, se resta el trimestre que viene primero y se suma el ltimo siguiente. La columna 4 de la tabla 2.3 muestra los promedios mviles de cuatro trimestres obtenidos, partiendo de los datos iniciaciones de viviendas para el 1964 a 1972. El promedio mvil no elimina las fluctuaciones muy acentuadas de la serie, pero reduce sustancialmente la amplitud de las variaciones de los datos originales. Si en el clculo de un promedio mvil entra un nmero impar de perodos, el proceso ser ms sencillo puesto que el nmero de perodos antes y despus del perodo para el cual se calcula el promedio son iguales. Si el nmero de periodos es par, como en este ejemplo, no se puede utilizar el mismo nmero de perodos antes y despus de un periodo especificado. Por tanto, el promedio mvil ha de quedar a mitad de camino entre los valores de dos perodos consecutivos y no se relaciona con ningn perodo. Este problema se puede resolver calculando un promedio mvil centrado en la serie, lo cual se logra obteniendo primero un promedio mvil centrado de dos trimestres de los promedios mviles ya obtenidos. El primer promedio mvil centrado es la media de los dos primeros promedios mviles de cuatro trimestres, el segundo promedio mvil centrado es la media de los promedios mviles de cuatro trimestres segundo y tercero, etc. De esta manera, habr un nmero igual de perodos despus y antes del periodo especificado para el cual se est calculando el promedio mvil centrado. Los promedios mviles centrados se ven en la columna 5 de la tabla 2.3.
Este valor corresponde al Promedio Mvil Centrado que se muestra en la columna 5. La figura 2.5 muestra grficamente el ajuste por a travs del promedio mvil, segn tabla 2.3, donde el segmento negro representa la serie original y el segmento azul la serie suavizada.
Figura 2.5
La estimacin de la estacionalidad no slo se realiza con el fin de incorporarla al modelo para obtener predicciones, sino tambin con el fin de eliminarla de la serie para visualizar otras componentes como tendencia y componente irregular que se pueden confundir en las fluctuaciones estacionales. De acuerdo con los modelos de descomposicin (seccin 2.1), se asume el siguiente modelo para T(t), a) Aditivo
b)
Mixto
Una vez removida la tendencia se obtiene los siguientes grficos, donde en la figura 2.6 (a) aparece el modelo aditivo y en la (b) el modelo mixto.
(a)
(b)
Figura 2.6
Como para serie mensual, entonces basta estimar E(1), E(2), E(3), ... , E(12). Para una serie trimestral, bastara conocer: E(1), E(2), E(3) y E(4). Suponga que se ha estimado la tendencia por alguno de los mtodos vistos en la seccin previa. Sea la estimacin de la tendencia ya sea mediante una curva o filtros lineales. Entonces,
Estas series generadas a partir de la original por eliminacin de la tendencia se denominan series de residuos y debern contener predominantemente
fluctuaciones estacionales. Para estimar la estacionalidad se requiere haber decidido el modelo a utilizar (mixto o aditivo), lamentablemente esto no es siempre claro, ya sea porque no contamos con informacin a priori para suponerlo o porque el grfico no ha dejado evidencia suficientemente clara como para decidirnos por alguno de ellos. En tal situacin se propone calcular ambas series residuales y elegir aquella cuyos valores correspondientes a una estacin dada oscilen menos en torno a su promedio. Para fijar ideas, supongamos una serie con datos trimestrales y que la informacin de las series residuales pueden ser resumidas como en las tablas 2.4 y 2.5. Tabla 2.4. Residuos modelo Mixto
Perodo Estacin 1 2 3 4 1 W(1) W(2) W(3) W(4) 2 W(5) W(6) W(7) W(8) K W(4k-3) W(4k-2) W(4k-1) W(4k) Promedio Fila S1 S2 S3 S4 STD Fila C.V. Fila
Una forma de seleccionar el modelo, es por inspeccin de los coeficientes de variacin (C.V.). Suponemos, que en aquellas filas donde la variacin sea menor en torno a la media tendr menor coeficiente de variacin en trminos absolutos. Luego, comparando dichos coeficientes parece razonable seleccionar el modelo cuyos coeficientes sean menores en trminos absolutos. Esto puede complementarse con grficos para cada fila en ambos modelos. Finalmente, una vez que se ha elegido el modelo a utilizar, se procede a estimar la estacionalidad.
donde:
donde Probablemente, la primera idea para estimar la estacionalidad consistira de los promedios por estacin en las series residuales. La correccin que aparece arriba para cada caso, apunta a garantizar que,
Sea
la estimacin de la tendencia (
1965 368,83 359,21 350,78 343,55 1966 337,50 332,64 328,97 326,48 1967 325,19 325,09 326,48 328,44 1968 331,90 336,55 342,39 349,42 1969 357,63 367,04 377,63 389,42 1970 402,39 416,55 431,90 448,44
)
1971 466,16 485,08 505,18 526,47
Trimestre 1 2 3 4
Entonces,
Trimestre 1 2 3 4
Como se observa en la siguiente figura, en el modelo mixto estos valores varan entorno al uno.
Si el modelo es Mixto, entonces, = 0,8 (0,9975 - 1) = 0,8025 = 1,21 (0,9975 1) = 1,2125 = 1,07 (0,9975 1) = 1,0725 = 0,91 (0,9975 1) = 0,9125
3. PREDICCIONES
Predecir, es estimar el futuro utilizando informacin del presente y del pasado. El conocimiento del futuro nos capacita para planificar, prever o prevenir. La idea es estimar X(t) en un instante n + k posterior al ltimo dato observado en t =n, k = 1,2,3,4,... (trimestre, mes, etc.). Una vez estimada la tendencia y la estacionalidad las frmulas de prediccin quedarn determinadas por: Modelo Mixto Modelo Aditivo
Con el objeto de ilustrar los mtodos revisados en este captulo considere los siguientes datos: Tabla 3.1. Serie Original
SEM/AO 1 1 1,73757 2 2,01815 2 2,42106 2,80325 3 4,47481 4,85566 4 4,78939 5,14076 5 5,19210 5,06387 6 5,10775 5,24787
Con el fin de eliminar los efectos irregulares y estacionalidad se obtiene la serie suavizada Z(t) con un promedio mvil centrado de orden 2, como se muestra en la tabla 3.2. Tabla 3.2. Serie Suavizada (Z(t))
SEM/AO 1 1 2 2,04874 2 2,41589 3,1256 3 4,15214 4,74389 4 4,89381 5,06576 5 5,14721 5,1069 6 5,12181 -
Una vez suavizada la serie, se obtienen las series residuales con el objeto de eliminar la estacionalidad dentro del modelo y saber por medio de un anlisis tabular de los residuos si el modelo es aditivo o mixto.
PRIMER CASO: Modelo Mixto. X(t) = T(t) E(t) + A(t) Con el objeto de eliminar la estacionalidad de la serie, se genera la serie de residuos:
La siguiente tabla contiene los residuos. Tabla 3.3. Serie de Residuos (W(t))
Sem/Ao 1 2 1 2 3 4 5 6 SW CV 1,00214 1,07771 0,97866 1,00872 0,9953 1,01251 0,03813 0,02766 0,98507 0,89687 1,02356 1,0148 0,99157 0,98237 0,05037 0,05127
SEGUNDO CASO: Modelo Aditivo. X(t) = T(t) + E(t) + A(t) Como en el caso anterior y con el objeto de eliminar la estacionalidad se construye la serie de residuos. R(t) = X(t) - Z(t) Los resultados se muestran en Tabla 3.4. Tabla 3.4. Serie de Residuos (R(t))
Sem/Ao 1 2
SR
CV
0,00517 0,32267 -0,10442 0,04489 -0,02406 0,04885 0,16256 3,3278 -0,03059 0,32235 0,11177 0,075 -0,04303 -0,04184 0,17034 -4,0712
La estimacin de la estacionalidad para este caso queda dada por: = 0,04885 - 0,0351 = 0,04534 = 0,004184 - 0,00351 = 0,04534 El clculo de las series residuales se realiz con el objeto de identificar a travs de los coeficientes de variacin para cada fila de los modelos; aquel modelo que sus filas presenten una menor variabilidad relativa a su media, ser escogido como el que interpreta a la serie a analizar. En este caso el modelo adoptado, es el modelo mixto. A travs de este modelo se obtendrn las proyecciones deseadas para los prximos dos semestres. Para tal efecto resta entonces obtener una estimacin de la tendencia. Con tal fin, se ajustar una curva a la serie suavizada.
Z(t) = a + bt
Yt = 0,442966 + 0,938027*t - 4,56E-02*t**2 Una vez obtenidas estas estimaciones se utiliza la ecuacin
para proyectar.
Proyecciones
Resumen
Se llama Serie de Tiempo, a un conjunto de mediciones de cierto fenmeno o experimento registradas secuencialmente en el tiempo, por ejemplo a cada hora, mensualmente, trimestralmente, semestralmente, etc.. En este apunte se trabaj con series de tiempo discreto, equiespaciadas en cuyo caso se asume que: : {x(t1), x(t2), ..., x(tn)}= {x(1), x(2), ..., x(n)}. Debido al carcter introductorio se restringi al caso de series de tiempo univariadas. Al analizar una serie de tiempo, lo primero que se debe hacer es graficar la serie. Esto nos permite detectar las componentes esenciales de la serie. El grfico de la serie permitir: detectar Outlier, detectar tendencias, variacin estacional, variaciones irregulares (o componente aleatoria). Un modelo clsico para una serie de tiempo, puede ser expresada como suma o producto de tres componentes: tendencia, estacional y un trmino de error aleatorio. Existen tres modelos de series de tiempos. Estos son:
1. Aditivo: X(t) = T(t) + E(t) + A(t) 2. Multiplicativo: X(t) = T(t) E(t) A(t) 3. Mixto: X(t) = T(t) E(t) + A(t)
Con el fin de obtener un modelo, es necesario estimar la tendencia y la estacionalidad. Para estimar la tendencia, se supone que la componente estacional no est presente. La estimacin se logra al ajustar a una funcin de tiempo a un polinomio o suavizamiento de la serie a travs de los promedios mviles. Para estimar la estacionalidad se requiere haber decidido el modelo a utilizar (mixto o aditivo). Una vez estimada la tendencia y la estacionalidad se esta en condiciones de predecir. Los mtodos revisados en este apunte son de naturaleza descriptiva, por lo que el juicio y el conocimiento del fenmeno juegan un rol importante en la seleccin del modelo. Los mtodos clsicos tienen la desventaja que se adaptan a travs del tiempo, lo que implica que el proceso de estimacin debe volver a iniciarse frente al conocimiento de un nuevo dato.