Documentos de Académico
Documentos de Profesional
Documentos de Cultura
: : : : :
Problema 1:
a) El archivo globtemp.dat es una serie asociada al calentamiento global que contiene 142 mediciones de desviaciones en la temperatura de la tierra entre los aos 1856 y 1997 (Shumway and stoffer 2000, pgina 50). Dado que se pide trabajar con los datos entre los aos 1900 y 1997 se genera una serie con las ltimas 98 mediciones mediante los comandos: datos = scan("globtemp.dat") Zt = ts(datos[45:142],start=c(1900))
b)
Rodrigo Thiers M.
Tarea 1 Series de Tiempo I Semestre 2013 - UTFSM c) Se considera el siguiente modelo de prediccin a un paso: t(1) = Zt + (1 ) t1(1), 0 < < 1, 1 t n,
Para determinar el valor ptimo de se realizan predicciones para siete valores distintos y se selecciona aquel que minimiza el error cuadrtico medio definido como: ECM = El problema de inicializacin del algoritmo se soluciona suponiendo 0(1) = Z1. Los resultados obtenidos se resumen en la tabla C.1:
ECM
0.01 4.443
0.1 2.037
0.2 1.508
0.4 1.292
0.6 1.285
0.8 1.327
1 1.409
Tabla C.1 ECM para distintos valores de Por lo tanto se selecciona como valor ptimo = 0.6 con un ECM = 1.285. En la figura C.2 se presentan los grficos de la serie original (rojo) y la serie suavizada para = 0.6 (azul).
Rodrigo Thiers M.
Tarea 1 Series de Tiempo I Semestre 2013 - UTFSM d) Para predecir la serie en los tres aos subsiguientes a la ltima observacin se considera el siguiente modelo de suavizamiento exponencial simple con = 0.6. t(k) = Zt + (1 ) t1(k-1), En la tabla D.1 se presentan los resultados obtenidos. 0 < < 1, 1 t n,
Ao Z pred.
Tabla D.1 Predicciones S.E.S (=0.6). e) En la figura E.1 se muestran grficamente la serie original (negro), serie suavizada (rojo) y la prediccin para los tres aos subsiguientes a la ltima observacin (verde).
Figura E.1 Serie original (Negro), Suavizada (Rojo) y Prediccin (Verde). El modelo de suavizamiento exponencial simple est formulado para una serie que no tiene tendencia, es decir, localmente constante ms un comportamiento irregular. La serie Globtemp presenta una clara tendencia creciente por lo que el modelo utilizado no es el ideal para capturar
Rodrigo Thiers M.
Tarea 1 Series de Tiempo I Semestre 2013 - UTFSM este comportamiento. Dado que la tendencia es lineal, el modelo ptimo de prediccin corresponde a suavizamiento exponencial doble. Sin embargo al observar la figura E.1 es posible apreciar un aceptable ajuste entre ambas curvas y suavizado de la serie.
f)
Para estabilizar la media de la serie se aplica el filtro de diferenciacin, definido como Yt = Zt = Zt Zt1
Figura F.1. Serie Diferenciada Mediante simple inspeccin visual es posible verificar la eliminacin de la tendencia y la estabilizacin de la media entorno a 0. Para estabilizar la varianza se propone aplicar la transformacin de Box-Cox. (Zt 1)/, T(Zt) = log(Zt), Zt > 0, = 0. (II) Zt 0, > 0, (I)
Se aplica esta transformacin a la serie original y a la series filtrada para valores de = 0 y = 1/2 y se comparan los resultados obtenidos.
Rodrigo Thiers M.
Figura F.2. Comparacin Transformaciones de Box-Cox Se observa que ninguna de los cuatro resultados obtenido presenta una varianza estable. Se concluye por lo tanto que mediante la transformacin de Box-Cox no es posible estabilizar la varianza. g) No existe evidencia experimental que permita establecer un comportamiento estacional en las variaciones de la temperatura anual media de la tierra. Esto se confirma al observar la serie, donde no es posible identificar un periodo s claro. Por este motivo se realizan las predicciones utilizando un modelo de Holt-Winters no estacional.
Rodrigo Thiers M.
Figura G.1. Mtodo Holt-Winters Caso No Estacional En la tabla G.2 se presentan los resultados de las predicciones realizadas para los aos 1998, 1999, 2000.
Ao Z pred.
Tabla G.2. Predicciones Holt-Winters No Estacional La comparacin de las capacidades de prediccin del mtodo Holt-Winters propuesto con el modelo de suavizamiento exponencial simple (=0.6) se realiza mediante validacin cruzada. Este procedimiento consiste en utilizar el 90% de los datos (n=88) para calibrar el modelo y el 10% restante (n=10) para evaluar la capacidad de prediccin calculando el error cuadrtico medio (ECM). Rodrigo Thiers M. 6
Ao 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997
Zt 0.25 0.18 0.35 0.29 0.15 0.19 0.26 0.39 0.22 0.43
Holt - Winters No Estacional t-1(1) et e t^2 0.07924763 0.17075237 0.02915637 0.09500279 0.08499721 0.00722453 0.11075795 0.23924205 0.05723676 0.12651312 0.16348688 0.02672796 0.14226828 0.00773172 5.9779E-05 0.15802344 0.03197656 0.0010225 0.17377861 0.08622139 0.00743413 0.18953377 0.20046623 0.04018671 0.20528893 0.01471107 0.00021642 0.2210441 0.2089559 0.04366257 ECM 0.21292772
Zt 0.25 0.18 0.35 0.29 0.15 0.19 0.26 0.39 0.22 0.43
S.E.Simple = 0.6 t-1 (1) et 0.1573522 0.0926478 0.2009409 -0.0209409 0.2183763 0.1316237 0.2253505 0.0646495 0.2281402 -0.0781402 0.2292561 -0.0392561 0.2297024 0.0302976 0.229881 0.160119 0.2299524 -0.0099524 0.229981 0.200019 ECM
et^2 0.00858361 0.00043852 0.0173248 0.00417956 0.00610589 0.00154104 0.00091794 0.02563809 9.905E-05 0.0400076 0.10483611
Tabla G.3. Validacin Cruzada Por lo tanto se concluye que el modelo de suavizamiento exponencial simple con =0.6 predice de mejor manera el comportamiento de la serie Globtemp.
Rodrigo Thiers M.
Problema 2:
a) En la figura 2.A.1 se presenta la imagen seleccionada.
Figura 2.A.1 Imagen Seleccionada Geneva.jpg Para cargarla en R se utiliza el comando readJPEG de la librera jpeg: library(jpeg) f=readJPEG("Geneva.jpg") Esto entrega un arreglo de datos de dimensin [504 756 3] debido a que la foto est compuesta por 3 canales de 504 x 756 pixeles. En el desarrollo del ejercicio los canales sern trabajados por separados, de manera de mantener el problema en Z2.
b) Como una primera descripcin estadstica de la imagen resulta til obtener el histograma de su distribucin. Para esto se utiliza el comando hist(), el cual entrega el grfico de la figura 2.B.1
Rodrigo Thiers M.
Figura 2.B.1 Histograma Geneva.jpg Se observa una distribucin irregular con dos peaks (Distribucin bimodal). Estos parecen corresponder a los dos colores predominantes que se observan en la fotografa (celeste y caf). Para obtener mayor informacin sobre la distribucin se utiliza el comando summary (), el cual entrega la media, mediana, primer cuartil, tercer cuartil, mnimo y mximo de la serie.
Min 0.03922
Mean 0.495
Max 1
Tabla 2.B.2 Parmetros Estadsticos Finalmente para obtener informacin sobre la dispersin se calcula la varianza. 2 = 0.06627668
Rodrigo Thiers M.
Tarea 1 Series de Tiempo I Semestre 2013 - UTFSM c) Para suavizar la serie espacial se plantea un filtro de media mvil considerando los vecinos a un pixel de distancia asignndoles un peso de 0.5. En la figura 2.C.1 se presenta un esquema explicativo del algoritmo.
Figura 2.C.1 Filtro Media Mvil Este procedimiento se realiza para cada canal de la imagen. Dado que el filtro considera los datos Zi-1,j-1 y Zi+1,j+1, se pierden 2 columnas y 2 filas de informacin. El detalle del procedimiento puede encontrarse en el archivo .R anexo. Una vez aplicado el filtro se calculan los mismos parmetros sealados en b), los cuales se resumen en la figura 2.C.2.
Max 1 1
Figura 2.C.2 a) Histogramas Imagen Filtrada v/s Original, b) Parmetros Estadsticos Rodrigo Thiers M. 10
Tarea 1 Series de Tiempo I Semestre 2013 - UTFSM Como es de esperar se aprecia un leve suavizamiento en el histograma de la serie. Se observa que los cuartiles se acercan hacia la media y que la mnima aumenta, lo que es esperable en un filtro de media mvil. En cuanto a la varianza, tambin se observa una leve disminucin alcanzando 2 = 0.06384893. d) En la figura 2.D.1 se compara la imagen original con la imagen filtrada.
Tarea 1 Series de Tiempo I Semestre 2013 - UTFSM Al observar ambas imgenes se aprecia que la foto filtrada presenta menos definicin en los bordes de los objetos. Esto es esperable, ya que el filtro de media mvil suaviz la serie espacial lo que provoca que los cambios de color sean menos bruscos y la imagen se vea ms borrosa. e) Para estudiar el efecto que tiene sobre la imagen filtrada la eleccin de la cantidad de vecinos se plantea un nuevo filtro considerando valores a dos pixeles de distancia. En la figura 2.E.1 se compara la imagen original con las dos imgenes filtradas. El detalle del algoritmo puede encontrarse en el archivo .R anexo.
Rodrigo Thiers M.
12
Figura 2.E.1. Comparacin Imgenes El considerar un mayor nmero de vecinos tiene como consecuencia un mayor suavizamiento de la serie lo que se traduce en una imagen an ms borrosa. Si bien el efecto de considerar vecinos a dos pixeles de distancia no tiene un efecto tan importante en el histograma, es importante destacar que la imagen tiene dimensiones 504x756 por lo que considerar vecinos a dos lugares de distancia no es significativo. Si se aplicara un filtro con un nmero importante de vecinos se suavizara an ms la serie y la imagen se vera ms borrosa.
f) Al observar la imagen se observa claramente la predominancia de dos colores: celeste y caf. Adems es posible reconocer una tendencia: La parte superior de la foto es principalmente celeste y vara hasta ser caf en la parte inferior. La existencia de esta tendencia implica que la serie espacial no es estable en media. En cuanto a la varianza se observa que en la mitad superior e inferior de la foto el color vara muy poco, por lo tanto se espera una varianza baja en estos sectores. Sin embargo en la parte central de la imagen, donde se juntan los colores celeste y caf, se tiene una varianza alta. Esta diferencia tan marcada en la varianza en distintos sectores implica que la varianza de la serie espacial no es estable.
Rodrigo Thiers M.
13
Problema 3:
a) b) Zt es un filtro lineal ya que es una combinacin lineal convexa entre las variables Y t-1 e Yt. E [Zt] = = = = V [Zt] = = = = = c) COV [Zt,Zt+1] = = E [ Yt-1 + (1-) Yt] E [ + t-1] + (1 ) E [ + t] + (1 ) V [ Yt-1 + (1-) Yt] 2 V [ + t-1] + (1 )2 V [ + t] 2 2 + (1 )2 2 2 (2 + 1 2 + 2) 2 (22 2 + 1) COV [ Yt-1 + (1-) Yt ; Yt + (1-) Yt+1 ]
2 COV [Yt-1, Yt] + (1-) COV [Yt-1, Yt+1] + (1-) COV [Yt, Yt] + (1 )2 COV [Yt, Yt+1]
Dado que COV [Yt, Ys] = 0 t s COV [Zt,Zt+1] = = d) (1-) Var [Yt] (1-) 2 = CORR [Zt,Zt+1]
Por lo tanto corresponde a la correlacin existente entre la variable Z en el instante t y el instante t+1. e) f) COV [Yt,Yt-1] = 0, y como Yt ~ N ( , 2) t, entonces Yt e Yt-1 son independientes. Segn lo calculado en c) COV [Zt,Zt+1] = (1-) 2 0. Por lo tanto Zt y Zt-1 no son independientes.
Rodrigo Thiers M.
14