Error Cuadrtico Medio de Prediccin para Modelos Estructurales de Series Temporales M. PILAR GONZALEZ Departamento de Econometra y Estadstica e Instituto de Economa Pblica Universidad del Pas Vasco RESUMEN En este artculo se comparan, mediante un estudio de Monte Carlo, el comportamiento en muestras pequeas de dos estimadores alter- nativos del error cuadrtico medio (ECM) de prediccin con parme- tros estimados para modelos estructurales de series temporales, uno que incluye un trmino que trata de recoger el error proveniente de la estimacin de los parmetros, y otro que no incluye dicho trmino. Para el modelo estructural ms sencillo, el modelo de paseo aleatorio ms ruido, se comparan ambos estimadores con el verdadero ECM de prediccin con parmetros estimados para diferentes tamaos de muestra, valores de los parmetros y horizontes de prediccin. Palabras clave: Filtro de Kalman, Modelos Estructurales, Error Cua- drtico Medio de Prediccin, Estimacin Mximo-verosmil. Clasificacin AMS: 62M 10. 1. INTRC^DUCCION Los modelos estructurales de series temporales se formulan en trminos de componentes no observados tales como tendencia, estacionalidad, ciclo e irre- gular, que son de gran inters para los economistas porque cuentan con una interpretacin directa. La formulacin general del modelo es: Yr=Nt+Yr+Wr+r (1.1) 1 18 ESrADiSr^CA ESPA4LA donde yr es la serie abservada ^r, Yr ^ ^r Y^r representan ia tendencia, estaciona- lidad, el ciclo y el componente irregular respectivamente. Cada uno de estos compnentes se especifica a priori de forma estocstica permitindoseles evolu- cionar a lo largo del tiempo mediante la introduccin de variables aleatorias. Depen- diendo de cules sean ias principales caracteristicas de la serie que se desean recvger en el rnodelo, estos componentes no observab^es se cOmbinan de diferentes maneras dando iugar a los distintos modelos estructurales (ver Harvey 1990). Esta clase de rnodelos se puede representar fcilmnte en el espacio de tos estadas, lo que posiblita la utilizacin de potentes algoritmos basados en el fiitro de Kalman para la estimacin mxirno-verosmil de los parmetros, la extraccin de seales y!a prediccin (Harvey 19$3). Por la tanto, baja el supuesto de que los parmetros del madelo son conocidos podemos obtener el predictor ptmo de fas futuras observaciones yT+s, s= 1, 2,... junto con el error cuadrtico medio (ECN1) de predicin aplicando repetidamente las ecuaciones de prediccn del filtro de Kalman (ver Anderson & Moore 1979). Ei problema se plantea porque coma ya seala Pierce ( 1975) rara vez cono- cermos los parmetros del modela y, en la prctica, para ilevar a cabo prediccio- nes basadas en cualquier modelo hemos de estimar en primer lugar los parme- tros de manera eficente. Nuestros predictores son, por io tanto, nicamente estimaciones de los predictores ptimos lo que conlleva un aumento en el ECM de prediccin. Estas cuestiones han despertado el inters en Ios ltimos aos sobre la distribucin del error de prediccin con parmetros estimados. En la seccin 2 de este artculo se plantean dos estimadores prcticos para el ECM de prediccin con parmetros estimadas, uno que incluye trminas que tratan de recoger la variabilidad debida a!a estimacin de los parmetros y otro que no los inciuye. Restringindanos al caso del modelo estructural ms sencillo, el paseo aleatorio con ruido, en la seccin 3 comparamos el comportamiento en muestras pequeas de ambos estimadores propuestos mediante un estudio de Monte Carlo. 2. ERROR CUADRATICO MED!(J DE PREDICCION CON PARAMETROS EST^MADOS Supongamos que la serie observada yt, t= 1, 2,,.. T, sgue un modelo estructural invariante en el tiempo del tipo (1.1 } que se puede representar en el espacio de las estados como: Yt = Z'ar + ^t ( 2 . 1 j ar - ^ at-1 + n t ERROR CUADRATICO MEDIO DE PRED^CCION PARA MODELOS ESTRUCTURALES DE SERIES TEMPORA^ES 11^ donde yr es la serie observada, at(kx 1) es el denominado vector estado, y , E t , r^t (kX1} son trminos de error que no estn correlacionados entre si ni con el vector estado as, s_< t , y ^^^^- N C (^E Q ) ) E n los modelos est ruct urales de series t emporales, el vect or est ado a, ^ est formado par ios element os que det erminan los component es no observables de la serie, como ^, ^r, et c. Tant o z', de orden (1 xk) , como C de orden (kxk) , son mat rices conocidas que no dependen de los parmet ros del rnodelo y cuya est ruct ura es dist int a para cada Modelo E st ruct ural que est emos considerando en part icular. Vamos a denot ar por yr (nx1) al vect or de parmet ros del modelo (2.1) , que incluye nicament e a y los parmet ros cont enidos en Q . En el modelo gaussiano (2.1}, la prediccin ptima (en el sentido de ECM m nimo} de las obsenraciones futuras yT+s, s= 1, 2, .. . viene dada por: YT+s/T^^^ = Z'aT+slT(W) donde ar+^r(W )= E [ar+sl Yr^ Yr-^ ^, Y^ ] { 2 . 2 ) Esta prediccin yr+^{y,) se puede interpretar como la media de la distribucin de yT+s condicionada a las observaciones hasta e incluyendoyT. Si no suponemos normalidad en el modelo ( 2.1) el predictor (2.2} ya no sera la esperanza condi- cionada ni sera ptimo. Sin embargo, seguir siendo el predictor lineal de EC M mnimo. E ! E CM de prediccin asociado, es decir, la varianza del error de prediccin es: EC MC Yr+ ^ r{ v^ )] = Z'Pr+^r{^) z + Q Z ( 2 . 3 } donde Pr+^rr{^) =E{[ar+s - ar+^r-r{^)][ar+s ar+^r{w)]'3 Est formula nos proporciona el EC M de prediccin condicionado a los par- metros del modeio. Por lo tanto, bajo el supuesto de que el vector de parmetros y^ es conocido, la frmula ( 2.3) es correcta. Tanto el predictor ( 2.2) como su EC M asociado (2.3) se pueden obtener aplicando repetidamen#e las ecuaciones del filtro de Kalman al modelo ( 2.1), con toda la informacin en ia serie yt, t= 1, 2,...,T. Si t rabajamos bajo el supuest o ms realist a de que desconocemos los par- met ros del modelo y hemos de est imarlos a part ir de la muest ra disponible, el 12U E_STAf.^151ft:A ESPAtVC7fvA criterio de actuacin suele ser el siguiente. En primer lugar estimamos los par- metros de forma eficiente por mxima verosimilitud (1) y posteriormente se sus- tituyen en (2.2) los valores desconocidos y^ por sus estimaciones mximos verosimiles, ^. De esta forma el predictor de yT+s con parmetros estimados es: Yr+srri V ) ^ Z'a r+^rr{ ^ ) (2,4) Aunque el predictor yT+^{ yr) era ptimo cuando conocamos !os parmetros del modelo, esto no implica que yT+^{yr} sea el predictor ptimo para un modelo con parmetros estimados. Sin embargo, yT+^{yr) es e! pr^dictor ms usado en la prctica y, por lo tanto, nos interesa estudiar sus propiedades. E! error de prediccin cometido se puede descomponer ahora en dos partes: .YT+s ^ YT+sJT{^) ' U' T+s ^ YT+slTC^)1 + U' T+s/T^V^) ^ YT+slT{W)J ( 2. 5 ) donde el primer sumando recoge e! error que proviene de la parte de perturbacin aleatoria de! modelo y e! segundo, el error debido a la estimacin de fos par- metros. Como los dos sumandos de (2.5) son independientes porque hemos supuesto que !os trminos de perturbacin ^t y nr son normales independientes, e! ECM de prediccin con parmetros estimados se puede escribir como: ECMoLVr+srr{W)J = ECYr+s - Yr^srrt^)l2 + ECVr+sir(v^) ^ Yr+sir{^ j ^)J2 (2.6) donde el primer sumando viene dado por (2.3), es decir, e! ECM de prediccin con parmetros conocidos y e! segundo representa lo que aadimos al ECM de prediccin para recoger la variabilidad muestral de !as estimaciones de los parmetros. Es interesante sealar que el ECM de las estimaciones de los parmetros es de orden 1/T por io que e! aumento en el ECM de prediccin es de ese orden mientras que el ECM de prediccn de! verdadero modelo es de orden 1. Aunque e! ECM del predictor yT+s,7-(y^) viene dado por (2.6), en la prctica e! estimador usual del ECM de prediccin que se utiliza se basa simplemente en sustituir e! verdadero valor de los parmetros desconocidos por sus estimaciones mximo-verosimiles en la frr^ula ( 2.3}^Pero este estimador del ECM del predic- tor yT+^{y^}, denotado por ECM[yT+^{^)J, presenta dos problemas fundamenta- les en muestras finitas. En primer lugar, no tiene en cuenta e! error que proviene de la estimacin de los parmetros y, en segundo lugar, puede presentar sesgos (1) Vase HARVEY, A. C. y S. PETERS (1984) para una discusin sobre los distintos mtodos de estimacin mximo-verosmil de los parme#ros desconocidos de los modelos estruc#urales. ERRC3R CUADRATICO MEDIO DE PREDICC^I4N PARA MC.^DEI_.OS ESTRUCT ^SRAt ES UE SER^ ES TEMF'OR.F1l ES 1 ^1 como estmador de la correspondiente cantidad poblacional ECM[yT.^^-(y^)] debi- do a que las estimaciones de las parmetros en muestras finitas pueden estar seriamente sesgadas. Por otra parte, la frmula (2.6^ no nos proporciona un estimador adecuado para el ECM de prediccin ya que presenta las dificultades de ser complicada de calcular porque el segundo sumando habria que obtenerlo por medio de simula- ciones. Bloomfield (1972), Yamamoto (1976) y^8ailiie (1980) entre otros, han estudiado este trmino para modelos autorregresivos y han derivado expresiones asintticas basadas en la distribucin asinttica de los parmetros estimados. AI aplicar estos resultados asintticos a!os estudios con muestras finitas que ge- neralmente se realizan en la prctica, se han de tener en cuenta que las estima- ciones de los parme#ros en muestras finitas pueden estar seriamente sesgadas y que estos sesgos se trasladarn a la distribucin condicianada de las predic- ciones dados los valores observados de la variable endgena utilizados para iniciar las predicciones. Adems cuando predecimos estamos condicionando a ciertos valores de la variable endgena, la distribucin de las estimaciones de las parmetros estar tambin condicionada y esto afectar a la distribucin de los errores de prediccin. En este sentido, se han desarrollado en la literatura estudios sobre la distribucin del error de prediccin con parmetros estimados condicionada a los datos observados. Los trabajos de Phillips (1979) y Fuller y Hasza (1981) se centran en modelos autorregresivos y el de Ansley y Kohn (1986} en modelos en el espacio de los estados. ^ Vamos a proponer un estimador alternativo para el ECM del predictor yT+^{^^ ), derivando una expresin analtica para el segundo sumando del segundo miem- bro de ( 2.6) condicionada a 1os datos observados. Podemos observar que, sustituyendo las expresiones (2.2) y(2.4), este segun- do sumando de (2.6) se puede escribir como: ^T+slT^4^ - .yT+s^l^{^)^2 ^ = Z^F^^ar+^rr{^) - ar+.^r{ 4^)]^ar+^r{^^) ! ar+^{4^))'}z ( 2 - 7 ) lo que significa que la parte del error de prediccin que proviene de la estimacin de los parmetros es una combinacin lineal del error de prediccin del vector estado que proviene de ia estimacin de los parmetros. Por lo #anta, para derivar una expresin analtica para (2.7) podemos aplicar la aproximacin propuesta por Ansley y Kohn (1986). Ansley y Kohn (1986) derivan una aproximacin al ECM de prediccin del vector estado con parmetros estimados condicionado a ia muestra, que propor- 122 ESTApISTICA ESPAOLA ciona una correccin de orden 1l T a Pr+^{y^) que es la expresin usual, bajo las siguientes condiciones de regularidad: i) Para T grande, T^^2 ( yr- yr) -- N(o, Vt^r)) ii) La diferencia aT+^){^^ ~^T+^^) ' ^T+s^Ti^} (^-^) ^p(1^^ sendo yr un punto intermedio entre yr y el verdadero valor yr, y donde aa r ^sr r { ^ ) A r+^r( 4^ ^ _ a ^ y el trmino Op( 1IT^ se puede despreciar, para tamaos muestrales grandes, camparado con AT^^( y^) ( y^-y ^ ). iii) La esperanza condicionada: ET(V^rw} (V^-4^}'^Ar+^{^)^ = V( V^}lT + oP( 1IT) donde V --^ es la matriz de covarianzas de {os estimadores ^r evaluada en el T verdadero valor de los parmetros yr. iv) z, C, Q tienen segundasderivadascontinuascon respecto a yr. La aproximacin a! ECM de prediccin esde la forma: Pr+^r{ W } + ^ IAr+^r(W} V(w) a'r +^r (v^)l T Hay sealar que Ansley y Kohn no condicionan el ECMde prediccin a todos los datos sino slo al determinante principal dei trmino aT+^(w)-aT+^(yr), que es el que recoge el error que proviene de la variabilidad muestral de ias estima- ciones de los parmetros. Apiicando l correccin anterior a losModelosEstructuralesde SeriesTempo- rales, obtenemosla siguiente aproximacin a! ECM de prediccin con parmetros estimados: ECM *^YT+s/T{W}^ -- Z'PT+s/T{^} Z+ a^ + ^^Z'AT+s^r{4^} V(^) A'T+^rl{4^}Zj (Z.8) T EI ltimo sumando de (2.8) nos da la correccin de orden 1/T que trata de recoger !a variabilidad debida a la estimacin de los parmetros. De la expresin (2.8) podemos obtener las siguientes conclusiones: i) 1a contribucin al ECM de prediccin de la estimacin dei error debido a ios parmetros desaparece cuando T tiende a infinito, resuitado que no es sorprendente ya que los parmetros han E:RROR CU4DRATICO MEDiO DE PREDICCIOPJ F^ARA MODELOS ESTRUCTI)RAIE:S DF 5ERIES T^MF'ORAIES 1Z3 sido estirnados consistentemente; ii) la eficiencia en prediccin se puede aurnen- tar, es decir, reducir el ECM de prediccin, si mejoramos ia eficiencia del estima- dor yr. Por ejemplo, si disponemos de informacin a priori sobre restricciones en algunos elementos de y^ y podemos obtener un estimador m^ximo-verosmii res#ringido. Un estimador dei ECM de prediccin con parametros estimados se puede obtener sustituyendo en (2.8} los verdaderos valores de los parmetros por sus estimaciones mximo verosimiles yr. EI estimador de ECM* [yT+^ ( yr}] depende slo de la muestra yr y es fcil de calcular. 3. COMPARACION DE ERRORES CUADRATICOS MEDI^S DE PREDICCION En la secci^in 2 hemos presentado dos estimadores posibles dei ECM de prediccin con parmetros estimados: n EC'^'U' T+s^lTC^^1 = 2'PT+sfItW ^2 + Q2 ECM * CYT+^r{ ^ }l = Z' ^T+srr( ^ )Z + a2 + ^ [z'A r+^{ yr > V( ^ ) A' r+ ^ >z ^- W sr1{ V ^ ^ Mediante un estudio de Monte Car{a vamos a analizar su comportamiento como estimadores del verdadero error cuadrtico medio de prediccin con par- metros estimados, ECM ^ oCYr ^r{W)l, tomando como marco de trabajo el modela estructural ms sencillo, el modelo de paseo aleatorio con ruido. 3.^. Modelo de Paseo Aleatorio con ruido Supongamos que nuestro conjunto de observaciones yr, t= 1, 2, ..., T sigue un modeio de paseo aleatorio con ruido: Yr=Nr+^r I^t - t^r-^ + ^1r donde ^r U^ a ^1r ^ IVo g ^2 n (3.1) Este modelo, est escrito directamente en el espacio de los estados cn Z^=c=1,yG?=a 124 FSTAD(STfCA ESF'A(VOt_A Si conocemas los parmetros del modelo la prediccin ptima de las futuras observaciones la pademos obtener aplicando (2.2) a nuestro modelo: YT+srr{^) = mr+srr{^Y) = mT{^) donde mT^^) _ ^N T+sI YT+ YT-1 + + Y1 ^ .s-1,2,... s=1,2,... (3.2) Por la tanto, para el modefo que nos ocupa la prediccin ptima para la serie observada es la misma que para el vector estado. EI ECM de prediccin correspondiente sera, aplicando (2.3): ECMCY r+ slr{ ^)l = Pr+ sn{ y, >+ ^? = 1' r( r} r ) + s 6 + Q 2 ( 3 . 3 ) Si los parmetros del modelo son desconocidos, la prediccin de las futuras observaciones yT+s, denominada yTf^{y,), la podemos obtener sustituyendo en (3.2) los verdaderos valores de los parmetros por sus estimaciones mximo-ve- rosmiles. EI ECM del predictor yT+^{w) lo podemos estimar a partir de (3.3), sustituyendo el vector de parmetros desconocidos ( Q, 6 ) por sus estimaciones mximo verosmiles, o bien derivando la expresin (2.8) correspondiente al modelo (3.1). Antes de aplicar la aproximacin (2.8) para obtener el ECM de prediccin con parmetros estimados, vamos a comprobar que las condiciones de regularidad sealadas por Ansley y Kohn se cumplen para nuestro modelo: i) Supongamas que estimarnos y^ maximizando la aproximacin a la funcin de verosimilitud en el dominio de la frecuencia siguiente: L(,^,y) ^ . . T-1 T-1 lo e'^ - n ^ - { -^ ^ g gc ^ ) ^ ;^ 1^^ ^^ pg^ej ^ ( 3 . 4) donde ^,^ = 2nj/T^`, j= 1, ..., T^`-1, y T"k = T-d, siendo d el orden de diferenciacin necesario para que la serie ( ^ -L}dyt sea estacionaria. Adems I( ^,j) es la ordenada correspondiente de! periodograma y g( e^^) es la funcin generatriz espectral que para el modelo (3.1) es de 1a forma g( e^^`) = 6^ + 2(1-cos^,^) a^. Bajo ciertas condiciones de regularidad, Hannan (197^) prueba que ^ es un estimador consistente que sigue una distribucin asinttica normal con matriz de ERRUR CI_lADFZATICO MEDIC^ C)E PF^FDCCCION PAR,A ti1C.)UELO;S E7TRl1C:Tl^RAlES D^ SER^E^S Tf"ti1f'C)Ft^LE.S ^^^:^ covarianzas V(y^)/T dada por la inversa de la matriz de informacin. EI elernento ih-simo de la matriZ de informacin se puede aproximar por (Harvey 1990): 1 a9(e^^) dg(e^) 1/ 2^ ^^ 2 9'(e^ ) a 4 ^^ a Wn por lo que para el modelo (3.1 } la rnatriz de covarianzas de los estimadares se puede escribir como: 1/ 2 e'^ -2 1/ 2 2(1 - cos^,^) ^g( ^) ^ ^^2 9 ^ t e^ ) 2(1 - cos^,^) 4(1 - 2cos^.^)2 1/ 2^ ^^2 1/ 2^ ^^ 2 9 ^( e^ ) 9 ( e^ ) ( 3 . 5 ) Esta teora asinttica no es vlida cuando el modelo (3.1 } no es estrictamente invertible. La forma reducida de un paseo aleatorio con ruido es un IMA (1 , 1) con parmetro MA -1 _< e_< o. EI modelo no es invertible cuando e=-1, valor que corresponde a^ = 0. Por lo tanto, el supuesto i) slo se cumple si 6 > 0. ii) La diferencia ^^ r+^r{ 4^ ) - rr^ r+^-r{^) = Mr+^r{ ^ ) ( 4 ^- ^^ ) + O p(1 / % ^ donde ^v es un punto intermedio entre y^y el verdadero valor yr y Mr+^w) _ amr+^^) a y ^ Este supuesto se cumple si mr+^-(r^) tiene derivadas continuas de segundo orden con respecto a yr, ya que yr es un estimadar consistente de y^. iii) EI tercer supuesto se cumple si (y^-y^) es aproximadamente independiente de Mr+^-( ^^ ) . Podramos evitar la dificultad de probar este supuesto considerando que tene- mos una muestra semiinfinita o que la muestra utilizada en la estimacin de los parmetros es independiente de los valares de la variable endgena con las que iniciamos la prediccin. Los trabajos de Fuller y Hasza (1980), Reinsel (1980), entre otros, indican que para muestras de tamao moderado, el supuesto de tener procesos independientes es una hiptesis de trabajo razonable. 12f ESTApISTiCA ESPANOLA No vamos a probar rigurosamente este supues#o, pero vamos a dar una veriFcacin heurstica del m'rsmo para el modelo de paseo aleatorio con ruido. Para muestras grandes, e! predictor ptimo de yT+s puede ser estimado por (ver Harvey 1990): T--1 yi+sT{^^ ^ mT^^V^ ^ ^^^ ^l1 - ^^YYT- j^-0 donde, ba^o ei supuesto de que el tamao muestral T es suficientemente grande como para que Pt alcance el estado estacionario, es decir, Pt = P^_ ^= P P(W) + Q ^( 4^ ) = F,( + ^.2 + Q2 W> ^ F P(yr) _ [-a + (4c^a? Cl^ )1^^ ^ 2 Como se puede comprobar fcilmente 4 <[1-^.(^)] < 1, lo que implica que al aumentar j el trmino [1-^,(y^)}^ decrece exponenciaimente con lmite inferior cero. Por lo tanto, para Tgrande, como (yr-yr) depende de todas !as observaciones de la misma manera, podemos incluir que (y>,-yr) es aproximadamente independiente de MT+^{y,}. iv) z, C, Q#ienen segundas derivadas continuas con respecto a yr. Por I tanto, podemos aproximar e1 ECM de prediccin con parmetros esti- mados apiicando la expresin (2.8) a nuestro modelo: ECM *[.Y T +^r r { 4^)^ = Pr +^r { W )+ Q? + ^ IMr +^r (4^) V(^)1V1'r +^n{ ^)^ t3.6) T 3.2. Resultados obtenidos Los estimadores prcticos dei ECM de prediccin con parmetros estimados se obtienen sustituyendo en (3.3) y(3.6) los valores de fos parmetros por sus es#irnaciones mximo, verosimiles. Estos estimadores dependen del tamao muestral, T, y del verdadero valor de los parmetros de! modelo (a,c^?). Nos interesan fundamentalmente los resultados que obtengamos para muestras pe- queas y moderadas, por Io que hemos considerado los tamaos muestrales, T= 25, 5^, 100 , y 200. Como valores de 1os parmetros del modeio se han elegido, Q^ = 0.01, 0.05, 0.1, 0.5, 1, 5, 10, 50, 100 y v? = 1. ERROR CUADRATICO MEDIO DE PREDICCION PARA AAODEIOS ESTRUCTURALES DE SERIES TEMPORALES ^ 27 Para cada tamao muestral T y para cada par de valores (a^,a?) se generan artificialmente N=1.000 muestras de yt que siguen el modelo (3.1). Una vez generadas las variables aleatorias pseudonormales, r^t y>E^, ia serie de observa- ciones yt se obtienen a partir det modelo (3.1), utilizando como valor inicial de1 vector estado m^ = 0. Para cada tamao muestral T, se han generado series de observaciones yt de tamao T+ 100. Las 100 primeras observaciorties se recha- zan para evitar que nuestros datos dependan de los valores iniciales tornados para generar la secie. Las T observaciones siguientes se utiizan para estimar los parmetros del modelo. Para cada tamao muestral T y para cada par de valores ( Q^, c^^ ) se han calculado los siguientes estad sticos: 1 ) 2) 3 ) 4) N ECMo^.Yr+srrE4^}^ - P^(^) + sQ^ + Q2 + ^ [mr+^rtW) - mr^^r{^)j^ ^ Nla1 ECM(yr+^r(^)] = P^t^) + S^ + ^ N N ECM[yr+ ^r( ^ }] =^ ECA^II.Yr+ ^r{ 4r )] ^ _ ^ [Pr(4^ ) + sQ2 + Q ] ^ ^ ^ ^ n ^ N ;a ^ N ^_ ^ * N ECM [yT+ s/T{ W)] - P7{ yr )+ s Q ^+ Q? + ^ ^MT+ s^rT( ^) V -^--^ M' T+ s/T{ 4^ )]; ^ N^^ T 5} ^ * ,^ ^ 1 N ^ ^^ ^2 ^ V( #^) " ECM [yr+^r{^)l ^ [Pr(^) + san + aF + MT+^{V^) T. ^r+^r(V^)]; N fa ^ La cantidad (2) se caicu{a analticamente asi camo la primera parte de (1) y (4), mientras que el segundo sumando de (1) y (4) as como (3), y(5) se obtienen mediante simulacin. Existen distintas alternativas para calcular el ECM del predictor yr+^{y,), como la utiiizada por Spitzer y Baillie (1983), que generan ms observaciones de la serie yr, y evalan el ECM de prediccin con parrnetros estimados directamente por simulacin. ^Sin embargo, ten^endo en cuenta que queremos comparar los estimadores ECM[yT+^,T{ y^)j y ECM' k[yT+s^-( y^)] con un valor del verdadero ECM de prediccin con parmetros estimados que no est sujeto a grandes variabilidades muestrales, la ventaja de usar la descomposicin (2.6) es que nos permite hallar una parte importante del EC1/I de prediccin analticamente y, por lo tanto, es de esperar que nos proporcione estimaciones ms precisas. Los parmetros del modelo ( a^,a?) se estiman por Mxima Verosimilitud en el dominio de la frecuencia, maximizanda la funcin ( 3.4). Estrictamente hablando, 128 ESTADISTICA ESPAOLA la expresin (3.4) slo es igual a la funcin de verosimilitud si la serie estacionaria cumple la condicin de circularidad. Camo esta condcin es poco realista en nuestro contexto de trabajo, es mejor considerar la funcin (3.4} como una aproximacin a la funcin de verosimilitud exacta. Esta funcin de verosimilitud exacta se puede obtener en el dominio del tiempo mediante la descomposicin de los errores de prediccin, que se obtienen junto con sus varianzas aplicando las recursiones del filtr de Kalman. En el caso de los modelos no estacionarios como son, en general, los modelos estructurales de series temporales, es preciso tener cuidado con las condiciones iniciales que se utilizan para el filtro de Kalman. Para calcular las cantidades (1)-(5) es necesario obtener tanto la estimacin de m^{^r) como su error cuadrtico medio P^(yr) evaluados para el verdadero valor de los parmetros y para los parmetros estimados. Ambas cantidades se obtienen mediante las recursiones de prediccin y actualizacin del filtro de Kalman inicializadas can mo = 0 y el prior difuso Po = k, donde k es un nmero arbitrariamen#e grande. En el programa que ha realizada e! clculo de estos estadsticos no se impone la condicin de que PT alcance el estado estacionario, pero para el rnodelo (3.1) este estado se alcanza incluso para muestras de tamao T = 25. A la hora de obtener los estadsticos (4) y(5) es preciso calcular el vector de derivadas M+ amT+^ , amT^^ . Estas derivadas del vector estado se r ^r{ ^ } = 2 2 aQ ^ aQ n han calculado analticarnente y el conjunto de recursiones se corren de forma paralela al filtro de Kalman, siendo ncializadas como sigue: amo _ arno _ aPo i aPo _ p aQ n a^? aQ ^ a^? Los estadsticos (1)-(5) han sido calculados para tres horizontes de prediccin s= 1, 3, 12. Para el modelo (3.1) que estamos considerando el predictor de yT+s, s= 1, 2,... viene dado par (3.2} que es !a estimacin de! vector estado en el momento T: m^. Por lo tanto, como la correccin de orden 1/T al ECM de prediccin con parmetros estimados que hemos propuesto depende slo de la estimacin del vec#ar estado en el momento T y de la matriz de covarianzas de las estimadores, que son las mismas para todo s, slo es necesara calcularla una vez para cada terna ^T,v,Q ?) o(T,^,^?). Todos los clcuios han sido realizados en un ordenador Hewlett-Packard serie 500. EI programa de Fortran utilizado ha sido escrito en doble precisin. La estimacin de los parmetros se Ileva a cabo maximizando 1a funcin de verosi- militud (3.4) mediante el algoritmo de scoring que presenta las ventajas de utilizar slo las primeras derivadas de ^la funcin de verosimilitud (como hemos visto la ERROR CUAORATICOMEDIODE PREDICCIONPARAMODELOS ESTRUCTURALES DE SERI^ES TEMPORAi`ES ^Z^ matriz de informacin depende nicamente de ellas}, y de proporcionar directa- mente la matriz de covarianzas para los estimadores (3.5}. Los criterios de convergencia utilizados para terminar las iteraciones han sido los habituales: i) la diferencia entre parmetros sea menor de 10^4; ii) la diferencia entre los valores de ia funcin sea menor que 10-$. En este trabajo se ha elegido la funcin de verosimilitud (3.4}, en lugar de los mtodos en el dominio del tiempo, porque la experiencia de clculo de estimadores mximo-verosmiles para muestras peque- as y moderadas, menores de 200, nos seala que los mtodos de estimacin en el dominio de la frecuencia son mucho ms rpidos que en el dominio del tiempo, y que el algoritmo de scoring proporciona muy buenos resultados en 1a mayora de los casos. ^os resultados obtenidos en las simulaciones para el modelo (3.1) se encuen- tran reflejados en los cuadros 1 y 2. En primer lugar, hemos tratado de estudiar la importancia cuantitativa de los problemas que plantea utilizar directamente un estimador de ECM[yT+^{^r)] para calcular el ECM de prediccin con parmetros estimados. Por un lado, un estimador de ECM[yT+^{y,)] no tiene en cuenta que los parmetros del modelo han sido estimados y que el error que proviene de ia estimacin de los parmetros producir un incremento en el ECM de prediccin de manera que: ECMo[YT+^r{W)] ^ ECMCYT+^r{V^)l En la primera columna del Cuadro 1, se presentan para cada tamao rnuestral T, para cada valor del parmetro Q y para el horizonte de prediccin s= 1, los resultados de calcular la razn: _^^^/%U' T+s/7{ ^ )^ R^^EC^ ^ CY T+^r{ w )] con la que tratamos de medir los efectos de la variabilidad muestral de las estirnaciones de los parmetros en el error cuadrtico medio de prediccin. Por ejemplo, para ^? = 0.1 y T= 25, ECMo[yT+S,T{yJ)] es un 10 por 100 mayor que el ECM[yT+s^(y^)]. Podemos observar que los efectos ms serios se producen para valores pequeos de a^, es decir, cuando nos encontramos cerca de la zona de no invertibilidad. Esta razn disminuye, en general, conforme aumenta el par- metro Q, estabilizndose en torno al 4 5 por 100, y decae rpidamente con el tamao muestral T. 130 ESTADISTICA ESPA^LA ^ CUADR01 ^ ECM[yT ^{yr)] como estimador del ECM de prediccin con parmetros estirnados T= 25 T= 50 T= 100 T=200 R^ R2 R^ R2 R^ R2 R1 R2 Q? = 4^01 1.11 1.13 1.07 1.09 1.03 1.05 1.02 1.03 o^= 0.05 1.09 1.06 1.06 1.02 1.02 1.01 1.01 1.01 Qz - p.1 ^- 1.10 1.06 1.04 1.05 1.02 1.04 1.0 ^ 1. 02 , ^2 - p_5 ^- 1.05 0.97 ^ 1.02 1.01 1.01 1.02 1.00 1.00 Q2 - 1.00 n- 1.03 0.96 1.03 0.98 1.01 1.00 1.01 1.01 Q^ = 5.00 1.05 1.03 1.01 1.02 1.01 1.01 1.01 1. 00 Q^_^ o.ao 1.04 0.96 1.02 1.01 1.01 1.01 1.00 0.99 Q^= 50.00 1. 06 0. 93 1.03 0.98 1.01 0. 99 1.01 1. 00 Q^ = 100.0 1.04 0.99 1.02 1.01 1.01 1.00 1.00 1.00 n Por otro lado, nos interesa c^omprobar ia calidad de ECM[yT+^(^)] como estimador de su correspondiente cantidad poblacional ECM[yT+^-(y^)]. La colum- na R2 del Cuadro 1 trata de recoger los sesgos en la estimacin de ECM[yT+^{y, }j debidos a los sesgos en la estimacin de ^os parmetros a travs de la razn: n _ ECM CY T+^r{ W )1 ^2 ECM CY T+$ rr( ^ )l ^ Se puede observar que para valores de Q^ pequeos, ECM[yT+^-{^r)j est siste- mticamente sesgado hacia arriba, hasta un 13 por 100 para T= 25 y un 9 por 100 para T= 50. Estos sesgos en la estimacin de ECM[yT+, ^{y ^ )] van disrninu- yendo conforme aumenta a y nos alejamos de la zona de no invertibilidad del modelo, hasta cambiar de signo y, asi, para valores grandes de Q^, el estimador n ECM[yT ^{ y,)] est sesgado hacia abajo, por ejemplo para Q^ = 50, es un 93 por 100 de ECM[yT+^{^r)]. Estos sesgos desaparecen rpidamente con el tamao muestral. Los resultados obtenidos en la zona de no invertibildad del modelo (valores pequeos de 6) pueden estar influenciados por el mtodo de estimacin elegido. Los distintos mtodos de estimacin mximo-verosmil tienen las mismas propie- dades asntticas, aunque pueden tener propiedades en muestras pequeas ERROR CUADRATICO MEDIO DE PREDICCION PARA AAODEIOS ESTRUCTURAIES DE SERiES TEMPORALES 131 diferentes. Harvey y Peters { 1984) realizan un pequeo ejercicio de simulacin en el que abtienen que las mayores diferencias entre fos estimadores en el dominio del tiempo y el dorninio de la frecuencia aparecen cuando !os parmetros de varianza estn prximos a cero, aunque no hay evidencia clara de la direccin del sesgo de ambos estimadores en esta zona prxima a la no invertibilidad. ^ ^n el Cuadro 2 comparamos el camportamiento de ECM^yr ^(yr)] y ECM*(yr+^{ y^ }] como estimadores de ECMo[yr+^{yr)] a travs de !as razones: n ^ _ _ ECM CYr+^(W )] _ ECM LYr+^{ ^ )l R3 ECM R4 ECM o CYT +^r{ 4 ^ ? ] o IYr+^r(v^ )I Con el fin de comprobar la validez de la aproximacin asintetica elegida, se presentan tambin los resultados obtenidos para el estadstico ECM*[yT+^{y^ )] mediante el clculo de la razn: * _ ECM ^yr+^r( ^Y )] R5 ECM 0 U' T +s T { ^ )] n En general el estimador ECM [yT +,^y^)] subestima el verdadero ECM de pre- diccin con parmetros estimados. Esta subestimacin aumenta de forma consi- derable conforme crece el horizonte de prediccin s. Por ejemplo, para 6^ = 50, n ^ el ECM[yT +^{ yr)] es el 88 pc+r 100 del verdadero ECM de prediccien para s= 1, pasa a ser el 73 por 100 para s= 3 y se reduce al 67 par 100 para s= 12. Podemos concluir que los efectos de la estimacin de los parmetros en el ECM de prediccin son importan#es y deben ser tenidos en cuenta, sobre todo en muestras pequeas, T=25, 50, como era de esperar. Por^lo tanto, ^arece conveniente utilizar el estimador alternativo que proponemos ECM'"`[yT +^(y^)] que corrige esta subestimacin en la direccin adecuada aunque no siernpre en la proporcien suficiente para solucionar totalmente el probfema. Por ejempio, para 62 =50 y s=1 e! E^M^'"`[yT S^(y^)] es el 92 por 100 del verdadero ECM. Adems n podemos observar, que como era de esperar, la proporcin en que el estimador alternativo corrige la subestimacin del verdadero ECM de prediccin es menor conforme el horizonte de prediccin es ms largo. Las nicas excepciones al comportamiento anteriormente sealado se produ- cen cuando nos encontramos con valores de o^ muy pequeos, cercanos a la zona de no invertibilidad. En este caso habamas observado en el Cuadro 1 que tanto los efectos de la variabilidad muestral en las estimaciones de los parme- tros como los sesgas en los e^tirnadores de las mi^mos apuntan en la misma direccin y hacen que tanto ECM[yT +sn-{ y^)] como ECM'k[yT +sn{^,)] sobreestimen el verdadero ECM de prediccien en cantidades que aunque no son muy impor- tantes para s = 1, aumentan rpidamente con el hrizonte de prediccin. 132 ESTAOISTICA ESPAOLA CUADRI^ 2 Comparacin de Errores Cuadrticos Medios de Prediccin con parmetros estimados s=1 s=3 s=12 T R^ R{ R^ R3 R4 RS R^ R^ R5 25 1.02 1.05 0.93 1.19 1.21 0.97 1.86 1.88 0.93 Q2- a.o^ ^! 50 1.01 1.03 0.95 1.09 1.11 0.95 1.43 1.45 0.95 100 1.02 1.03 0.98 1.06 1.06 0.98 1.21 1.22 0.98 200 1.02 1.02 0.99 1.03 1.04 0.99 1.11 1.12 0.99 25 0.97 1.00 0.95 1.12 1.15 0.95 1.60 1.62 0.96 a^=0 05 50 0.97 0.98 0.97 1.04 1.05 0.97 1.26 1.27 0.98 . 100 0.99 1.00 0.99 1.03 1.04 0.99 1.14 1.14 0.99 200 1. 00 1. 01 1.00 1.02 1.02 1.00 1. 06 1.06 1.00 25 0.97 1.00 0.95 1.10 1.13 0.96 1.45 1.47 0.97 QZ _- 0.1 ^ 50 1.01 1.03 0.99 1.07 1.09 0.99 1.21 1.22 0.99 100 1.02 1.03 0.99 1.05 1.06 0.99 1.11 1.12 1.00 200 1. 01 1. 02 1. 00 1. 0 3 1. 0 3 1. 00 1. 06 1. 06 1. 00 25 0.92 0.96 0.99 1.00 1.03 1.00 1.10 1.11 1.00 Q2_- 0.5 ^ 50 0.98 1.00 1.00 1.02 1.04 1.00 1.08 1.08 1.00 100 1.00 1.02 1.00 1.03 1.03 1,00 1.05 1.05 1.00 200 1. 00 1. 00 1.00 1. 00 1.01 1.00 1. 01 1. 01 1. 00 25 0.93 0.96 0.99 0.94 0.95 1.00 0.94 0.95 1.00 Q2__ ^ 0 ^ 50 0.95 0.97 1.00 0.97 0.99 1.00 0.99 1.00 1.00 100 0.98 1.00 1.00 0.99 1.00 1.00 1.00 1.00 1.00 200 1.01 1.01 1.00 1.01 1.01 1.00 1.01 1.01 1.00 25 0.98 1.02 1.00 0.89 0.91 1.00 0.84 0.84 1.00 ^? =5.0 ^ 50 1.00 1.02 1.00 0.96 0.96 1.00 0.93 0.93 1.00 100 1.00 1.01 1.00 0.99 0.99 1.00 0.98 0.98 1.00 200 1.00 1.00 1.00 0.99 1.00 1.00 0.99 0.99 1.00 25 0.93 0.96 0.99 0.82 0.83 1.00 0.76 0.77 1.00 Q2_ ^ 0 0 - 50 0.99 1.01 1.00 0.91 0.92 1.00 0.87 0.87 1.00 n 100 1.00 1.02 1.00 0.96 0.96 1.00 0.94 0.94 1.00 200 0.98 0.99 1.00 0.97 0.97 1.00 0.96 0.96 1.00 25 0.88 0.92 0.99 0.73 0.75 1.00 0.67 0.68 1.00 Q^ - 50.0 ^- 50 0.96 0.98 1.00 0.84 0.84 1.00 0.79 0.79 1.00 100 0.98 0.99 1.00 0.89 0.90 1.00 0.86 0.86 1.00 200 1.00 1.00 1.00 0.94 0.94 1.00 0.92 0.92 1.00 25 0.95 0.98 1.00 0.79 0.80 1.00 0.72 0.73 1.00 v2- 100.0 ^- 50 0.98 1.00 1.00 0.86 0.87 1.00 0.81 0.81 1.00 100 0.99 1.00 1.00 0.90 0.90 1.00 0.87 0.87 1.00 200 0.99 1.00 1.00 0.93 0.93 1.00 0.91 0.91 1.00 ERROR CUADRATICO MEDtO DE PREDICCION PARA MODELOS ESTRUCTURALES DE SERIES TEMPORALES 133 Si observamos los resultados obtenidos para ECM*[yT+^{y,)] vemos que fun- ciona muy bien para todo tamao muestral y para todos los valores de c^^, por lo que parece que la aproximacin asinttica es adecuada. Sin embargo, ECM*[yT+^(y^)] no es un estimador factible del verdadero ECM de prediccin con parmetros estimados. 4. CoNCLUSIONES En este trabajo se ha estudiado la distribucin del error de prediccin bajo el supuesto de que los parmetros son desconocidos y hay que estimarlos previa- mente. Para ello, se han propuesto dos estimadores alternativos del ECM de prediccin con parmetros estimados, uno que tiene en cuenta explcitamente en cu^enta el error de prediccin que provien^e de la estirnacin de los parmetros, ECM*`[yT+^{^^ )], y otro que no lo tiene, ECM[yT+^{^r)]. ^ EI ECM de prediccin alternativo que hemos derivado, ECM*[yT+^{yr)], es una aproximacin al ECM de prediccin con parmetros estimados condicionado a lo^ datos, ^ proporciona una correccin de orden 1 I T al estimador usual ECM[yT+^{y,)], que trata de recoger el error generado por la variabilidad muestral en la estimacin de los parmetros. Esta aproximacin ha sido obtenida dentro del marco de los madelos en el espacio de los estados. Teniendo en cuenta que sta es una clase de mode{os lineales muy general que incluye entre otros a los modelos estructurales de series temporales y los modelos ARIMA, podemos aplicar la frmula ECM*[yT+^{y^)] para estimar el ECM de prediccin con parmetros estimados dentro del campo de los modelos estructurales que son el objetivo fundamental de nuestro estudio. Tomando corno base el modelo estructural ms sencillo, el modelo de paso aleatorio con ruido, he Ilevado a cabo un sencillo estudio de simulacin para obtener algunas indicaciones sobre el camportamiento de los dos estimadores propuestos: i) Los efectos de la variabilidad muestral de las estimaciones de los par- metros en el ECM de prediccin con parmetros estimados, son bastante importantes. ^ ii) EI estimador ECI^I^`[yT+s^{yr)] subestima, en general, el verdadero ECM de prediccin con parmetros estimados. Los efec#os son mayores para tamaos muestrales pequeos, para valores de c^ prximos a la zona de no invertibilidad y para horizontes de prediccin largos. EI estimador alternativo c^ue se ha propuesto corrige esta subestimacin en la direccin deseada aunque no siempre en la proporcin suficiente para solucionar totalmente el problema. 13d ESTADISTiCA ESPAlJ^OLA Si estudiamos el comportamiento de ECM*[yT+^(^^ )] para distintos valores de T, Q y s, podemos concluir que la aproximacin asinttica utilizada es apropiada; el problema es que no se trata de un estimador factible. En principio, pademos aplicar la aproximacin al ECM de prediccin con parmetros es#imadios dada por ECM*[yT#^{yr)J, a modelos estructurales de series temporales m^s complejos, a condicin de comprobar que las condiciones de regularidad necesarias se cumplen para cada modelo. REFERENCIAS AN^3ERSaN, B. D. O. y MooRE, J. B. (1979). Optimai Filtering, Englewoad Cliffs: Prentice Hall. ANSLEY, C. F. y KoHN, R. (1986). Prediction mean squared error for state space models with estima#ed parameters, Biometrika, 76, 467-473. BAILLIE, R. T. (1980}. Predictions for ARMAX models, Journal of Econometrics, 12, 365-314. BLOOMFIIELD, P. (1972}. On the error of prediction of a time series, Biometrika, 59, 501-507. FULLER, r/1/. A. y HASZA, D. P. (1980). Predictors for the first-order autoregressive process, Journal of Econometrics, 13, 139-157. FULLER, W. A. y HASZA, D. P. (1981). Properties of predictors fr the autorregresive time series, Journal of the American Statistical Association, 76, 155-161. HANNAN, E. J. (1970). Multiple Tirne Series, New York: John vviley. HARVEY, A. C. (1983). The formulation of Structural Time Series Models in discrete and continuous time, Questioo, 7, 563-575. HARVEY, A. C. (1990). Forecasting, Structural Time Series Models and the Kalman Filter, Cambridge Academic Press. HARVEY, A. C. y PETERS, S. (1984). Estimation procedures for Structural Time Series Models, LSE Econometrics Programme, Discussion Paper nm. A44. PHILLIPS, P. C. B. (1979), The sampling distribution of forecasts from a first order autoregresion, Journal af Econometrics, 9, 241-261. PiERCE, D. A. (1975). Forecasting in dynamic models with stochastic regressors, Journal of Econometrics, 3, 349-374. ^ ERROR CUADRATICO MEO10 DE PREDICCIOWPARA MODEI.OS ESTRUCTURALES DE SERIES TEMF'ORALES 1^^ RE^rvsE^, G. { 1980), Asymptotic properties of prediction errors for the muftivariate autoregressive rnode{ using estimated parameters, Journal of the Roya/ Statis- tical Society, Series B, 42, nm. 3, 328-333. SPITZER, J. J. y^AILLIE, R. T. (1983). Sma{f sample properties of predictions from the regression model with autoregressive errors, Journal of fhe American Sta- tistica/ Association, 78, 258-263. YannAMC^TO, T. (1976), Asymptotic mean squared error prediction for an autoregre- sive model with estimated coeffcients, Applied Statistics, 25, 123-127. SUMMARY FORECASTING MEAN SQUARED ERROR FOR STRUCTURAL TIME SERIES MODELS A simulation study is carried out to examine the behaviour in small samples of various estimators of the forecasting mean squared error (MSE) with estirnated parameters. The attention is focused on the class of Structural Time Series Models. Two practical estimates of the forecating MSE, one of which includes terms reflecting parameter estimation and one which exludes these terms, are compared to the mean squared error of forecast for the simplest structural model, the random walk plus noise model, considering different values of the parameters of the mode! and different sample sizes. Key wt^rds: Kalman Filter, Structural Models, Forecasting Mean Squa- red error, maximum likelihood estimation. AMS Classification: 62M 10.