Está en la página 1de 20

ESTADISTICA ESPAOLA,

VI. 34, Nm. 129, 1992, pgs. 117 a 135


Error Cuadrtico Medio de Prediccin para
Modelos Estructurales de Series Temporales
M. PILAR GONZALEZ
Departamento de Econometra y Estadstica
e Instituto de Economa Pblica
Universidad del Pas Vasco
RESUMEN
En este artculo se comparan, mediante un estudio de Monte Carlo,
el comportamiento en muestras pequeas de dos estimadores alter-
nativos del error cuadrtico medio (ECM) de prediccin con parme-
tros estimados para modelos estructurales de series temporales, uno
que incluye un trmino que trata de recoger el error proveniente de la
estimacin de los parmetros, y otro que no incluye dicho trmino.
Para el modelo estructural ms sencillo, el modelo de paseo aleatorio
ms ruido, se comparan ambos estimadores con el verdadero ECM
de prediccin con parmetros estimados para diferentes tamaos de
muestra, valores de los parmetros y horizontes de prediccin.
Palabras clave: Filtro de Kalman, Modelos Estructurales, Error Cua-
drtico Medio de Prediccin, Estimacin Mximo-verosmil.
Clasificacin AMS: 62M 10.
1. INTRC^DUCCION
Los modelos estructurales de series temporales se formulan en trminos de
componentes no observados tales como tendencia, estacionalidad, ciclo e irre-
gular, que son de gran inters para los economistas porque cuentan con una
interpretacin directa. La formulacin general del modelo es:
Yr=Nt+Yr+Wr+r
(1.1)
1 18 ESrADiSr^CA ESPA4LA
donde yr es la serie abservada
^r, Yr
^ ^r Y^r
representan ia tendencia, estaciona-
lidad, el ciclo y el componente irregular respectivamente. Cada uno de estos
compnentes se especifica a priori de forma estocstica permitindoseles evolu-
cionar a lo largo del tiempo mediante la introduccin de variables aleatorias. Depen-
diendo de cules sean ias principales caracteristicas de la serie que se desean
recvger en el rnodelo, estos componentes no observab^es se cOmbinan de diferentes
maneras dando iugar a los distintos modelos estructurales (ver Harvey 1990).
Esta clase de rnodelos se puede representar fcilmnte en el espacio de tos
estadas, lo que posiblita la utilizacin de potentes algoritmos basados en el fiitro
de Kalman para la estimacin mxirno-verosmil de los parmetros, la extraccin
de seales y!a prediccin (Harvey 19$3). Por la tanto, baja el supuesto de que
los parmetros del madelo son conocidos podemos obtener el predictor ptmo
de fas futuras observaciones yT+s, s= 1, 2,... junto con el error cuadrtico medio
(ECN1) de predicin aplicando repetidamente las ecuaciones de prediccn del
filtro de Kalman (ver Anderson & Moore 1979).
Ei problema se plantea porque coma ya seala Pierce ( 1975) rara vez cono-
cermos los parmetros del modela y, en la prctica, para ilevar a cabo prediccio-
nes basadas en cualquier modelo hemos de estimar en primer lugar los parme-
tros de manera eficente. Nuestros predictores son, por io tanto, nicamente
estimaciones de los predictores ptimos lo que conlleva un aumento en el ECM
de prediccin. Estas cuestiones han despertado el inters en Ios ltimos aos
sobre la distribucin del error de prediccin con parmetros estimados.
En la seccin 2 de este artculo se plantean dos estimadores prcticos para el
ECM de prediccin con parmetros estimadas, uno que incluye trminas que
tratan de recoger la variabilidad debida a!a estimacin de los parmetros y otro
que no los inciuye. Restringindanos al caso del modelo estructural ms sencillo,
el paseo aleatorio con ruido, en la seccin 3 comparamos el comportamiento en
muestras pequeas de ambos estimadores propuestos mediante un estudio de
Monte Carlo.
2. ERROR CUADRATICO MED!(J DE PREDICCION CON PARAMETROS
EST^MADOS
Supongamos que la serie observada yt, t= 1, 2,,.. T, sgue un modelo estructural
invariante en el tiempo del tipo (1.1 } que se puede representar en el espacio de
las estados como:
Yt = Z'ar + ^t
( 2 . 1 j
ar - ^ at-1 + n t
ERROR CUADRATICO MEDIO DE PRED^CCION PARA MODELOS ESTRUCTURALES DE SERIES TEMPORA^ES 11^
donde yr es la serie observada, at(kx 1) es el denominado vector estado, y
, E t , r^t (kX1} son trminos de error que no estn correlacionados entre si ni con el
vector estado as, s_< t , y
^^^^- N C (^E Q ) )
E n los modelos est ruct urales de series t emporales, el vect or est ado a, ^ est
formado par ios element os que det erminan los component es no observables de
la serie, como ^, ^r, et c. Tant o z', de orden (1 xk) , como C de orden (kxk) , son
mat rices conocidas que no dependen de los parmet ros del rnodelo y cuya
est ruct ura es dist int a para cada Modelo E st ruct ural que est emos considerando
en part icular.
Vamos a denot ar por yr (nx1) al vect or de parmet ros del modelo (2.1) , que
incluye nicament e a y los parmet ros cont enidos en Q .
En el modelo gaussiano (2.1}, la prediccin ptima (en el sentido de ECM
m nimo} de las obsenraciones futuras yT+s, s= 1, 2, .. . viene dada por:
YT+s/T^^^ = Z'aT+slT(W)
donde
ar+^r(W )= E [ar+sl Yr^ Yr-^ ^, Y^ ]
{ 2 . 2 )
Esta prediccin yr+^{y,) se puede interpretar como la media de la distribucin
de yT+s condicionada a las observaciones hasta e incluyendoyT. Si no suponemos
normalidad en el modelo ( 2.1) el predictor (2.2} ya no sera la esperanza condi-
cionada ni sera ptimo. Sin embargo, seguir siendo el predictor lineal de EC M
mnimo.
E ! E CM de prediccin asociado, es decir, la varianza del error de prediccin
es:
EC MC Yr+ ^ r{ v^ )] = Z'Pr+^r{^) z +
Q Z
( 2 . 3 }
donde
Pr+^rr{^) =E{[ar+s - ar+^r-r{^)][ar+s ar+^r{w)]'3
Est formula nos proporciona el EC M de prediccin condicionado a los par-
metros del modeio. Por lo tanto, bajo el supuesto de que el vector de parmetros
y^ es conocido, la frmula ( 2.3) es correcta. Tanto el predictor ( 2.2) como su EC M
asociado (2.3) se pueden obtener aplicando repetidamen#e las ecuaciones del
filtro de Kalman al modelo ( 2.1), con toda la informacin en ia serie yt, t= 1,
2,...,T.
Si t rabajamos bajo el supuest o ms realist a de que desconocemos los par-
met ros del modelo y hemos de est imarlos a part ir de la muest ra disponible, el
12U
E_STAf.^151ft:A ESPAtVC7fvA
criterio de actuacin suele ser el siguiente. En primer lugar estimamos los par-
metros de forma eficiente por mxima verosimilitud (1) y posteriormente se sus-
tituyen en (2.2) los valores desconocidos y^ por sus estimaciones mximos
verosimiles, ^. De esta forma el predictor de yT+s con parmetros estimados es:
Yr+srri V ) ^ Z'a r+^rr{ ^ )
(2,4)
Aunque el predictor yT+^{ yr) era ptimo cuando conocamos !os parmetros del
modelo, esto no implica que yT+^{yr} sea el predictor ptimo para un modelo con
parmetros estimados. Sin embargo, yT+^{yr) es e! pr^dictor ms usado en la
prctica y, por lo tanto, nos interesa estudiar sus propiedades.
E! error de prediccin cometido se puede descomponer ahora en dos partes:
.YT+s ^ YT+sJT{^) ' U' T+s ^ YT+slTC^)1 + U' T+s/T^V^) ^ YT+slT{W)J
( 2. 5 )
donde el primer sumando recoge e! error que proviene de la parte de perturbacin
aleatoria de! modelo y e! segundo, el error debido a la estimacin de fos par-
metros.
Como los dos sumandos de (2.5) son independientes porque hemos supuesto
que !os trminos de perturbacin ^t y nr son normales independientes, e! ECM
de prediccin con parmetros estimados se puede escribir como:
ECMoLVr+srr{W)J = ECYr+s - Yr^srrt^)l2 + ECVr+sir(v^) ^ Yr+sir{^
j ^)J2 (2.6)
donde el primer sumando viene dado por (2.3), es decir, e! ECM de prediccin
con parmetros conocidos y e! segundo representa lo que aadimos al ECM de
prediccin para recoger la variabilidad muestral de !as estimaciones de los
parmetros.
Es interesante sealar que el ECM de las estimaciones de los parmetros es
de orden 1/T por io que e! aumento en el ECM de prediccin es de ese orden
mientras que el ECM de prediccn de! verdadero modelo es de orden 1.
Aunque e! ECM del predictor yT+s,7-(y^) viene dado por (2.6), en la prctica e!
estimador usual del ECM de prediccin que se utiliza se basa simplemente en
sustituir e! verdadero valor de los parmetros desconocidos por sus estimaciones
mximo-verosimiles en la frr^ula ( 2.3}^Pero este estimador del ECM del predic-
tor yT+^{y^}, denotado por ECM[yT+^{^)J,
presenta dos problemas fundamenta-
les en muestras finitas. En primer lugar, no tiene en cuenta e! error que proviene
de la estimacin de los parmetros y, en segundo lugar, puede presentar sesgos
(1) Vase HARVEY, A. C. y S. PETERS (1984) para una discusin sobre los distintos
mtodos de estimacin mximo-verosmil de los parme#ros desconocidos de los modelos
estruc#urales.
ERRC3R CUADRATICO MEDIO DE PREDICC^I4N PARA MC.^DEI_.OS ESTRUCT ^SRAt ES UE SER^ ES TEMF'OR.F1l ES 1 ^1
como estmador de la correspondiente cantidad poblacional ECM[yT.^^-(y^)] debi-
do a que las estimaciones de las parmetros en muestras finitas pueden estar
seriamente sesgadas.
Por otra parte, la frmula (2.6^ no nos proporciona un estimador adecuado para
el ECM de prediccin ya que presenta las dificultades de ser complicada de
calcular porque el segundo sumando habria que obtenerlo por medio de simula-
ciones. Bloomfield (1972), Yamamoto (1976) y^8ailiie (1980) entre otros, han
estudiado este trmino para modelos autorregresivos y han derivado expresiones
asintticas basadas en la distribucin asinttica de los parmetros estimados. AI
aplicar estos resultados asintticos a!os estudios con muestras finitas que ge-
neralmente se realizan en la prctica, se han de tener en cuenta que las estima-
ciones de los parme#ros en muestras finitas pueden estar seriamente sesgadas
y que estos sesgos se trasladarn a la distribucin condicianada de las predic-
ciones dados los valores observados de la variable endgena utilizados para
iniciar las predicciones. Adems cuando predecimos estamos condicionando a
ciertos valores de la variable endgena, la distribucin de las estimaciones de
las parmetros estar tambin condicionada y esto afectar a la distribucin de
los errores de prediccin. En este sentido, se han desarrollado en la literatura
estudios sobre la distribucin del error de prediccin con parmetros estimados
condicionada a los datos observados. Los trabajos de Phillips (1979) y Fuller y
Hasza (1981) se centran en modelos autorregresivos y el de Ansley y Kohn
(1986} en modelos en el espacio de los estados.
^
Vamos a proponer un estimador alternativo para el ECM del predictor yT+^{^^ ),
derivando una expresin analtica para el segundo sumando del segundo miem-
bro de ( 2.6) condicionada a 1os datos observados.
Podemos observar que, sustituyendo las expresiones (2.2) y(2.4), este segun-
do sumando de (2.6) se puede escribir como:
^T+slT^4^ - .yT+s^l^{^)^2 ^
= Z^F^^ar+^rr{^) - ar+.^r{ 4^)]^ar+^r{^^) ! ar+^{4^))'}z
( 2 - 7 )
lo que significa que la parte del error de prediccin que proviene de la estimacin
de los parmetros es una combinacin lineal del error de prediccin del vector
estado que proviene de ia estimacin de los parmetros. Por lo #anta, para derivar
una expresin analtica para (2.7) podemos aplicar la aproximacin propuesta
por Ansley y Kohn (1986).
Ansley y Kohn (1986) derivan una aproximacin al ECM de prediccin del
vector estado con parmetros estimados condicionado a ia muestra, que propor-
122 ESTApISTICA ESPAOLA
ciona una correccin de orden 1l T a Pr+^{y^) que es la expresin usual, bajo las
siguientes condiciones de regularidad:
i) Para T grande, T^^2 ( yr- yr) -- N(o, Vt^r))
ii) La diferencia
aT+^){^^ ~^T+^^) ' ^T+s^Ti^} (^-^) ^p(1^^
sendo yr un punto intermedio entre yr y el verdadero valor yr, y donde
aa r ^sr r { ^ )
A r+^r( 4^ ^ _
a ^
y el trmino Op( 1IT^ se puede despreciar, para tamaos muestrales grandes,
camparado con AT^^( y^) ( y^-y ^ ).
iii) La esperanza condicionada:
ET(V^rw} (V^-4^}'^Ar+^{^)^ =
V( V^}lT + oP( 1IT)
donde V --^ es la matriz de covarianzas de {os estimadores ^r evaluada en el
T
verdadero valor de los parmetros yr.
iv) z, C, Q tienen segundasderivadascontinuascon respecto a yr.
La aproximacin a! ECM de prediccin esde la forma:
Pr+^r{ W } + ^ IAr+^r(W} V(w) a'r +^r (v^)l
T
Hay sealar que Ansley y Kohn no condicionan el ECMde prediccin a todos
los datos sino slo al determinante principal dei trmino aT+^(w)-aT+^(yr), que
es el que recoge el error que proviene de la variabilidad muestral de ias estima-
ciones de los parmetros.
Apiicando l correccin anterior a losModelosEstructuralesde SeriesTempo-
rales, obtenemosla siguiente aproximacin a! ECM de prediccin con parmetros
estimados:
ECM *^YT+s/T{W}^ -- Z'PT+s/T{^} Z+ a^ + ^^Z'AT+s^r{4^} V(^) A'T+^rl{4^}Zj
(Z.8)
T
EI ltimo sumando de (2.8) nos da la correccin de orden 1/T que trata de
recoger !a variabilidad debida a la estimacin de los parmetros. De la expresin
(2.8) podemos obtener las siguientes conclusiones: i) 1a contribucin al ECM de
prediccin de la estimacin dei error debido a ios parmetros desaparece cuando
T tiende a infinito, resuitado que no es sorprendente ya que los parmetros han
E:RROR CU4DRATICO MEDiO DE PREDICCIOPJ F^ARA MODELOS ESTRUCTI)RAIE:S DF 5ERIES T^MF'ORAIES 1Z3
sido estirnados consistentemente; ii) la eficiencia en prediccin se puede aurnen-
tar, es decir, reducir el ECM de prediccin, si mejoramos ia eficiencia del estima-
dor yr. Por ejemplo, si disponemos de informacin a priori sobre restricciones en
algunos elementos de y^ y podemos obtener un estimador m^ximo-verosmii
res#ringido.
Un estimador dei ECM de prediccin con parametros estimados se puede
obtener sustituyendo en (2.8} los verdaderos valores de los parmetros por sus
estimaciones mximo verosimiles yr. EI estimador de ECM* [yT+^ ( yr}] depende
slo de la muestra yr y es fcil de calcular.
3. COMPARACION DE ERRORES CUADRATICOS MEDI^S
DE PREDICCION
En la secci^in 2 hemos presentado dos estimadores posibles dei ECM de
prediccin con parmetros estimados:
n
EC'^'U'
T+s^lTC^^1 = 2'PT+sfItW ^2 + Q2
ECM * CYT+^r{ ^ }l = Z' ^T+srr( ^ )Z + a2 + ^ [z'A r+^{ yr > V( ^ ) A' r+ ^ >z
^- W sr1{ V ^ ^
Mediante un estudio de Monte Car{a vamos a analizar su comportamiento
como estimadores del verdadero error cuadrtico medio de prediccin con par-
metros estimados, ECM ^
oCYr ^r{W)l,
tomando como marco de trabajo el modela
estructural ms sencillo, el modelo de paseo aleatorio con ruido.
3.^. Modelo de Paseo Aleatorio con ruido
Supongamos que nuestro conjunto de observaciones yr, t= 1, 2, ..., T sigue
un modeio de paseo aleatorio con ruido:
Yr=Nr+^r
I^t - t^r-^ + ^1r
donde
^r U^ a
^1r
^ IVo g ^2
n
(3.1)
Este modelo, est escrito directamente en el espacio de los estados cn
Z^=c=1,yG?=a
124 FSTAD(STfCA ESF'A(VOt_A
Si conocemas los parmetros del modelo la prediccin ptima de las futuras
observaciones la pademos obtener aplicando (2.2) a nuestro modelo:
YT+srr{^) = mr+srr{^Y) = mT{^)
donde
mT^^) _ ^N T+sI YT+ YT-1 + + Y1 ^
.s-1,2,...
s=1,2,...
(3.2)
Por la tanto, para el modefo que nos ocupa la prediccin ptima para la serie
observada es la misma que para el vector estado.
EI ECM de prediccin correspondiente sera, aplicando (2.3):
ECMCY r+ slr{ ^)l = Pr+ sn{ y, >+
^? = 1' r( r} r )
+ s 6 + Q 2 ( 3 . 3 )
Si los parmetros del modelo son desconocidos, la prediccin de las futuras
observaciones yT+s, denominada yTf^{y,), la podemos obtener sustituyendo en
(3.2) los verdaderos valores de los parmetros por sus estimaciones mximo-ve-
rosmiles.
EI ECM del predictor yT+^{w) lo podemos estimar a partir de (3.3), sustituyendo
el vector de parmetros desconocidos ( Q, 6 ) por sus estimaciones mximo
verosmiles, o bien derivando la expresin (2.8) correspondiente al modelo (3.1).
Antes de aplicar la aproximacin (2.8) para obtener el ECM de prediccin con
parmetros estimados, vamos a comprobar que las condiciones de regularidad
sealadas por Ansley y Kohn se cumplen para nuestro modelo:
i) Supongamas que estimarnos y^ maximizando la aproximacin a la funcin
de verosimilitud en el dominio de la frecuencia siguiente:
L(,^,y) ^
. .
T-1 T-1
lo e'^ - n ^ - { -^
^ g gc ^ )
^ ;^
1^^ ^^ pg^ej ^
( 3 . 4)
donde ^,^ = 2nj/T^`, j= 1, ..., T^`-1, y T"k = T-d, siendo d el orden de diferenciacin
necesario para que la serie ( ^ -L}dyt sea estacionaria. Adems I( ^,j) es la ordenada
correspondiente de! periodograma y g( e^^) es la funcin generatriz espectral que
para el modelo (3.1) es de 1a forma g( e^^`) = 6^ + 2(1-cos^,^) a^.
Bajo ciertas condiciones de regularidad, Hannan (197^) prueba que ^ es un
estimador consistente que sigue una distribucin asinttica normal con matriz de
ERRUR CI_lADFZATICO MEDIC^ C)E PF^FDCCCION PAR,A ti1C.)UELO;S E7TRl1C:Tl^RAlES D^ SER^E^S Tf"ti1f'C)Ft^LE.S ^^^:^
covarianzas V(y^)/T dada por la inversa de la matriz de informacin. EI elernento
ih-simo de la matriZ de informacin se puede aproximar por (Harvey 1990):
1 a9(e^^) dg(e^)
1/ 2^ ^^ 2
9'(e^ ) a 4 ^^ a Wn
por lo que para el modelo (3.1 } la rnatriz de covarianzas de los estimadares se
puede escribir como:
1/ 2 e'^ -2 1/ 2
2(1 - cos^,^)
^g( ^) ^ ^^2
9 ^ t e^ )
2(1 - cos^,^) 4(1 - 2cos^.^)2
1/ 2^ ^^2 1/ 2^ ^^ 2
9 ^( e^ ) 9 ( e^ )
( 3 . 5 )
Esta teora asinttica no es vlida cuando el modelo (3.1 } no es estrictamente
invertible. La forma reducida de un paseo aleatorio con ruido es un IMA (1 , 1)
con parmetro MA -1 _< e_< o. EI modelo no es invertible cuando e=-1, valor
que corresponde a^ = 0. Por lo tanto, el supuesto i) slo se cumple si 6 > 0.
ii) La diferencia
^^ r+^r{ 4^ ) - rr^ r+^-r{^) = Mr+^r{ ^ ) ( 4 ^- ^^ ) +
O p(1 / % ^
donde ^v es un punto intermedio entre y^y el verdadero valor yr y
Mr+^w) _ amr+^^)
a y ^
Este supuesto se cumple si mr+^-(r^) tiene derivadas continuas de segundo
orden con respecto a yr, ya que yr es un estimadar consistente de y^.
iii) EI tercer supuesto se cumple si (y^-y^) es aproximadamente independiente
de
Mr+^-( ^^ ) .
Podramos evitar la dificultad de probar este supuesto considerando que tene-
mos una muestra semiinfinita o que la muestra utilizada en la estimacin de los
parmetros es independiente de los valares de la variable endgena con las que
iniciamos la prediccin. Los trabajos de Fuller y Hasza (1980), Reinsel (1980),
entre otros, indican que para muestras de tamao moderado, el supuesto de tener
procesos independientes es una hiptesis de trabajo razonable.
12f ESTApISTiCA ESPANOLA
No vamos a probar rigurosamente este supues#o, pero vamos a dar una
veriFcacin heurstica del m'rsmo para el modelo de paseo aleatorio con ruido.
Para muestras grandes, e! predictor ptimo de yT+s puede ser estimado por (ver
Harvey 1990):
T--1
yi+sT{^^ ^ mT^^V^ ^ ^^^ ^l1 - ^^YYT-
j^-0
donde, ba^o ei supuesto de que el tamao muestral T es suficientemente grande
como para que Pt alcance el estado estacionario, es decir, Pt = P^_ ^= P
P(W) + Q
^( 4^ ) = F,( + ^.2 + Q2
W> ^ F
P(yr) _ [-a + (4c^a? Cl^ )1^^ ^ 2
Como se puede comprobar fcilmente 4 <[1-^.(^)] < 1, lo que implica que al
aumentar j el trmino [1-^,(y^)}^ decrece exponenciaimente con lmite inferior cero.
Por lo tanto, para Tgrande, como (yr-yr) depende de todas !as observaciones de
la misma manera, podemos incluir que (y>,-yr) es aproximadamente independiente
de MT+^{y,}.
iv) z, C, Q#ienen segundas derivadas continuas con respecto a yr.
Por I tanto, podemos aproximar e1 ECM de prediccin con parmetros esti-
mados apiicando la expresin (2.8) a nuestro modelo:
ECM *[.Y T +^r r { 4^)^ = Pr +^r { W )+ Q? + ^ IMr +^r (4^) V(^)1V1'r +^n{ ^)^
t3.6)
T
3.2. Resultados obtenidos
Los estimadores prcticos dei ECM de prediccin con parmetros estimados
se obtienen sustituyendo en (3.3) y(3.6) los valores de fos parmetros por sus
es#irnaciones mximo, verosimiles. Estos estimadores dependen del tamao
muestral, T, y del verdadero valor de los parmetros de! modelo (a,c^?). Nos
interesan fundamentalmente los resultados que obtengamos para muestras pe-
queas y moderadas, por Io que hemos considerado los tamaos muestrales,
T= 25, 5^, 100 , y 200. Como valores de 1os parmetros del modeio se han
elegido, Q^ = 0.01, 0.05, 0.1, 0.5, 1, 5, 10, 50, 100 y v? = 1.
ERROR CUADRATICO MEDIO DE PREDICCION PARA AAODEIOS ESTRUCTURALES DE SERIES TEMPORALES ^ 27
Para cada tamao muestral T y para cada par de valores (a^,a?) se generan
artificialmente N=1.000 muestras de yt que siguen el modelo (3.1). Una vez
generadas las variables aleatorias pseudonormales, r^t y>E^, ia serie de observa-
ciones yt se obtienen a partir det modelo (3.1), utilizando como valor inicial de1
vector estado m^ = 0. Para cada tamao muestral T, se han generado series de
observaciones yt de tamao T+ 100. Las 100 primeras observaciorties se recha-
zan para evitar que nuestros datos dependan de los valores iniciales tornados
para generar la secie. Las T observaciones siguientes se utiizan para estimar los
parmetros del modelo.
Para cada tamao muestral T y para cada par de valores ( Q^, c^^ ) se han
calculado los siguientes estad sticos:
1 )
2)
3 )
4)
N
ECMo^.Yr+srrE4^}^ - P^(^) +
sQ^ + Q2 + ^
[mr+^rtW) - mr^^r{^)j^
^
Nla1
ECM(yr+^r(^)] = P^t^) + S^ + ^
N N
ECM[yr+ ^r( ^ }] =^ ECA^II.Yr+ ^r{ 4r )] ^ _ ^ [Pr(4^ ) + sQ2 + Q ] ^
^ ^ ^ n ^
N ;a ^ N ^_ ^
* N
ECM [yT+ s/T{ W)] - P7{ yr )+ s Q ^+ Q? + ^ ^MT+ s^rT( ^) V
-^--^ M' T+ s/T{ 4^ )];
^
N^^ T
5}
^ *
,^ ^ 1 N ^ ^^ ^2
^
V( #^) "
ECM [yr+^r{^)l
^ [Pr(^) + san + aF + MT+^{V^) T. ^r+^r(V^)];
N fa ^
La cantidad (2) se caicu{a analticamente asi camo la primera parte de (1) y
(4), mientras que el segundo sumando de (1) y (4) as como (3), y(5) se obtienen
mediante simulacin. Existen distintas alternativas para calcular el ECM del
predictor yr+^{y,), como la utiiizada por Spitzer y Baillie (1983), que generan ms
observaciones de la serie yr, y evalan el ECM de prediccin con parrnetros
estimados directamente por simulacin. ^Sin embargo, ten^endo en cuenta que
queremos comparar los estimadores
ECM[yT+^,T{ y^)j y ECM' k[yT+s^-( y^)] con un
valor del verdadero ECM de prediccin con parmetros estimados que no est
sujeto a grandes variabilidades muestrales, la ventaja de usar la descomposicin
(2.6) es que nos permite hallar una parte importante del EC1/I de prediccin
analticamente y, por
lo tanto, es de esperar que nos proporcione estimaciones
ms precisas.
Los parmetros del modelo ( a^,a?) se estiman por Mxima Verosimilitud en el
dominio de la frecuencia, maximizanda la funcin ( 3.4). Estrictamente hablando,
128 ESTADISTICA ESPAOLA
la expresin (3.4) slo es igual a la funcin de verosimilitud si la serie estacionaria
cumple la condicin de circularidad. Camo esta condcin es poco realista en
nuestro contexto de trabajo, es mejor considerar la funcin (3.4} como una
aproximacin a la funcin de verosimilitud exacta. Esta funcin de verosimilitud
exacta se puede obtener en el dominio del tiempo mediante la descomposicin
de los errores de prediccin, que se obtienen junto con sus varianzas aplicando
las recursiones del filtr de Kalman. En el caso de los modelos no estacionarios
como son, en general, los modelos estructurales de series temporales, es preciso
tener cuidado con las condiciones iniciales que se utilizan para el filtro de Kalman.
Para calcular las cantidades (1)-(5) es necesario obtener tanto la estimacin
de m^{^r) como su error cuadrtico medio P^(yr) evaluados para el verdadero
valor de los parmetros y para los parmetros estimados. Ambas cantidades se
obtienen mediante las recursiones de prediccin y actualizacin del filtro de
Kalman inicializadas can mo = 0 y el prior difuso Po = k, donde k es un nmero
arbitrariamen#e grande. En el programa que ha realizada e! clculo de estos
estadsticos no se impone la condicin de que PT alcance el estado estacionario,
pero para el rnodelo (3.1) este estado se alcanza incluso para muestras de
tamao T = 25.
A la hora de obtener los estadsticos (4) y(5) es preciso calcular el vector de
derivadas M+ amT+^ , amT^^ . Estas derivadas del vector estado se
r ^r{ ^ } =
2 2
aQ ^ aQ n
han calculado analticarnente y el conjunto de recursiones se corren de forma
paralela al filtro de Kalman, siendo ncializadas como sigue:
amo _ arno _ aPo i aPo _ p
aQ n a^? aQ ^ a^?
Los estadsticos (1)-(5) han sido calculados para tres horizontes de prediccin
s= 1, 3, 12. Para el modelo (3.1) que estamos considerando el predictor de yT+s,
s= 1, 2,... viene dado par (3.2} que es !a estimacin de! vector estado en el
momento T: m^. Por lo tanto, como la correccin de orden 1/T al ECM de
prediccin con parmetros estimados que hemos propuesto depende slo de la
estimacin del vec#ar estado en el momento T y de la matriz de covarianzas de
las estimadores, que son las mismas para todo s, slo es necesara calcularla
una vez para cada terna ^T,v,Q ?) o(T,^,^?).
Todos los clcuios han sido realizados en un ordenador Hewlett-Packard serie
500. EI programa de Fortran utilizado ha sido escrito en doble precisin. La
estimacin de los parmetros se Ileva a cabo maximizando 1a funcin de verosi-
militud (3.4) mediante el algoritmo de scoring que presenta las ventajas de utilizar
slo las primeras derivadas de ^la funcin de verosimilitud (como hemos visto la
ERROR CUAORATICOMEDIODE PREDICCIONPARAMODELOS ESTRUCTURALES DE SERI^ES TEMPORAi`ES ^Z^
matriz de informacin depende nicamente de ellas}, y de proporcionar directa-
mente la matriz de covarianzas para los estimadores (3.5}. Los criterios de
convergencia utilizados para terminar las iteraciones han sido los habituales: i)
la diferencia entre parmetros sea menor de 10^4; ii) la diferencia entre los valores
de ia funcin sea menor que 10-$. En este trabajo se ha elegido la funcin de
verosimilitud (3.4}, en lugar de los mtodos en el dominio del tiempo, porque la
experiencia de clculo de estimadores mximo-verosmiles para muestras peque-
as y moderadas, menores de 200, nos seala que los mtodos de estimacin
en el dominio de la frecuencia son mucho ms rpidos que en el dominio del
tiempo, y que el algoritmo de scoring proporciona muy buenos resultados en 1a
mayora de los casos.
^os resultados obtenidos en las simulaciones para el modelo (3.1) se encuen-
tran reflejados en los cuadros 1 y 2.
En primer lugar, hemos tratado de estudiar la importancia cuantitativa de los
problemas que plantea utilizar directamente un estimador de ECM[yT+^{^r)] para
calcular el ECM de prediccin con parmetros estimados.
Por un lado, un estimador de ECM[yT+^{y,)] no tiene en cuenta que los
parmetros del modelo han sido estimados y que el error que proviene de ia
estimacin de los parmetros producir un incremento en el ECM de prediccin
de manera que:
ECMo[YT+^r{W)] ^ ECMCYT+^r{V^)l
En la primera columna del Cuadro 1, se presentan para cada tamao rnuestral
T, para cada valor del parmetro Q y para el horizonte de prediccin s= 1, los
resultados de calcular la razn:
_^^^/%U'
T+s/7{ ^ )^
R^^EC^ ^
CY T+^r{ w )]
con la que tratamos de medir los efectos de la variabilidad muestral de las
estirnaciones de los parmetros en el error cuadrtico medio de prediccin. Por
ejemplo, para ^? = 0.1 y T= 25, ECMo[yT+S,T{yJ)] es un 10 por 100 mayor que el
ECM[yT+s^(y^)]. Podemos observar que los efectos ms serios se producen para
valores pequeos de a^, es decir, cuando nos encontramos cerca de la zona de
no invertibilidad. Esta razn disminuye, en general, conforme aumenta el par-
metro Q, estabilizndose en torno al 4 5 por 100, y decae rpidamente con el
tamao muestral T.
130 ESTADISTICA ESPA^LA
^ CUADR01
^
ECM[yT ^{yr)] como estimador del ECM de prediccin con parmetros
estirnados
T= 25 T= 50 T= 100 T=200
R^ R2 R^ R2 R^ R2 R1 R2
Q? = 4^01 1.11 1.13 1.07 1.09 1.03 1.05 1.02 1.03
o^= 0.05
1.09 1.06 1.06 1.02 1.02 1.01 1.01 1.01
Qz - p.1
^-
1.10 1.06 1.04 1.05 1.02 1.04 1.0 ^ 1. 02
, ^2 - p_5
^-
1.05 0.97 ^ 1.02 1.01 1.01 1.02 1.00 1.00
Q2 - 1.00
n-
1.03 0.96 1.03 0.98 1.01 1.00 1.01 1.01
Q^ = 5.00
1.05 1.03 1.01 1.02 1.01 1.01 1.01 1. 00
Q^_^ o.ao
1.04 0.96 1.02 1.01 1.01 1.01 1.00 0.99
Q^= 50.00
1. 06 0. 93 1.03 0.98 1.01 0. 99 1.01 1. 00
Q^ = 100.0 1.04 0.99 1.02 1.01 1.01 1.00 1.00 1.00
n
Por otro lado, nos interesa c^omprobar ia calidad de ECM[yT+^(^)] como
estimador de su correspondiente cantidad poblacional ECM[yT+^-(y^)]. La colum-
na R2 del Cuadro 1 trata de recoger los sesgos en la estimacin de ECM[yT+^{y, }j
debidos a los sesgos en la estimacin de ^os parmetros a travs de la razn:
n
_ ECM CY T+^r{ W )1
^2 ECM
CY T+$ rr( ^ )l
^
Se puede observar que para valores de Q^ pequeos, ECM[yT+^-{^r)j est siste-
mticamente sesgado hacia arriba, hasta un 13 por 100 para T= 25 y un 9 por
100 para T= 50. Estos sesgos en la estimacin de ECM[yT+, ^{y ^ )] van disrninu-
yendo conforme aumenta a y nos alejamos de la zona de no invertibilidad del
modelo, hasta cambiar de signo y, asi, para valores grandes de Q^, el estimador
n
ECM[yT ^{ y,)] est sesgado hacia abajo, por ejemplo para Q^ = 50, es un 93 por
100 de ECM[yT+^{^r)]. Estos sesgos desaparecen rpidamente con el tamao
muestral.
Los resultados obtenidos en la zona de no invertibildad del modelo (valores
pequeos de 6) pueden estar influenciados por el mtodo de estimacin elegido.
Los distintos mtodos de estimacin mximo-verosmil tienen las mismas propie-
dades asntticas, aunque pueden tener propiedades en muestras pequeas
ERROR CUADRATICO MEDIO DE PREDICCION PARA AAODEIOS ESTRUCTURAIES DE SERiES TEMPORALES 131
diferentes. Harvey y Peters { 1984) realizan un pequeo ejercicio de simulacin
en el que abtienen que las mayores diferencias entre fos estimadores en el
dominio del tiempo y el dorninio de la frecuencia aparecen cuando !os parmetros
de varianza estn prximos a cero, aunque no hay evidencia clara de la direccin
del sesgo de ambos estimadores en esta zona prxima a la no invertibilidad.
^
^n el Cuadro 2 comparamos el camportamiento de ECM^yr ^(yr)] y
ECM*(yr+^{ y^ }] como estimadores de ECMo[yr+^{yr)] a travs de !as razones:
n ^
_ _
ECM CYr+^(W )] _ ECM LYr+^{ ^ )l
R3 ECM R4 ECM
o CYT +^r{ 4 ^ ? ] o IYr+^r(v^ )I
Con el fin de comprobar la validez de la aproximacin asintetica elegida, se
presentan tambin los resultados obtenidos para el estadstico ECM*[yT+^{y^ )]
mediante el clculo de la razn:
*
_ ECM ^yr+^r( ^Y )]
R5 ECM
0 U' T +s T { ^ )]
n
En general el estimador ECM [yT +,^y^)] subestima el verdadero ECM de pre-
diccin con parmetros estimados. Esta subestimacin aumenta de forma consi-
derable conforme crece el horizonte de prediccin s. Por ejemplo, para 6^ = 50,
n ^
el ECM[yT +^{ yr)] es el 88 pc+r 100 del verdadero ECM de prediccien para s= 1,
pasa a ser el 73 por 100 para s= 3 y se reduce al 67 par 100 para s= 12.
Podemos concluir que los efectos de la estimacin de los parmetros en el ECM
de prediccin son importan#es y deben ser tenidos en cuenta, sobre todo en
muestras pequeas, T=25, 50, como era de esperar. Por^lo tanto, ^arece
conveniente utilizar el estimador alternativo que proponemos ECM'"`[yT +^(y^)] que
corrige esta subestimacin en la direccin adecuada aunque no siernpre en la
proporcien suficiente para solucionar totalmente el probfema. Por ejempio, para
62 =50 y s=1 e! E^M^'"`[yT S^(y^)] es el 92 por 100 del verdadero ECM. Adems
n
podemos observar, que como era de esperar, la proporcin en que el estimador
alternativo corrige la subestimacin del verdadero ECM de prediccin es menor
conforme el horizonte de prediccin es ms largo.
Las nicas excepciones al comportamiento anteriormente sealado se produ-
cen cuando nos encontramos con valores de o^ muy pequeos, cercanos a la
zona de no invertibilidad. En este caso habamas observado en el Cuadro 1 que
tanto los efectos de la variabilidad muestral en las estimaciones de los parme-
tros como los sesgas en los e^tirnadores de las mi^mos apuntan en la misma
direccin y hacen que tanto ECM[yT +sn-{ y^)] como ECM'k[yT +sn{^,)] sobreestimen
el verdadero ECM de prediccien en cantidades que aunque no son muy impor-
tantes para s = 1, aumentan rpidamente con el hrizonte de prediccin.
132 ESTAOISTICA ESPAOLA
CUADRI^ 2
Comparacin de Errores Cuadrticos Medios de Prediccin
con parmetros estimados
s=1 s=3 s=12
T R^ R{ R^ R3 R4 RS R^ R^ R5
25 1.02 1.05 0.93 1.19 1.21 0.97 1.86 1.88 0.93
Q2- a.o^
^!
50 1.01 1.03 0.95 1.09 1.11 0.95 1.43 1.45 0.95
100 1.02 1.03 0.98 1.06 1.06 0.98 1.21 1.22 0.98
200 1.02 1.02 0.99 1.03 1.04 0.99 1.11 1.12 0.99
25 0.97 1.00 0.95 1.12 1.15 0.95 1.60 1.62 0.96
a^=0 05
50
0.97 0.98 0.97 1.04 1.05 0.97 1.26 1.27 0.98
.
100 0.99 1.00 0.99 1.03 1.04 0.99 1.14 1.14 0.99
200 1. 00 1. 01 1.00 1.02 1.02 1.00 1. 06 1.06 1.00
25 0.97 1.00 0.95 1.10 1.13 0.96 1.45 1.47 0.97
QZ _- 0.1
^
50 1.01 1.03 0.99 1.07 1.09 0.99 1.21 1.22 0.99
100 1.02 1.03 0.99 1.05 1.06 0.99 1.11 1.12 1.00
200 1. 01 1. 02 1. 00 1. 0 3 1. 0 3 1. 00 1. 06 1. 06 1. 00
25 0.92 0.96 0.99 1.00 1.03 1.00 1.10 1.11 1.00
Q2_- 0.5
^
50 0.98 1.00 1.00 1.02 1.04 1.00 1.08 1.08 1.00
100 1.00 1.02 1.00 1.03 1.03 1,00 1.05 1.05 1.00
200 1. 00 1. 00 1.00 1. 00 1.01 1.00 1. 01 1. 01 1. 00
25 0.93 0.96 0.99 0.94 0.95 1.00 0.94 0.95 1.00
Q2__ ^ 0
^
50 0.95 0.97 1.00 0.97 0.99 1.00 0.99 1.00 1.00
100 0.98 1.00 1.00 0.99 1.00 1.00 1.00 1.00 1.00
200 1.01 1.01 1.00 1.01 1.01 1.00 1.01 1.01 1.00
25 0.98 1.02 1.00 0.89 0.91 1.00 0.84 0.84 1.00
^? =5.0
^
50
1.00 1.02 1.00 0.96 0.96 1.00 0.93 0.93 1.00
100 1.00 1.01 1.00 0.99 0.99 1.00 0.98 0.98 1.00
200 1.00 1.00 1.00 0.99 1.00 1.00 0.99 0.99 1.00
25 0.93 0.96 0.99 0.82 0.83 1.00 0.76 0.77 1.00
Q2_ ^ 0 0
-
50 0.99 1.01 1.00 0.91 0.92 1.00 0.87 0.87 1.00
n 100 1.00 1.02 1.00 0.96 0.96 1.00 0.94 0.94 1.00
200 0.98 0.99 1.00 0.97 0.97 1.00 0.96 0.96 1.00
25 0.88 0.92 0.99 0.73 0.75 1.00 0.67 0.68 1.00
Q^ - 50.0
^-
50
0.96 0.98 1.00 0.84 0.84 1.00 0.79 0.79 1.00
100 0.98 0.99 1.00 0.89 0.90 1.00 0.86 0.86 1.00
200 1.00 1.00 1.00 0.94 0.94 1.00 0.92 0.92 1.00
25 0.95 0.98 1.00 0.79 0.80 1.00 0.72 0.73 1.00
v2- 100.0
^-
50 0.98 1.00 1.00 0.86 0.87 1.00 0.81 0.81 1.00
100 0.99 1.00 1.00 0.90 0.90 1.00 0.87 0.87 1.00
200 0.99 1.00 1.00 0.93 0.93 1.00 0.91 0.91 1.00
ERROR CUADRATICO MEDtO DE PREDICCION PARA MODELOS ESTRUCTURALES DE SERIES TEMPORALES 133
Si observamos los resultados obtenidos para ECM*[yT+^{y,)] vemos que fun-
ciona muy bien para todo tamao muestral y para todos los valores de c^^, por lo
que parece que la aproximacin asinttica es adecuada. Sin embargo,
ECM*[yT+^(y^)] no es un estimador factible del verdadero ECM de prediccin con
parmetros estimados.
4. CoNCLUSIONES
En este trabajo se ha estudiado la distribucin del error de prediccin bajo el
supuesto de que los parmetros son desconocidos y hay que estimarlos previa-
mente. Para ello, se han propuesto dos estimadores alternativos del ECM de
prediccin con parmetros estimados, uno que tiene en cuenta explcitamente en
cu^enta el error de prediccin que provien^e de la estirnacin de los parmetros,
ECM*`[yT+^{^^ )], y otro que no lo tiene, ECM[yT+^{^r)].
^
EI ECM de prediccin alternativo que hemos derivado, ECM*[yT+^{yr)], es una
aproximacin al ECM de prediccin con parmetros estimados condicionado a
lo^ datos, ^ proporciona una correccin de orden 1 I T al estimador usual
ECM[yT+^{y,)], que trata de recoger el error generado por la variabilidad muestral
en la estimacin de los parmetros.
Esta aproximacin ha sido obtenida dentro del marco de los madelos en el
espacio de los estados. Teniendo en cuenta que sta es una clase de mode{os
lineales muy general que incluye entre otros a los modelos estructurales de series
temporales y los modelos ARIMA, podemos aplicar la frmula ECM*[yT+^{y^)]
para estimar el ECM de prediccin con parmetros estimados dentro del campo
de los modelos estructurales que son el objetivo fundamental de nuestro estudio.
Tomando corno base el modelo estructural ms sencillo, el modelo de paso
aleatorio con ruido, he Ilevado a cabo un sencillo estudio de simulacin para obtener
algunas indicaciones sobre el camportamiento de los dos estimadores propuestos:
i) Los efectos de la variabilidad muestral de las estimaciones de los par-
metros en el ECM de prediccin con parmetros estimados, son bastante
importantes.
^
ii)
EI estimador ECI^I^`[yT+s^{yr)] subestima, en general, el verdadero ECM de
prediccin con parmetros estimados. Los efec#os son mayores para
tamaos muestrales pequeos, para valores de c^ prximos a la zona de
no invertibilidad y para horizontes de prediccin largos. EI estimador
alternativo c^ue se ha propuesto corrige esta subestimacin en la direccin
deseada aunque no siempre en la proporcin suficiente para solucionar
totalmente el problema.
13d ESTADISTiCA ESPAlJ^OLA
Si estudiamos el comportamiento de ECM*[yT+^(^^ )] para distintos valores
de T, Q y s, podemos concluir que la aproximacin asinttica utilizada es
apropiada; el problema es que no se trata de un estimador factible.
En principio, pademos aplicar la aproximacin al ECM de prediccin con
parmetros es#imadios dada por ECM*[yT#^{yr)J, a modelos estructurales de
series temporales m^s complejos, a condicin de comprobar que las condiciones
de regularidad necesarias se cumplen para cada modelo.
REFERENCIAS
AN^3ERSaN, B. D. O. y MooRE, J. B. (1979). Optimai Filtering, Englewoad Cliffs:
Prentice Hall.
ANSLEY, C. F. y KoHN, R. (1986). Prediction mean squared error for state space
models with estima#ed parameters, Biometrika, 76, 467-473.
BAILLIE, R. T. (1980}. Predictions for ARMAX models, Journal of Econometrics,
12, 365-314.
BLOOMFIIELD, P. (1972}. On the error of prediction of a time series, Biometrika, 59,
501-507.
FULLER, r/1/. A. y HASZA, D. P. (1980). Predictors for the first-order autoregressive
process, Journal of Econometrics, 13, 139-157.
FULLER, W. A. y HASZA, D. P. (1981). Properties of predictors fr the autorregresive
time series, Journal of the American Statistical Association, 76, 155-161.
HANNAN, E. J. (1970). Multiple Tirne Series, New York: John vviley.
HARVEY, A. C. (1983). The formulation of Structural Time Series Models in discrete
and continuous time, Questioo, 7, 563-575.
HARVEY, A. C. (1990). Forecasting, Structural Time Series Models and the Kalman
Filter, Cambridge Academic Press.
HARVEY, A. C. y PETERS, S. (1984). Estimation procedures for Structural Time
Series Models, LSE Econometrics Programme, Discussion Paper nm. A44.
PHILLIPS, P. C. B. (1979), The sampling distribution of forecasts from a first order
autoregresion, Journal af Econometrics, 9, 241-261.
PiERCE, D. A. (1975). Forecasting in dynamic models with stochastic regressors,
Journal of Econometrics, 3, 349-374. ^
ERROR CUADRATICO MEO10 DE PREDICCIOWPARA MODEI.OS ESTRUCTURALES DE SERIES TEMF'ORALES 1^^
RE^rvsE^, G. { 1980), Asymptotic properties of prediction errors for the muftivariate
autoregressive rnode{ using estimated parameters, Journal of the Roya/ Statis-
tical Society, Series B, 42, nm. 3, 328-333.
SPITZER, J. J. y^AILLIE, R. T. (1983). Sma{f sample properties of predictions from
the regression model with autoregressive errors, Journal of fhe American Sta-
tistica/ Association, 78, 258-263.
YannAMC^TO, T. (1976), Asymptotic mean squared error prediction for an autoregre-
sive model with estimated coeffcients, Applied Statistics, 25, 123-127.
SUMMARY
FORECASTING MEAN SQUARED ERROR FOR STRUCTURAL TIME
SERIES MODELS
A simulation study is carried out to examine the behaviour in small
samples of various estimators of the forecasting mean squared error
(MSE) with estirnated parameters. The attention is focused on the
class of Structural Time Series Models.
Two practical estimates of the forecating MSE, one of which includes
terms reflecting parameter estimation and one which exludes these terms,
are compared to the mean squared error of forecast for the simplest
structural model, the random walk plus noise model, considering different
values of the parameters of the mode! and different sample sizes.
Key wt^rds: Kalman Filter, Structural Models, Forecasting Mean Squa-
red error, maximum likelihood estimation.
AMS Classification: 62M 10.

También podría gustarte