Está en la página 1de 38

ESTADlSTICA ESPAÑOLA

Vol. 36, Núm. 135, 1994, págs. 21 a 58
Efectos de los distintos tipos
de out/iers en las predicciones
de los Modelos ARIMA*
por
F. JAVIER TRIVEZ
Universidad de zaragoza
RESUMEN
EI presente artículo estudia el grado de incidencia que en la
exactitud de las predicciones puntuales obtenidas a partir de los pro-
cesos ARIMA, rnedida por el error cuadrático medio de predicción,
tiene la ignorancia (no tratamiento) de observaciones atípicas (out-
liers) en la serie temporal objeto de análisis. La conclusión que se
obtiene es que dicho grado de incidencia depende del tipo de out-
liers que aparezca, del período temporal (más o menos cercano al
del origen de la predicción) en que tengan lugar, del horizonte tem-
poral (períodos hacia adelante) para el que efectuemos la predic-
ción, de la magnitud del outlier y del tipo de proceso subyacente a la
serie temporal.
Palabras Clave: Outliers, Modelos ARIMA, Error cuadrático rnedio
de predicción.
Clasificación AMS: 62M20.
* Este trabajo ha sido realizado dentro del Proyecto DGICYT PB90-0919. EI autor desea agra-
decer los útiles comentarios y sugerencias de dos evaluadores anónimos.
1 l
INTR4DUCCION
^'.^ ^ r^^)^^ ^ ^^. ^^ ^ '.^f^^r^^()Í.:1
La presencia de observaciones atípicas (outliers) causa importantes proble-
mas en la modelización univariante de las series temporales. De hecho, la pro-
pia identificación del proceso generador de datos encuentra graves dificultades,
como consecuencia de las alteraciones que las observaciones atípicas produ-
cen en los instrumentos habitualmente utilizados a tal fin (correlograma muestral
y representación gráfica de la función de autocorreiación parcial muestral). Ade-
más, los outliers afectan a la estimación de los parámetros del modelo; y, en
consecuencia, alteran los tamañas de los intervalos de predicción, que están di-
rectamente relacionados con el parámetro aá (varianza del ruido blanco}. Todo
ello ha motivado que en los úitimos años se haya prodigado la investigación re-
lativa a la forma de detectar y tratar adecudamente los outliers, cabiendo desta-
car en esta línea de investigación los trabajos de H+Ilmer, Bell y Tiao (1983),
Muirhead (1986), Tsay (1988), Chen, Liu y Hudak (1990), Chen y Tiao (1990),
Peña (1990), Balke (1993) y Chen y Liu (1993), entre otros (1).
Desde luego, por lo comentado, parece obvio que los outliers, o mejor la ig-
norancia de los mismos, van a afectar las predicciones puntuales que se obten-
gan a partir de los modelos estocásticos univariantes de series temporales es-
pecificados. Sin embargo, esta afectación va a depender de distintas cuestio-
nes, tales como el tipo de outliers no detectadas, el efecto cuantitativo de ios
mismos, el período de acurrencia (más o menos próximo al horizonte ternporal
desde e! que comenzamos a calcular las predicciones) y el proceso estocástico
generador de los datos.
EI objetivo de este trabajo consiste en analizar detalladamente todas estas
cuestiones, para lo cual se obviará en lo que sigue el problema de la identifica-
ción y la estimación de los parámetros, partiendo de una situación ideal que,
aunque poco realista, permite centrar adecuadamente las consecuencias «míni-
mas» que en la predicción puntual se producen al ignorar la presencia de out-
liers; esto es, supondremos que conocemos tanto el período de ocurrencia de
los outliers como el tipo de los mismos, así como los verdaderos valores de los
parámetros de los modelos.
Un análisis de este tipo ha sido efectuado por Ledolter (1989) para el caso
de los outliers aditivos; en este trabajo, sin embargo, se estudian los efectos de
otros tres tipos de outliers enunciados en la literatura.
Aunque ei objetivo central de este artículo consiste en analizar las conse-
cuencias «mínimas» que en las predicciones puntuales obtenidas a partir de los
modelos ARIMA produce el no tratamiento de los distintos tipos de outliers, para
(1) A nivel de libros de texto también pueden verse los de Mills (1990), Weí (1990} y Aznar y
Trívez (1993).
E-:hF^.('^lO^ I)E^: I.O^ 1)l^il lti'1OS 17F'O^ l)E: ^1('IL/f.'kti Eti I.,^^S F'kk-[)I(^t_ 1OtiF-S l.^f^ LOti !^1(al^E.l ( ^ ti ^ ^kE!^1^^ ?.^
Io cual suponemos conocidos los valores de los parámetros, dado que estos
outliers pueden producir importantes sesgos en las estimaciones de los caefi-
cientes de los modelos, lo cual empeora el grado de exactitud de las prediccio-
nes puntuales, también se Ileva a cabo un análisis de la cuantía de los sesgos
referidos.
EI trabajo se estructura como sigue. En la sección 2 se presentan los dife-
rentes tipos de outliers considerados, así corno los efectos que los mismos pro-
ducen en la serie temporal objeto de estudio. En la sección 3, se analizan los
efectas de los distintos tipos de outliers en la exactitud de las predicciones pun-
tuales de las modelos ARIMA, suponiendo que los coeficientes de los mismos
son conocidos. En la sección 4 se aplican los resultados abtenidos en la sección
precedente a dos tipos de modelos AR I MA concretos, el AR (1) y el I MA (1,1) .
En la sección 5, y tomando como referencia los modelos considerados en la
sección precedente, se evalúa el impacto que la ignorancia de los outliers pro-
duce en las estimaciones de los coeficientes de dichos modelos. EI trabajo #ina-
liza presentando las principales conclusiones.
2. TIPOS DE DUTLIERS
Denominemos yi a la serie temporal observada objeto de estudio y zt a la
misma serie temporal, pero libre de outliers. Suponiendo que zt sigue un proce-
so ARIMA(p, d, q), escribiremos:
^ (L)(1-L) °'zt = ^ (L)at [ 1 ]
donde:
^ (L) = 1- ^ ^ L- ^2 L2- . . . - ^PLp
e(L) = 1- e, L- e2 L2- ... - eq Lq
son operadores estacionarios e invertibles, esto es, tales que las raíces de ^(L) = 0
y 6(L) = 0 caen fuera del círculo unitario, donde L es el operador de retardos, tal
que Lsxr = xt_S, sin raíces comunes, y siendo at una secuencia de variables alea-
torias que se distribuyen idéntica e independientemente con media o y varianza
6
2
a
Formas alternativas de escribír [1 ] son:
zt = ^ (L)at [2]
^ (L)zr = at [3]
donde:
`^ (L) = 1 +^ L+`^ L2+ . . . - 8 (L)
, 2
^ (L)(1-L) d
[ 4 ]
f-°:^f.AI)1S"I1('A E'.S{'r^N()I„1
n (L) = 1-rc L--n L2-- . . .
_
$ (L)( ^ - L
'
2
8 (L)
d
Los tipos de outliers que se han considerado en la literatura, ver por ejemplo
Chen y Tiao (1990) o Chen y Liu (1993), son: el outlier aditivo («Additive Out-
lier», AO), el autlier innovacional (^ ^lnnovational Outlier», ItJ), ei cambio de nivel
(«Level Shift», LS) y el cambio temporal («Temporary Changei^ , TC).
E I outlier aditivo (AO) es un suceso (efecto externo) que afecta a una serie
en un solo instante temporal ( t = to), de manera que podemos expresarlo como:
yr =zr +^ ^ r
donde:
sit-to
O,sit^to
[ 6 ]
[ 7 ]
es la variable que representa la presencia o ausencia del outlier, siendo w el
efecto de dicho outlier.
Teniendo en cuenta [2] y[4], una forma alternativa de expresar el outlíer adi-
tivo es:
yr =^(L) ar +c^ r= 8(L1 a+ w^
[8l
^ (L)(1 --L) d t
r
EI outlier innovacional (10) es un suceso cuyo efecto se propaga en confor-
midad con el modelo ARIMA del praceso, afectando a todos los valores obser-
vados después de su ocurrencia. Lo representaremos, por tanto, como sigue:
Yr - zr +`^ (L)^ ^ r [9^
siendo ^r la misrna variable ( impulso) defínida en [7].
Alternativamente, [9] puede escribirse también como:
y r
`^ (L) ( ar + w^ r) = 8 (L^
( a + u^^ )
[ ^0]
^(L)(1--L}°'
r
r
EI cambio de nivel (LS) es un suceso que afecta a una serie en un período
dado, y cuyo efecto es permanente. Su definición es:
yr =zr + ^ w^
(1-L) r
donde ^r es la variable impufso definida anteriormente.
F-:FEa°CUS [^^ L(1S DIST"[N"f(1S ^1"IPOS UF ^)l.'T^IJEfzS E^:I^ Lr^S NRE:[.)[C'C^IOtif:5 [^E C.O^ MOI)F^1 OS AfZI!^9^^ ^
Resulta inmediato que [1 1] puede escribirse también como:
yr = zr + c^sr
siendo sr la variable escalón que se define:
S r
1 , t ? to
0, t < to
[ 12]
[13]
Finalmente, un cambio temporal (TC) es un suceso que tiene un impacto ini-
cial y cuyo efecto decae exponencialmente en conformidad con un factor de
amortiguación, que denotaremos mediante el parámetro b. En consecuencia, lo
expresaremos como:
y=z+1 c^^,0<S<1
r r
(1-SL)
r
o bien,teniendo en cuenta [2] y[4]:
y =^(L)a + ^ c^^ , 0<b<1
r r
(1-bL} r
[14]
[15]
siendo ^r la variable impulso definida en [7].
A partir de ia tipología de los outliers que acabamos de exponer resulta in-
mediato que los efectos de los distintos outliers en la serie original, que supon-
dremos cansta de T= to + k observaciones, son los que pasamos a comentar.
EI outlier aditivo (AO) causa un efecto inmediato y único en la serie observa-
da en el período to, de magnitud u^. Esto es, se cumplirá:
z r , para 1 <_ t< to
yr = zr+ c^ , para t= to
z r , para t > to
[16]
Por lo que respecta al efecto del outlier innovacional (10), éste depende de
la estructura ARIMA de la serie. En concreto, a partir de [9] podernos escribir:
zr, paral <_t<to
zr + w^^ , para t
= to + ^^ ^'- ^^`^o
[17]
donde ^^es el coeficiente j-ésimo del polinomio `^(L) definido en [4].
En el caso de un cambio de nivel (LS),el outlier intr oduce un cambio br usco
yper manente en la ser ie de tipo escalón,esto es:
?^ H,ti^I^•>f)IS^f 1(^,•^k-tiP:1Nt)LA
y
zr, para 1 < t< to
para t> zt+w,_to
[^8]
t
Finalmente, un cambio temporal (TC) produce un efecto inicial w en el perío-
do to, y este efecto decae gradualmente en el tíempo con un factor de amorti-
guacíón S, esto es:
Zr, paral<_t<to
yr Z^ + wS^ , para t = to + j, j>_ 0
EFECTOS DE LOS DISTINTOS TIPOS DE OUTLIERS
EN LAS PREDICCIONES DE LOS MODELOS ARIMA
[19]
Supongamos que los coeficientes del modelo ARIMA son conocidos y que el
autlier en el período to ha sido ignorado. Entonces, la predícción / períodos ha-
cía adelante lineal de mínimo error cuadrático rnedio, de la observación futura
yro+k +^ ,
desde el origen to + k, vendrá dada, ver Box y Jenkins (1976), por:
^ r ^ ^ r ^ ^ n } r ^ ^
yf^+k^'^- ^1 yto+k +^2yto+k-1 +^3yto+k-2+"' - ^ ^ %+1 yto+k j
j z0
siendo los pesos de la predicción en esta combinación lineal, iguales a:
r^^
7 L j = 1C^
calculándose los ^^a partir de [5] como:
1 -^ n ^ ^ ^ =^ (L)(1--L)°1/e(L)
^>_ ,
y siendo:
^ ^ ^ ^ i -> >
r ^ -n 1
? L ^ = 1t
j +l --1 +^ ^ h ^ j ^ ^ =
1 , 2, . . .
n=i
[20]
[21 ]
[22]
[23]
Como ha demostrado Ledolter (1989), ver también Hilimer (1984), si el out-
lier adítivo ha ocurrído en ei período to (k >0 períodos antes del origen de la pre-
dicción), el incremento relativo en el error cuadrático medio (IECM) de la predic-
ción I periodos hacía adelante que es debido al outlier aditivo que acontece en
el período referido es igual a:
w2
I EC M( l; k, a^ ^) _
6^
(24]
E_E^E-:('"T"Oti [)E-: I.US T)TST^1N"IOS T^TE't)S T)E^. ^^1,'7LIF.R.S E^ti [..•^S T'KE-:UTC'('TOtiE:^, OE-: T.O^; ti1c)Uf-l.^)ti .^kl`1-^
Si el outlier que ha ocurrido en el período to es de tipo innovacional, el error
de predicción / períodos hacia adelante, ver Apéndice, será igual a:
y^+k+!
donde:
^
Y^^k(I) =
e^+k(I) + c^ `^`k+i
k+ 1
(r ) `^k ^+^ [25] ^ ^
I 1
j=1
et o+k(I) = a^+k+^ + `^, at o+k+^ - - ,
+ . . . + ^, - , a
r o+k+,
[26]
En la expresión [25] debe observarse, sin embargo, que siempre se va a
cumplir, a partir de [4] y[5], que:
k+1 l
()
^k+l - ^ nj ^k j+1
j=1
Por lo que el error de la predicción [28] será igual a:
^ _ `
y^+k+l - yt a+k^l^ - et ;, +k^^/
En este caso, por lo tanto, el no tratamiento del outlier innovacional no incre-
menta la inexactitud de las predicciones, esto es, el valor del incremento relativo
del error cuadrático medio de la predicción es igual a:
I E C M(!; k, c.^ ) = o
[28]
En cuanto al carnbio de nivel, el error de predicción / períodos hacia adelan-
te, y sus correspondientes ECM e I ECM, son iguales a:
n
yt^+k+l yt^+k^ll - +k(^) + u^
f ^
k+ 1 ^^^
- ^ ^l
J=1
/-1 k+1 ^ ^ ^ 2
I E C M ( /; k, cu) = 6á ^ ^ Y? + (^ 2 1 - ^ ?CÍ
^ =o ^ _^
k+ 1 r ^^ 2
1 - ^ ^i
^2 j=1
IECM(l;k,c^)=
(5a
^ - ^ 2
^ ^•
j=0 ^
[29]
[30]
[31 ^
Finalmente, un cambio temporal en el período to, origina los siguientes resul-
tados:
- ^ l= e l+ c^ ^k+^ _ k+,
^ ,^ S k+j+^
Yto+k+l Yta+k^ ^ t^+k^ ^ ^ J
^ =1
[32]
F.S^TF#[)IS^TI('A f^:SP,^N(ll_A
E C M(/y k, r.^ = 6 2 J ^ 1 ^? + u.^2
S k+ ^ _
^k+, ^^^^ Sk+ j+ 1 2
) a ^ l 4-^ l
^ ^
k+ 1 ^ 2
Sk+l ` ^ ^^ ^ Sk+ j+ 1
w2
^ 1
IECM(l; k, t^j = i=
6a ^ - t 2
^ ^^
J=0
4. CASOS PARTIC U LAR ES
[33]
[34]
Con el fin de comprender mejor las implicaciones de los resultados genéri-
cos obtenidos en la sección anterior, así como comprobar el hecho de que los
efectos de ios outliers dependen del tipo de proceso estocástico subyacente a la
serie objeto de estudio, se trata en esta sección de aplicar los resultados obteni-
dos a procesos estocásticos con parte exclusivamente autorregresiva o de me-
dias móviles. Concretamente, nos centraremos en dos de los procesos más ha-
bitualmente utilizados en la literatura: el AR (1 } y el IMA (1,1).
4.1. Proceso AR (1 }
En el caso de un proceso estocástico AR (1), que escribiremos:
y t ^ ^ , y t _ , + u r , ^ ^ , ^ < ^
resulta inmediato, a partir de las expresiones [4], [5
cientes n^^i y ^^ son iguales a:
( iJ i
^^ _ ^^
^n ^^^= 0 , `d j > 1
^
dj
por lo que podemos escribir:
[35]
21 ] y[22], que los coefi-
1-1
2l
2 2 4 2(I--1) 1-!^1
^ ^•_^ -^-^1+^1+,..+^1 =
i=o ^ 1 _ ^;
[36]
[3^]
A continuación veremos cómo la ignorancia de cada uno de los tipos de out-
liers considerados a excepción del 10, que como vímos deja invariante el
IECM bajo e! supuesto de coeficientes conocidos incrementan el error cuadrá-
tico medio de predicción.
EFH:('"I'OS [^E [.OS [)IS'T'IN"hUS "^I'IPUS DE^, l)(^T^1./f'K.S^ E:N L^S E'KE^C^14..'('IONE:^ [)E^: t_O5 :^1OUF^.LOS ARttit:^
Outlier AO
Cuando el proceso es autorregresivo y los outliers en cuestión son aditivos,
éstos sólo afectan a la predicción cuando acontecen en las p observaciones
más recientes [las p+dsi el proceso es ARI (p,d )]. En el caso del proceso AR (1)
esto significa que los outliers Ao, su ignorancia, sólo van a afectar a la predic-
ción cuando éstos se produzcan en el mismo período desde el que efectuamos
la predicción, esto es, cuando k= 0.
En concreto, Ledolter (1989) ha demostrado que el incremento relativo en el
error cuadrático medio de la predicción debido al outlier aditivo en to, es igual a:
IECM(l;k,w)=
Outlier LS
$21 (1 - $^ )
w2
2^ ^
cia
1 - ^^
0 ,
para k = 0
para k > 0
[38]
En el caso del outlier LS, el error de la predicción I períodos hacia adelante,
expresión [29], y el IECM, expresión [31 ], son iguales, teniendo en cuenta [36] y
[37], a:
^
Yro+k+i - Yro+k^l) = eto+k^l) +
c , ^ { 1 - ^i }
IECM(/;k, c ^)
(w l2 (1 - ^i^2 ^^ - ^i^
\6a/
(Í -
^^^ )
[39]
La expresión [39] implica que el incremento del error cuadrático medio de la
predicción es el mismo para cualquier valor de k, es decir, es invariante a si el
outlier se produce en el período correspondiente al origen de la predicción o en
cualquier otro período del tiempo anterior.
C^utlier TC
Por lo que respecta al outlier TC, reernplazando [36] y[37] en [32] y [34], se
obtiene:
^
Yto+k+l ^Yto+k^l) i
efo+k^!) + (^ (Ók+l - ^1 Sk)
_^Í1
f_^ t-^I7I`; I I(^,^1 F^.^,^`,^^tiÍ ^l :^^
IECM(l;k,w)=
^^ z { ó k+ ^' -- ^; ^k)^ (1 - ^^)
6a
{Í --^1r1
[40J
En este caso, por tanto, el IECM es menor cuanto más alejado del origen de
la predicción acontece el outlier TC {esto es, cuanto mayor es el valor de k}, si
bien, a diferencia de lo que ocurría con el outlier AO, el efecto, estrictamente, no
se anula.
Como conclusión de este apartado cabe señalar que cuando el proceso es-
tocástico subyacente a la serie temporal objeto de estudio es un autorregresivo,
el efecto que va a producir en la predicción (ECM} la ignorancia de un determi-
nado outlier, depende claramente del tipo del mismo. En concreto, si el outlier
es aditivo, su ignorancia tan sólo producirá variaciones en el error cuadrático
medio de la predicción cuando éste tenga lugar en el mismo instante temporal a
partir del cual efectuamos las predicciones. Este no es el caso del resto de los
outliers analizados, pues todos los demás, a excepción del 10, alteran el ECM
tanto si el outlier tiene lugar en el periodo correspondiente al origen de la pre-
dicción, como en períodos precedentes, si bien en el caso del outlier TC la
cuantía del efecto está relacionada de manera positiva con la proximidad al ori-
gen de la predicción de la ocurrencia de dichas observaciones atípicas, mien-
tras que en el caso del outlier LS el efecto es invariante respecto al momento en
que tiene lugar.
Otro resultado que se observa directamente a partir de las expresiones [38]
a[40] es que, como cabía esperar, cuanto mayor es la cuantía de los outliers,
es decir, cuanto mayor es w/aa, mayor es el efectos que éstos producirán en
IECM.
Las cuadros 1 a 3 confirman estos resultados, además de permitir analizar
cuáles son las magnitudes (en %) de incrementos en el ECM de predicción que
originan la ignorancia de los distintos tipos de outliers. En dichos cuadros se ha
calculado el IECM, en tanto por ciento, suponiendo distintos valores de k(el pe-
ríodo de ocurrencia de los outliers es más o menos próximo al origen de la pre-
dicción), de I ( horizonte temporal de la predicción, esto es, períodos hacia ade-
lante para los que se efectúa la predicción), así como de los valores de los pará-
metros del modelo (^1, en este caso) y de la magnitud del outlier ( c^/6a).
A la vista de los resultados presentados en los cuadros citados, el primer
punto que cabe destacar es que el no tratamiento de los outliers puede Ilevar a
incrementos en ECM muy importantes ( ide hasta casi un 10.000 por ciento!).
Salvo en el caso de los outliers LS, el efecto no es muy relevante si el valor de k
es elevado, es decir, si las observaciones atípicas se producen en períodos de
tiempo bastante alejados al del origen de la predicción. En cuanto al horizonte
E^°^^E:("'1'Oti [)E^ I.O^ I)tSTtN`I'OS ` f ^IP(^)S f . 1 E : ^ ^ I ( ^ 7 ^ 1 . / E . k . ^ E:ti LAti F'Kfa)I(^('COtif:.^ ( y E^- !(^^ ti1^^1:>t^.t.r ^^ ^^ ^k1ti1,1 _ ^ 1
temporal de la predicción (n, en el caso de outliers AO, el valor de IECMestá
relacionado de manera negativa con el número de períodos hacia adelante para
los que efectuamos la predicción, siendo esta relación positiva en el caso de
outliers LS, y dependiendo de los valores concretos de ^, en los vutliers TC.
También obtenemos conclusíones opuestas al analizar la relación existente en-
tre el IECMque se obtiene al ignorar los distintos tipos de outliers y el valor del
parámetro ^^, que se supone conocido. En efecto, en el caso de los outliers AO,
a mayor valor de ^^ mayor es el incremento en el error cuadrático medio de la
predicción que produce el no tratamiento de las observaciones atípicas, obser-
vándose una relación totalmente contraria cuando los outliers ignorados son LS.
Cuadro 1
INCREMENTOS EN EL ECM DE PREDICCION (EN %) ORIGINADOS
POR UN OUTLIERAO EN EL PROCESO AR (1)
Períodos hacia adelante para
Outlier en el origen de la predicción
k=0
los que efectuamos la predicción
/--^ 1 2 3 1 2 3
Magnitud del Outlier w= 5a^ Magnitud del Dutlier w= 10aa
^, = 0, 1 25 0, 2 0 10 0 ^ o
^1 = 0, 3 225 18, 6 1, 7 900 74, 3 6, 6
^^ = 0, 5 625 125 29, 8 2.500 500 1 19, 1
^1 = 0, 7 1.225 402, 9 170 4.900 1.61 1, 4 680
^^ = 0, 9 2.025 906, 2 538, 8 8.100 3.624, 9 2.155
Cuadro 2
INCREMENTOS EN EL ECM DE PREDICCION (EN %) ORIGINADOS
POR UN OUTLIER LS EN EL PROCESO AR (1)
Períodos hacia adelante para
Outlieren cualquier período (d k)
los que efectuamos la predicción
1--^ 1 2 3 1 2 3
Magnitud del Outlier w= 5a^ Magnitud del Outlier c^^ = 10aa
^1 = 0, 1 2.025 2.426 2.470 8.100 9.704 9.8$0
^1 = 0, 3 1.225 1.899, 3 2.155, 4 4.900 7.597, 2 8.621, 5
Q ^^ = 0, 5 625 1. i 25 1.458, 3 2.500 4.500 5.833, 3
Q ^ 1= 0, 7 225 436, 4 623, 7 900 1. 745, 6 2. 494, 9
^i = 0, 9 25 49, 9 74, 5 100 199, 4 297, 8
F.S I,AI){ti l l('A F^+F'AN( at.A
^
N N *-
O
^ C C
^
O O ©O O
N ^O_
' ^^ 4^
^j
^ ^ O C1 O
T YJ
1 _ J ^""' '.^
W1^ ^ V
U
^--
N ^
m ^^ II
Z^ ^ ^ Y
j ^ ^
©
N
r
O
00
ó
O
C7
ó
O
^-
c ^
O
o
O
r-
ó
,--
(T
c^i
.--
M
^=
O
C^
c^
O
o
O
Cr3
ó
^
^1 J
^
N zt ^D M r. r^ c^ r-
1 c+ ^
c^D cñ Ñ O ^t
^
O
^`0
M Ñ © .--
1'^^
`^•^
^../
^
^ _^ lli
$^ ^ ii N
^
Cp
^
©
^
MO ^
^ ^
h o U
Z
^
C Z7dY ,`^^
r
tt
^-
C'7 0 0
c 0
P ^-
^t
N M M
^
^ ^C ^
r--

N
r^
^--
ÑO N r--
O
lf?
`rt
*-
^-
O
.-
0
r
^
i^i.. UJ WF' t'J t'J 1 ^ r-
^
^
-pO
^
M
C^D ^ N ^ f ^^7
WWW
GO
o^ti
^t
^
^O O ÑN .-
^
Q
_ _
^ 'C
^ ^ U_
O N
V^ Q ,1 ^ il N
^77
M
T
^
1 `-
Ñ ^ ^
^
^
^
'
C^
^^
ad
M
Zt^
^ ^ Ó. Y
CO
^
(1 )
C^ r T
V O
^^.`. N ^ V
.W .^^^
^
r^ d' N
^ I^
^
^
^ O
^
^
T
Ñ ^ Ñ Ñ ^ ^ ^ ^
/^\
^^ \
W^ ^ ^ W^
^ T^
...^ r r ^7 O ^
O
M
M
^ r^ f ^. W^ 1 ^ ^.//
w^
-p c c
^ ^- ^ ^ r N
0,--^Q
^o ^
Z
^ t^

^ 0^ d' M CO M OCa N
^ ^
_
T^ ^
C ^WII N
^ ^ ^ O ^
r ^ C1 J ^ 1 ^
=rtiW^ ^ á -Y
N •- r1^- N N
^.,/ ^U.r^
C.^
...^r ^
^
. Q % ^ ^Ú
' ^ ^
T O ^
T
O L^^n/ ^ ©
^ ^ ^ ^ ^ ^
T
^ Í^ (^ ^' r
Wp,.
^ J
a- W
^
T
M^
r
^^ T N
wZ
^ W
(^^^ C^ N ^ Q^t")
t`
Ó CNO ^ Ó
N N *-
r^^} ^
^
^
T
^
^ U ^
O C
C^ N ^t N !X} 1 ^-
w
^p ;
C ^O ^
^ I I N
^^ ^
r
O *-
^t
r t70 O O ^
^
Ó )
Y
I.f') M r r Ñ ^ ^
W
^^
+.. `
Nr ^ ^
Z
^ ^
W
Ó Ó Ó ^ Ó Ó O O ^ O
^
T
O^ d ,-- ^-- C^ tD ^ d'
O
^^^
^
Z
W
^
W
^
U
Z
c
.p
C^
T M
0 0
II ^)
r ^--
^ n r ^ a^
000
II 1 1 II
^ r ^r
r
II
r_ c^^n r^rn
00000
II ^I II I^ ^I
t:F°t^^:C"^I^t)ti UF^: l.(^)S [^1S`I'IN"I^t)^ "f^IPOS C)E (^('TIJf^,'R.^^ F^N I.^AS 1^'FZE^L)I(^'(^I(^tif-,^ Uk: l.^)5 ti1^^I
4.2.
Proceso IMA (1,1)
En el caso dei proceso IMA (1,1):
i1 '^) Y^ = ut -- ^^ ur_^ , (81 ^ <1
^^_ 1 (>`^ ^^k1^1-^ _ ^^
[41 ]
los valores de los coeficientes n;^> y^; , teniendo en cuenta las expresiones [4],
[5], [21 ], [22] y [23], son iguales a:
n^^> = 6^
-^ (1 _ ^1) , d ^, /
, para ^ ?^ [42]
Se trata, al igual que en el apartado anterior, de analizar el incremento en el
error cuadrático medio de la predicción que origina la ignorancia de cada uno de
los outliers descritos. Para ello, deberá tenerse en cuenta que, a partir de [42],
se obtienen los siguientes resultados:
^^^ k
^k+1 - e1 (1
I -1 2
^ `^. = 1 +(
!- 1) (^ _ e^)2
Í =o ^
k + 1
1 _^^^^^=^1+ 1
^
j =1
k + 1 j -
^Sk + 1 _ Si + 1)
^ ,^^' ^^k +,
_ (1 e, )
j = ^ f (s- e
,)
(la prueba de [45] y[46] se adjunta en el apéndice).
Outlier AO
[43]
[45]
A diferencia de lo que sucedía cuando el proceso estocástico era autorregre-
sivo, en el caso de procesos de medias móviles (o de medias móviles integra-
dos, como es el que aquí consideramos), el vutlier AO va a afectar las predic-
ciones independientemente de cuando se produzcan las observaciones atipicas,
si bien la cuantía del efecto en el ECMque produce.la ignorancia de las mismas
va a ser menor cuanto más alejadas se encuentren dichas observaciones atípi-
cas del origen de la predicción; es decir, el IECMserá menor cuanto mayor sea
k, aunque en sentido estricto no se anulará a partir de un determinado k.
F:tiTA[)1^11('^^ f.SF'^ti{)1..^^
En efecto, tal y como ha demostrado Ledolter (1989), el valor del fECM en
este caso es igual a:
IECM (l; k, c^) _
^ 2
e2k {1 - ^^)2
[47]
^a [ 1 + ( / - 1 } (1 - 8^ }2]
A partir de [47] podemos concluir, por tanto, que:
a) EI efecto del outlier AO sobre ECM en el proceso IMA (1,1) no se anula
cuando el outlier ignorado tiene lugar un número determinado de periodos ante-
riores al origen de la predicción, si bien a medida que dicho número de períodos
(k } aumenta, el efecto del outlier, sobre el grado de exactitud de las prediccio-
nes medido por ECM, disminuye.
b) Cuanto rnayor es el horizonte temporal para el que efectuamos la pre-
dicción {es decir, cuanto mayor es l), menor es IECM.
c) Existe una relación positiva entre magnitud del outlier (c^lcsa) y efecto
cuantitativo del mismo en IECM.
d) A diferencia de lo señalado para el proceso AR (1), en el caso del IMA
(1,1) no existe una relación positiva entre magnitud, en valor absoluto, del coefi-
ciente del modelo (9^) y efecto cuantitativo del outlier en la inexactitud predic-
tiva.
Dutlier LS
En el caso del outlier LS, el error de la predicción I períodos hacia adelante,
expresión [29], y el IECM, expresión [31 ], teniendo en cuenta [44] y[45], son
iguales a:
^
yro+ k+ ^ - Yro+ k^l} _
(^ 2 8; ( k+ t )
IECM (l; k, w) =
aa [1 + {I - 1) (1
- 81)2]
(I) + w e; +,
[48]
A partir de [48] podemos señalar que en el caso del outlier LS se mantienen
las conclusiones a}, b) y c) referidas para el outlierAO, es decir, existe una rela-
ción negativa entre IECMy k (períodos previos al del origen de la predicción en
que acontecen las observaciones atípicas) algo que no se cumplía en la com-
binación de outliers LS y procesos AR-- e IECM y /(horizonte temporal de la
FFf^,('"fC)S Df^ f.()S !)1S'!"tN"I'C)S "(^tP()S DE t)l.'7'L/f..^R.1' E:N l.AS PRE=!)IC'('1()!^f-.ti [)E= l.()^ !^^f()f)f:1 ()^ ,^^kl!tif,A ^5
predicción); mientras que hay relación positiva entre IECMy la magnitud del
outlier (c.^laa). Además, como rasgo distintivo con respecto al outlier A4, en este
caso se observa una relación positiva entre la magnitud del parámetro 6^ y el
valor de I ECM.
Outlier TC
Respecto al outlier TC, reemplazando [44] y[46J en [32] y[34], obtenemos:
Sk+,
Y
-Y (Ij=e (1)+w
Sk+^_(1 _® ) (
to+k+l tp+k fo+k 1 (S
IECM(/;k,c^)=
2
(Sk+1 _„ 8 k+11
^k+/ ,_ / 1 - ^ 1 } 1 1
(^ 2 l (^-8,^^
aa [ 1 + (I- ,I ) (^ - e1)2]
[49]
A partir de [49] podemos concluir que el valor de IECMse encuentra relacio-
nado positivamente con la magnitud del out/ier (w/6a}, mientras que las relacio-
nes existentes entre los valores de ios incrementos en el error cuadrátíco medio
de la predicción y el número de períodos anteriores al del origen de la predic-
ción en que acontecen los outliers TC (k) o el horizonte temporal de la predic-
ción (n, dependen de los valores concretos de los parámetros 8^ y s.
Ai igual que en el apartado anterior, con el fin de poder analizar las magnitu-
des (en %) de Ios incrementos en el ECMque produce el no tratamiento (igno-
rancia) de los diferentes tipos de outliers, cuando el proceso estocástico que
subyace a la serie ternporal objeto de estudio es un IMA (1,1), se han elaborado
los cuadros 4 a 6, en los que se confirman todos los resultados señalados en
este apartado.
T
r
Q
C
r
^^
^
©
^
^
^
0
^
C i ^
^
^^
^^
^ Z
^v
^^
^o
.i-^.
^
O
^
W
. . . ^
^
^_
U
U_
^
^
^
^
^
U
W
J
W
Z
W
^
^
F-
Z
W
^
W
^
U
Z
Ú _
^ ^
I I
á ac
cv
-^ C^
^ct7 T^
^
N
O
Ó
^
^l
a ^
^Aa ^
W
^ a ^
cts Z3
m
a ^ ^
c
• o
. ^
c^
a ^ ^
a ^

N
.--
N
r
M
N
N
r
(^
N
T
F.S I .^l)6ti l ( { ,-^E-. tif'^^tic )L,^^
^
cD O^
o á ^© O O O © r-
r
N ^
O O O O
N
M 4 O O O
I'^
N
r
N
O © O O c'7 O O O O CV
^
V' d' C L 3 CO ^N
O O O I ^t ') CO O O T- r--
N
^t
M
t,A 00 C D M ^
O © O ^ DO O O N c^
N
^t
c^
cD d' t`- d' d- ^
O O O Ct ^ 0^ O O N
Ñ M
W^ C^ N
r^'
C^
O ^ Ñ ^ C O
^N O 40 c^
.- T-
.- I `^ N CO N ^t C O N
o co . - rn ca
^ M ^ ^ Ñ Ñ
T
^
T
^
N ^ •- ^ct 00 h- N r-- C D
G^ ^ G^ ^t c, Ú © rn có Cs ? ^n
`-, y ^ r M tl^ ^^- ^D
^- N
1^ ^ N ^t Q O ^ I ` I '^ 1 `^ ^
^ ^ ^ M (T O N C D C 'r} ^
^fi O ^ ^
M
_
^ T Ñ ^ c)
N
T
T
^f
f`
I .C)
N
r-
O
O
N
I^-
^
(D N
^
N N
r
N
r
N N
Ñ t^ ^
O C^ CO O C) r r- L t ^ r ^--
N *- ^ •- N
^ M r- , - .- ^t CO ^
tT f^
^
I^
^
f`^ ln C D
T-
I^
^t
1^
C O
f^
N OU
ñ ^ Ñ
^
O C
rT
t^- cf l ^t T Ó
M
et
N
CO
T-
^
N ^f ^ v-- C O I^
^
^ ^ r- Ñ © ÓÑ f^ 00 Ó c' V ^
,-
T
00 t.f) N ^t
^t
N
M
O
N
C ^0
N Ñ N N N Ó ÓO ÓO
O N c1^ N t -- ^ t n ^ .-
N •- 00
m
k ^
d^N
0
^
I I
3
^
^
^
O
T- M I .C) r`^ O) ^^ - M ^ 1 ^ O)
O O O O ^
^
O O C J O O
^
II il II II rl rl n u u rr
r T T T 1 ^
^
T T r T f^
^ ^ ^ ^ ^ ^^ W m Q ^ C D W
E:F^F:^C^..!'OS [^)E: !.t):^ C^IS^^lN"I^(^)S ^I^IYOS UE (^ ('"7^ 1_l^ ^ ^ R .S N^N LAti PRf-:l)1('('1t)NE^-.S C^F I tati !^1OC)E^.1.^^5 •^ ^ kl!^+tA ii
Q
G
i^
O
^
O
^CC
C^ áU`C^
L vi V
QO ^ O
^ ^ ^. II
L1
^^^Y
1 CTr+
^ 1^ v
O
N
O
N
^ C C
O ^ `C
,Q^ .U
_^N
^^^tl
-C ^r^ a. -^C
V/^/`
^
/^ ' W
. = 4^i
© (a ^o
O
-p CC
O ^^O
,Ñ ^.^
C1_^Zj r
CW^II
^^C1 -^C
.` ^^
'^
O ^^
c
•o
U
U_
N ^
N
^ á
O
N^
^
^O
C'1 ('13
^
.^
U
N
v-
N
N
OO O
a^ o0
O oO o^
N
T
N
0^ ^ r^
^
^C'+7
N
N
C^ O O O ^ N
N ^
^t` T
N
oc^ ó ^a rn ,^`
CD f`-^
CD
^--
^
0 o c^ ^r có
e7 O
^ M c .C)
M
O ^
Ñ ^ Ó
N
0
N
^
N
.-
M
N
QO
^
ch
^t
^_
00 ^--
Ñ
r-
M
r^
(D
r--
^ ^ ^ ^ Ñ
r^ N N 1'^-
c^
r'
T
M
O O^
r-
d'
O
Cf^
^O
Op
^
^
ca r^
N
Ó
^ Ñt^
^t
N
r(,n ^
^
CV
C^
N
O
N
N
c^
^A
N
O
O^
T
N
Ó
^
1.C) C.^ ti ^
T
M
M (h CO OO ^
M
.-- •- Ch 0^
,-- ^O^
r
a^ rn
N ^ ln Ó Ñ O
.-- tl3 .-- O
.-- N
,--
ÑÑ
N
Ñ
CD
Ñ
N
Ñ
O
.- N
^
b
u'^
n
3
^
t
^
1
^
^
.-- C^ ln (`^- O ^
^
OOOOO
-a
^
^
u
m
I I
m
I I
a^
rl
m
I I
a^
O Q ©
O O O
O O
O O
,^-
t17
tti
^
^
^
M w^
1^. CQ
- C^D
N
M
ÑQ^i
.- 1'`
N
Cf: tt (^
C^ O N Cb ^
M N^
N
N
N
0 Q O ^
T
^C7
^ M CO
O-d ^ ^ C1^
^
r-
^ C7 Ñ
T^
C7
CY 3
(^-
N
^
^fY
C^O^
et
^t
+- r- M
^11
T
^
y /
^ ^
O O CD ` ^t N
^ tt O ^t
ll^ ^
N
Cr0
CO
O
^
^ Ñ ^
T^^
l
I,^
N
^d'
C L ^
OD d^ ^
^ l1")
N 1.l') 1`-
N
l1?
CD
N
Ch ^ CD ln et
^f C ^ ^- rT
^^ti
N
l ^A Ó ^ ^ Ñ
t^ O
N
d
tt
O
O^
ó ó ó ó ó
r- ^7 t1') ^ T-
N ^t ^
T- M tn 1`- ^
OOOOO
II 11 II II II
a^ a^ ^ m cá
!~ti^1^^^1OISf I<^^,^^ t-.SWAti^)LA
^ ^ ^Ó
O
^^^U
^ ©^ O
N^ ^
d + ^- - 1 1
T.7 a
Z7 ^ ^ ^[
^ ^4}
^, cts v
^
^
0
W
á C
a ^
^
^- ó
^
0 ^^
Z
^Ú ^
^ ^
^
C
^ ^
^
d
0
^ ^
^ II
^
^ Q^
...,.
UUW
U v
ó0
^ ^
0- J
W W
^ Z
^ W
^
W
1 1 J
Z
W
U^
0
H-
Z
W
^
W
^
U
Z
O
^ CC
^ •O
C^ ^Ú
^ ^ U
_ N
^ ^ ^ II
^ ^ d-^[
^
^
^ ^cv
ó ciDt7
_t 0
^ ^ C
C^ ,^
N C(,j O
^ ^ UI f
^ ,^ ^ ^
^
^
O p_
^
^
V^,
W
N
r
N
M
N
T
N
^?
O
^O
©
^ I
N cD
^
C^ f ^ Et U^
O O ÑI ^
N ^I 7 ^
Ó ^
I
N O
^
^.n c^
I
cn
^ Ñ t.
t^
C) í^
N ^-- 1`^ ^
.- N ln I CY 7
P^ cT N CJ7
^ C1r J ^ I Q7i
t ! ^ ^- 00 Lf7
c + ^
^
^
^ 00 M
.- T-- N
Ñ^t' ^
O ( á ^ ^
N
^
N
Ó
T
N
o
C,^ ^
^ J
DO
r-
*- -
r-
^
^ C^D ^ T
N
(^3
N
d0
N
T ^
c^
^
C_ ^
N
N
r
W
N N N N
N C^ O N
M *- M
.- .- Ñ
W
rn
o
T
*-^
t `
^
^ o^ co ^t ^
N •--
N CV ^
N
M
N
O
^
O
^ ^
O
I`^ ^
M
O
r^ ^ r ` r n
0000
fi ^f u ff n
♦- ^ .- r ^
^ ^ ^ ^ ^
3
`
g ^
^
w I ^
00
.-
^ ^
.^- N ^ ^
^
r-
N
N
r-
00 ^
c ^
^
c n T- ao ! v
íl7 Ó t,^A I ^Ó
•- N N
^ C'^ CD CG ^
^t Ó M I í^
r- N .-
CO CL7 00 ^
^
CY 7 ^ W f^
.--
.-
^
c+ ^
^
N T
CO
l ^
^ ^ ^
^
^ 1^-
.-
`C}'
Ñ
^ ^ n
^ r- 00 I ^
Ñ^ ^ Ñ
N u7 tn
^ t ^D CMO I tND
00 O 4t)
.-
N ^t ^t CO
T
^ í^ Ñ ^ M
^ ^ ^ ^
^ ^ *- I Ó
r
N t`^ M ^
^
t -
WTI Y/
^
Ñ ^
O
I O
(^ N ^
r
0000
^t ° ^o ^ c °o
M
^_ r^ ^n r^
o©o0
i i i f i i u
r Tf^ f^
t^:FE(°IOS [)E^. [.(^^ [^(^'f.tN"f"c)S ttF^c)^ [^E ^^^^TL.If .'K.^^ t-.N i..aS t`'REUI('('tOtit•.4 I)t- I.Oti ti1l)I)f.t ^):^ -^klti9,a ^y
5. EFECTOS DE LOS DISTINTOS TIPOS DE OUTLIEf^S
EN LAS ESTIMACIONES DE LOS MODELOS ARIMA
En la sección anterior hemos analizado cuáles son las consecuencias míni-
mas (esto es, suponiendo conocidos los coeficientes de los modelos) que el no
tratamiento de los diferentes tipos de outliers considerados producen en la
exactitud de las predicciones de !os modelos ARIMA.
Las implicaciones de !os outliers en i as predicciones, sin embargo, van a
verse incrementadas como consecuencia de que en la práctica no se conocerán
los verdaderos valores de los parámetros de los modelos ARIMA, debiendo, por
tanto, estimarlos. En este sentido, tal y como ha demostrado analíticamente Le-
dolter {1989), considerando outliers tipo AO, los sesgos en las estimaciones de
los parámetros ocasionados por los outliers producen un efecto suma en las ine-
xactitudes predictivas de los modelos ARIMA.
EI análisis de los efectos que los distintos tipos de outlíers producen en las
estímaciones de los modelos AR IMA, io Ifevaremos a cabo considerando los
mismas casos particulares de la sección anterior, esto es, los procesos AR (1) e
IMA(1,1).
Se trata de generalizar a los outliers 10, LS y TC los resultados que, para el
caso de los outliers AO, ha obtenido Ledolter ( 1989).
5.1. Proceso AR {1)
La estimación minimocuadrática del coeficiente ^^ de [35] viene dada por:
T
^ Yf Yr_i
^^ _
Cuando el outlier es aditivo, véase Ledolter ( 1989), se cumple:
T
E(^YrYt-,)=(T-1)^Y,
^L Y r_^
r = 2
T [50]
t=2
Y
T ( T -- 1) ^o + c^2
E (^ Y r_^) _
, s i k > Q
[5^ )
[52)
r 2
^
( T^1)Yo , sik=Q
E-^ I -i131^^i( A1-.tii'A!`^()l.rti
siendo y, la autocovarianza de primer orden, que en el caso del modelo AR (1 }
es igual a y, = c^,yo, y yo la varianza, que para el modelo AR {1) es igual a yQ = 6á
/1 -^j.
De acuerdo con [50], [51 ] y[52], una aproximación a E(^^ ), que es aceptable
cuando T es suficientemente grande, viene dada por:
, s i k > 0
1
+ lcu/cs^2 (1 - ^i )
T- 1
sik_0
Las expresiones [51 ] y [52] varían sustancialmente cuando los outliers, como
es el caso de los I^, LS o TC, no agotan su efecto en el período de ocurrencia
de los mismos. Asi, y en conformidad con las expresiones [17], [18] y[19], véa-
se el Apéndice, podemos escribir, suponiendo que k> 0:
y ^ 1 } _
k
(T-1)y1+w2^,`^^ `^f_^ ,con`^o=1, silQ
^-,
(T-1)y^+ku^2 , siLS
(
T- 1) y+ c^2b{ 1- ó2k} , si TC
3 1 _ b2
T
E(^ y
t - 2
k-1
(T-1)yo+c,^2^`^? ,con`^o =l,sil0
j= 0
( T- 1 } yo + c^.^2
{ T } yo +
, si LS
(^2 (1 - ^2 ^
1 - ^2 , si TC
En consecuencia, y teniendo en cuenta que en el proceso AR (1) se cumple
que `^^ _^; b' j, podemos escribir las siguientes aproximaciones para E(^^):
Fa-E•:('"f OS l)E: LOS [.)1S`I'!N"Tt)S 'I'!f'OS L.)E: ^I[^T^l./F.R.S E^N I.AS NFtf:I.)IC`( ^It^tiF^.ti UF^. L^ )^ 11c )I)h.Lt ^ti AK141,^ -l 1
Outlier lo
E ( c p ^ ) ^
Outlier LS
( T-1) ^ ,Yp +c ^ 2^ ,[( ^ -$jk) /( 1-^ j) ]
( T-1) Yo+c ,^ 2( ^ _^ 2k) /( ^ -$1)
( T- 1) $,Yo_
{T-^ ) yo
, si k= 0
, S I k > ^
[54]
( T --
1) ^ 1ya
+ kc^2
( T -
1) $i + k(w2/aa)2 (1 - ^?)
( T-1) ya+kc ^ 2
sik>0
[55]
Outlier TC
( T- 1) ^ ^ Yo
{ T-- 1) Ya
_^ ^
{ T- 1) +k( u^ 2/6a) 2( 1- ^ ?)
, si k- 0
( T- 1) ^ iyo
+ c,^2S(1- b2k/ 1- b2}
(T-^)yo+w2(1_^2k/1 _S2) -
_[( T- 1) $^ /( 1- ^ j ) ] +( u^/6a)2S( ^ - S2k/ 1- S2)
[(
T-- 1) /( 1- ^ ?) ]
+ (c^/aa)2(1 _ ^2k/ 1 -- b2)
si k>0 [56]
A partir de las expresiones [53] a[56] podemos concluir que los sesgos en la
estimacíón del coeficiente ^1 del modelo autorregresivo de primer orden van a
ser relevantes, siempre y cuando el outlier no tenga lugar en el período corres-
pondiente al origen de la predicción. Además, en los casos en que los outliers
sean LS o TC el sesgo será mayor cuanto más alejado del origen de la predic-
ción acontezca el misrno. También debe observarse que en el caso del outlier
10, e independientemente del período de ocurrencia del mismo, no se produce
sesgo alguno en la estimación del coeficiente. Finalmente, obsérvese la relación
directa entre tamaño del sesgo y de outlier (w/6a).
Una cuantificacíón de los sesgos que originan los distintos tipos de outliers en
la estimación del coeficiente ^1 de un modelo AR (1) se adjunta en el Cuadro 7.
• ^ ^ ^ F-.^ i^ ^ f^ .,tt')IS^ II(^ ,; f^^.tiF^'AÑ{)t.s^
Cuad ro 7
EFECTOS DE LOS DISTINTOS TIPOS DE (7UTLlFRS EN LA ESTIMACION
DEL COEFICIENTE DE UN MODELO AR (1). (T= 90}
E^^ ^ )
LS TC
AO
(k>1)
10
(`dk} k= 1 k= 5 k= 10 k= 1 k= 5 k= 10
6^-0.1;w=2
^^ = 0.2 0.14 0.2 0.44 0.75 0.85 0.35 0.53 0.53
^^ = 0.5 0.37 0.5 0.63 0.81 0.89 0.55 0.58 0.58
Q ^^ = 0.8 0.69 0.8 0.83 0.89 0.92 0.79 0.78 0.78
6á=0.1;w-3
^, = 0.2 0.10 0.2 0.59 0.86 0.93 0.45 0.52 0.53
^^ = 0.5 0.2$ 0.5 0.72 0.90 0.94 0.59 0.62 0.62
^y = 0.8 0.59 0.8 0.85 0.93 0.96 0.77 0.76 0.76
5.2. Modelo IMA (^1,^1)
Si la serie { y t } sigue un proceso IMA ( 1,1), tal como el escrito en [41 ], las prime-
ras diferencias Dy^ = yt - y t _, seguirán un proceso MA (1) con una matriz de varian-
zas y covarianzas caracterizada por yo = 62a (1 +62^ ), y^ _-8162^ y y^ =0 para j> 1.
Para analizar el efecto de los out liers en la estimación del parámetro 91, po-
demos comenzar examinando el efecto de los mismos en la estimación del coe-
ficiente de autocorrelación de primer orden de la serie diferenciada una vez.
A este respecto, podemos escribir:
E( r^ ) =
r
E (^ ^Yr ay^-1)
r^ 2
T
E (^ (dy^. , )2)
t =2
[57]
Los valores que adoptan las expresiones del numerador y denominador de
[57] dependen del tipo de outlier que acontezca, pudiéndose demostrar ( véase
el Apéndice) los siguientes resultados:
r
E (^ ^Yt ©y^-i
r =2
( T- 1) y^ - c^2, pa ra k>0, s i AO
( T- 1) y^ - 9c^2, para k>0, si 10
( T- 1) y1, si LS
( T- 1) y1 + t^^2( ó-1) [(1 +b2k^1)/(1 +b)], para k>0, si TC
^^,F^E°,("^OS [)f-: LOS [)IS'i"1N"T^C)S "i^IPO5 [.)E O('77Jf^^K.S E^N LAS f'RHf)I('C'I(^!^f^.S !>E LOti ti1(^U^^.l ^^ti Akl.ti^^^ =^3
T 2
( T - 1) yo + 2a^2, para k>1 , si AO
( T - 1) yo + w2(1 + 9^ ), para k>1, si !O y
F (^ [DYt _, ) ) -
r^2
2
( T-1) yo + w, para k>0, si LS
( T- 1) yo + w2{ 1+[(1-b) (1-b2^k-' >)/(1 +S)]}, para k>0, si TC
Reemplazando estas expresiones en [57] se obtienen las siguientes aproxi-
maciones a E(r1) :
Outlier AO
Er __ ( T- 1) 1'1 -
w2 _ --( T- 1)9^ -( w/csa)2
( ')r T -1 +2 w2 T-1 1 +82 +2 w/a^
{ ) ^p ( )( y) ( a
Outlier IO
para k > 1 [58j
_ (T- 1) Y^ -8^w2 __ -(T-
^)6^ -e^(w/óaj2 _
E(r^) - T- 1 + w2 1+82 T- 1 1+ 62 + i+62 w/6 2
( ) ^p ( 1) ( )( 1) ^ 1)( a)
--e,
^ 1 +62 ^ Para k > 1
1
Outlier LS
E( r, ) _
( T -1)y^ _ _ -( T -1)^1aá
( T -1)yo+w2 ( T --1)6á( 1 +9^)+w2
- -{[( 1 + 8^ )/61] + [(w/6a)^l( T- 1)e^]}^' , para k > 0
Outlier TC
( T -- 1 }y^ +
r^2(^ - 1)[(1
+ó2 k ^)/( 1 +^)j
E( r^ )=
T- 1 + w2 1 + 1-ó 1-S2 ^k '^/ 1+b
( ) Yo { [( )( ) ( )]}
-( T -- 1)8^ -- ( w/6a)2 ( 1-b)[( 1-ó2 k-1)/( 1 +b)^
( T - 1)( 1 + 6?) + ( w/6a)2 { 1 +[( 1--5)( 1-ó2 ^k-' ^)/( 1 +S)]}
, para k>0
[59)
[60J
[61 ]
Teniendo en cuenta que el parámetro ^1 y la autocorrelación de primer orden
(p1) de las primeras diferencias de un procesv IMA {1,1) están relacionados me-
diante p1 =-81/(1 +81), pueden obtenerse estirnaciones de 6^ a partir de las ex-
E;ti'TA[)1S1^1C'A F:SPAti()t.A
presiones [58] a[61 ] reemplazando p1 por r^ y resolviendo la ecuación cuadráti-
ca resultante para la salución invertible e^ . Esto es, obteniendo:
1 I 1
E(c^' } = - 2E(r } ^
4[E(r )]2
-1
1 1
[s^]
La expresión [62] nos permite cuantificar, véase el Cuadro 8, el efecto de
los distintos tipos de outliers en la estimación del parámetro e^ del modelo
IMA(1,1).
Cuad ro 8
EFECTOS DE LOS DISTINTOS TIPOS DE OUTLIERS EN LA ESTIMACION
DEL PARAMETRO 8i DE UN MODELO IMA (1 ,1 )
TC
AO 1 0 LS
(k>1) {^Jk) (dk) k= 1 k= 5 k= 1 0
a^=0.1;w=2
6^=0.2 0.38 0. 2 0.14 0. 24 0.19 0.18
9^ =0.5 0.60 0.5 0.33 0.45 0.37 0.37
8^ =0.8 0.84 0.8 0.47 0.62 0.52 0.51
csá=0.1;c,^=3
e, =0.2 0. 49 0.2 0.10 0.26 o .1s o .18
91 =0.5 0.67 (J.5 0.23 0.42 0,31 0.30
6^ =0.8 0.86 4.8 ^.34 0.54 0.41 0.40
A partir del Cuadro 8 se observa que los sesgos en la estimación del pará-
metro s1 del modelo IMA {1,1) pueden ser reievantes, siempre y cuando el out-
lier no sea de tipo innovacional, pues en este caso, al igual que ocurría en el
modelo AR {1 } no se produce ningún sesgo en la estimación del parámetro. En
cuanto a la relacián entre período de ocurrencia del outlier y tamaño del sesgo,
cabe destacar que en el caso del autlier LS el tamaño del sesgo será invariante
respecto al período de ocurrencia del outlier, algo que no sucedía al analizar el
modelo AR (1), mientras que el outlierAO produce el mismo sesgo salvo en el
caso en que el outlier acontece en el período correspondiente al origen de la
predicción (k=0) o en el anterior (k=1). Finalmente, obsérvese que, al igual que
en el modelo AR (1), cuanto mayor es la magnitud del outlier objeto de estudio
{Cx3 ^6a), mayor es la cuantía del sesgo.
^ : t ^ ^ t : c ^ ^ ^ r « ^ u E . ^ ^ . ^ ^ ^ t ^ > i s ^ r i N ^ r < ^ t i ^ r i E ^ ^ ^ s u ^ ^ ^ t ^ r^ _ i F, ^ x s E ^ n ^ ^ _ t ^ s E ^ K ^ ; ^ ^ i c ^ c ^ i ^ ^ ^ t i E - : ^ r ^ > F . i ^ ^ ^ , ^ ^ ^ , ^ > E - i ^ ^ ^ ; : ^ k ^ ^ ^ ^ ^ ^ > ^ ^
5.3. Ejercicio de Simulación
Con el fi n de c ompr obar s i los s es gos en las es t i mac i on es de los c oefi c i en t es
de los modelos ARIMA, c u ya apr oxi mac i ón s e ha der i vado an alít i c amen t e en Ios
dos apar t ados an t er i or es , s e c on fi r man al u t i li zar los pr oc edi mi en t os (i t er at i vos )
de det ec c i ón de out li ers y es t i mac i ón pr opu es t os en la li t er at ^ u r a, s e ha Ilevado a
c abo u n ejer c i c i o de s i mu lac i ón (2), c on s i der an do el pr oc edi mi en t o de es t i mac i ón
pr opu es #o por Chan g y Ti ao (1983) véas e t ambi én Hi llmer , Bell y Ti ao (1983),
y Chan g, Ti ao y Chen (1988j , qu e s e en c u en t r a di s pon i ble en el pr ogr ama i n -
for má#i c o SCA (Sci ent i fi c Comput i ng As s oci at es ), ver Li u y Hu dak (1986) (3}.
Par a ello, s e ha c omen zado s i mu lan do u n a s er i e t empor al de 100obs er va-
c i on es c or r es pon di en t es a modelos ARIMA, c on c r et amen t e los modelos AR (1)
e IMA(1, 1), afec t ada por u n out li er (de t i po AO, 10, LS o TC), en u n per íodo de-
t er mi n ado; c on c r et amen t e s e ha c on s i der ado qu e la oc u r r en c i a del out li er t i en e
lu gar o bi en en el or i gen de la pr edi c c i ón (k =0), o bi en en u n per íodo (k =1) o
di ez per íodos (k =10) an t es del or i gen de la pr edi c c i ón . E n c u an t o a la i n n ova-
c i ón , at , és t a s e ha gen er ado s u pon i en do qu e s i gu e u n a di s t r i bu c i ón n or mal c on
medi a c er o y var i an za 0. 1.
Un a vez s i mu lada la s er i e s e ha pr oc edi do a efec t u ar la es t i mac i ón de los
par ámet r os de los modelos ARIMAgen er ador es , t an t o t en i en do en c u en t a la
pr es en c i a de u n out li er del mi s mo t i po y en el mi s mo per íodo de c omi en zo en el
qu e afec t a a la s er i e en c u es t i ón , c omo i gn or an do la pr es en c i a del out li er,
Las es t i mac i on es en ambos modelos {c on y s i n t r at ami en t o de out /i ers ) s e ha
r eali zado eli mi n an do las di ez pr i mer as obs er vac i on es de las s er i es gen er adas (as í
pu es , t oman do c omo t amaña mu es t r al T=90). La r azón de eli mi n ar los dat os r efe-
r i dos es t r i ba en qu e de es t a man er a s e logr a s u avi zar el efec t o qu e la elec c íón de
la s emi i la gen er ador a de la s er i e t r an s mi t e a los pr i mer os dat os gen er ados .
E I mi s mo pr oc es o des c r i t o s e ha r epet i do 100vec es (4) par a c ada u n a de
las pos i bles c ombi n ac i on es r es pec t o a valor es de los par ámet r os de los mode-
los , c oefi c i en t es del out li er, t i pos de out li ers y per íodo de oc u r r en c i a de los mi s -
mos . E n c on c r et o, y t oman do s i empr e 6á =0. 1, s e han c on s i der ado las s i gu i en -
t es pos i bi li dades : ^ 1 ={0. 2, 0. 5, 0. 8}, 61 ={0. 2, 0. 5, 0. 8}, c ^ _ {2, 3}, Ti pos de
out li ers ={AO, 10, LS, TC} y k ={0, 1, 10}.
Los valor es medi os de las es t i mac i on es de los par ámet r os del modelo AR (1)
obt en i dos a par t i r del ejer c i c i o de s i mu lac i ón c omen t ado s e adju n t an en los c u a-
dr os 9a12.
(2) E I au t or des ea agr adec er la ayu da pr es t ada por Pablo Gar c ía en el ejer c i c i o de s i mu lac i ón
qu e s e pr es en t a en es t e apar t ado.
(3) Otros procedimientos (iterativos) de detección de outliers y estimación propuestos en la li-
teratura son ios de Tsay (1986), y Chen y Liu (1993).
(4) Au n qu e s e es c on s c i en t e de qu e 100s i mu lac i on es pu eden s er poc as y qu e, gen er almen -
t e, c on vi en e hac er al men os 500par a poder obt en er c on c lu s i on es , en el pr es en t e t r abajo hemos
man t en i do es t e n úmer o li mi t ado de s i r n u lac i on es por c u an t o, c omo ver emos més adelan t e, és t e es
s u fi c i en t e par a c on fi r mar los r es u lt ados an alít i c os der i vados en los apar t ados 5. 1 y 5. 2.
E.ti l Al^l^ l l( ^1, E^.Sf'Atit )1.,^^
Cuadro 9
ESTIMAClONES MEDIAS DE LOS PARAMETROS DEL MODELO AR (1 }
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. ©UTLIER AO
Outlíer en el Out/ier un período ^utlierdiez períodos
el origen de la antes de! origen antes de! origen
predicción de la predicción de la predicción
(k = 0) (k - 1) (k = 10)
^ Q2 ^^ ^^2 ^ ^2 ^^ á^2 ^ ^2 ^^ ^^2
1 a 1 a 1 a 1 a 1 a 1 a
csa-0.1;c^=2
^, = 0.2 0.18 0.10 0_ 18 0.14 0.21 0.09 0.14 0.14 0.19 0.10 0.13 0.14
c^^ = 0.5 4.50 0.10 0.50 0.14 0.49 0.09 0.37 0.15 0.50 0.09 0.37 0.15
q ^^ = 0.8 0.79 0.10 0.79 0.14 0,79 0.10 0.68 0.17 0.79 0.10 0.68 0.17
aá=0.l;c^=3
c^, = 0.2 0.19 0.10 0.22 0.20 0.19 0.10 0.11 0.21 0.19 0,10 0.09 0.21
c^^ = 0.5 0.48 0.10 0.48 0.20 0.47 0.10 0.27 0.21 0.47 0.10 0.26 0.21
c^, = 0.8 0.79 0.10 0.80 0.20 0.79 0.10 0.57 0.24 0.79 0.10 0.57 0.24
Cuadro 10
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO AR (1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER 10
Outlier en el Outlier un período Outlier diez períodos
el origen de la antes del origen antes del origen
predicción de la predicción de la predicción
(k = 0) (k = 1) (k = 10)
^ ^z $^ áf2 $ á2 $^ 6+ 2 $ a2 $' a#2 1 a 1 a 1 a 1 a 1 a 1 a
cs^-0.1;c;^=2
^1 = 0.2 0.18 0.10 0.18 0.14 0.20 0.10 0.20 0.14 0.19 0.10 0.19 0.14
^^= 0.5 0.50 0.10 0.50 0.14 0.50 0.10 0.50 0.14 0.50 0.10 0.49 0.14
cpi = 0.8 0.79 0.10 0.79 0.14 0.80 0.10 0.79 0.14 0.80 0.10 0.70 0.14
aá=0.l;cv=3
^^= 0.2 0.19 0.10 0.22 0.20 0.20 0.10 0.20 0.20 0.20 0.10 0.19 0.20
^^= 0.5 0.48 0.10 0.48 0.20 0.50 0.10 0.49 0.20 0.49 0.10 0.48 0.20
^^= 0.8 0.79 0.10 0.80 0.20 0.80 0.10 0.79 0.20 0.80 0.10 0.79 0.20
F^:F^E:C°1()S [>F^ l.()^ Ulti'^.^N"1^()^ .1.^E^()ti f)k^. ^il'1IJF/l.S ^:^i L_A^ f'^t}.:l)I('('I()^.F ti l7E l.^)^, 1^1(71)I l^,ti ^klti1^^
Cuadro 11
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO AR (1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER LS
Ouilier en el Outlier un período Outlier diez períodos
el origen de la antes del origen antes del origen
predicción de la predicción de la predicción
(k = 0) (k = 1) (k = 10)
n n2 n, n.^ n n2 n, n.2 n n2 n, n.2
^1 aa ^1 aa ^1 aa ^1 ^a ^1 aa ^1 6a
a^=0.1;c;^=2
^, =
^ 1=
^^ =
0.2
0.5
0.8
0.18
0.50
0.79
0.10
0.10
0.10
0.18
0.50
0.79
0.14
0.14
0.14
0.20
0.49
0.79
0.10
0.10
0.10
0.45
0.63
0.82
0.16
0.15
0.15
0.17
0.48
0.77
0.10
0. 09
0.10
0.85
0.88
0,96
0.20
0.17
0.21
6á=O.1;cu-3
^^ = 0.2 0.19 0.10 0.22 0.20 0.18 0.10 0.59 0.24 0.18 0.10 0.92 0.27
^^ = 0.5 0.48 0.10 0.48 0.20 0.44 0.10 0.71 0.21 0.44 0.10 0.94 0.23
^^ = 0.8 0.79 0.10 0.80 0.20 0.77 0.10 0.84 0.20 0.77 0.10 0.96 0.21
Cuadro 12
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO AR (1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTL/ER TC
Out/ier en el Outlier un período Outlier dieZ períodos
el origen de la antes del origen antes del origen
predicción de la predicción de la predicción
(k = 0) (k ^ 1) (k = 10)
n n^ n, n ♦ ^ n, n/^ n R n•l] n n^ n• n. ./^
^j ^.a ^1 6a1 ,Yj 6La ^1 ^aL ^1 ^.a ^1 ^aL
aá=0.l;co=2
^ y= 0.2
^^ = 0.5
^^ = 0.8
0.18
0.50
0.79
0.10
0.10
0.10
0.18
0.50
0.79
0.14
0.14
0.14
0.20
0.49
0.79
0. 09
0.09
0.10
0. 36
0.55
0.78
0.15
0.14
0.14
0.18
0.48
0.78
0.10
0.10
0.10
0.42
0.57
0.77
0.16
0.14
0.14
6a -0.1;co-3
^^ = 0.2 0.19 0.10 0.22 0.20 0.18 0.10 0.45 0.22 0.16 0.10 0.51 0.22
^^ = 0.5 0.48 0.09 0.48 0.20 0.44 0.10 0.58 0.20 0.42 0.10 0.61 0.20
^^ = 0.8 0.79 0.10 0.80 0.20 0.78 0.10 0.76 0.20 0.77 0.10 0.74 0.20
^}`^ t-_ti^1^^^1^l^ti I^I(',^ F tiF'^Atitil ;^
Para interpretar dichos cuadros debe tenerse en cuenta que denotamos por
^^ y csá !a media de las estirnaciones de los parámetros ^^ y csá que se obtiene al
modelizar correctamente el modelo con outliers; mientras que denotamos por c^^
y áá la media de las estimaciones de los parámetros respectivvs que se obtie-
nen al especi#icar, incorrectamente, un modelo AR (1) sin outlíers.
Comparando los resultados de los Cuadros 9 a 12 con los del Cuadro 7,
puede apreciarse cómo se canfirman los resultados teóricos obtenidos en el
apartado 5.1. En concreto, las principales conclusíones que pueden extraerse
son ias siguientes:
a) Para todos los tipos de outliers los valores medios de las estímaciones
de los parámetros ^^ y aá cuando ei modelo se especifica adecuadamente son
prácticamente iguales a los valores de !os parámetros utilizados en el proceso
generador de datos.
b) En caso de especificación incorrecta del modelo, no tratamiento de out-
liers, el parámetro ^, se estima de manera incorrecta con carácter general, salvo
cuando ei outlier ocurre en el origen de la predicción (k=o), o cuando es de tipo in-
novacional. Así pues, ante outliers AO, LS o TC que ocurren en períodos previos al
del origen de la predicción se producen importantes sesgos en las estimaciones
del coeficiente ^^, que pueden llegar a ser muy importantes si el outlier es LS y el
verdadero valor del parámetro ^^ es pequeño.
c) Para cualquier tipo de outliers, e independientemente de cuándo se origi-
nen los mismos, los sesgos en la estimación del parámetro 6á, cuando el modelo
omite 1a inclusión de los outliers, son muy elevados. En efecto, en el caso de
c^^ = 3, en todas las situaciones analizadas se obtiene un valor medio de la esti-
mación de csá que es más del doble del verdadero valor del parámetro.
La aplicación del e^ercicio de simulación referido al modelo IMA (1,1) origina
los valores medios de las estimaciones de los parámetros que se adjuntan en
los Cuadros 13 a 16.
De manera análoga al caso del modelo AR {1) denotamos mediante ^^ y ^sá
la media de las estimaciones de los parámetros e1 y aá que se obtienen al mo-
delizar correctamente el madelo con outliers, y mediante 61 y 6á las medias de
las estimaciones de los parámetros respectivos obtenidas al especificar, inco-
rrectamente, un modelo I MA (1,1) sin outliers.
AI igual que en el caso anterior, en el proceso fMA (1,1 } los Cuadros 13 a 16
confirman !os resultados teóricos obtenidos en el apartado 5.2, y que se resu-
m ían en el Cuadro 8, pudiendo afirmar:
a) Como en e! caso del modelo AR (1), para todos los tipos de outliers, y
cualquiera que sea su período de acurrencia, las estimaciones medias de los
parámetros 6^ y aá cuando ei modelo se especifica correctamente son práctica-
F^.F-f^:(°^O^ l)F^.: LOti I)IS"I'Iti"(c)^ I If'OS 1)F; (1('7L/f:K.1 t•^ti l..^ti F'FZEF)I('('I( ^ `F.^ !>f. 1,Oti ^1O1)I l(^^ ,^k1ti1.^^ -^^/
Cuadro 13
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO IMA (1,1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER AO
Outlier en el Outlier un período Outlier diez períodos
el origen de la antes det origen antes del origen
predicción de la predicción de la predicción
(k = 0} (k = 1) (k = 10)
n ^ n^ n, n n n^ n. n n n. n.
6^ 6á 9^ 6á 8^ aá H 1 aá e^ aá 8^ 6á
c^á-0.1;w=2
81 =
8^ =
8^ =
0.2
0.5
0.8
0.22
0.49
0.79
0.10
0.10
0.10
0.21
0.48
0.78
0.14
0.14
0.14
0.19
0.49
0.79
0.10
0.10
0.10
0.41
0.61
0.82
0.16
0.15
0.15
0.21
0.49
0.79
0.10
0.10
0.10
0.40
0.60
0.83
0.17
0.15
0.15
a^-0.1;w=3
81 = 0.2 0.20 0.10 0.18 0.20 0.19 0.10 0.51 0.24 0.19 0.10 0.50 0.25
8i = 0.5 0.52 0.10 0.50 0.20 0.51 0.10 0.61 0.21 0.51 0.10 0.69 0.22
8^= 0.8 0.79 0.10 0. 77 0.20 0. 79 0.10 0. 83 0.20 0. 79 0.10 0.86 0. 21
Cuadro y 4
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO IMA (1,1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER 10
Outlier en ei Outlier un período Dutlier diez períodos
el origen de la antes del origen antes del origen
predicción de la predicción de la predicción
(k= 0) (k= 1) (k= 10)
n n
2
9^ 6a
á'2
a
n
8 ^ á2
a
n.
A ^
n
a
a
n
E^^ ^ ^
a
n
e;
^R^
a
aá-0.1;w=2
H ^ = 0.2 0.22 0.10 0.21 0.14 0.20 0.09 0.20 0.14 0.22 0.10 0.21 0.14
E^ i= 0. 5 0.49 0.10 0.48 0.14 0.49 0.10 0. 49 0.14 0. 50 0.10 0.50 0.14
H 1 = 0.8 0.79 0.10 0.78 0.14 0.79 0.10 0.79 0.14 0.80 0.10 0.79 0.14
6á=0.1;w=3
91 = 0.2 0.20 0.10 0.18 0.20 0.21 0.10 0.20 0.20 0.22 0.10 0.21 0.20
81 = 0.5 0.52 0.10 0.50 0.20 0.52 0.10 0.51 0.20 0.53 0.10 0.51 0.20
H ^ = 0.8 0.79 0.10 0.77 0.20 0.79 0.10 0.78 0.20 0.80 0.10 0.80 0.20
51)
t.^ ^:^tii^f^ i^^c^,^^ t^tit^,^ti^^^t ^^
Cuadro 15
ESTIMACIONES MEDIAS DE LOS PARAMETROS DEL MODELO
IMA (1,1)
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACION. OUTLIER LS
Outlieren el Outlier un período Outlier diez períodos
e! origen de la antes del origen antes del origen
prediccíón de la predícción de la predicción
(k = 0) (k = 1) (k = 10)
^ ^ ^
^ n
^
^
81 6á H^
^.
(S^ H^
^
6a e;
6'2
a
2
aa e1
6' 2
a
cs^=0.l; c^=2
e^ = 0.2 0.22 0.10 0.21 0.14 0.19 0.10 0.13 0.14 0.22 0.10 0.15 0.14
6^ = 0.5 0.49 0.10 0,4$ 0.14 0.50 0.10 0.34 0.15 0.50 0.10 0.32 0.15
E ^^ = 0.8 0.79 0.10 0.78 0.14 0.79 0.10 0.57 0.16 0.80 0.10 0.45 0.17
a^; =0.1; cu-3
8^ = 0.2 0.20 0.10 0.18 0.20 0.20 0.10 0.10 0.21 0.20 0.10 0.11 0.21
H^ = 0.5 0.52 0.10 0.50 0.20 0.52 0.10 0.24 0.21 0.52 0.10 0.23 0.21
e^ = 0.8 0.79 0.10 0.77 0.20 0.79 0.10 0.37 0.23 0.80 0.10 0.32 0.24
Cuadro 16
ESTIMACIONES MEDIAS DE LOS PARAMETRC)S DEL MODELO IMA (1,1}
OBTENIDAS A PARTIR DEL EJERCICIO DE SIMULACiON. OUTLIER TC
Outlier en el Outlier un período Outlier diez períodos
el orígen de la antes del origen antes del origen
predicción de la predícción de la predicción
(k = 0} (k = 1 } (k = 10)
A
h ^. /^. ^ A ^. N. ^ /^ ^ n.
C T á 81 C sá 8^ E iá Qi C i^ e^ C sá 6^ +6á
rsá=0.1;u^=2
6^ = 0.2 0.22 0.10 0.21 0.14 0.19 0.10 0.23 0.14 0.22 0.10 0.22 0.14
H^ = 0.5 0.49 0.10 0.48 0.14 0.50 0.10 0.45 0.15 0.49 0.10 0.36 0.15
9^ = 0.8 0.79 0.10 0.78 0.14 0.79 0.10 0.61 0.15 0.79 0.10 0.50 0.16
6a=0.1; cu=3
e^ = 0.2 0.20 0.10 0.18 0.20 0.20 0.10 0.26 0.21 0.20 0.10 0.22 0.21
81 = 0.5 0.52 0.10 0.51 0.20 0.52 0.10 0.44 0.21 0.52 0.10 0.31 0.21
6^ = 0.8 0.79 0.10 0.77 0.20 0.79 0.10 0.53 0.22 0.79 0.10 0.39 0.22
E=.t^^t-.c'"I^OS f)l^ L(^S UIS"f^^IN^^'(^S I^^IP<JS UE: t)l1^LL/f^R.^^ E^*^ l_.•^S I'FtE^-.l^t("('I^^tit^.^, L^it-_ Lt^^ ti1t^I>t I ^^ti .^^klti1,^
mente iguales a los valores de dichos parámetros utilizados en el proceso gene-
rador de datos.
b) Cuando el modelo se especifica sin tener en cuenta los outliers, las con-
clusiones respecto a las estimaciones de 9^ son análogas a las que señalába-
mos al analizar las estimaciones del parámetro ^^ en el modelo AR (1 }. En efec-
to, la estimación de 81 tiene sesgos elevados, salvo cuando el outlier es de tipo
innovacionai, o bien siendo AO, LS o TCtiene lugar en el instante correspon-
diente al origen de !a predicción.
c) Finalmente, al iguai que en ei análisis del modelo AR (1), cualquiera que
sea el tipo de outlier que acontezca y el período de ocurrencia del misrno, se
producen sesgos ( positivos} muy elevados en la estimación del parámetro aá
cuando ei modelo especificado no tiene en cuenta la presencia de los outliers,
siendo las cuantías de estos sesgos similares a las correspondientes en el mo-
delo AR (1).
Obsérvese que, dada la relación directa existente entre la varianza del ruido
blanco (crá) y las varianzas de los errores de predíccíón, estos sesgos positivos
detectados indican que todos los outliers considerados producen un incremento
en la amplitud de los intervalos de confianza de las predicciones.
6. CONCLUSIONES
En el presente trabajo se ha investigado el grado de incidencia «mínima»
--en el sentido de que suponemos que los coeficientes de los modelos ARIMA
son conocidos, obviando, por tanto, en primer término otro de los problemas
más importantes que origina el no tratamiento de las observaciones atípicas, y
que consiste en los sesgos que produce en las estimaciones de los coeficientes
del model0 que en la exactitud de las predicciones puntuales obtenidas a par-
tir de los procesos ARIMA, medida por el error cuadrático medio de la predic-
ción, tiene la ignorancia (no tratamiento) de observaciones atípicas (outliers) en
la serie temporal objeto de análisis.
La conclusión definitiva que podemos extraer es que los efectos que se pro-
ducen en la calidad de las predicciones pueden ser importantísimos, si bien el
grado de incidencia depende del tipo de outlier que aparezca, del período tem-
poral {rnás o menos cercano al del origen de la predicción) en que tenga lugar,
del horizonte temporal (períodos hacia adelante) para el que efectuemos la pre-
dicción, de la propia magni#ud del outlier y del tipo de proceso estocástico sub-
yacente a la serie temporal.
En este sentido, y con carácter general, hernos obtenido que para todo pro-
ceso estocástico y tipo de outlier (con la excepción del 10), se cumple que el in-
f^, I^lt )(ti f f( ;0 f tif'.^,ti( )t ^l
cremento en el error cuadrático medio de !a predicción (lECM) ariginado como
consecuencia de no tratar la presencia de outliers en la serie temporal, es ma-
yor cuanto mayor es la magnitud concreta de la observación atípica {c^/csa).
Cualquier atro tipo de conclusión que queramos extraer va a depender del
típo de outlier y proceso estocástico que esternos considerando. Así, si bien se
observa con frecuencia que !a incidencia en la predicción del no tratamiento de
los ou^tliers va a ser menor cuando éstos aparezcan en períodos alejados al del
comienzo de las predicciones {esto es, a medida que aumenta k, menor es
IECM), esto no se cumple ni en e! caso de outliers LS, cuando el proceso esto-
cástico en cuestión es AR, ni en el outlierTC cuando el proceso es IMA.
Por último, #ambién se ha analizado teóricamente y mediante un ejercicio de
simulación el efecto que los distintos tipos de outliers producen sobre las estí-
maciones de los parámetros de los modelos ARIMA. Se abtiene que, salvo en el
caso de los outliers 10, los sesgos en !as estimaciones de los coeficientes auto-
rregresivos o de rnedias móviles que produce una específicación errónea del
modelo (es decir, ai estimar como si no hubiera outliers cuando estos existen),
pueden Ilegar a ser muy elevados, salvo que los outliers acontezcan en el ori-
gen de la predicción. Además, el ejercicio de simulación permite afirmar que
para todos los outliers considerados (incluidos los de tipo innovacional) la errá-
nea especificación referida produce un sesgo positivo elevado en la estimación
de la varianza del ruido blanco del modelo, lo que indica que los outliers ocasio-
nan un incremento importante en la amplitud de los intervalos de confianza de
las predicciones.
APENDICE
Prueba de [25]
Teniendo en cuenta [17], [24] será igual a:
^ _
y t t , + k ( I ) - - 1 L i r ^
(Zr^+k + Ctl^k) + n^^^ (
+k-1 + W^k-1 ) + ' ' ' +
+ 7^ k^^ ( Zt^+ 1 -F - {^^ 1 ^ + ^ ^k+ 1 ( Zr -+- (^t}) -f ?L ^k+2
Z f^ .^ -#- . . . _
k+1
^ ^j11 ^k j+1
^ siendo ^o =1
^=1
Luego:
^ I
yt„+k+l Yt^+k ( ^ -
n k+1
/ _
t„+k+! + ^^k+l ^ zt,;+k {n + ^ ^ ^Í ^k-%+1 -
^-1
k+1
= et^,+k ^ ^ + c^ ^k+^ - ^
^^^1
^. `
^ k-j+ 1
^= t
^^:F^t:('"f^C)S f)E^^: l_Oti f)iS^I^(N'1^Oti ^ fIPOti E ) f ^ , ^)('7Lll^;k.S F-:N L.,^ ^ S PRF:t^I(^('1Otii=:ti 1)F^ l(^^ ti1OI)F l^^`^ ^^I^1ti1A ^.^
siendo:
/ ^ _ / ^ ^ / ^ _
et^+k ^'1 - Zt„+k+l ^'J - Ztn+k ^'J `
Prueba de [29]:
k+l + ^1 af^,+k+E-1 + "' +^l-1 at,+k
Teniendo en cuenta [18], [20] será igual a:
yt,,+k ^'1- ^ j/) ^ Zt^ +k -
^ - (^ ^ -^ 1C^tj ^Zt
+k- 1+(^ ^ +
+TLkI) ^Zt+1
+ (ll)} ^- ?L^k+1
^Zt, +
(tJ^ + ?L{t^+2
n k+1
= Zt,;+k ^^
+GJ 1L j
^ ^ ' ^
^ =1
Luego:
+
k+1
yt„+k+l yt^,+k ^'` `" Zto+k+l + w- Zf^ +k ``1 + ^ .,.r ^^l) -
^^ ^ l
k+1
- et.+k
( n + (,^ 1
- ^ n(^)
j^ 1
Prueba de [32] :
Teniendo en cuenta [19], [20] será igual a:
^ n _
yt<^+k ^'1-- 7L ^I ) ^Zto+k +
(^ t^ k) + 1L 2I ) ^Zt^+k-1 + c^t^k-1 ^ + .. . +
+ TL kI ) ^ Zto+1
+(^ tS} +7L^ k+1^ Zto +t1^ ^ +TC^ k+2 Zta- 1+... _
k+1
= Z +t^ ^ 7L^ ^ )
Sk-j +1
t„+k ^ ^ /
/ =1
Luego :
n n
^ta+k+l yt^+k ^'` `
k+1
^ ^ l) ^
Zt^+k+l + ^Sk+l - Zt +k l l^ + ^
J^ll
^k-'+l
l'1 j =1
k+1
E + (.^
^k+l .._, ^` ^^l) sk-j+l
t^,+k ^ I J L _• 1r l
l
Prueba de [45] :
A parti r de [42J :
1
k+1
1 [ ^ ^ ^ + 1 ^ ^ ^ ^ +... +l C ^ ^ k
+1 -
5-^ E^ r^^[ ^[s t tc ;^ t-:^
( 1
,;
tic ft.r^
-H1}+E^?(1 -E^^)+...+8^(1
81)(1 +81 +8?+...+6^`}=(1 -
Luego;
Prueba de [46
k+1
1 - ^ ^(I) ^ 1 _/^ - ^1+1) !ek+1
I
l
^- ^
Teniendo en cuenta [42], se obtiene:
k+ 1
^ ^^!) ^k- j+ 1 i
7L ^l^bk + ?L^/)^k-1 +
1 - ^
^^^^s +^^^+,
^1)Sk +^1(1^ ^1)^k-1+... +8^ -1( ^ - 8j )^
_(1_8,){^Sk ,} e1^k-1+... +^,^-1(i +^^) _
e k+ 1
bk - 1
^
1
E 3 y
s
Luego:
k+1
^ _^ n ^^^ sk ;+^
/=1 !
}
(Sk+1_8i +1}
(^k+^ _e; ^1)
(S - ^^ )
)
Prueba de la esperanza matemática de las expres^ones del numerador y
denominador de [50] para los diferentes tipos de outlíers:
Outlier AO
Teniendo en cuenta [1 f], y dado que por [1 ] hemos supuesto que E(zt )= 0,
podemos escribir:
r
E ( ^ y t Y r
r- 2
i )
E(z2z^ ) + ... + Etzr, ^ zto_2) + E [(zr +
w)z^^^_f]+
+ E [zt,^+1(zrG+ w}] + E{zr,+2zr+1) + ... + E{zto+k zr^+k-^
} = { T - 1}7i
T
E(^ ^_^ ) = E(z1) + ... + E{zt, ^ ) + E [{zt,+ w)2] + E(zr+1) +
t=2
+... +E(z^
+k-1 ^ _ { T -
1 )y o + w2 , para k > 0
F^:}^f^:("fC)^ [)F^•: !.O^ I:>1^"C^IN'i^Oti "I^lPt)S U}•: I"Jl,^ll_1FR_S ^-^^ I.AS F'RF:llI("(^Ii1tiF^.^ 1)F^ 1.(^ti \^1^y1)1 ^ d ^ ti ^1k1^1^^,
Outlier IO
De manera análoga al caso anterior, pero teniendo en cuenta [17], se obten-
drá para k > 0:
T
E( ^ yt yr_^ ) = ( T - 1)y^ + c^2^^ + c^ z` Y2` ^ 1 + . .. + t^a2i^k`Nk_^ _
t^ 2
_ ( r- 1) y1 + c^2
k
^ `^i ` N^ .^ , COn ` ^ a = 1
, _,
T
E(^J^-1)=(T-1)yo+c^2+c^2`Y?+c^2iN2+...+c^2^k ^ _
t=2
k-1
=(T--1)Yo+c^2 ^^? , con^o=1
C)utlíer LS
Considerando [18], se obtiene para k> 0:
r
E ( ^ y r y t _, ) _( T- 1) y^ + kw2
t-2
Dutlier TC
T
E( ^^- i)_( T--
1) yo + kc^2
r=2
Teniendo encuenta [19], y para k> 0:
r
E( ^ yfyt-1 ) _ ( T - 1 )^1 + (^ 2S + (^ 2tS3 + (^ 2Ó5 + ... + C^ J2S2k^ 1 =
t=2
r
E( ^ ^ , )
t=2
2 (1 - S2k)
_( T-- 1)71 + c^ b 1_ S2
( )
T-- 1) 70 + c^2 + cu2b2 + c^2ó4
- T - 1 + c^2 (1
b2i
( )yo 1 _ S2
( )
. , . + W2S2k-2
Prueba de las expresiones del numerador y denominador de [57]
para los diferentes tipos de outliers:
Outlier AO
A partir de [16]:
r
E( ^ ^Yr ^yr-1) _ ^ ( z2 -- z, ) ( z, - zo ) ]
t=2
^tZ3` Z2) 1z2 - z1)] +
f i f ^ F , , ^ ^ 1 AI)I^ ^ f i(';^ E-^ F '^ 1 ^ , ;t )L, ^ :
+ ... + ^[^Zt --1 ^- Zt _2^^Z1 _2 ^
Zf _3^ ] +^ ^ Zr
+ tt) - Zt_1 ^(Zt -1 - Zt,---2)] +
+ ^(Zr,#^ ^ Zl, -^^(Zt„ + (1J -- ^Zt,-1 )^ + ^(Zt.^+2 ^ Zt,.+1 }(Zt„+
+`^ ( Z1 ^ , +3-` 2to+2) ( Zt, +2
1 }] +... -1 -
^(Zt^+k - zt^,+k-1)(Zt„+k-1 ^ Zt„+k-2)] `
=(T-1)y^-c^^ , parak>0
r
E( ^ (DYr_ ^ )^ ) = E{ z1 -- zo } 2 +E{ z2 - z^ ) 2 + . . . + E( zto_
^ -^
+^(zr +w - Zr.-^ )^] +^(Zr,+
}2]
+ E(z
)
+ E(zt +k_^ -- zr, +k_2)2 =
(
T - 1 )yo +2cu2 , para k > 1
©utlier 14
De manera anáioga, teniendo en cuenta [17], se obtiene;
r
E(^ L1yt ^1yr_1 ) ` { T - 1)Y^ + c:^^[(`^^- 1) + (`^2 -- `Y1}(^2 --- 1) +
r -2
+... +(^ k
-1 } (^ k-1 - ^ k-2)^
Y como por [42] ^1=1 -- 6^ para j>_ 1, se cumplirá que `f', -- 1=- e j
`^r^ =0 para j >_ 2. En consecuencia, para k>0, puede escribirse:
T
E( ^ tlyr 1S yt_ i)_( T
t=2
1 ) ^ y1
Por otra parte, para k>1 se obtiene:
T
E( ^ (Dyt_i )2) _( T - 1 )yo +
w2 j1 + (`^ 1
r-2
( ^ f'2 - `.3'
-t` {^ k-1 - ^ k-2}2^ _( T - 1 )ip+(^ 2 (1 +^ ^ )
Outlier L^
A partir de [18] se obtiene:
T
E{ ^ ayr ^1yr-^ ) _ ( T - 1 )y1
t=2
)
T
E( ^(dyr_1}2)
_( T-- 1)1^0 + ua2, para k>4
r=^
l.I;F^('^TOS I)f•; I.OS I)I^^f1N"1^Oti "I^1P^)S [)E ral'7Zl^^^k1 r.N Lr^S f'Ft^^.l)I(^f'I^^tik-^ [>E- l^ ­ ^ ^1(rl>Fl ^^ti ^^k1ti1,^ ^ ^
Outlier TC
Teniendo en cuenta [19J, y para k> 0:
r
E( ^ aYr aYt- ^)=( T--
1) Y^ + c^2 ( b-
r = 2
1}+ c^2b{b - 1)2 + t^2cS^(b -- 1)^ +
+ ... + ao2Ó2k^3(S -- 1 )2 =l T-- 1 )^1 + GJ2b(^ - 1 ) [l 1 + S2k-11 I (1 +t^}]
T
E(^ (Dyt_^ )^ ) _ ( T - 1)yo+ cu2 + [ c ^ ( b - - 1 } ] 2 + [ c ^ S ( S - - 1 ) J 2
r = 2
+ [c^b2(b- 1)]2 + ... + [c^bk-z(s_ 1)J2 ^
- { T-- 1)yo+ c^^2 { 1 + [(1 - b) { 1 - b2^k^1 ^) / (1 + b)J}
REFERENCIAS BIBLIOGRAFICAS
AZNAR, A., y TRívEZ, F. J . ( 1 993) : Métodos de Predicción en Economía. Vol. 2:
Análisis de Series Temporales, Editor ial Ar iel, Bar c elona.
BALKE, N. S. (1993): «Detecting Level Shifts in Time Series», Journal of Busi-
ness and Economic Statistics, 11, 81-92.
Box, G. E. P., y JENKINS, G. M. (1976): Tíme Series Analysis: Forecasting and
Control (Second Edition), San Francisco: Holden Day.
CHANG, I., y TiAO, G. C. (1983): «Estimation of Time S er ies Par ameter s in the
Pr esenc e of Outliers», Technical Report, 8, University of Chic ago, S tatistic s
Resear c h Center .
CHANG, I.; TiAO, G. C., y CHEN, C. ( 1 988) : «Estir nation of Time S er ies Par ameter s
in the Pr esenc e of Outlier s», Technometrics, 30, 1 93- 2 04.
CHEN, C., y L^u, L. M. (1993): «Joint Estimation of Model Parameters and Outlier
Effects in Time Series», Journal of the American Statistica/ Association, 88,
284-297.
CHEN, C.; Liu, L. M., y HUDAK, G. B. ( 1 990} : «Outlier s Detec tion and Adjustment
in Time S er ies Modeling and For ec asting», Working Papers Series, S c ientific
Computing Assoc iates.
CHEN, C., y TiAo, G. C. ( 1 990) : «Random Level- S hift Time S er ies Models,
ARIMA Appr oximations, and Level- S hift Detec tion», Journal of the Business
and Economic Statistics, 8, 83- 97.
HI^LMER, S. C. (1984): «Monitoring and Adjusting Forecast in the Presence of
Additive Outliers», Journal of Forecasting^ , 3, 205-215.
^ñ ^-.SI:^UIS t^l("a F^-Sf'^ti'O1_:1
HtLLMER, Si. C.; BELL, W. R., y TiAO, G. C. (1983): «Modeling Considerations in
the Seasonal Adjustement of Economic Time Series», en Applied Time Se-
ries Analysis of Economic Data, A. Zellner (ed.), Washington D. C.: U. S. De-
partment of Commerce Bureau of the Census, 74-100.
LEDOLTER, J. (1989): «The Effect of Additive Outiiers on The Forecast from
A R I MA Models =_ , International Journa/ of Forecasting, 5, 231-240 .
Liu, L. M., y HuoAK, G. B. (1986): The S^A Statistical System. Reference Manual
for Forecasting^ and Time Series Analysis, Dekalb, Scientific Computing As-
sociates.
Mi^LS, T. C. (1990): Time Series Techniques for Economists, Cambridge: Cam-
bridge University Press.
MUIRHEAD, C. R. (1986): «Distringuishing Qutlier Types in Time Series==, Journal
of the Royal Statistica/ Society, B, 48, 39-47.
PEÑA, D. (1990): «Influential Ubservations in Time Series», Journa/ of Business
and Economic Statístics, 8, 235-241.
TSAY, R. S. (1986): «Time Series Model Specification in the Presence of Out-
liers» , Journa/ of the American Statistical Association, 81, 132-141.
{1988): «Outliers, Level Shifts, and Variance Changes in Time Seríes=>, Jour-
na/ of Forecasting, 7, 1-20.
WE^, W. W. S. (1990) : Time Series Ana/ysis: Univariate and Mu/tivariate Met-
hods, Rewood City: Addison-Wesley.
SUMMARY
This article studies the degree of incidence on the accuracy of
the specific predictions obtained from the ARIMA processes {measu-
red by the quadratic average prediction error), of the leaving out of
outliers from the time series under analysis. The conclusion points to
the fact that said degree of incidence depends on the type of outliers
which occur, on the moment (more or less near to the origin of the
prediction) they appear, on the limits in the future for which the pre-
diction is enounced, on the size of the outlíer and the type of process
underlying the time series.
Key words: Outliers, ARIMA Models, quadratic average predíction
error.
AMS Classificatian.• 62M20.