Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TESIS DOCTORAL
Mtodos estadsticos en series temporales
no lineales, con aplicacin a la prediccin de
energa elica
Autor:
DEPARTAMENTO DE ESTADSTICA
Legans, Junio 2011
Agradecimientos
Durante el inicio de mi vida acadmica no fui un alumno especialmente aplicado. Por
ello, mi primer agradecimiento ha de ser para aquellos profesores que durante esos aos
creyeron en mi a pesar de mi falta de atencin y de esfuerzo y me animaron y ayudaron
para continuar. Poco a poco entre todos lograron que fuera convirtindome en mejor
estudiante.
Me gustaria agradecer especialmente su ayuda a mis directores, Daniel Pea e Ismael Snchez. La primera vez que se me ocurri la idea de realizar un doctorado y de
dedicarme a la investigacin fue durante el curso de series temporales que Daniel imparta en la licenciatura de Estadstica, por lo que a l le debo el estar hoy aqu. Adems
gracias a su sugerencia se incorpor como director Ismael que durante estos aos ha
sido una gran ayuda y un gran apoyo. En estos cuatro aos trabajando junto a ellos he
aprendido mucho como estudiante y como persona.
Tambin quiero agradecer al profesor James W. Taylor y a su entonces estudiante
Jooyoung Jeon su gran acogida y las diferentes charlas que me ayudaron a progresar en
mis inicios en la tesis durante mi estancia en la Universidad de Oxford. Asimismo me
gustara agradecer a los miembros del proyecto Safewind que con sus comentarios en
las diferentes reuniones del proyecto han ayudado a la mejora de este trabajo.
Llevo cursando titulaciones del departamento de Estadstica muchos aos: la diplomatura, la licenciatura, el mster y el doctorado, por lo que creo que puedo decir que
he aprendido algo de todos los profesores del departamento. Por ello, siempre le estar
muy agradecido a un departamento al que entr, sin saber muy bien que era eso de Estadstica que haba elegido tras la selectividad y salgo tras completar un ciclo acadmico
inimaginable para m el da que asist a clase por primera vez. Dentro de la gente que
he podido conocer en el departamento me gustara agradecer especialmente su apoyo y
amistad (y los partidos de squash) a mis compaeros de doctorado que al fin y al cabo
son las nicas personas que consiguen comprenderte durante este periodo. Adems de
llevarme un ttulo, me llevo muchos amigos, gente como Nuria, Kenedy, Henry, Sofa,
Javi, Cristina, Alberto, Leo, Gabi, etc etc etc. Entre todos ellos me gustara agradecer
especialmente a Roberto los grandes y duros momentos que pasamos durante el mster
i
ii
ndice
Lista de figuras
vii
Lista de tablas
xi
Lista de acrnimos
1
xiii
Introduccin
1.1
1.1.1
1.1.2
1.1.3
Modelos bilineales . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.4
1.1.5
1.1.6
Modelos no paramtricos . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1
1.2.2
1.2.3
1.2
1.3
Estructura de la tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
19
2.1
2.2
2.3
2.4
2.3.1
2.3.2
2.4.2
2.5
2.6
3
2.4.4
2.4.5
Contrastes de linealidad . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5.2
47
3.1
3.2
3.3
3.2.1
3.2.2
3.2.3
3.3.2
3.3.3
Intervalos de confianza de
3.3.4
3.3.5
st
. . . . . . . . . . . . . . . . . . . . . . 57
3.4
3.5
3.6
4
2.4.3
3.5.1
Linces canadienses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
3.5.2
Manchas solares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.5.3
73
Energa elica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.1
4.1.2
Notacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2
4.3
4.4
4.4.2
4.5
4.4.3
Distribucin Beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.4.4
4.4.5
Comprobacin de la estimacin . . . . . . . . . . . . . . . . . . . . . 90
4.5.2
4.6
4.7
4.8
105
5.1
5.2
5.2.2
5.2.3
5.3
5.4
5.5
Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6 Contribuciones de la tesis
125
Referencias
129
vi
Lista de figuras
1.1
2, a0
(2)
(1)
= 0, a0
= 3, a1
1.
. . . . . . . . . . . . . . . . . . . . . . . . . .
1.3
(2)
= :8, a1
= (2; 1),
= 1. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4
1.5
1.6
= :8,
:5 y
1.
. . . . . . . . . . . . . . . . . .
no lineales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.7
1.8
1.9
3.1
3.2
3.3
3.4
3.5
. . . . . . . 25
. . . . 63
obtenida empleando
Aut-ARLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.7
3.8
3.9
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.17 Comparacin entre los percentiles obtenidos al evaluar la senda de densidades predictivas estimadas en 5 parques elico empleando diferentes
distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
5.1
Estimacin adaptativa de un modelo TV-AAR(1) sobre la potencia ordenada de acuerdo al incremento del primer retardo . . . . . . . . . . . . . . 108
5.2
Estimacin adaptativa de un modelo TV-AAR(1) sobre la potencia ordenada de acuerdo a su primer retardo. . . . . . . . . . . . . . . . . . . . . . . 109
5.3
Estimacin adaptativa de un modelo TV-AAR(1) sobre la potencia creciente ordenada de acuerdo a su primer retardo . . . . . . . . . . . . . . . 110
5.4
5.5
ix
Lista de tablas
3.1
Medidas para comparar los lmites empricos con los asintticos empleando 1000 rplicas del modelo 3.27 para diferentes tamaos muestrales . . 60
3.2
Tasa de deteccin para diferentes contrastes en datos generados empleando el modelo (3.27) para diferentes valores de
3.3
. . . . . . . . . . . . . . 61
3.4
63
Modelos propuestos por Tsay, Tong y Aut-ARLS con sus respectivos AIC
y BIC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.5
Modelos propuestos por Tsay, Tong y Aut-ARLS con sus respectivos AIC,
error medio absoluto y raz del error cuadrtico medio. . . . . . . . . . . . 70
3.6
5.1
Media de la raz del error cuadrtico medio para los 31 parques elicos
horarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.2
Valor relativo de la raz del error cuadrtico medio obtenido para los 31
parques elicos horarios.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.3
Media del error absoluto medio para los 31 parques elicos horarios. . . . 119
5.4
Valor relativo del error medio absoluto obtenido para los 31 parques elicos horarios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
5.5
Media de la raz del error cuadrtico medio para los 19 parques elicos
15 minutales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
5.6
Valor relativo de la raz del error cuadrtico medio obtenido para los 19
parques elicos 15 minutales. . . . . . . . . . . . . . . . . . . . . . . . . . . 120
5.7
Media del error medio absoluto para los 19 parques elicos 15 minutales. 121
5.8
Valor relativo del error medio absoluto obtenido para los 19 parques elicos 15 minutales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
5.9
xii
Lista de acrnimos
AIC Criterio de seleccin de modelos de Akaike
AAR Modelo lineal autorregresivo ordenado
AR Modelo lineal autorregresivo
ARCH Modelo no lineal autorregresivo con heterocedasticidad condicional
ARLS Herramienta de identificacin de modelos por umbrales propuesta, de nombre
mtodo de mnimos cuadrados recursivos y ordenados
ARMA Modelo lineal autorregresivo con media movil
Aut-ARLS Procedimiento automtico de la herramienta de identificacin ARLS
BIC Criterio de seleccin bayesiano de modelos
BL Modelo no lineal bilineal
BS Brier Score, medida de evaluacin de estimacin de densidades
CRPS Criterio de seleccin de densidades (Continuous Ranked Probability Score)
EAM Error medio absoluto
EAR Modelo no lineal autorregresivo exponencial
ECM Error cuadrtico medio
EWMA Mtodo de media movil exponencialmente ponderada
EXPAR Modelo no lineal autorregresivo exponencial de amplitud dependiente
FAR Modelo no paramtrico autorregresivo con coeficientes funcionales
GARCH Modelo no lineal autorregresivo generalizado con heterocedasticidad condicional
xiii
xiv
Captulo 1
Introduccin
Moran (1953) al realizar un ajuste lineal sobre el nmero de linces capturados anualmente en el distrito canadiense de Mackenzie River descubri un, como l lo llam, fenmeno curioso. Dicho fenmeno consista en que los residuos para las observaciones
mayores que la media eran significativamente menores que los residuos para aquellas
observaciones que eran menores que la media. Seguramente nos encontramos ante una
de las primeras identificaciones de la existencia de heterocedasticidad condicional en
una serie temporal de datos reales.
Poco despus, Whittle (1954) realiz un estudio sobre las mediciones del nivel del
agua cada 15 segundos en un canal de la Isla de Bay en Nueva Zelanda. Analizando la
estimacin de la funcin de densidad espectral, Whittle descubri la existencia de una
relacin aritmtica que permita relacionar los periodos de los picos existentes en dicha
estimacin. Whittle explica que la relacin encontrada es debida a la existencia de no
linealidad, realizando un anlisis basado en ecuaciones diferenciales lineales a trozos.
Tong (2010, p. 5) afirma que el trabajo de Whittle es, seguramente, el primer estudio
acerca de la importancia de la idea del umbral en el anlisis de las series temporales.
Motivados por trabajos similares a los de Moran y Whittle, el inters de investigadores por el estudio de tcnicas no lineales en series temporales fue incrementndose
de manera progresiva hasta nuestros das. Realmente, el primer estudio terico de un
modelo temporal no lineal fue efectuado por Volterra (1930). En su estudio mostr
como cualquier funcin continua no lineal puede ser ajustada mediante la expansin
de Volterra, cuya forma viene definida por
Yt =
1
X
1 X
1
X
guvw Ut
gu Ut u +
guv Ut u Vt v
u=0
u=0 v=0
1 X
1 X
1
X
u=0 v=0 w=0
u Vt v Wt w
(1.1)
+ :::
Captulo 1. Introduccin
1.1
A lo largo de los aos se han ido proponiendo diferentes tipos de modelos que intentan
explicar diferentes fenmenos no lineales. En esta seccin se hace un repaso de los modelos paramtricos habitualmente ms empleados, as como una introduccin a distintas tcnicas no paramtricas existentes. Adems de los modelos aqu mostrados existen
otros ms generales como pueden ser, por ejemplo, los modelos estado-dependientes
(Priestley, 1980) o los modelos doblemente estocsticos (Tjstheim, 1986).
1.1.1
Los modelos por umbrales, mencionados por vez primera por Tong (1977), asumen
la existencia de diferentes funciones lineales en diferentes regiones del espacio de los
estados. La divisin del espacio de los estados viene dada por la variable umbral Xt
con d
d,
1. Basndose en esta idea Tong (1987) formul el principio del umbral, el cual
dice que el anlisis de un sistema estocstico complejo puede ser realizado mediante
su descomposicin en subsistemas ms sencillos (Tong 1990, p. 99).
El modelo por umbrales ms conocido es el autorregresivo por umbrales (TAR,
Threshold Autoregressive) que tiene la forma
(Jt )
Yt = a0
p
X
(Jt )
ai
Yt
+ b(Jt ) et ;
(1.2)
i=1
f1; 2; :::; Jg trabajando como mecanismo de intercambio. Dicho mecanismo es, habi-
tualmente, una variable observada llamada variable umbral. La figura 1.1 muestra un
ejemplo muy evidente de un modelo TAR con dos regmenes de comportamiento.
Los modelos TAR han sido empleado en diversas reas, como pueden ser en ecologa
(p.ej., Stenseth et al., 1999), en hidrologa (p.ej., Tong et al., 1985), en epidemiologa (p.ej.,
Stenseth et al., 2006; Samia et al., 2007), en economa (p.ej., Tiao and Tsay, 1994; Hansen,
Yt
Yt
6
100
200
300
400
500
t
600
700
800
900
1000
Yt1
Figura 1.1: Realizacin de tamao 1000 a partir del modelo (1.2) para valores J = 2,
(1)
(2)
(1)
(2)
a0 = 0, a0 = 3, a1 = :8, a1 = :8, dependiendo el indicador temporal Jt del valor
de Yt 1 .
1999), en finanzas (p.ej., Li and Lam, 1995; Potter, 1995), en ciencias actuariales (p.ej.,
Chan et al., 2004), entre muchos otros. Un amplio estudio sobre el desarrollo de los
modelos TAR ha sido efectuado por Tong (2010).
1.1.2
Los modelos EXPAR (Amplitude-dependent Exponential Autoregressive) fueron introducidos de manera independiente por Jones (1976) y Ozaki y Oda (1978). Un modelo EXPAR(k) est definido por
Yt =
k
X
exp
Yt2 1
Yt
+ et ;
> 0;
(1.3)
j=1
tribuidas. Haggan y Ozaki (1981) mostraron que el modelo es til para la modelizacin
de la vibracin del sonido. En la figura 1.2 vemos un ejemplo de modelo EXPAR.
1.1.3
Modelos bilineales
p
X
i=1
i Yt
i + et +
q
X
j=1
j et
Q
P X
X
i=1 j=1
ij Yt i et j ;
(1.4)
Captulo 1. Introduccin
80
60
40
Yt
20
20
40
60
0
20
40
60
80
100
t
120
140
160
180
200
= (2; 1),
y fueron introducidos por Granger y Andersen (1978). Son especialmente tiles para
series temporales en las que ocasionalmente se produzcan grandes alejamientos de la
media, como puede verse en la figura 1.3. Ejemplos de posibles aplicaciones reales
podran ser las mediciones realizadas por un sismgrafo, ya que stas, en general, sern
estables salvo cuando se produzca un terremoto. Subba Rao y Gabr (1984) hicieron un
amplio estudio sobre este tipo de modelos.
150
100
Yt
50
50
100
150
0
20
40
60
80
100
t
120
140
160
180
200
1.1.4
= :8,
Los modelos de heterocedasticidad condicional (ARCH, Autoregressive Conditional Heteroscedastic) fueron introducidos por Engel (1982) para modelizar la tasa de inflacin
de Reino Unido. Son modelos muy empleados en series temporales econmicas y financieras. Un proceso Yt sigue un modelo ARCH(r) si est definido como
Yt =
t "t ;
(1.5)
donde f"t g es un proceso de variables aleatorias independientes e idnticamente distribuidas, siendo f"t g independiente de fYt
k;
donde
Pr
i=1
2
1 Yt 1
+ ::: +
2
r Yt r ;
(1.6)
de r muy altos. Para evitar ste efecto, Bollerslev (1986) y Taylor (1987) propusieron un
modelo ms parsimonioso, los modelos autorregresivos generalizados de heterocedasticidad condicional (GARCH, Generalized Autoregressive Conditional Heteroscedastic). Un
proceso Yt sigue un modelo GARCH(p,q) si el proceso
2
t
= c0 +
p
X
ci zt2 i +
i=1
q
X
bj
2
t j:
(1.7)
j=1
Los modelos GARCH tienen una estructura similar a los modelos ARMA, compartiendo con ellos muchas de sus propiedades. En la figura 1.4 se pueden ver dos realizaciones eneradas a partir de modelos ARCH y GARCH. En el trabajo de De Gooijer
y Hyndman (2006) se puede encontrar un resumen reciente de los diferentes estudios
basados en modelos de heterocedasticidad condicional que se han ido proponiendo.
20
20
15
15
10
10
5
Yt
Yt
5
0
0
5
5
10
10
15
20
0
20
40
60
80
100
t
120
140
160
180
200
= (1:5; :8).
15
0
20
40
60
80
100
t
120
140
160
180
200
1.1.5
Los modelos mostrados hasta ahora intentan explicar un tipo de fenmeno no lineal,
por ello Tong (1990, p.116) los llama modelos no lineales de primera generacin. Para
aprovechar mejor sus ventajas, Tong propone crear modelos ms complejos que aunen
Captulo 1. Introduccin
a varios de estos modelos, creando as modelos de segunda generacin, tercera generacin, y as.
Un posible modelo de segunda generacin que empieza a ser empleado es un modelo por umbrales con heterocedasticidad condicional. Por ejemplo, un modelo SETARARCH vendra definido por
(Jt )
Yt = a0
p
X
(Jt )
ai
Yt
+ et Vt ;
i=1
y fJt g es un indicador temporal que tomar valores en f1; 2; :::; Jg trabajando como
mecanismo de intercambio. Adems Vt2 =
0+
2
1 Yt 1 + : : : +
2
r Yt r .
1.1.6
Modelos no paramtricos
En ocasiones los fenmenos no lineales subyacentes en los datos no pueden ser identificados de manera particular, por ello ser adecuado el uso de modelos no parmetricos
que permitan un ajuste no lineal ms general. La forma de un modelo no paramtrico
ser
Yt = f (Yt
donde f ( ) y
1 ; :::; Yt p )
+ (Yt
1 ; :::; Yt p ) et ;
(1.8)
( ) ser
prcticamente imposible, salvo que el tamao muestral sea muy grande (ver, p.ej., Fan
y Gijbels (1996)), debido a la maldicin de la dimensionalidad (Bellman, 1961).
Debido al problema de la dimensionalidad para trabajar con modelos no paramtricos hay dos opciones. Por una parte existen diferentes tcnicas que permiten estimar las
funciones f ( ) y
Caps. 5 y 8; Pea et al., 2001 Cap. 12). Otra opcin diferente es emplear modelos para
ajustar dichas funciones. A continuacin vemos algunos de estos modelos.
d )Y1
+ : : : + fp (Yt
d )Yt p
+ (Yt
d )et ;
(1.9)
k;
d,
posibles. Por ello, una generalizacin de esta clase de modelos es permitir una combinacin lineal de valores pasados como variable dependiente del modelo. Esta generalizacin es conocida como modelo de coeficientes funcionales adaptativo.
Modelos aditivos
Los modelos aditivos (Ezekiel, 1924) son muy tiles para aproximar la funcin autorregresiva de alta dimensin del modelo (1.8) mediante la descomposicin de la funcin
f (Yt
1 ; :::; Yt p )
la forma
Yt = f1 (Yt
1)
+ ::: + fp (Yt
p)
+ et ;
(1.10)
donde fet g es una secuencia de variables aleatorias independientes e idnticamente distribuidas. Las funciones f1 ; : : : ; fp son univariantes y pueden ser estimadas mediante
alguna tcnica de regresin no paramtrica. Lgicamente, esto disminuye la dimensin
del problema, y nos da la ventaja de necesitar menos observaciones para obtener resultados precisos. El problema es que la aditividad es una condicin muy fuerte, que
habitualmente no se cumple, y que adems es difcil de comprobar. En Chen et al. (1995)
se propone un contraste que permite evaluar si se cumple la condicin de aditividad.
1.2
En esta seccin se describen los problemas a los que nos hemos enfrentado durante la
realizacin de esta tesis, as como las propuestas que ms adelante sern desarrolladas.
1.2.1
El uso de un modelo lineal para explicar un conjunto de datos que presenten algn
tipo de fenmeno no lineal, provocar que el modelo no pueda recoger toda la informa-
Captulo 1. Introduccin
cin contenida en los datos. En la figura 1.5 vemos un ejemplo de un proceso temporal
Yt cuya relacin con su primer retardo Yt
un ajuste lineal ser complicado que se pueda predecir su comportamiento futuro adecuadamente. Por ello, es importante identificar cundo tenemos existe algn fenmeno
no lineal subyacente en los datos para as poder aplicar mtodos ms adecuados. El
problema radica en cmo identificar estos fenmenos, cmo identificar la no linealidad.
2
1.5
1
0.5
Yt
0
0.5
1
1.5
2
2.5
2.5
1.5
0.5
0.5
1.5
t1
1.
Identificar un fenmeno no lineal particular suele ser una tarea compleja. Para ello
se pueden emplear diferentes mtodos como pueden ser anlisis de los datos mediante
mtodos grficos, realizacin de contrastes de linealidad
Mtodos grficos
El uso de mtodos grficos nos puede mostrar que algo anormal pasa en nuestros datos.
Sin duda, son una herramienta muy til cuando se comienza a analizar cualquier tipo
de datos. Mtodos como histogramas, correlogramas o funciones de densidad espectral,
que son habitualmente empleados en los anlisis lineales puede darnos una idea de
que algo no funciona bien, en caso de observar fenmenos no esperados. A dichas
herramientas grficas aadimos aqu algunas propuestas realizadas en el mbito de las
series temporales no lineales.
Grfico inverso
cada entero positivo n, y para cada vector de ndices (t1 ; :::; tn ) los vectores (Yt1 ; :::; Ytn )
y (Y
Modelo no lineal
100
75
Yt
Modelo lineal
4
10
20
30
40
50
60
t
Modelo lineal inverso
70
80
90
0
1
100
100
75
50
20
30
40
50
t
60
70
80
90
100
30
20
10
25
2
4
100
10
Yt
Yt
4
1
50
25
90
80
70
60
50
t
40
30
20
10
0
100
90
80
70
60
50
t
40
Figura 1.6: Comparacin del grfico de una serie procedente de modelos lineales y no
lineales
k g,
lneas. En la figura 1.7 vemos un ejemplo del diagrama para datos generados mediante
un modelo AR lineal y un modelo SETAR no lineal. El diagrama perteneciente al proceso lineal tiene un comportamiento completamente aleatorio, mientras que el proceso
no lineal dibuja una especie de elipse, sin datos en el centro. Tong (1990, p.216) explica
cmo este tipo de resultados muestran la existencia de ciclos. Este tipo de grficos ha
sido muy empleado en el anlisis de tcnicas de caos.
kg
til para identificar una posible relacin no lineal. En la figura 1.8 vemos la diferencia
entre realizar un ajuste lineal y un suavizado no paramtrico, y cmo este ltimo ayuda
a explicar mejor los datos, pudiendo indicar por lo tanto no linealidad.
Captulo 1. Introduccin
10
Modelo lineal
Modelo no lineal
2.5
2
8
1.5
1
Yt1
Yt1
0.5
0
0.5
5
1
1.5
2
2.5
3
0
Yt
3
3
6
Y
7
t
Yt
Figura 1.7: Diagramas de dispersin directos para datos provenientes de modelos lineales y no lineales
4
4
Yt1
7
t
Yt
6
Yt2
6
Yt4
6
5
4
3
6
Yt3
Figura 1.8: Ajuste lineal y suavizado no paramtrico sobre un proceso generado a partir
de un modelo no lineal
Contrastes de linealidad
Una herramienta ms formal para comprobar la existencia de no linealidad en el proceso es el uso de contrastes de hiptesis. Existen dos clases de contrastes de linealidad,
por una parte estn los contrastes generales que no asumen ningn tipo de estructura
no lineal en los datos, sino que solo contrastan la falta de linealidad en los mismos. Por
otra parte, estn aquellos contrastes especficos que nos permiten comprobar si un tipo
de fenmeno no lineal en particular es correcto para el proceso estudiado.
Contrastes generales
representacin lineal del proceso es correcta o no, para ello existen multitud de contrastes. Uno de los primeros que se propusieron es el contraste basado en la aproximacin bi-espectral, propuesto originalmente por Subba Rao y Gabr (1980) y mejorado
poco despus por Hinich (1982). Se basa en la idea de que bajo el supuesto de linealidad las funciones de densidad espectrales acumuladas son constantes. Su principal
11
donde
Yt2 =
(Yt )
; para todo j;
(1.11)
en el proceso han de cumplir la relacin (1.11), ya que en caso contrario el proceso ser
no lineal. Empleando esta idea, McLeod y Li (1983) propusieron un contraste de LjungBox que permite comprobar que la relacin (1.11) se mantiene en los residuos . Curiosamente, aunque McLeod y Li (1983) realizaron un contraste general, su propuesta
funciona especialmente bien para detectar la existencia de modelos de heterocedasticidad condicional. Siguiendo esta misma va, Pea y Rodrguez (2005) proponen un
contraste que mejora a los anteriores.
Otros contrastes de linealidad existentes son el contraste BDS propuesto por Brock
et al. (1996) que se basa en la relacin no lineal de los residuos del ajuste lineal y de
su pasado, y el contraste del tipo Kolmogorov-Smirnov propuesto por Hong-zhi y Bing
(1991).
Contrastes especficos
Captulo 1. Introduccin
12
Fan y Yao (2005, Cap. 9) desarrollan un contraste de ratio de verosimilitud generalizado basado en el contraste para datos independientes de Fan et al. (2001). La idea
principal de este contraste es que la distribucin asinttica del estimador bajo la hiptesis nula es independiente de los parmetros desconocidos ausentes de dicha hiptesis
nula. Esta propiedad es conocida como fenmeno de Wilks. Fan y Yao (2005) muestran
como siguiendo esta idea se puede desarrollar un contraste para series temporales, que
permite contrastar la existencia de diferentes modelos no paramtricos o paramtricos,
como el TAR, el EXPAR, el BL, el FAR,etc.
Por ltimo, existen diferentes contrastes de bondad de ajuste que permiten comparar diferentes modelos tanto lineales como no lineales entre s, como son las propuestas de Escanciano (2006), Ling y Tong (2010) o Du y Escanciano (2011).
Resultados propuestos en la tesis
En el anlisis de las series temporales lineales existe una medida de dependencia general que permite la modelizacin del proceso, se trata de la autocorrelacin simple
y parcial. Adems, esta medida permite una sencilla representacin grfica mediante
el correlograma. Sin embargo, no existe ninguna medida ni ninguna herramienta, que
permita de manera tan simple e ilustrativa analizar las relaciones no lineales. Por ello, el
primer objetivo de esta tesis doctoral es el desarrollar una herramienta de identificacin
y modelizacin de un fenmeno no lineal. En particular, durante esta tesis nos hemos
centrado en la identificacin de modelos por umbrales.
Para ello vamos a proponer un procedimiento basado en una herramienta grfica
que permita identificar la existencia de un modelo por umbrales. Adems, dicho procedimiento nos permitir modelizar de manera sencilla el proceso.
1.2.2
El clculo de predicciones es una de las tareas esenciales cuando se trabaja con series
temporales. Existen dos tipos de caminos que se pueden emplear para calcular predicciones, por una parte el uso de modelos que expliquen el comportamiento de los datos,
permitir adems obtener predicciones a partir de ellos. Mientras que otra opcin es el
uso de tcnicas de prediccin no paramtricas que sin explicar el comportamiento de la
serie permitirn calcular predicciones. En esta tesis nos hemos centrado en el clculo de
predicciones empleando modelos no lineales.
Sea Yt un proceso conocido, el objetivo ser calcular predicciones a un horizonte h
dada la informacin contenida en dicho proceso mediante
Y^t+hjt = f (Yt ; :::; Y1 ) ;
(1.12)
13
(1.13)
d.
En ese caso,
la variable umbral no ser observada, con lo que ser complicado encontrar la forma
analtica de las predicciones. Tong (1990) muestra como hacerlo mediante ecuaciones
de Chapman-Kolmogorov las predicciones, lo que para estructuras TAR muy complejas
puede resultar extremadamente dificultoso. Clements y Smith (1997) muestran diferentes mtodos de computacin que permiten el clculo de predicciones en modelos TAR
mediante simulaciones. Para realizar estas simulaciones ser necesario estimar la densidad condicionada del proceso. En la seccin 2.6 mostraremos ms detenidamente las
diferentes formas de calcular predicciones empleando un tipo de modelo TAR.
1.2.3
Captulo 1. Introduccin
14
elica ha pasado de ser una energa residual dentro de las renovables a representar casi
la mitad de la potencia instalada.
Con la demanda cubierta por las diferentes fuentes energticas sucede algo semejante. Como vemos en la figura 1.9b, la potencia elica adquirida en el mercado energtico ha pasado de ser prcticamente inexistente a cubrir en el ao 2010 el 15.6% del total
demandado. Este aumento ha provocado la necesidad de obtener mejores predicciones
tanto para poder optimizar su integracin en el mercado energtico como por motivos
de operatividad del sistema elctrico.
Energa elica
Resto de renovables
Energa nuclear
Resto de no renovables
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2000
Energa elica
Resto de renovables
2001
2003
2002
2004
Energa nuclear
2005
2006
2007
Resto de no renovables
2008
2009
2010
15
0.9
0.8
0.7
pt
0.6
0.5
0.4
0.3
0.2
0.1
50
100
150
200
250
300
t
350
400
450
500
550
600
Captulo 1. Introduccin
16
dictiva a partir de los datos histricos de la potencia y de sus predicciones (p.ej., Bludszuweit et al.,2008; Al-Awami y El-Sharkawi, 2009; Lau y McSharry, 2010; Pinson, 2010).
Este punto de vista ser el empleado en nuestra propuesta de estimacin. Empleando
las predicciones de potencia estimaremos de manera adaptativa los momentos condicionados de los errores de prediccin. Con estos momentos condicionados, estimaremos la senda de predicciones predictiva ajustando diferentes distribuciones paramtricas.
1.3
Estructura de la tesis
La tesis consta de 6 captulos. En este primer captulo se han introducido los diferentes
problemas que hemos tratado a lo largo de la tesis. Para ello realizaremos una descripcin de diferentes tcnicas existentes para analizar series temporales no lineales.
Adems se introducen los problemas bsicos a los que nos hemos enfrentado en esta
tesis como son, por una parte, la identificacin de no linealidad en datos temporales,
y por otra la estimacin de densidades predictivas y el clculo de predicciones puntuales empleando modelos no lineales. En particular, en estas ltimas tareas nos concentraremos en su aplicacin a datos provenientes de la potencia producida por parques elicos, por lo que introduciremos diferentes tcnicas existentes que se emplean
para este tipo de datos.
A lo largo de esta tesis nos hemos centrado en un tipo de modelos no lineales, que
son los modelos por umbrales, por ello en el captulo 2 repasamos de manera exhaustiva los diferentes tipos de modelos por umbrales que se han propuesto. En particular,
repasaremos los modelos autorregresivos por umbrales.
Los principales resultados de la tesis se encuentran en los captulos 3, 4 y 5. En el
captulo 3 desarrollamos un procedimiento que permitir identificar y modelizar los
modelos autorregresivos por umbrales. Dicho procedimiento se basa en dos puntos
principales, por una parte ordenamos los datos respecto a la variable que provoca la no
linealidad, como ya hicieron en sus propuestas de contrastes Petruccelli y Davies (1986)
y Tsay (1989), y por otra parte, empleamos un mtodo de estimacin recursiva sobre
los datos ordenados para as poder detectar posibles cambios estructurales provocados por la variable que empleamos para realizar la ordenacin. A lo largo del captulo
mostraremos el mtodo recursivo empleado as como sus principales propiedades y justificaremos porqu la ordenacin no altera la dependencia temporal de la variable. Por
ltimo compararemos el procedimiento propuesto con diferentes contrastes existentes
mostrando como los mejoraremos.
En el captulo 4 se trata la estimacin de la densidad predictiva, cuando la variable
17
18
Captulo 1. Introduccin
Captulo 2
Yt =
(J )
a0 t
p
X
(Jt )
ai
Yt
+ b(Jt ) et ;
(2.1)
i=1
donde los fet g son variables aleatorias independientes e idnticamente distribuidas con
E[et ] = 0 y V[et ] =
f1; 2; :::; kg. La idea bsica de un modelo por umbrales es la descomposicin del sistema
20
2.1
Un modelo autorregresivo por umbrales auto-alimentado (SETAR(k; p1 ,...,pk ;d), SelfExciting Threshold Autoregressive) con k regmenes, siendo k
Yt =
k
X
(i)
0
(i)
1 Yt 1
(i)
pi Yt pi
+ ::: +
2, se define como
(i)
+ et
I (Yt
i=1
donde
i
i
j
(2.2)
i) ;
= ( 1; 1) y
riable umbral Yt
mediante
d,
= (ri
1 ; ri ].
(i) .
La
funcin I( ) es una funcin indicadora, que toma valor 1 cuando se cumple la condicin
y 0 en otro caso. El modelo SETAR es quizs el ms conocido entre todos los modelos por umbrales que se han ido proponiendo. Su extensin directa ser aadiendo el
componente media movil, con lo que un modelo SETARMA(k; p1 ,...,pk , q1 ,...,qk ;d) se
define como
Yt =
k
X
(i)
0
(i)
1 Yt 1
+ ::: +
(i)
pi Yt pi
(i)
+ et
(i) (i)
1 et 1
:::
(i) (i)
qi et qi
I (Yt
i=1
i) :
(2.3)
Otro tipo de modelos posible es aqul en el que el proceso indicador fJt g es inde-
pendiente del proceso Yt . En ese caso, la variable umbral ser una variable exgena
al proceso Yt . Tong y Lim (1980) nombraron a este tipo de modelos con variables exgenas como modelos autorregresivos por umbrales con sistema de bucle abierto, pensando principalmente, en trminos de control de sistemas. En su reciente estudio sobre
la evolucin de los modelos por umbrales Tong (2010) propone modificar el nombre a
modelos TARMAX (Threshold Autoregressive Moving Average Exogenous). De esta manera
Yt seguir un modelo TARMAX(k; p1 ,...,pk , q1 ,...,qk ;d) si est definido por
Yt =
k
X
i=1
(i)
0
(i)
1 Yt 1
+ ::: +
(i)
pi Yt pi
(i)
+ et
(i) (i)
1 et 1
:::
(i) (i)
qi et qi
I (Xt
i) ;
(2.4)
En los modelos vistos hasta ahora el cambio de regin en el espacio de los estados viene dado por una funcin indicadora, lo que provocar un cambio brusco entre regmenes. En algunas aplicaciones, ser ms apropiado que el cambio entre re-
21
Chan y Tong (1986) llamndolos modelos autorregresivos con umbrales suaves (STAR,
Smooth Threshold Autoregressive). Los modelos STAR han sido ampliamente estudiados
en el campo de la econometra (p.ej., Franses y van Dijk, 2000), siendo habitualmente
denominados como modelos autorregresivos con transicin suave (Smooth Transition
Autoregressive).
Todos los modelos anteriores emplean como variable umbral una variable observada, pero hay otro tipo de modelos en los que dicha variable umbral no ser observada.
El primero de ellos es el modelo autorregresivo exponencial (EAR, Exponential Autoregressive). Sea fJt g una secuencia de variables aleatorias independientes e idnticamente
Jt =
1; con probabilidad 1
(2.5)
2; con probabilidad
(1)
a1 Yt
1
(2)
a2 Yt 1
+ et ; con probabilidad 1
+ et ; con probabilidad
(Jt )
a1
(1)
= 0, a2
=0y0
(2)
a2
= 0, b(Jt ) = 1, 0
(1)
a1 < 1,
(1980) y Lawrance y Lewis (1980). La conexin entre el modelo EAR y el modelo TAR
fue notada por vez primera por Tong (1983, p.63) y posteriormente fue desarrollada por
Chan (1986, Cap.4; 1988) extendiendo el modelo EAR a ordenes ms elevados.
cadena de Markov finita. Este modelo fue propuesto por primera vez por Tong y Lim
(1980, p.285), siendo probablemente el trabajo de Tyssedal y Tjstheim (1988) el primer
estudio en profundidad que se realiz. Una posible modificacin del modelo MSAR es
que el indicador temporal fJt g sea parcialmente oculto, como propuso Tong (1983, p.
276-277). Esta modificacin solo ha sido explorada parcialmente, siendo la propuesta
de Wu y Chen (2007) de las ms recientes.
22
2.2
1 ; :::; Yt p )
(2.6)
+ et ;
siendo h una funcin lineal a trozos, y donde el proceso fet g es una secuencia de va-
p+1 )
j,
para
1)
= (h (Yt
1)
(2.7)
+ et ;
0
1 ; :::; Yt p ) ; Yt 1 ; :::; Yt p+1 ) .
bajo las que el proceso Yt es estacionario ser necesario comprobar que Yt es un proceso
geomtricamente ergdico.
Definicin 2.1 (Proceso Geomtricamente Ergdico). El proceso Yt es geomtricamente
ergdico si existe una medida de probabilidad
constante
positivo ( < 1), y una funcion h medible no negativa y -integrable tal que
kPn (x; )
( )k
h (x) ; x 2 R;
2 (0; 1), c y ai
jh (x)j
0, siendo
Pp
i=1 ai
jjxjj!1
jh (x)
(b1 x1 + ::: + bp xp )j
= 0;
jjxjj
b1 z
:::
bp
zp
Huang, 1996).
C3 Existen los valores
1=2
23
1 (An y
i k
Ppi
i k
(i)
j
j=1
(i)
j
i k
pi , lo que corresponde
a la condicin C3 de ergodicidad.
Estas condiciones para la ergodicidad son suficientes pero no necesarias.
Teorema 2.2 (Estacionariedad, Fan y Yao(2005)). Suponiendo que el modelo de Markov (2.7)
es geomtricamente ergdico. Entonces, existe una distribucin estacionaria F tal que la serie
temporal fYt ; t = 1; 2; :::g definida por (2.6) e inicializada segn (X0 ; X
1 ; :::; X p+1 )
(1)
= ::: =
(k) ,
2.3
2.3.1
(i)
son
(i)
j
en cada rgimen.
El mtodo de mnimos cuadrados ordinarios (OLS, Ordinary Least Squares) fue introducido por Legendre (1805) y Gauss (1809). En realidad, Gauss ide el mtodo en 1795
con 18 aos de edad. La prueba de que descubri el mtodo aos antes de publicarlo es
la localizacin del asteroide Ceres. Dicho asteroide fue descubierto en 1801 siendo su
24
trayectoria seguida hasta que se ocult tras el Sol. Con los datos obtenidos durante ese
seguimiento, se intent predecir la localizacin por la que Ceres aparecera de nuevo.
De todos los intentos que se hicieron, la prediccin de Gauss empleando el anlisis de
mnimos cuadrados fue el nico que permiti su localizacin.
Los estimadores por mnimos cuadrados de los coeficientes autorregresivos (i) =
n (1)
o
(k)
(i)
(i)
b
b
;
:::;
,
con
i
=
1;
:::;
k,
sern
aquellos
;
:::;
2 R que minimicen la
pi
0
funcin de costes
k
X
(i)
; d;
(2.8)
i=1
(i)
; d;
X n
Yt
(i)
0
(i)
1 Yt 1
(i)
pi Yt pi
+ ::: +
Yt d 2 i
h<t n
o2
; h = max (pi ; d) :
(2.9)
La estimacin del modelo SETAR (2.2) se llevar a cabo mediante una proceso de
dos etapas. Primero se minimiza la expresin (2.9) para cada valor del parmetro delay
d. Dicho valor, se estima a continuacin, siendo d^ aquel que minimice (2.8). La mi(1)
(k)
nimizacin de la expresin (2.9) es equivalente a calcular los estimadores b ; :::; b
k
X
Xt
(i)
+ et
I (Yt
i=1
1 ; :::; Yt pi ),
(i)
(2.10)
i) ;
(i)
(i)
(i)
h
i
b (i) = X(i)0 X(i)
t
t
(i)0
(i)
(2.11)
Xt Yt ; i = 1; :::; k;
I (Yt
0
i ) 1pi
(i)
y Yt = Yt I(Yt
i ),
25
(i)
1
b
S b ; d;
ni
(i)
en cada rgimen es
(2.12)
donde ni es el nmero de elementos en cada una de las particiones del espacio de los
estados.
2.3.2
= yt
k;
1].
Para ilustrar las diferentes formas que puede tomar dicha funcin de regresin, se generan diferentes realizaciones provenientes del modelo (2.2) con valores k = 2, p1 = p2 =
(1)
1
1,
= :6 y
(2)
1
1 ].
(2.1a) se ve como la funcin de regresin es continua, puesto que el valor de los parmetros evoluciona de manera continua a lo largo del dominio, mientras que en (2.1b)
vemos como dicha evolucin es discontnua a la altura del valor del umbral r.
4
Yt
Yt
5
5
5
5
Yt1
(a) r=0
0
Yt1
(b) r=-1
Para el caso discontinuo, Chan (1993) mostr que, bajo ciertas condiciones, los estimadores de los parmetros del modelo son consistentes en sentido estricto, como
podemos ver en el teorema 2.3.
Teorema 2.3 (Chan, 1993). Sea fYt g un proceso generado por
(1)
(2)
; r; d y
(1) ;
(2)
que satisface el modelo (2.2), con k = 2 y p1 = p2 = p. Suponiendo que fYt g es geomtricamente ergdico y estacionario con segundo momento finito y que la distribucin conjunta de
26
(Y1 ; :::; Yp ) admite una densidad positiva. Entonces, el estimador b es consistente, es decir,
b c:s:
! :
Adems del resultado de consistencia para los estimadores, Chan obtuvo los si-
0
1 ; :::; Yt p+1 )
1:
ii) fet g tiene una funcin de densidad continua y positiva, y E e4t < 1.
iii) La funcin autorregresiva es discontinua, es decir, existe z = (1; zp
(1)
(2)
Entonces (b
r
Op (1). Adems
z 6=0 y zp
(i)
ni b
donde
(i)
(1)
es asintticamente normal
(i)
ni b
(i)
(i) (i)0
t
t
1p E
(i)
!N 0;
10p
Wi =
tal que
= r.
(1)
r) es asintticamente independiente de b
siendo
0
1 ; zp 2 ; :::; z0 )
Wi
(i)
t
1=2
;b
(2)
(2)
y n (b
r
r)
; i = 1; 2;
(i)
(i)
1 ; :::; p
=E[ t ] y
(i)
t
(i)
0
(i) (i)
1 t 1
+ ::: +
(i) (i)
p t p
+ "t :
= yt
k;
1,
rema 2.4. Entonces, si el proceso sigue un modelo SETAR con 2 regmenes, la funcin
(1)
j
(2)
j ,
para 1
j 6= d
p, y
(1)
(1)
0
(2)
+r
(2)
0
+r
(2)
d .
As pues, el
(1)
(1)
0 +r d +
p
X
j=1; j6=d
(1)
j Yt j +
(1)
d (Yt d
(2)
d (Yt d
(1)
r) + et
r) +
(2)
et
; si Yt
; si Yt
r>0
: (2.13)
27
Chan y Tsay (1998) mostraron resultados similares a los obtenidos por Chan (1993)
en los teoremas 2.3 y 2.4 para el caso continuo. Por una parte el teorema 2.3 en el
caso continuo es semejante al obtenido en el caso discontinuo, con la salvedad de la
(1)
d
(2)
d ,
6=
Teorema 2.5 (Chan y Tsay, 1998). Sea fYt g un proceso generado por
y
(1) ;
(2)
(1)
(2)
; r; d
(1)
d
(2)
d .
6=
Entonces, el estimador
b c:s:
! :
Para obtener los resultados de las distribucin lmite, antes ser necesario definir las
condiciones que requiere el proceso Yt para ser -mixing (para ampliar la informacin
sobre este tipo de procesos ver, p.ej., Doukhan, 1994).
Definicin 2.6 (Coeficiente -mixing). Sean
)=
1
sup
2
(i;j)"I J
jP (
i)
P ( i) P (
i )j ;
j )j2J
de los
, respectivamente.
Definicin 2.7 (Proceso -mixing). El proceso fYt g es -mixing con tasa geomtrica si
f (:::; Y
para algn 0
<1y
1 ; Y0 ) ;
que contienen.
As pues, de las definiciones de un proceso geomtricamente ergdico 2.1 y de un
proceso -mixing 2.7 se deduce que una cadena de Markov estacionaria y geomtricamente ergdica es -mixing con una tasa que decrece geomtricamente. Una vez
definidos los conceptos necesarios se muestra el resultado obtenido por Chan y Tsay
(1998).
Teorema 2.8 (Chan y Tsay, 1998). Sea fYt g un proceso generado por
(1) ;
(2)
(1)
(2)
; r; d y
28
un proceso estacionario -mixing con una tasa que decrece geomtricamente, y que la densidad
estacionaria de Yt es positiva y acotada entorno al verdadero valor del umbral r. Suponemos
adems que
(1)
d
6=
(2)
d
y que, para algn q > 2, E(jYt jq ) < 1. Entonces, sean U =E(Ht Ht0 )
n b
! N 0; U
VU
2.4
Los criterios de seleccin de modelos son empleados para encontrar el orden ptimo
de un modelo parmetrico basndose en los datos observados, siendo el orden ptimo
aquel que minimice el criterio de seleccin empleado. En esta seccin se revisan las
propuestas existentes para seleccion de modelos SETAR. Para ver una amplia comparativa de multiples criterios de seleccin existentes para modelos por umbrales puede
verse, por ejemplo, Kapetanios (2001).
2.4.1
(2.14)
f (x)
f (x)
E log
log E
g (x)
g (x)
Z
f (x)
log
g (x)
dx = 0;
g (x)
29
k h
X
i=1
n
o
i
ni log b2(i) + 2 (pi + 1) :
(2.15)
Tong (1983, 1990) propuso seleccionar los ordenes autorregresivos de los diferentes
rgimenes en un modelo SETAR empleando el criterio AIC, aunque no mostr ninguna
justificacin terica.
Hurvich y Tsai (1989) propusieron una modificacin del AIC para obtener una mejor
correccin del sesgo, el criterio de informacin de Akaike corregido (AICc, corrected
Akaike Information Criteria). El AICc para modelos SETAR fue hallado por Wong y Li
(1998) y est definido como
AICc( [p1 ; :::; pk ] ) =
k
X
i=1
n
o n (n + p + 1)
i
i
i
ni log b2(i) +
:
(ni pi 3)
(2.16)
McQuarrie et al. (1997) muestran que la correccin del sesgo del AICc no es adecuada. Por ello propusieron un criterio de informacin asintticamente insesgado. La
forma del AICu (unbiased Akaike Information Criteria) para modelos SETAR, deducida
por De Gooijer (2001) es
k
X
i=1
2.4.2
ni log
ni
ni
pi
(2.17)
k h
X
i=1
n
o
i
ni log b2(i) + (pi + 1) log (ni ) :
(2.18)
30
ishnan, 2004).
2.4.3
El concepto de validacin cruzada se basa en la divisin de la muestra en dos submuestras disjuntas, una de las cuales es la de calibracin que se emplea para estimar
un modelo y otra la de validacin que se emplea para evaluar el rendimiento de dicho
modelo. Para encontrar ms informacin sobre el tema ver, por ejemplo, Stone (1974).
Stoica et al. (1986) proponen la siguiente generalizacin de esta idea. Sea m un valor
positivo entero y n el tamao muestra, se define el entero L que vendr definido por
L = [n=m], donde [ ] denota la parte entera. Entonces, la idea es dividir el proceso en
submuestras, de manera que se creen L submuestras de calibracin y L submuestras
de validacin. Siguiendo esta idea Stoica et al. (1986) proponen un criterio de seleccin
para modelos lineales. Sea ^ i la estimacin de un modelo AR(p) en la submuestra de
calibracin i-sima y sea Ii la muestra de validacin i-sima, entonces el criterio de
seleccin basado en validacin cruzada se calcula mediante
CVm (p) =
L Xn
X
Yt
Xt ^ i
i=1 t2Ii
o2
(2.19)
Como puede verse el criterio (2.19) depender de la eleccin de m. Stone (1974) recomienda emplear m = 1, en cuyo caso nos encontramos ante el mtodo habitualmente
conocido como validacin cruzada dejar-uno-fuera (leave-one-out). El problema
es que la propuesta de Stone (1974) fue en el mbito de modelos de regresin lineal, no
para el mbito de las series temporales, a pesar de ello De Gooijer (2001) emplea m = 1.
El criterio de seleccin basado en validacin cruzada para modelos SETAR fue propuesto por De Gooijer (2001), y viene definido por
C1 ([p1 ; :::; pk ]) =
L
X
im
X
n
o
e^2t ^i ([p1 ; :::; pk ]) ;
(2.20)
Y^t;i ;
(2.21)
donde Y^t;i es la prediccin un paso adelante empleando la muestra de calibracin isima de la observacin Yt;i de la muestra i-sima de validacin. De Gooijer (2001)
siguiendo el espiritu de las modificaciones que se han ido efectuando en el criterio AIC,
31
X 2 (pj + 2) (pj + 3)
1
C1 ([p1 ; :::; pk ]) +
:
n
n j pj 3
(2.22)
j=1
k
X
1
nj log
C1 ([p1 ; :::; pk ]) +
n
nj
j=1
2.4.4
nj
pj
2 (pj + 2) (pj + 3)
n j pj 3
(2.23)
1
n
n
X
Y^t;g
Yt
(2.24)
t=p+1
El problema de los mtodos Bootstrap es que asumen que el remuestreo con reemplazamiento se realiza sobre observaciones independientes e idnticamente distribuidas,
asuncin que habitualmente no se cumple en series temporales. Para solucionarlo
hrvik y Schoier (2005) emplean diferentes aproximaciones para obtener las muestras Bootstrap. Una vez obtenidas las B muestras Bootstrap, se puede diferenciar entre
aquellas en las cuales la observacin a predecir Yt est incluida y en las que no lo est.
La idea de hrvik y Schoier (2005) es emplear la media del error de las muestras Bootstrap que no contienen al punto que est siendo predicho para ajustar la tasa de error
aparente. Dicha media vendr definida por
^"B
g =
1
n
n
X
X
t=p+1 b2At
Yt
b
Y^t;g
#At
(2.25)
donde At son los ndices de las muestras Bootstrap que no contienen la t-sima ob-
32
(2.26)
^"g :
k
X
j=1
k
X
nj (nj + pj + 1)
(pj + 1) +
;
n j + pj 3
j=1
(2.27)
k
X
nj log
j=1
2.4.5
nj
nj
pj
(2.28)
Hurvich et al. (1990) proponen una mejora del criterio AIC para su uso en seleccin
de ordenes de un proceso autorregresivo en muestras pequeas. Su mejora se basa en
una aproximacin de la esperanza de la divergencia de Kullback-Leibler basada en el
determinante de la estimacin de la matriz de covarianzas del proceso autorregresivo.
Dado que el modelo SETAR se compone de procesos autorregresivos, Galeano y
Pea (2007) emplean la idea de Hurvich para mejorar varios de los criterios de seleccin
anteriormente mostrados. La modificacin de los criterios consiste en la adicin del
determinante de la matriz de covarianzas al criterio de seleccin que se va a modificar.
Por ejemplo, en el caso del AIC, la modificacin propuesta por Galeano y Pea (2007),
que denotaron como AIC*, es
k h
X
i=1
n
o
i
(i)
ni log b2(i) + 2 (pi + 1) + log Q ^
;
(2.29)
donde el determinante en cada rgimen se calcula empleando (p.ej., van der Leeuw,
1994)
(i)
Q ^
1
jM0 M
NN0 j
(2.30)
33
Mab
8
>
; si a < b
>
< 0
1
; si a = b ;
=
>
>
(i)
: ^
a b ; si a > b
Nab =
^ (i)
p +(a
i
b)
; si a
; si a > b
(2.31)
De manera anloga a la mostrada para el criterio AIC, Galeano y Pea (2007) proponen modificar varios criterios de seleccin como son el AICc, el BIC, el C1 , el Cc y el
Cu.
2.5
la distribucin asinttica habitual del estadstico no puede ser aplicada. As pues ser
necesario realizar otra aproximacin de la distribucin.
Adems, el uso de un modelo por umbrales conlleva la necesidad de estimar cul es
la variable umbral y la particin del espacio de los estados. La estimacin de la variable
umbral no es una gran complicacin puesto que se pueden probar diferentes variables
y seleccionar entre ellas empleando algn criterio de seleccin.
El problema ms complicado es la identificacin de la particin del espacio de los
estados, o lo que es lo mismo la estimacin de los umbrales. Tsay (1989) y Tong (1990)
identifican los valores de los umbrales mediante un anlisis visual de diferentes grficos. Otra opcin propuesta es emplear algoritmos de bsqueda intensiva probando
diferentes valores posibles.
2.5.1
Contrastes de linealidad
0+
p
X
j Yt j
(2.32)
+ et ;
j=1
contra la alternativa
H1 : Yt =
p
X
j=1
j Yt j
+4
p
X
j=1
j Yt j 5 I (Yt d
r) + et :
(2.33)
34
^2
^ 20
^2
(2.34)
max (d; p)g y las varianzas ^ 20 y ^ 2 son las estimaciones OLS emple-
ando (2.12) de los modelos (2.32) y (2.33), respectivamente. El problema, como dijimos
anteriormente, es que la distribucin asinttica del estadstico Fn no es una ji-cuadrado
de Pearson ya que el parmetro desconocido r est ausente en la hiptesis nula (2.32),
por lo que una nueva aproximacin se hace necesaria.
La aproximacin propuesta en los trabajos de Chan y Tong (1990), Chan (1990) y
Chan (1991), se basa en la familia de procesos de Poisson (ver, Aldous 1989). Segn la
propuesta de los autores, los niveles de significacin del estadstico (2.34) se aproximan
mediante
P fFn > x jH0 g
donde
2(
j
exp
2
p+1 (x)
x
p+1
p+1 Z
X
i=1
Ir
hi (y) dy
(2.35)
1
log
2
dJi (y)
;
dy
P0 (Yt y)
P0 (Yt > y)
(2.36)
; 1
i < p;
(2.37)
35
c=
h
1
P0 (Yt
E0 Yt2
Yt2
1+
E0 Yt2
y) E0 Yt2 I (Yt
I (Yt
y)
bx + c = 0 con
)
(2.38)
y) ;
i
y)gg2 :
(2.39)
Notar que en las expresiones anteriores P0 y E0 denotan, respectivamente, la probabilidad y la esperanza bajo la hiptesis nula H0 . En Chan (1991) se pueden encontrar
tablas para diferentes ordenes p y para diferentes intervalos Ir compuestos por porcentajes de la muestra.
Contrastes propuestos por Hansen
Hansen (1996, 1999) ha propuesto varios contrastes para modelos SETAR. En este trabajo nos hemos centrado en los que propuestos en Hansen (1996), que emplean las
hiptesis (2.32) y (2.33). En Hansen (1999) propone un ampliacin para permitir contrastar
(
H0 : AR(p)
H1 : SET AR(2; p; d)
H0 : SET AR(2; p; d)
H1 : SET AR(3; p; d)
(2.40)
Fn = sup (Fn (r )) :
(2.41)
r 2Ir
2(
problema es que hallar esto no es trivial, puesto que Fn (r ) es una funcin aleatoria.
Hansen (1996) muestra que la funcin aleatoria Fn (r ) tiene una distribucin asinttica
Normal multivariante y que el estadstico Fn converge en distribucin a Sn . La dificultad ahora se encuentra en que la distribucin de Sn no puede ser caracterizada. Hansen
(1996) muestra cmo calcular un valor de Sn proveniente de su distribucin asinttica
36
mediante
Sn = max u
^0 Mn (r ) u
^;
(2.42)
r 2Ir
donde
h
1
Mn (r ) = X10
r Xr
1
X10
r Xr
X0 X
1
X10
r Xr
0
1 ; :::; Yt p )
X10
r ;
y X1r = X I(Yt
(2.43)
d
r ).
Adems el vector u
^ se calcula empleando
u
^=u
X X0 X
X0 u;
(2.44)
X X0 X
X0 ;
(2.45)
dos a partir de una distribucin N(0; 1). Entonces, el estadstico Bootstrap se calcula
mediante
FnB = sup (Fn (r )) ;
(2.46)
r 2Ir
donde
Fn (r ) = n
^ 2 (r ) ^ 20
;
^ 2 (r )
(2.47)
37
t ),
siendo
<
1. En este caso, dado que el proceso fet g es heterocedstico habr que emplear un
contraste de Wald o uno de multiplicadores de Lagrange. Hansen (1996) propone un
procedimiento para encontrar la distribucin asinttica de un contraste de Wald, en el
que el estadstico ser
(2.48)
Wn = sup (Wn (r )) ;
r 2Ir
siendo
donde
h
Wn (r ) = (r )0 R RM (r )
(r ) =
0 ; :::;
p ; 0 ; :::; p
V (r ) M (r )
R0 (r ) ;
(2.49)
; si i
p+1
1 ; si i > p + 1
2 (p + 1),
(2.50)
1X
M (r ) =
Xt (r ) Xt (r )0 ;
n
(2.51)
i=1
V (r ) =
1X
Xt (r ) Xt (r )0 e2t ;
n
(2.52)
i=1
siendo Xt (r ) =
[Yt0 I (Yt d
r );
Yt0 I (Yt d
0
1 ; :::; Yt p ) .
En-
tonces, el procedimiento para obtener los niveles de significacin asintticos del estadstico Wn ser idntico al detallado para el caso homocedstico, salvo que los nmeros
aleatorios fut g vendrn generados por una distribucin N (0; et ).
Contrastes de bondad de ajuste
Existen multitud de contrastes de bondad de ajuste en diferentes campos. Ling y Tong
(2011) hacen una revisin de los ms significativos en el campo de las series temporales.
En esta seccin se van a revisar dos propuestas que permiten contrastar lo adecuado
que es el uso de un modelo SETAR.
Contraste basado en contrastes del tipo Score Ling y Tong (2011) proponen un contraste de bondad de ajuste general que permite comparar entre dos modelos paramtricos cualesquiera. Sea ^n el estimador mximo verosimil de 0 bajo la hiptesis nula, se
38
n ^n
n
X
Dt ( 0 )
p
+ op (1) ;
n
t=1
evaluado en
(2.53)
=E Dt ( 0 ) Dt ( 0 )0 es la matriz
de informacin.
El contraste propuesto por Ling y Tong (2011) se basa en el proceso emprico
n
Tn (r;
1 X
Dt ( 0 ) I (Yt
0) = p
n t=1
(2.54)
r) :
=E Dt ( 0 ) Dt ( 0 )0 I (Yt
r) , y el valor A = inf fr :
r g,
tico
Sna = max
a r A
i2
r; ^n
0^ 1
nr Tn
^n1
^ na1
(2.55)
^ nr =
n Dt ^n Dt ^n
X
I (Yt
y
^n =
n Dt ^n Dt ^n
X
t=1
r)
;
t=1
1). Adems ^ nr y
(2.56)
(2.57)
puesto que encontrar su ptimo llevara a buscar la distribucin asinttica de max Sna
en lugar de la de Sna , lo que complicara el problema. En la prctica proponen emplear
= (1; :::; 1)0 . Como valor de a proponen emplear el cuantil 5p% de la muestra.
La aproximacin a los valores crticos de Sna para rechazar la hiptesis nula con un
nivel de significacin
= ;
(2.58)
39
1
4 X ( 1)k
exp
2k + 1
x =1
2[0;1]
k=0
"
(2k + 1)2
8x
; x > 0;
(2.59)
d;
) Yt
+ ::: + ap (Yt
d;
) Yt
(2.60)
+ et ;
d ) Yt 1
+ ::: + ap (Yt
d ) Yt p
(2.61)
+ et :
Entonces, la suma de cuadrados residual bajo la hiptesis nula vendr dada por
n
1 X n
SCR0 =
Yt
n
a1 Yt
d;
^ Yt
:::
ap Yt
d;
t=p+1
^ Yt
o2
(2.62)
n
1 X
fYt
n
a
^1 (Yt
d ) Yt 1
:::
t=p+1
a
^p (Yt
2
d ) Yt p g :
(2.63)
SCR0 SCR1
;
SCR1
donde la hiptesis nula ser rechazada para valores grandes de Tn . Cai et al. (2000)
proponen un procedimiento Bootstrap para encontrar los valores crticos de Tn :
40
n d
, donde
d
i
es ordenada de menor
vector ordenado. Entonces, el modelo de la hiptesis alternativa en forma de autorregresivo ordenado sera
Y
i +d
(k)
0
p
X
(k)
j Y
i +d
; si i
(k)
;
i +d
+e
(2.64)
j=1
siendo
8
<1
k=
:0
(2.65)
; si i > s
donde, como puede verse no ser necesario el conocimiento del umbral. La ordenacin
de una serie temporal puede no ser un paso muy intuitivo. El ordenamiento realizado
asegura que los trminos de la derecha en (2.64) son los retardos del trmino de la
izquierda, por lo tanto las filas sern intercambiables si el proceso de las innovaciones
es independiente de las observaciones. En la seccin 3.1 se darn ms detalles sobre el
modelo autorregresivo ordenado y sus propiedades.
Empleando un proceso autorregresivo ordenado Tsay (1989) propuso el siguiente
procedimiento para contrastar la existencia de un modelo SETAR.
1. Coger las primeras m observaciones de la serie ordenada (m = 30 es lo recomendado por Tsay) y realizar por mnimos cuadrados la regresin siguiente,
Y
i +d
0+
p
X
j=1
jY
i +d
+e
i +d
; i = 1; : : : ; m:
(2.66)
41
m+1 +d
=Y
m+1 +d
0;m
p
X
j;m Y
m+1 +d
(2.67)
j:
j=1
Incorporar el punto m + 1 a la muestra y realizar el paso 1, actualizando el vector de coeficientes empleando mnimos cuadrados recursivos, obteniendo ^ m+1 .
Repetir de manera recursiva para todas las observaciones.
(i) Realizar la regresin lineal
e^
i +d
p
X
jY
i +d
+ vt ; i = m + 1; : : : ; n
m:
(2.68)
j=1
X2 X1
X1
d m
p+1
(2.69)
donde
X1 =
X2 =
nX
d m
v^t2 ;
(2.70)
t=m+1
n
Xp
e^2t ;
t=1
2.5.2
Fp+1;n
(2.71)
d m p:
El uso de contrastes nos dar una idea de si el uso del modelo SETAR es adecuado o
no, pero no nos dar la forma de la particin del espacio de los estados en el modelo
SETAR (2.2). La mayor parte de procedimientos existentes en la literatura que permiten
la identificacin de los umbrales, estn basados en mtodos de bsqueda intensiva.
Dada una coleccin f
j;
j g)
j g).
42
jg
R.
Los lmites del intervalo suele ser los percentiles l = a% y u = b%, donde una
1 pj pmax
;j=1;:::;k
j
1 d dmax
43
(i) Fijar el mximo valor del parmetro delay dmax , el nmero de regmenes k y los
ordenes autorregresivos mximos pmax
; :::; pmax
que podrn ser seleccionados en
1
k
cada rgimen del modelo SETAR.
(ii) Definir R candidatos a ser los valores de los umbrales. Estos valores deben estar
dentro del intervalo [l; u], donde l y u son cuantiles del proceso fYt g.
(iii) Seleccionar K posibles valores de los ordenes autorregresivos para cada rgimen,
teniendo como orden mximo en cada rgimen pmax
; :::; pmax
1
k . De esta manera
para un valor del delay d existen G modelos SETAR a probar, siendo G = K k R. Es
decir, si se escogen como valores de los umbrales el 50% de una muestra con 200
observaciones y se fijan como ordenes autorregresivos mximos p = 3, el nmero
de modelos a evaluar sera 900 para cada valor de d. En cuanto el modelo que se
quiere evaluar sea un poco complejo el nmero de evaluaciones crecer de manera
exponencial.
(iv) Estimar los parmetros del g-simo modelo SETAR omitiendo m observaciones
y empleando el mtodo de mnimos cuadrados sobre el modelo autorregresivo
ordenado. As se obtiene ^ i que es la estimacin de los diferentes parmetros
autorregresivos de los diferentes regmenes empleando la i-sima muestra de calibracin.
(v) Sea
n o
g
Y^t;i
la prediccin un paso adelante del proceso Yt empleando el g-simo
g
Y^t;i
, t = 1; :::; n; i = 1; :::; L; g = 1; :::; G,
con L = [n=m]. Entonces, para cada uno de los modelos que hay que evaluar se
tienen que realizar L estimaciones. Dado que el valor de m que recomiendan los
autores es m = 1, entonces, volviendo al ejemplo que mostramos en el paso (iii),
L = 200, y el nmero de estimaciones que hay que realizar para cada valor de d
que se desea probar asciende a 1800:
(vi) Calcular cualquiera de los criterios de seleccin mostrados en la seccin 2.4.3 y elegir como modelo SETAR aquella estructura Mg que minimice el valor del criterio.
De Gooijer (2001) aconseja emplear el criterio de seleccin basado en validacin
cruzada insesgado (2.23) segn los resultados obtenidos en las simulaciones.
44
2.6
El clculo de predicciones empleando modelos SETAR tiene una ventaja respecto a otro
tipo de modelos no lineales, y es que al ser un modelo lineal a trozos realizar predicciones dentro de cada rgimen es sencillo. Para ello es necesario conocer a que rgimen
pertenece la variable en el instante de tiempo a predecir, es decir, necesitamos conocer el
valor de la variable umbral Yt
d.
h es mayor que el parmetro delay d, puesto que en ese caso, la variable umbral deja
de ser observada, por lo que calcular las predicciones de manera exacta es complicado.
Existe la creencia de que calcular predicciones exactas en este caso es imposible, cosa
que Tong (1990, p. 347) desmiente. No es imposible, pero si es muy complejo.
Un modelo SETAR puede ser escrito en forma de un modelo autorregresivo no lineal
Yt = h (Yt
1)
+ et ;
(2.72)
distribuidas con media cero y varianza finita. Entonces, calcular la prediccin a horizonte h significa estimar la esperanza condicionada E[Yt+h jYt ]. Calcular dicha esperanza condicionada directamente es complejo, por ello Tong (1990, p.346) propone una
estimacin empleando la distribucin predictiva, es decir, la distribucin condicionada
de la prediccin. Dicha densidad predictiva puede ser estimada empleando la relacin
de Chapman-Kolmogorov
f (Yt+h jYt ) =
1
1
(2.73)
De esta manera, empleando mtodos de integracin numrica (ver, p.ej., Tong, 1990
Cap. 4.2.4) se puede estimar la media y la varianza condicionada. El problema principal es que este tipo de mtodos numricos puede ser complejo y computacionalmente
costoso dependiendo de la complejidad de la estructura del modelo SETAR utilizado.
Granger y Tersvirta (1993) proponen cinco tcnicas para calcular predicciones a
horizonte h empleando modelos autorregresivos no lineales sin necesidad de emplear
tcnicas de integracin numrica. Por simplicidad en la notacin durante esta seccin
asumiremos un modelo SETAR(2;1,1), adems la prediccin ser Y^t+hjt =E[Yt+h jYt ]. Entonces los mtodos propuestos son:
45
Y^t+h
r^
^ n+h
(2)
+ ^1
1jt
1
(1)
Y^t+hjt
^ (1) ^ n+h
1
Y^t+h
r^
1
Y^t+h
r^
^ n+h
^ n+h
!
1jt
1jt
1
(2)
Y^t+hjt
(2.74)
(1) (2)
(1)
(2)
donde ^ 1 ; ^ 1 y Y^t+hjt ; Y^t+hjt son la estimacin de los parmetros y la predic-
()y
sidad y de distribucin de una Normal con media 0 y varianza 1. Por ello, este
mtodo solo ser til en el caso de que los residuos sigan una distribucin Normal. El valor ^ i es la desviacin del error de prediccin i-simo.
Mtodo de prediccin adaptativa. La idea es emplear diferentes estimaciones de
los parmetros para diferentes horizontes de prediccin, como sugiri Cox (1961).
En series temporales esta aproximacin ha sido empleada para su uso en modelos
lineales por Findley (1983, 1985) y Tiao y Tsay (1994). Para calcular la prediccin a
horizonte h, el modelo es estimado minimizando la suma de los cuadrados de los
errores de prediccin dentro de la muestra a horizonte h. Para ilustrar ms claramente vamos a suponer un modelo AR(1). En ese caso, la prediccin a horizonte
h se calcular
Y^t+hjt =
(2.75)
1 Yt+h 1jt :
Entonces, empleando el mtodo de prediccin adaptativa los parmetros del modelo (2.75) sern estimados minimizando la suma de cuadrados de los errores de
prediccin a horizonte h, es decir, minimizando
n
Xh
t=2
e2t+hjt
n
Xh h
t=2
Yt+h
Y^t+hjt
i2
(2.76)
que la variable umbral siempre ser observada. Cuando el horizonte sea h > d
las predicciones sern calculadas simulando diferentes trayectorias posibles, que
luego sern empleadas para estimar la prediccin. Entonces, sea Y^t+djt la ltima
46
(i)
0
(i) ^
1 Yt+djt
I Y^t+djt 2
(i)
; i = 1; 2;
(2.77)
y
j
Y^t+kjt
=
siendo
(i)
(i)
0
(i) ^ j
1 Yt+d+1jt
(i)
j
2
I Y^t+d+1jt
; i = 1; 2; k = d + 2; :::; h;
(2.78)
J
^j
j=1 Yt+kjt ;
(2.79)
k = d + 1; :::; h:
Este mtodo puede ser implementado fcilmente para cualquier tipo de modelos
y evita tener que asumir que la distribucin es Normal.
Mtodos Bootstrap. El funcionamiento es igual al detallado para el mtodo de
Monte Carlo, salvo en la generacin del nmero aleatorio
(i)
(i)
0
(i) ^ j
1 Yt+d+1jt
j
I Y^t+d+1jt
2
; i = 1; 2; k = d + 2; :::; h; (2.80)
Captulo 3
3.1
Sea Yt un proceso autorregresivo con parmetros variables en el tiempo (TV-AR, TimeVarying Autoregressive) de orden p vendr definido mediante
Yt = Xt0
+ et ; t = h; :::; n;
(3.1)
2
t
0
1 ; :::; Yt p )
Se define S como el conjunto de todas las posibles ordenaciones del vector temporal t = 1; : : : ; n. Entonces si;t es la t-sima posicin, con t = 1; :::; n, del i-simo
47
48
elemento de S, con i = 1; :::; n!. El subindice i ser en ocasiones omitido cuando nos
estemos refiriendo a un elemento genrico de S, por motivos de sencillez en la notacin.
Denotaremos con
h = max(1; p + 1
d ),
d.
Es
donde
st
(3.2)
+ est ; t = h; :::; n;
2
t
< 1.
variable umbral Yt
d,
1t Yt 1
1)
usando la
B
C B
BY h+1 C B
B . C=B
B . C B
@ . A @
Y n
1
1
h+1
Y
Y
..
.
Y
h+1
C B
C
Be
C
C + B h+1
C
C B .. C :
A @ . A
e n
1C
(3.3)
49
3.2
Sea Yst un proceso TV-AAR(p) definido en (3.1), ser necesario emplear un mtodo de
estimacin recursiva para calcular los estimadores de los parmetros variables en el
tiempo. Existen varios algoritmos que permiten hacerlo, como son mnimos cuadrados
recursivos (RLS, Recursive Least Squares) o el filtro de Kalman. El inconveniente del filtro
de Kalman es que para emplearlo se necesita conocer el modelo que sigue la variacin
del parmetro. Adems una de las ventajas del mtodo RLS es que es especialmente
til cuando los cambios en los parmetros ocurren lentamente a lo largo del ndice en
el que estn ordenadas las observaciones. Es decir, los cambios se pueden producir de
manera temporal, o como ser nuestro caso, se producirn debido a que la variable que
puede producir dichos cambios en el parmetro est ordenada.
3.2.1
t
X
j=1
(t; j)(Yt
Xt0 )2 ;
(3.4)
(3.5)
50
siendo (t; t) = 1
(t; t 1)
(t; 1)
perfil de olvido. Cada una de estas cantidades (t; j) denotan el peso dado al j-simo
residuo en la funcin de costes en el instante de tiempo t. A lo largo de este trabajo se
emplea un perfil de olvido del tipo
t
Y
(t; j) =
i;
(3.6)
j < t;
i=j+1
h h+1 ,...,
h h+1
t Xt
X0t
(3.7)
t Yt ;
estimador (3.7) puede ser calculado de manera recursiva empleando (ver, p.ej., Ljung
and Sderstrm 1983)
^ =^
t
t
donde e^t = Yt
Xt0 ^ t
+ Mt 1 Xt e^t ;
(3.8)
t Xt ) es la
matriz de ganancia que mide la dispersin los parmetros estimados. La expresin (3.8)
es el estimador RLS. La matriz de ganancia Mt se calcula de manera recursiva mediante
Mt =
t Mt 1
+ Xt Xt0 :
(3.9)
El problema es que realizar el clculo de una matriz inversa en cada iteracin ralentizar el algoritmo e incrementar los problemas numricos. Para evitar este clculo se
halla la forma recursiva de calcular Mt , para lo que ser necesario emplear el lema de
inversin de matrices (ver, p.ej., Bodewig 1956).
Lema 3.3 (Lema de Inversin de Matrices). Sean B y D dos matrices no singulares y de
orden m y n, respectivamente y sea C una matriz de orden n
B + C0
=B
C 0 CB
C0
m. Entonces,
1
CB
51
recursiva mediante
Mt
Mt
3.2.2
1
1
0
1 X t X t Mt 1
1
0
t + X t Mt 1 X t
Mt
1
1
+ Xt0 Mt
1
1 Xt
(3.10)
que es un escalar.
La correcta eleccin del factor de olvido ser clave para que el mtodo funcione eficientemente, puesto que de dicha eleccin depender obtener una buena estimacin de los
parmetros del modelo y, por lo tanto, la eficiencia de las predicciones. Como dijimos
anteriormente el factor de olvido puede ser constante o variable. Puede demostrarse
(Haykin et al., 1997) que emplear RLS con un factor de olvido
t.
Por lo tanto, si no
en la estimacin se desa-
Xt0 )2 +
t Ct 1 (
Xt0 )2 +
= :::
= (yt
+
yt
2 (y1
t t 1
Xt0
2
1
t t 1
yt
Xt0
(3.11)
X10 )2 :
crecer cuando
=1
e^2t
;
1 + Xs0 t Mst 1 1 Xst
(3.12)
52
donde
las dificultades para el uso de este mtodo, pues no existe modo formal de seleccin. Observando la expresin (3.12) puede verse la existencia de la expresin
Xs0 t Mst 1 1 Xst . Es sabido, segn la teora clsica de regresin, que Xs0 t Mst 1 1 Xst es
una medida de la influencia de la t-sima observacin en la muestra de datos, o
lo que es lo mismo, es una medida de la distancia de Xt al centro de gravedad
de los datos. Entonces, si las nuevas observaciones influyen poco en la muestra,
pero tienen un error de prediccin grande, se obtendr un valor de
pre
t
pequeo
=1
(3.13)
lev
t ,
se premultiplicar y postmulti-
=
=
1
t
1
0
t +Xst Mst 1 Xst
(3.14)
ht ( t )
= 0 y por lo tanto,
ht (0) = 1, siendo la influencia de las nuevas observaciones mxima. Por el contrario, si no se aplica ningn olvido en la estimacin,
ht (1) =
= 1, y
(3.15)
ser la mnima influencia que se puede obtener de los datos. Entonces la expresin
(3.13) puede ser escrita como
lev
t
=1
ht (1):
(3.16)
53
donde
min
min
+ (1
2
m
min ) P
(3.17)
> mDt ;
es una estimacin de
2.
(3.18)
olvido combina las ventajas de (3.12) y (3.13), lo que es una ventaja pues, como
hemos visto, ambos mtodos funcionan bien donde falla el otro. La distancia de
Cook es una medida de la influencia de las observaciones sobre los parmetros estimados, por lo que, si se obtiene una distancia pequea, significar que las nuevas
observaciones influyen poco y que, por lo tanto, el factor de olvido debera de ser
mayor para tener en cuenta a los datos pasados. En caso contrario, si se obtiene
una distancia alta, significar una gran influencia de las nuevas observaciones y
un valor pequeo del factor de olvido para as descartar la informacin previa.
3.2.3
Las propiedades del estimador RLS con un factor de olvido variable son complejas.
La distribucin del estimador para un modelo de regresin variable con el tiempo son
desconocidas. Sin embargo, para nuestro procedimiento de identificacin de modelos
SETAR se necesitan las propiedades del estimador RLS bajo el supuesto de un proceso
autorregresivo invariante en el tiempo.
Para un proceso autorregresivo sin olvido, es decir, con
= 1, el error cuadrtico
medio (ECM) del estimador de mnimos cuadrados ordinarios es (Fuller y Hasza, 1985;
Kunitomo y Yamamoto, 1985)
ECM[ ^ OLS ] = E
+ O(n
3=2
);
(3.19)
54
donde
1 (X 0 X ) 1 : El uso de un
t t
factor de olvido puede ser interpretado como una reduccin del tamao muestral, ya
que empleando mnimos cuadrados ordinarios cada observacin tiene el mismo peso en
la estimacin, sin embargo en el estimador (3.8), el tamao muestral efectivo es menor
que n. Si usamos, por simplicidad, un factor de olvido constante, el tamao muestral
efectivo es neq = 1 +
n 1
(3.20)
E[ Xt0
t Xt
h
] + O (1
3=2
(3.21)
E[ Xt0
t Xt
];
(3.22)
(3.23)
2,
^ 2t = ^ 2t
3.3
t Xt
1
t
e^2t
^ 2t
(3.24)
55
3.3.1
d >r)
)Y t
(3.25)
1 +et :
paso crucial a la hora del correcto funcionamiento del procedimiento, ya que este nos
ayudar en la identificacin del umbral, puesto que si ^ es demasiado elevado o bajo
0
ser identificado. Vamos a comprobar que con una estimacin inicial ^ 0 calculada mediante OLS conseguimos siempre un valor intermedio.
Proposicin 3.4 (Estimacin inicial). Definimos n
fYt g o
comon una o
serie temporal compuesta
(2)
(1)
(2)
0(1)
0(2) 0
(1)
son dos procesos AR(1)
y Yt
por Yt y Yt , es decir, Yt = [Yt ; Yt ] , donde Yt
con parmetros
(1)
Entonces, sean Mt
+ , respectivamente.
1
0(1) (1)
1 Yt 1
Yt
0(1)
0(2) 0
1 ; Yt 1 ] .
(2)
y Mt
0(2) (2)
1 Yt 1
Yt
, si ajustamos un modelo
!
^ )( [
+ );
siendo !
^ 2 (0; 1).
Demostracin. La estimacin por mnimos cuadrados ordinarios de un proceso AR(1)
ser ^ = (X 0 Xt ) 1 X 0 Yt , o lo que es lo mismo empleando la composicin de la serie
0
temporal Yt
0
= B
entonces
^ = M (2) M (1) + M (2)
0
t
t
t
+B
(1)
Mt
0 (1)
Yt
1
1
1
0 (1)
Yt
(1)
Yt
0 (2)
+ Yt
(2)
Yt
(1)
Yt
0 (2)
+ Yt
(2)
Yt
56
por lo que
^
(2)
= Mt
(1)
Mt
(2)
(1)
Mt
(1)
Mt
(2)
(2)
(2)
+ Mt
+ Mt
(1)
= Mt
Mt + Mt
= !
^ ^ + (1 !
^ )( [
+ ):
(1)
0 (1)
(2)
0 (2)
Mt X t
Mt X t
(1)
Yt
+ :::
(2)
Yt
([
+ )
d,
est cerca de
Una vez justificado porqu es necesario emplear un factor de olvido variable, faltar justificar qu factor de olvido emplear. Para ello se repasan los problemas bsicos
que pueden surgir al emplear un mtodo de estimacin adaptativo (ver, p.ej., Rao Sripada and Grant Fisher 1987). El primero de los problemas habituales es que una matriz
de ganancias Mt
dran ser detectados. Este problema puede aparecer cuando las observaciones entrantes
al sistema recursivo X
sin embargo, puede ser limitado empleando un factor de olvido variable (3.17), ya que
en estos casos el factor de olvido tender a incrementarse.
57
tiene valo-
res muy pequeos, la cantidad que cambia la estimacin recursiva (3.8) podra acabar
siendo igual a 0. Cuando esto sucede se dice que la actualizacin recursiva se ha apagado. Esto podra suceder, por ejemplo, si el factor de olvido es demasiado elevado.
Consecuentemente, un posible cambio estructural existente no sera detectado. Por ello,
para que nuestro procedimiento funcione correctamente se necesita un factor de olvido
variable que sea sensible a cambios en los parmetros del modelo. El factor de olvido
(3.13) propuesto por Landau et al. (1998) no es una buena eleccin para nuestro objetivo, puesto que est relacionado con la influencia de las observaciones nuevas. Dado
que los datos estn ordenados de acuerdo a los valores crecientes de Yt
d,
las observa-
ciones nuevas sern similares a las antiguas. Por ello, la medida de la influencia no nos
ayudar a detectar cambio estructural alguno. Por el contrario, el factor de olvido propuesto en Snchez (2006a) es especialmente conveniente para nuesta tarea. Este factor
de olvido est basado en una representacin recursiva de la distancia de Cook, permitiendo que el factor de olvido sea sensible a cambios en los parmetros del modelo.
3.3.3
Intervalos de confianza de
st
El problema que nos surge ahora es cmo se puede evaluar si un codo observado en
la secuencia de estimaciones ^ es significativo, en el sentido de que realmente dicho
t
codo ha sido provocado por un cambio de rgimen en un modelo SETAR. Con este objetivo, la trayectoria observada ^ es comparada con las trayectorias esperadas bajo el
t
supuesto de que no hay ningn cambio de rgimen. Esta comparacin puede ser empleada para construir una regin de confianza para la familia de trayectorias ^ st cuando
el modelo es lineal. El problema es que la construccin de la regin de confianza puede
ser compleja. Un posible camino para construir la regin es calculando las trayectorias correspondientes a todos los elementos si del conjunto S, es decir, calcular la estimacin para todas las ordenaciones posibles. Esto nos dara un conjunto de trayectorias
^ ; i = 1; :::; n!. Entonces una regin de confianza de cobertura 100 (1
)% puede
si;t
tender a permanecer
st
58
st ,
mado por
^
Entonces, si la trayectoria ^
Z1
=2
^ 2n Mn 1 :
(3.26)
que hay un cambio de rgimen y que el codo identifica el valor del umbral r.
3.3.4
Yt =
donde
1 >1)
Yt
(3.27)
+ et ;
tomar valores 0, en cuyo caso estaremos ante un modelo lineal AR(1), o 0:8,
en cuyo caso estaremos ante un modelo SETAR(2;1,1). Adems para cada uno de los
se emplea un tamao muestral n = 150 y n = 500. La secuencia et ser un proceso de
ruido blanco gaussiano tal que et
N(0; 3).
tiende a salir
fuera de los lmites de confianza, se concluye que el modelo adecuado para el proceso
Yt es un SETAR. Adems, el valor de Yt 1 correspondiente al valor de la secuencia
^ ms alejado de los lmites de confianza ser la estimacin del valor del umbral r.
t
La figura 3.1 muestra un ejemplo del funcionamiento de la herramienta ARLS sobre
una rplica del modelo (3.27) para diferentes valores de y n. En ella se puede ver la
trayectoria de las estimaciones ^ junto con varias lneas. La linea central continua es el
t
del conjunto de ordenaciones S. Los lmites continuos son calculados mediante (3.26),
mientras que los lmites discontinuos muestran, para cada t, los percentiles empricos
2.5 y 97.5 de las 5000 trayectorias aleatorias de ^ si;t .
Cuando
59
n=150 y #=0
n=150 y #=1
0.45
~
0.5
''''''''
0.2
!"(t)
0.1
0.7
0.05
.""
~"".
0.75
-"
..", .,''''
"" ~
h.
0.6
10
1=
",
10
0,98
0.2
""""",
...
IT""~"".
__ '''''
.~
0.05
0
..
;;
0.1 "'d'
...... ""\.
V"fItII,{
." . ~
0.05
"
.
5
Yt1
n=500 y #=1
Lmites asintticos
Lmites empricos
0.15
0.1
Yt1
n=500 y #=0
!"(t)
...;...",.,r,;",'";T,,,,,,,,,""
0.05
0.65
"(t)
!"(t)
0.6
0.7
,~
0.15
0.55
0.55
,,,,,,,,,,,,,,""'1'10,','...,..,...,.....,
0.1
5
10
Yt1
1,02
Yt1
10
1, el
cul es el verdadero valor del umbral en el modelo generador de los datos (3.27).
En la figura 3.1 tambin podemos ver como los intervalos asintticos parecen una
buena aproximacin de los intervalos empricos calculados con 5000 ordenaciones aleatorias. Para validar este resultado, el experimento es repetido 1000 veces para cada valor
de n y de . Varias medidas son empleadas para comparar los intervalos de confianza.
Primero se define una medida de la diferencia relativa entre los lmites asintticos y
empricos. Esta medida es denotada como B l y se calcula mediante
R
1 X
B =
R
l
k=1
1
n
Pn
(k)
(k)
lei
i=1 la
;
(k)
(k)
Ua
La
(3.28)
60
0
0.8
BL
0.007
0.008
BU
0.039
0.050
n=150
A
CVL
0.955 0.026
0.954 0.014
CVU
0.012
0.008
BL
0.003
0.011
BU
0.013
0.025
n=500
A
CVL
0.989 0.003
0.985 0.002
CVU
0.002
0.002
Tabla 3.1: Medidas para comparar los lmites empricos con los asintticos empleando
1000 rplicas del modelo 3.27 para diferentes tamaos muestrales
tamao del intervalo que se quiere estimar. La segunda medida est definida por
R
1 X
A=
R
k=1
1
n
Pn
(k)
(k)
Lei j
i=1 jUei
;
(k)
(k)
jUa
La j
(3.29)
en el modelo
(3.27). Los coeficientes de variacin son aproximadamente 0, lo que significa que 5000
ordenaciones aleatorias son suficientes para calcular los lmites empricos. Los valores
de Bl son muy pequeos, del orden de 10
que la amplitud de los lmites asintticos son aproximadamente un 5% mayores que los
empricos, es decir, los lmites asintticos son ligeramente conservadores. En resumen,
se puede concluir que los resultados de las simulaciones confirman que los intervalos
de confianza asintticos (3.26) son una buena aproximacin de los intervalos empricos.
3.3.5
En esta seccin se evala la eficiencia del mtodo ARLS para detectar modelos SETAR
empleando experimentos de Monte Carlo. Para ello el mtodo ARLS propuesto es comparado con varios mtodos existentes en la literatura previa. Los mtodos empleados
en la comparacin son tanto mtodos generales para detectar no linealidad como mtodos especficos para modelos SETAR. Entre los mtodos generales, estn incluidos en la
evaluacin la propuesta de Tsay (1986), la de McLeod y Li (1983) y el contraste BDS propuesto por Brock, Dechert and Scheinkman (1996). Los contrastes para modelos SETAR
incluidos en la competicin son las propuestas de Tsay (1989) y Hansen (1996, 1999).
El nivel de significacin empleado en todos los contrastes es
mtodo ARLS est basado en los intervalos de confianza asintticos del 95%.
61
Mtodos
McLeod y Li (1983)
Tsay (1986)
Tsay (1989)
BDS2
BDS3
BDS4
Hansen Bootstrap Homoscedstico
Hansen Bootstrap Heterocedstico
Hansen Asinttico Homocedstico
Hansen Asinttico Heterocedstico
ARLS
0
0.06
0.02
0.03
0.14
0.12
0.15
0.04
0.03
0.19
0.01
0.06
0.25
0.04
0.14
0.33
0.13
0.15
0.10
0.06
0.04
0.29
0.02
0.41
0.5
0.07
0.29
0.60
0.15
0.16
0.11
0.15
0.12
0.40
0.06
0.96
0.75
0.13
0.59
0.94
0.32
0.24
0.22
0.36
0.27
0.62
0.21
1.00
1
0.22
0.89
1.00
0.56
0.44
0.35
0.76
0.68
0.90
0.56
1.00
Tabla 3.2: Tasa de deteccin para diferentes contrastes en datos generados empleando
el modelo (3.27) para diferentes valores de
Para realizar el primer experimento se generan realizaciones provenientes del modelo (3.27) con
= (0; 0:25; 0:5; 0:75; 1). En este experimento, los contrastes de Hansen
ya que son demasiado costosos computacionalmente. Las figuras 3.2 y 3.3 muestran las
tasas de deteccin obtenidas. Los resultados confirman que el mtodo ARLS propuesto
es el ms eficiente. Tambin puede verse como los contrastes de no linealidad generales
tienen una potencia baja para detectar no linealidad provocada por los umbrales.
62
0.9
0.8
ARLS
Tsay (1989)
Tsay (1986)
McLeod (1983)
BDS (1996) M=2
BDS (1996) M=3
BDS (1996) M=4
Tasa de deteccin
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
1.2
1.2
0.9
0.8
ARLS
Tsay (1989)
Tsay (1986)
McLeod (1983)
BDS (1996) M=2
BDS (1996) M=3
BDS (1996) M=4
Tasa de deteccin
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
rgimen 1
(1)
0
0
-0.75
-1.25
-1.25
0
0
0
-1.25
-1.25
-1.25
(1)
1
0.3
0.3
0.3
0.3
-0.3
-0.7
-0.7
-0.7
-0.7
-0.7
rgimen 2
(1)
(2)
0
1
1
1
1
1
1
1
1
1
2
0
0
0
0
0
0
0
0
0
0
(2)
1
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
0.3
r
(2)
1
2
1
2
2
1
2
1
2
1
-0.76
-0.97
-1.25
0.25
0.34
0.49
-0.2
-0.1
0.15
63
Tabla 3.3: Tasa de deteccin obtenida empleando ARLS y el contraste de Tsay (1989) y
el mejor de los resultados obtenido por los contrastes de Hansen (1996)
2500
frecuencia
2000
1500
1000
500
0
2.5
1.5
0.5
0.5
1.5
2.5
64
3.4
para cada
Yt
j^
d.
De-
ordenacin de los casos en el orden descendiente de la variable Yt d . Denotaremos la secuencia de las estimaciones adaptativas como ^ , j = 1; ::; p. El uso de
j
d,
Paso 4. Estimar el valor del umbral r para cada valor del delay d entre los candidatos rasc
y rdesc . Para ello los conjuntos rasc y rdesc , y sus respectivas distancias hasc y
hdesc , son combinadas. Si hay candidatos que repiten en ambos conjuntos rasc y
rdesc , sus distancias correspondientes en hasc y hdesc son sumadas. Entonces, la
estimacin del umbral r es el candidato con una distancia ms grande.
65
Paso 5. Para cada valor de d, ajustar un modelo SETAR empleando los valores estimados
de r, si los hubiera. El orden autorregresivo en cada rgimen es seleccionando empleando el criterio de seleccin de modelos propuesto por Galeano y Pea (2007).
Paso 6. Repetir los Pasos 2-5 sobre las series residuales obtenidas en el Paso 5, cuando
Yt
r y Yt
paso ser realizado separando los residuos de cada rgimen y analizando cada
rgimen por separado. El procedimiento es repetido hasta que no se encuentre
ningn umbral adicional.
Paso 7. Seleccionar el modelo SETAR final. Si varios modelos SETAR son detectados para
diferentes valores de d, el modelo SETAR final es seleccionado usando el criterio
de Galeano y Pea (2007).
700
600
Frecuencia
500
400
300
200
100
0.5
0.5
1.5
Figura 3.5: Histograma de los umbrales estimados empleando Aut-ARLS sobre 1000
rplicas del modelo (3.30)
La eficiencia del mtodo Aut-ARLS es evaluada mediante simulaciones. El primer
experimento consiste en simular 1000 replicas del modelo SETAR(3;[2,3,1],2),
Yt =
8
>
<
>
:
0:7Yt
0:2Yt
0:8Yt
+ 0:6Yt
(3)
et
N(0;
siendo
(j)
(j)
+ 0:1Yt
donde la secuencia et
(j) ),
(1)
, si Yt
+ et
0:3Yt
(2)
et
, si
, si Yt
0:5;
0:5 < Yt
2
2;
(3.30)
> 2:
ARLS es aplicado a los datos simulados, obteniendo para cada rplica el parmetro d
66
2)
1 I( 0:5<Yt
0:5)
2 I(0:5<Yt
2)
)Yt
(3.31)
+ et ;
2.
1
0.9
Tasa de deteccin
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1
0.8
0.6
!2
0.4
0.2
0
0.1
0.2
0.3
3.5
0.4
0.5
0.6
0.7
0.8
0.9
obtenida empleando
67
Porcentaje de acierto
100%
80%
60%
40%
20%
0%
1
0.8
0.6
!2
0.4
0.2
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
!1
3.5.1
Linces canadienses
3.5
yt
2.5
1.5
1
21
41
61
81
101
114
68
Propuesta
Tsay (1989)
Tong (1990)
Aut-ARLS
Delay
2
2
2
Umbral
(2:373; 4:154)
3:116
3:2639
Ordenes SETAR
(1; 7; 2)
(7; 2)
(3; 2)
AIC
347:7
337:6
353:1
BIC
322:4
315:2
339:0
Tabla 3.4: Modelos propuestos por Tsay, Tong y Aut-ARLS con sus respectivos AIC y
BIC
Aplicamos pues la herramienta Aut-ARLS a los datos transformados por logaritmos,
seleccionando como orden autorregresivo del modelo TV-AAR (3.2) a estimar p = 2 y
como variable umbral el segundo retardo Yt
2.
detectado es 3:2639.
Figura 3.9: Deteccin del umbral en los datos de los linces canadienses empleando AutARLS
La tabla 3.4 resume el modelo propuesto por Aut-ARLS y los modelos propuestos en
los estudios previos de Tong (1990) y Tsay (1989). Los valores mnimos correspondientes
a los criterios AIC y BIC son encontrados para el modelo propuesto por Aut-ARLS.
3.5.2
Manchas solares
Esta popular serie de datos consiste en el nmero de manchas solares anuales observadas desde 1700 a 2008. Los datos estn disponibles en la pgina web del National
Geophysical Data Center. Para realizar la identificacin del modelo SETAR han sido empleadas las observaciones pertenecientes al periodo de tiempo que abarca desde 1700
hasta 1920, debido a que estas fueron las observaciones que posea Tong (1983). De esta
manera nos garantizamos que no poseemos mayor informacin que en los estudios previos. La figura 3.10 muestra el nmero anual de manchas solares.
Si aplicamos Aut-ARLS, la herramienta selecciona como orden autorregresivo un
69
las figuras 3.11a y 3.11b muestran las estimaciones de las ordenaciones ascendentes y
descendentes, respectivamente. En la ordenacin ascendente, la observacin 30.7 es
el principal candidato a ser seleccionado como umbral, mientras que en la ordenacin
descendente existen varios candidatos. Aut-ARLS selecciona como valor del umbral
30:7, empleando los criterios explicados anteriormente.
1.6
!1"
!1"
1.8
1.5
1.4
0.2
!3"
!3"
0.3
0.1
0
0.1
0.4
0.5
t
!2"
!2"
0.6
0.8
1
1
1.2
0
20
30,7
40
60
yt3
80
100
120
140
02
20
32,3 34,8 40
60
yt3 80
100
120
140
Figura 3.11: Deteccin del umbral empleando Aut-ARLS para los datos de las manchas
solares
Una vez que el umbral ha sido seleccionado, un modelo SETAR puede ser estimado.
Aut-ARLS busca ms posibles umbrales en los residuos de cada rgimen, pero ningn
umbral adicional fue encontrado. Para comparar el modelo seleccionado por Aut-ARLS
hemos empleado los modelos SETAR propuestos por Tsay (1989) y Tong (1983) para
obtener predicciones fuera de la muestra del ndice de manchas solares durante el pe-
70
Propuestas
Delay
Umbral
rdenes SETAR
AIC1700-1920
Tong (1983)
Tsay (1989)
Aut-ARLS
3
2
3
36.6
(34.8, 70.9)
30.7
(3,11)
(11,10,10)
(7,11)
1083.8
1064.1
1045.9
EMA1921-2008
h=1
h=2
12.31 12.42
11.74 11.87
11.37 11.47
RECM1921-2008
h=1
h=2
16.59 16.69
15.52 15.61
15.33 15.42
Tabla 3.5: Modelos propuestos por Tsay, Tong y Aut-ARLS con sus respectivos AIC,
error medio absoluto y raz del error cuadrtico medio.
riodo de tiempo 1921-2008. La tabla 3.5 resume los resultados para los modelos propuestos. Los valores del AIC fueron hallados por Tsay (1989) con los datos del periodo
de tiempo 1700-1920, mientras que para las predicciones fuera de la muestra son calculados la raiz del error cuadrtico medio (RECM) y el error medio absoluto (EMA) para
horizontes de prediccin h = 1; 2. El modelo propuesto por Aut-ARLS tiene menor
valor del AIC, el RECM y el EMA que las propuestas de Tong y Tsay.
3.5.3
Una de las principales caractersticas de los modelos SETAR es que permiten la modelizacin de ciclos asimtricos en los datos, por ello su utilidad en el campo de la economa
ha sido ampliamente investigada. Entre las distintas series econmicas analizadas se
encuentra la del Producto Nacional Bruto (PNB) cuatrimestral de Estados Unidos. El
anlisis de los datos del PNB se realiza sobre la tasa de crecimiento, calculada mediante
Yt = log (Xt )
log (Xt
1) ;
Yt =
8
>
>
>
>
<
0:015
(1)
1:076Yt
0:006 + 0:63Yt
>
0:006 + 0:438Yt
>
>
>
:
0:004 + 0:443Yt
+ et
1
1
0:756Yt
(3)
et
(4)
et
(2)
et
; si Yt
Yt
; si Yt
> Yt
y Yt
; si Yt
Yt
y Yt
>0
; si Yt
> Yt
>0
(3.32)
que permite explicar la evolucin del PNB en trminos de periodos de recesin y expansin econmica. En su trabajo Tiao y Tsay (1994) muestran cmo en determinados periodos el modelo SETAR predice mejor que un modelo lineal. Pea y Rodrguez
(2005b) analizaron la serie empleando diferentes tipos de modelos lineales con un modelo SETAR. Para comparar las diferentes propuestas realizaron predicciones fuera de
71
0.05
0.04
0.03
Yt
0.02
0.01
0.01
0.02
0.03
20
40
60
80
100
120
140
160
180
200
220
Figura 3.12: Tasa de crecimiento del producto nacional bruto de Estados Unidos desde
1947 a 2003.
Yt =
0:0031 + 1:0345Yt
0:0045 + 0:2340Yt
(1)
1
1
+ et
+
(2)
et
; si Yt
0:0084
; si Yt
> 0:0084
(3.33)
(04=49)
+ w1 It
(04=70)
+ w2 It
w3
1
(01=70)
It
(02=78)
+ w4 St
(3.34)
+ et ;
siendo los wi el tamao de los atpicos cuya influencia vendr dada por la variable
(k)
impulso It
(k)
= 0; t 6= k; Ik
(k)
= 1, y la variable escaln St
= 1; t
k; y cero en caso
contrario. Pea y Rodrguez (2005b) muestran que el modelo que obtiene menor error
cuadrtico medio es el autorregresivo con los atpicos ajustados (3.34), mejorando a los
modelos SETAR propuestos.
Se aplica el procedimiento Aut-ARLS a la tasa de crecimiento del PNB para comprobar si se puede obtener un modelo SETAR mejor que las propuestas previas, encontrando el modelo SETAR con 4 regmenes siguiente
8
(1)
>
0:0078 + 0:3927Yt 1 + et
>
>
>
(2)
< 0:0040 + 0:3034Y
t 1 + 0:1741Yt 2 + et
Yt =
(3)
>
0:0068 + 0:5398Yt 1 0:8094Yt 2 + et
>
>
>
(4)
:
0:0071 + 0:2638Yt 1 + et
; si
Yt
0:0075 y Yt
; si
Yt
0:0075 y Yt
>0
; si
Yt
> 0:0075 y Yt
; si
Yt
> 0:0075 y Yt
>0
(3.35)
En la tabla 3.6 se muestra el error cuadrtico medio de los diferentes modelos. Como
vemos, el modelo SETAR propuesto por Aut-ARLS mejora a las anteriores propuestas
72
Propuestas
Tiao y Tsay
Pea y Rodrguez
Pea y Rodrguez
Aut-ARLS
Modelo
SETAR
AR con atpicos
SETAR
SETAR
ECM01/01-02/03
3:08 10 5
1:67 10 5
4:66 10 5
1:33 10 5
Tabla 3.6: Error cuadrtico medio de los errores de prediccin del PNB EE.UU..
existentes. Esto muestra que la eficiencia del modelo SETAR depende en gran manera
de una correcta estimacin, lo que no es sencillo de obtener.
3.6
Captulo 4
4.1
Energa elica
La estimacin de la densidad predictiva depender de los datos con los que se est
trabajando. Por ejemplo, si los residuos del modelo empleado son gaussianos, el problema de estimar la densidad predictiva quedar reducido a la estimacin de la media
y la varianza condicionales. Sin embargo, esto no ser adecuado en otras ocasiones
en las que, por ejemplo, se pueden encontrar densidades predictivas no gaussianas.
El objetivo de este captulo es mejorar la estimacin de la densidad predictiva de las
predicciones puntuales de potencia elica. Es decir, para unas predicciones puntuales
proporcionadas por cierto agente, queremos estimar su distribucin condicionada.
Para analizar los diferentes mtodos propuestos a lo largo del captulo vamos a emplear datos de potencia elica media producida horariamente en 6 parques elicos dife73
74
rentes. Para cada uno de dichos parques elicos tendremos la produccin media horaria
observada y las predicciones de dicha produccin a diferentes horizontes. Desconocemos cmo han sido calculadas las predicciones, por lo que no tenemos ninguna informacin previa acerca de las propiedades de los predictores ms all de lo que digan los
datos disponibles. La frecuencia de dichos datos es horaria.
4.1.1
1
0.9
0.8
0.7
pt
0.6
0.5
0.4
0.3
0.2
0.1
0
0
2000
4000
6000
8000
t
10000
12000
14000
16000
75
El objetivo del captulo es proponer un procedimiento para estimar la densidad predictiva de las predicciones para diferentes horizontes de prediccin. En la figura 4.2
vemos los grficos de caja de la potencia medida para diferentes niveles de las predicciones. En dichas figuras vemos cmo existen asimetras y varianzas que dependen
del nivel de prediccin independientemente del horizonte. Es decir, los errores de
prediccin tienen algunas caractersticas que pueden observarse a cualquier horizonte
de prediccin. Utilizaremos este tipo de patrones en el mtodo propuesto.
(a) h=1
(b) h=24
Figura 4.2: Grfico de caja para de la potencia medida respecto a diferentes niveles de
la prediccin puntual
4.1.2
Notacin
Para facilitar la lectura del captulo, vamos a introducir la notacin empleada a lo largo
del mismo. Dado el carcter estocstico del viento, la potencia elica generada durante
un periodo de tiempo puede interpretarse como un proceso estocstico, cuyos valores
observados sern denotados por pt . Por simplicidad en la notacin siempre usaremos
pt , tanto para referirnos al proceso como a los valores observados. El objetivo del tra-
76
ser
(j)
(0)
mt+hjt
mt+hjt =Et
4.2
=Et et+hjt . Los momentos centrales del error de prediccin et+hjt sern
et+hjt
(0)
mt+hjt
, donde j = 2; 3; :::
77
78
dichos momentos es realizada de forma recursiva y con parmetros que cambian con el
tiempo.
4.3
Para realizar una estimacin parmetrica de la densidad predictiva ser necesario realizar la estimacin de los momentos condicionados. La estimacin de los momentos
condicionados ser efectuada mediante modelos de regresin en los cuales los regresores sern las predicciones puntuales de la potencia elica.
Entonces, el modelo de regresin empleado para estimar los momentos condicionados es
eM
t+hjt =
0;t+h
bt+hjt
1;t+h p
b2t+hjt
2;t+h p
b3t+hjt
3;t+h p
+ vt+h ,
(4.1)
cero, es decir, mt+hjt =E et+hjt = 0. En este caso, los momentos centrales condicionados sern
h
i
(M )
mt+h = Et eM
t+hjt ;
(4.2)
periodos de tiempo, es decir, mt+hjt 6= 0. Por ello, se realiza una correccin del sesgo,
por lo que para calcular los momentos centrales se emplea el modelo
eeM
t+hjt =
0;t+h
donde eeM
t+hjt = et+hjt
+
(0)
bt+hjt
1;t+h p
mt+hjt
b2t+hjt
2;t+h p
para M = 2; 3; :::
b3t+hjt
3;t+h p
+ vt+h ,
(4.3)
0.26
79
0.01
0.014
0.24
0.012
0.005
0.22
0.01
0.2
0.18
Cuarto momento
Tercer momento
Segundo momento
0.005
0.16
0.14
0.008
0.006
0.01
0.12
0.004
0.1
0.015
0.08
0.06
0.02
0
0.2
0.4
0.6
0.8
.,.'
1=
0
0.002
Media
0595%percentiles bootstrap
0.2
0.4
0.6
0.8
0.2
0.4
Prediccin
Prediccin
0.6
0.8
Prediccin
4.3.1
El objetivo del mtodo propuesto es ir calculando la senda de distribuciones predictivas ft+h para un horizonte h, es decir, habr que ir estimando de manera recursiva los
momentos condicionados. Para ello se ha desarrollado un procedimiento adaptativo.
La estimacin del modelo (4.3) se realiza de manera adaptativa empleando el mtodo
de mnimos cuadrados recursivos. Por simplificar la notacin reescribimos (4.3) en
forma matricial, tal que
0
yt+h = Xt+h
t+h
(4.4)
+ vt+h ;
t+h
=(
0;t+h ;
1;t+h ;
2;t+h ;
0
3;t+h )
1
Mt+h
b t+h = b t+h
0
Xt+h
b t+h
1
+ Mt+h
Xt+h v^t+h ;
(4.5)
1
Mt+h
=
1
t+h
1
Mt+h
1
Mt+h
1
1
0
1 Xt+h Xt+h Mt+h
1
0
t+h + Xt+h Mt+h
1 Xt+h
(4.6)
80
donde
t+h
biando a lo largo del tiempo. El factor de olvido empleado en este trabajo es el propuesto por Snchez (2006a), que est basado en la distancia de Cook.
Como la variable aleatoria con la que trabajamos es la potencia elica hemos de acotar su estimacin para no obtener valores fuera del intervalo [0; 1]. Es fcil comprobar
que las acotaciones ser
M
b
eet+hjt
8 h
<
pbM ; 1 pbt+hjt
h t+hjt
i
2
: 0; 1 pbt+hjt M
; si M es impar
; si M es par
(4.7)
En la figura 4.4 podemos ver la senda de estimaciones de los 4 primeros momentos centrales durante un periodo de tiempo, para diferentes horizontes de prediccin.
Adems en la figura 4.5 podemos ver la asimetra y curtosis asociadas a dichos momentos centrales. En alguno de los grficos hemos tenido que emplear diferentes escalas en
los ejes de las ordenadas, para facilitar ver la evolucin de los momentos, puesto que
segn aumenta el horizonte de prediccin, los valores sern mayores.
4.4
En la seccin 4.1.1 mostramos que la distribucin de la potencia tiene varias caractersticas que deberemos de tener en cuenta a la hora de seleccionar las distribuciones con
las que trabajaremos, como son que es acotada, que es unimodal, que es condicionalmente asimtrica, etc. Como la potencia producida est acotada no se puede emplear
la distribucin Normal, por ello hemos empleado dos posibles opciones basadas en la
Normal como son la Normal Truncada y la Normal Censurada. Estas distribuciones
normales con soporte acotado presentan ya diferentes asimetras y curtosis que podran
ser adecuadas para nuestro problema.
Otra distribucin apropiada para nuestros , ser la Beta, ya que est acotada en [0; 1]
y se puede ajustar a fenmenos asimtricos. Por ltimo, emplearemos la distribucin
de Mxima Entropa, ya que tambin nos permitir obtener una densidad acotada y nos
es muy flexible para adaptarse a momentos condicionados cambiantes.
4.4.1
y desviacin
81
0.14
h=1
h=3
h=6
h=12
0.9
h=1
h=3
h=6
h=12
0.12
0.8
0.1
0.7
0.6
(2)
mt+h|t
m(1)
t+h|t
0.08
0.5
0.06
0.4
0.3
0.04
0.2
0.02
0.1
10
15
20
25
t
30
35
40
45
50
10
15
20
25
t
30
35
40
45
50
1.8
x 10
0.03
1.5
x 10
0.06
h=1
h=3
h=6
h=12
0.5
0.02
m(4)
, h=3, 6, 12
t+h|t
0.04
0.03
1.8
3.6
m(4)
, h=1
t+h|t
m(3)
, h=1,3
t+h|t
m(3)
, h=6, 12
t+h|t
h=1
h=3
h=6
h=12
0.06
0
10
15
20
25
t
30
35
40
45
50
10
15
20
25
t
30
35
40
45
0
50
f (y) =
(4.8)
; a < y < b:
(N T )
2
(N T )
donde
24
[a
]
h
(4.9)
[b
b
]
a
5;
(4.10)
82
10
50
h=1
h=3
h=6
h=12
h=1
h=3
h=6 200
h=12
Asimetra h=6
Curtosis, h=1, 3, 6
10
Curtosis, h=12
Asimetra, h=1,3,12
20
50
10
20
5
10
15
20
25
t
30
35
40
10
100
50
45
10
15
(a) Asimetra
20
25
t
30
35
40
45
50
(b) Curtosis
(4.11)
(N T )
(N T )
b
^
a
;
^
(4.12)
^ ^2 ;
(4.13)
^=a
donde
1
(4.14)
83
(N T )
tiva ft+h . En la figura (4.6) podemos ver un ejemplo de la senda de estimaciones ft+1
para diferentes periodos de tiempo.
(a) h=1
(b) h=3
(c) h=6
(d) h=12
4.4.2
Sea y una variable aleatoria con funcin de densidad ( ) Normal de media y desviacin
y ( ) su correspondiente funcin de distribucin. Entonces, la variable y 0 2 R = [a; b],
84
donde
(4.15)
En este caso, las colas de la Normal que sobrepasen el intervalo en el que la variable
est acotada se acumulan en los extremos. Los momentos de la variable censurada son
(Cohen, 1991)
(N C)
2
(N C)
= a ( 1) + [ ( 2)
( 1 )] ( +
= a2 ( 1 ) + [ ( 2 )
[[a
( 1)
( 1 )]
[b
) + [1
+2
( 2 )] b:
(4.16)
(4.17)
( 2 )] b2
( 2 )] + [1
2
(N C) ;
donde
( 2)
( 2)
( 1)
:
( 1)
(4.18)
b
^
^=a
a
;
^
(4.19)
^ ^2 ;
(4.20)
solo que la estimacin de ^1 y ^2 , en esta ocasin ser diferente. Para hallar los momentos de la variable sin censurar, dicha estimacin tendr que ser realizada mediante un
procedimiento iterativo descrito en Cohen (1957, 1991).
El primer paso importante en un proceso iterativo es obtener una buena estimacin
inicial que est prxima a la solucin ptima, para que de esta manera el nmero de
0
0
iteraciones sea el menor posible. Como valores iniciales ^ y ^ , Cohen (1957) emplea
1
^0 = c1 y 1
1
N
^0 = c2 ;
2
N
(4.21)
85
^i+1 v1 =w
donde v1 =
i
1
i
2
1 v1 =w
i
1
(N C)
i
2
[(
+
i
1
a, w = b
i
2
)v1 =w+ i2 ]
a, s2 =
i
1
i
2
2
(N C)
=
=
[(
i
1
i
2
)v1 =w+ i2 ]
(4.22)
2s2
c1
n
c2
n 1
^i
^i
(4.23)
^i
^i
a partir de ellos se buscarn las estimaciones de los momentos muestrales sin censurar.
Es importante notar que al estimar los momentos empleando los datos que poseemos,
obtendemos los momentos correspondientes o bien a la muestra truncada o bien a la
censurada, dependiendo del caso en el que estemos. Por ello, es necesario resolver el
sistema que nos permita calcular el valor de los momentos
de la distribucin sin
truncar o sin censurar. No es infrecuente encontrar trabajos donde se ignora este problema.
(N C)
para
4.4.3
Distribucin Beta
Sea y una variable que sigue una distribucin Beta( ; ), entonces su funcin de densidad es
f (y) =
1 [1
y]
B( ; )
; 0 < y < 1;
(4.24)
86
(a) h=1
(b) h=3
(c) h=6
(d) h=12
2
2
(4.25)
funcin de densidad Beta ft+h se calcula empleando (4.24). En la figura 4.8 podemos
(B)
87
(a) h=1
(b) h=3
(c) h=6
(d) h=12
4.4.4
La entropa puede ser vista como una medida de la incertidumbre para una funcin de
densidad (Shannon ,1948)
S=
(4.26)
Jaynes (1957) emple este concepto para proponer una distribucin de probabilidad
que minimice la informacin previa necesaria, que ser aquella que maximice la entropa de Shannon. Entonces, la funcin de densidad de mxima entropa f (y) definida
en el intervalo [a; b] es aquella que cumpla
max
s:a:
Rb
Rb
Rab
a
f (y)dy = 1
(4.27)
y i f (y)dy = mi ; i = 1; :::; M;
donde los mi son los M primeros momentos respecto al origen. Jaynes (1957) muestra
que la forma analtica de la funcin de densidad de mxima entropa f (y) es
88
f (y) = exp
"
M
X
iy
i=1
(4.28)
donde
=
ln
"Z
M
X
exp
y los multiplicadores
1 ; :::;
iy
i=1
(4.29)
dy ;
no lineales
"Z
y exp
M
X
iy
i=1
dy
# "Z
M
X
exp
iy
i=1
dy
= mj ; j = 1; :::; M:
(4.30)
m1 = m1
(0)
mj
mj1 ( 1)j
= mj
0
1 ; :::;
0
M.
Pj
( 1)k j!
1
k=1 k!(j k)!mk m(0)
1 j k
1 ; :::;
(4.31)
0
1
= ::: =
0
M
= 0.
Pl
j
i=1 ai xi
m0j
Pl
exp
i=1 ai exp
PM
j=1
PM
j=1
j
j xi
j
j xi
= Rj ; j = 1; :::; M;
(4.32)
donde ai son los multiplicadores de integracin numrica, l es el nmero de intervalos empleados en dicha integracin numrica y Rj son los residuos normalizados empleados en la resoluciones de las ecuaciones simultneas (4.32).
89
0.
4.4.5
En la figura 4.10 podemos ver varios ejemplos de las diferentes estimaciones obtenidas
en un determinado instante de tiempo para diferentes horizontes de prediccin. Para
h = 1 vemos un ejemplo en el que todas las distribuciones funcionan de manera similar
puesto que nos encontramos en mitad del intervalo y la desviacin es pequea. En el
ejemplo para un h = 3 vemos las diferencias existentes cuando nos encontramos en un
extremo, diferencias que se irn acrecentando segn aumenta el horizonte y con ello la
desviacin como vemos en los grficos restantes.
90
(a) h=1
(b) h=3
(c) h=6
(d) h=12
4.5
Existen multitud de herramientas para evaluar el correcto funcionamiento la una secuencia de estimaciones de densidades predictivas. Se pueden clasificar los diferentes
mtodos en dos tipos distintos, por una parte estn aquellos mtodos que sirven para
comprobar que la densidad predictiva estimada es correcta. Estos son mtodos necesarios, pero no suficientes pues no garantizan un buen comportamiento predictivo futuro.
Por ello son necesarios otro tipo de mtodos que comparen entre diferentes densidades
predictivas y digan cul es la ms eficiente.
4.5.1
Comprobacin de la estimacin
91
16
100
14
12
80
10
ft+h
ft+h
60
8
40
4
20
2
0
0.45
0.5
0.55
pt+h
0.6
0
0
0.65
0.01
0.02
0.03
0.04
0.05
pt+h
0.06
0.07
0.08
0.09
0.1
0.7
0.8
0.9
50
MEP
NT
Beta
NC
Prediccin
Observado
45
40
35
t+h
25
ft+h
30
20
15
2
10
1
5
0
0
0.05
0.1
0.15
0.2
0.25
p
0.3
0.35
0.4
0.45
0.5
0
0
0.1
0.2
t+h
0.3
0.4
0.5
pt+h
0.6
Yt+h
ft+h dYt ;
(4.33)
(1952) prob que los valores PIT fut+h g sern un proceso independiente e idntica-
mente distribuido segn una distribucin Uniforme U [0; 1]. El mtodo PIT propuesto
por Dawid (1984) empez a ser ampliamente usado a partir del trabajo de Diebold et
al. (1998) que populariz su uso. A partir de este trabajo se han propuesto diferentes procedimientos para evaluar diferentes propiedades estadsticas de la secuencia de
densidades predictivas se han ido proponiendo. En Corradi y Swanson (2006) se hace
una amplia revisin de este tema. Ms recientemente Gonzlez-Rivera et al. (2011)
proponen una ampliacin para el caso multivariante.
Durante este trabajo, como herramienta para evaluar la secuencia de estimaciones
92
predictivas hemos empleado el mtodo PIT. Para comprobar que los valores PIT siguen
una distribucin uniforme hemos realizado, como se hace habitualmente, el histograma
de los valores PIT obtenidos. Otra posible representacin, quizs ms util para comparar secuencias de densidades predictivas diferentes es obtener un grfico de los percentiles empricos del proceso fut+h g obtenido respecto a los percentiles nominales esperados.
Hamill (2001) muestra un ejemplo del funcionamiento del mtodo PIT como mtodo
de evaluacin. En el ejemplo, emplea cuatro densidades predictivas diferentes. Una es
la ideal y las otras tres son densidades sesgadas. En todos los casos, el mtodo PIT nos
dice que las cuatro distribuciones son correctas a pesar de que tres de ellas no lo son.
Esto es debido a que el mtodo PIT es una condicin necesaria pero no suficiente, por
lo que se necesitan emplear otros mtodos que permita distinguir cual es el predictor
ideal.
4.5.2
El concepto de verificacin de las predicciones fue introducido en el campo de la metereologa por Jolliffe y Stephenson (2003) y se basa en la idea de obtener medidas que
permiten la evaluacin de las densidades predictivas. La mayora de las medidas existentes se basan en el Brier Score, introducido por Brier (1950). Sea Ft la funcin de
distribucin acumulada predictiva de la potencia elica en el instante de tiempo t y sea
pt el valor observado en dicho instante de tiempo, entonces el Brier Score se calcula
mediante
BS (x) =
N
1 X
[Ft
N
H (x
pt )]2 ;
(4.34)
t=1
donde H(x
caso contrario, siendo x el dominio de pt . El Brier Score es uno de los mtodos conocidos como Scoring Rules. Estos mtodos asignan una puntuacin numrica a la densidad
predictiva, basandose en el concepto de concentracin. Esto es, una distribucin predictiva ms concentrada, nos dar predicciones mejores. As pues, un menor valor del
Brier Score nos dar una densidad predictiva mejor.
Diferenciar cul de las densidades predictivas alternativas es mejor puede ser complicado a partir slo del Brier Score. Por esta razn, es aconsejable una medida que nos
diga cual de las distribuciones acumular menor valor Brier Score. Existen multitud de
medidas que permiten esta tarea. En Gneiting y Raftery (2007) podemos ver una amplia
revisin. En este trabajo hemos empleado la medida propuesta por Matheson y Winkler
(1976), el CRPS (Continuous Ranked Probability Score) que vendr definido por
CRP S =
BS (x) dx;
93
(4.35)
la cual, al ser una medida asociada al Brier Score, nos dar como mejor densidad predictiva a aquella que tenga un menor valor CRPS.
4.6
como densidad predictiva aquella que tenga menor valor del Brier Score predicho
en pbt+hjt .
(min CRP S)
donde 0 <
dt+1 = BS
dt + (1
BS
) BSt ;
= 0:9.
94
4.7
Una vez estimadas las diferentes sendas de densidades predictivas empleando las diferentes distribuciones y los criterios de seleccin anteriormente detallados, pasamos
a evaluar las diferentes estimaciones realizadas. Poseemos los valores histricos de la
potencia media generada horariamente por 6 parques elicos. Adems, para cada una
de estas potencia tenemos la serie de sus predicciones hasta un horizonte de prediccin
h = 24: El tamao de los ficheros vara, siendo 18937, 3649, 2118, 8658, 5047 y 3220.
Comenzaremos viendo los resultados para el parques elico con ms observaciones
disponibles, el Parque 1. En las figuras 4.11, 4.12, 4.13 y 4.14 mostramos los histogramas de los valores PIT obtenidos para las diferentes distribuciones ajustadas para el
Parque 1 a horizontes de prediccin h = 1; 6; 12; 24. Como dijimos anteriormente si la
distribucin estimada es correcta esperamos que los valores PIT sigan una distribucin
uniforme, por lo que el histograma deber de tener forma de rectngulo. Como vemos
en los diferentes grficos la distribucin con mayores problemas es la Normal Truncada,
puesto que acumula un gran nmero de valores prximos al cero. Las dems distribuciones en general, funcionan de manera correcta, especialmente la distribucin MEP y
las densidades estimadas mediante los criterios de seleccin detallados en la seccin
anterior.
Mediante la representacin de los valores PIT podemos ver si las distribuciones estimadas son adecuadas, pero no podemos comprobar su eficacia. Para ello empleamos
los mtodos para la verificacin de densidades predictivas. Una opcin es comparar los
diferentes valores que toma el Brier Score para las distintas distribuciones empleadas,
siendo la mejor distribucin aquella que menor Brier Score tenga. En la figura 4.15 vemos los resultados para diferentes horizontes de prediccin. Como vemos a horizontes
1 y 6 la distribucin MEP obtiene menores valores, pero a horizontes mayores los resultados son ms confusos puesto que las diferentes distribuciones obtienen valores
similares.
Para comprobar de manera ms exacta el resultado observado con la representacin
del Brier Score, vemos los valores que toma el CRPS. En la figura 4.16a vemos cmo
segn aumenta el horizonte de prediccin la diferencia entre las distintas distribuciones
se va reduciendo. En general, podemos concluir que la mejor distribucin empleada es
la MEP, puesto que tiene el valor mnimo excepto a horizonte 24 en el cual la distribucin M in CRP S obtiene un valor ligeramente menor.
Para resumir los resultados obtenidos en los 6 parques elicos empleados vamos
a agupar los resultados en un nico grfico por horizonte. Para ello calculamos los
95
percentiles de los valores PIT estimados para cada distribucin para cada uno de los
parques y a continuacin hallamos la diferencia de la media de los 5 parques restantes
respecto a los percentiles nominales. En la figura 4.17 vemos los resultados obtenidos.
Como puede verse en estas figuras, segn aumenta al horizonte de prediccin casi todas
las distribuciones van alejandose del cero, es decir la diferencia entre los percentiles empricos y el ptimo se va agrandando. Sin embargo, la distribucin del MEP permanece
siempre prximo al cero, confirmando los resultados observados en el Parque 1. Por ltimo, en la figura 4.16 podemos ver los valores del CRPS obtenidos para los diferentes
parques elicos. Como vemos la mejor distribucin es la MEP, puesto que, en general,
obtiene el menor valor en los diferentes parques. Vemos adems resultados prometedores empleando los criterios de seleccin de distribuciones, especialmente empleando
el mnimo CRPS. Como vemos asumir un tipo de distribucin a este tipo de datos no
parece buena idea, puesto que dependiendo del parque la Normal Truncada, la Normal
Censurada o la Beta puede dar buenos o malos resultados, dependiendo de los datos.
4.8
96
distribucin condicionada esta ir cambiando dependiendo del valor anterior. Otro resultado interesante, sera la obtencin de un criterio formal para que el nmero de momentos empleados en cada instante de tiempo fuera variando segn las caractersticas
de los datos.
Por ltimo, la seleccin de distribuciones es, como parecen indicar los resultados,
un mtodo prometedor. El uso del mnimo CRPS como criterio de seleccin de distribuciones funciona de manera eficiente sin haber empleado un mtodo de prediccin
especialmente refinado. Otra idea a explorar ser la de realizar una combinacin de diferentes distribuciones empleando el Brier Score, que nos dice que distribucin es mejor
en diferentes tramos del dominio de la variable.
97
4000
4000
3500
3500
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0
0
0.1
0.2
3500
3500
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0
0
0.1
0.2
0.3
0.4
(c) Beta
4000
3500
3500
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0.1
0.2
0.3
0.4
0.5
0.5
0.6
0.7
0.8
0.9
0.5
0.6
0.7
0.8
0.9
0.6
0.7
0.8
0.9
(d) MEP
4000
0
0
0.4
4000
0
0
0.3
0.6
(e) Mnimo BS
0.7
0.8
0.9
0
0
0.1
0.2
0.3
0.4
0.5
Figura 4.11: Histograma de los valores PIT obtenidos para diferentes densidades predictivas estimadas para un parque elico a horizonte h = 1.
98
3500
3500
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0
0
0.1
0.2
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0
0
0.1
0.2
0.3
(c) Beta
3500
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0.1
0.2
0.3
0.4
0.5
0.5
0.6
0.7
0.8
0.9
0.4
0.5
0.6
0.7
0.8
0.9
0.6
0.7
0.8
0.9
(d) MEP
3500
0
0
0.4
3500
0
0
0.3
0.6
(e) Mnimo BS
0.7
0.8
0.9
0
0
0.1
0.2
0.3
0.4
0.5
Figura 4.12: Histograma de los valores PIT obtenidos para diferentes densidades predictivas estimadas para un parque elico a horizonte h = 6.
99
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0
0
0.1
0.2
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0
0
0.1
0.2
0.3
(c) Beta
0.5
0.6
0.7
0.8
0.9
0.4
0.5
0.6
0.7
0.8
0.9
0.6
0.7
0.8
0.9
(d) MEP
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
0
0
0.4
3000
0
0
0.3
500
0.1
0.2
0.3
0.4
0.5
0.6
(e) Mnimo BS
0.7
0.8
0.9
0
0
0.1
0.2
0.3
0.4
0.5
Figura 4.13: Histograma de los valores PIT obtenidos para diferentes densidades predictivas estimadas para un parque elico a horizonte h = 12.
100
3500
3500
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0
0
0.1
0.2
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0
0
0.1
0.2
0.3
(c) Beta
3500
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0.1
0.2
0.3
0.4
0.5
0.5
0.6
0.7
0.8
0.9
0.4
0.5
0.6
0.7
0.8
0.9
0.6
0.7
0.8
0.9
(d) MEP
3500
0
0
0.4
3500
0
0
0.3
0.6
(e) Mnimo BS
0.7
0.8
0.9
0
0
0.1
0.2
0.3
0.4
0.5
Figura 4.14: Histograma de los valores PIT obtenidos para diferentes densidades predictivas estimadas para un parque elico a horizonte h = 24.
101
0.18
0.14
0.16
0.12
0.14
NT
NC
Beta
MEP
Min BS
Min CRPS
0.08
NT
NC
Beta
MEP
Min BS
Min CRPS
0.12
Brier Score
Brier Score
0.1
0.1
0.08
0.06
0.06
0.04
0.04
0.02
0
0
0.02
0.1
0.2
0.3
0.4
0.5
pt
0.6
0.7
0.8
0.9
0
0
0.1
0.2
0.3
(a) h=1
0.4
0.5
pt
0.6
0.7
0.8
0.9
(b) h=6
0.25
0.35
0.3
0.2
0.25
Brier Score
0.15
Brier Score
NT
NC
Beta
MEP
Min BS
Min CRPS
NT
NC
Beta
MEP
Min BS
Min CRPS
0.2
0.15
0.1
0.1
0.05
0.05
0
0
0.1
0.2
0.3
0.4
0.5
pt
(c) h=12
0.6
0.7
0.8
0.9
0
0
0.1
0.2
0.3
0.4
0.5
pt
0.6
0.7
0.8
0.9
(d) h=24
Figura 4.15: Valor del Brier Score obtenido para las diferentes distribuciones estimadas
en un parque elico empleando para diferentes horizontes de prediccin h.
102
0.14
0.12
0.12
0.1
0.1
0.08
0.08
CRPS
CRPS
0.14
0.06
0.06
0.04
0.04
NT
NC
Beta
MEP
Min BS
Min CRPS
0.02
12
Horizonte
NT
NC
Beta
MEP
Min BS
Min CRPS
0.02
24
(a) Parque 1
12
Horizonte
24
(b) Parque 2
0.25
0.11
0.1
0.2
0.09
0.08
0.15
CRPS
CRPS
0.07
0.1
0.06
0.05
0.04
NT
NC
Beta
MEP
Min BS
Min CRPS
--
0.05
12
Horizonte
0.02
0.01
24
----
NT
NC
Beta
MEP
Min BS
Min CRPS
0.03
(c) Parque 3
12
Horizonte
24
(d) Parque 4
0.2
0.1
0.18
0.09
0.16
0.08
0.14
0.07
0.12
CRPS
CRPS
0.06
0.1
0.05
0.08
0.04
0.06
0.03
NT
NC
Beta
MEP
Min BS
Min CRPS
0.02
0.01
12
Horizonte
(e) Parque 5
24
NT
NC
Beta
MEP
Min BS
Min CRPS
0.04
0.02
12
Horizonte
--
24
(f) Parque 6
Figura 4.16: Valor del CRPS para las diferentes distribuciones predictivas empleadas en
los diferentes parques elicos disponibles.
103
h=1
h=6
0.2
0.2
NT
NC
Beta
MEP
Min BS
Min CRPS
Ideal
0.1
0.05
0.15
0.1
Diferencia respecto al ptimo
0.15
0.05
0.1
0.05
0.05
0.1
0.15
0.2
0
NT
NC
Beta
MEP
Min BS
Min CRPS
Ideal
0.15
0.1
0.2
0.3
0.4
0.5
0.6
Percentiles nominales
0.7
0.8
0.9
0.2
0
0.1
0.2
0.3
(a) h=1
0.15
0.15
0.1
0.1
0.05
NT
NC
Beta
MEP
Min BS
Min CRPS
Ideal
0.15
0.2
0
0.1
0.2
0.3
0.4
0.5
0.6
Percentiles nominales
(c) h=12
0.8
0.9
h=24
0.2
h=12
0.1
0.7
(b) h=6
0.2
0.05
0.4
0.5
0.6
Percentiles nominales
0.05
0
0.05
NT
NC
Beta
MEP
Min BS
Min CRPS
Ideal
0.1
0.15
0.7
0.8
0.9
0.2
0
0.1
0.2
0.3
0.4
0.5
0.6
Percentiles nominales
0.7
0.8
0.9
(d) h=24
Figura 4.17: Comparacin entre los percentiles obtenidos al evaluar la senda de densidades predictivas estimadas en 5 parques elico empleando diferentes distribuciones
104
Captulo 5
5.1
106
Modelos univariantes
Seguramente el primer trabajo que predijo la potencia elica generada empleando un
modelo univariante de series temporales fue el de Brown, Katz y Murphy (1984). Su
idea fue realizar una transformacin sobre los datos de la velocidad del viento con una
frecuencia horaria mediante la raz cuadrada para as obtener normalidad en los datos.
Entonces ajustaban a los datos transformados un modelo autorregresivo y realizaban
predicciones de la velocidad del viento, mediante las que extrapolaban los valores de la
potencia empleando una curva de potencia estimada.
El modelo univariante clsico en el anlisis de series temporales lineales es el modelo
ARMA, gracias, especialmente, a la metodologa desarrollada por Box y Jenkins (ver,
Box y Jenkins, 1970; Pankratz, 1983) que permiti su modelizacin de manera sencilla.
Fellows y Hill (1990) desarrollaron un procedimiento basado en dicha metodologa para
calcular predicciones de la velocidad del viento. Otras propuestas de modelos lineales
ARMA aplicados a la energa elica son, entre muchas otras, las de Tantareanu (1992),
Kamal y Jafri (1997) y Torres et al. (2005).
Bossanyi (1985) propuso aplicar un filtro de Kalman para predecir la velocidad del
viento con una frecuencia de 1 minuto empleando los 6 valores anteriores, en la que
fue una de las primeras propuestas de modelos que emplean estimacin recursiva. El
uso de modelos no lineales, como ya explicamos en la seccin 1.2.2 tiene el problema
del clculo de las predicciones, que suele ser complejo y computacionalmente costoso.
Algunas propuestas de tcnicas no lineales aplicadas a la energa elica son Kariniotakis
et al. (1997), Kariniotakis et al. (1999) y Bale et al. (2011), en las cuales se emplean
tcnicas como Wavelets o redes neuronales.
107
5.2
La utilidad de los modelos con umbrales va ms all de su uso como funcin a trozos.
Una de sus principales ventajas es que dependiendo de la complejidad de la estructura
idenfiticada, un modelo con umbrales puede servir para modelizar funciones no lineales ms complejas. Por ejemplo, como mostraron Fan y Yao (2005, p.130), una funcin
sinusoidal puede ser aproximada por un modelo SETAR con 4 regmenes. Es decir, el
uso de modelos SETAR puede emplearse como aproximaciones de funciones no lineales
ms complejas.
En ocasiones el uso de estructuras con ms de una variable umbral nos permitir
adems poder interpretar el comportamiento de la serie a estudiar. Por ejemplo, Tiao y
Tsay (1994) propusieron modelizar el producto nacional bruto de EEUU empleando un
modelo SETAR con 4 regmenes, entre los que el proceso ir cambiando dependiendo
del valor del primer y del segundo retardo. Es decir, emplea dos variables umbral.
Para dichas variables el valor del umbral correspondiente es 0, por lo que, cada uno de
los regmenes se pueden interpretar en trminos de periodos de recesin o expansin
econmica.
Pinson et al. (2008), entre otros, muestran que la potencia elica tiene diferentes
comportamientos dependiendo de diferentes regmenes. En particular, muestran cmo
la varianza de la potencia ser ms baja a niveles bajos y altos de produccin, mientras que tomar un valor ms elevado en niveles medios. Por ello proponen emplear
diferentes modelos por umbrales con 3 regmenes, como son el SETAR, el STAR y el
MSAR. El problema principal de su propuesta es que la estimacin del los umbrales
es realizada mediante un algoritmo de bsqueda intensiva, que seleccionar aquellos
108
pt
= pt
pt
2.
los incrementos y los decrementos de potencia est justificado debido a la inercia de los
componentes mecnicos del aerogenerador, as como a otros instrumentos de control
del mismo que tendrn diferente comportamiento en las subidas y en las bajadas (ver,
p.ej., Burton et al., 2001). Para comprobar la posible existencia de un modelo SETAR
con esta estructura empleamos la herramienta ARLS descrita en 3.3.
En la figura 5.1 vemos el resultado obtenido en uno de los parques elicos estudiados al aplicar la herramienta ARLS empleando como variable umbral
pt
1.
En ese
pt
1.
cambio de rgimen en torno a 0, lo que confirma que la inercia de la potencia elica tendr un comportamiento diferente dependiendo de si est en un periodo de crecimiento
o decrecimiento.
0.993
0.992
0.991
0.99
"s(t)
0.989
0.988
0.987
0.986
0.985
0.984
0.983
0,4
0,2
0
! Pt1
0,2
0,4
109
por lo tanto, ser comprobar qu sucede cuando la potencia generada decrece, es decir
cuando
pt
(ver seccin 3.4), seleccionando el procedimiento como variable umbral el primer retardo de la potencia pt
M1
0.97
M2
M3
0.968
0.966
!s(t)
0.964
0.962
0.96
0.958
0.956
0.954
0
0.2
0.3945
0.6
0.7824
Pt1
As pues en los datos provenientes del parque analizado se ha identificado un modelo SETAR con 6 regmenes de comportamiento, cuya estructura puede verse en la
figura 5.4. En ella podemos ver los 6 regmenes de comportamiento, los 3 de la parte
superior a la diagonal se corresponden a incrementos negativos de la potencia y los 3
de la parte inferior a los incrementos positivos.
5.2.1
Una vez detectada una estructura en los datos provenientes de un parque elico hemos
de comprobar si dicha estructura puede ser extrapolada a datos provenientes de diferentes parques elicos. Para ello hemos empleado datos de potencia elica de distintas
110
1.022
0.99
0.988
0.986
M4
1.02
M6
1.018
M5
1.016
1.014
!1s(t)
!1s(t)
0.984
1.012
0.982
1.01
0.98
1.008
1.006
0.978
1.004
0.976
0
0.2
0.4
0.6
0.6514
0.8
1.002
0
Pt1
0.1
0.2
0.2988
0.4
0.5
0.6
Pt1
(a) Paso 1
(b) Paso 2
Rgimen 3
0.85
Rgimen 1
Rgimen 2
pt2
0.65
Rgimen 6
0.45
Rgimen 5
0.25
0.1
0
0
Rgimen 4
0.1
0.25
0.45
0.65
0.85
pt1
111
A todos los ficheros de datos descritos les aplicamos la herramienta Aut-ARLS para
que busque la posible existencia del modelo SETAR con 6 regmenes descrito anteriormente. El resultado fue que en los 76 ficheros de datos se encontr un modelo SETAR
con 6 regmenes. Adems, en la figura 5.5 podemos ver los grficos de caja de los umbrales detectados para todos los ficheros de datos. Como vemos, a pesar de emplear
datos de diferentes frecuencias y tipos, se encuentra una estructura similar en todos los
ejemplos.
Variable umbral ! pt1
0.5
0.5
Si ! pt1"0
0.8
0.8
0.6
0.6
0.4
0.4
0.2
0.2
Si ! pt1>0
Figura 5.5: Graficos de caja para los umbrales detectados en los 76 ficheros de datos
disponibles
5.2.2
Modelos SETAR
A la vista de los resultados, proponemos modelizar la potencia elica pt producida mediante el modelo SETAR siguiente:
8
(1)
>
AR(p1 ) + et
>
>
>
(2)
>
>
AR(p2 ) + et
>
>
>
< AR(p ) + e(3)
t
3
pt =
(4)
>
AR(p
)
+
e
>
t
4
>
>
(5)
>
>
AR(p
)
+
e
>
t
5
>
>
:
(6)
AR(p6 ) + et
1
rL
; si
pt
0 y pt
; si
pt
1 <p
0 y rL
t
; si
pt
0 y rU1 < pt
; si
pt
> 0 y pt
; si
pt
2 <p
> 0 y rL
t
; si
pt
rU1
2
rL
(5.1)
rU2
donde los valores rL y rU son calculados de manera automtica por la herramienta AutARLS para cada serie temporal concreta. Una vez seleccionados los ordenes autorregresivos p1 ,...,p6 mediante el criterio propuesto por Galeano y Pea (2007), los parmetros
sern estimados mediante el mtodo de mnimos cuadrados descrito en la seccin 2.3.1.
En general, los modelos estimados en datos provenientes de las mismas frecuencias
112
; si
pt
0 y pt
; si
pt
0 y 0:37 < pt
; si
pt
0 y 0:69 < pt
; si
pt
> 0 y pt
; si
pt
; si
pt
0:37
0:69
(5.2)
0:29
0:65
En (5.3) vemos un ejemplo de modelo estimado en un parque con datos de frecuencia 15 minutos. Como vemos la principal diferencia al aumentar la frecuencia es el
aumento del orden autorregresivo en los regmenes.
8
(1)
>
1:19pt 1 0:30pt 2 + et
>
>
>
(2)
>
>
0:01 + 1:31pt 1 0:46pt 2 + 0:14pt 3 + et
>
>
>
(3)
< 0:04 + 1:32p
0:4830pt 2 + et
t 1
pt =
> 1:59pt 1 0:69pt 2 + e(4)
>
t
>
>
(5)
>
>
0:03
+
1:25p
0:33p
>
t 1
t 2 + et
>
>
:
(6)
1:11pt 1 0:26pt 2 + 0:11pt 3 + et
5.2.3
; si
pt
0 y pt
; si
pt
0 y 0:31 < pt
; si
pt
0 y 0:77 < pt
; si
pt
> 0 y pt
; si
pt
; si
pt
0:31
0:77
;
0:26
0:77
(5.3)
Los modelos SETAR permiten que la media y la varianza del proceso cambien en el
tiempo dependiendo de los diferentes regmenes, pero dentro de los regmenes permanecern constantes. En ocasiones, como mostramos en la seccin 1.1.5, existe la posibilidad de crear un modelo que permita que la varianza cambie dentro de los regmenes,
empleando un modelo ARCH para la varianza condicionada. En esta seccin vamos a
proponer emplear un modelo SETAR en el que el trmino de error ir cambiando de
forma similar a la mostrada en el captulo 4. Es decir, dependiendo de un polinomio
de la potencia prevista cuyos parmetros cambiarn a lo largo del tiempo. De esta manera, permitiremos que los momentos condicionados de los residuos cambien a lo largo
113
del tiempo sin depender exclusivamente de los regmenes. A este modelo lo llamaremos SETAR-TVCD (Self Exciting Threshold Autoregressive with Time Varying Conditional
Density), y vendr definido por
pt = m (pt
1 ; :::; pt h )
+ (pt
(5.4)
1 ; :::; pt h ) ;
8
>
AR(p1 ) ;
>
>
>
>
>
AR(p2 ) ;
>
>
>
< AR(p ) ;
3
m (pt 1 ; :::; pt h ) =
>
AR(p4 ) ;
>
>
>
>
>
AR(p5 ) ;
>
>
>
: AR(p ) ;
6
1
rL
si
pt
0 y pt
si
pt
1 <p
0 y rL
t
si
pt
0 y rU1 < pt
si
pt
> 0 y pt
si
pt
2 <p
> 0 y rL
t
si
pt
rU1
1
2
rL
(5.5)
rU2
1 ; :::; pt k )
0;t
bt
1;t p
b2t
2;t p
b3t
3;t p
+ vt ;
donde los valores pbt sern calculados empleando el modelo autorregresivo de m (pt
(5.6)
1 ; pt 2 )
correspondiente al regimen al que pertenezca la observacin. De esta manera la estimacin de (5.4) ser realizada en dos etapas, primero estimaremos la media condicionada (5.6) dependiendo del rgimen al que pertenezca el proceso, para continuacin
estimar de manera recursiva (5.6). La estimacin recursiva se har empleando el mtodo
de mnimos cuadrados adaptativos explicado en la seccin 3.2.
5.3
Como dijimos en el captulo 2.6 realizar predicciones empleando modelos SETAR ser
complicado en la mayora de los casos. De las diferentes opciones detalladas en dicha
seccin, en esta tesis se ha empleado un procedimiento de Monte Carlo. Dicho procedimiento se basa en la simulacin de diferentes trayectorias que el proceso fpt g podra
1 ; pt 2 g
calcular las predicciones. Si queremos calcular predicciones a horizonte h = 1, la variable umbral Xt es conocida, por lo que la prediccin p^t+1jt puede ser calculada directamente empleando el modelo autorregresivo correspondiente al umbral del modelo
SETAR (5.5) al que pertenezca.
114
h
i
(j)
mt+1jt = Et+1 ejt+1jt ; j = 1; :::; M;
(5.7)
(j)
0t+1
(j)
^t+1jt
1t+1 p
(j)
^2t+1jt
2t+1 p
(j)
^3t+1jt
3t+1 p
+ vt+1 ; j = 1; :::M:
(5.8)
Estimar el modelo (5.8) no es posible, puesto que los errores de prediccin no sern
observados, ya que estamos realizando predicciones fuera de la muestra. Debido a ello
se emplearn los ltimos estimadores de los coeficientes de (5.8) dentro de la muestra, es decir, aquellos valores estimados en el instante de tiempo t condicionados a la
informacin contenida en el instante de tiempo t
ejtjt
(j)
= ^ 0tjt
(j)
+ ^ 1tjt
^tjt 1
1p
(j)
1,
^2tjt 1
1p
+ ^ 2tjt
(j)
(j)
+ ^ 3tjt
^3tjt 1
1p
+ vt :
(5.9)
(j)
mt+1jt = ^ 0tjt
(j)
+ ^ 1tjt
^t+1jt
1p
(j)
+ ^ 2tjt
^2t+1jt
1p
(j)
+ ^ 3tjt
^3t+1jt ;
1p
j = 1; :::; M:
(5.10)
Una vez estimados los momentos condicionados podemos estimar como densidad
predictiva ft+1 de la prediccin p^t+1jt las diferentes distribuciones mostradas en el captulo 4, es decir, la Normal truncada, la Normal censurada, la Beta y la de Mxima En(i)
ft+1 ,
(i)
estiman B trayectorias posibles p^t+2jt , mediante el
n
o
(i)
como variable umbral Xt+1 = p^t+1jt ; pt : Emple-
115
dictiva ft+h
1:
(j)
(j)
mt+h
(j)
1jt
= ^ 0tjt
1jt ,
(j)
(j)
(j)
^t+h 1jt +^ 2tjt h+1 p^2t+h 1jt +^ 3tjt h+1 p^3t+h 1jt ;
h+1 +^ 1tjt h+1 p
j = 1; :::; M;
(5.11)
(j)
^ tjt h+1
1jt se estima la
(i)
p^t+h 1jt , desde las que
(i)
p^t+hjt empleados para
5.4
En esta seccin se comprueba la eficacia de los modelos SETAR propuestos en las secciones 5.2.2 y 5.2.3 realizando predicciones sobre los diferentes datos de potencia elica
descritos en la seccin 5.2.1. Compararemos los modelos SETAR entre s, empleando las
diferentes distribuciones mostradas en el captulo 4. Adems, dichos modelos SETAR
son comparados con el mejor modelo lineal ARMA encontrado para cada fichero de
datos. Para ello, se ha empleado un procedimiento de bsqueda del orden ptimo del
modelo ARMA basado en la metodologa Box-Jenkins, es decir, asumiendo que el proceso es estacionario, se seleccionan los rdenes mximos que el modelo ARMA puede
tomar empleando la funcin de autocorrelacin simple y parcial. A continuacin se estiman las diferentes combinaciones posibles empleando dichos rdenes mximos y se
selecciona aqul modelo que minimiza el criterio de seleccin AIC y el BIC. Por ltimo
hemos empleado un modelo TV-AR con parmetros variables definido por
pt =
0t
1t pt 1
+ ::: +
pt pt p
+ et ;
(5.12)
116
5.5. Conclusiones
117
5.5 Conclusiones
Los resultados obtenidos mediante el clculo de predicciones en 72 ficheros de potencia
producida tanto por parques elicos como por diferentes aerogeneradores de un mismo
parque y con diferentes frecuencias de tiempo, muestran que el modelo SETAR-TVCD
propuesto es una buena alternativa para predecir la produccin elica.
Esos mismos resultados obtenidos en datos de tan diferente procedencia nos confirman que la estructura de 6 regmenes detectada por la herramienta Aut-ARLS es
adecuada para todo tipo de datos de produccin elica, sin importar la frecuencia o si
son datos sobre la produccin agregada de un parque o de la potencia desarrollada por
aerogeneradores particulares.
Adems, confirmando lo observado en el captulo 4, la distribucin de Mxima
Entropa basada en la estimacin adaptativa de los primeros cuatro momentos condicionales mejora las restantes distribuciones paramtricas empleadas en este trabajo. Las
posibles lneas de investigacin futuras se centrarn en la mejora del modelo SETARTVCD propuesto. Una posible mejora podra obtenerse encontrando un criterio de seleccin de momentos para la distribucin de mxima entropa. Otra mejora posible
es la estimacin de la media condicionada empleando un factor de olvido prximo a
1, o el uso de otro tipo de modelos como podra ser un modelo MSAR. Tambin ser
interesante realizar una evaluacin de la densidad condicionada estimada.
Por ltimo, posibles aplicaciones futuras sera probar si el patrn aqu detectado
aparece en otro tipo de datos como pueden ser parques elicos martimos (datos offshore) o en datos provenientes de los nuevos superaerogeneradores de ms de 5 GW.
h
1
2
3
4
5
6
h
1
2
3
4
5
6
NT
,0836
,1378
,1795
,2102
,2330
,2504
MEP
,0835
,1223
,1394
,1552
,1702
,1771
NT
,0835
,1293
,1589
,1813
,1988
,2128
SETAR-TVCD
NT
1,00
1,13
1,29
1,35
1,37
1,41
MEP
1,00
1,00
1,00
1,00
1,00
1,00
NT
1,00
1,06
1,14
1,17
1,17
1,20
SETAR-TVCD
Mediana
NC BETA
1,00
1,00
1,05
1,07
1,13
1,16
1,16
1,21
1,16
1,23
1,20
1,29
MEP
1,00
1,00
1,00
1,00
1,01
1,01
Mediana
NC
BETA
,0835 ,0835
,1289 ,1302
,1580 ,1621
,1802 ,1879
,1981 ,2101
,2127 ,2291
Tabla 5.2: Valor relativo de la raz del error cuadrtico medio obtenido para los 31 parques elicos horarios.
TV-AR
1,05
1,09
1,18
1,21
1,22
1,26
Media
NC BETA
1,00
1,00
1,25
1,28
1,46
1,46
1,55
1,54
1,56
1,55
1,61
1,60
Tabla 5.1: Media de la raz del error cuadrtico medio para los 31 parques elicos horarios.
TV-AR
,0873
,1336
,1639
,1876
,2069
,2229
ARMA
1,08
1,16
1,32
1,47
1,57
1,69
ARMA
,0899
,1423
,1836
,2279
,2672
,2994
Media
NC
BETA
,0836 ,0836
,1529 ,1567
,2040 ,2035
,2399 ,2387
,2659 ,2639
,2860 ,2837
118
Captulo 5. Prediccin de produccin elica empleando modelos SETAR
h
1
2
3
4
5
6
h
1
2
3
4
5
6
MEP
,0490
,0853
,1011
,1141
,1261
,1311
NT
,0490
,0853
,1115
,1357
,1578
,1791
Mediana
NC
BETA
,0490 ,0490
,0853 ,0849
,1117 ,1108
,1357 ,1342
,1584 ,1561
,1800 ,1771
MEP
,0490
,0834
,0975
,1086
,1191
,1244
NT
,0485
,0860
,1125
,1320
,1468
,1588
Media
NC BETA
1,00
1,00
1,16
1,12
1,25
1,19
1,16
1,10
1,18
1,12
1,23
1,17
MEP
1,00
1,16
1,17
1,05
1,06
1,06
NT
1,00
1,20
1,30
1,22
1,23
1,28
SETAR-TVCD
Tabla 5.4: Valor relativo del error medio absoluto obtenido para los 31 parques elicos horarios.
NT
1,01
1,33
1,51
1,46
1,51
1,60
Media
NC BETA
1,01
1,01
1,31
1,31
1,49
1,48
1,45
1,44
1,53
1,52
1,64
1,62
MEP
1,00
1,00
1,00
1,00
1,00
1,00
Mediana
NC
BETA
,0485 ,0485
,0787 ,0749
,0992 ,0936
,1157 ,1082
,1289 ,1208
,1407 ,1323
Mediana
NC BETA
1,00
1,00
1,12
1,07
1,19
1,12
1,10
1,03
1,12
1,05
1,16
1,09
NT
,0485
,0842
,1091
,1279
,1425
,1543
SETAR-TVCD
Tabla 5.3: Media del error absoluto medio para los 31 parques elicos horarios.
NT
,0490
,0933
,1266
,1532
,1750
,1932
TV-AR
1,07
1,10
1,06
1,04
1,00
1,00
TV-AR
,0519
,0772
,0887
,1092
,1161
,1209
ARMA
1,04
1,12
1,19
1,12
1,17
1,29
ARMA
,0502
,0785
,0993
,1171
,1354
,1555
Media
NC
BETA
,0490 ,0490
,0919 ,0918
,1244 ,1238
,1524 ,1515
,1770 ,1756
,1980 ,1963
SETAR
MEP
,0485
,0702
,0836
,1050
,1156
,1209
5.5. Conclusiones
119
h
1
2
3
4
8
12
16
20
24
h
1
2
3
4
8
12
16
20
24
NT
,0506
,0876
,1150
,1387
,2143
,2695
,3073
,3338
,3562
MEP
,0501
,0701
,0912
,1070
,1445
,1676
,1881
,2036
,2204
NT
,0501
,0787
,0986
,1142
,1577
,1849
,2062
,2233
,2392
SETAR-TVCD
NT
1,01
1,25
1,26
1,30
1,48
1,61
1,63
1,64
1,62
MEP
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
NT
1,00
1,12
1,08
1,07
1,09
1,10
1,10
1,10
1,09
SETAR-TVCD
Mediana
NC BETA
1,00
1,00
1,12
1,13
1,08
1,09
1,07
1,08
1,09
1,14
1,11
1,18
1,11
1,20
1,11
1,23
1,10
1,24
Tabla 5.6: Valor relativo de la raz del error cuadrtico medio obtenido para los 19 parques elicos 15 minutales.
TV-AR
1,15
1,15
1,10
1,10
1,11
1,12
1,12
1,12
1,11
MEP
1,00
1,08
1,03
1,01
1,09
1,04
1,01
1,02
1,00
Mediana
NC
BETA
,0501 ,0501
,0787 ,0789
,0985 ,0994
,1141 ,1157
,1581 ,1643
,1857 ,1978
,2082 ,2266
,2267 ,2508
,2435 ,2729
Tabla 5.5: Media de la raz del error cuadrtico medio para los 19 parques elicos 15 minutales.
TV-AR
,0576
,0809
,1007
,1177
,1601
,1879
,2104
,2284
,2445
ARMA
1,19
1,34
1,30
1,29
1,37
1,44
1,49
1,55
1,59
ARMA
,0598
,0938
,1183
,1385
,1985
,2405
,2798
,3152
,3497
Media
NC
BETA
,0506 ,0506
,0877 ,0877
,1153 ,1152
,1393 ,1392
,2170 ,2165
,2759 ,2747
,3181 ,3158
,3459 ,3433
,3698 ,3668
120
Captulo 5. Prediccin de produccin elica empleando modelos SETAR
h
1
2
3
4
8
12
16
20
24
h
1
2
3
4
8
12
16
20
24
MEP
,0671
,1228
,1607
,1938
,2785
,3410
,4017
,4544
,5181
NT
,0671
,1148
,1506
,1805
,2662
,3285
,3860
,4408
,4952
Mediana
NC
BETA
,0671 ,0671
,1147 ,1159
,1509 ,1527
,1812 ,1838
,2679 ,2725
,3305 ,3377
,3885 ,3982
,4451 ,4564
,5040 ,5167
MEP
,0671
,1144
,1439
,1687
,2377
,2904
,3413
,3854
,4370
NT
,0658
,1192
,1590
,1916
,2777
,3352
,3901
,4376
,4826
Media
NC BETA
1,00
1,00
1,02
0,99
1,04
1,00
1,05
1,00
1,06
1,01
1,08
1,03
1,09
1,05
1,10
1,06
1,14
1,11
MEP
1,00
1,00
1,00
1,01
1,02
1,03
1,04
1,04
1,06
NT
1,00
1,05
1,08
1,09
1,10
1,11
1,12
1,12
1,14
SETAR-TVCD
Tabla 5.8: Valor relativo del error medio absoluto obtenido para los 19 parques elicos 15 minutales.
NT
1,02
1,10
1,14
1,17
1,20
1,24
1,27
1,30
1,39
Media
NC BETA
1,02
1,02
1,10
1,11
1,13
1,14
1,16
1,17
1,20
1,20
1,24
1,24
1,26
1,26
1,29
1,29
1,40
1,40
MEP
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
Mediana
NC
BETA
,0658 ,0658
,1109 ,1095
,1445 ,1430
,1733 ,1712
,2518 ,2482
,3054 ,3013
,3573 ,3533
,4029 ,3994
,4533 ,4541
Mediana
NC BETA
1,00
1,00
0,99
0,98
1,00
0,99
1,00
0,99
1,01
1,00
1,03
1,02
1,04
1,03
1,05
1,04
1,10
1,10
NT
,0658
,1173
,1558
,1877
,2721
,3289
,3833
,4298
,4733
SETAR-TVCD
Tabla 5.7: Media del error medio absoluto para los 19 parques elicos 15 minutales.
NT
,0671
,1232
,1651
,2020
,2981
,3667
,4340
,4954
,5760
TV-AR
1,08
1,03
1,02
1,02
1,03
1,11
1,00
1,00
1,00
TV-AR
,0711
,1151
,1485
,1767
,2557
,3273
,3417
,3806
,4143
ARMA
1,16
1,16
1,16
1,17
1,18
1,21
1,22
1,24
1,32
ARMA
,0760
,1295
,1680
,2013
,2933
,3578
,4176
,4747
,5449
Media
NC
BETA
,0671 ,0671
,1227 ,1243
,1643 ,1656
,2010 ,2020
,2968 ,2976
,3654 ,3658
,4329 ,4330
,4948 ,4944
,5805 ,5781
SETAR
MEP
,0658
,1119
,1449
,1727
,2481
,2956
,3424
,3822
,4137
5.5. Conclusiones
121
ARMA
,0456
,0688
,0825
,0919
,1004
,1048
,1436
,1707
,1838
,2045
,2220
TV-AR
,0447
,0635
,0763
,0857
,0934
,0992
,1326
,1515
,1639
,1732
,1776
NT
,0428
,0661
,0846
,0922
,1002
,1064
,1403
,1562
,1664
,1869
,1974
MEP
,0426
,0587
,0677
,0731
,0773
,0793
,1015
,1109
,1136
,1214
,1259
NT
,0426
,0620
,0716
,0833
,0903
,0926
,1185
,1296
,1364
,1331
,1367
SETAR-TVCD
Mediana
NC
BETA
,0426 ,0426
,0619 ,0625
,0714 ,0722
,0829 ,0850
,0897 ,0935
,0923 ,0979
,1178 ,1228
,1291 ,1369
,1364 ,1469
,1352 ,1496
,1391 ,1560
MEP
,0426
,0594
,0698
,0754
,0810
,0827
,1068
,1179
,1240
,1291
,1319
Tabla 5.9: Media de la raz del error cuadrtico medio para los 21 aerogeneradores de un parque elico con una frecuencia de 10
minutos.
h
1
2
3
4
5
6
12
18
24
30
36
Media
NC
BETA
,0428 ,0428
,0675 ,0693
,0847 ,0847
,0924 ,0924
,1006 ,1005
,1071 ,1070
,1382 ,1411
,1566 ,1574
,1662 ,1662
,1866 ,1901
,1976 ,1977
122
Captulo 5. Prediccin de produccin elica empleando modelos SETAR
ARMA
1,07
1,17
1,22
1,26
1,30
1,32
1,42
1,54
1,62
1,68
1,76
TV-AR
1,05
1,08
1,13
1,17
1,21
1,25
1,31
1,37
1,40
1,43
1,41
NT
1,00
1,13
1,25
1,26
1,30
1,34
1,38
1,41
1,47
1,54
1,57
MEP
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
NT
1,00
1,06
1,06
1,14
1,17
1,17
1,17
1,17
1,20
1,10
1,09
SETAR-TVCD
Mediana
NC BETA
1,00
1,00
1,05
1,07
1,05
1,07
1,13
1,16
1,16
1,21
1,16
1,23
1,16
1,21
1,16
1,23
1,20
1,29
1,11
1,23
1,10
1,24
MEP
1,00
1,01
1,03
1,03
1,05
1,04
1,05
1,06
1,09
1,06
1,05
ARMA
,0288
,0479
,0615
,0718
,0798
,0880
,1143
,1321
,1507
,1622
,1719
TV-AR
,0288
,0433
,0553
,0642
,0708
,0812
,0958
,1140
,1210
,1221
,1271
NT
,0269
,0454
,0589
,0691
,0757
,0839
,1099
,1264
,1433
,1540
,1617
MEP
,0269
,0428
,0559
,0655
,0741
,0831
,1090
,1270
,1429
,1482
,1478
NT
,0269
,0423
,0527
,0601
,0647
,0714
,0934
,1072
,1209
,1294
,1354
Mediana
NC
BETA
,0269 ,0269
,0424 ,0424
,0552 ,0552
,0643 ,0646
,0724 ,0729
,0808 ,0813
,1057 ,1063
,1226 ,1238
,1370 ,1394
,1416 ,1450
,1417 ,1455
MEP
,0285
,0425
,0544
,0630
,0695
,0805
,0935
,1059
,1146
,1201
,1230
NT
,0264
,0440
,0582
,0683
,0755
,0825
,1068
,1217
,1335
,1370
,1388
MEP
,0264
,0413
,0532
,0624
,0688
,0750
,0970
,1107
,1215
,1276
,1313
NT
,0264
,0434
,0571
,0669
,0740
,0809
,1049
,1196
,1309
,1340
,1353
SETAR-TVCD
Mediana
NC
BETA
,0264 ,0264
,0418 ,0417
,0529 ,0536
,0618 ,0622
,0685 ,0675
,0751 ,0741
,0978 ,0967
,1121 ,1111
,1254 ,1256
,1304 ,1325
,1331 ,1370
MEP
,0264
,0413
,0531
,0616
,0675
,0727
,0937
,1063
,1144
,1190
,1218
Tabla 5.11: Media del error absoluto medio para 21 aerogeneradores de un parque elico con una frecuencia de 10 minutos.
h
1
2
3
4
5
6
12
18
24
30
36
Media
NC
BETA
,0269 ,0269
,0454 ,0459
,0602 ,0607
,0717 ,0720
,0807 ,0809
,0899 ,0900
,1185 ,1185
,1377 ,1375
,1606 ,1599
,1695 ,1684
,1730 ,1716
SETAR
Tabla 5.10: Valor relativo de la raz del error cuadrtico medio de 21 aerogeneradores de un parque elico con una frecuencia de
10 minutos.
h
1
2
3
4
5
6
12
18
24
30
36
5.5. Conclusiones
123
ARMA
1,09
1,16
1,16
1,17
1,18
1,21
1,22
1,24
1,32
1,36
1,41
TV-AR
1,09
1,05
1,04
1,04
1,05
1,12
1,02
1,07
1,06
1,03
1,04
NT
1,02
1,10
1,11
1,12
1,12
1,15
1,17
1,19
1,25
1,29
1,33
Media
NC BETA
1,00
1,00
1,02
1,01
1,04
1,00
1,05
1,00
1,06
1,01
1,08
1,03
1,09
1,05
1,10
1,06
1,14
1,11
1,13
1,11
1,12
1,11
MEP
1,00
1,00
1,00
1,01
1,02
1,03
1,04
1,04
1,06
1,07
1,08
NT
1,00
1,05
1,08
1,09
1,10
1,11
1,12
1,12
1,14
1,13
1,11
SETAR-TVCD
Mediana
NC BETA
1,00
1,00
1,01
1,01
1,00
1,01
1,00
1,01
1,01
1,00
1,03
1,02
1,04
1,03
1,05
1,04
1,10
1,10
1,10
1,11
1,09
1,12
MEP
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
1,00
Tabla 5.12: Valor relativo del error medio absoluto para predicciones de 21 aerogeneradores de un parque elico con una frecuencia de 10 minutos..
h
1
2
3
4
5
6
12
18
24
30
36
Media
NC BETA
1,02
1,02
1,10
1,11
1,13
1,14
1,16
1,17
1,20
1,20
1,24
1,24
1,26
1,26
1,29
1,29
1,40
1,40
1,42
1,42
1,42
1,41
124
Captulo 5. Prediccin de produccin elica empleando modelos SETAR
Captulo 6
Contribuciones de la tesis
A lo largo de esta tesis se han ido mostrando resultados que nos han permitido cumplir
el principal objetivo que nos planteamos al iniciarla, desarrollar tcnicas para mejorar
la implementacin de modelos de series temporales no lineales, con especial nfasis en
la prediccin de potencia elica.
El primer paso ha sido desarrollar una herramienta al estilo del correlograma en el
mbito de las series temporales lineales que nos ayude a identificar un modelo por umbrales. Para ello hemos propuesto una herramienta grfica basada en la estimacin
recursiva del proceso ordenado respecto a la variable que provoca la no linealidad.
Para comprobar si la estimacin recursiva identificaba algn tipo de fenmeno no lineal
hemos propuesto la construccin de una regin de confianza dentro de la cul cualquier
ordenacin de la variable que no provoque un cambio estructural en el proceso deber
de permanecer. Para la construccin de la regin de confianza mostramos cul sera la
distribucin asinttica del estimador para cualquier ordenacin que se realice sobre el
proceso.
Como extensin a la herramienta grfica de identificacin fue desarrollado un procedimiento que permite la modelizacin de estructuras TAR de manera automtica. El
procedimiento puede realizar la bsqueda de estructuras TAR empleando diferentes
variables, tanto retardos del mismo proceso, como variables exgenas, como combinaciones de ellas.
Una vez desarrollado un procedimiento que nos permite la identificacin de un tipo
de modelo no lineal, estudiamos el problema de calcular predicciones empleando dichos modelos. Al hacerlo notamos que conseguir una buena estimacin de la densidad
predictiva era clave para obtener buenas predicciones, puesto que su clculo implica
la realizacin de simulaciones mediante un mtodo de Monte Carlo. Por ello hemos
propuesto una estimacin adaptativa de la senda de densidades predictivas. Las principales novedades que introduce la estimacin que proponemos son:
125
126
(i) El uso de una estimacin adaptativa de los momentos condicionados. En los trabajos previos sobre estimacin de densidades predictivas, los momentos eran calculados empleando estimadores muestrales, sin tener en cuenta su posible evolucin a lo largo del tiempo dependiendo del proceso.
(ii) El uso de la distribucin de Mxima Entropa. La distribucin de Mxima Entropa ha sido empleada en el mbito de la produccin elica para estimar la densidad incondicional de la velocidad del viento, pero no haba sido empleada ni en
datos de produccin elica ni en la estimacin de densidades condicionales.
Por ltimo, empleando el procedimiento automtico de identificacin de modelos
TAR sobre datos de produccin elica encontramos un modelo SETAR con 6 regmenes.
En este trabajo hemos mostrado cmo dicha estructura SETAR se encuentra como patrn comn en datos de produccin tanto horaria como diez minutal, as como en datos
tanto de parques elicos como de diferentes aerogeneradores de un mismo parque. Empleando la estructura comn detectada hemos propuesto emplear para ajustar la produccin elica un modelo SETAR con distribucin condicionada que va variando con
el tiempo dependiendo del valor la potencia prevista. Para estimar dicha distribucin
condicionada introducimos el uso de la distribucin de Mxima Entropa con heterocedasticidad condicional, en el cul la varianza del proceso ir evolucionando dependiendo del valor de la potencia elica prevista.
Las posibles lneas de investigacin futuras a partir de los resultados aqu propuestos han sido mostradas a lo largo del trabajo, en las secciones 3.6, 4.8 y 5.5.
127
128
Referencias
[1] Akaike, H. (1973). Information theory and an extension of the maximum likelihood principle. Proceedings of the Second International Symposium on Information
Theory. Akademiai Kiad: Budapest, p. 267-281.
[2] Akaike, H. (1977). On the entropy maximisation principle. In Applications of Statistics (ed. P.R. Krishnaiah). North-Holland: Amsterdam, p. 27-41.
[3] Akpinar, S. y Kavak Akpinar, E. (2007). Wind Energy Analysis based on Maximum Entropy Principle (MEP)-type distribution function. Energy Conversion and
Management, 48: 1140-1149.
[4] Al-Awami, A.T. y El-Sharkawi, M.A. (2009). Statistical Characterization of Wind
Power Output for a given Wind Power Forecast. In North American Power Symposum, NAPS 2009.
[5] Aldous, D. (1989). Probability approximations via the Poisson clumping heuristic.
Springer-Verlag: New York.
[6] Al-Qassam, M.S. y Lane, J.A. (1989). Forecasting exponential autoregressive models of order 1. Journal of Time Series Analysis, 10: 95-113.
[7] An, H.Z. y Huang, F.C. (1996). The geometrical ergodicity of nonlinear autoregressive models. Statistica Sinica, 6: 943-956.
[8] Bale, R., Muzy, J.F. y Poggi, P. (2011). Short-term forecasting of surface layer
wind speed using a continuous random cascade model. Wind Energy, DOI:
10.1002/we.452.
[9] Bellman, R.E. (1961). Adaptive control processes. Princeton University Press: Princeton.
[10] Bermejo, M.A., Pea, D. y Snchez, I. (2011). Identification of TAR models using
recursive estimation. Journal of Forecasting, 30: 31-50.
129
Referencias
130
[11] Bhattacharya, R.N. y Lee, C. (1995). Ergodicity of nonlinear first order autoregressive models. Journal of Theoretical Probability, 8: 207-219.
[12] Bludszuweit, H., Domnguez-Navarro, J.A. y Llombart, A. (2008). Statistical
Analysis of Wind Power Forecast Error. IEEE Transactions on Power Systems, 23:
983-991.
[13] Bodewig, E. (1956). Matrix Calculus. North Holland: Amsterdam.
[14] Bollerslev, T. (1986). Generalized autoregressive conditional heteroskedasticity.
Journal of Econometrics, 31: 307-327.
[15] Bossanyi, E.A. (1985). Short-term wind prediction using Kalman Filters. Wind engineering, 9: 1-8.
[16] Box, G. y Jenkins, G. (1970). Time series analysis: Forecasting and control, HoldenDay: San Francisco.
[17] Bremnes, J.B. (2006). A Comparison of a Few Statistical Models for Making Quantile Wind Power Forecasts. Wind Energy, 9: 3-11.
[18] Brier, G.W. (1950). Verification of forecasts expressed in terms of probability.
Monthly Weather Review, 78: 1-3.
[19] Brock, W.A., Scheinkman, J.A. y Dechert, W.D. (1996). A test for independence
based on the correlation dimension. Econometric Reviews, 15: 197-235.
[20] Brown, B.G., Katz, R.W. y Murphy, A.H. (1984). Time series models to simulate
and forecast wind speed and wind power. Journal of climate and applied meteorology,
23: 1184-1195.
[21] Burton, T., Sharpe, D., Jenkins, N. y Bossanyi, E. (2001). Wind Energy Handbook.
John Wiley & Sons: West Sussex.
[22] Cai, Z., Fan, J. y Yao, Q. (2000). Functional-coefficient regression models for nonlinear time series. Journal of the American Statistical Association, 95: 941-956.
[23] Campbell, E.P. (2004). Bayesian selection of threshold autoregressive models. Journal of Time Series Analysis, 25: 467-482.
[24] Carta, J.A., Ramirez, P. y Velzquez, S. (2009). A review of wind speed probability
distributions used in wind energy analysis, Case studies in the Canary Islands.
Renewable and Sustainable Energy Reviews, 13: 933-955.
Referencias
131
[25] Chan, K.S. (1986). Topics in nonlinear time series analysis. Doctoral thesis, Princeton
University.
[26] Chan, K.S. (1988). On the existence of the stationary and ergodic NEAR(p) model.
Journal of Time Series Analysis, 9: 319-328.
[27] Chan, K.S. (1990). Testing for threshold autoregression. The Annals of Statistics, 18:
1886-1894.
[28] Chan, K.S. (1991). Percentage point of likelihood ratio tests for threshold autoregression. Journal of the Royal Statistical Society, Series B, 53: 691-696.
[29] Chan, K.S. (1993). Consistency and limiting distribution of the least squares estimator of a threshold autoregressive model. Annals of Statistics, 21: 520-533.
[30] Chan, K.S. y Tong, H. (1986). On estimating thresholds in autoregressive models.
Journal of Time Series Analysis. 7: 179-190.
[31] Chan, K.S. y Tong, H. (1990). On likelihood ratio tests for threshold autoregression. Journal of the Royal Statistical Society, Series B, 52: 469-476.
[32] Chan, K.S. y Tsay, R.S. (1998). Limiting properties of the conditional least squares
estimator of a continuous TAR model. Biometrika, 85: 413-426.
[33] Chan, K.S., Tong, H. & Wong, A.C.S. (2004). Some nonlinear threshold autoregressive time series models for actuarial use. North American actuarial journal, 8:
37-61.
[34] Chatfield, C. (2001). Time Series Forecasting, Chapman & Hall / CRC: London.
[35] Chen, R. y Tsay, R.S. (1993). Functional-coefficient autoregressive models. Journal
of the American Statistical Association, 88: 298-308.
[36] Chen, R., Liu, J.S. y Tsay, R.S. (1995). Additivity tests for nonlinear autoregressions. Biometrika, 82: 369-383.
[37] Clements, M.P. y Harvey, D.I. (2010). Combining probability forecasts. International Journal of Forecasting, 27: 208-223.
[38] Clements, M.P. y Smith, J. (1997). The performance of alternative forecasting
methods for SETAR models. International Journal of Forecasting, 13: 463-475.
[39] Clements, M.P., Franses, P.H., Smith, J. y Van Dijk, D. (2003). On SETAR nonlinearity and forecasting. Journal of Forecasting, 22: 359-375.
Referencias
132
[40] Cleveland, W.S. y McGill, R. (1987). Graphical Perception: The Visual Decoding
of Quantitative Information on Statistical Graphs. Journal of the Royal Statistical
Society Series A, 150:192-229.
[41] Cohen, A.C. (1957). On the solution of estimating equations for truncated and
censored samples from normal populations. Biometrika, 44: 225-236.
[42] Cohen, A.C. (1991). Truncated and Censored Samples. Marcel Dekker: New York.
[43] Corradi, V. y Swanson (2006). Predictive density evaluation. In Handbook of Forecasting, ed. por G. Elliot, C.W.J. Granger y A. Timmerman, Elsevier Science, 197284.
[44] Costa A. et al. 2008. A review on the young history of the wind power short-term
prediction. Renewable and Sustainable Energy Reviews, 12: 1725-1744.
[45] Cox, D.R. (1961). Prediction by exponentially weighted moving averages and related methods. Journal of the Royal Statistical Society, Series B, 23: 414-422.
[46] Cramer, H. (1961). On some classes of nonstationary stochastic processes. Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, 2:
55-77.
[47] Davies, R.B. (1987). Hypothesis testing when a nuisance parameter is present only
under the alternative. Biometrika, 74: 33-43.
[48] Dawid, A.P. (1984). The prequential approach. Journal of the Royal Statistical Society,
Series A, 147: 278-292.
[49] De Finetti, B. (1990). Theory of Probability. Wiley: New York.
[50] De Gooijer, J.G. (2001). Cross-validation criteria for SETAR model selection. Journal of Time Series Analysis, 22: 267-281.
[51] De Gooijer, J.G. y De Bruin, P.T. (1998). On forecasting SETAR processes. Statistics
and Probability Letters, 37: 7-14.
[52] De Gooijer, J.G. y Hyndman, R.J. (2006). 25 years of time series forecasting. International Journal of Forecasting, 22: 443-473.
[53] Diebold, F.X. y Lopez, J.A. (1996). Forecast evaluation and combination. In G.S.
Maddala & C.R. Rao (Eds.), Handbook of statistics, 14: 241-268. North Holland:
Amsterdam.
Referencias
133
[54] Diebold, F.X., Gunther, T., Tay, A.S. (1998). Evaluating density forecasts with applications to finance and management. International Economic Review, 39: 863-883.
[55] Doukhan, P. (1994). Mixing: Properties and Examples. Springer-Verlag: New York.
[56] Du, Z. y Escanciano, J.C. (2011). A simple portmanteau test for conditional
goodness-of-fit in dynamic models. In 2011 North American Summer Meeting of
the Econometric Society, Washington University.
[57] Epstein, E.S. (1969). Stochastic dynamic prediction. Tellus, 21: 739-759.
[58] Escanciano, J.C. (2006). Goodness-of-Fit Tests for Linear and Nonlinear Time Series Models. Journal of the American Statistical Association, 101: 531-541.
[59] Ezekiel, A. (1924). A method for handling curvilinear correlation for any number
of variables. Journal of the American Statistical Association, 19: 431-453.
[60] Fan, J. y Gijbels, I. (1996). Local polynomial modelling and its applications. Chapman
and Hall: London.
[61] Fan, J. y Yao, Q. (2005). Nonlinear Time Series. Springer: New York.
[62] Fan, J., Zhang, C. y Zhang, J. (2001). Generalized likelihood test statistic and Wilks
phenomenon. The Annals of Statistics, 29: 153-193.
[63] Fellows, A. y Hill, D. (1990). Wind and load forecasting for integration of wind
power into a meso-scale electrical grid. Proceedings of the European community Wind
Energy conference, 10-14.
[64] Findley, D.F. (1983). On the use of multiple models for multi-period forecasting.
In Proceedings of the Business and Economic Statistics Section, American Statistical Association, p. 528-531.
[65] Findley, D.F. (1985). Model selection for Multi-step-ahead forecasting. In Identification and System Parameter Estimation (7th IFAC/IFORS Symposium), p 1039-1044,
Pergamon Press: Oxford.
[66] Fisher, R.A. (1935). The Design of Experiment. Hafner: New York.
[67] Fortescue, T.R., Kershenbaum, L.S. y Ydstie, B.E. (1981). Implementation of selftuning regulators with variable forgetting factors. Automatica, 17: 831-835.
[68] Franses, P.H. y van Dijck, D. (2000). Non-linear time series models in empirical finances. Cambridge University Press: Cambridge.
Referencias
134
[69] Fuller, W.A. y Hasza, D.P. (1981). Properties of predictors for autoregressive time
series. Journal of the American Statistical Association, 76: 155-161.
[70] Galeano, P. y Pea, D. (2007). Improved model selection criteria for SETAR time
series models. Journal of Statistical Planning and Inference, 137: 2802-2814.
[71] Gauss, C.F. (1809). Theoria motus corporum celestium. Traducido al ingls por C.H.
Davis (1857). Reedicin 1963, Dover Publications: New York.
[72] Gaver, D.P. y Lewis, P.A.W. (1980). First order autoregressive gamma sequences
and point processes. Advances in Applied Probability, 12: 727-745.
[73] Giebel,
G.,
State-of-the-Art
Deliverable
Brownsword,
in
Report
R.
Short-Term
D1.1,
Kariniotakis,
Prediction
Project
of
Anemos,
G.
(2011).
Wind
The
Power,
disponible
en
http://anemos.cma.fr/download/ANEMOS_D1.1_StateOfTheArt_v1.1.pdf.
[74] Giebel, G., Landberg, L., Nielsen, T.S. y Madsen, H. (2001). The Zephyr project.
The next generation prediction system. Proceedings of the EWEC, 777-780.
[75] Gneiting, T. y Raftery, A.E. (2007). Strictly proper scoring rules, prediction and
estimation. Journal of the American Statistical Association, 102: 359-378.
[76] Gneiting, T., Balabdaoui, F. y Raftery, A.E. (2007). Probabilistic forecasts, calibration and sharpness. Journal of the Royal Statistical Society, Series B, 69: 243-268.
[77] Gonzlez-Rivera, G., Senyuz, Z. y Yoldas, E. (2011). Autocontours: dynamic specification testing. Journal of Business and economic statistics, 29: 186-200.
[78] Granger, C.W.J. y Andersen, A.P. (1978). An introduction to bilinear models. Van
derhoeck & Ruprecht: Gottingen.
[79] Granger, C.W.J. y Tersvirta, T. (1993). Modeling nonlinear economic relationships.
Oxford University Press: Oxford.
[80] Haggan, V. y Ozaki, T. (1981). Modeling nonlinear vibrations using an amplitudedependent autoregressive time series model. Biometrika, 68: 189-196.
[81] Hamill, T.M. (2001). Interpretation of rank histograms for verifying ensemble
forecasts. Monthly Weather Reviews, 129: 550-560.
[82] Hansen, B.E. (1996). Inference when a nuisance parameter is not identified under
the null hypothesis. Econometrica, 64: 413430.
Referencias
135
[83] Hansen, B.E. (1999). Threshold effects in non-dynamic panels: estimation, testing,
and inference. Journal of Econometrics, 93: 345368.
[84] Haykin, S., Sayed, A.H., Zeidler, J.R., Yee, P. y Wei, P.C. (1997). Adaptive tracking
of linear time-variant systems by extended RLS algorithms. IEEE Transactions on
signal processing, 45: 1118-1128.
[85] Hinich, M. (1982). Testing for gaussianity and linearity of a stationary time series.
Journal of Time Series Analysis, 3: 169-176.
[86] Holt, C.C. (1957). Forecasting trends and seasonals by exponentially weighted moving
averages, O.N.R. Memorandum, no 52, Carnegie Institute of Technology.
[87] Hong, Y. (1997). One-sided testing for conditional heteroskedasticity in time series
models. Journal of Time Series Analysis, 18: 253-277.
[88] Hong-zhi, A. y Bing, C. (1991). A Kolmogorov-Smirnov type statistic with application to test for nonlinearity in time series. International Statistical Review, 59:
287-307.
[89] Hurvich, C.M. y Tsai, C.L. (1989). Regression and time series model selection in
small samples. Biometrika, 76: 297-307.
[90] Hurvich, C.M., Shumway, R. y Tsai, C.L. (1990). Improved estimators of KullbackLeibler information for autoregressive model selection in small samples. Biometrika, 77: 709-719.
[91] Jaynes, E.T. (1957). Information theory and statistical mechanics. Physical Reviews,
106: 620-630.
[92] Jolliffe, I.T. y Stephenson, D.B. (2003). Forecast verification: a practitioners guide in
atmospheric science. Wiley: Chichester.
[93] Jones, D.A. (1976). Non-linear autoregressive processes. PhD Thesis, University of
London.
[94] Kamal, L. y Jafri, Y.Z. (1997). Time series models to simulate and forecast hourly
averaged wind speed in Quetta, Pakistan. Solar Energy, 61: 23-32.
[95] Kapetanios, G. (2001). Model selection in threshold models. Journal of Time Series
Analysis, 22: 733-754.
Referencias
136
[96] Kariniotakis, G., Nogaret, E. y Stavrakis, G. (1997). Advanced short-term forecasting of wind power production. Proceedings of the European Wind Energy conference,
751-754.
[97] Kariniotakis, G., Nogaret, E. y Stavrakis, G. (1999). Evaluation of advanced Wind
Power and Load forecasting methods for the Optimal Management of Isolated
Power Systems. Proceedings of the European Wind Energy conference, 1082-1085.
[98] Keenan, D.M. (1985). A Tukey nonadditivity-type test for time series nonlinearity.
Biometrika, 72: 39-44.
[99] Kunimoto, N. y Yamamoto, T. (1985). Properties of predictors in misspecified autoregressive time series models. Journal of the American Statistical Association, 80:
941-950.
[100] Landau, I.D., Lozano, R. y MSaad,M. (1998). Adaptive control, Springer: London.
[101] Landberg, L, Giebel, G., Madsen, H., Nielsen, T.S., Jorgensen, J.U., Laursen, L.
et al. (2002). Wind farm production prediction -the Zephyr model. Technical report.
Roskilde, Denmark: Riso national Laboratory.
[102] Lange, M. (2005). On the Uncertainty of Wind Power Predictions: Analysis of the
Forecast Accuracy and Statistical Distribution of Errors. Journal of Solar Energy
Engineering, 127: 177-184.
[103] Lau, A. y McSharry, P. (2010). Approaches for Multi-Step Density Forecasts with
Application to Aggregated Wind Power. The Annals of Applied Statistics, 4: 13111341.
[104] Lawrance, A.J. y Lewis, P.A.W. (1980). The Exponential Autoregressive-Moving
Average EARMA (p,q) Process. Journal of the Royal Statistical Society. Series B
(Methodological), 42: 150-161.
[105] Lee, J.H.H. y King, M.L. (1993). A locally most mean powerful based score test
for ARCH and GARCH regression disturbances. Journal of Business and Economic
Statistics, 11: 17-27.
[106] Legendre, A.M. (1805). Nouvelles mthodes pour la dtermination des orbites des
comtes, en Sur la mthode des moindres quarrs. Pars.
[107] Li, W.K. y Lam, K. (1995). Modelling asymmetry in stock returns by a threshold
ARCH model. The Statistician, 44: 333-341.
Referencias
137
[108] Ling, S. y Tong, H. (2005). Testing for a linear MA model against threshold MA
models. Annals of Statistics, 33: 2529-2552.
[109] Ling, S. y Tong, H. (2011). Score based goodness-of-fit tests for time series. Statistical Sinica, Preprint SS-09-090.
[110] Liu, F.J. y Chang, T.P. (2010). Validity analysis of maximum entropy distribution based on different moment constraint for wind energy assessment. Energy,
doi:10.1016/j.energy.2010.11.033.
[111] Ljung, L. y Sderstrm, T. (1983). Theory and practice of recursive identification. The
MIT Press: Cambridge.
[112] McLeod, A.I. y Li, W.K. (1983). Diagnostic checking ARMA time series models
using squared-residual autocorrelations. Journal of Time Series Analysis, 4: 269-273:
[113] Maravall, A. (1983). An application of nonlinear time series forecasting. Journal of
the Business and Economic Statistics, 1: 66-74.
[114] Matheson, J.E. y Winkler, R.L. (1976). Scoring rules for continuous probability
distributions. Management science, 22: 1087-1096.
[115] McQuarrie, A., Shumway, R. y Tsai, C.L. (1997). The model selection criterion
AICu. Statistics and Probability Letters, 34: 285-292.
[116] Mitchell, J. (2008). Density forecast revisions and forecast efficiency. National Institute of Economic and Social Research.
[117] Moller, J.K., Nielsen, H.A. y Madsen, H. (2008). Time-adaptive quantile regression. Computational Statistics & Data Analysis, 52: 1292-1303.
[118] Moran, P.A.P. (1953). The statistical analysis of the Canadian lynx cycle, I: structure and prediction. Australian Journal of Zoology, 1: 163-173.
[119] Nielsen, T.S., Madsen, H. y Tofting, J. (1999). Experiences with statistical methods
for wind power prediction. Proceedings of the EWEC, 1066-1069.
[120] Nielsen, H.A., Madsen, H., Nielsen, T.S., Badger, J., Giebel, G., Landberg, L., Sattler, K. y Feddersen, H. (2004). Wind Power Ensemble Forecasting. Technical report,
Technical University of Denmark, DTU Informatics, Kgs. Lyngby, Denmark, 2004.
[121] hrvik, J. y Schoier, G. (2005). SETAR model selection, a bootstrap approach. Computational Statistics, 20: 559-573.
Referencias
138
[122] Ozaki, T. y Oda, H. (1978). Non-linear time series model identification by Akaikes
information criterion. Proceedings IFAC Workshop on Information and Systems, Compiegn, France.
[123] Pankratz, A. (1983). Forecasting with univariate BoxJenkins models: concepts and
cases. Wiley: Hoboken.
[124] Pea, D. (2002). Anlisis de datos multivariantes, McGraw-Hill: Madrid.
[125] Pea, D. y Rodrguez, J. (2005). The Log of the determinant of the autocorrelation
matrix for testing goodness of fit in time series. Journal of Statistical Planning and
Inference, 136: 2706-2718.
[126] Pea, D. y Rodrguez, J. (2005b). Detecting nonlinearity in time series by model
selection criteria. International Journal of Forecasting, 21: 731-748
[127] Pea, D., Tiao, G.C. y Tsay, R.S. (2001). A course in time series analysis. Wiley: New
York.
[128] Petruccelli, J. y Davies, N. (1986). A portmanteau test for Self-Exciting Threshold
Autoregressive-Type nonlinearity in time series. Biometrika, 73: 687-694.
[129] Pinson, P. (2010). On probabilistic Forecasting of Wind Power Time-Series. Technical
report, Technical University of Denmark, DTU Informatics, Kgs. Lyngby, Denmark, 2010.
[130] Pinson, P. y Madsen, H. (2009). Ensemble-based probabilistic forecasting at Horns
Rev. Wind Energy, 12: 137-155.
[131] Pinson, P., Christensen, L.E.A., Madsen, H., Sorensen, P.E., Donovan, M.H. y
Jensen, L.E. (2008). Regime-switching modelling of the fluctuations of offshore
wind generation. Journal of Wind Engineering and Industrial Aerodynamics, 96: 23272347.
[132] Pitman, E.J.G. (1938). Significance tests which may be applied to samples from
any population. Biometrika, 29: 322-335.
[133] Potter, S. (1995). A nonlinear approach to US GNP. Journal of Applied Econometrics,
10: 109-125.
[134] Priestley, M.B. (1980). State dependent models: a general approach to nonlinear
time series analysis. Journal of Time Series Analysis, 1: 57:71.
[135] Priestley, M.B. (1981). Spectral Analysis and Time Series. Academic Press: New York.
Referencias
139
[136] Ramrez, P. y Carta, J.A. (2006). The use of Wind Probability Distributions derived
from the Maximum Entropy Principle in the Analysis of Wind Energy. A case
study. Energy Conversion and Management, 47: 2564-2577.
[137] Ramsey, J.B. (1969). Tests for Specification Errors in Classical Linear Least Squares
Regression Analysis. Journal of the Royal Statistical Society Series B, 31: 350371.
[138] Rao Sripada, N. y Gran Fisher, D. (1987). Improved least squares identification.
International Journal of Control, 46: 1889-1913.
[139] Rosenblatt, M. (1952). Remarks on a multivariate transformation. The annals of
mathematical statistics, 23: 470-472.
[140] Samia, N.I., Chan, K.S. y Stenseth, N.C. (2007). A generalized threshold mixed
model for analyzing nonnormal nonlinear time series; with application to plague
in Kazakhstan. Biometrika, 94: 101-118.
[141] Snchez, I. (2006). Recursive estimation of dynamic models using Cooks distance,
with application to wind energy forecast. Technometrics, 48: 61-73.
[142] Snchez, I. (2006b). Short-term prediction of Wind Energy production. International Journal of Forecasting, 22: 43-56.
[143] Schwarz, G. (1978). Estimating the dimension of a model. The Annals of Statistics,
6: 461-464.
[144] Shannon, C.E. (1948). A mathematical theory of communication. Bell System Technical Journal, 27: 379-423, 623-656.
[145] Shorack, G.R. y Wellner, J.A. (1986). Empirical processes with applications to statistics.
Wiley: New York.
[146] Siddall, J.N. y Diab, Y. (1975). The use in probabilistic design of probability curves
generated by maximizing the Shannon entropy function constrained by moments.
Journal of Industrial Engineering, 97: 843-852.
[147] Stenseth, N.C., Chan, K.S., Tong, H. et. al.(1999). Common dynamic structure of
Canadian lynx populations within three climatic regions. Science, 285: 1071-1073.
[148] Stenseth, N.C., Samia, N.I. et. al. (2006). Plague dynamics are driven by climate
variation. Proceedings of the National Academy of Sciences, 103: 13110-13115.
[149] Stoica, P., Eykhoff, P., Janssen, P. y Sderstrm, T. (1986). Model-structure selection by cross-validation. International Journal of Control, 43: 1841-1878.
Referencias
140
Referencias
141
[164] Tong, H. y Lim, K.S. (1980). Threshold autoregression, limit cycles and cyclical
data (con discusin). Journal of Royal Statistical Society, Series B (Methodological), 42:
245-292.
[165] Tong, H., Thanoon, B. y Gudmundsson, G. (1985). Threshold time series modelling of two Icelandic riverflow systems. Water Resources Bulletin, 21: 651-661.
[166] Torres, J.L., Garcia, A., De Blas, M. y De Francisco, A. (2005). Forecast of hourly
average wind speed with ARMA models in Navarre (Spain). Solar Energy, 79: 6577.
[167] Tsay, R.S. (1986). Nonlinearity tests for time series. Biometrika, 73: 461-466.
[168] Tsay, R.S. (1989). Testing and modeling threshold autoregressive processes. Journal
of the American Statistical Association, 84: 231-240.
[169] Tukey, J.W. (1949). One degree of freedom for non-aditivity. Biometrika, 5: 232-242.
[170] Tyssedal, J.S. y Tjstheim, D. (1988). An autoregressive model with suddenly
changing parameters and an application to stock market prices. Journal of the Royal
Statistical Society. Series C (Applied Statistics), 37: 353-369.
[171] Unnikrishnan, N.K. (2004). Bayesian subset model selection for time series. Journal of Time Series Analysis, 25: 671-690.
[172] Van der Leeuw, J. (1994). The covariance matrix of ARMA errors in closed form.
Journal of Econometrics, 63: 397-405.
[173] Volterra, V. (1930). Theory of functional and of integro-differential equations. Dover:
New York.
[174] Wedlin, A. (1997). On the notion of second-order exchangeability. Erkenntnis, 45:
177-194.
[175] Whittle, P. (1954). The statistical analysis of a seiche record. Sears Foundation Journal of Marine Research, 13: 76-100.
[176] Wong, C.S. y Li, W.K. (1998). A note on the corrected Akaike information criterion
for the threshold autoregressive models. Journal of Time Series Analysis, 19: 113124.
[177] Wu, S. y Chen, R. (2007). Threshold variable determination and threshold variable
driven switching autoregressive models. Statistica Sinica, 17: 241-264.