Está en la página 1de 108

Modelado de series temporales usando sistemas

adaptativos de inferencia neuro difusa ANFIS con


heterocedasticidad condicional autorregresiva

Elizabeth Catalina Zapata Gmez, I.S.

Director
Juan David Velsquez H., PhD.(c)
Co-director
Ricardo Smith Q., PhD.

Universidad Nacional de Colombia


Facultad de Minas
Escuela de Sistemas
Maestra en Ingeniera
Mayo de 2007
ii
RESUMEN

En este trabajo se propone un modelo adaptable de inferencia neurodifuso con


heterocedasticidad condicional autorregresiva para el anlisis de series temporales denominado
ANFIS-ARCH. Este modelo integra la representacin de la no linealidad en la media usando un
sistema de inferencia neurodifusa ANFIS con un modelo ARCH para representar las asimetras
y clusters de volatilidad presentes principalmente en series financieras.
Para la estimacin de este tipo de modelos se propone el uso del algoritmo iRprop+ , y para
la especificacin y seleccin del modelo se desarroll una estrategia sistemtica basada en la
prueba STR de no linealidad y la prueba del radio de verosimilitud.
Con el fin de determinar las propiedades de los modelos propuestos en muestras pequeas,
se realiz una simulacin Monte Carlo cuyo resultado determin que el modelo es capaz de
recuperarse a si mismo y que la estrategia de especificacin planteada funciona apropiadamente.
La estrategia propuesta fue usada para modelar la serie del ndice de Oscilacin del Sur - SOI
y la serie de los cambios relativos en los precios de cierre de las acciones de IBM, demostrando que
el modelo desarrollado puede representar, mejor que otros modelos de caractersticas similares,
la dinmica de las series estudiadas.
Como trabajo futuro, se puede aplicar la metodologa propuesta dentro de este trabajo para
el modelado de series temporales que involucre variables regresoras exgenas.
Finalmente, se deja abierto el camino para la formulacin de modelos ANFIS que consideren,
en vez de una componente ARCH, otras funciones que permitan representar series temporales
con estructuras ms complejas en su varianza.
Palabras Clave: ANFIS, ARCH, heterocedasticidad, series temporales, modelos no lineales, SOI,
IBM.

iii
iv
ABSTRACT

In this work, ANFIS-ARCH, an adaptable neural-fuzzy inference model with autoregressive


conditional heteroscedasticity for time series analysis is purposed. This model combines the
non-linearity in mean representation through the neural-fuzzy inference system ANFIS, with
ARCH, a model for representing asymmetries and volatility clusters existing mainly on financial
series.
On the estimation of this kind of models its purposed using iRprop+ algorithm. For model
specification and regressor selection, a strategy has been developed, based on STR non-linearity
test and likelyhood ratio test.
Its used Monte Carlo simulation for obtaining the properties of purposed models on small
samples, and its found that the model is able to recover itself and that purposed specification
strategy works correctly. This purposed strategy was used for modelling the Southern Oscillation
Index - SOI serie and IBM closing stock prices changes serie, its found that the proposed model
captures in a better way the main features of the studied time series in comparison to other
competitive models.
As future work, this methodology can be applied for modeling time series containing exogen
regressive variables. Finally, a remaining question is open to formulation of ANFIS models
considering another functions representing time series with a more complex variance structure,
different to ARCH model.
Keywords: ANFIS, ARCH, heterocedasticity, nonlinear time series modelling, SOI, IBM.

v
vi
A A,

i
ii
AGRADECIMIENTOS

Este trabajo no hubiera sido posible sin la ayuda de mi director de tesis Juan David Velsquez,
quien adems de asesora, me brindo su apoyo incondicional y su amistad, a l mi mas profundo
agradecimiento.
Gracias a mi codirector Ricardo Smith por brindarme sus valiosos aportes.
Gracias a los profesores y miembros de la escuela de Sistemas, quienes formaron parte activa
de este proceso; a los profesores del rea de inteligencia artificial, por sus constantes aportes; a
Zorelly por su ayuda; a los compaeros de la maestra que continuamente apoyaron la ejecucin
de este trabajo; y en especial al profesor Santiago Montoya al que siempre recordar.
Gracias a los miembros de la escuela de Geociencias y Medio Ambiente donde he tenido
grandes amigos durante estos aos en la universidad; y en especial, gracias a los profesores
Jaime Ignacio Vlez y Germn Poveda quienes han ayudado enormemente en mi formacin.
Gracias a mi familia por su paciencia, cario y sobre todo su apoyo incondicional. Gracias
a Jorge por su ayuda y amor. Y gracias a Alejandro por darme cada maana el impulso para
continuar.
Finalmente, gracias a todos aquellos que de una u otra forma me han acompaado durante
este proceso.

iii
iv
CONTENIDO

1 Introduccin 1
1.1 Tpico principal y problemtica abordada . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Organizacin del documento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Difusin de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Generalidades sobre los sistemas de inferencia difusa 5


2.1 El problema genrico de regresin . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Sistemas de inferencia difusa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 ANFIS: Sistema adaptable de inferencia neurodifusa . . . . . . . . . . . . . . . . . 7
2.4 Modelado usando ANFIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4.1 Estimacin de parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4.2 Especificacin de la estructura de ANFIS . . . . . . . . . . . . . . . . . . . 12
2.5 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3 Limitaciones de los sistemas de inferencia neurodifusa en el modelado de series


temporales 15
3.1 Conceptos y definiciones bsicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.1.1 Definicin de linealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.1.2 Volatilidad cambiante en el tiempo y clusters de volatilidad . . . . . . . . 18
3.1.3 Mtodo de mxima verosimilitud . . . . . . . . . . . . . . . . . . . . . . . 19
3.2 Prediccin versus regresin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3.3 Uso de ANFIS en el modelado de series temporales . . . . . . . . . . . . . . . . . 21
3.3.1 Modelos STR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.3.2 ANFIS como una generalizacin de los modelos STR . . . . . . . . . . . . 23
3.4 Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

4 Un modelo ANFIS-ARCH para el modelado de series temporales 27


4.1 Requerimientos y limitaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

v
vi

4.2.1 Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28


4.2.2 Objetivos especficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.3 Formulacin del modelo ANFIS-ARCH . . . . . . . . . . . . . . . . . . . . . . . . 29
4.4 Estimacin del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.5 Estrategia para la especificacin del modelo ANFIS-ARCH . . . . . . . . . . . . . 31
4.5.1 Paso 1. Seleccin de regresores . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.5.2 Paso 2: Pruebas de no linealidad . . . . . . . . . . . . . . . . . . . . . . . . 33
4.5.3 Paso 3: Estimacin de un modelo homocedstico . . . . . . . . . . . . . . 33
4.5.4 Paso 4: Pruebas de diagnstico . . . . . . . . . . . . . . . . . . . . . . . . . 34
4.5.5 Paso 5: Presencia de heterocedasticidad y orden de la componente ARCH 36
4.5.6 Paso 6: Eliminacin de regresores irrelevantes . . . . . . . . . . . . . . . . 36
4.6 Propiedades del modelo en muestras pequeas . . . . . . . . . . . . . . . . . . . . 36
4.6.1 Simulacin Monte Carlo para determinar la convergencia de los modelos 36
4.6.2 Metodologa y resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
4.7 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5 Casos de aplicacin 47
5.1 Caracterizacin del SOI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.1.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.1.2 Descripcin de la serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.1.3 Caracterizacin de la serie e interpretacin de resultados . . . . . . . . . . 49
5.2 Caracterizacin de la serie de cambios relativos en los precios de cierre de las
acciones de IBM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2.2 Descripcin de la serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.2.3 Caracterizacin de la serie e interpretacin de resultados . . . . . . . . . . 61
5.3 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

6 Conclusiones y Trabajo Futuro 77


6.1 Aspectos generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.2 Contribuciones tericas al anlisis de series temporales . . . . . . . . . . . . . . . 78
6.3 Contribuciones tericas a la inteligencia artificial . . . . . . . . . . . . . . . . . . . 79
6.4 Contribuciones prcticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
6.5 Observaciones finales y trabajo futuro . . . . . . . . . . . . . . . . . . . . . . . . . 80
vii

A ANEXO - Pruebas de no linealidad 89


viii
LISTA DE TABLAS

4.1 Simulacin de la convergencia del modelo sin variables exgenas . . . . . . . . . 39


4.2 Simulacin de la convergencia del modelo con variables exgenas . . . . . . . . . 40
4.3 Simulacin de la seleccin de variables relevantes en el modelo . . . . . . . . . . 43
4.4 Simulacin para determinar la funcin y la variable de transicin del modelo . . 44

5.1 Valor de los criterios de informacin para el modelo AR(p) - Serie SOI. . . . . . . 59
5.2 Pruebas de no linealidad para la serie del SOI . . . . . . . . . . . . . . . . . . . . . 60
5.3 Resultados de la prueba STR - Serie SOI . . . . . . . . . . . . . . . . . . . . . . . . 60
5.4 Pruebas estadsticas para el modelo ANFIS homocedstico - Serie SOI . . . . . . 61
5.5 Parmetros del modelo ANFIS-ARCH - Serie SOI . . . . . . . . . . . . . . . . . . 62
5.6 Pruebas estadsticas para el modelo ANFIS-ARCH - Serie SOI . . . . . . . . . . . 63
5.7 Momentos de la serie real y el modelo - Serie SOI . . . . . . . . . . . . . . . . . . . 63
5.8 Estadsticos de diferentes modelos para la serie del SOI . . . . . . . . . . . . . . . 63
5.9 Valor de los criterios de informacin para el modelo AR(p) - Serie IBM . . . . . . 68
5.10 Pruebas de no linealidad para la serie del IBM . . . . . . . . . . . . . . . . . . . . 72
5.11 Resultados de la prueba STR - Serie IBM . . . . . . . . . . . . . . . . . . . . . . . 72
5.12 Pruebas estadsticas para el modelo ANFIS homocedstico - Serie IBM . . . . . . 73
5.13 Parmetros del modelo ANFIS-ARCH - Serie IBM . . . . . . . . . . . . . . . . . . 73
5.14 Pruebas estadsticas para el modelo ANFIS-ARCH - Serie IBM . . . . . . . . . . 74
5.15 Momentos de la serie real y el modelo - Serie IBM . . . . . . . . . . . . . . . . . . 74
5.16 Estadsticos de diferentes modelos para la serie del IBM . . . . . . . . . . . . . . . 74

ix
x
LISTA DE FIGURAS

2.1 (a)Particin del espacio del dominio dada por las reglas difusas. (b)Arquitectura
de ANFIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 rbol binario - Fuente: Jang (1993) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

3.1 Caractersticas de las series temporales . . . . . . . . . . . . . . . . . . . . . . . . . 17

5.1 (a) SOI, (b) Innovaciones del modelo ANFIS-ARCH; y (c) Varianzas del modelo
ANFIS-ARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.2 Propiedades estadsticas de la serie del SOI (a) FAC; (b) FACP; (c) Espectro; (d)
Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.3 Propiedades estadsticas de los residuales del modelo ANFIS-ARCH - Serie SOI
(a) Residuales; (b) FAC; (c) Espectro; (d) Histograma . . . . . . . . . . . . . . . . . 56
5.4 Funcin de transicin para el modelo ANFIS-ARCH - Serie SOI (a) En el tiempo,
(b) Como funcin de la variable de transicin. . . . . . . . . . . . . . . . . . . . . 57
5.5 Pronstico determinstico para la serie del SOI . . . . . . . . . . . . . . . . . . . . 58
5.6 Convergencia de largo plazo para la serie del SOI . . . . . . . . . . . . . . . . . . 58
5.7 Funciones de transicin para los modelos ANFIS-ARCH y STR-ARCH - Serie SOI 59
5.8 (a) IBM, (b) Innovaciones del modelo ANFIS-ARCH; y (c) Varianzas del modelo
ANFIS-ARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.9 Propiedades estadsticas de la serie del IBM (a) FAC; (b) FACP; (c) Espectro; (d)
Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.10 Propiedades estadsticas de los residuales del modelo ANFIS-ARCH - Serie IBM
(a) Residuales; (b) FAC; (c) Espectro; (d) Histograma . . . . . . . . . . . . . . . . . 69
5.11 Funcin de transicin para el modelo ANFIS-ARCH - Serie IBM (a) En el tiempo,
(b) Como funcin de la variable de transicin. . . . . . . . . . . . . . . . . . . . . 70
5.12 Pronstico determinstico para la serie del IBM . . . . . . . . . . . . . . . . . . . . 71
5.13 Convergencia de largo plazo para la serie del IBM . . . . . . . . . . . . . . . . . . 71
5.14 Funciones de transicin para los modelos ANFIS-ARCH y STR-ARCH - Serie IBM 72

xi
xii
1. INTRODUCCIN

1.1 TPICO PRINCIPAL Y PROBLEMTICA ABORDADA

El anlisis y la prediccin de series temporales es usado en muchas reas donde se registra la


evolucin de muchas variables econmicas, fsicas o sociales como un medio para entender su
comportamiento histrico y realizar predicciones sobre su comportamiento futuro (Tong, 1990).
Las tareas de anlisis y prediccin se basan en la identificacin de un modelo que represente
la dinmica de la serie estudiada, por lo que necesariamente debe considerar los atributos
particulares que estn relacionados con caractersticas visuales de la serie como la presencia de
tendencias primarias o secundarias, patrones repetitivos, ciclos de largo plazo (Harvey, 1989),
linealidades, varianza cambiante en el tiempo o clusters de volatilidad. El gran nmero de dichas
caractersticas, la complejidad de sus interacciones, y la amplia gama de modelos propuestos
en la literatura, hace que la especificacin de un modelo para una serie particular sea tanto una
ciencia como un arte.
Tradicionalmente, el anlisis y la prediccin de series temporales han estado ligados al
uso de modelos lineales, y particularmente, a la aproximacin propuesta por Box y Jenkins
(1970), que es usada como un punto de partida para otras clases de modelos. Sin embargo,
al reconocer que en muchos casos los modelos lineales no capturan de forma adecuada ciertos
comportamientos atpicos de las series reales, se abren las puertas al uso de modelos no lineales.
Consecuentemente, se han desarrollado muchas aproximaciones a este tipo de modelos, tanto
paramtricas como no paramtricas, fundamentadas en la estadstica, las matemticas, y las
ciencias de la computacin. Por ejemplo, la modelacin de series de caudal se ha realizado
tradicionalmente usando la metodologa propuesta por Box y Jenkins (1970), pero recientemente
el uso de tcnicas no lineales como el anlisis espectral singular (Carvajal, 1994), el modelo de
ecuacin diferencial estocstica no lineal (Salazar, Mesa, Poveda y Carvajal, 1994) y la prediccin
por bandas espectrales usando onditas (PREBEO) (Poveda, Mesa, Carvajal, Hoyos, Meja,
Cuartas y Pulgarn, 2002), ha venido ganando terreno y en varios casos se ha demostrado que
existen ganancias al usar dichas tcnicas en comparacin con los modelos lineales tradicionales.
De la amplia gama de modelos no lineales existentes, las tcnicas de regresin no lineal
emergidas del campo de la inteligencia artificial han tenido aplicaciones empricas en el

1
2

modelado y la prediccin de series temporales. Por ejemplo, Velsquez, Dyner y Souza


(2004) presentan una aproximacin metodolgica para el modelado de series temporales usando
sistemas adaptables de inferencia neurodifusa; Velsquez y Gonzlez (2006) modelan el ndice
de tipo de cambio real colombiano usando redes neuronales artificiales; Zapata, Velsquez
y Smith (2004) analizan la prediccin de caudales mensuales usando sistemas adaptables de
inferencia neurodifusa. No obstante, la mayor parte de los trabajos citados en la literatura
ms relevante estn relacionados con el uso de modelos de redes neuronales artificiales (vase
por ejemplo la revisin general presentada por Zhang, Patuwo y Hu (1998), o los ejemplos de
aplicaciones especficas que son presentadas por Heravi, Osborn y Birchenhall (2004), Swanson
y White (1997a), Swanson y White (1997b), Chatfield (1998), Darbellay y Slama (2000), Kuan
y Liu (1995), entre muchos otros). Ms an, se han desarrollado esfuerzos importantes por
establecer marcos metodolgicos para la especificacin de modelos de redes neuronales basados
en criterios estadsticos; vase por ejemplo a Anders y Korn (1999) y Fukumizu (2003). As,
existe muy poca experiencia en el modelado y la prediccin de series temporales usando
sistemas de inferencia difusa y particularmente para los sistemas adaptables de inferencia
neurodifusa (Jang, 1993); slo recientemente se ha planteado la relacin de estos ltimos con otras
tcnicas economtricas (Velsquez et al., 2004), abriendo la posibilidad de establecer un proceso
sistemtico de especificacin fundamentado en pruebas estadsticas, permitiendo desarrollar as
un marco de trabajo formal y riguroso.

Por otro lado, se ha observado que muchas series temporales presentan una volatilidad
que puede ser cambiante en el tiempo, y que adems puede agruparse en clusters; este
comportamiento ha sido investigado principalmente en el campo financiero y sugiere la
existencia de una estructura en la volatilidad. Para explicar estos comportamientos, Engle
(1982) desarroll los modelos de heterocedasticidad condicional autorregresiva (ARCH, por
sus siglas en ingls) los cuales permiten representar la varianza de las series como una
funcin de las perturbaciones aleatorias pasadas. Otros modelos ms complejos han surgido
como generalizaciones de la propuesta de Engle (1982) tales como los modelos GARCH
(Bollerslev, 1986) e IGARCH (Nelson, 1991) entre muchos otros.

Tradicionalmente, los modelos ARCH y sus generalizaciones han sido usados para modelar
la volatilidad de las series temporales, mientras que la media esperada es representada usando
la aproximacin de Box y Jenkins (1970). As, los modelos obtenidos son lineales en media
y no lineales en varianza. No obstante, es natural pensar que los modelos de Box y Jenkins
(1970) usados en esa aproximacin podran ser reemplazados por otras tcnicas no lineales
para obtener una representacin no lineal en la media y en la varianza. Aunque esta idea fue
3

esbozada de forma general por Tong (1990), en la literatura ms relevante se han presentado pocas
aproximaciones; Chan y McAleer (2003) presentan un modelo de transicin suave combinado con
un modelo GARCH para los errores en presencia de observaciones extremas; Chen y Mike (2006)
proponen la combinacin de un modelo de transicin brusca (tipo threshold), que modela la no
linealidad en la media, con un modelo GARCH que representa la estructura de la volatilidad,
y presentan varios casos de aplicacin en que el modelo hbrido postulado brinda una mejor
representacin en relacin a otros modelos tradicionales.
De acuerdo con lo anterior, resulta natural extender la propuesta de Velsquez et al. (2004)
en donde se considera un sistema adaptable de inferencia neurodifusa homocedstico (varianza
constante en el tiempo), permitiendo que la varianza de los errores sigan un proceso ARCH.
Igualmente, este mismo enfoque puede verse como una extensin del trabajo de Chan, Marinova
y McAleer (2005) al sustituir el modelo STR por un modelo adaptable de inferencia neurodifusa.
Consecuentemente, el tpico principal de esta tesis es:

Establecer como un modelo adaptable de inferencia neurodifusa para el cual la varianza de


los residuales sigue un proceso ARCH, y que se ha bautizado como ANFIS-ARCH en esta
investigacin, podra ser usado para el modelado y la prediccin de series temporales, y
determinar si existen ganancias derivadas de su uso.

1.2 OBJETIVO GENERAL

Un objetivo de este trabajo, y el ms simple de todos, es establecer la representacin matemtica


de un modelo hbrido de la clase propuesta. Sin embargo, esta formulacin por si misma
no brinda los elementos necesarios para realizar la especificacin de un modelo para una
serie particular; se requerira establecer que trminos conformaran el modelo, as como la
determinacin de los valores de sus parmetros. Esta especificacin no puede ser obtenida al
tratar los modelos ANFIS y ARCH independientemente, ya que no se garantiza el cumplimiento
de unos criterios mnimos tales como la parsimonia o la normalidad de los residuales, ni se tiene
en cuenta la sinergia y propiedades de esta nueva clase de modelos. As, el objetivo restante de
este trabajo es establecer una aproximacin metodolgica basada en un proceso claro, riguroso
y sistemtico que permita obtener un modelo ANFIS-ARCH.
Por otra parte se sabe que la estimacin de parmetros en modelos no lineales es bastante
difcil debido a la presencia de puntos de mnima local, as como las variaciones en sensibilidad de
la funcin objetivo en relacin a cada uno de los parmetros; la incorporacin de una componente
ARCH dentro de la especificacin de ANFIS, dificulta este problema, ya que la funcin de costo
4

es muy sensible a pequeas variaciones en los parmetros del modelo ARCH, por lo que debe
verificarse la capacidad que tienen las tcnicas de optimizacin para converger al ptimo global
del modelo. As, otro objetivo de esta tesis es analizar, a partir de resultados empricos, qu
tcnica podra ser adecuada para la estimacin de los parmetros del modelo.

1.3 ORGANIZACIN DEL DOCUMENTO

La organizacin de este trabajo se encuentra descrita a continuacin. En el captulo 2 es


presentada una introduccin al problema genrico de regresin, as como una revisin de los
sistemas de inferencia difusos y el modelado usando ANFIS. Las limitaciones de los sistemas
de inferencia neurodifusa en el modelado y prediccin de series temporales son presentadas
en el captulo 3, donde se especifican conceptos y definiciones bsicas en el contexto de series
temporales y el uso de ANFIS en esta misma rea. Un modelo ANFIS-ARCH para el modelado
de series temporales es planteado en el captulo 4, adems se establece una aproximacin
metodolgica para obtener este tipo de modelos y una estrategia para estimar sus parmetros.
En el captulo 5 se presentan dos casos de aplicacin, en la seccin 5.1 se presenta la serie fsica
del SOI, y en la seccin 5.2 se presenta la serie financiera de los cambios relativos en los precios
de cierre de las acciones de IBM. Finalmente, en el captulo 6 se establecen las conclusiones y los
trabajos futuros.

1.4 DIFUSIN DE RESULTADOS

En el marco de este proyecto se han presentado para su revisin dos trabajos.

El primero para la revista de la Facultad de Ingeniera de la Universidad de Tarapac


Chile - INGENIARE, titulado CARACTERIZACIN DEL SOI USANDO ANFIS CON
RESIDUALES HETEROCEDSTICOS.

II Congreso Colombiano de Computacin S CARACTERIZACIN DEL SOI USANDO


ANFIS CON RESIDUALES HETEROCEDSTICOST. Bogota, 18 Abril 2007.
2. GENERALIDADES SOBRE LOS SISTEMAS DE INFERENCIA DIFUSA

El uso de los sistemas de inferencia difusa para la solucin de problemas de modelado se ha


incrementado en los ltimos aos, especialmente en el rea de control; ello se debe a que ha sido
demostrado que muchos tipos de sistemas de inferencia difusa son aproximadores universales
de funciones (Jang, 1993). Particularmente, los sistemas adaptables de inferencia neuro-difusa
(ANFIS, por sus siglas en ingls), propuestos por Jang (1993), son considerados como modelos no
paramtricos de regresin no lineal que permiten aproximar una relacin existente y desconocida
entre una variable dependiente y un conjunto de variables independientes. El objetivo de este
captulo es presentar los conceptos bsicos generales sobre el modelado de sistemas usando
ANFIS a partir de la propuesta realizada por Jang(1993; 1994). Para ello, en la Seccin 2.1 se
presenta una definicin normal del problema genrico de regresin; seguidamente, en la Seccin
2.2 se discute de una forma muy general los principales tipos de sistemas de inferencia difusa
existentes, para seguidamente, presentar a los modelos ANFIS en la Seccin 2.3. En la Seccin
2.4, se discute la estrategia de especificacin del modelo que fue propuesta por Jang (1994).
Finalmente, en la Seccin 2.5 se concluye.

2.1 EL PROBLEMA GENRICO DE REGRESIN

Un problema comn en diversas disciplinas, como matemticas, estadstica o economa, es


aproximar adecuadamente una funcin desconocida de varias variables a partir de una muestra
de datos. Para ello, se asume que la variable dependiente o respuesta, y, es una funcin, f , de
una o ms variables explicativas x1 , x2 , ..., xn (Friedman, 1990), tal que

y = f (x1 , x2 , ..., xn ) + (2.1)

donde la funcin f representa las relaciones determinsticas entre la variable dependiente y y las
variables independientes x1 , x2 , ..., xn ; es una variable aleatoria que representa todos los efectos
de aquellas variables no medibles o que no han sido consideradas en la especificacin de f y que
tienen influencia sobre y, pero que no tienen relacin con las variables incluidas en la regresin.
En el problema genrico de regresin se desea utilizar la muestra finita de datos
{y, x1 , x2 , ..., xn }N para construir una aproximacin f(x1 , x2 , ..., xn ) a la funcin desconocida
1

5
6

por ejemplo, una de


f (x1 , x2 , ..., xn ). Muchas tcnicas han sido usadas para especificar f ();
las aproximaciones ms comunes es suponer que la relacin entre las variables es de orden
lineal, de tal forma que:
X
n
y = f((x1 , ..., xn ) + = i xi + (2.2)
i=1

No obstante, cuando la relacin entre las variables independientes y la variable explicada


es de orden no lineal f puede ser reemplazada por funciones ms complejas, entre las que se
cuentan los modelos de redes neuronales artificiales, algunos tipos de sistemas de inferencia
difusa, y otras formas de regresin no lineal.

2.2 SISTEMAS DE INFERENCIA DIFUSA

El objetivo de esta investigacin est relacionado con el uso de sistemas de inferencia difusa para
construir aproximaciones a funciones no lineales que representan la dinmica de sistemas reales.
Por tal motivo, en esta seccin se profundiza en las definiciones y conceptos bsicos necesarios
para abordar los dems elementos discutidos en este captulo, y que ya fueron anunciados en la
introduccin.
En trminos generales, un sistema de inferencia difuso es una tcnica que permite modelar las
relaciones existentes entre una variable dependiente y un conjunto de variables independientes
a partir de un sistema de reglas heursticas.
Un sistema de inferencia difusa est conformado por variables de entrada que componen
los antecedentes de las reglas, una variable de salida (para el caso general de los modelos de
regresin) o variable dependiente, un conjunto de reglas difusas, y un sistema de inferencia
que permite calcular los valores de la variable de salida cuando los valores de las variables de
entrada son conocidos (Jang, 1993).
Para resolver el problema genrico de regresin presentado en la seccin anterior, es decir,
especificar f (), pueden ser utilizados diferentes tipos de sistemas de inferencia difusa, todos
los cuales se caracterizan por especificar la relacin entre la variable dependiente y las variables
independientes a partir de un modelo ecuacional.
Diversos tipos de sistemas pueden ser obtenidos cambiando las especificaciones del sistema
de inferencia difuso; entre las principales se encuentran: FALCON (Lin y Lee, 1991), GARIC
(Bherenji y Khedkar, 1992), ANFIS (Jang, 1993), FUN (Sulzberger, Tschicholg-Gurman y Vestli,
1993), FINEST (Tano, Oyama y Arnould, 1996), SONFI (Juang y Lin, 1998), NEFCON (Nauck y
Kruse, 1999), EFuNN (Kasabov y Song, 1999), HyFIS (Kim y Kasabov, 1999). Estos sistemas han
7

sido utilizados para resolver problemas de control, reconocimiento de patrones, prediccin, y


toma de decisiones entre muchos otros.
Algunos de los sistemas anteriormente mencionados se basan en el uso de reglas del tipo
Takagi-Sugeno (Takagi y Sugeno, 1985), para las cuales el consecuente de la regla es especificado
como una funcin de las variables en los antecedentes. En el caso de una regla con dos variables
independientes x y y, y una variable dependiente z, una regla de Takagi-Sugeno toma la siguiente
forma:
Si x A y B z = f (x, y) (2.3)

donde A y B son conjuntos difusos.


Un conjunto difuso puede ser definido como una funcin que asocia a cada variable del
dominio un valor en el intervalo [0,1]. z = f (x, y) es una funcin crisp en el consecuente,
que usualmente corresponde a una funcin polinomial de las variables de entrada x y y. De
acuerdo al orden del polinomio de la funcin f () se establece el orden del sistema de reglas
del modelo Takagi-Sugeno, de manera que es de primer orden cuando f (x, y) es especificada
como un polinomio de orden uno. Una discusin completa general sobre este tipo de reglas es
presentado por Kasabov (1999).

2.3 ANFIS: SISTEMA ADAPTABLE DE INFERENCIA NEURODIFUSA

Jang (1993) utiliza reglas de Takagi-Sugeno para especificar un sistema de inferencia difusa que
puede ser interpretado como una red neuronal artificial. Esta arquitectura es conocida como
sistema adaptable de inferencia neurodifusa (ANFIS, por sus siglas en ingls). Este tipo de
sistema combina los mecanismos propios de los sistemas de inferencia difusa para representar
conocimiento experto y reglas heursticas, con las ventajas de los modelos de redes neuronales
para manipular informacin numrica (Jang, 1993). Estas ventajas estn relacionadas con un
alto grado de adaptabilidad, capacidad de aprendizaje, generalizacin, y tolerancia al ruido.
Jang (1993) demuestra que ANFIS puede aproximar con una precisin arbitraria cualquier
funcin no lineal definida en un dominio compacto; por esta razn se considera que ANFIS es
un aproximador universal de funciones. Esta demostracin garantiza que dado un conjunto de
datos y una relacin determinstica entre ellos ANFIS es capaz de aproximarla.
Para describir la arquitectura de ANFIS se usar por simplicidad un sistema de inferencia
difusa con dos variables de entrada cuyo dominio ha sido dividido en dos conjuntos borrosos
A1 y A2 para la variable x, y B1 y B2 para la variable y, y una variable de salida z cuya relacin
8

con x y y se describe usando reglas de Takagi y Sugeno (1985). Dicho sistema se escribe como:

Si x A1 y B1 f1 (x, y) = p1 x + q1 y + r1
Si x A1 y B2 f2 (x, y) = p2 x + q2 y + r2
Si x A2 y B1 f3 (x, y) = p3 x + q3 y + r3 (2.4)
Si x A2 y B2 f4 (x, y) = p4 x + q4 y + r4

donde la particin del espacio del dominio dada por las reglas difusas se presenta en la Figura
2.1(a) y la arquitectura de ANFIS es ilustrada en la Figura 2.1(b). Las funciones en cada nodo de
una capa son las mismas y se describen a continuacin:

Capa 1: Cada nodo i en esta capa tiene la siguiente funcin:

O1i = Ai (x) (2.5)

donde O1i es la funcin de pertenencia de Ai y especifica el grado en el cual x satisface Ai .


Usualmente, se utilizan funciones de pertenencia normalizadas Ai (x) donde el mximo
valor es 1 y el mnimo valor 0. Para arquitecturas con slo dos conjuntos difusos unas de
las funciones usadas son la sigmidea, S(), y la Z() que pueden escribirse como:

1
S(xt , i , ci ) =   (2.6)
1 + exp i (xt ci )

y la funcin Z():
1
Z(xt , i , ci ) = 1   (2.7)
1 + exp i (xt ci )

donde i , ci son llamados parmetros de la premisa o el antecedente, y varan dando
formas diferentes a las funciones de pertenencia en Ai . En arquitecturas con ms conjuntos
difusos usualmente se utiliza, para cada conjunto, la funcin de campana de Gauss
generalizada dada por:

1
m(xt , i , i , i ) = A (z) = (2.8)
x |2i |
1 + ti i

donde i , i , i son los parmetros del antecedente.
9

Figura 2.1: (a)Particin del espacio del dominio dada por las reglas difusas. (b)Arquitectura de
ANFIS
10

Capa 2: Los nodos de esta capa entregan como salida el producto de las seales entrantes:

wi = Ai (x)Bi (x), i = 1, 2. (2.9)

Capa 3: El resultado de esta capa establece el porcentaje en que cada regla contribuye con
la solucin final y se calcula como:

wi
wi = , i = 1, 2. (2.10)
w1 + w2

y representan el proceso de agregacin de los antecedentes de la regla.

Capa 4: Los nodos de esta capa tienen la siguiente funcin:


O4i = wi fi = wi pi x + qi y + ri , (2.11)


donde wi es la salida de la capa 3 y pi , qi , ri constituyen una serie de parmetros llamados
parmetros del consecuente.

Capa 5: El nico nodo calcula la salida final como la suma de todas las seales entrantes:

X P
i wi fi
O5i = wi fi = P (2.12)
i wi

Cuando ANFIS es especificado usando reglas de Takagi-Sugeno, las variables de entrada del
antecedente son las mismas que las variables de entrada en el consecuente, y el dominio de cada
variable independiente es cubierto por al menos dos conjuntos difusos. Usualmente, la funcin
especificada para el consecuente es una combinacin lineal de sus variables de entrada, aunque
pueden usarse funciones ms complejas.

2.4 MODELADO USANDO ANFIS

La construccin de modelos de regresin usando ANFIS implica cuatro pasos fundamentales


(Jang, 1993):

1. La seleccin de las variables de entrada y la de salida.

2. La especificacin de los conjuntos borrosos para cada variable de entrada, as como su


nmero.
11

3. La especificacin del conjunto de reglas.

4. La estimacin de los parmetros del modelo.

A continuacin, se presentar una breve descripcin de las metodologas ms comunes para


realizar este proceso.

2.4.1 Estimacin de parmetros

Jang (1993) propone un algoritmo de aprendizaje hbrido para la estimacin de los parmetros
del modelo, el que combina el uso de tcnicas de optimizacin basadas en gradientes con la
estimacin basada en mnimos cuadrados. De acuerdo con la arquitectura planteada en la
seccin anterior, para un sistema con dos variables de entrada y cuatro reglas, se puede observar
que si se consideran fijos los valores de los parmetros de los antecedentes, la salida puede ser
expresada como una combinacin lineal de los parmetros del los consecuentes; as la salida del
sistema puede calcularse como:

f = (w1 x)p1 + (w1 y)q1 + (w1 )r1 + (w2 x)p2 + (w2 y)q2 + (w2 )r2 +
(w3 x)p3 + (w3 y)q3 + (w3 )r3 + (w4 x)p4 + (w4 y)q4 + (w4 )r4 (2.13)

la cual es lineal en los parmetros de los consecuentes. Al tener una muestra de N puntos, se
obtienen N ecuaciones como la anterior, formando un sistema sobredeterminado el cual puede
ser estimado por mnimos cuadrados.
El algoritmo de optimizacin propuesto por Jang (1993) asume que previamente se han
definido la cantidad de conjuntos difusos en que se ha dividido el dominio de los conjuntos
difusos de cada variable, y se ha especificado el conjunto de reglas; el algoritmo se basa en los
siguientes pasos:

1. Se asumen unos valores iniciales para los parmetros de los antecedentes.

2. Asumiendo fijos los valores iniciales de los parmetros de los antecedentes, se estiman por
mnimos cuadrados los consecuentes.

3. Se calcula la funcin de error para medir el ajuste entre los datos reales y la salida producida
por ANFIS.

4. Si la precisin es inferior a un lmite previamente definido se detiene el proceso de


optimizacin; de lo contrario se continua con el paso siguiente.
12

5. Se estima una nueva aproximacin de los parmetros de los antecedentes usando alguna
tcnica basada en gradiente, y se retorna al paso 2.

2.4.2 Especificacin de la estructura de ANFIS

La especificacin de la estructura del modelo consiste en:

1. Seleccionar las variables de entrada.

2. Determinar el nmero de conjuntos difusos en que se divide el dominio de cada variable


de entrada.

3. Construir el sistema de reglas.

Jang(1994) propone el uso del algoritmo CART de Breiman, Friedman, Olshen y Stone (1984) el
cual permite la especificacin inicial de la estructura de ANFIS. Las reglas presentadas en (2.4)
puede interpretarse como un rbol binario de decisin como muestra la Figura 2.4.2.
Para construir el rbol de regresin, CART primero incrementa extensivamente el rbol,
basado en los datos de entrenamiento as:

1. Para el nodo raz se busca entre todas las posibles variables del espacio solucin aquella
divisin que minimice el error.

2. Se repite el proceso de bsqueda para cada hijo del nodo raz.

3. Se continua el proceso hasta llegar a un criterio de parada como haber alcanzado una
profundidad mxima o no obtener una mejora en el error por encima de cierto umbral.

Y posteriormente recorta el rbol hacia atrs basado en el principio de mnimo costo de


complejidad, dando como resultado una secuencia de rboles de varios tamaos, donde se
elige el rbol con mejor desempeo.
Para hacer continuo el resultado de CART, Jang (1993) propone usar ecuaciones de primer
orden para las funciones fi en (2.4), y establecer una funcin de pesos para cada regla siguiendo
las funciones sigmidea (2.6) y z (2.7).
Lewis (2000) hace un anlisis acerca de este algoritmo y seala entre sus ventajas:

1. Es un mtodo bastante flexible.

2. CART no hace suposiciones sobre la distribucin de ningn tipo, ya sea de las variables
predictoras como de la variable criterio.
13

Figura 2.2: rbol binario - Fuente: Jang (1993)

3. Las variables pueden ser de diferentes tipos como continuas, discretas, categricas o
nominales.

4. CART no est afectado por valores extremos, colinealidad, heterocedasticidad que afecten
otros procedimientos establecidos. Los valores extremos pueden ser aislados en un nodo
y no tienen ningn efecto en la divisin.

5. CART puede detectar y revelar interacciones en un conjunto de datos.

Y entre sus desventajas menciona:

1. Al ser un algoritmo binario, tiende a generar rboles de muchos niveles. Por ello, el rbol
resultante puede que no presente los resultados de manera eficiente, sobre todo si la misma
variable ha sido utilizada para la divisin de varios niveles consecutivos.

2. CART no est basado en un modelo probabilstico. No existen intervalos de confianza


asociados con las predicciones derivadas usando el algoritmo CART para clasificar a un
conjunto de datos.

Posterior a la primera aproximacin de Jang (1993), donde se especificaban los modelos


ANFIS con el algoritmo CART, Jang (1996) propone realizar el proceso de seleccin de entradas
evaluando todos los posibles conjuntos de variables y determinando con cual se obtena el menor
error. Este costoso proceso era sugerido por Jang (1996) soportado en la velocidad de estimacin
de los modelos de acuerdo a la tcnica hbrida de optimizacin propuesta por l.
14

2.5 CONCLUSIONES

En este captulo se ha presentado una breve descripcin de los conceptos bsicos de ANFIS y de
los algoritmos comnmente utilizados para su especificacin. Esta tcnica ha sido ampliamente
utilizada para la construccin de modelos de series temporales abordando el problema desde el
punto de vista de la regresin de funciones; sin embargo, no se han analizado completamente las
implicaciones que ello tiene desde la perspectiva del anlisis y prediccin de series temporales.
As el objetivo del prximo captulo ser presentar, desde un punto de vista crtico, las limitantes
en la construccin de modelos de series temporales cuando este problema es abordado como si
fuese una simple regresin.
3. LIMITACIONES DE LOS SISTEMAS DE INFERENCIA NEURODIFUSA EN EL
MODELADO DE SERIES TEMPORALES

El modelado de series temporales es un problema comn a muchas disciplinas, en el cual


se pretende representar la dinmica del fenmeno estudiado y ayudar a su entendimiento. La
importancia de la solucin de este problema ha hecho que se desarrollen diversas aproximaciones
metodolgicas desde la estadstica, la economa y la inteligencia artificial. Este problema
comparte un terreno comn con la problemtica general de la regresin, pero a diferencia de esta
ltima, el ordenamiento de los datos en el tiempo o en el espacio induce nuevas propiedades
estadsticas que deben ser tenidas en cuenta durante la especificacin de los modelos.
El primer objetivo de este captulo es definir un vocabulario comn que incorpore las
principales definiciones relacionadas con los modelos de series temporales y sus propiedades.
Tal como ya se esboz, el problema de la modelacin de series temporales es un caso particular
del problema de regresin, para el cual deben tenerse en cuenta particularidades propias que
hacen que las tcnicas de regresin no puedan ser usadas directamente sin que se realicen
consideraciones especiales. As, otro objetivo de este captulo es presentar una discusin entre
el modelado de series temporales y la regresin tradicional.
Dada la importancia del problema de modelacin de series temporales, muchas tcnicas han
sido propuestas para su solucin, y no es sorprendente que ANFIS haya sido utilizado para
resolver este tipo de problemas. No obstante, es necesario analizar las implicaciones que tiene el
uso de ANFIS, entendido como un modelo de regresin, cuando es utilizado como un modelo
de series temporales. Este es otro objetivo de este captulo.
Para cumplir con los objetivos anteriores, este captulo se encuentra organizado como sigue.
La Seccin 3.1 presenta conceptos y definiciones bsicas en el contexto de series temporales. Una
comparacin entre prediccin y regresin es presentada en la Seccin 3.2. El planteamiento de
ANFIS como un modelo para series temporales es presentado en la Seccin 3.3, y discutido en
la Seccin 3.4. Finalmente, la Seccin 3.5 presenta las conclusiones de este captulo.

3.1 CONCEPTOS Y DEFINICIONES BSICAS

Dentro del contexto de series temporales existe un vocabulario bsico comnmente usado en
la literatura estadstica, pero de poco uso en la comunidad de Inteligencia Artificial, el cual se

15
16

presenta en esta seccin.


Las series temporales son observaciones que permiten guardar un registro sobre como cambia
el mundo (Tong, 1990); formalmente, una serie temporal se define como una familia de variables
aleatorias ordenadas en el tiempo o en el espacio mediante un subndice t:

y1 , ..., yt , ..., yT

En general se establecen tres propsitos en el modelado de las series temporales (Kasabov, 1999)
la prediccin de corto plazo, en la cual se pretende obtener el valor ms probable para la siguiente
observacin; el modelado, que busca determinar las propiedades y la estructura subyacente de la
dinmica de la serie temporal estudiada; y la caracterizacin, en donde prima la determinacin
de las propiedades fundamentales de la serie temporal. La importancia del anlisis de las series
temporales radica en que su estudio puede ayudar a representar la dinmica del fenmeno
observado y por lo tanto a entenderlo; adems, muchos problemas pueden ser asimilados a series
temporales en muchas reas; en economa, por ejemplo, la prediccin de demandas y precios a
nivel macro y micro econmico es una importante rea de estudio; en cuando a variables fsicas,
existen muchos trabajos sobre la caracterizacin y prediccin de series como los fenmenos
macroclimticos (el fenmeno de El Nio, el ndice de Oscilacin del Sur), y las variables
climticas e hidrolgicas (precipitacin, caudal); en las reas sociales, las series temporales han
sido utilizadas para el mejor entendimiento de muchos comportamientos; algunas de las series
analizadas son nacimientos, homicidios, muertes a causa de enfermedades especficas, entre
otras.
Muchas de las propiedades de las series temporales estn relacionadas con los patrones
visuales que pueden distinguirse a partir de su inspeccin. As por ejemplo, para la serie
presentada en la Figura 3.1a se puede observar que existen: la tendencia, que representa los
movimientos de largo plazo de la serie (vase la Figura 3.1b), una componente estacional
mostrada en la Figura 3.1c, que corresponde a aquellos movimientos que poseen un patrn
peridico asociado usualmente a algn tipo de efecto calendario; una componente cclica
asociada a ciclos de largo plazo que intervienen sobre la serie, vase la Figura 3.1d; y una
componente irregular, presentada en la Figura 3.1e, que refleja los movimientos no sistemticos
de la serie (Harvey, 1989). De esta forma, un modelo que represente el comportamiento de la
serie yt debe ser especificado como:

yt = tendencia + estacionalidad + ciclos + irregular


17

(a)

(b) (c)

(d) (e)

Figura 3.1: Caractersticas de las series temporales


18

3.1.1 Definicin de linealidad

Las componentes de tendencia, estacionales y los ciclos de largo plazo pueden ser representadas
como una funcin g() de la informacin disponible, tal que:

yt = g(It1 ) + h(It1 )t (3.1)

donde It1 representa la informacin disponible hasta el instante t1 y t es una variable aleatoria
normal estndar. Se dice que la dinmica de yt es lineal si la funcin g() es una funcin lineal de
las variables disponibles, y si la funcin h() es especificada como una constante. yt es no lineal
en media cuando g() es especificada como una funcin no lineal y h() es una constante. yt es
lineal en media y no lineal en varianza cuando g() es lineal y h() es diferente de una constante.
Y finalmente, yt es no lineal en media y en varianza cuando g() es una funcin no lineal y h() es
diferente de una constante.

3.1.2 Volatilidad cambiante en el tiempo y clusters de volatilidad

La volatilidad cambiante en el tiempo, y la presencia de clusters de volatilidad son dos


caractersticas que usualmente se han presentado en series financieras y econmicas, y que
desde un punto de vista matemtico pueden entenderse como la presencia de una estructura
funcional en la varianza, lo que equivale a definir la funcin h() como diferente de una constante.
Engle (1982) propone especificar h() como:

Q
X
h2t = 0 + q a2tq + t (3.2)
q=1

donde at = ht t . Este es el modelo ARCH de Engle.


Para determinar si una serie sigue un proceso ARCH, se utiliza la prueba propuesta por
Engle (1982), cuya hiptesis nula es que la serie es homocedstica. La prueba se realiza de la
siguiente manera

P 
1. Estimar SSR0 = y t w 2 , donde w es la media de la serie.

2. Estimar la regresin y 2t = 0 + 1 y 2t1 + ... + q y 2tq + t

P
3. Calcular SSR1 = 2t
19

4. El estadstico LMARCH es igual a



(SSR0 SSR1 ) q
LMARCH =   2q (3.3)
(SSR1 ) T 2q 1

3.1.3 Mtodo de mxima verosimilitud

Para la estimacin de los modelos de series temporales se parte de que las realizaciones
de la variable aleatoria t son incorrelacionadas e idnticamente distribuidas, siguiendo una
distribucin normal con media cero y varianza desconocida. Una vez que se han estimado los
parmetros del modelo se procede a verificar el cumplimiento de estos supuestos; cuando uno
o ms de ellos han sido violados, el modelo debe ser re-especificado y sus parmetros deben ser
nuevamente estimados. El proceso de verificacin de estos supuesto se conoce como diagnstico
del modelo.
El mtodo de mxima verosimilitud es un procedimiento para la estimacin de parmetros
de modelos probabilsticas (Mills, 1993). Dado un modelo de series temporales de la forma:

yt = f () + t (3.4)

con t i.i.d.N(0, ), la funcin de verosimilitud se define como la funcin de densidad de t .


Como las variables t son independientes e idnticamente distribuidas, su funcin de densidad
conjunta puede representarse como
Y
T
L= p(t ) (3.5)
t=1

El objetivo que se pretende alcanzar con el mtodo de estimacin es encontrar aquellos valores de
los parmetros de la funcin de distribucin de probabilidades que maximicen la probabilidad
de que efectivamente t viene de la distribucin postulada . Al despejar t se obtiene que

t = yt f () (3.6)

Por lo tanto, para encontrar los estimativos se debe derivar la funcin de verosimilitud con
respecto a cada uno de los parmetros a estimar, igualar a cero y despejar el respectivo valor.
Debido a que la funcin f () en (3.5) es inestable numricamente, y dado que existe una
relacin biunvoca entre una funcin y su logaritmo, entonces se prefiere encontrar la derivada
del logaritmo de la funcin de verosimilitud.
De una muestra extrada de una distribucin normal con media y varianza h2 , el logaritmo
20

de la funcin de mxima verosimilitud es


n
n n 2 1 X a2
log L = ln(2) ln ht 2 (3.7)
2 2 2 ht
i=1

3.2 PREDICCIN VERSUS REGRESIN

Los modelos de regresin, como se describi anteriormente, intentan aproximar una funcin de
acuerdo a un conjunto de valores del espacio solucin. La prediccin en el contexto de series
temporales intenta, a su vez, encontrar una funcin que permita predecir valores futuros de un
fenmeno de acuerdo a los valores ya observados. Aunque ambos objetivos suenen similares, la
prediccin de series temporales y la regresin deben considerarse como dos problemas distintos.
En primer lugar, porque los modelos de regresin no consideran relevante el orden de los datos
para el desempeo del modelo; sin embargo, para las series temporales los modelos deben
reflejar una transicin probabilstica de un valor al siguiente. Y en segundo lugar, porque la
problemtica de las series temporales est enmarcada en un contexto estadstico que desconocen
los modelos de regresin, es decir, los modelos de regresin ignoran algunas caractersticas
estadsticas de la serie.
En la modelacin usando tcnicas tradicionales de regresin se tienen en cuenta los siguientes
aspectos:
1. La distribucin de probabilidad de yt

2. Las propiedades de los parmetros del modelo tales como: el condicionamiento y la


inferencia estadstica.
Adicionlmente, cuando se considera la modelacin de series temporales, los siguientes aspectos
son incluidos:
1. La estructura de dependencia de la serie con sus valores pasados.

2. Las propiedades dinmicas del modelo, tales como la convergencia a puntos de equilibrio,
la presencia de ciclos lmite y la divergencia.

3. La presencia de estructuras determinsticas en la varianza del modelo y la presencia de


clusters de volatilidad.

4. Los cambios en las propiedades estructurales de la serie de tiempo tales como


observaciones atpicas, cambios de nivel, cambios de pendiente, modificaciones en las
componentes cclicas, etc.
21

3.3 USO DE ANFIS EN EL MODELADO DE SERIES TEMPORALES

Desde el punto de vista de la modelacin con ANFIS no existe diferencia entre un modelo de
regresin tradicional y un modelo de series temporales. Velsquez et al. (2004) han analizado este
problema demostrando que ANFIS tiene un claro vnculo con algunos modelos economtricos
tradicionales, y que bajo algunas simplificaciones ANFIS puede ser considerado como una
generalizacin de los modelos STR (Smooth Transition Regression). En esta seccin se presenta
el desarrollo propuesto por Velsquez et al. (2004), y se analizan algunas limitantes que presenta
esta aproximacin cuando se modelan series financieras y econmicas.

3.3.1 Modelos STR

Una aproximacin al comportamiento de la series temporales es el modelado de rgimen


cambiante, dando paso a una gran variedad de modelos no lineales para series temporales
(Granger y Terasvirta, 1993), donde se considera que la serie temporal se comporta de forma
diferente de una regin a otra.
En un modelo autorregresivo (AR), la observacin actual yt se obtiene como una combinacin
lineal de sus valores previos, tal que:

X
P
yt = 0 + p ytp + ht (3.8)
p=1

Este modelo puede extenderse al caso no lineal al considerar que la serie se encuentra dividida
en varias regiones, en cada una de las cuales su dinmica puede ser aproximada por un modelo
AR:
X
P
XP

(1) (1)
(2) (2)

yt = 0 + p ytp + F(zt )
0
+ y
p tp
+ t (3.9)



p=1 p=1

donde F() es una funcin continua acotada entre cero y la unidad, y zt es la variable de transicin
que permite determinar en que rgimen se encuentra la serie temporal. Estos modelos son
llamados STR y su proceso de especificacin es discutido por Granger y Terasvirta (1993). En
(3.9) pueden distinguirse entonces dos regiones: la primera, cuando F() = 0, se rige por el
modelo lineal:
X
P
(1) (1)
yt = 0 + p ytp + t (3.10)
p=1
22

y la segunda, cuando F() = 1, se rige por el modelo lineal



X
P
XP

(1) (1)
(2) (2)

yt = 0 + p ytp +
0
+ y
p tp
+ t (3.11)



p=1 p=1

si se considera la funcin F() como la funcin logstica:

1
F(yt ) = (3.12)
exp((yt c))

el modelo es llamado LSTAR (Logistic Smooth Transition Autoregressive), donde y c


representan los parmetros de la funcin de transicin, los cuales deben ser calculados dentro del
proceso de estimacin de los parmetros del modelo (van Dijk y Franses, 1999). Si se considera
F() como una funcin exponencial:

F(yt ) = exp((yt c)2 ) (3.13)

el modelo es llamado ESTAR (Exponential Smooth Transition Autoregressive).


El proceso de especificacin se basa en los siguientes pasos:

1. Se selecciona un modelo AR de orden P usando algn criterio de informacin u otra


metodologa.

2. Se realiza un contraste cuya hiptesis nula es que los residuales del modelo AR son
independientes e idnticamente distribuidos; y cuya hiptesis alternativa considera que
existe una estructura remanente en los residuales que el modelo AR no pudo capturar.
Cuando se rechaza la hiptesis nula, este contraste permite determinar el tipo de funcin
de transicin usado para especificar F(), as como la variable de transicin zt (esta prueba
es detallada en el prximo captulo).

3. Se estiman los parmetros del modelo STR seleccionado.

4. Se evala que los residuales estimados para el modelo especificado son independientes,
incorrelacionados e idnticamente distribuidos.

5. Se modifica el modelo segn sea necesario.

6. Se usa el modelo para propsitos de caracterizacin o pronstico.


23

3.3.2 ANFIS como una generalizacin de los modelos STR

Tal como lo indican Velsquez et al. (2004) ANFIS puede ser interpretado como una
generalizacin de los modelos STR especificados en (3.9) de la siguiente forma: se permite
que las regiones definidas por la funcin de transicin se traslapen usando conjuntos difusos.
De esta forma se obtiene un modelo de mayor complejidad que el modelo STR original.

La funcin de pertenencia a cada regin puede ser especificada, en el caso ms general, como
una funcin de campana generalizada, presentada en la ecuacin (2.8), dada por:

1
m(z; i , i , i ) = A (z) =
z |2i |
1 + i i

la cual representa el grado de pertenencia de z al conjunto A. En el caso de un modelo con dos


regiones, el modelo ANFIS puede ser descrito de la siguiente forma:

(1) (1) PP (1)


Si xt A1 yt = 0 + p=1 p ytp
(2) (2) PP (2) (3.14)
Si xt A2 yt = 0 + p=1 p ytp

equivalentes a un caso particular de ANFIS.

El proceso de clculo de yt en (3.14), permite que dicho sistema sea transformado a la ecuacin
paramtrica lineal, tal que los coeficientes p son calculados como

(i) (i)
m(xt ; 1 , 1 , 1 ) (1) m(xt ; 2 , 2 , 2 ) (2)
j = (i) (i)
j + (i) (i)
j (3.15)
m(xt ; 1 , 1 , 1 ) + m(xt ; 2 , 2 , 2 ) m(xt ; 1 , 1 , 1 ) + m(xt ; 2 , 2 , 2 )

cuyos coeficientes son una funcin continua de zt .

Velsquez et al. (2004) indican que, en el caso general, los antecedentes de (3.14) pueden
contener ms de una variable, incluyendo diferentes particiones del dominio. Esta aproximacin
permite usar diferentes conjuntos de variables tanto en el antecedente como en las reglas del
consecuente.

La capacidad de ANFIS para aproximar funciones no lineales est determinada por el


nmero de conjuntos difusos asociados a la variable de decisin; esto implica, que el nmero
de parmetros en el modelo crece exponencialmente cuando se incorporan nuevos conjuntos
difusos al sistema, limitando las aplicaciones a pocas variables.
24

3.4 DISCUSIN

En la Seccin 2.3 del captulo anterior se discuti la propuesta de Jang (1993) que introduce a
ANFIS como una tcnica de regresin capaz de aproximar todo tipo de funciones no lineales; sin
embargo, hablar de una tcnica de regresin tiene fuertes implicaciones en el contexto de series
temporales, como se vio en la Seccin 3.2, debido a que el modelado de series temporales
considera propiedades que desconocen las tcnicas de regresin, dichas propiedades estn
relacionadas con las estructuras y dinmicas de la serie. Esta marcada diferencia entre una
tcnica y otra, hizo necesario el establecimiento de ANFIS como un modelo en el contexto de
series temporales; en este sentido, Velsquez et al. (2004) analizan este problema demostrando el
vnculo entre ANFIS y algunos modelos economtricos, este anlisis es resumido en la Seccin
3.3. Trabajos posteriores mostraron buenos resultados de dicha metodologa cuando es aplicada
a casos reales, vase Zapata et al. (2004). Adems, este planteamiento dejo abierta la posibilidad
de establecer otro tipo de modelos ANFIS que son especficos para series temporales con
caractersticas especficas, como por ejemplo, la volatilidad cambiante en el tiempo y los cluster
de volatilidad presentados en la Seccin 3.1.2, cuya problemtica ya ha sido objeto de estudio
desde los trabajos de Engle (1982) que sugieren la presencia de una estructura determinstica en
la volatilidad. Aunque en teora, la ampliacin del modelo propuesto por Velsquez et al. (2004)
para considerar estructura en la volatilidad de la serie puede ser realizada de forma directa, no
es posible realizar esto en la prctica ya que es necesario disear un proceso de especificacin
que permita obtener esta nueva clase de modelos.
Respecto a la especificacin de los modelos ANFIS, Jang (1994) propone el uso de los
algoritmos CART de Breiman et al. (1984) tal como se muestra en la Seccin 2.4.2, donde se
exponen las ventajas de esta tcnica para establecer modelos de regresin, no obstante, hay claras
desventajas que tienen implicaciones desfavorables directas en el contexto de series temporales.
El principal problema para los modelos ANFIS en el contexto de series temporales es el nmero
de variables que este algoritmo puede llegar a considerar tanto en el antecedente como en el
consecuente de la regla, que puede ocasionar que el nmero de parmetros crezca de forma
exponencial generando una dificultad adicional en la estimacin del modelo y yendo contra el
principio de parsimonia. Adems, Jang (1996) propone la validacin cruzada como otra tcnica
para la seleccin de regresores en el modelo; sin embargo, esta tcnica requiere un alto costo
computacional. Por lo tanto es necesario el planteamiento de otro tipo de algoritmo o estrategia
para la especificacin de los modelos ANFIS y sus posibles ampliaciones, que podra estar
relacionada con las metodologas propuestas para los modelos economtricos relacionados con
ANFIS de la Seccin 3.3.
25

Finalmente, la estimacin de los modelos ANFIS es un problema complejo debido a la


presencia de mnimos locales en los modelos no lineales. Jang (1993) propone un algoritmo
hbrido basado en tcnicas de gradiente descendente para optimizar los parmetros de los
antecedentes y mnimos cuadrados para optimizar los parmetros de los consecuentes. Sin
embargo, este algoritmo no sera suficiente para una ampliacin relacionada con modelos de
heterocedasticidad condicional autorregresiva especialmente porque el algoritmo de mnimos
cuadrados ordinarios parte de la hiptesis de varianza constante. Adems, la influencia no lineal
que tienen los trminos que modelan la heterocedasticidad sobre la funcin de verosimilitud,
aumenta la dificultad en la estimacin de los parmetros ptimos para modelos de este tipo. Para
solucionar este problema se hace necesario entonces usar un tipo de algoritmo de optimizacin
robusto, preciso y que a su vez converja rpidamente a la solucin ptima de acuerdo a las
caractersticas de estos tipos de modelos. En este sentido, es igualmente necesario establecer si
en la prctica es posible recuperar los parmetros de un modelo conocido a partir de una serie
sinttica generada por l, es decir, si el modelo es capaz de recuperarse a s mismo.

3.5 CONCLUSIONES

En este captulo se presentaron conceptos bsicos en el contexto de series temporales relacionados


con la no linealidad y heterocedasticidad de las series temporales. Adems, se discutieron las
limitaciones de los planteamientos actuales de los sistemas de inferencia neurodifusa en el
modelado de series temporales, planteados como modelos de regresin. Tambin present
un resumen acerca del planteamiento de Velsquez et al. (2004) en el que ANFIS puede ser
usado en el contexto de series temporales estando relacionado con los modelos ecomtricos
STR. Finalmente, se discuti como este planteamiento abre posibilidades para la formulacin
de nuevos modelos, especficamente la formulacin de modelos adaptables de inferencia
neurodifusa con heterocedasticidad condicional autorregresiva y las implicaciones de estos en
los problemas de estimacin de parmetros y especificacin de modelos.
Siguiendo la primera aproximacin de ANFIS en el contexto de series temporales y de
acuerdo a la discusin planteada hasta ahora, en el prximo captulo se define un modelo
ANFIS capaz de capturar no solo la dinmica no lineal de las series temporales, sino tambin la
presencia de estructuras en su varianza.
26
4. UN MODELO ANFIS-ARCH PARA EL MODELADO DE SERIES TEMPORALES

4.1 REQUERIMIENTOS Y LIMITACIONES

Hasta los trabajos de Velsquez et al. (2004), ANFIS slo haba sido usado como modelo de
regresin dejando de lado las caractersticas estadsticas y probabilsticas de las series temporales,
se ignora as la relacin que tienen en las series temporales los valores presentes con los futuros
y se incurre en problemas metodolgicos para la especificacin de modelos. A partir de dicho
trabajo, se estableci una relacin entre ANFIS y los modelos tradicionales de series temporales
y se dej abierta la posibilidad de extender este tipo de modelos de acuerdo a estructuras
especficas que se deseen capturar en una serie.
Por otro lado se ha observado, en especial en el sector financiero, la presencia de estructuras en
la volatilidad de las series temporales, manifestada como cambios de la volatilidad en el tiempo
y el agrupamiento en clusters; estas caractersticas han sido analizadas a partir de los trabajos
de Engle (1982) por medio de modelos con varianza condicional autorregresiva. Sera posible
entonces pensar en una extensin de los modelos ANFIS para considerar esta caracterstica de
manera que los nuevos modelos capturaran la no linealidad en la media y la no linealidad en la
varianza de las series temporales.
Como se discuti en el captulo anterior, llegar a este tipo de modelos puede ser fcil en la
teora pero no en la prctica, ya que por la complejidad del modelo es necesario establecer
una estrategia de especificacin sistemtica y robusta. Estas caractersticas se encuentran
fcilmente en las metodologas del modelado tradicional de series temporales que hace uso
de un universo de pruebas estadsticas para la formulacin de modelos. La relacin puede
hacerse entonces gracias al planteamiento que hacen Velsquez et al. (2004) donde consideran
los modelos economtricos no lineales de transicin suave STR como un caso particular de los
modelos ANFIS bajo algunas restricciones en su arquitectura
El objeto de este captulo se centra en formular un modelo que capture la dinmica de
series no lineales en la media y con estructura en la varianza. Para conseguirlo, se propone un
modelo ANFIS con heterocedasticidad condicional autorregresiva denominado ANFIS-ARCH,
partiendo del modelo planteado por Velsquez et al. (2004); igualmente, debe establecerse
tambin una estrategia de especificacin con las caractersticas ya mencionadas y un algoritmo

27
28

para la estimacin de parmetros que permita al modelo converger rpidamente a la solucin


ptima. Adems, de probar si el modelo, de acuerdo a la estimacin planteada es capaz de
recuperarse a si mismo mediante simulaciones.
En la seccin 4.2 se presentan los objetivos general y especficos de este trabajo. El
modelo adaptable de inferencia neurodifusa con heterocedasticidad condicional autorregresiva
ANFIS-ARCH es formulado en la seccin 4.3. En la seccin 4.4 se presenta el algoritmo para la
estimacin de los parmetros del modelo. La estrategia para la especificacin de los modelos
ANFIS-ARCH es presentada en la seccin 4.5. En la seccin 4.6 se hace una simulacin de
Monte Carlo para determinar las propiedades del modelo en muestras pequeas. Finalmente,
las conclusiones son presentadas en la seccin 4.7.

4.2 OBJETIVOS

4.2.1 Objetivo general

Desarrollar estrategias para la formulacin de modelos ANFIS para series temporales que
permitan considerar errores heterocedsticos; y aplicar dichas estrategias a series comnmente
usadas en la literatura para determinar las limitaciones y bondades de los modelos formulados.

4.2.2 Objetivos especficos

1. Formular un modelo ANFIS que permita considerar dentro del modelo desarrollado por
Velsquez et al. (2004) errores heterocedsticos.

2. Proponer una estrategia para la seleccin de los modelos ANFIS-ARCH propuestos en el


primer objetivo.

3. Determinar las propiedades del modelo formulado para muestras pequeas, con el fin
de determinar si el modelo puede ser recuperado a partir de muestras pequeas, y si la
estrategia propuesta para la seleccin de modelos es adecuada.

4. Aplicar la estrategia planteada en el segundo objetivo, a series temporales comnmente


usadas en la literatura para comparar los resultados con otros modelos y establecer sus
debilidades y fortalezas.
29

4.3 FORMULACIN DEL MODELO ANFIS-ARCH

Para la formulacin de un modelo adaptable de inferencia neurodifusa (ANFIS) con


heterocedasticidad condicional autorregresiva, ANFIS-ARCH, es necesario retomar la relacin
establecida en la ecuacin (4.3) usada para representar una serie temporal en la que se tiene que:

yt = g(It1 ) + h(It1 )t

donde las funciones g() y h() estaban relacionadas con la media y la varianza de la serie
respectivamente. Si se considera para g() un modelo ANFIS de acuerdo a la arquitectura
planteada en la seccin 2.3.1, con una variable de transicin particionada en dos conjuntos
difusos dados por las funciones F() y G() ; y para h() se considera la ecuacin (3.2) que
representa los modelos ARCH, se obtiene un modelo ANFIS-ARCH de la forma:

F(zt )
XP XM


(1) (1) (1)

yt =
0
+ y
p tp + m mx +
F(zt ) + G(zt )


p=1 m=1

G(zt )
XP XM


(2) (2) (2)


0
+ y
p tp + m mx + at (4.1)
F(zt ) + G(zt )


p=1 m=1

donde xm son variables exgenas que pueden ser incluidas dentro del modelo; y at = ht t con
PQ
h2t = 0 + q=1 q a2tq + t .

La forma de las funciones F() y G() depende del tipo de funcin de transicin equivalente del
modelo ANFIS-ARCH. As, si la transicin del modelo sigue una funcin logstica equivalente,
F() esta dada por ecuacin sigmidea (2.6), S(), de la forma:

1
S=  
1 + exp 1 (zt c1 )

y la funcin G() corresponde a la funcin Z() de la ecuacin (2.7):

1
Z=1  
1 + exp 2 (zt c2 )

donde 1 , 2 , c1 y c2 son los parmetros de los antecedentes del modelo. Cuando se especifica
una funcin de transicin exponencial equivalente para el modelo, F() corresponde a la ecuacin
30

E(), tal que:


E = exp(1 (zt c1 )2 ) (4.2)

y G() esta dada por la ecuacin U(), definida como:

U = 1 exp(2 (zt c2 )2 ) (4.3)

donde 1 , 2 , c1 y c2 son los parmetros del antecedente del modelo.

4.4 ESTIMACIN DEL MODELO

Los parmetros del modelo ANFIS-ARCH se pueden especificar como un vector de la forma:
n (1) (1) (2) (2) (1) (1) (2) (2)
o
= c1 , c2 , 1 , 2 , 0 , ..., P , 0 , ..., P , 1 , ..., M , 1 , ..., M , 0 , ..., Q

ptimos es necesario maximizar la funcin de verosimilitud presentada en


Para encontrar los
la ecuacin (3.7)
n 2
X
n n 1 a
log L = ln(2) ln h2t
2 2 2 h2
t i=1

La estimacin de parmetros de el modelo ANFIS-ARCH propuesto es un problema difcil de


abordar debido a la presencia de mltiples puntos de mnima local, a causa de la no linealidad;
adems, la componente ARCH de dicho modelo incorpora una dificultad adicional, ya que la
funcin de costo se hace muy sensible a pequeas variaciones en los parmetros del modelo
ARCH. Estas razones le imprimen una gran importancia a la eleccin del mtodo de estimacin
para este tipo de modelos.
Pensando en ello, se eligi una tcnica de gradiente descendente adaptable que, al tener
tamaos de paso individuales para cada componente del vector de parmetros, proporciona un
mtodo robusto y preciso. Sin embargo, las tcnicas de gradiente no aseguran la solucin del
problema de mnimos locales en todos los casos. Igel y Hsken (2000) proponen una variacin
de estos algoritmos denominada iRprop+ , la cual es considerada uno de los mejores algoritmos
de su clase. En l, el tamao de paso solo depende del signo de la derivada y no de su magnitud.
Otra ventaja de este tipo de algoritmos es que converge rpidamente a una solucin. Esta
caracterstica es deseable en el caso de los modelos ANFIS-ARCH debido al gran nmero de
parmetros que puede llegar a tener un modelo de este tipo.
Asumiendo que se tiene especificada una forma funcional del modelo ANFIS-ARCH, de
acuerdo a (4.1), la estimacin del modelo pretende maximizar la funcin de verosimilitud
31

expresada en (3.7). Este algoritmo propone para cada parmetro i , y dada una medida de
error arbitraria log L, que la direccin de actualizacin de los pesos est basada en el signo de la
derivada parcial log L/i , con un tamao de paso i que se adapta para cada parmetro.
Cada iteracin del algoritmo se divide en dos pasos, en el primero se calcula el tamao de
paso para cada parmetro de acuerdo a la regla


log L log L

(t) > 0

+ (t1) , Si (t1)

i i

i
(t)
i :=
log L log L (4.4)

(t1) (t1) (t) < 0

i , Si

i i


(t1) , de lo contrario
i

donde 0 < < 1 < + . El segundo paso consiste en determinar la actualizacin del parmetro
i as:

log L log L log L
(t) (t)
(t)
Si (t1) (t) 0, i := signo
i i i i
(4.5)
log L log L (t) (t0 1)
E
Si (t1) (t) < 0 y log Lt > log Lt1 i : = i (t) := 0
i i i

Por ltimo, los nuevos parmetros se calculan como

(t+1) (t) (t)


i := i + i (4.6)

4.5 ESTRATEGIA PARA LA ESPECIFICACIN DEL MODELO ANFIS-ARCH

La estrategia de especificacin corresponde a los siguientes pasos:

1. Seleccin de regresores

2. Pruebas de no linealidad

3. Estimacin de un modelo homocedstico

4. Pruebas de diagnstico

5. Prueba de heterocedasticidad y orden del modelo ARCH

6. Eliminacin de regresores irrelevantes


32

4.5.1 Paso 1. Seleccin de regresores

La estrategia para especificacin de modelos planteada a continuacin considera modelos


univariados, que son los ms usados; sin embargo el uso de variables exgenas regresoras
puede ser definido de acuerdo al criterio experto del modelador.
El primer paso para la seleccin de los regresores del modelo, consiste en la seleccin de un
modelo AR(p) que aproxime la serie temporal. La ecuacin del modelo AR(p) est dada por:

X
P
yt = 0 + i yti + t (4.7)
i=1

Para seleccionar el orden P del modelo AR se pueden usar diferentes criterios reportados en la
literatura. La estrategia propuesta considera los siguientes criterios, para un tamao de muestra
T:

1. Criterio de Akaike (1973) (CIA): es un estimador de la varianza del error de pronstico


fuera de la muestra, que penaliza los grados de libertad que estn dados por el nmero de
parmetros estimados del modelo, k. Su frmula es:

P
T
2t
t=1
CIA = exp(2k/T) (4.8)
T

2. Criterio de Schwartz (CIS): Es una alternativa del criterio de Akaike y tiene su misma
interpretacin, pero penaliza an ms los grados de libertad. Su frmula esta dada por:

P
T
2t
CIS = T( )
k i=1
T (4.9)
T

3. Criterio de Hannan y Quinn (1979): Es un criterio similar a los dos anteriores cuya frmula
es:
P
T
2t
2k i=1
CIHQ = ln(T) (4.10)
T T

El procedimiento consiste en estimar modelos AR(p) para p en el intervalo [1, n] donde n


es elegido por el modelador, y determinar cual o cuales modelos minimizan cada uno de los
criterios considerados, lo cual permitir determinar el modelo AR(p) ptimo para la serie.
33

4.5.2 Paso 2: Pruebas de no linealidad

Una vez determinado el orden ptimo del modelo, se procede a comprobar la no linealidad de la
serie. En la literatura se encuentran reportadas diferentes pruebas de no linealidad, sustentadas
en el hecho de que la no linealidad en una serie temporal puede ocurrir en muchas formas
(Tsay, 2002).
Este trabajo se concentra en el uso de la prueba STR que permite, adems de establecer la no
linealidad de la serie, definir la funcin y la variable de transicin para el modelo ANFIS-ARCH.
Para facilitar la notacin de la prueba STR, propuesta por Terasvirta, Tjostheim y Granger
(1994), la ecuacin (4.7) se reescribe como


yt = 1 0xt 1 G(st ; , c) + 2 0xt G(st ; , c) + t (4.11)

La hiptesis nula de linealidad puede ser expresada como H0 : 1 = 2 , contra la hiptesis


alternativa H1 : 1, j , 2, j para al menos un j {0, ..., p}.
Sin embargo, es posible la existencia de otras forma de linealidad causadas por los parmetros
sin identificar del modelo. Para solucionar ese problema, Luukkonen, Saikkonen y Terasvirta
(1988) proponen reemplazar la funcin G(st ; , c) por una aproximacin de Taylor, y probar la
linealidad por medio de Multiplicadores de Lagrange [LM].
Para los modelos LSTAR se establecen los estadsticos LM1 y LM3 para hiptesis nulas con
aproximaciones de Taylor de orden uno y tres respectivamente. Mientras para los modelos
ESTAR se establecen los estadsticos LM2 y LM4 para hiptesis nulas con aproximaciones de
Taylor de orden dos y cuatro respectivamente.
Para seleccionar la variable de transicin, Terasvirta et al. (1994) proponen usar el estadstico
LM3 . Para cada variable candidata se calcula el estadstico y se selecciona aquella cuyo valor
crtico sea menor. A su vez, estos estadsticos permiten tambin determinar la funcin de
transicin, cuando se rechaza la hiptesis nula de linealidad. Si el valor crtico del LM2 es menor
que el valor crtico del LM3 y que el valor crtico del LM4 , entonces la funcin de transicin es
exponencial; de lo contrario, la funcin de transicin es logstica (van Dijk, Franses y Lucas, 1999).

4.5.3 Paso 3: Estimacin de un modelo homocedstico

Se considera un modelo ANFIS con un conjunto de reglas que considera los regresores del
AR(p) del numeral 1 como parmetros del consecuente, y asumiendo que los errores son
homocedsticos se estima el modelo. Este es el mismo proceso considerado por Velsquez
et al. (2004).
34

4.5.4 Paso 4: Pruebas de diagnstico

A continuacin, se verifica si el modelo homocedstico del paso anterior captura la dinmica de


la serie, o por el contrario, se requiere otro tipo de modelos para representar el comportamiento
de dicha serie.
Se realizan pruebas de diagnstico para demostrar si los residuales t para t = 1, ..., T, son
normales, incorrelacionados y homocedsticos.
El primer diagnstico de los residuales se hace observando las grficas de sus propiedades
estadsticas, de esta forma la funcin de autocorrelacin (FAC) y la funcin de autocorrelacin
parcial (FACP) permiten visualizar si los residuales estn autocorrelacionados. El espectro
de potencias muestra si existe una concentracin de energa que indique presencia de ciclos;
y finalmente, el histograma de frecuencias permite determinar si los residuales tienen una
distribucin aproximadamente normal.
Luego, para probar si los residuales estn incorrelacionados se realizan las pruebas:

1. Box y Pierce (1970) proponen una prueba denominada tambin prueba Pormanteau, cuyo
estadstico est dado por
X
n
Q(m) = T 2l (4.12)
l=1

donde l corresponde a la autocorrelacin del residual et en el rezago l, dada por


PT
tl
t=l+1 (t )(
)
l = PT (4.13)
2
t=l+1 (t )

con l en el intervalo [0, T 1]. Donde y corresponde a la serie y T es el tamao de la muestra.


La prueba de Box Pierce parte de la hiptesis nula de incorrelacion, es decir H0 : 1 =
2 = ... = n = 0, contra la hiptesis alterna de autocorrelacin, Ha : i , 0 para algn
i [1, ..., n]. El estadstico Q se aproxima a una chi-cuadrada con n grados de libertad.

2. Ljung y Box (1978) proponen una modificacin al estadstico Q para incrementar su poder
en muestras finitas, estableciendo un nuevo estadstico dado por:

X
n 2l

Q (n) = T(T + 2) (4.14)
Tl
l=1

Para probar que los residuales no son lineales se realiza la prueba de McLeod y Li (1983),
35

quien propone un estadstico anlogo al Q de Ljung-Box en el que el estadstico no se calcula


con la autocorrelacin de los residuales, sino con su cuadrado.
Finalmente, para probar si los residuales son normales se usan las siguientes pruebas:

1. La prueba de normalidad propuesta por Bera y Jarque (1980) est basada en los conceptos
de curtosis, K, y asimetra ,S, definidos como

1 P
T i=1 T( 3
)
S= P (4.15)
( T1 i=1 T( 2 )3 /2
)

1 P
T 4
i=1 T( )
K= P (4.16)
( T1 i=1 T( ) 2 )2
El estadstico J-B esta dado por

1 (K 3)2
J-B = (S2 + ) (4.17)
6 4

y se aproxima como una chi-cuadrada asinttica con 2 grados de libertad.

2. Lin y Mudholkar (1980) formularon una prueba de normalidad contra la alternativa de


asimetra, en el cual se calculan
2 1/3

X T XT


1 1


yi = 2j j (4.18)


T T 1

j,i j,i

con i = 1, ..., T, y
T 1/2
X
T X X
T
R= (i )(
y i y)/ 2
(i ) 2
( y i y) (4.19)
i=1 i=1 i=1

as, el estadstico L-M est dado por

1
L-M = (T/3)1/2 ln [(1 + R)/(1 R)] (4.20)
2

bajo la hiptesis nula de una distribucin gausiana para , contra la hiptesis alterna de
una distribucin gausiana asinttica con media cero y varianza uno.
36

4.5.5 Paso 5: Presencia de heterocedasticidad y orden de la componente ARCH

Con la prueba de homocedasticidad de la serie o prueba de Engle, descrita en en la seccin 3.1.2 se


determina el orden de la componente ARCH en caso de que los residuales sean heterocedsticos.

4.5.6 Paso 6: Eliminacin de regresores irrelevantes

El proceso de eliminacin de regresores irrelevantes est basado en la prueba del radio de


verosimilitud (Vuong, 1989), es sistemtico y puede ser descrito de la siguiente forma, primero
para las variables de los consecuentes y luego para las componentes ARCH:
Sea log L la funcin especificada en (3.5), si se tienen dos modelos y tales que el segundo
es un modelo restringido del primero, el radio de verosimilitud LR se define como

LR = 2(log L log L ) (4.21)

1. Para cada variable del modelo, tanto de los consecuentes como del modelo ARCH, se
estiman modelos restringidos donde dicha variable es eliminada y se calcula LR para cada
uno.

2. Se selecciona la entrada correspondiente al modelo con el menor valor crtico (LR).

3. Si el valor crtico es mayor del 5% se elimina la entrada y se vuelve a 1, considerando el


modelo restringido que eliminaba la entrada seleccionada como el nuevo modelo. De lo
contrario se termina el proceso.

4.6 PROPIEDADES DEL MODELO EN MUESTRAS PEQUEAS

Antes de realizar aplicaciones del modelo ANFIS-ARCH, es necesario evaluar sus propiedades
para muestras pequeas, considerando si el modelo efectivamente se puede recuperar a partir
de los datos. El procedimiento realizado es similar a los trabajos de van Dijk et al. (1999).

4.6.1 Simulacin Monte Carlo para determinar la convergencia de los modelos

La simulacin de Monte Carlo consiste en repetir un proceso, con una muestra de soluciones
cada una correspondiente a un conjunto diferente de muestras aleatorias, para luego obtener
resultado que permitan hacer anlisis estadsticos. En este caso la simulacin de Monte Carlo
ser usada para validar los mtodos de solucin propuestos para la estimacin de parmetros,
la seleccin de entradas del modelo y la especificacin de la funcin y variable de transicin.
37

El objetivo de la simulacin es estudiar las propiedades de la estimacin basada en mxima


verosimilitud, para modelos ANFIS-ARCH, cuando la muestra de datos es pequea, teniendo
tres objetivos especficos:

1. Determinar si los parmetros de un modelo pueden ser recuperados a partir de una


muestra, para establecer si es posible obtener un modelo nico.

2. Determinar si el mtodo de inferencia puede seleccionar adecuadamente variables


relevantes siguiendo el mtodo de eliminacin de variables propuesto en en numeral
4.5.6.

3. Determinar si las pruebas de seleccin del tipo de modelo, desarrolladas en la prueba


STR descrita en el numeral 4.5.2, pueden seleccionar la variable y funcin de transicin
correctas en el caso de modelos ANFIS-ARCH.

4.6.2 Metodologa y resultados

1. Para el Objetivo 1 se ha planteado la siguiente metodologa:

(a) Para un modelo ANFIS-ARCH predefinido de antemano se generan N series sintticas


de tamao T.

(b) Para cada serie sinttica se estima un modelo ANFIS-ARCH y se almacenan los
parmetros obtenidos.

(c) Al final del proceso de simulacin se obtiene una muestra de tamao N para cada
uno de los parmetros del modelo, y se determinan las propiedades para la muestra
correspondiente a cada parmetro.

La Tabla 4.1 presenta los resultados de la simulacin para un modelo ANFIS-ARCH sin
variables exgenas en las entradas de los consecuentes, que se puede escribir de la forma:

Z(yt1 ) n (1) (1) (1)


o
yt = 0 + 1 yt1 + 2 yt2 +
Z(yt1 ) + S(yt1 )
S(yt1 ) n (2) (2) (2)
o
0 + 1 yt1 + 2 yt2 + at (4.22)
Z(yt1 ) + S(yt1 )

donde at = ht t con h2t = 0 + 1 a2t1 .


38

La Tabla 4.2 muestra los resultados obtenidos en la simulacin para un modelo


ANFIS-ARCH con una variable exgena, x, como entrada en los consecuentes de las
reglas, que puede representarse as:

Z(yt1 ) n (1) (1) (1)


o
yt = 0 + 1 yt1 + 1 xt +
Z(yt1 ) + S(yt1 )
S(yt1 ) n (2) (2) (2)
o
0 + 1 yt1 + 1 xt + at (4.23)
Z(yt1 ) + S(yt1 )

donde at = ht t con h2t = 0 + 1 a2t1 .

En ambos casos, para 1000 series sintticas de tamaos T = 100, 200 y 500, se reportan la
media, mediana y desviacin estndar de cada uno de los parmetros del modelo. Se puede
observar que la media y la desviacin estndar no son instrumentos concluyentes porque
se ven fcilmente afectados por resultados extremos; sin embargo, la mediana permite
analizar el comportamiento del modelo. Adems, a medida que aumenta el tamao de
la muestra, los parmetros ajustados son ms cercanos a los parmetros reales. A pesar
de esto, los parmetros de los antecedentes, es decir, c y , presentan dificultades para
ser recuperados; pero al conservar su signo, estos parmetros permiten aproximar los
conjuntos difusos de una manera similar a la de los reales.

Tambin, puede observarse que los parmetros relacionados con el modelo ARCH son los
que ms fcil captura el modelo, incluso para un tamao de muestra pequeo.

Finalmente, se puede anotar que el modelo con variables exgenas present desviaciones
estndar menores, razn por la cual la media estuvo ms cerca de la mediana en ese
modelo.

2. Para el Objetivo 2 la metodologa planteada puede ser descrita como:

(a) Para un modelo ANFIS-ARCH predefinido de antemano se genera una serie sinttica
de tamao T.
(b) Se construyen un modelo completo, () y un modelo restringido, ( ) con una variable
explicativa menos que el modelo completo.
(c) Se realiza el proceso de seleccin de variables basada en la prueba del radio de
verosimilitud presentada.
(d) Se determina si en el proceso de inferencia se descartaron variables explicativas.
39

Tabla 4.1: Simulacin de la convergencia del modelo sin variables exgenas

Parmetro Real Media Mediana Std


T = 100
(1)
1
0.8 -1.3E+09 0.23 1.1E+11
(2)
1
-0.5 1.5E+09 -0.29 4.9E+10
(1)
2
-0.9 -8.3E+09 -0.44 1.7E+11
(2)
2
0.7 6.7E+09 0.32 1.2E+11
(1)
0
0.1 -3.8E+09 0.09 2.0E+11
(2)
0
0.2 8.6E+09 0.15 2.0E+11
1 0.5 0.48 0.36 0.53
a0 0.1 0.09 0.08 0.04
(1) 0.9 9.5E+01 3.77 2.6E+02
(2) 1.1 1.5E+02 2.80 3.8E+02
c(1) -0.2 -0.73 -0.79 0.98
c(2) 0.1 0.69 0.88 0.67
T = 200
(1)
1
0.8 -2.0E+09 0.36 4.4E+10
(2)
1
-0.5 -1.4E+09 -0.39 3.2E+10
(1)
2
-0.9 -1.6E+08 -0.55 4.9E+09
(2)
2
0.7 8.1E+07 0.38 2.5E+09
(1)
0
0.1 -4.2E+09 0.02 9.7E+10
(2)
0
0.2 1.9E+08 0.20 5.9E+09
1 0.5 0.48 0.49 0.21
0 0.1 0.10 0.10 0.02
(1) 0.9 6.5E+01 1.57 2.6E+02
(2) 1.1 9.6E+01 1.21 3.2E+02
c(1) -0.2 -1.43 -1.38 1.41
c(2) 0.1 1.00 1.17 0.78
T = 500
(1)
1
0.8 -4.5E+08 0.65 1.4E+10
(2)
1
-0.5 3.2E+08 -0.52 1.0E+10
(1)
2
-0.9 1.90 -0.76 8.8E+01
(2)
2
0.7 1.59 0.56 2.7E+01
(1)
0
0.1 -8.0E+08 -0.06 2.5E+10
(2)
0
0.2 -3.60 0.27 1.4E+02
1 0.5 0.49 0.49 0.10
0 0.1 0.10 0.10 0.01
(1) 0.9 1.5E+01 0.77 1.4E+02
(2) 1.1 2.9E+01 0.85 1.9E+02
c(1) -0.2 -2.26 -2.11 1.48
c(2) 0.1 1.44 1.48 0.70
40

Tabla 4.2: Simulacin de la convergencia del modelo con variables exgenas

Parmetro Real Media Mediana Std


T =100
(1)
1
0.8 -3.3E+03 0.44 1.0E+05
(1)
2
-0.9 4.6E+01 -0.56 1.1E+03
(1)
0
0.1 -1.2E+04 0.09 3.9E+05
(2)
0
0.2 -9.0E+01 0.18 2.3E+03
1 0.5 4.9E-01 0.49 2.6E-01
0 0.1 9.2E-02 0.09 2.6E-02
(1) 0.9 39.82 1.35 195.69
(2) 1.1 83.89 1.39 303.99
c(1) -0.2 -1.3 -1.27 1.1
c(2) 0.1 1.0 1.17 6.8E-01
(1)
1
-0.5 2669.83 -0.27 84466.99
(2)
1
0.7 20.11 0.45 511.88
T = 200
(1)
1
0.8 7.7E-02 0.48 5.5
(1)
2
-0.9 3.1E-01 -0.69 5.7E+01
(1)
0
0.1 -1.6 0.03 1.8E+01
(2)
0
0.2 -2.4 0.24 1.2E+02
1 0.5 4.9E-01 0.48 1.6E-01
0 0.1 9.7E-02 0.10 1.7E-02
(1) 0.9 24.17 1.04 148.53
(2) 1.1 31.39 1.07 193.21
c(1) -0.2 -1.8 -1.66 1.2
c(2) 0.1 1.2 1.33 7.2E-01
(1)
1
-0.5 -0.68 -0.39 1.35
(2)
1
0.7 1.54 0.48 21.50
T = 500
(1)
1
0.8 4.6E-01 0.71 5.2
(1)
2
-0.9 -8.5E-01 -0.86 9.4E-01
(1)
0
0.1 -9.8E-01 0.03 1.4E+01
(2)
0
0.2 2.2E-02 0.25 3.1
1 0.5 5.0E-01 0.50 8.8E-02
0 0.1 9.8E-02 0.10 1.0E-02
(1) 0.9 2.82 0.65 58.53
(2) 1.1 3.48 0.87 60.26
c(1) -0.2 -2.6 -2.34 1.3
c(2) 0.1 1.6 1.60 5.7E-01
(1)
1
-0.5 -0.46 -0.49 4.28
(2)
1
0.7 0.77 0.60 0.96
41

La Tabla 4.3 presenta los resultados para la simulacin que permite verificar si el modelo
efectivamente selecciona las variables relevantes de los consecuentes para aproximar la
serie. Se realizaron 4 pruebas con diferentes modelos, para 1000 series sintticas de tamaos
de muestra T = 100, 200 y 500.

En la prueba A. el modelo real est dado por:

Z(yt1 ) n (1) (1)


o S(yt1 ) n (2) (2)
o
yt = 0 + 1 yt1 + 0 + 1 yt1 + at (4.24)
Z(yt1 ) + S(yt1 ) Z(yt1 ) + S(yt1 )

donde at = ht t con h2t = 0 + 1 a2t1 . El modelo completo, , considerado fue:

Z(yt1 ) n (1) (1) (1)


o
yt = 0 + 1 yt1 + 2 yt2 +
Z(yt1 ) + S(yt1 )
S(yt1 ) n (2) (2) (2)
o
0 + 1 yt1 + 2 yt2 + at (4.25)
Z(yt1 ) + S(yt1 )
(4.26)

donde at = ht t con h2t = 0 + 1 a2t1 . Contra el modelo real como modelo restringido,
. Todo esto con el objeto de determinar si el modelo descartaba o no la variable
irrelevante. Los resultados obtenidos muestran como para los tres tamaos de
muestra se descart la variable irrelevante en al menos el 82% de las veces.

En la prueba B. el modelo real est dado por:

Z(yt1 ) n (1) (1) (1)


o
yt = 0 + 1 yt1 + 2 yt2 +
Z(yt1 ) + S(yt1 )
S(yt1 ) n (2) (2) (2)
o
0 + 1 yt1 + 2 yt2 + a2t (4.27)
Z(yt1 ) + S(yt1 )

donde at = ht t con h2t = 0 + 1 a2t1 . Considerado tambin como modelo completo,


, contra un modelo restringido, , de la forma:

Z(yt1 ) n (1) (1)


o S(yt1 ) n (2) (2)
o
yt = 0 + 1 yt1 + 0 + 1 yt1 + at (4.28)
Z(yt1 ) + S(yt1 ) Z(yt1 ) + S(yt1 )

donde at = ht t con h2t = 0 +1 a2t1 . Teniendo como objetivo determinar si se aceptaba


42

o no el modelo restringido que descartaba una variable relevante para el modelo. Se


encontr que para muestras muy pequeas de 100 y 200 datos, no se obtuvo el
resultado esperado. Es decir, aparentemente se necesitan al menos 500 datos para que
el modelo sea capaz de rechazar el modelo restringido.
En la prueba C la serie fue generada con un modelo real de la forma:

Z(yt1 ) n (1) (1)


o S(yt1 ) n (2) (2)
o
yt = 0 + 1 yt1 + 0 + 1 yt1 + at (4.29)
Z(yt1 ) + S(yt1 ) Z(yt1 ) + S(yt1 )

donde at = ht t con h2t = 0 + 1 a2t1 . Considerado tambin como modelo restringido,


. Y como modelo completo, , se us un modelo de la forma

Z(yt1 ) n (1) (1) (1)


o
yt = 0 + 1 yt1 + 1 xt +
Z(yt1 ) + S(yt1 )
S(yt1 ) n (2) (2) (2)
o
0 + 1 yt1 + 1 xt + at (4.30)
Z(yt1 ) + S(yt1 )

donde at = ht t con h2t = 0 + 1 a2t1 ; y xt corresponde a una variable aleatoria normal,


como variable exgena. Los resultados obtenidos mostraron que en al menos el 79%
de los casos se rechaz la variable irrelevante.
Por ltimo, en la prueba D. se consider un modelo real de la forma

Z(yt1 ) n (1) (1) (1)


o
yt = 0 + 1 yt1 + 1 xt +
Z(yt1 ) + S(yt1 )
S(yt1 ) n (2) (2) (2)
o
0 + 1 yt1 + 1 xt + at (4.31)
Z(yt1 ) + S(yt1 )

donde at = ht t con h2t = 0 + 1 a2t1 ; y xT corresponde a una variable aleatoria normal


exgena. Usado tambin como modelo completo , , contra un modelo restringido,
, de la forma

Z(yt1 ) n (1) (1)


o S(yt1 ) n (2) (2)
o
yt = 0 + 1 yt1 + 0 + 1 yt1 + at (4.32)
Z(yt1 ) + S(yt1 ) Z(yt1 ) + S(yt1 )

donde at = ht t con h2t = 0 + 1 a2t1 . Con el propsito de determinar si el modelo


restringido era o no aceptado. Se observ, a diferencia de la prueba B, que an para
43

una muestra muy pequea de 100 datos, el modelo fue capaz de rechazar el modelo
restringido.

Tabla 4.3: Simulacin de la seleccin de variables relevantes en el modelo


Modelo Resultados
Prueba Real M. M. T p<0.05
100 184
A yt1 yt1 y yt2 yt1 200 162
500 142
100 373
B yt1 y yt2 yt1 y yt2 yt1 200 466
500 750
100 212
C yt1 yt1 y xt yt1 200 161
500 141
100 727
D yt1 y xt yt1 y xt yt1 200 935
500 998

3. La metodologa para el Objetivo 3 consiste en:

(a) Para un modelo ANFIS-ARCH predefinido de antemano se generan N series sintticas


de tamao T.
(b) Para cada serie sinttica se realizan las pruebas de no-linealidad y seleccin de modelo
para modelos STR

(c) Al final del proceso de simulacin se obtiene una muestra de tamao N que indica,
si la serie es no-lineal, el tipo de funcin de transicin (logstica o exponencial) y la
variable de transicin para el modelo.

(d) Se analizan los resultados de las pruebas

Para la simulacin que permita determinar si la eleccin de la variable y la funcin de


transicin se hace de forma adecuada o no, se establecieron dos modelos de la forma:

F(yt1 ) n (1) (1) (1)


o
yt = 0 + 1 yt1 + 2 yt2 +
F(yt1 ) + G(yt1 )
G(yt1 ) n (2) (2) (2)
o
0 + 1 yt1 + 2 yt2 + at (4.33)
F(yt1 ) + G(yt1 )
44

donde at = ht t con h2t = 0 + 1 a2t1 . El primer modelo considera una funcin de transicin
logstica equivalente, por lo tanto F() corresponde a la funcin S() de la ecuacin (2.6) y
G() a la funcin Z() de la ecuacin (2.7). Mientras que el segundo modelo considera una
funcin de transicin exponencial equivalente, el la cual F() corresponde a la funcin E()
de la ecuacin (4.2) y G() a la funcin U() de la ecuacin (4.3).
Para tamaos de muestra, T = 100, 200 y 500 datos y un total de 1000 series sintticas, se
obtuvieron los resultados reportados en la Tabla 4.4, en los cuales se puede observar que:
Para el caso de la funcin de transicin logstica equivalente, an en muestras pequeas, la
prueba fue capaz de encontrar la variable de transicin real al menos en el 91% de los casos,
e indic correctamente que el modelo tena una funcin de transicin logstica al menos
el 92% de las veces. Por su parte para el caso de la funcin de transicin exponencial, los
resultados son igualmente buenos para el caso de la variable de transicin, sin embargo, la
funcin de transicin no fue indicada correctamente. Una inspeccin visual de la grfica
de la funcin de transicin como funcin de la variable de transicin, indic que las series
en las cuales la prueba no detectaba correctamente la funcin de transicin correspondan
a grficas donde no se observaba claramente cual era la funcin de transicin que seguan.

Tabla 4.4: Simulacin para determinar la funcin y la variable de transicin del modelo

Modelo Real T % Aciertos Funcin Trans. % Aciertos Variable Trans.


100 38.3 99.2
Funcin Transicin E 200 35.2 99.8
500 22.7 100
100 92.2 91.6
Funcin Transicin L 200 92.2 93.9
500 98.2 97.7

4.7 CONCLUSIONES

Los objetivos de este captulo comprendan la formulacin de un modelo capaz de capturar


la dinmica de series no lineales en la media y con estructura en la varianza; establecer para
l una estrategia de especificacin sistemtica y robusta; y finalmente, proponer un algoritmo
de estimacin de parmetros que permitiera llegar a una solucin ptima rpidamente. Para
solucionarlos, se plante un modelo denominado ANFIS-ARCH, partiendo del modelo ANFIS
propuesto por Velsquez et al. (2004) y el modelo ARCH de Engle (1982); y se formularon adems,
la estimacin de estos modelos basada en el algoritmo iRprop+ y la especificacin basada en la
45

prueba STR de no linealidad y el clculo del radio de verosimilitud.


De igual forma, para verificar que el modelo fuese capaz de recuperarse a s mismo, y
que los procesos formulados para la especificacin de los modelos funcionaban correctamente;
se realizaron simulaciones para determinar las propiedades de dichos modelos en muestras
pequeas. Respecto a estas simulaciones se pudo concluir que:

La simulacin para la convergencia del modelo dej ver dificultades en la optimizacin


de los parmetros relacionados con los conjuntos difusos; sin embargo, los parmetros
obtenidos por la simulacin permiten reproducir conjuntos que arrojan resultados similares
a los reales. Adems, esta simulacin mostr facilidades, en el mtodo de estimacin, para
los parmetros ARCH del modelo y para los modelos con variables exgenas.

La simulacin de la seleccin de entradas del modelo mostr como es ms fcil para


el modelo rechazar modelos restringidos con regresores irrelevantes, que no rechazar
modelos restringidos con variables relevantes, en casos donde la variable considerada
era rezago de la serie. Para los modelos donde la variable considerada fue una variable
exgena, se encontr que el proceso de seleccin de entradas fue exitoso an en muestras
muy pequeas.

Finalmente, la simulacin para la eleccin de la variable de transicin mostr que la prueba


hace una eleccin correcta en un alto porcentaje de los casos. Incluso, hace una eleccin
correcta de la funcin de transicin, aun cuando los resultados de la funcin de transicin
exponencial no fueron aceptables. Esto ltimo se puede descartar, debido a que las series
simuladas con una funcin de transicin exponencial en muchos casos no tenan una
distribucin de los conjuntos claramente exponencial.

Aunque se han cumplido parcialmente los objetivos planteados en esta tesis, es necesario
confrontar el modelo propuesto contra otros modelos alternativos en casos reales de aplicacin.
Esto ser hecho en el prximo captulo.
46
5. CASOS DE APLICACIN

En el captulo anterior se plante un modelo para el anlisis de series temporales no lineales con
heterocedasticidad condicional autorregresiva y se propuso una estrategia para la especificacin
de estos modelos basada en la prueba STR de no linealidad y la prueba del radio de verosimilitud.
Para establecer la validez del modelo es necesario realizar casos de aplicacin con series reales
que permitan determinar sus bondades o limitantes. En este captulo se evaluarn dos casos de
aplicacin en los cuales se representarn series temporales comnmente usadas en la literatura.
En la seccin 5.1. se modela la serie del ndice de Oscilacin del Sur (SOI), una serie
macroclimtica usada para medir la fuerza y la fase de la Oscilacin del Sur la cual permite
determinar la presencia de los eventos extremos de El Nio y La Nia (Hall, Skalin y Tersvirta,
1998). Por un lado, la no linealidad de las variables macroclimticas ha sido reconocida en
diferentes estudios explicada en la naturaleza catica del clima (Mesa, Poveda y Carvajal, 1997).
La heterocedasticidad por su parte, no ha sido un tema formalmente abordado, sin embargo en
la literatura se encuentran trabajos que lo han planteado como Hall et al. (1998).
A nivel mundial el estudio de las series financieras ha desencadenado un sin nmero de
propuestas para representar los movimientos del mercado financiero. ndices macroeconmicos,
tasas de cambio y precios de acciones, entre muchas otras series, se han abordado desde diversos
enfoques para tratar de representar su dinmica e incluso pronosticar su comportamiento
futuro. Se ha encontrado en dichos estudios que, en su mayora, las series financieras son
no lineales en la media, y adems que su volatilidad puede ser cambiante en el tiempo y puede
agruparse en clusters, este comportamiento sugiere la existencia de correlaciones seriales y de
heterocedasticidad. Diversos estudios se han enfocado en capturar una o ambas propiedades
entre ellos (Engle, 1982) (Taylor, 2004) (Chen y Mike, 2006) (Chang, 2006) (Chan et al., 2005).
Siguiendo ese mismo enfoque se presenta como caso de aplicacin en la seccin 5.2 la serie de
los cambios relativos en los precios de cierre de las acciones de IBM.
Finalmente, la seccin 5.3 presenta las conclusiones de los casos de aplicacin planteados
para este trabajo.

47
48

5.1 CARACTERIZACIN DEL SOI

5.1.1 Introduccin

El fenmeno climtico de El Nio - Oscilacin del Sur (ENSO) se presenta como el resultado de
la interaccin ocano-atmsfera en el Ocano Pacfico ecuatorial, afectando de forma importante
las condiciones climatolgicas de las regiones comprometidas durante sus fases clida y fra,
conocidas como periodos de El Nio y La Nia respectivamente (Philander, 1990). Diversos
estudios han determinado que El Nio es un evento recurrente y aperidico que se presenta con
una recurrencia aproximada de entre 2 y 7 aos, y que tiene una duracin aproximada de 12
meses (Glantz, 1996); su intensidad depende de la magnitud de las anomalas y del rea cubierta
por las mismas. Ambas fases del ENSO producen eventos extremos hidrometeorolgicos, que
tienen importantes impactos ambientales, sociales y econmicos que han sido documentados
en diversas investigaciones (Glantz, 1996). Dichos impactos han confirmado la necesidad de
entender y predecir este fenmeno con el fin de emprender tareas de planificacin para la
mitigacin de sus efectos (IDEAM, 2002).
Debido a la naturaleza catica del clima, la interaccin de fenmenos atmosfricos que actan
en distintos lugares y momentos, y su aperiodicidad, el pronstico del ENSO representa un
problema complejo (Wittenberg, 2002) que ha sido abordado por dos enfoques fundamentales.
Por un lado se encuentran los modelos fsicos que consideran los sistemas ocano-atmosfricos;
mientras que por el otro, se encuentran los modelos estadsticos Hall et al. (1998) en que se
pretende encontrar representaciones matemticas de la dinmica que siguen las variables que
pueden ser usadas para medir el fenmeno.
El SOI es un ndice para medir la fuerza y la fase de la Oscilacin del Sur, el cual permite
determinar la presencia de los eventos de El Nio y La Nia; los valores extremos negativos
corresponden al fenmeno de El Nio, mientras que los valores extremos positivos corresponden
a La Nia. Las caractersticas ya mencionadas del ENSO se ven reflejadas precisamente en
la dinmica que sigue el SOI, lo que ha llevado a abordar su modelado a partir de tcnicas
estadsticas no lineales. Particularmente, en Hall et al. (1998) se ha realizado el modelado de
esta serie usando un modelo LSTAR; los resultados del diagnstico del modelo obtenido por
Hall et al. (1998) muestran que los residuales no presentan correlaciones residuales remanentes,
pero su volatilidad es cambiante en el tiempo, por lo que el modelo podra ser rechazado, y
consecuentemente se requerira considerar otras especificaciones alternativas u otras clases de
modelos.
49

5.1.2 Descripcin de la serie

El Nio consiste en un calentamiento anmalo de las aguas superficiales del centro y este del
Pacfico tropical, lo que produce una profundizacin de la termoclima; est asociado a un
debilitamiento de los vientos alisios del este y al desplazamiento del centro de conveccin del
oeste al centro del Pacfico.
La Oscilacin del Sur es una onda estacionaria de masa atmosfrica que produce un
diferencial de presiones entre el oeste y el este del Pacfico ecuatorial. El centro de alta presin
se encuentra en la isla de Tahit, mientras que el de baja presin se halla en Darwin, Australia.
El SOI (ndice de Oscilacin del Sur), determina el gradiente de presiones, y se establece como la
diferencia entre las presiones de los centros de presin dividida por la desviacin estndar. De
esta manera, valores extremos positivos del SOI denotan el evento La Nia y valores extremos
negativos del SOI sugieren el evento El Nio.
La Figura 5.1(a) presenta la serie del SOI, en ella se visualizan periodos de El Nio y La Nia.
As, por ejemplo, los fenmenos El Nio de 1982- 1983 y 1997- 1998 se consideran muy fuertes
en intensidad, los de 1957-1958, 1965-1966, 1972-1973 y 1991-1992, fuertes y los de 1976-1978 y
1986-1987, moderados. No obstante, el efecto climtico y el impacto socioeconmico de estos
fenmenos dependen de otros factores como la vulnerabilidad de las regiones (IDEAM, 2002).
La informacin usada en este estudio corresponde a las mediciones mensuales del SOI, desde
Enero de 1876 hasta Marzo de 1997 para un total de 1455 observaciones, al igual que Hall et al.
(1998).

5.1.3 Caracterizacin de la serie e interpretacin de resultados

La Figura 5.2 resume las propiedades estadsticas del SOI. La funcin de autocorrelacin simple
y la funcin de autocorrelacin parcial o FACP son presentadas en las Figuras 5.2.a y 5.2.b
respectivamente, e indican que la serie se podra aproximar con un modelo AR(P)de orden
3. Sin embargo, hay presencia de rezagos importantes alrededor de P = 14. En el espectro
de potencias (Figura 5.2.c) se muestra una concentracin de energa de frecuencias muy bajas,
debidas posiblemente a que el periodo de ocurrencia de El Nio es amplio y de largo plazo. El
histograma (Figura 5.2.d), adems, muestra que los datos de la serie siguen una distribucin
aproximadamente normal.
A continuacin se presentarn los pasos de la metodologa propuesta para el modelo
desarrollado.
Paso 1: En la Tabla 5.1 se reportan los valores de los diferentes criterios de informacin
50

50

50
1/1876 1/1896 1/1916 1/1936 1/1956 1/1976 1/1996
(a) SOI
50

50
1/1876 1/1896 1/1916 1/1936 1/1956 1/1976 1/1996
(b) Innovaciones
150

100

50
1/1876 1/1896 1/1916 1/1936 1/1956 1/1976 1/1996
(c) Varianzas

Figura 5.1: (a) SOI, (b) Innovaciones del modelo ANFIS-ARCH; y (c) Varianzas del modelo
ANFIS-ARCH
51

(a)
1

1
0 10 20 30 40 50 60 70
(b)
1

1
0 10 20 30 40 50 60 70
(c) (d)
2 0.1

1 0.05

0 0
0 0.1 0.2 0.3 0.4 50 0 50

Figura 5.2: Propiedades estadsticas de la serie del SOI (a) FAC; (b) FACP; (c) Espectro; (d)
Histograma
52

estimados para modelos autoregresivos de orden P = 1, , 18. Con negrilla son resaltados aquellos
valores mnimos para cada criterio, de acuerdo a ello el orden ptimo P del modelo AR(p) para
las reglas de los consecuentes es 16, teniendo como criterio de eleccin el valor ms alto de P.

Paso 2: Las diferentes pruebas de no linealidad se presentan en la Tabla 5.2, y se detallan en


el ANEXO A de este trabajo. El nmero entre parntesis corresponde al valor crtico, aquellos
que indican no linealidad se encuentran en negrilla. A pesar que no sean muchos los valores
crticos que indican no linealidad, existe en la literatura evidencia suficiente de la no linealidad
de la serie para continuar con el proceso de especificacin.

Los resultados de las pruebas STR para especificar el tipo de modelo son reportados en
la Tabla 5.3. El valor reportado en la primera columna de cada LM es el estadstico de dicha
prueba, mientras que la cantidad entre parntesis corresponde a su valor crtico. Cuando se
rechaza la hiptesis nula de linealidad para el LM1, se calculan los estadsticos LM2, LM3 y
LM4. De acuerdo con los resultados obtenidos, se selecciona a yt3 como variable de decisin, y
a la funcin logstica para realizar la transicin.

Pasos 3, 4 y 5: La Tabla 5.4 presenta los resultados obtenidos al estimar un modelo ANFIS
homocedstico. El log L es el logaritmo de la funcin de verosimilitud de los residuales,
Box-Pierce y Ljung-Box son los estadsticos para determinar correlaciones residuales remanentes,
McLeod-Lee es un estadstico para determinar si existen relaciones no lineales remanentes en los
residuales y ARCH es la prueba de Engle para determinar si los residuales son heterocedsticos.
Las pruebas de normalidad realizadas rechazan la hiptesis nula de normalidad de los residuales,
lo cual es consistente con el resultado de la prueba ARCH, el cual indica que ellos son
heterocedsticos. Adems, existen autocorrelaciones remanentes en los residuales. Este anlisis
indica que el modelo ANFIS propuesto no captura completamente la dinmica de la serie, y se
debe proceder a incluir una componente heterocedstica a travs de un modelo ARCH de de
orden 1. La presencia de una estructura ARCH en los residuales indica una persistencia en el
cambio mes a mes de la serie, esto es, que una variacin mensual grande en el SOI tiende a ser
seguida por otra variacin grande y que variaciones pequeas tienden a ser seguidas por nuevas
variaciones pequeas.

Paso 6: Un proceso para la eliminacin de regresores irrelevantes se llev a cabo, obteniendo


como relevantes en el modelo los rezagos 1-5, 7, 11, 13 y 14 de la serie.
53

El modelo final elegido corresponde a un modelo ANFIS-ARCH de la forma:




X5

S(yt3 )
(1) (1) (1) (1) (1) (1)

yt =
0
+ p y tp + 6
y t7 + 7
y t11 + 8
y t13 + 9
y t14
+
S(yt3 ) + Z(yt3 )


p=1




(2) X (2)
5
Z(yt3 ) (2) (2) (2) (2)

+ y + y + y + y + y + at (5.1)
S(yt3 ) + Z(yt3 )
0 p tp 6 t7 7 t11 8 t13 9 t14



p=1

donde at = ht t con h2t = 0 + 1 a2t1 . Los parmetros para este modelo son presentados en la
Tabla 5.5.
La Figura 5.3 resume las principales propiedades estadsticas para los residuales
normalizados; la FAC y el espectro indican que los residuales parecen ser incorrelacionados;
adems el histograma indica que son aproximadamente normales. Las pruebas estadsticas
para este modelo se encuentran reportadas en la Tabla 5.6; aunque los residuales no siguen una
distribucin normal, los contrastes aplicados a ellos, indican que son homocedsticos, y que no
existen correlaciones remanentes.
Las Figuras 5.1(b) y 5.1(c) presentan las innovaciones y varianzas del modelo propuesto.
Aunque la serie presenta una componente importante en su volatilidad, es importante resaltar
la presencia de un nmero significativo de cambios extremos en el SOI de un mes a otro. Estos
se evidencian en la Figura 5.1(c) como varianzas puntuales extremadamente altas en relacin al
resto de la serie.
La Figura 5.4 muestra la funcin de transicin del modelo en el tiempo y como funcin
de la variable de transicin. En dicha figura se muestra como la funcin de transicin flucta
rpidamente de un rgimen al otro, ello claramente confirma que la dinmica de la serie es no
lineal.
La Figura 5.5 presenta el pronstico determinstico para la serie; yT+1 se calcul utilizando
los datos histricos. Para calcular yT+2 se utilizaron los datos reales hasta yT , y el pronstico
para yT+1 ; los restantes valores se calcularon de forma similar; en todos los casos se asume que
los residuales son cero. Se observa como la serie pronosticada converge a un punto de equilibrio
donde las entradas y la salida del modelo son iguales numricamente.
La Figura 5.6 muestra la convergencia a largo plazo del modelo; ella se obtiene al realizar
el pronstico determinstico utilizando diferentes puntos de arranque obtenidos de los datos
histricos. En general, los modelos no lineales pueden presentar procesos de convergencia a uno
o ms puntos estables; procesos cclicos, y procesos divergentes; es comn, que dependiendo
del punto de inicio, un mismo modelo presente distintos comportamientos. Para el modelo
54

obtenido, se presenta un proceso de convergencia a un nico punto de equilibrio, y la velocidad


con que el modelo converge a l es aproximadamente constante e independiente del tipo de
fenmeno extremo.
Otra forma de analizar que tan bien son reproducidas las propiedades estadsticas de los
datos, es generar una serie sinttica utilizando el modelo estimado y comparar las propiedades
estadsticas de los datos y de la serie sinttica. En la Tabla 5.7 se presentan las propiedades
estadsticas de la serie original y de una serie sinttica de 1000 datos de longitud, puede concluirse
que el modelo reproduce bastante bien las propiedades de la serie original.
Para comparar el modelo ANFIS-ARCH propuesto, la Tabla 5.8 presenta un conjunto de
estadsticos para diferentes modelos con el fin de establecer la bondades o limitantes del modelo
ANFIS-ARCH en la caracterizacin de esta serie. La comparacin con cada uno de los modelos
presentados es descrita a continuacin:

1. Los primeros estadsticos presentados en la tabla corresponden a los reportados por Hall
et al. (1998) para un modelo LSTAR que intenta capturar la dinmica de la serie del SOI. El
modelo LSTAR presenta un menor valor para el criterio de informacin de Akaike, adems
su R2 es mayor. Si se considera la relacin establecida por Velsquez et al. (2004) entre
ANFIS y los modelos STR, y adems que los modelos LSTAR son formulados a partir de los
modelos STR, entonces se podra pensar en que el criterio de Akaike, que es dependiente de
la estructura de los modelos, pueda ser usado para propsitos de comparar, y de acuerdo
a ellos el mejor modelo es el LSTAR. Adems el estadstico R2 , que es independiente
de la estructura de los modelos, tambin indica que es el LSTAR el modelo que mejor
representa la serie. Sin embargo, el modelo LSTAR reportado no cumple con el supuesto
de homocedasticidad en los residuales de acuerdo al valor crtico del estadstico LMARCH,
lo cual es suficiente evidencia para afirmar que el modelo ANFIS-ARCH captura mejora
la dinmica de la serie.

2. El siguiente modelo presentado en la tabla de comparaciones es el STR-ARCH. De igual


forma que en el modelo anterior, la relacin de Velsquez et al. (2004) indica que los
modelos poseen la misma estructura y por tanto todos los criterios pueden ser usados
para su comparacin. Tanto el criterio de informacin de Akaike como el R2 indica que el
modelo ANFIS-ARCH presenta un mejor ajuste; adems, el log L es concluyente para elegir
este modelo como el ms adecuado de los dos, considerando que en ambos se consigue
capturar la heterocedasticidad de la serie.

La Figura 5.7 presenta las funciones de transicin para los modelo ANFIS-ARCH y
55

STR-ARCH, en ellas se observa una transicin ms suave en el modelo ANFIS-ARCH.

Adicionalmente, se realiz la prueba del radio de verosimilitud para determinar cual


modelo era mejor para la representacin de la serie. Se consider el modelo ANFIS-ARCH
como el modelo completo, y el modelo STR-ARCH como el modelo restringido; el
estadstico de la prueba fue LR = 32.815 y su valor crtico p = 0, por lo tanto el modelo que
mejor representa la series es el ANFIS-ARCH.

3. Finalmente, se presentan los estadsticos para un modelo ARX-ARCH, el cual tambin se


considera con la misma estructura de los modelos ANFIS-ARCH. El criterio de informacin
de Akaike, el estadstico R2 y el log L muestran al modelo ANFIS-ARCH como el que mejor
ajusta la serie del SOI.

Para este modelo tambin se realiz la prueba del radio de verosimilitud, cuyo estadstico
fue LR = 58.448 y su valor crtico p = 0, lo cual es suficiente evidencia de que el modelo
ANFIS-ARCH es mejor que el modelo ARX-ARCH.

En resumen, a pesar de que los modelos LSTAR de Hall et al. (1998) presentan unos mejores
estadsticos de ajuste que el modelo ANFIS-ARCH, se deben descartar debido a la presencia
de heterocedasticidad en sus residuales. De esta forma los modelos ANFIS-ARCH son los que
mejor capturan la dinmica de la serie.

5.2 CARACTERIZACIN DE LA SERIE DE CAMBIOS RELATIVOS EN LOS PRECIOS


DE CIERRE DE LAS ACCIONES DE IBM

5.2.1 Introduccin

El estudio de la volatilidad en las series temporales ha estado ligado fundamentalmente al


anlisis del mercado financiero. La econometra ha modelado, entre otras, las tasas de cambio,
los precios en el mercado burstil, las tasas de inters, los ndices macroeconmicos. Estas
series al estar ligadas al comportamiento humano, se ven influenciadas por un sin nmero de
variables que resultan imposibles de considerar en su totalidad. Sin embargo, el anlisis de series
de tiempo pretende representar la dinmica de este tipo de fenmenos altamente complejos con
base en sus valores pasados.
Concretamente, los modelos que modelan series temporales con estructuras en la varianza
son aplicados en un gran porcentaje a series financieras; vase por ejemplo Engle (1982),
Bollerslev (1986), Nelson (1991), Chan y McAleer (2003).
56

(a)
5

5
1/1876 1/1896 1/1916 1/1936 1/1956 1/1976 1/1996

(b) (c) (d)


1 0.5 0.2

0.4
0.5 0.15
0.3
0 0.1
0.2
0.5 0.05
0.1
1 0 0
0 10 20 0 0.5 10 0 10

Figura 5.3: Propiedades estadsticas de los residuales del modelo ANFIS-ARCH - Serie SOI (a)
Residuales; (b) FAC; (c) Espectro; (d) Histograma
57

(a)
0.5

0.4

0.3

0.2

0.1

0
0 500 1000 1500

(b)
1

0.8

0.6

0.4

0.2

0
50 40 30 20 10 0 10 20 30 40
U

Figura 5.4: Funcin de transicin para el modelo ANFIS-ARCH - Serie SOI (a) En el tiempo, (b)
Como funcin de la variable de transicin.
58

40

20

20

40

1/1991 1/1992 1/1993 1/1994 1/1995 1/1996 1/1997 1/1998 1/1999

Figura 5.5: Pronstico determinstico para la serie del SOI

30

20

10

10

20

30
0 20 40 60 80 100

Figura 5.6: Convergencia de largo plazo para la serie del SOI


59

0.8

0.6

0.4

0.2 ANFISARCH
STRARCH
0
50 40 30 20 10 0 10 20 30 40

Figura 5.7: Funciones de transicin para los modelos ANFIS-ARCH y STR-ARCH - Serie SOI

Tabla 5.1: Valor de los criterios de informacin para el modelo AR(p) - Serie SOI.

p CAK CHQ CSC


1 7.019 7.023 7.03
2 6.979 6.984 6.993
3 6.971 6.978 6.989
4 6.966 6.974 6.988
5 6.965 6.975 6.991
6 6.966 6.977 6.995
7 6.965 6.978 6.998
8 6.965 6.979 7.002
9 6.967 6.982 7.007
10 6.959 6.976 7.003
11 6.96 6.978 7.008
12 6.961 6.98 7.011
13 6.959 6.979 7.013
14 6.951 6.972 7.009
15 6.951 6.974 7.012
16 6.95 6.974 7.015
17 6.951 6.977 7.02
18 6.952 6.979 7.025
60

Tabla 5.2: Pruebas de no linealidad para la serie del SOI

Rez Kennan RESET Tsay White


1 0.19 (0.660) 2.08 (0.125) 0.19 (0.660) 0.76 (0.682)
2 0.04 (0.849) 2.11 (0.122) 2.62 (0.050) 0.57 (0.754)
3 0.00 (0.958) 1.64 (0.194) 1.52 (0.169) 0.01 (0.994)
4 0.07 (0.795) 1.71 (0.181) 1.85 (0.047) 0.01 (0.994)
5 0.06 (0.800) 1.78 (0.170) 1.54 (0.084) 0.02 (0.989)
6 0.07 (0.794) 1.76 (0.173) 1.36 (0.125) 0.00 (0.998)
7 0.20 (0.659) 1.73 (0.178) 1.31 (0.128) 10.91 (0.427)
8 0.21 (0.643) 1.71 (0.182) 1.27 (0.129) 0.00 (1.000)
9 0.21 (0.647) 1.69 (0.185) 1.15 (0.232) 0.01 (0.997)
10 0.21 (0.650) 1.25 (0.286) 1.13 (0.245) 9.23 (0.992)
11 0.16 (0.687) 1.23 (0.292) 1.12 (0.240) 0.01 (0.995)
12 0.13 (0.715) 1.36 (0.256) 1.24 (0.080) 0.00 (0.999)

Tabla 5.3: Resultados de la prueba STR - Serie SOI

Variable LM1 LM2 LM3 LM4 Tipo


Rez 1 1.37 (0.05) 1.62 (0.058) 1.15 (0.3) 1.31 (0.181) L
Rez 2 1.42 (0.033) 1.52 (0.084) 1.21 (0.252) 1.5 (0.09) L
Rez 3 1.54 (0.011) 1.36 (0.156) 1.56 (0.071) 1.69 (0.043) L
Rez 4 0.93 (0.616)
Rez 5 1.38 (0.046) 1.62 (0.056) 1.2 (0.256) 1.28 (0.199) L
Rez 6 1.27 (0.107)
Rez 7 0.95 (0.571)
Rez 8 1.17 (0.2)
Rez 9 1.22 (0.149)
Rez 10 0.88 (0.711)
Rez 11 1.11 (0.288)
Rez 12 0.9 (0.669)
Rez 13 1.25 (0.116)
Rez 14 1.27 (0.103)
Rez 15 0.98 (0.51)
Rez 16 0.94 (0.592)
61

Tabla 5.4: Pruebas estadsticas para el modelo ANFIS homocedstico - Serie SOI

Tamao de la Muestra 1455


Sumatoria 0.172
Media 1.18E-04
Mediana 0.005333
Desviacin Estndar 1.006
Asimetra -0.08791
Curtosis 3 813
Exceso de curtosis 0.8936
Mnimo -4.846
Mximo 4.124
Test de Normalidad de Jarque-Bera 49.7 (0.000)
Test de Normalidad Lin-Mudholkar 1.148 (0.126)
log L -5.02E+03
Rez Box-Pierce Ljung-Box McLeod-Lee ARCH
1 0.02 (0.889) 0.02 (0.889) 6.80 (0.009) 6.84 (0.009)
2 0.10 (0.954) 0.10 (0.953) 7.40 (0.025) 3.89 (0.143)
3 0.10 (0.992) 0.10 (0.992) 13.19 (0.004) 4.74 (0.192)

5.2.2 Descripcin de la serie

Box y Jenkins (1970) presentan la serie de precios diarios de I.B.M. para plantear la especificacin
de sus modelos clsicos. Desde entonces, esta serie se ha usado en la literatura analizando, entre
otras, sus caractersticas de no linealidad y heterocedasticidad (Tong, 1990)(Tsay, 2002). Muchos
enfoques han sido usados para representar la dinmica de esta serie; sin embargo, el modelo
de Inteligencia Computacional ms citado en la literatura para modelar esta serie es redes
neuronales, el cual fue propuesto por White (1993) y sirvi como precedente para el uso de las
redes neuronales en el anlisis de otras series financieras.
La serie de precios de IBM utilizada en este trabajo, corresponde a la misma utilizada por
Tong (1990), quien demuestra su comportamiento no lineal; en el periodo comprendido entre el
18 de mayo de 1961 y el 30 de marzo de 1962, con un total de 118 observaciones.
La Figura 5.8(a), presenta la serie temporal. La media de la serie es 0.07 y su varianza es de
0.9239.

5.2.3 Caracterizacin de la serie e interpretacin de resultados

La Figura 5.9 resume las propiedades estadsticas de la serie. La funcin de autocorrelacin


simple y la funcin de autocorrelacin parcial o FACP son presentadas en las Figuras 5.2.a y 5.2.b
62

Tabla 5.5: Parmetros del modelo ANFIS-ARCH - Serie SOI

Parametro Valor STD Est. T


c(1) -24.24 0.01 -1832.922
(1) 513.01 67.1 7.645
c(2) 34.8 34.8 1
(2) 0.04 0.06 0.589
(1)
0 16.11 541.05 0.03
(1)
1 0.31 5.36 0.059
(1)
2 -0.53 6.41 -0.082
(1)
3 1.31 17.77 0.073
(1)
4 0.53 4.99 0.107
(1)
5 -1.19 6.78 -0.175
(1)
6 1.16 5.74 0.203
(1)
7 -1.23 8.75 -0.14
(1)
8 -0.8 4.73 -0.168
(1)
9 -0.14 3.27 -0.041
(2)
0 -0.09 7.66 -0.012
(2)
1 0.46 1.08 0.432
(2)
2 0.13 1.14 0.113
(2)
3 0.08 1.21 0.07
(2)
4 0.06 1.13 0.051
(2)
5 0.07 1.03 0.072
(2)
6 -0.01 1.02 -0.006
(2)
7 0 0.97 -0.003
(2)
8 0 1.08 0
(2)
9 -0.1 1.03 -0.095
0 53.09 120.19 0.442
1 0.09 1.54 0.055
63

Tabla 5.6: Pruebas estadsticas para el modelo ANFIS-ARCH - Serie SOI

Tamao de la Muestra 1455


Sumatoria -1.075
Media -7.39E-04
Mediana 0.006347
Desviacin Estndar 1.0000
Asimetra -0.2126
Curtosis 3.88800
Exceso de curtosis 0.8877
Mnimo -5.031
Mximo 3.567
Test de Normalidad de Jarque-Bera 58.13 (0.000)
Test de Normalidad Lin-Mudholkar 2.803 (0.003)
log L -5.01E+03
Rez Box-Pierce Ljung-Box McLeod-Lee ARCH
1 0.68 (0.409) 0.68 (0.409) 0.05 (0.822) 0.05 (0.822)
2 0.71 (0.703) 0.71 (0.702) 0.13 (0.935) 0.07 (0.966)
3 0.71 (0.871) 0.71 (0.870) 0.87 (0.832) 0.29 (0.962)

Tabla 5.7: Momentos de la serie real y el modelo - Serie SOI

Modelo Media Varianza Kurtosis Asimetra


Real 0.0559 108.5393 3.3799 -0.2116
ANFIS-ARCH 0.0775 134.0772 3.5021 -0.3212

Tabla 5.8: Estadsticos de diferentes modelos para la serie del SOI

Estadstico LSTAR ANFIS-ARCH STR-ARCH ARX-ARCH


T 1455 1455 1455 1455
R2 0.467 0.4649 0.4529 0.4446
AIC 4.12 6.927 6.946 6.948
Asimetra -0.071 -0.2126 -0.2106 0.1069
Exceso kurtosis 0.974 0.8877 0.8261 1.064
Ljung-Box 58.788(p 0.000) 58.13(p 0.000) 55.58 (p 0.000) 70.69 (p 0.000)
LMARCH 2.544(p 0.038) 1.04(p 0.373) 0.33 (p 0.802) 0.42 (p 0.738)
log L -5013.088798 -5029.5 -5042.31271
64

5
0 50 100 150 200
(a) IBM
5

5
0 50 100 150 200
(b) Innovaciones
4

0
0 50 100 150 200
(c) Varianzas

Figura 5.8: (a) IBM, (b) Innovaciones del modelo ANFIS-ARCH; y (c) Varianzas del modelo
ANFIS-ARCH
65

(a)
1

1
0 5 10 15 20 25
(b)
1

1
0 5 10 15 20 25
(c) (d)
1 0.4

0.5 0.2

0 0
0 0.1 0.2 0.3 0.4 5 0 5

Figura 5.9: Propiedades estadsticas de la serie del IBM (a) FAC; (b) FACP; (c) Espectro; (d)
Histograma

respectivamente, e indican que la serie se podra aproximar con un modelo de medias mviles
MA(P)de orden 2. En el espectro de potencias (Figura 5.9.c) no se observa una concentracin de
energa de frecuencias muy altas. El histograma (Figura 5.9.d), adems, muestra que los datos
de la serie siguen una distribucin aproximadamente normal.
Paso 1: En la Tabla 5.9 se reportan los valores de los diferentes criterios de informacin
estimados para modelos autoregresivos de orden P = 1, , 12. El orden ptimo P del modelo
AR(p) para las reglas de los consecuentes es 4, teniendo como criterio de eleccin el mayor orden
de P.
Paso 2: Las diferentes pruebas de no linealidad se presentan en la Tabla 5.10 y se detallan en
el ANEXO A de este trabajo. En ellas se observa claramente la no linealidad de la serie, ya que
todas las pruebas, al menos hasta el rezago uno dieron indicios de no linealidad.
66

Los resultados de las pruebas STR para especificar el tipo de modelo son reportados en
la Tabla 5.11. De acuerdo con los resultados obtenidos, se selecciona a yt1 como variable de
decisin y a la funcin logstica equivalente para la transicin.
Pasos 3, 4 y 5: La Tabla 5.12 presenta los resultados obtenidos al estimar un modelo ANFIS
homocedstico; log L es el logaritmo de la funcin de verosimilitud de los residuales igual a
-278; Las pruebas de normalidad realizadas rechazan la hiptesis nula de normalidad de los
residuales, lo cual es consistente con el resultado de la prueba ARCH, el cual indica que ellos
son heterocedsticos. Se puede concluir entonces que no existen autocorrelaciones remanentes
en los residuales y que es necesario incorporar una componente ARCH de orden uno al modelo
ANFIS.
Paso 6: El proceso de eliminacin de regresores irrelevantes se llev a cabo, obteniendo como
relevantes en el modelo los rezagos del 1 al 3 de la serie.
El modelo final elegido corresponde a un modelo ANFIS-ARCH de la forma:

S(yt1 ) n (1) (1) (1) (1)


o
yt = 0 + 1 yt1 + 2 yt2 + 3 yt3 +
S(yt1 ) + Z(yt1 )
Z(yt1 ) n (2) (2) (2) (2)
o
0 + 1 yt1 + 2 yt2 + 3 yt3 + at (5.2)
S(yt1 ) + Z(yt1 )

donde at = ht t con h2t = 0 + 1 a2t1 . Los parmetros para este modelo son presentados en la
Tabla 5.13.
La Figura 5.10 resume las principales propiedades estadsticas para los residuales
normalizados; la FAC y el espectro indican que los residuales parecen ser incorrelacionados,
adems, el histograma indica que son aproximadamente normales. Las pruebas estadsticas para
este modelo reportadas en la Tabla 5.14 confirman que los residuales siguen una distribucin
normal, los contrastes aplicados a ellos, indican que son homocedsticos, y que no existen
correlaciones remanentes.
Las Figuras 5.8(b) y 5.8(c) presentan las innovaciones y varianzas del modelo propuesto. Se
puede observar como los picos en la figura de la varianza tienen una relacin directa con los
cambios bruscos en la serie.
La Figura 5.11 muestra la funcin de transicin en el tiempo, Figura (a), y como funcin de
la variable de transicin, Figura (b). La Figura (a) muestra fluctuaciones rpidas de un rgimen
a otro, lo que evidencia la no linealidad de la serie.
La Figura 5.12 presenta el pronstico determinstico para la serie; yT+1 se calcul utilizando
los datos histricos. Para calcular yT+2 se utilizaron los datos reales hasta yT , y el pronstico
67

para yT+1 ; los restantes valores se calcularon de forma similar; en todos los casos se asume que
los residuales son cero. Se observa como la serie pronosticada converge rpidamente a un punto
de equilibrio donde las entradas y la salida del modelo son iguales numricamente.
La Figura 5.13 muestra la convergencia a largo plazo del modelo; ella se obtiene al realizar
el pronstico determinstico utilizando diferentes puntos de arranque obtenidos de los datos
histricos. En general, los modelos no lineales pueden presentar procesos de convergencia a uno
o ms puntos estables; procesos cclicos, y procesos divergentes; es comn, que dependiendo
del punto de inicio, un mismo modelo presente distintos comportamientos. Para el modelo
obtenido, se presenta un proceso de convergencia a un nico punto de equilibrio, y la velocidad
con que el modelo converge a l es aproximadamente constante e independiente del tipo de
fenmeno extremo.
Las propiedades estadsticas de los datos son reportadas en la Tabla 5.15 contrastadas con las
propiedades para una serie sinttica simulada de 10000 observaciones. Esta tabla nos permite
analizar que tan bien son reproducidas las propiedades estadsticas de los datos; en general,
puede concluirse que el modelo reproduce bastante bien las propiedades de la serie original.
La Tabla 5.16 presenta los estadsticos de diferentes modelos con los que se desea comparar
el modelo ANFIS-ARCH propuesto.
De acuerdo al relacin que establecen Velsquez et al. (2004) entre los modelos ANFIS y
STR, los modelos STR-ARCH y ARX-ARCH se puede afirmar que dichos modelos poseen la
misma estructura de los modelos ANFIS-ARCH para efectos de comparar el ajuste de la serie.
La comparacin con cada uno de los modelos presentados es descrita a continuacin:

1. El primer modelo presentado en la tabla de comparaciones es el STR-ARCH. El estadstico


R2 es mayor para el modelo ANFIS-ARCH, mientras que el criterio de informacin de
Akaike es mayor para el modelo STR-ARCH, y el log L tambin es mayor para los modelos
ANFIS-ARCH; los tres estadsticos confirman entonces que el modelo ANFIS-ARCH
reproduce mejor la dinmica de la serie. Finalmente, los estadsticos de Ljung-Box y
LMARCH, indican que los residuales son incorrelacionados y homocedsticos para ambos
modelos.

La Figura 5.14 presenta las funciones de transicin para los modelo ANFIS-ARCH y
STR-ARCH, en ellas se observa una transicin ms suave en el modelo ANFIS-ARCH y
un solo rgimen para el modelo STR lo que puede indicar problemas en su especificacin.

Se realiz adems, la prueba del radio de verosimilitud para determinar cual modelo
representaba mejor la dinmica de la serie. Se consider el modelo ANFIS-ARCH como el
68

modelo completo, y el modelo STR-ARCH como el modelo restringido; el estadstico de la


prueba fue LR = 11.420 y su valor crtico p = 0.022, por se puede concluir que el modelo
ANFIS-ARCH capturar mejor la dinmica de la serie.

2. El otro modelo usado para comparar es el ARX-ARCH contra el cual los estadsticos
tambin indicaron que el modelo ANFIS-ARCH capturaba mejor la dinmica de la serie;
el criterio de informacin de Akaike fue mayor para el modelo ARX-ARCH, y tanto el
estadstico R2 como el log L fueron mayores para el modelo ANFIS-ARCH.
Adems, la prueba del radio de verosimilitud, cuyo estadstico fue LR = 23.914 y su valor
crtico p = 0.008 indic que efectivamente los modelos ANFIS-ARCH se comportaban mejor
que los modelos ARX-ARCH.

En resumen, los modelos ANFIS-ARCH capturan mejor la dinmica de la serie estudiada,


seguidos de los modelos STR-ARCH.

Tabla 5.9: Valor de los criterios de informacin para el modelo AR(p) - Serie IBM

p CAK CHQ CSC


1 2.737 2.756 2.783
2 2.722 2.747 2.784
3 2.729 2.76 2.806
4 2.721 2.759 2.814
5 2.73 2.774 2.839
6 2.738 2.789 2.863
7 2.747 2.803 2.887
8 2.756 2.818 2.911
9 2.747 2.816 2.918
10 2.749 2.825 2.936
11 2.759 2.84 2.96
12 2.764 2.852 2.981

5.3 CONCLUSIONES

Al modelar las series del SOI y de los cambios relativos en los precios de las acciones de IBM se
pudieron hacer varias observaciones respecto a los modelos ANFIS-ARCH:

En primer lugar, se puede anotar que la metodologa planteada para la especificacin


permiti formular modelos donde los estadsticos para sus residuales mostraban
69

(a)
4

4
0 50 100 150 200

(b) (c) (d)


1 0.4 0.4

0.5 0.3 0.3

0 0.2 0.2

0.5 0.1 0.1

1 0 0
0 10 20 0 0.5 5 0 5

Figura 5.10: Propiedades estadsticas de los residuales del modelo ANFIS-ARCH - Serie IBM (a)
Residuales; (b) FAC; (c) Espectro; (d) Histograma
70

(a)
0.5

0.4

0.3

0.2

0.1

0
0 50 100 150 200 250

0.8

0.6

0.4

0.2

0
3 2 1 0 1 2 3 4

Figura 5.11: Funcin de transicin para el modelo ANFIS-ARCH - Serie IBM (a) En el tiempo,
(b) Como funcin de la variable de transicin.
71

0.5

0.5

1.5

2
0 10 20 30 40 50

Figura 5.12: Pronstico determinstico para la serie del IBM

1.5

0.5

0.5

1
0 5 10 15 20

Figura 5.13: Convergencia de largo plazo para la serie del IBM


72

0.8

0.6

0.4

0.2

0
3 2 1 0 1 2 3 4

Figura 5.14: Funciones de transicin para los modelos ANFIS-ARCH y STR-ARCH - Serie IBM

Tabla 5.10: Pruebas de no linealidad para la serie del IBM

Rez Kennan RESET Tsay White


1 15.12 (0.000) 10.06 (0.000) 15.26 (0.000) 15.67 (0.039)
2 10.44 (0.001) 6.19 (0.002) 6.22 (0.000) 13.53 (0.115)
3 10.47 (0.001) 5.15 (0.007) 2.97 (0.008) 14.17 (0.084)
4 14.58 (0.000) 9.53 (0.000) 2.44 (0.009) 15.16 (0.051)
5 14.38 (0.000) 9.45 (0.000) 1.85 (0.031) 15.25 (0.049)
6 11.30 (0.001) 7.90 (0.000) 1.52 (0.075) 12.41 (0.202)
7 8.93 (0.003) 8.18 (0.000) 1.51 (0.058) 15.05 (0.054)
8 4.80 (0.030) 8.96 (0.000) 1.22 (0.203) 12.61 (0.182)
9 6.27 (0.013) 5.99 (0.003) 1.34 (0.097) 9.62 (0.813)
10 3.58 (0.060) 5.10 (0.007) 1.22 (0.177) -0.01 (1.000)
11 4.03 (0.046) 5.18 (0.006) 1.16 (0.238) 9.70 (0.784)
12 3.07 (0.081) 4.13 (0.017) 1.27 (0.120) 11.14 (0.381)

Tabla 5.11: Resultados de la prueba STR - Serie IBM

Var LM1 LM2 LM3 LM4 Tipo


Rez 1 2.84 (0.001) 0.92 (0.453) 2.01 (0.095) 5.51 (0.00) L
Rez 2 1.19 (0.29)
Rez 3 0.54 (0.889)
Rez 4 1.00 (0.45)
73

Tabla 5.12: Pruebas estadsticas para el modelo ANFIS homocedstico - Serie IBM

Tamao de la Muestra 218


Sumatoria -0.6978
Media -3.20E-03
Mediana -0.03827
Desviacin Estndar 1.011
Asimetra 0.0837
Curtosis 4
Exceso de curtosis 0.9001
Mnimo -3.381
Mximo 3.652
Test de Normalidad de Jarque-Bera 7.038 (-0.03)
Test de Normalidad Lin-Mudholkar -0.37(-0.645)
log L -2.78E+02
Rez Box-Pierce Ljung-Box McLeod-Lee ARCH
1 0.01 (0.906) 0.01 (0.905) 3.45 (0.063) 3.45 (0.063)
2 0.08 (0.962) 0.08 (0.962) 3.52 (0.172) 1.72 (0.424)
3 0.13 (0.988) 0.14 (0.987) 3.58 (0.310) 1.16 (0.764)

Tabla 5.13: Parmetros del modelo ANFIS-ARCH - Serie IBM

Parametro Valor STD Est. T


c1 0.96 3.46 0.278
1 2.73 1.74 1.567
c2 0.15 0.01 28.905
2 285.43 1 284.619
(1)
0 -0.37 3.11 -0.121
(1)
1 -0.43 4.5 -0.095
(1)
2 0.03 1.74 0.019
(1)
3 -0.02 1.42 -0.015
(2)
0 0.7 4.21 0.167
(2)
1 0.15 4.15 0.036
(2)
2 -0.28 2.15 -0.129
(2)
3 -0.17 1.73 -0.1
0 0.52 1.43 0.364
1 0.35 2.49 0.139
74

Tabla 5.14: Pruebas estadsticas para el modelo ANFIS-ARCH - Serie IBM

Tamao de la Muestra 218


Sumatoria -0.5431
Media -2.49E-03
Mediana -0.02791
Desviacin Estndar 1.0030
Asimetra 0.1145
Curtosis 3.40600
Exceso de curtosis 0.406
Mnimo -3.231
Mximo 3.426
Test de Normalidad de Jarque-Bera 1.747 (0.418)
Test de Normalidad Lin-Mudholkar -0.5799 (0.719)
log L -2.73E+02
Rez Box-Pierce Ljung-Box McLeod-Lee ARCH
1 0.65 (0.418) 0.66 (0.415) 0.18 (0.672) 0.18 (0.675)
2 1.77 (0.413) 1.80 (0.407) 0.35 (0.840) 0.17 (0.920)
3 1.88 (0.597) 1.92 (0.590) 0.70 (0.873) 0.23 (0.972)

Tabla 5.15: Momentos de la serie real y el modelo - Serie IBM

Modelo Media Varianza Kurtosis Asimetra


Real 0.0722 0.9239 4.2643 0.4667
ANFIS-ARCH 0.071 0.9274 4.6762 0.4355

Tabla 5.16: Estadsticos de diferentes modelos para la serie del IBM

Estadstico ANFIS-ARCH STR-ARCH ARX-ARCH


T 218 218 218
R2 0.1808 0.1414 0.06361
AIC 2.656 2.672 2.674
Asimetra 0.6997 0.04787 -0.07948
Exceso kurtosis 0.2639 0.2672 0.5189
Ljung-Box 0.6731 (0.714) 0.5937 (0.743) 2.377 (0.305)
LMARCH 1.08 (0.359) 1.16 (0.327) 0.98 (0.405)
log L -273.5103081 -279.2202421 -285.4672007
75

incorrelaciones, normalidad y homocedasticidad, que son las caractersticas que indican


que efectivamente se captur la dinmica de la serie.

En segundo lugar, al simular series sintticas con ambos modelos se encontr que las
propiedades estadsticas de las dos series se lograban reproducir bastante bien. Adems,
las grficas del pronstico determinstico y la convergencia a largo plazo indicaron que
los modelos lograban converger rpidamente, en ambos casos, a un mismo punto de
equilibrio.

Adems, la comparacin con otros modelos no lineales en media y en varianza, determin


que para estas series los modelos ANFIS-ARCH capturaron mejor su dinmica. La
especificacin de estos modelos adicionales, aunque no se sigui una rigurosa metodologa,
es aceptable ya que la estrategia de especificacin propuesta en este trabajo, tiene muchos
puntos en comn con las metodologas para esos modelos especficos.

Finalmente, al comparar el modelo propuesto para la serie del SOI con el propuesto por Hall
et al. (1998), se puede anotar que las medidas de ajuste que se poda usar para comparar
los modelos eran el estadstico R2 y el criterio de Akaike, que mostraron el modelo LSTAR
como mejor; sin embargo, el hecho de que ese modelo tuviera residuales heterocedsticos
era evidencia suficiente para determinar que el modelo ANFIS-ARCH ajustaba mejor la
serie.
76
6. CONCLUSIONES Y TRABAJO FUTURO

Los captulos anteriores han cubierto los siguientes objetivos:

Demostrar las limitantes de la aproximacin de ANFIS hecha por Jang (1993), encontrando
que: el planteamiento est hecho para ANFIS como un modelo de regresin; el proceso
de estimacin de parmetros no aplica para los modelos que intentan capturar cambios
en la varianza; finalmente, el procedimiento para la especificacin de los modelos no es
adecuado para modelos de series temporales.

Establecer un conjunto de requerimientos para la formulacin de un modelo adaptable de


inferencia neurodifusa con heterocedasticidad condicional autorregresiva, que estuviera
en capacidad de caracterizar series temporales con presencia de no linealidad en la media
y en la varianza; a partir de una discusin acerca de los modelos ANFIS en el contexto
de series temporales, de acuerdo al planteamiento de Velsquez et al. (2004). En primer
lugar, se seal la necesidad de encontrar un algoritmo de estimacin de parmetros que
permitiera converger rpidamente a una solucin; y en segundo lugar, se consider el
problema de la especificacin de este tipo de modelos que deba ser sistemtica y robusta.

Formular un modelo adaptable de inferencia neurodifusa con heterocedasticidad


condicional autorregresiva denominado ANFIS-ARCH, para el cual se propuso el
algoritmo iRprop+ de Igel y Hsken (2000), para la estimacin de parmetros y un
mtodo de especificacin basado en el clculo del radio de verosimilitud para establecer
los regresores del modelo.

Determinar si las estrategias planteadas para la formulacin de los modelos eran adecuadas
y si el modelo era capaz de recuperarse a si mismo. Con este fin, se realizaron
unas simulaciones en muestras pequeas que permitieron determinar que el modelo
efectivamente es capaz de recuperarse a si mismo, pero presenta dificultades para
establecer exactamente los parmetros de los antecedentes. Adems, a pesar de que
durante el planteamiento del modelo solo se hizo referencia a modelos univariados, la
especificacin de modelos con variables exgenas arroj buenos resultados. Por ltimo,
la simulacin mostr que los procesos de especificacin del modelo funcionan de forma
adecuada.

77
78

Realizar dos casos de aplicacin, el primero con la serie macroclimtica del SOI y el segundo
con la serie de los cambios relativos en los precios de cierre de las acciones de IBM.
En ambos casos, la estrategia planteada para la formulacin de modelos ANFIS-ARCH
permiti caracterizar adecuadamente la serie, lo que se manifest en que sus residuales
no presentaron correlaciones residuales remanentes, fueron aproximadamente normales y
homocedsticos.

6.1 ASPECTOS GENERALES

El modelado de series temporales ha sido utilizado en diferentes reas como un medio para
entender fenmenos de los cuales se tiene un registro en el tiempo. Con este propsito se
han desarrollado mltiples mtodos de anlisis encaminados a explicar la dinmica de dichos
fenmenos. Este trabajo se concentr en la necesidad de representar las dinmicas de no
linealidad en media y en varianza que poseen algunas series temporales. A pesar de que
esta problemtica ya ha sido abordada en la literatura, no se han agotado todas las posibilidades
de investigacin en esta rea, y por tanto es vlido el planteamiento de nuevos modelos que
potencialmente puedan explicar mejor el comportamiento de fenmenos complejos.
Este trabajo complement el enfoque de series temporales con una tcnica de inteligencia
artificial para la solucin de los objetivos planteados formulando un modelo ANFIS-ARCH.
Este tipo de modelos hbridos constituye un conjunto de aportes tanto para el anlisis de series
temporales como para la inteligencia artificial, y potencialmente puede aportar al entendimiento
de fenmenos altamente complejos.
Finalmente, la formulacin exitosa de este tipo de modelos indica que es posible construir
otros modelos donde las componentes reflejen mayor complejidad, en este caso concreto, los
modelos ARCH podran ser reemplazados por otros modelos que representen estructuras ms
complejas en la varianza de la serie.

6.2 CONTRIBUCIONES TERICAS AL ANLISIS DE SERIES TEMPORALES

En el anlisis de series temporales los fenmenos complejos suelen ser abordados desde
diferentes enfoques y recientemente se han usado modelos hbridos con los que se intenta
capturar la mayor cantidad de caractersticas conocidas para una serie especfica. En esta
diversidad de enfoques, la inteligencia artificial a jugado un papel importante con el uso de
redes neuronales y otra clase de tcnicas para el modelado de series temporales. Sin embargo,
79

los aportes de la lgica difusa han sido ms recientes y limitados, concentrados nicamente en
formular la aproximacin como un problema general de regresin.
El modelo propuesto constituye entonces una nueva tcnica para el anlisis de series
temporales no lineales en media y en varianza, y como tal un aporte para el anlisis de series
temporales, ya que consigue vincular una tcnica de la inteligencia artificial como los modelos
adaptables de inferencia neurodifusa con las herramientas del anlisis de series temporales como
los modelos de heterocedasticidad condicional autorregresiva.
Por otra lado, la relacin planteada por Velsquez et al. (2004) en la que los modelos STR
corresponden a una simplificacin de los modelos ANFIS bajo algunas restricciones, implica
que los modelos ANFIS-ARCH pueden representar series temporales ms complejas que los
modelos economtricos STR-ARCH, lo cual establece otra contribucin en el anlisis de series
temporales.
Finalmente, es vlido preguntarse si los modelos ANFIS podran complementar otros
modelos economtricos para explicar mejor algunos fenmenos especficos.

6.3 CONTRIBUCIONES TERICAS A LA INTELIGENCIA ARTIFICIAL

Una de las tareas de los modelos de inteligencia artificial ha sido construir modelos de regresin.
Para resolver este problema se han usado diversos enfoques que han conseguido establecerse
en la literatura como tcnicas de regresin de uso comn. Sin embargo, la formulacin,
especificacin y estimacin de este tipo de modelos ha sido de alguna manera informal y muchos
de esos procesos se han realizado mediante tcnicas ad hoc.
Los modelos adaptables de inferencia neurodifusa ANFIS se han relacionado recientemente
con la econometra, considerndolos ms como modelos de series temporales que como simples
modelos de regresin. El principal aporte de esta tesis a la inteligencia artificial lo constituye el
planteamiento metodolgico por medio del cual se pueden especificar modelos ANFIS-ARCH
de forma sistemtica y robusta, apoyado en pruebas estadsticas y matemticas que le dan un
carcter ms formal a este tipo de modelos. Este proceso de especificacin va ms all de los
procedimientos comnmente usados en la inteligencia artificial.

6.4 CONTRIBUCIONES PRCTICAS

Los modelos formulados fueron aplicados a dos series de uso comn en la literatura, la serie del
ndice de Oscilacin del Sur (SOI) y la serie de los cambios relativos en los precios de cierre de
las acciones de IBM.
80

Respecto a la representacin del SOI, el modelo propuesto ayud a complementar los trabajos
de Hall et al. (1998) mostrando que la heterocedasticidad reportada en los residuales de su
modelo se eliminaba al representar la varianza de la serie por medio de la componente ARCH del
modelo propuesto en este trabajo. Los dems estadsticos del modelo ANFIS-ARCH propuesto
mostraron tambin residuales incorrelacionados y aproximadamente normales, lo que indica
que el modelo caracteriza tanto la no linealidad de esta serie como su volatilidad.
El modelo para la serie de IBM, por su parte, captur adecuadamente la dinmica de la
serie de acuerdo al anlisis de sus residuales que resultaron incorrelacionados, homocedsticos
y aproximadamente normales. Estos resultados confirman que la serie es no lineal y sugiere la
existencia de una estructura determinstica en su volatilidad que puede ser representada como
una funcin de las perturbaciones aleatorias pasadas.
Los modelos propuestos fueron comparados con otros modelos economtricos (STR-ARCH
y ARX-ARCH) que tambin representaban no linealidades en la media y la varianza de las series,
por lo tanto tienen caractersticas similares a los modelos ANFIS-ARCH. Estas comparaciones
permitieron encontrar para las series especficas del caso de aplicacin, de acuerdo a los
estadsticos de ajuste, que el modelo ANFIS-ARCH presenta mejores resultados que los dems
modelos analizados.

6.5 OBSERVACIONES FINALES Y TRABAJO FUTURO

Este captulo ha resumido algunas de las contribuciones hechas dentro de esta tesis en el anlisis
de series temporales y la inteligencia artificial indicando aspectos que deberan ser considerados
en investigaciones futuras.
Respecto a los puntos que deben ser tratados y que no se han resuelto en este trabajo se
encuentran:
Aplicar la metodologa planteada en la formulacin de modelos para series reales que
puedan ser explicadas por variables exgenas.

Reemplazar la componente ARCH del modelo propuesto con alguna generalizacin de


los modelos con heterocedasticidad condicional autorregresiva que permitan ajustar otras
series con estructuras ms complejas en la varianza. Se puede pensar por ejemplo, en
formular un tipo de modelo ANFIS-GARCH que permita representar series que requieren
procesos ARCH de orden elevado, caracterstica muy comn en las series financieras.

Formular modelos ANFIS-ARCH que consideren ms de una variable de transicin en los


antecedentes.
81

Reemplazar el modelo ARCH con otros modelos no lineales para considerar estructuras
ms complejas en la varianza de la serie.

Determinar las propiedades matemticas de los modelos formulados y establecer una


propuesta metodolgica para su construccin.

Establecer si otras tcnicas de optimizacin podran obtener mejores ptimos de la funcin


de verosimilitud para estimar los parmetros del modelo.

Los problemas enunciados anteriormente podran generar muchas ms preguntas de


investigacin que las desarrolladas en esta tesis. Sus respuestas no solamente estn limitadas a
la realizacin de desarrollos conceptuales y tericos sino tambin a la existencia de series reales
que permitan verificar los resultados. Quedan as muchas oportunidades de investigacin en
relacin al tpico abordado en este trabajo.
82
BIBLIOGRAFA

Akaike, H. (1973), Information theory and an extension of the maximum likelihood principle, in
B. Petrov y F. Csaki, eds, 2nd International Symposium on Information Theory, Akademia

Kiado, p. 267U281.

Anders, U. y Korn, O. (1999), Model selection in neural networks, Neural Networks 12, 309U323.

Bera, A. y Jarque, C. (1980), Efficient tests for normality, homoscedasticity and serial
independence of regression residuals, Economics Letters (3).

Bherenji, H. y Khedkar, P. (1992), Learning and tuning fuzzy logic controllers through
reinforcements, IEEE Transactions on Neural Networks (3), 724740.

Bollerslev, T. (1986), Generalized autoregressive conditional heteroskedasticity, Journal of


Econometrics 31, 307327.

Box, G. y Jenkins, G. M. (1970), Time Series Analysis: Forescasting and Control, Holden-Day, Inc.

Box, G. y Pierce, D. (1970), Distribution of residual autocorrelation in autorregressive integrated


moving average time series models, Journal of the American Statistical Association (65).

Breiman, L., Friedman, J. H., Olshen, R. A. y Stone, C. J. (1984), Classification and Regression Trees,
Wadsworth y Brooks/Cole Advanced Books y Software.

Carvajal, L. (1994), Acerca de la prediccin no lineal en hidrologa, Tesis de Maestra, Universidad


Nacional de Colombia.

Chan, F., Marinova, D. y McAleer, M. (2005), Modelling thresholds and volatility in us ecological
patents, Environmental Modelling & Software 20, 13691378.

Chan, F. y McAleer, M. (2003), Estimating smooth transition autoregressive models with garch
errors in the presence of extreme observations and outliers, Applied Financial Economics
13(8), 581592.

Chang, B. (2006), Applying nonlinear generalized autoregressive conditional heteroscedasticity


to compensate anfis outputs tuned by adaptive support vector regression, Fuzzy Sets and
Systems 17, 18321850.

Chatfield, J. F. C. (1998), Time series forecasting with neural networks: a comparative study

using the airline data, Journal of Applied Statistics 47, 231U250.

Chen, C. y Mike, S. (2006), On a threshold heteroscedastic model, International Journal of


Forecasting 22(1), 7389.

83
84

Darbellay, G. y Slama, M. (2000), Forecasting the short-term demand for electricity. do neural

networks stand a better chance?, International Journal of Forecasting 16, 71U83.
Engle, R. (1982), Autoregressive conditional heterocedasticity with estimates of the variance of
united kingdom inflations, Econometrica 50, 9871007.
Friedman, J. H. (1990), Multivariate adaptive regression splines, Tech. Report Dept. of Statitstics
Stanfor University .
Fukumizu, K. (2003), Likelihood ratio of unidentifiable models and multilayer neural networks,
Annals of Statistics 31(3), 833851.
Glantz, M. H. (1996), Currents of Change El Nios impacts on climate and society, Cambridge
University Press.
Granger, C. y Terasvirta, T. (1993), Modelling Nonlinear Economic Relationships, Oxford University
Press.
Hall, A. D., Skalin, J. y Tersvirta, T. (1998), A nonlinear time series model of el nio, Working
Paper Series in Economics and Finance 263, Stockholm School of Economics.
Hannan, E. y Quinn, B. (1979), The determination of the order of an autoregression, Journal of

Royal Statistical Society Series B 41, 190U195.
Harvey, A. C. (1989), Forecasting, Structural Time Series Models and the Kalman Filter, Cambridge
University Press.
Heravi, S., Osborn, D. y Birchenhall, C. (2004), Linear versus neural network forecasts for

european industrial production series, International Journal of Forecasting 20, 435U446.
IDEAM (2002), Efectos naturales y socioeconmicos del fenmeno el nio en colombia, Technical
report, Ministerio del Medio Ambiente, Instituto de Hidrologa Meteorologa y Estudios
Ambientales,Repblica de Colombia.
Igel, C. y Hsken, M. (2000), Improving the Rprop learning algorithm, in H. Bothe y R. Rojas,
eds, Proceedings of the Second International ICSC Symposium on Neural Computation
(NC 2000), ICSC Academic Press, pp. 115121.
Jang, R. (1993), Anfis: Adaptive-network-based fuzzy inference system, IEEE Transactions (3).
Jang, R. (1994), Structure determination in fuzzy modeling: a fuzzy cart approach, in IEEE
international conference on fuzzy systems.
Jang, R. (1996), Input selection for anfis learning, in 5th IEEE International Conference on Fuzzy
System.
Juang, C. y Lin, C. (1998), An online self-constructing neural fuzzy inference network and its
applications, IEEE Trans. on Fuzzy Systems (6).
85

Kasabov, N. (1999), Foundations of Neural Networks, Fuzzy Systems, and Knowledge Engineering,
MIT Press.

Kasabov, N. y Song, Q. (1999), Technical report.

Kennan, D. M. (1985), A tukey non-additivity-type test for times series nonlinearity, Biometrika
(75).

Kim, J. y Kasabov, N. (1999), Hyfis: adaptive neuro-fuzzy inference systems and their application
to nonlinear dynamical systems, Neural Networks (12).

Kuan, C. y Liu, T. (1995), Forecasting exchange rates using feedforwad and recurrent neural

networks, Journal of Applied Econometrics 10, 347U364.

Lewis, R. (2000), An introduction to classification and regression tree (cart) analysis, in Annual
Meeting of the Society for Academy Emergency Medicine, p. 267U281.

Lin, C. y Mudholkar, G. (1980), A simple test for normality against asymmetric alternatives,
Biometrika (67).

Lin, C.-T. y Lee, C. S. G. (1991), Neural-network-based fuzzy logic control and decision system,
IEEE Trans. Comput. 12(40), 13201336.

Ljung, G. y Box, G. (1978), On a measure of lack of fit in time series models, Biometrika (65).

Luukkonen, R., Saikkonen, P. y Terasvirta, T. (1988), Testing linearity agains smooth transition
autoregressive models, Biometrika .

McLeod, A. y Li, W. (1983), Diagnostic checking arma time series models using squared residual
correlations, Journal of Time Series Analysis .

Mesa, O., Poveda, G. y Carvajal, L. (1997), Introduccin al clima de Colombia, Universidad Nacional
de Colombia.

Mills, T. (1993), The econometric modelling of financial time series, Cambridge Press University.

Nauck, D. y Kruse, R. (1999), Neuro-fuzzy systems for function approximation, Fuzzy Sets and
Systems (101).

Nelson, D. B. (1991), Conditional heteroskedasticity in asset returns: A new approach,


Econometrica 59(2), 34770.

Philander, S. (1990), El Nio, La Nia and The Southern Oscillation, Academic Press Inc.

Poveda, G., Mesa, O., Carvajal, L., Hoyos, C., Meja, J., Cuartas, A. y Pulgarn, A. (2002),
Prediccin de caudales medios mensuales en ros colombianos usando mtodos no
lineales, Meteorologa Colombiana (6).
86

Ramsey, J. B. (1969), Test for specification errors in classical linear least squares regression
analysis, Journal of the Royal Statistical Society, Series B (31).

Salazar, J., Mesa, . J., Poveda, G. y Carvajal, L. F. (1994), Aplicacin de un modelo continuo no
lineal al estudio de series hidrolgicas, in XVI Congreso Latinoamericano de Hidrulica e
Hidrologa, IAHR, number 4.

Sulzberger, S., Tschicholg-Gurman, N. y Vestli, S. (1993), Fun: Optimization of fuzzy rule based
systems using neural networks, in IEEE Conference on Neural Networks.

Swanson, N. y White, H. (1997a), Forecasting economic time series using adaptive versus
nonadaptive and linear versus non-linear econometric models, International Journal of

Forecasting 13, 439U461.

Swanson, N. y White, H. (1997b), A model selection approach to real time macroeconomic


forecasting using linear models and artificial neural networks, Review of Economics and

Statistics 39, 540U550.

Takagi, T. y Sugeno, M. (1985), Fuzzy identification of systems and its applications to modeling
and control, IEEE Transactions on Sistems, Man and Cybernetics (15).

Tano, S., Oyama, T. y Arnould, T. (1996), Deep combination of fuzzy inference and neural
network in fuzzy inference, Fuzzy Sets and Systems (82(2)).

Taylor, J. (2004), Volatility forecasting with smooth transition exponential smoothing,


International Journal of Forecasting 20(2), 273286.

Terasvirta, T., Tjostheim, D. y Granger, C. (1994), Aspects of modelling nonlinear time series,
4, 29172957.

Tong, H. (1990), Non-linear time series a dynamical system approach, Claredon Press Oxford.

Tsay, R. (2002), Analysis of Financial Time Series: Financial Econometrics, John Wiley & Sons.

Tsay, R. S. (1986), Nonlinearity tests for time series, Biometrika (73).

van Dijk, D. y Franses, P. (1999), Modeling multiple regimes in the business cycle, Macroeconomic
Dynamics 3(3), 31140.

van Dijk, D., Franses, P. y Lucas, A. (1999), Testing for smooth transition nonlinearity in the
presence of outliers, Journal of Business & Economic Statistics 2(17), 21735.

Velsquez, J., Dyner, I. y Souza, R. (2004), Statistical modelling of the brazilian electricity spot
price using anfis, in 24th International Symposium of Forecasting.

Velsquez, J. y Gonzlez, L. (2006), Modelado del indice de tipo de cambio real colombiano
usando redes neuronales artificiales, Cuadernos de Administracin 19(32).
87

Vuong, Q. H. (1989), Likelihood ratio test for model selection and non-nested hypotheses,
Econometrica (57).

White, H. (1989), Son asymtotic results for learning in single hidden layer feedforward network
models, Journal of the American Statistical Association (84).

White, H. (1993), Economic prediction using neural networks: the case of ibm daily stock
returns, Neural networks in finance and investing .

Wittenberg, A. T. (2002), ENSO Response to Altered Climates, PhD thesis, Princeton University.

Zapata, E., Velsquez, J. y Smith, R. (2004), Modelamiento de series de caudal usando anfis,
(11).

Zhang, G., Patuwo, B. y Hu, M. (1998), Forecasting with artificial neural networks: the state of
the art, International Journal of Forecasting 14, 3562.
88
A. ANEXO - PRUEBAS DE NO LINEALIDAD

En la literatura se encuentran detalladas diversas pruebas de no linealidad. Las usadas durante


el desarrollo de este trabajo se encuentran resumidas a continuacin:

Prueba RESET: Ramsey (1969) propone la prueba RESET estableciendo como hiptesis
nula que la serie se puede representar como un modelo AR(p), cuyos valores optimizados
son y y sus residuales .
Versus el modelo alternativo de la forma

yt = x0t a + b2 y 2t + ... + bk y kt + ut (A.1)

donde xt es un vector que contiene los regresores originales. El estadstico de la prueba


esta dado por
(0 u 0 u)(n
k)
RESET = (A.2)
(u 0 u)p

Este estadstico tiene una distribucin F con (p, n k) grados de libertad.

Prueba de Kennan: Kennan (1985) propone una prueba de no linealidad similar a la prueba
RESET, considerando en el modelo alterno solo y 2t y modificando el segundo paso de la
prueba RESET para eliminar la multicolineariadad entre x(t1) y y 2t .

Prueba de Tsay: La prueba Tsay o F fue propuesta por Tsay (1986) para mejorar la prueba
Kennan, incluyendo p(p+1)/2 trminos del producto cruzado en los diferentes rezagos en la
regresin, denotados yt j ytk , k j (j, k = 1, ..., p). Basada en la hiptesis nula de linealidad.
Esta prueba sigue aproximadamente una distribucin F con p(p + 1)/2 y n [p(p + 3)/2] 1
grados de libertad.

Prueba de White: La prueba propuesta por White (1989) denominada tambin prueba de
redes neuronales, usa una red neuronal feedforward con una capa oculta con conexiones
directas entre las entradas y las salidas. De esta forma, la salida de la red neuronal est
dada por:
q
X
yt = x0t a + j (x0t j ) + ut (A.3)
j=1

89
90

donde xt es el vector de entradas, j representa los pesos y es la funcin de transferencia.


Usualmente es una funcin de distribucin acumulativa.
Para los modelos de series temporales, la prueba se puede construir obteniendo primero
los residuales 0t y luego calculando el coeficiente de correlacin R2 . El estadstico para la
prueba es nR2 y se distribuye como una 2 con q grados de libertad.