Está en la página 1de 20

Vol.

8 (2008): 51-70

ISSN 1578-8768

c
Copyright
de los autores de cada artculo. Se permite su
reproduccin y difusin por cualquier medio, siempre que se
haga sin inters econmico y respetando su integridad

Estimacin de datos faltantes en estaciones meteorolgicas de Venezuela


va un modelo de redes neuronales
Saba Infante, Jos Ortega y Fernando Cedeo
Departamento de Matemticas, Facyt, Universidad de Carabobo (Venezuela)
(sinfante@uc.edu.ve jortega@uc.edu.ve fjcedeno@uc.edu.ve)
(Recibido: 10-Ago-2008. Publicado: 17-Oct-2008)

Resumen
En el presente trabajo se propone un mtodo de reconstruccin de series de tiempo de precipitaciones, para ser
aplicado a las estaciones meteorolgicas de Venezuela con el propsito de corregir el problema de datos faltantes. La metodologa se fundamenta en dos tcnicas: la primera reconstruye la dinmica y el tiempo de retardo del
sistema dinmico de la serie temporal, y la segunda utiliza un modelo de redes neuronales para predecir los datos
faltantes. Los modelos de redes neuronales exploran la dependencia espacio temporal de los atributos meteorolgicos de las series y constituyen una herramienta importante para la propagacin de la informacin relacionada con
el clima, y adems proveen soluciones prcticas de incertidumbre asociados con la interpolacin y la captura de la
estructura espacio temporal de los datos. Para llevar a cabo estos procedimientos, se ha determinado la dimensin
de inmersin del atractor de las series y el tiempo de retardo, y luego se han usado estas medidas para definir la
arquitectura de la red neuronal. El algoritmo utilizado para estimar los parmetros de la red neuronal ha sido el
de retropropagacin, que bsicamente actualiza los pesos del modelo en la direccin en que el gradiente decrece
ms rpidamente. Para seleccionar la arquitectura de la red, se ha usado el criterio de informacin de Bayes (BIC),
que consiste en penalizar el error cuadrtico medio de los parmetros utilizados en el ajuste del modelo. Los resultados indican que las series de precipitaciones en Venezuela tienen alguna estructura subyacente no lineal, y
provienen de un sistema catico de bajas dimensiones. Los modelos de redes neuronales se han revelado tiles
para la reconstruccin de los datos faltantes de las series.
Palabras clave: Reconstruccin de Series Pluviomtricas, Sistemas Dinmicos, Modelos de Redes Neuronales.

Abstract
The present work proposes a method of reconstruction of precipitation time series, to be applied to the meteorological stations of Venezuela with the purpose of correcting the problem of missing data. The methodology is based in
two techniques: the first reconstructs the dynamics and the time of delay of the dynamic system of the temporary
series and the second uses a model of neural network to predict the missing data. The model of neural network
explores the spatio-temporal dependence of the meteorological attributes and constitutes an important tool for
the propagation of the related weather information to provide practical solutions of uncertainties associated with
interpolation, capturing the spatiotemporal structure of the data. To carry out these procedures, the embedding
dimension of the time series attractor and time delay are determined in order to define the neural networkss architecture. The algorithm used to estimate the parameters of the neural network is the back propagation, which
basically updates the models weights in the direction of the fastest decaying gradient. To select the neural networkss architecture, the Bayesian information criterion (BIC) has been used, consisting in penalizing the mean
squared error of the parameters used in the model fit. Results indicate that the precipitation series from Venezuela
have an nonlinear underlying structure, and come from a low dimensional chaotic system. Neural network models
have been useful to reconstruct the missing data of the series.
Key words: Reconstruction of Rainfall Time Series, Dynamical Systems, Models of Neural networks.

52

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

1. Introduccin
Uno de los objetivos prioritarios de la ciencia hoy en da es analizar el cambio climtico, entre cuyos
aspectos est estudiar el comportamiento de las precipitaciones. La precipitacin es uno de los fenmenos climticos con mayor variabilidad y comportamiento aleatorio. En los pases tropicales las lluvias
son irregulares, con gran variabilidad espacio-temporal, pero tienen la propiedad de persistencia a largo
plazo, de manera que episodios de precipitaciones intensas estn seguidos a su vez de otros similares,
existiendo una correlacin positiva entre ellos (Amaro et al., 2004). Por esta razn, las precipitaciones
presentes y pasadas pueden utilizarse para predecir precipitaciones en el futuro. Las medidas obtenidas
en las estaciones determinan el estado del sistema o comportamiento del cambio climtico; por lo tanto,
la serie reconstruida puede servir como referencia para pronosticar un estado futuro del sistema en una
estacin local, regional o nacional. En definitiva, se puede considerar que las series de precipitaciones
mensuales o anuales en la actualidad son funciones que dependen de las precipitaciones del pasado,
definindose as un sistema dinmico.
Adicionalmente al problema del anlisis de series de precipitaciones en un entorno complejo, se tiene el
problema de los datos faltantes y la calidad de la base de datos. Es comn encontrar una gran cantidad de
registros con poca duracin, numerosos errores y con ausencia de datos. La calidad en la base de datos
es una informacin clave para detectar y monitorear la variabilidad en el clima. Para tratar este problema se utilizaran dos mtodos complementarios: El primer mtodo proviene de la teora de los sistemas
dinmicos, y lo que se busca es entender el comportamiento del sistema generado por las series de precipitaciones, a travs de la reconstruccin de los estados del sistema; es decir, determinando la dimensin
de inmersin y los tiempos de retardos temporales de la serie, se reconstruye el atractor en el espacio
defasado (un espacio de menor dimensin al original), utilizando las ideas de la topologa diferencial
de Takens (1981, 1985). El uso de est tcnica permite determinar si la serie temporal ha sido generada
por un sistema determnistico no lineal o un sistema aleatorio no lineal. El segundo mtodo proviene del
campo de las mquinas de aprendizaje, concretamente se propone utilizar un modelo de redes neuronales multicapas, que son capaces de imitar mediante algoritmos recursivos el comportamiento de la serie
temporal.
El objetivo principal de este trabajo consiste en proponer un mtodo para la reconstruccin de las series
pluviomtricas de las distintas estaciones meteorolgicas de Venezuela, fundamentado en un modelo de
redes neuronales. Los modelos de redes neuronales se caracterizan por ser buenos para predecir, y lo que
se busca es una metodologa que permita predecir con el mnimo error posible el valor del dato faltante en
la serie de precipitacin mensual o anual en la estacin o estaciones que lo requieran. La metodologa de
redes neuronales provee soluciones prcticas a la incertidumbre asociada con la interpolacin; es decir,
el modelo captura las dinmicas intrnsecas de las actividades atmosfricas, tales como la dependencia
espacial, los ciclos aparentes o estructuras de la serie, los valores extremos y las tendencias. Estimar los
valores perdidos en las estaciones es importante porque por un lado se obtienen series climatolgicas
homogneas y por otro la informacin contenida en los registros de lluvia es confiable. La disponibilidad, confiabilidad y homogeneidad de una base de datos puede resultar de mucha ayuda a los entes
gubernamentales que toman decisiones; especialmente pueden ser utilizadas para predecir desastres en
aquellas zonas vulnerables donde las precipitaciones afectan negativamente a la vida de los habitantes, o
donde los periodos largos de sequas impactan en el desarrollo agrcola esencial para la subsistencia. Algunas tcnicas estadsticas usadas para resolver estos problemas incluyen los modelos de regresin lineal
para pronstico de clima de Wilby y Wigley (1997), los mtodos de clustering de Enke y Spekat (1997)
y los de anlisis de componentes principales para identificar patrones atmosfricos representativos de
Kutzbach (1967). Los modelos de redes neuronales tambin han sido utilizados en aplicaciones climatolgicas, ver por ejemplo los trabajos de Kalogirou et al. (1997), Michaelides et al. (1995), Abdelaal y
Elhadily (1995), Schizas et al. (1994) y Lucio et al. (2007) entre otros.
Para lograr los objetivos planteados en este trabajo se seguir el siguiente esquema, primero se estiman:
el tiempo de retardo , a travs de la funcin de autocorrelacin lineal y el ndice de informacin mutua

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

53

de Fraser y Swinney (1986); la dimensin de inmersin m, usando mtodo del vecino falso de Kennel et
al. (1992) y el criterio de informacin de Akaike (AIC) (1974); y la dimensin de correlacin, usando
el algoritmo de Grassberger y Procaccia (1983). Una vez determinados y m, se construyen los vectores defasados. En el segundo paso se comienza con los vectores defasados como variables de entrada
para entrenar la red neuronal; estas entradas definen las interconexiones dependientes con los pesos; se
propone trabajar con una capa oculta como sealan Zhang et al. (1998); los pesos del modelo son estimados por el algoritmo de retropropagacin y la arquitectura de la red ser seleccionada por el criterio
modificado de informacin de Bayes (BIC) propuesto en Nychka et al. (1992).
El resto del artculo es organizado como sigue: la seccin 2 explica la metodologa; se definen los conceptos bsicos utilizados en los sistemas dinmicos tales como los mtodos para determinar el tiempo
de retardo, la dimensin de inmersin, el mximo exponente de Lyapunov, el test BDS, la integral de
correlacin, y la dimensin de correlacin; se define el modelo de redes neuronales utilizado y el criterio
de informacin de Bayes; y se introducen las herramientas computacionales utilizadas. En la seccin 3
se realiza un anlisis de los resultados obtenidos. Y en la seccin 4 se establecen las conclusiones.

2. Metodologa
2.1. Sistemas Dinmicos
Considrese un sistema dinmico f : Rn Rn , que describe la transicin sobre el espacio estado dado
por una ecuacin en diferencias:
xt = f (xt1 ) ,

t = 1, 2, ...,

(1)

Si se conoce el estado verdadero de xt1 y f (), entonces se puede pronosticar en forma exacta el valor
futuro de xt . El sistema generado por f (), por lo general est definido sobre un atractor A, que tiene
dimensin m, el cual es ms pequeo que n. En la prctica el verdadero estado del sistema no se conoce,
pero se puede observar una secuencias de medidas de una funcin h : Rn R; es decir, se genera una
serie de tiempo univariada {x0 , x1 , ..., xn } del sistema observable, mediante la siguiente ecuacin:
yt = h(xt )

(2)

donde h puede ser no lineal. Una forma natural de generalizar (1), es tratar la ecuacin de estado en
cada punto del tiempo t como aleatorio; es decir, se introduce un ruido dinmico aleatorizado. Especficamente, se considera que los datos {xt } son generados por un modelo autoregresivo no lineal dado
por:
xt = f {xt1 , xt2 , ..., xtm } + et

1t n

(3)

1t n

(4)

o ms generalmente
xt = f {xt , xt2 , ..., xtm } + et

donde xt R, f es una funcin suave en casi todas partes desconocida, y {et } son secuencias de variables
aleatorias independientes idnticamente distribuidas, con E(et ) = 0 y var(et ) = 2 . El modelo dado en
(4) para datos caticos es motivado por los teoremas de inmersin de Takens (1981) y Saucer et al.
(1991) de la teora de sistemas dinmicos. Los teoremas establecen que para un sistema catico siempre
se satisface la ecuacin dada por:
xt = f {xt , xt2 , ..., xtm }

(5)

Como en el espacio de inmersin se preservan las caractersticas del atractor, estas dinmicas pueden ser
empleadas para construir el modelo del sistema. La ecuacin dada en (5) est completamente determinada por el tiempo de retardo y la dimensin de inmersin m, y forman el espacio de fases donde se

54

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

reconstruye el atractor. Los teoremas antes mencionados tambin establecen que bajo ciertas condiciones
generales, tales como una escogencia adecuada del tiempo de retardo y una eleccin de la dimensin de
inmersin m lo suficientemente grande, se puede reproducir una imagen uno a uno del conjunto original
de los datos. Hay una literatura extensa sobre cmo escoger los parmetros m y en una forma ptima
(ver Hegger et al., 1999, y sus referencias). A continuacin se mencionarn los mtodos utilizados en
este trabajo para la reconstruccin del espacio de fases.
2.1.1. Mtodos para estimar el tiempo de retardo y la dimensin de inmersin
Una primera manera de escoger el tiempo de retardo es usando la funcin de autocorrelacin que se
define por:
() =

1 n
i+ x)

(xi x)(x
n i=1

(6)

donde x es la media aritmtica, y se elige de tal manera que la funcin () tienda a cero, es decir, se
minimiza la dependencia estadstica entre las coordenadas de los vectores. En la prctica, no se conoce a
priori la dimensin del sistema dinmico, y la dimensin de inmersin es necesaria para la reconstruccin
del espacio de fases. Por lo tanto, el estimador de la dimensin es obtenido incrementando la dimensin
de inmersin hasta que el estimador de la dimensin se estabilice. Una segunda estrategia para escoger
es usando el tiempo de retardo de la informacin mutua sugerida por Fraser y Swinney (1986). Supngase
que se tiene una medicin xt en un tiempo t que est conectada con otra medicin xt+ en un tiempo t + ;
la informacin mutua promedio entre estas dos mediciones se estima por:


p (xt , xt+ )
I() = p (xt , xt+ ) log
(7)
p(xt )p(xt+ )
xt xt+
donde I() es mayor o igual a cero. Cuando se hace muy grande, el comportamiento catico de la seal
hace que las mediciones xt y xt+ sean independientes en un sentido prctico, e I() tender a cero. Entonces I() puede pensarse como un tipo de funcin de autocorrelacin no lineal para determinar cundo
los valores xt y xt+ son lo suficientemente independientes entre s para ser usados como coordenadas
de un vector de datos con retrasos temporales, pero no tan independientes para que los mismos estn
desconectados. La prescripcin sugerida para determinar el valor de retraso en la reconstruccin del
espacio de fases, es el valor de para el cual ocurre el primer mnimo de I().
Para determinar la dimensin de inmersin m se utiliza el mtodo propuesto por Kennel et at (1992),
llamado del vecino falso. La idea del algoritmo del vecino falso es la siguiente. Para cada punto xi en
la serie de tiempo se observa su vecino ms cercano x j en un espacio de dimensin m. Se calcula la
distancia kxi x j k. Se itera en ambos puntos y se calcula:
Ri =

|xi+1 x j+1 |
kxi x j k

(8)

Si Ri excede a un umbral Rt dado, este punto es marcado como un vecino falso. El criterio de parada para
determinar la dimensin de inmersin consiste en considerar que la fraccin de puntos para los cuales
Ri > Rt sea cero, o al menos lo suficientemente pequeo. En la prctica, se grafica la fraccin de vecinos
falsos como una funcin de la dimensin de inmersin y se toma el valor mnimo. La implementacin
del vecino falso permite especificar la separacin temporal mnima de los vecinos vlidos. Tambin se
usa una tcnica de tipo lineal de serie temporal tradicional para complementar el mtodo anterior. Como
el inters es encontrar la dimensin de inmersin, entonces se ajusta un modelo autoregresivo y con
ello se determina el orden. Estos modelos han sido ampliamente usados para inferencia y pronstico de
procesos. En este caso particular, no lo usaremos como predictor lineal; nos interesa encontrar el orden
del modelo que permita hacer un balance entre la reduccin de la varianza del error y el nmero de

55

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

parmetros estimados. Una medida utilizada para tal fin es el criterio de informacin de Akaike. Para un
modelo de orden k, el criterio puede ser escrito como sigue:
AIC(k) = nlog(2,k ) + 2k

(9)

donde 2,k es la varianza de los datos y k es el nmero de parmetros que intervienen en el modelo. Si la
serie temporal se modela como un proceso autoregresivo, entonces el valor de k es el valor que minimiza
a AIC(k), y por lo tanto es un estimador del orden del modelo autoregresivo.
2.1.2. Mximo exponente de Lyapunov
La impredecibilidad de la seal se puede cuantificar con los exponentes de Lyapunov. Basta decir que si el
exponente mayor de Lyapunov es positivo, la seal se considera impredecible (catica). Una estimacin
del mximo exponente de Lyapunov se basa en el algoritmo propuesto en Wolf et at (1985). Sea xk un
punto en el espacio de fase de dimensin m. Sea d(k) la distancia eucldea entre este punto y el punto ms
prximo x j . Sea d(k + k) la distancia entre xk y el punto x j+k . Entonces se puede estimar el exponente
mximo de Lyapunov como:


1 M
d(k + k)
=
log d(k)
Mk k=1

(10)

donde M es el nmero de puntos en el espacio de fases. k es el intervalo de prediccin que es, para una
seal peridica, su perodo. Los exponentes de Lyapunov son cantidades que miden la tasa de divergencia
exponencial de trayectorias con condiciones iniciales perturbadas. Hay tantos exponentes como variables
independientes tenga el sistema, es decir la dimensin del espacio de fases. Si el espacio de fases es mdimensional, hay m exponentes de Lyapunov ordenados de un modo decreciente; esta configuracin es
denominada espectro de Lyapunov:
1 2 . . . m

(11)

Estos exponentes son una generalizacin de los autovalores que se usan para caracterizar los diferentes
tipos de puntos de equilibrio. Una trayectoria es catica si al menos uno de los exponentes de Lyapunov
es positivo. El valor de este exponente, denominado Mximo Exponente de Lyapunov (MEL), proporciona un estimador de la tasa de divergencia de dos trayectorias infinitesimalmente prximas y de la
impredecibilidad del sistema; es decir, mide la sensibilidad de las condiciones iniciales y la separacin
exponencial entre dos trayectorias, inicialmente prximas, al cabo de n-pasos.
Algoritmo para calcular el mximo exponente de Lyapunov:
Paso 1 Se comienza con cualquier condicin inicial en la cuenca del atractor
Paso 2 Se itera hasta que una rbita est en el atractor seleccionado
Paso 3 Se selecciona el punto prximo separado por una distancia d(k)
Paso 4 Se avanza en ambas rbitas una iteracin y se calcula la nueva separacin d(k + k)
o
n


Paso 5 Se evala log d(k+k)
d(k)
Paso 6 Se reajusta la rbita, con lo que su separacin d(k) est en la misma direccin que d(k + k)
Paso 7 Se repiten los pasos 4 a 6 muchas veces y se calcula un promedio del paso 5
o
n


Paso 8 El exponente de Lyapunov ms grande es 1 = log d(k+k)
d(k)

56

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

2.1.3. Test BDS de no linealidad


El Test BDS fue desarrollado por Brock et al. (1987) y es un test no paramtrico que trata de contrastar si una serie de tiempo tiene una estructura concreta frente a su ausencia. Sin embargo, a veces es
ms interesante contrastar si la serie es independiente e idnticamente distribuida (i.i.d.) frente a cualquier estructura que pueda tener la serie, como por ejemplo no linealidad determnistica o estocstica, o
no estacionalidad; en este trabajo se utilizar para determinar si la serie tiene una estructura no lineal;
destacamos que el test tiene algunas limitaciones; por ejemplo existen atractores caticos que no son detectados por el test (ver Mantilla et al., 2001, para ms detalles). Sea x = {x1 , ..., xn } una serie temporal
de longitud n, que sigue alguna funcin de distribucin x F. Si se elige una distancia r de modo que
0 < r < max(x) mn(x), dadas dos observaciones xi y x j , si se considera la probabilidad de que estas
dos variables no disten entre s en ms de r, se tiene que:


, i 6= j i, j N
(12)
P1 (r) = Pr kxi x j k r
donde N representa al conjunto de nmeros naturales. Una relacin similar en dos dimensiones puede
ser definida para cualesquiera dos observaciones y sus respectivas que las preceden inmediatamente, es
decir,


P2 (r) = Pr kxi x j k r; kxi1 x j1 k r
, i 6= j i, j N
(13)
Si las observaciones de la serie temporal son i.i.d., entonces se tiene que:



P2 (r) = Pr kxi x j k r Pr kxi1 x j1 k r = P12 (r) ,

i 6= j

i, j N

(14)

Esta relacin de potencia es generalizable para cualquiera dimensin, de modo que el test BDS para una
dimensin m se convierte en un test de la hiptesis nula de que las probabilidades para la dimensin 1 y
m sean iguales; esto es:
H0 : Pm (r) = P1m (r) vs

Ha : Pm (r) 6= P1m (r)

(15)

El estadstico de contraste es:

n (Pm (r) [P1 (r)]m )


ZBDS =
m,n (r)

(16)

donde m,n (r) es la varianza estimada de Pm (r) [P1 (r)]m y cuya distribucin asinttica sigue una distribucin normal N(0, 1) para todo m y r (De Lima, 1996). Para estimar la probabilidad P1 (r), se utilizar
un algoritmo desarrollado por Grassberger y Procaccia (1983).
2.1.4. Integral de correlacin
n
Sea {xt }t=1
una serie de tiempo de longitud n. Se llama m-historias a cada uno de los vectores mdimensionales

xt = {xt , xt2 , ..., xtm }

(17)

que se que se pueden formar a partir de la serie univariada dada. Para m y r > 0, la probabilidad de
que cualesquiera dos m-historias estn a una distancia menor que r cuando n + se llama integral de
correlacin. Una estimacin de la integral de correlacin muestral viene dada por:
Cn (r) =

2 nj=2 ij=1 I(kxi xj k < r)


n(n 1)

(18)

donde I(kxi xj k < r) = 1 si kxi xj k < r, siendo k k la norma del supremo, y I(kxi xj k < r) = 0
en caso contrario. La integral de correlacin mide la correlacin espacial del sistema dinmico.

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

57

2.1.5. Dimensin de correlacin


En la generalizacin del Test BDS se observa que Pm (r) tiene una conducta de ley potencial para r
pequeo, por lo tanto Pm (r) se puede aproximar como sigue:
Pm (r) r

(19)

donde representa la dimensin del atractor. La dimensin de correlacin se define como el valor lmite:


log Pm (r)
= lm
(20)
r0
log(r)
Si la serie temporal tiene una explicacin determnistica entonces el lmite anterior existe y se estabiliza
en torno a un valor real k, para cualquier m > k. Contrariamente, cuando la serie tiene un componente
aleatorio, la dimensin de correlacin crece con m (ver Brock et al., 1991). El valor lmite en (20) puede
ser aproximado por el mtodo de Grassberger y Procaccia (1983), que esencialmente consiste en grficar
el log Pm (r) contra log(r) y observar la proporcin de puntos sobre la cual el grfico es aproximadamente
lineal; la pendiente de la recta de regresin construida sobre esa porcin es el estimador de la dimensin
de correlacin . El modelo de regresin lineal que se debe ajustar es:
log Pm (r) = 0 + 1 log(r)

(21)

donde 0 es el intercepto y 1 la pendiente de la recta, que representa a la dimensin de correlacin que


se desea estimar a partir de los datos, es decir, 1 = .
2.2. Modelos de Redes Neuronales
Las series de tiempo son casos especiales de los modelos de regresin y pueden ser analizadas usando la
estructura de los modelos de redes neuronales (Cheng y Titterington, 1984; Ripley 1994 y 1996; Bishop,
1995). Los modelos de redes neuronales exploran la dependencia de los atributos meteorolgicos como
una funcin que depende del espacio y el tiempo, detectan patrones en los datos y pueden ser utilizados
como mtodos para rellenar datos faltantes. En general estos modelos sirven para resolver problemas
relacionados con el reconocimiento de patrones, la clasificacin, la deteccin de comportamientos no
lineales y prediccin de fenmenos no lineales. La red neuronal hacia adelante es conocida como el perceptrn multicapa, que puede ser vista como un modelo de regresin no lineal. Entonces la red neuronal
hacia adelante con m variables de entrada x = {x1 , x2 , ..., xm } est relacionada con una variable de salida
o variable respuesta y. La versin ms familiar de esta estructura conduce a una funcin de respuesta de
la forma:
(
!)
k

xt = g w0 + wi f
i=1

wi0 + wi j xt j

(22)

j=1

donde m y son, respectivamente, la dimensin de inmersin y el tiempo de retardo necesarios para


una correcta reconstruccin. Los w := {wi j } son llamados pesos de conexin. Para cada j, los wi j con
j = 1, ..., m corresponden a las conexiones de las variables de entrada a cada una de las i-simas capas
de k nodos ocultos, y los w0i , para i = 1, ..., k, corresponden a las conexiones de los nodos ocultos a los
nodos de salida. La funcin g() es llamada funcin de activacin en el nodo de salida, y f () es tambin
una funcin de activacin comn en cada uno de los nodos ocultos. La salida del isimo nodo oculto
es:
!
m

zi = f

wi0 + wi j xt j

(23)

j=1

La funcin de activacin sigmoidal f (), se define como:


f (u) =

1
1 + exp(u)

(24)

58

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

Se consideran funciones de este tipo para modelar a grandes rasgos las propiedades del umbral de las
neuronas. Cuando la variable respuesta es continua, se sugiere que la funcin de activacin g sea igual a
la funcin identidad, por lo que la salida es una combinacin lineal de las salidas de los nodos ocultos.
El error se puede tomar con distribucin normal con media 0 y varianza conocida 2 para que el
modelo sea reconocido como un modelo de regresin no lineal. El problema consiste en estimar los
parmetros desconocidos w = (w0 , w1 , ..., wk , 1 , ..., k ), donde j = (w j0 , w j1 , ..., w jm ); el ajuste se hace
va mnimos cuadrados. El proceso de ajuste de los parmetros de la red neuronal se hace en dos fases:
La primera fase consiste en el entrenamiento de la red, y el objetivo es estimar los parmetros o pesos de
la red. La segunda fase es la de validacin del modelo ajustado, y consiste en comprobar con datos no
utilizados en el entrenamiento si la red predice bien.
Para construir la funcin de error, considrese que se tienen c variables objetivos t p , p = 1, ..., c, y supngase que las diferentes variables objetivos t p son generadas por:
t p = h p (x) + p

(25)

donde h p (x) es una funcin desconocida y p N(0, 2 ). Entonces la distribucin de probabilidad de la


variable objetivo viene dada por:


(t p g p (x, w))2
1
p(t p |x) =
exp

(26)
1
22
(22 ) 2
donde h p (x) es reemplazada por la salida predicha por la red neuronal x p = g p (x; w). Si se supone
que se tiene un conjunto de datos de entrenamientos dados por (xn ,t n ), la salida predicha por la red es
x = g(x; w), tomando el logaritmo de la ecuacin (26) cancelando todos aquellos valores constantes que
no dependan de los pesos, se obtiene una funcin de error:
E


1 N c  n
(t p g p (xn , w))2

2 n=1 p=1

(27)

el vector de parmetros w se escoge de modo que minimice la suma de cuadrados residual dada por:
E(w) =

1 N n
kt p g p (xn ; w)k2
2 n=1

(28)

La suma de cuadrados es sobre los valores predichos por la red neuronal y los valores utilizados para
entrenar la red. Como este es un problema de minimizacin, se pueden usar algoritmos generales de optimizacin no restringidos tales como los mtodos de Newton, el quasi Newton, el gradiente conjugado,
o el mtodo de Levenberg-Marquardt. Para mayores detalles de estos algoritmos ver Press et al. (1986),
Gill et al. (1981), Dennis y Schnabel (1983), y Fletcher (1987). El algoritmo que se utilizar para estimar
los parmetros en este trabajo ser el de retropropagacin, que bsicamente actualiza las ponderaciones
del modelo en la direccin en que el gradiente desciende ms rpidamente:
t+1 = w
t + g(x, w
t )[t p g p (x, w
t )]
w

(29)

t ) es el vector gradiente de la funcin g con respecto a w, y es la tasa de aprendizaje.


donde g(x, w
Este algoritmo fue ideado por Verbos a principios de los aos 70, y completado con las contribuciones de
Parker (1981) y Le Cun (1985), siendo popularizado por Rumelhart y McClenlland (1985). El algoritmo
consiste en propagar el error hacia atrs, de la capa de salida hacia la capa de la entrada, pasando por las
capas ocultas intermedias y ajustando los pesos de las conexiones con el propsito de minimizar el error
cometido.
Una prctica difcil en los modelos de redes neuronales es seleccionar la arquitectura de la red. Para
tal objetivo se propone usar el Criterio de Informacin de Bayes propuesto por Nychka et al. (1992).

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

59

Bsicamente el criterio consiste en penalizar el error cuadrtico medio por los parmetros utilizados en
el ajuste:




ln(Nm )
1
1
2
Et (w) + k
1 + ln(2) + 2 ln
(30)
BIC =
2
Nm
Nm
t
donde Nm es la longitud de la serie de tiempo, k es el nmero de parmetros en el modelo, y Et es el error
cometido por la red en un instante t.
2.3. Herramientas Computacionales
Todos los anlisis fueron realizados bajo el ambiente de programacin R. El orden fue el siguiente: para
estimar el tiempo de retardo se utiliz la funcin de autocorrelacin parcial ACF(, ), y la funcin de
informacin mutua mutual(, ); para determinar la dimensin de inmersin se usaron las siguientes funciones: ar.yw() para ajustar el modelo autoregresivo, y luego para grficar el orden de la serie contra el
criterio de informacin de Akaike se utiliz la funcin tsplot(, ); alternativamente a este procedimiento
se utiliz el criterio del vecino falso a travs del comando f alse.nearest(, , ); el mximo exponente
de Lyapunov se estim usando la funcin lyap(, , ); la dimensin de correlacin se estim usando la
funcin d2(, , ); el test BDS se obtuvo a travs de la funcin bds.test(, ). Las funciones ACF(, ),
ar.yw(), y tsplot(, ) son propias del R, y las funciones mutual(, ), f alse.nearest(, , ), y lyap(, , )
estn implementadas en el paquete T SERIESCHAOS de Di Narzo (2005); la funcin d2(, , ) est implementada en el paquete RT ISEAN y T ISEAN implementados por Di Narzo (2007) y Hegger et al.
(1999), y la funcin bds.test(, ) est implementada en el paquete T SERIES de Trapletti (2008). Para
ajustar la arquitectura de la red neuronal se utiliz el comando new f f (, , ); el entrenamiento de la red
se llev a cabo usando la funcin train(, , ), y la prediccin se realiz a travs de la funcin sim(, ).
Estas tres ltimas funciones estn implementadas en el paquete AMORE de Castejon y Ordieres (2007);
y finalmente se utiliz el paquete GRAPPHV IZ de Ellson et al. (2007) para visualizar las imgenes de la
red estimada. Como aporte de los autores se implement el criterio de informacin de Bayes modificado
(BIC), variando el nmero de neuronas en la capa oculta, entrenando con el paquete AMORE, que permite obtener un error de prediccin, y luego utilizando este error estimado y el nmero de parmetros de
los modelos se implement el BIC.

3. Resultados
Las datos utilizados para mostrar la metodologa son los de las series mensuales de precipitaciones del
perodo comprendido entre 1971 y 2000 de 36 estaciones del servicio meteorolgico de la Fuerza Area
de Venezuela (tabla 1). En la tabla 2 se muestran los estadsticos descriptivos por estacin, y puede
observarse que los mayores coeficientes de variacin estn asociados a las estaciones climatolgicas con
menor precipitacin anual.
3.1. Dimensin de Correlacin y Exponente de Lyapunov
En la tabla 3 se muestra la dimensin de correlacin estimada con m y ptimos para las 36 estaciones,
usando los criterios considerados en el apartado 2.1.1. Tambin se muestra un resumen por estacin del
mximo exponente de Lyapunov. Como hay 35 estaciones con mximos exponentes de Lyapunov positivos, se puede concluir que el sistema de precipitaciones de Venezuela es inestable, excepto la estacin
del Viga, que tiene el mximo exponente de Lyapunov negativo. En la tabla 4 se presenta un resumen
de la dimensin de correlacin estimada por estacin. Grassberger y Procaccia (1983) han sugerido la
dimensin de correlacin como una herramienta til para distinguir entre series de tiempo que provienen
de un sistema determinstico en bajas dimensiones (posiblemente con caos) y los procesos estocsticos
en altas dimensiones(procesos aleatorios). Los valores de la tabla 4 confirman que las series de precipitaciones en Venezuela son generadas por un proceso determinstico (posiblemente con una conducta
catica de baja dimensin), debido a que la dimensin de correlacin crece lentamente cuando m crece,

60

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

lo que quiere decir que la dimensin de correlacin alcanza un lmite finito (se estabiliza) para algn
m pequeo. Una serie tiene un componente puramente aleatorio si la dimensin de correlacin crece a
medida que se aumenta m. La literatura indica, que es suficiente calcular la dimensin de correlacin
para m = 1, 2, ..., 10.
Tabla 1: Estaciones climatolgicas utilizadas.
Estaciones Climatolgicas
Entidad federal Estacin Meteorolgica
Amazonas:
Puerto Ayacucho
Anzotegui:
Barcelona
Apure:
Guasdualito
San Fernando
Aragua:
Colonia Tovar
Maracay
Barinas:
Barinas
Bolvar:
Ciudad Bolvar
Santa Elena de Uairen
Tumeremo
Carabobo:
Palmichal
Valencia
Falcn:
Coro
Gurico:
Calabozo
Carrizal
San Juan de los Morros
Valle de la Pascua
Lara:
Barquisimeto
Mrida:
El Viga
Mrida
Miranda:
La Carlota
Monagas:
Maturn
Temblador
Nueva Esparta: Porlamar
Portuguesa:
Acarigua
Guanare
Sucre:
Cuman
Guiria
Tchira:
Coln
San Antonio del Tchira
Santo Domingo del Tchira
Trujillo:
Valera
La Caada
Vargas:
Maiqueta
Zulia:
Maracaibo
Mene Grande

Altitud
73
7
130
73
1790
436
203
43
907
180
1000
430
16
100
160
429
125
613
76
1479
835
65
30
24
226
163
2
13
825
400
328
628
26
43
66
27

Localizacin
Longitud Latitud
67 36
05 36
64 41
10 07

70 48
07 14

67 26
07 53
67 17
10 25

67 39
10 15
70 13
08 37

63 33
08 09

61 07
04 36
07 18
61 27

68 14
10 18
67 56
10 10

69 41
11 25

67 25
08 56
60 55
09 25

67 20
09 55

66 01
09 13
69 19
10 04

71 39
08 38
71 11
08 36

66 50
10 29

63 11
09 45
62 37
09 01

63 58
10 55
69 14
09 33

69 44
09 01

64 11
10 27
62 19
10 35

72 15
08 02
72 27
07 52

72 04
07 35

70 37
09 21
71 39
10 11

66 59
10 36

71 44
10 34
70 56
09 49

Cdigo FAV
80457
80419
80448
80450
1435
80413
80440
80444
80462
80433
80479
80472
80403
80442
80432
80431
80434
80410
80437
80438
80416
80435
80478
80421
80427
80428
80420
80423
8092
80447
80475
80426
80476
80415
80407
80425

En la figura 1 se muestra un boxplot de la dimensin de correlacin para los distintos valores de m considerados y las estaciones meteorolgicas analizadas, para un lag de tiempo fijo . En el grfico se puede
observar que existe una discriminacin sobre la base de la distribucin de la dimensin de correlacin
estimada. Las estaciones con la mayor dimensin de correlacin son: Santa Elena de Uairen, Tumeremo,

61

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

Maturn, Temblador, Mrida, San Antonio del Tchira y Mene Grande; en un segundo grupo se pueden incluir: Puerto Ayacucho, Ciudad Bolvar, Guiria, Maiqueta, la Carlota, Colonia Tovar, Palmichal,
Barquisimeto, Valera y el Viga; en un tercer grupo se tienen: Porlamar, Cumana, Barcelona, Valencia,
San Juan de los Morros, Calabozo, Valle de la Pascua, Acarigua, Guanare, Guasdualito, San Antonio del
Tchira, Santo Domingo y Coro; y por ltimo las estaciones con menor dimensin de correlacin son:
Maracay, San Fernando, Carrizal, La Caada y Maracaibo. Cada nmero en el grfico representa una
estacin (ver la tabla 3).

Tabla 2: Medidas descriptivas de la precipitacin (mm, excepto el coeficiente de variacin,


expresado en %), por estaciones.
Estaciones climatolgicas
1 Puerto Ayacucho
2 Ciudad Bolvar
3 Santa Elena de Uairen
4 Tumeremo
5 Maturn
6 Temblador
7 Porlamar
8 Cumana
9 Guiria
10 Barcelona
11 Maiqueta
12 La Carlota
13 Colonia Tovar
14 Maracay
15 Palmichal
16 Valencia
17 San Juan de los Morros
18 Calabozo
19 San Fernando de Apure
20 Carrizal
21 Valle de la Pascua
22 Barquisimeto
23 Acarigua
24 Guanare
25 Barinas
26 Guasdualito
27 Valera
28 La Caada
29 El Viga
30 Mrida
31 Coln
32 San Antonio del Tchira
33 Santo Domingo
34 Maracaibo
35 Mene Grande
36 Coro

Media
190.4
82.3
152.0
109.1
114.7
92.4
41.0
41.1
81.5
49.5
42.0
74.1
108.2
75.3
111.4
89.3
100.8
127.8
117.4
91.0
78.8
46.8
126.1
134.8
131.7
148.2
104.3
50.0
176.3
143.9
131.4
59.9
237.5
46.4
111.1
29.4

Mediana
159
65
135
97
107
78
28
27
67
34
31
62
91
56
99
75
83
102
85
56
44
40
121
116
131
131
84
29
146
132
112
38
221
27
94
15

Coef. de variacin
81
95
69
71
70
78
140
127
83
104
105
87
119
102
100
91
94
106
111
141
106
86
82
86
84
82
115
115
68
65
73
100
104
120
75
134

Mnimo
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2
0
0
0
0
0
0
0
0
0
0
0
2
0
9
0
2
0
3
0
0
0

Mximo
789
418
550
493
423
375
633
371
314
226
290
279
1411
454
1114
337
483
800
997
1047
336
250
448
519
486
759
1353
292
965
437
934
384
3093
302
491
296

62

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

Tabla 3: Estimacin de los valores ptimos de m, , , exponente de Lyapunov, y BIC.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

Estaciones climatolgicas
Puerto Ayacucho
Ciudad Bolvar
Santa Elena de Uairen
Tumeremo
Maturn
Temblador
Porlamar
Cumana
Guiria
Barcelona
Maiqueta
La Carlota
Colonia Tovar
Maracay
Palmichal
Valencia
San Juan de los Morros
Calabozo
San Fernando de Apure
Carrizal
Valle de la Pascua
Barquisimeto
Acarigua
Guanare
Barinas
Guasdualito
Valera
Caada
Viga
Mrida
Coln
San Antonio del Tchira
Santo Domingo del Tchira
Maracaibo
Mene Grande
Coro

m
4
4
3
3
4
4
4
4
4
4
4
4
4
3
3
3
4
2
3
4
4
4
6
4
3
3
3
4
2
4
4
5
3
3
4
2

3
3
4
3
3
3
2
3
3
4
3
2
3
2
3
3
3
2
3
2
2
3
3
3
3
3
3
3
2
3
3
2
3
3
2
3

2.1693
2.1190
2.4986
2.3390
2.6632
2.6327
1.7075
1.0699
2.3859
1.0906
2.2200
1.9737
2.0278
0.9731
1.6750
1.0956
1.4199
0.8566
0.7266
0.8805
1.3936
2.2907
1.9134
1.7567
1.8122
1.3174
1.8622
1.0791
1.3662
2.7876
2.3524
2.6829
1.5791
0.8434
2.7619
0.7882

Exp. de Lyapunov
0.011355
0.012530
0.007763
0.008233
0.010980
0.010339
0.010707
0.016176
0.011495
0.016183
0.010226
0.011070
0.011083
0.013152
0.004649
0.011746
0.015190
0.007978
0.021852
0.020277
0.014248
0.010168
0.012976
0.013927
0.009633
0.010962
0.007386
0.015067
-0.007061
0.010376
0.009064
0.010916
0.013197
0.015996
0.008661
0.012469

# neuronas ocultas
2
2
7
2
9
10
3
3
2
11
2
4
2
3
9
4
2
5
8
10
4
2
7
2
9
4
10
6
10
2
2
2
2
6
10
2

BIC
5.61
4.29
4.90
4.25
4.36
4.67
3.82
4.06
3.98
3.40
3.18
3.87
5.29
4.19
6.47
5.44
5.38
6.31
5.23
5.51
5.66
2.94
4.75
5.01
6.13
5.04
5.74
3.93
6.58
4.62
4.71
3.74
7.05
3.57
4.45
2.89

3.2. Test BDS


En la tabla 5 se muestran los valores del estadstico BDS para las distintas estaciones y para los distintos
valores de r; es decir, se calcula el test BDS para r = 0,5 y r = , donde es la desviacin tpica
de la serie de tiempo analizada y para distintos valores de la dimensin de inmersin m = 2, ..., 10. Se
quiere contrastar si las series obtenidas de las precipitaciones en Venezuela tienen alguna estructura
subyacente. Los valores crticos para comparar el test BDS se obtienen de la distribucin normal, y se
acepta o rechaza la hiptesis nula con los siguientes valores tericos: 1.64 (10 %), 1.96 (5 %) y 2.576
(1 %). Se puede observar que los valores del estadstico BDS confirman que la series analizadas para
las 36 estaciones meteorolgicas venezolanas no son independientes; esto quiere decir que las series
analizadas tienen una estructura subyacente de carcter no lineal.

63

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

Tabla 4: Dimensin de correlacin para distintos valores de la dimensin de inmersin m.


Estaciones climatolgicas
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

Puerto Ayacucho
Ciudad Bolvar
Santa Elena de Uairen
Tumeremo
Maturn
Temblador
Porlamar
Cumana
Guiria
Barcelona
Maiqueta
La Carlota
Colonia Tovar
Maracay
Palmichal
Valencia
San Juan de los Morros
Calabozo
San Fernando de Apure
Carrizal
Valle de la Pascua
Barquisimeto
Acarigua
Guanare
Barinas
Guasdualito
Valera
La Caada
El Viga
Mrida
Coln
San Antonio del Tchira
Santo Domingo
Maracaibo
Mene Grande
Coro

m = 1 m = 2 m = 3 m = 4 m = 5 m = 6 m = 7 m = 8 m = 9 m = 10
0.750
0.660
0.750
0.690
0.740
0.703
0.447
0.476
0.688
0.590
0.562
0.681
0.564
0.611
0.602
0.650
0.650
0.657
0.574
0.534
0.647
0.622
0.676
0.714
0.708
0.695
0.5375
0.5739
0.600
0.7648
0.627
0.564
0.627
0.550
0.706
0.4255

1.480
1.100
1.720
1.420
1.580
1.496
0.843
0.664
1.205
0.779
1.076
1.084
1.045
0.842
1.440
0.874
0.867
0.857
0.687
0.715
0.863
1.135
1.031
1.107
1.441
1.068
1.368
0.789
1.366
1.690
1.264
1.085
1.342
0.758
1.344
0.788

1.930
1.740
2.490
2.330
2.300
2.173
1.169
0.843
1.999
0.924
1.954
1.590
1.774
0.973
1.675
1.096
1.169
1.049
0.727
0.795
1.144
1.860
1.296
1.375
1.812
1.317
1.862
0.9328
1.618
2.362
2.113
1.951
1.579
0.8434
2.338
1.095

2.160
2.110
3.080
2.860
2.660
2.633
1.707
1.070
2.386
1.091
2.220
1.974
2.028
1.078
1.980
1.306
1.420
1.304
0.771
0.880
1.394
2.291
1.502
1.757
1.964
1.586
2.217
1.079
1.921
2.788
2.352
2.349
1.845
0.922
2.762
1.625

2.340
2.300
3.600
3.120
2.840
3.058
1.953
1.708
2.288
1.387
2.608
2.272
2.164
1.189
2.402
1.528
1.610
1.700
0.823
0.972
1.647
2.493
1.817
1.944
2.220
1.900
2.238
1.210
2.180
3.155
2.629
2.683
1.923
1.015
3.129
1.878

2.470
2.470
3.700
3.200
3.060
3.369
1.998
1.748
2.550
1.623
2.667
2.353
2.221
1.302
2.587
1.958
1.464
2.100
0.872
1.024
1.924
2.723
1.913
2.047
2.394
2.078
2.407
1.405
2.495
3.403
2.862
2.532
2.172
1.129
3.291
2.183

2.600
2.530
4.140
3.580
3.350
3.555
2.152
1.999
2.717
1.652
2.900
2.598
2.408
1.417
2.517
2.347
1.614
2.237
0.939
1.143
2.019
2.946
2.005
2.193
2.504
2.253
2.726
1.577
2.598
3.389
3.076
2.714
2.291
1.338
3.591
2.313

2.640
2.690
4.070
4.060
3.190
3.588
2.220
2.064
2.704
1.760
3.106
2.705
2.530
1.698
2.731
2.986
1.755
2.431
1.039
1.196
2.336
3.094
2.100
2.385
2.777
2.308
2.823
1.797
2.846
3.721
3.398
2.706
2.372
1.442
3.526
2.493

2.604
2.820
4.510
4.180
3.220
3.801
2.241
2.196
2.877
1.919
3.036
2.589
2.542
1.783
2.976
3.539
1.955
2.821
1.113
1.242
2.532
3.464
2.166
2.588
2.741
2.438
2.900
1.826
2.451
3.792
3.525
2.880
2.511
1.552
3.755
2.547

2.680
2.870
4.470
4.480
3.500
3.880
2.370
2.340
2.990
1.870
3.230
2.680
2.730
1.980
2.660
3.710
2.120
3.332
1.210
1.300
2.610
3.510
2.290
2.910
2.970
2.460
2.730
1.870
2.480
4.170
3.380
2.840
2.360
1.680
4.130
2.680

3.3. Modelo de Redes Neuronales


Una vez realizada la caracterizacin de las series de tiempo de las precipitaciones de Venezuela va las
tcnicas de los sistemas dinmicos, y dado que se determin la dimensin de inmersin m y el tiempo
de retardo ptimos para cada serie, ahora se pretende utilizar las series cortas (m-historias) como elementos de entrada a la red neuronal, con el propsito de predecir los datos faltantes en cada estacin
meteorolgica que lo requiera. El ajuste de los parmetros se realiza en dos fases: En una primera fase se
entrena la red, donde el objetivo que se persigue es estimar los parmetros del modelo, y en una segunda
fase se realiza la validacin, con datos no utilizados para el entrenamiento: el objetivo es comprobar si
la red predice razonablemente bien. Para llevar a cabo este proceso se toma el 80 % de los datos para
estimar los parmetros, y el otro 20 % para validar el modelo. Uno de los problemas que se encuentran al
ajustar modelos de redes neuronales es determinar el nmero ptimo de neuronas en la capa oculta. Para
solventar este problema se utiliz el criterio de informacin de Bayes modificado. En las dos ltimas
columnas de la tabla 3 se puede observar el nmero de neuronas ocultas de la red y el BIC mnimo para
cada estacin.

64

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

Tabla 5: Estadstico BDS para la estaciones climatolgicas.


Estaciones climatolgicas

(1/2)

Ciudad Bolvar
(1/2)

Santa Elena de Uairen


(1/2)

Tumeremo
(1/2)

Maturn
(1/2)

Temblador
(1/2)

Porlamar
(1/2)

Cumana
(1/2)

Guiria
(1/2)

Barcelona
(1/2)

Maiqueta
(1/2)

La Carlota
(1/2)

Colonia Tovar
(1/2)

Maracay
(1/2)

Palmichal
(1/2)

Valencia
(1/2)

San Juan de los Morros (1/2)

Calabozo
(1/2)

San Fernando de Apure (1/2)

Carrizal
(1/2)

Valle de la Pascua
(1/2)

Barquisimeto
(1/2)

Acarigua
(1/2)

Guanare
(1/2)

Barinas
(1/2)

Guasdualito
(1/2)

Valera
(1/2)

La Caada
(1/2)

El Viga
(1/2)

Mrida
(1/2)

Coln
(1/2)

San Antonio del Tchira (1/2)

Santo Domingo
(1/2)

Maracaibo
(1/2)

Mene Grande
(1/2)

Coro
(1/2)

1 Puerto Ayacucho
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36

m=2

m=3

m=4

m=5

m=6

49.670
31.361
22.690
11.707
10.096
8.1933
5.3465
4.2143
51.858
28.698
9.7878
7.4793
2.0978
0.5843
12.214
5.1737
28.586
13.612
34.576
23.700
4.5503
3.7223
32.527
12.991
14.937
5.2921
35.805
22.422
2.9629
0.6024
27.700
9.4209
36.735
15.718
22.478
9.0219
38.183
23.347
10.968
2.6011
10.967
11.379
14.693
6.0404
94.591
59.321
46.671
21.699
39.715
19.799
68.224
34.384
5.3450
4.1657
10.426
6.0162
2.3825
0.49557
22.037
15.040
2.0106
2.0653
4.3973
3.1116
34.134
7.1325
14.637
7.3244
11.673
5.3079
2.8556
0.32633

76.656
39.251
34.470
14.756
14.559
10.816
8.7278
6.6912
73.217
35.124
14.996
8.9833
3.2562
1.0676
19.037
6.7834
48.537
18.726
57.963
29.391
5.1787
3.3713
52.193
16.899
20.214
6.1231
61.790
29.016
2.2237
0.3458
44.258
10.748
62.504
20.950
31.889
11.631
62.703
31.075
18.773
4.2763
18.298
14.744
23.140
7.2496
157.16
76.069
81.3880
28.625
60.479
24.926
102.04
43.136
5.7845
4.4357
18.720
8.7823
4.6141
1.3276
29.935
18.839
2.4462
2.9684
5.9951
3.8420
48.908
10.277
23.698
10.420
16.377
6.2976
3.4089
0.33782

125.59
47.798
54.940
19.016
17.842
12.639
11.676
8.4096
108.85
42.913
21.269
9.7414
4.6070
1.7557
28.899
7.8194
84.943
25.576
100.29
36.518
6.1206
3.5172
87.750
20.152
25.957
6.9558
113.54
37.164
3.1083
0.2791
74.674
13.180
110.42
26.065
46.111
14.122
107.67
40.339
26.823
5.4423
28.757
19.685
34.393
8.0521
278.23
94.928
146.92
36.263
97.144
30.620
156.89
51.437
5.9018
4.5722
31.807
11.362
6.6344
2.3956
44.143
22.673
2.6359
3.1643
7.4193
4.3830
64.081
11.484
34.091
12.150
24.973
6.9808
4.3358
0.79064

221.06
59.887
89.816
23.064
22.711
15.375
15.131
10.555
174.06
53.141
31.55
11.658
5.7018
2.0879
42.598
8.4967
150.79
33.119
185.57
45.624
7.7464
3.9186
168.53
24.736
32.550
7.6502
219.71
47.303
3.5698
0.5506
152.66
15.995
219.19
31.072
71.078
18.097
203.37
51.710
36.835
5.9965
46.288
27.165
54.622
8.5642
523.22
123.53
285.18
47.485
163.90
38.116
269.23
63.082
5.7503
4.3186
51.337
14.040
8.8026
3.1089
67.448
26.989
2.9434
3.4904
10.027
5.5531
87.130
12.541
53.875
14.945
41.060
7.9287
4.6933
0.88639

413.51
76.692
155.45
29.171
27.327
17.947
18.149
12.221
289.27
67.633
47.629
14.208
7.0798
2.0819
64.470
9.2440
277.21
43.674
370.15
60.048
9.0833
4.1209
356.47
30.763
41.528
8.0956
465.69
61.508
3.5663
0.7066
303.41
20.750
475.74
38.719
117.62
22.593
405.79
67.893
51.792
6.9520
86.200
37.437
79.795
10.339
1058.5
166.15
598.29
62.889
280.48
48.380
480.91
78.986
5.8455
4.3129
83.613
17.138
10.849
4.0323
115.21
32.696
2.9842
3.7799
13.290
6.1361
121.5
13.887
90.920
18.020
69.490
9.0364
4.8968
0.89144

m = 7 m = 8 m = 9 m = 10
810.55
101.44
272.85
37.196
30.773
20.508
18.402
13.893
532.44
88.353
66.279
16.696
8.6208
2.0532
98.827
10.118
538.29
57.640
777.33
79.730
11.538
4.4676
788.76
39.050
54.625
8.3733
1033.5
81.135
3.3900
0.6558
621.08
28.377
1067.4
50.581
186.39
29.116
873.01
90.215
75.105
7.7308
159.64
51.841
125.67
13.666
2229.9
229.47
1310.5
86.099
491.10
64.368
945.82
102.90
6.0795
4.4608
142.22
20.881
14.178
5.0611
213.46
40.622
3.6570
4.4388
17.661
6.7941
179.85
15.300
169.62
22.323
117.32
10.481
6.9418
1.1771

1668.4
137.62
483.15
47.523
29.791
23.398
20.823
16.220
1033.5
119.36
102.22
19.483
11.108
2.1824
153.28
10.757
1100.3
75.405
1686.7
111.30
14.420
4.8116
1788.0
51.264
72.794
8.4730
2376.3
108.34
3.5242
0.7083
1496.2
39.655
2610.8
66.429
284.68
37.349
1948.0
124.37
108.35
8.3662
300.86
72.354
199.95
17.552
4881.7
326.71
3034.6
120.78
830.98
89.335
1984.1
140.52
6.2445
4.7565
250.92
26.039
18.787
6.1592
392.05
51.100
4.6760
4.8953
26.100
8.0689
279.66
16.682
330.48
28.509
202.16
12.015
9.5826
1.6501

3592.4
193.69
843.74
60.286
36.772
26.470
33.853
19.076
2096.2
166.68
202.33
23.848
15.011
2.2635
223.69
11.023
2339.6
102.10
3750.6
160.93
19.154
5.0996
4157.3
68.051
98.592
8.6341
5625.2
152.80
2.1480
0.5997
3635.6
57.554
6037.8
85.206
387.00
48.451
4462.0
174.46
154.53
9.2916
612.33
103.06
325.80
21.864
10861
479.21
7405.5
175.06
1428.2
124.05
4555.2
194.85
6.1716
4.8713
469.67
32.224
25.260
7.4943
768.98
64.955
5.1802
5.1577
38.543
9.9070
443.48
17.974
659.94
36.071
364.65
14.931
12.953
1.8929

7774.7
276.90
1469.7
76.481
47.412
28.776
57.157
22.908
4267.7
237.86
392.53
28.959
20.212
2.2501
310.87
10.988
5007.5
143.40
8598.5
236.20
28.283
5.5311
9757.3
92.399
135.47
8.9292
13588
219.31
0.87025
0.4986
8856.1
84.492
14440
111.63
490.55
63.099
10504
251.20
233.12
10.151
1302.7
153.68
537.68
27.195
25231
725.68
18391
257.64
2399.5
172.19
10680
273.57
5.9417
4.8316
898.74
40.778
31.484
8.9568
1366.7
83.750
5.0751
5.5503
60.657
12.275
702.11
19.494
1344.8
46.256
659.75
19.214
17.163
2.2462

65

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

11 13 15 17 19 21 23 25 27 29 31 33 35

Figura 1: Boxplot de la dimensin de correlacin, con m = 2, ..., 10, para las distintas estaciones.
En las figuras 2 y 3 se muestran las representaciones de las series originales de las estaciones Palmichal
y Barinas respectivamente, con los datos faltantes estimados usando el modelo de redes neuronales con
3 variables de entrada, 9 nodos ocultos y una variable de salida. Es importante sealar que la arquitectura
de la red para todas las estaciones fue obtenida usando el criterio de informacin de Bayes; aqu slo
se muestra la representacin de dos estaciones reconstruidas por el espacio, pero el estudio abarca el
anlisis para las 36 estaciones meteorolgicas y la reconstruccin tambin fue favorable para el resto
de las estaciones. En la figura 4 se muestran las arquitecturas de las redes ajustadas para las estaciones
de Palmichal y Barinas. En la tabla 6 se muestra el porcentaje de datos perdidos, el mximo nmero de
meses seguidos sin datos, y el error cuadrtico medio (ECM), para las 36 estaciones consideradas. El
ECM se obtiene comparando la serie original con la serie reconstruida por el modelo de redes neuronales
propuesto, observndose un ECM pequeo, independientemente de si la estacin tiene un alto porcentaje
de datos perdidos o que existan datos perdidos en meses contiguos. Este resultado nos permite confiar en
la validez del modelo.

4. Conclusiones
En este trabajo se han aplicado dos mtodos complementarios para analizar seales que provienen de
las precipitaciones en Venezuela. La primera reconstruye la dinmica y el tiempo de retardo del sistema
dinmico de la serie temporal, y la segunda utiliza un modelo de redes neuronales para predecir los datos
faltantes. El primer resultado importante que se detecta es que los mayores coeficientes de variacin
estn asociados a las estaciones climatolgicas con menor precipitacin anual. El segundo resultado que
se obtiene est relacionado con el mximo exponente de Lyapunov: todas las estaciones climatolgicas
exceptuando la del Viga tienen el exponente negativo, indicando que hay una inestabilidad el sistema
subyacente de precipitaciones en el pas. Tambin se aplic un test de independencia no paramtrico
basado en la estimacin de la integral de correlacin para varios valores de la dimensin de inmersin
m, con el propsito de probar la hiptesis nula de que las series de precipitaciones son independientes
idnticamente distribuidas frente a la alternativa de no ser independientes. El test BDS aplicado a las
distintas estaciones meteorolgicas exceptuando las estaciones de Porlamar, Palmichal, el Viga y Coro
cuando r = , rechaza la hiptesis nula de que estas series son independientes idnticamente distribuidas;

66

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

esto quiere decir que las series de precipitaciones en Venezuela tienen alguna estructura subyacente no
lineal. De estos anlisis se puede concluir que las series estudiadas en general son generadas por un
sistema de precipitaciones que tiene una dinmica no lineal (ver la tabla 5).

1000

Datos estimados vs reales en la Estacin Palmichal

600
400
0

200

Precipitacin Total Mensual

800

reales
estimado

20

40

60

80

100

120

100

120

meses

Figura 2: Reconstruccin de la estacin Palmichal.

100

200

300

reales
estimado

Precipitacin Total Mensual

400

500

Datos estimados vs reales en la Estacin Barinas

20

40

60

80

meses

Figura 3: Reconstruccin de la estacin Barinas.

67

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

wi1: -2.28629
Id=1

wi2: -4.67029
wi3: -0.34308

wi1: -2.86595
2

v0: 0

Id=1

Bias: 0.15079

wi1: 9.99035
Id=2

wi2: 6.52509
wi3: 68.25763

v0: 1

Id=2

wi2: 1.67632

v0: 1

Id=3

wi3: -1.87564

wi2: -14.85115
wi3: 15.21828

v0: 1

wi2: -2.37797
wi3: -0.71268

v0: 0

v0: 0

Bias: -0.15346

wi1: -35.12727
wi2: -8.80279

v0: 0

wi1: -3.27934
2

Bias: 0.08611

Id=4

Bias: -0.62784

wi1: 0.76378

wi3: -0.00642

wi3: -1.3112

wi1: 1.92473
2

Bias: 0.17064

Id=3

wi2: -2.64303

Bias: -0.31713

wi1: -93.96813
2

v0: 0

Id=4

Bias: -0.14051

wi2: -84.22491
wi3: -0.97208
Bias: -0.90223

Input 1

Input 1

w1: 18.92224

w1: 15.30714

w2: 22.21248

w2: 13.55742

w3: 20.06971

Input 2

Id=5

w3: 13.23984

wi1: 4.03802

w4: 11.85929

wi1: -2.63554

wi2: 1.41222

w5: 23.89448

wi2: -10.74358

wi3: 0.57277

v0: 1

Bias: 0.0904

Id=10

w6: 23.56943

v0: 126.1305

Output 1

Input 2

Id=5

w7: 23.59883

wi3: -0.79895

w4: 73.84993
2

v0: 0

Bias: -0.2469

wi2: 5.85759
wi3: 34.20197

w9: 14.92661

v0: 1

Id=6

wi3: 0.67973

v0: 1

Id=7

wi3: -6.4435

v0: 0

Id=8

wi3: -0.3998
Bias: 0.10001

wi2: -4.66043
wi3: -3.84431

v0: 0

wi2: 9.17657
wi3: -9.04882

v0: 0

v0: 0

Bias: -0.17504

wi1: -0.92317
wi2: -0.51797

v0: 0

wi1: 9.60062
2

Bias: 0.22835

Id=9

Bias: -0.34841

wi1: 1.97604
wi2: -0.92238

wi3: -0.26528

wi1: -10.66766
2

Bias: -0.02151

Id=8

wi2: -2.98226

Bias: -0.00962

wi1: 0.77247
wi2: 0.30603

Output 1

wi1: -2.49916

Bias: 0.17707

Id=7

v0: 47.26306

Bias: 33.63707

Input 3

wi1: 0.74844
Id=6

w8: 116.4825

w9: 16.02052
Bias: 12.00646

w5: 5.54757
w6: 45.11897
w7: 15.63847

w8: -65.86551

Input 3

Id=10

wi1: -1.94547
2

v0: 0

Id=9

wi2: -1.92941
wi3: -0.49038
Bias: -0.37927

Figura 4: Modelos de redes neuronales estimados para las estaciones Palmichal y Barinas.

Igualmente se calcularon las dimensiones de correlacin para los distintos valores de dimensin de inmersin m como sugieren Grassberger y Procaccia (1983) para monitorear si las series de precipitaciones
en Venezuela son generadas por un proceso determinstico (posiblemente con una conducta catica de
baja dimensin), o son generadas por un proceso puramente aleatorio. Dado que la dimensin de correlacin crece lentamente cuando m crece; entonces se concluye que la dimensin de correlacin alcanza
un lmite finito (se estabiliza) para algn m relativamente pequeo y se confirma que las series provienen
de un sistema catico de bajas dimensiones (ver la tabla 4).
Tambin se utiliz un mtodo para estimar los datos faltantes: primero se identifica la estructura del
sistema y luego se predice el dato faltante a travs de un modelo de redes neuronales. En el estudio
se demuestra cmo se utilizan los modelos de redes neuronales para predecir con series de tiempo que
tienen datos irregulares, y se observa que los modelos realizan una reconstruccin robusta, tomando en
consideracin la relacin espacio tiempo de las series de precipitacin mensual. Se realiz una seleccin
de modelos usando el criterio de informacin de Bayes (BIC) modificado. En las dos ltimas columnas
de la tabla 3 se puede observar el nmero de neuronas ocultas de la red seleccionada de acuerdo al BIC
mnimo para cada estacin; en la mayora de las estaciones es suficiente utilizar entre 2 y 10 neuronas
ocultas para alcanzar el BIC mnimo. Se estim el error cuadrtico medio para validar el modelo (ver la
tabla 6), obtenindose un resultado favorable.
Agradecimientos
Agradecemos a los revisores annimos por las sugerencias aportadas para mejorar el manuscrito. Tambin agradecemos al servicio de meteorologa de la Fuerza Area Venezolana, por proveer los datos que
sirvieron de insumo para este trabajo. Est investigacin fue parcialmente financiada por Consejo de
Desarrollo Cientfico y Humanstico, proyecto CDCH 2006-003 y la partida 407 ao 2007 de la Facultad
de Ciencias y Tecnologa de la Universidad de Carabobo.

68

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

Tabla 6: Porcentaje de datos faltantes ( % D.F.), mximo no de meses seguidos sin


datos (Mx. No MSSD), y Error Cuadrtico Medio (E.C.M.).
Estaciones climatolgicas
1 Puerto Ayacucho
2 Ciudad Bolvar
3 Santa Elena de Uairen
4 Tumeremo
5 Maturn
6 Temblador
7 Porlamar
8 Cumana
9 Guiria
10 Barcelona
11 Maiqueta
12 La Carlota
13 Colonia Tovar
14 Maracay
15 Palmichal
16 Valencia
17 San Juan de los Morros
18 Calabozo
19 San Fernando de Apure
20 Carrizal
21 Valle de la Pascua
22 Barquisimeto
23 Acarigua
24 Guanare
25 Barinas
26 Guasdualito
27 Valera
28 La Caada
29 El Viga
30 Mrida
31 Coln
32 San Antonio del Tchira
33 Santo Domingo
34 Maracaibo
35 Mene Grande
36 Coro

% D.F.
0
1.39
0
0
0
0
1.60
1.96
0
0
0.29
0
0.83
0
3.21
0
5
3.79
0.28
1.39
0
0
0
0
5.13
1.67
1.39
1.81
5.56
0
1.67
0
0.44
0
0
0

Mx. No MSSD
0
5
0
0
0
0
5
4
0
0
1
0
2
0
5
0
9
5
1
2
0
0
0
0
8
6
3
5
6
0
6
0
1
0
0
0

E.C.M.
4.222443e-05
1.693798e-04
1.012215e-04
2.007012e-04
1.400038e-04
1.910639e-04
2.904363e-04
3.849126e-04
2.501404e-04
3.374555e-04
5.057795e-04
2.332757e-04
8.123605e-05
1.634572e-04
6.945575e-05
1.443705e-04
1.037940e-04
5.145656e-05
5.895692e-05
7.978169e-05
1.370228e-04
5.878364e-04
8.826145e-05
6.799884e-05
7.589839e-05
6.425630e-05
1.295379e-04
3.009307e-04
6.141848e-05
1.056390e-04
1.111680e-04
2.751172e-04
1.453688e-05
3.054179e-04
1.475209e-04
6.995349e-04

Bibliografa
Abdelaal R, Elhadidy M (1995): Modelling and forecasting the daily maximum temperature using adductive machine learning. Wea. Forecast, 10:310-325.
Akaike H (1974): A new look at the statistical model identification. IEEE Transactions on Automatic
Control, 19:716-723.
Amaro I, Demey J, Macchiavelli R (2004): Aplicacin del anlisis r/s de hurst para estudiar las propiedades fractales de la precipitacin en Venezuela. Interciencia, 29:617-620.
Bishop, C (1995): Neural Networks for pattern recognition. Oxford University Press, Oxford.
Brock W, Dechert W, Scheinkman J (1991): A test for independence base do the correlation dimension.
Working paper, Universidad de Chicago.

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

69

Brock W, Hsieh D, Lebaron, L (2007): Nonlinear dynamics, chaos and instability. Statistic theory and
econometric evidence, MIT press, Cambrige.
Castejon M, Ordieres J, Vergara E, Martinez de Pinson J, Perna A, Alba F (2007): The A MORE flexible
neural network Package. http://www.r-project.org
Cheng B, Titterington D (1995): Neural Networks a review from a statistical perspective with discission.
Statistical Science, 9:2-54.
De Lima P (1996): Nuisance parameter free properties of correlation integral based statistics. Econometric Review, 15:237-259.
Dennis J, Schnabel R (1983): Numerical Methods for Unconstrained Optimization and Nonlinear Equations. Prentice-Hall, Englewood Cliffs, NJ.
Di Narzo F (2007): The RTisean Package, interface to Tisean algorithms. http://www.r-project.org
Di Narzo F (2005): The tseries Chaos Package, for analysis of nonlinear time series. http://www.rproject.org
Ellson J, Gasner E, Koren Y, Koutsofios E, North S, Woodhull G (2007): Graphviz-Graph Visualization
Software. http://www.graphviz.org
Enke W, Spekat A (1997): Downscaling climate model outputs into local and regional weather elements
by classification and regression. Climate Research, 8:195-207.
Fletcher R (1987): Practical Methods of Optimization, Unconstrained Optimization. Wiley, New York.
Fraser A, Swinney H (1986): Independent coordinates for strange attractors from mutual information.
Physsical Rev., A(33), 1134.
Gill P, Murray W, Wright M (1981): Practical Optimization. Academic Press, London.
Grassberger P, Procaccia I (1983): Characterization of strange attractors. Physical Review Letters, 50:346349.
Hegger R, Kantz H, Schreiber T (1999): Practical implementation of nonlinear time series methods, The
TISEAN package, arXiv:chao-dyn, 9, 413.
Hornik K, Stinchcombe M, White H (1989): Multilayer Feedforward Networks are Universal Approximators. Neural Network, 2:359-366.
Kalogirou S, Neocleous C, Michaelides S, Schizas C (1997): A time series reconstruction of precipitation
records using artificial neural networks. Proceedings of the EUFIT97 Conference, Aachen, Germany,
3:2409-2413.
Kantz H, Schreiber T (2005): Nonlinear time series analysis. Cambridge University Press, Cambridge.
Kennel M, Brown R, Abarbanel D (1992): Determining embedding dimension for phase space reconstruction using a geometrical construction. Physical Rev., 45:3403-3411.
Kutzbach JE (1967): Empirical eigenvectors of sea-level pressure, surface temperature and precipitation
complexes over North America. Jour. Appl. Meteor., 6:791-802.
Le Cun Y (1985): Une procdure de apprentissage pour rseau seuil asymtrique. Procceding of cognitiva.
Lucio P, Conde F, Cavalcanti I, Serrano A, Ramos A, Cardoso A (2007): Spatiotemporal monthly rainfall
reconstruction via artificial neural network case study: south of Brazil. Advances in Geosciences, 10:6776.

70

R EVISTA DE C LIMATOLOGA , VOL . 8 (2008)

Mantilla M, Rodrguez J, Sanz B (2001): El Test BDS: Posibles Limitaciones. Actas IX Jornadas ASEPUMA, Las Palmas de G.C., julio de 2001.
http://eco-mat.ccee.uma.es/asepuma/laspalmas2001/laspalmas/Invo14.pdf
Michaelides S, Neocleous C, Schizas C (1995): Artificial neural networks and multiple linear regression
in estimating missing rainfall data. Proceedings of the DSP95 International Conference on Digital Signal
Processing, Limassol, Cyprus, pp. 668-673.
Nychka H, Ellner S, Gallant A, McCaffrey D (1992): Finding Chaos in noise systems. Journal of the
Royal Statistical Society, Series B, 54:399-426.
Parker D (1985): Learning Logic. MIT center for computational research in economics and management,
science, Technical Report 47.
Press W, Flannery B, Teukolsky S, Vetterling W (1986): Numerical Recipies: The Art of Scientific Computing, Cambridge University Press, pp. 523-528.
Ripley B (1994): Neural networks and related methods for classification (with discussion). Journal of
the Royal Statististical Society, Series B, 56:409-456.
Ripley B (1996): Pattern Recognition and Neural Networks. Cambridge University Press, 403 pp.
Rumelhart D, McClenlland J (1986): Parallel distributed processing. MIT Press, Cambridge, Ma.
Sauer T, Yorke JA, Casdagli M (1991): Embedolgy. Journal of Statistical Physics, 65:579-616.
Schizas C, Pattichis C, Michaelides S (1994): Forecasting minimun temperature with short time length
data using artificial neural networks. Neural Network World, 94:219-230.
Takens F (1981): Detecting strange attractors in turbulence. In: Rand DA, Young LS (Eds.), Dynamical
Systems and Turbulence, Lecture Notes in Mathematics, 898:366-381, Springer-Verlag.
Takens F (1985): On the numerical determination of the dimension of the attactor. In Dynamical Systems
and Bifurcations, Lecture notes in mathematics, 1125:99-106, Springer-Verlag.
Trapletti A (2008): The tseries Package, for analysis of time series and computational finance.
http://www.r-project.org
Wilby R, Wigley T (1997): Downscaling general circulation model output: a review of methods and
limitations. Progress in Physical Geography, 21:530-548.
Wolf R, Swift J, Swinney H, Vastano A (1985): Determining lyapunov exponents from a time series.
Physica, D-16:285-317.
Zhang G, Patuwo BE, Hu MY (1998): Forecasting with artificial neural networks: The state of the art.
International Journal of Forecasting, 14:35-62.

También podría gustarte