Está en la página 1de 13

REVISTA PERUANA GEO-ATMOSFRICA RPGA (2), 76-88 (2010)

www.senamhi.gob.pe\rpga
Editado por el Servicio Nacional de Meteorologa e Hidrologa del Per
RPGA-Autor(es)

Reconstruccin de datos faltantes de precipitacin pluvial diaria mediante la


Transformada Wavelet

Daily rainfall data-gap filling using a Wavelet Transform-based methodology

MARIELLA CARBAJAL CARRASCO1, 2, CHRISTIAN YARLEQU1, ADOLFO


POSADAS1, 3, ELIZABETH SILVESTRE4, ABEL MEJA2 & ROBERTO QUIROZ1,*

1
Divisin de Sistemas de Produccin y Ambiente, Centro Internacional de la Papa, Av. La Molina 1895, Lima 12, Per
2
Universidad Nacional Agraria La Molina, MRH-EPG-UNALM, Av. La Molina s/n, La Molina, Lima 12, Per
3
EMBRAPA, Rua XV de Novembro, 1452, Sao Carlos, SP, CEP 13560-970, Brasil
4
Servicio Nacional de Meteorologa e Hidrologa, SENAMHI, Castilla 1308, Lima 11, Per.
*r.quiroz@cgiar.org
Resumen Abstract
Se describe la aplicacin de un nuevo mtodo para This paper describes the application of a new
la completacin de datos faltantes de precipitacin wavelet transform-based method to fill data
diaria utilizando la Transformada de Wavelets gaps in daily rainfall signals. Complete rainfall
(TW). Series completas de datos de precipitacin di- gauge data from six weather stations located in
aria para los perodos 1999-2000, 2003-2004, 2004- the high plateau of Peru, spanning the periods:
2005, seis estaciones meteorolgicas del altiplano 1999-2000, 2003-2004, 2004-2005 were used
peruano fueron utilizadas en el anlisis. El proceso for the study. The process entailed the decom-
consisti en la descomposicin y reconstruccin de position and reconstruction of the signal at two
la seal, a dos niveles, usando el Wavelet Haar. El levels using the wavelet Haar. The software de-
programa desarrollado utiliza la seal que resulta del veloped utilizes the low-pass signal from the
filtro de baja frecuencia, proveniente de la estacin target weather station and the high-pass signal
a ser corregida y el detalle o seal de alta frecuencia from a neighbor weather station which confer the
proveniente de una estacin vecina, la que propor- random element to the reconstruction of a daily
ciona el detalle aleatorio que se usa en el llenado de signal to fill in the data gaps. The selection of the
datos faltantes. La seleccin de la estacin vecina neighbor weather station was based on the simi-
se bas en la similitud de la distribucin acumulada larity of the standardized cumulative distribu-
de ambas seales previamente estandarizadas. El tion function of both signals. The procedure was
procedimiento se valid generando vacos aleato- validated by generating random data gaps, fill-
rios, llenando stos con la transformada de Wave- ing the gaps with the wavelet transformed (WT)
lets o el generador de datos climticos ClimGen y method or the standard ClimGen software and
comparando las seales reconstruidas con la seal comparing the reconstructed signals to the full
original sin alteracin en todos los casos. Son com- signal prior to the generation of the data gaps. In
probados en todos los casos, el mtodo basado en la all cases, the WT method produced slightly bet-
TW produjo mejores coeficientes de determinacin ter determination coefficients than the standard
que ClimGen. La prueba Kolmogorov-Smirnov ClimGen method. The Kolmogorov-Smirnov
constat que las seales reconstruidas y originales test confirmed that the original and reconstructed
son similares. Otros estimadores estadsticos de las signals were similar; as other statistical estima-
distribuciones tambin fueron similares. El mtodo tors of the time series did too. The WT method
basado en la TW, parece ser el ms apropiado para proposed in this paper seems to be a more suita-
la completacin de datos diarios de precipitacin ble alternative for filling daily rainfall data gaps
ya que, adems de producir datos muy prximos since it provided a closer approximation to the
a los reales, la generacin de los parmetros para original data with the plus that it requires much
la reconstruccin requiere de pocos datos en com- less data than standard methods to estimate the
paracin con los mtodos convencionales. required generating parameters.
Palabras claves: Precipitacin Pluvial; descom- Keywords: Rainfall; Decomposition; Recon-
posicin; reconstruccin; Transformada Wavelet; struction; Wavelet Transform; ClimGen.
ClimGen.

76
Autor(es)-RPGA
RECONSTRUCCIN DE DATOS FALTANTES DE PRECIPITACIN PLUVIAL DIARIA

INTRODUCCIN ella datos ausentes en la serie real. La


validacin cruzada de la tcnica
La precipitacin pluvial es una variable propuesta para la reconstruccin de datos
climtica de gran importancia para los faltantes se realiz con las mismas seis
sistemas hidrolgico, agrcola, industrial estaciones del Altiplano y se compar con
y energtico. El entendimiento de su com- los resultados obtenidos con el generador de
portamiento temporal y espacial es de sumo datos climticos ClimGen (Nelson, 2002).
inters, especialmente en los estudios de
riesgos climticos, donde la disponibili- MATERIALES
dad de informacin de alta resolucin y de
buena calidad es esencial. rea de Estudio
El Altiplano peruano est ubicado
En el Per, la informacin sobre precipi- alrededor del Lago Titicaca, entre las
tacin pluvial diaria es escasa e incom- coordenadas 151359 S; 70215O;
pleta (Giddings & Soto, 2006), lo que 68344 E y 16 58 18 S (Ver Fig. 1).
limita la capacidad de anlisis de riesgos de La altitud de esta regin vara entre los
dficit hdricos en agricultura de secano 3800 y los 4500 metros (m) sobre el nivel
y a su vez constituye una fuente adicional del mar. La precipitacin pluvial vara de
de error cuando se modelan los balances <400 hasta 600 mm por ao; en promedio
hidrolgicos (Giddings & Soto, 2006). la temperatura mnima desciende hasta
10C y las sequas pueden durar hasta 150
Este inconveniente nos lleva a buscar das (d) por ao. El uso predominante de la
alternativas de solucin en muchos tierra es de pastizales con reas cultivadas,
modelos de la literatura, los cuales principalmente cerca al lago (Quiroz et al.,
segn sus autores son capaces de generar, 2003).
completar o interpolar datos de
precipitacin y otras variables climticas, La actividad convectiva y la precipitacin
utilizando para ello diferentes mtodos en el Altiplano ocurren casi exclusiva-
como los modelos regresivos univariados mente durante el verano austral (diciembre-
y multivariados (Sveinsson et al., 2007), la marzo) y estn asociadas con la
interpolacin con Kriging (Wackernagel, expansin estacional de los vientos del Este
2003), etc. Cada uno de estos modelos superior y relacionadas con la afluencia de la
tiene sus limitaciones segn el mtodo que humedad cercana a la superficie
aplique y el nmero de entradas continental de las tierras bajas del Este
disponibles. (Vuille & Keiming, 2004).

En este contexto, el presente trabajo La variacin de precipitacin est tambin


propone la aplicacin de un nuevo relacionada con la proximidad al Lago
mtodo para completar datos medidos de Titicaca encontrndose los valores ms
lluvia diaria, en base a la transformada altos cerca a ste. Los estudios corro-
Wavelet (TW). El mtodo de reconstruc- boran que ms lluvia cae sobre el lago
cin de precipitacin diaria con la TW ha Titicaca que sobre cualquier otro lugar del
sido desarrollado y validado por Quiroz et Altiplano. Durante la poca de lluvias el
al. (2010), Yarlequ (2009) y Yarlequ et flujo atmosfrico general es del sureste
al. (2007). Las pruebas de reconstruccin y las reas viento arriba del lago Titicaca
de datos climticos mostradas se realizaron (sureste del lago) tienden a ser ms secas
con la informacin de seis estaciones del que las reas viento abajo (Grace, 1985).
Altiplano peruano, localizadas en la pro-
vincia de Puno, definindose el trmino
reconstruccin como el proceso de
obtener una nueva seal y completar con

77
Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

Fig. 1. Estaciones meteorolgicas empleadas en el Estudio.

Data Meteorolgica parametrizacin del generador. Se


procedi luego a generar la data de toda
La data pluviomtrica diaria de seis estaciones la serie de tiempo. Finalmente se extrajo la
meteorolgicas fue obtenida del Servicio data del perodo de anlisis (Tabla 1) para su
Nacional de Meteorologa e Hidrologa del posterior comparacin con los resultados
Per (SENAMHI). La ubicacin geogrfica obtenidos con el mtodo de la Transformada
de las estaciones climticas se muestra en la Wavelet.
Fig. 1, y los periodos de anlisis de los datos
observados se detallan en la Tabla 1. La data Transformada Wavelet (TW)
fue pre procesada (anlisis no mostrado) para
verificar su consistencia mediante la tcnica La TW es una tcnica matemtica introducida
de doble masa (Unesco/Rostlac, 1982; Dunne en el anlisis de seales en los primeros aos
& Leopold, 1978). de la dcada de 1980 (Mallat 1999; Prasad &
Iyengar, 1997). La TW se encuentra definida
Cabe mencionar que para la reconstruc- en un dominio de tiempo y escala (frecuen-
cin o completacin de datos con el cia), y posee un soporte compacto (Foufoula-
mtodo de la Transformada Wavelet el nmero Georgiou & Kumar, 1994). Esto permite
de datos utilizado fue el mismo que el estudiar series de tiempo con una resolucin
periodo de anlisis. Por otro lado, con el definida por la escala; esto es, estructuras
generador ClimGen se utiliz un generales en la seal en una escala grande
registro de 27 a 42 aos dependiendo de la (baja resolucin) y finas estructuras en
data disponible de cada estacin para la escalas pequeas (alta resolucin). Esta
caracterstica es especialmente til para

Tabla 1. Ubicacin y perodo de anlisis de las estaciones meteorolgicas en el Altiplano peruano.


Latitud Longitud Altitud
N Estacin Periodo de anlisis
S 0 (msnm)
1 Cabanillas 153838 702019 3890 01-12-1999 /02-02-2000 (64
2 Maazo 154848 702020 3920 das)
3 Ilave 160505 693837 3850 11-11-2003 /17-03-2004 (128
4 Tahuaco 161818 690403 3860 das)
5 Arapa 150808 700707 3920 11-11-2004/ 17-03-2005 (128
6 Huancan 151212 694545 3880 das)

78
Autor(es)-RPGA
RECONSTRUCCIN DE DATOS FALTANTES DE PRECIPITACIN PLUVIAL DIARIA

variaciones espaciales que son no- Aqu >0 representa la variable de


estacionarias, y que poseen componen- escala (o ancho de la funcin Wavelet) y la
tes que trascienden con una corta duracin, variable de translacin (ubicacin de la funcin
con estructuras en diferentes escalas, o que Wavelet). La funcin (t) es la conocida
poseen singularidades, las cuales son ideales Wavelet Madre o Wavelet, que es utiliza-
para mostrar pequeas fluctuaciones en las da para que sean ptimamente localizados
seales (Posadas et al., 2005). Debido a esta los valores de la transformada en el tiempo
propiedad, el anlisis con la TW tiene muchas (espacio) y en distintas escalas (frecuencias).
aplicaciones, en dinmica de fluidos (Farge,
1992; Gao & Li, 1993; Liu, 1994, Katul & El operador Inverso de la Transforma Wavelet
Vidakovic, 1996), geofsica o hidrologa (IWT) es definido como (Foufoula-Geourgiou
(Kumar & Foufoula-Georgiou, 1993; Labat et & Kumar, 1994):
al., 2000).

La TW es una tcnica fsica-


matemtica (Graps, 1995), que describe
la seal en estudio por intermedio de sus
coeficientes, los que a su vez describen la
diversidad de cambios ocasionados por
eventos (singularidades) locales (Kumar & Para mayor informacin acerca de las
Foufoula, 1997). La TW no es una tcnica propiedades de la TW y el ITW, el
meramente estadstica, que requiera un gran lector puede revisar los trabajos recopilados
nmero de datos, sino que ella representa la en Foufoula-Geourgiou & Kumar (1994).
descomposicin de una seal en diferentes
niveles de resolucin, proceso conocido como Con el fin de construir algoritmos eficientes
multiresolucin. El uso de una represen- para calcular la TW, se realiza la discre-
tacin multiresolucin ofrece un marco tizacin del parmetro de escala y del
jerrquico simple para interpretar la parmetro de traslacin t, lo que produce la
informacin contenida en la seal. A diferentes Transformada de Wavelet Discreta (y la
resoluciones, los detalles de una seal general- inversa en su forma discreta). La
mente caracterizan diferentes estructuras fsi- seleccin de = 2m y t = n2m, resulta en una
cas de ella. A una resolucin ms gruesa, estos representacin discreta ortogonal
detalles generalmente caracterizan las grandes (Foufoula-Geourgiou & Kumar, 1994;
estructuras que su entorno contiene. Daubechies, 1988).
Con un aumento de la resolucin obtenemos
detalles ms finos. As, la TW puede ser Anlisis de Multiresolucin (AMR) con la
discreta o continua: TW

La TW se define como la convolucin de El AMR (Mallat, 1989) proporciona un tipo


una funcin f, con una funcin de onda de descomposicin y reconstruccin de una
(Wavelet) como Kernel de la transformada seal en base a las propiedades de la TW (e
(Foufoula-Geourgiou & Kumar, 1994): ITW), en su forma discreta. Para una informa-
cin detallada, los autores recomiendan revisar
la siguiente documentacin (Mallat, 1999;
Foufoula-Geourgiou & Kumar, 1994).
(1)
En trminos generales, seleccionando
donde: una cierta funcin Wavelet Ortogonal
(Foufoula-Geourgiou & Kumar, 1994), es
posible obtener una descomposicin de la
(2) funcin f como:

79
Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

y as es posible obtener caractersticas


(5) singulares en diferentes escalas de estudio.
En general, la relacin entre los coeficientes
Aqu AN es llamado el coeficiente de aproxi- de tendencia y detalle en dos niveles de
macin o seal de tendencia; DN es el descomposicin (o reconstruccin) est
coeficiente de detalle o seal de detalle; y definido como:
N indica el nivel del proceso de descom-
posicin (o reconstruccin), donde la escala (7)
vara creciente o decrecientemente,
respectivamente (Foufoula-Geourgiou & donde: N indica el nivel de descomposicin
Kumar, 1994). Las caractersticas y diferencias (o reconstruccin) o escala del proceso. Esta
entre estas dos nuevas seales resultan del ecuacin (7) de AMR muestra que para
tipo de frecuencias que contiene cada una obtener la seal AN, a una escala menor (mayor
de ellas. En A se tienen las frecuencias ms desagregacin) N-1, es necesaria la
bajas de f, donde aparecen las frecuencias de los informacin extra (DN). As AN-1 viene a
componentes estacionarios, peridicos y ser la nueva seal A en la escala N-1. Este
cclicos, mientras que en D aparecen las seales proceso es conocido como Downscaling y es
de alta frecuencia existentes en la seal f; equivalente al proceso de reconstruccin de
frecuencias que describen la variabilidad, AMR (Figura 2b), y el proceso inverso es
perturbacin y el ruido existente en la data. equivalente al proceso de descomposicin
En el presente trabajo las seales A y D, son (donde se generan los DN, Figura 2a). En la
nombrados como Tendencia y Ruido. figura 2, R es equivalente a A, la nica
Posteriormente, se puede realizar la misma diferencia es que A se obtiene de un proceso
descomposicin para la seal A1, obteniendo: de descomposicin y R de un proceso de
reconstruccin.

(6)

Fig. 2. Proceso AMR. a) Descomposicin o proceso de Up-scaling. b) Reconstruccin o proceso


de Downscaling. La funcin Wavalet Madre () para ambos procesos es la misma. N=0, 1, 2 es
el nivel del proceso (aqu se define la escala como =2N y f es la escala asociada a la funcin ).

80
Autor(es)-RPGA
RECONSTRUCCIN DE DATOS FALTANTES DE PRECIPITACIN PLUVIAL DIARIA

Generador de datos climticos ClimGem MTODOS

El ClimGen es un generador de datos Generacin de vacos de informacin


climticos a escala diaria, basado en aleatorios
correlaciones y regresiones (Nelson, 2002). Para simular la ausencia de datos
Este generador fue desarrollado por el observados (vacos) en las estaciones N 1, 3 y
Departamento de Ingeniera de Sistemas 5 (Tabla 1) se generaron vacos en posiciones
Biolgicos de la Universidad Estatal de aleatorias, segn el porcentaje de vacos
Washington, y es un software de libre deseado. En cada caso (Cabanillas, Ilave y
acceso en la Web (www.bsyse.wsu.edu/ Arapa) se gener un total de 25% de datos
climgen/ClimGen/index.html), requiere faltantes en relacin con el total de datos.
de series diarias para calcular los
parmetros a utilizar en el proceso de Estudio de la informacin de vacos
generacin. Las variables climticas El estudio de vacos consiste en determinar
que genera son precipitacin pluvial, el porcentaje de datos faltantes en las series
temperatura, radiacin solar, entre otras temporales estudiadas, para as seleccionar
variables. el nivel de descomposicin que se requiere
para iniciar el proceso de reconstruccin.
En el caso de precipitacin diaria, la Dicho porcentaje es calculado en distintas
reconstruccin est basada en dos escalas (o niveles de descomposicin de
supuestos: primero, que la condicin de la base de la funcin Wavelet de Haar (n))
lluvia en un cierto da i, se relaciona y posiciones. El anlisis de ausencia de
con la condicin de lluvia en el da i-1 informacin en una vecindad de cada 2N
(Cadena Markov); segundo, que la cantidad datos, dado por (Nmero de Vacos)*100/2N,
de lluvia en los das lluviosos est descrita determin que el nivel ms adecuado para la
por una funcin de distribucin adecuada, reconstruccin era N = 2. Por lo cual, de cada
en cada mes. Los valores diarios de dichas 4 datos analizados el porcentaje de vacos
probabilidades son interpolados usando puede ser 0, 25, 50, 75 y 100% dependiendo
funciones spline, siendo el requerimiento si hay 0, 1, 2, 3 y 4 datos faltantes. Este nivel
mnimo para poder generar datos con el fue seleccionado considerando un umbral no
ClimGen un registro histrico de mayor a 25% para la mayora de vecindades,
por lo menos 25 aos (continuos, no es decir de donde se pueda obtener una
necesariamente completos). tendencia representativa para la posterior
reconstruccin, asimismo es importante
El ClimGen es uno de los programas tratar de preservar el nivel de detalle y
computacionales ms empleado y conocido trabajar con escalas menores.
para generar datos diarios, por ello ha sido
utilizado como referente para evaluar la Modelo de reconstruccin de la funcin
metodologa propuesta para la Wavelet
reconstruccin de datos de precipitacin Una vez determinado el nivel N, donde se
diaria en las estaciones y periodos de estudio. cumple la condicin de minimizar la prdida
En este caso, se generaron parmetros y de informacin en las series no completas en
nuevas series en cada estacin a partir de una cierta escala o intervalos de anlisis en
registros pluviomtricos (incompletos) de toda la serie, se procede a reconstruir con la
entre 27 y 42 aos en funcin de la data Transformada Wavelet.
existente y luego se complet la serie
incompleta con los valores generados para El modelo de reconstruccin se inicia con
los das sin informacin. la normalizacin o estandarizacin de las
seales (ecuacin 8, Nakken, 1999) con el
objetivo de convertir los datos de las seales
en adimensionales y llevarlos a una misma

81
Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

escala (valores entre 1 y 1, con media 0 y comprobando previamente la similitud entre


desviacin estndar 1) para poder trabajar sus seales estandarizadas. Dicho modelo de
con ellos. Este procedimiento es realizado reconstruccin as como otros procedi-
solo para los valores correspondientes a mientos tiles para el anlisis de datos fueron
condiciones de lluvia (mayores a 0). programados en el software de clculo
matemtico Matlab.
(8)
A continuacin se describe el algoritmo de
reconstruccin:
Con las seales estandarizadas se procede a
determinar la tendencia de la estacin a 1. Seleccionar dos estaciones vecinas, una
completar y a extraer la variabilidad a con vacos (f) y la otra completa (g), de una
heredar de la estacin de apoyo en la escala N. La misma familia de distribucin y con indicadores
tendencia se obtiene dividiendo la seal en climticos similares.
particiones de 2N y calculando el promedio 2. Estandarizar las seales f y g siguiendo la
de los valores observados en cada particin metodologa descrita por Nakken (1999).
(sin considerar en el promedio los vacos) 3. Descomponer la seal como en las ecuaciones
resultando una nueva seal del tipo de las seales 3 y 4, hasta un cierto nivel de descomposicin N,
de tendencia A1N (Fig. 2), cuyo nmero de escogido segn la cantidad de vacos existentes
datos ser: (longitud de la seal original)/2N. en f.
La variabilidad es extrada con la Transfor- 4. Promediar los valores de f en el nivel N,
mada Wavelet (filtro Haar, ya que reduce la cada 2N datos. Esto debe corresponder a una
distorsin de los datos, segn Das & Mohanty, aproximacin de A, por lo que se toma este
2008) al descomponer la seal completa hasta resultado como la tendencia en la reconstruccin
el nivel N, generando las seales A2N y D2N para (en lugar de A utilizamos el ponderado de f cada
todo N=1,2 Luego se procede a reconstruir 2N vecindades).
como se muestra en la Fig. 2, pero a partir del 5. Tomar la tendencia de f (obtenida en 4) en
nivel N, se toma la tendencia A1N y los detalles el nivel N y todos los ruidos de g de todos los
D2N con N=N, (N-1) 1. Posteriormente, se niveles N,(N-1),..., 1.
realiza el proceso contrario a la estandarizacin 6. Realizar el proceso inverso de la
de los datos correspondientes a das lluviosos, y se estandarizacin de la parte dos y obtener la seal
eliminan los posibles errores por negatividad en h.
la seal reconstruida e inexistencia de ruido en la 7. Los valores faltantes de la seal f son
seal vecina. Los errores en el primer caso son reemplazados por los valores que se generaron
debido a la matemtica utilizada en la obtencin en el proceso de reconstruccin de la seal h.
de tendencias y ruidos a diferentes escalas, y los
errores en el segundo caso se dan cuando la seal Mtodos de Validacin
vecina registr un da sin lluvia, pero la tenden-
cia en la escala de descomposicin presenta Las pruebas comparativas con los datos
valor positivo producto de su clculo. Ambos observados completos son importantes para
errores son reemplazados con cero. Finalmente, la verificacin de los datos modelados, tanto
se completan los datos faltantes en la seal con el mtodo de Transformada Wavelet como
original, reemplazndolos con los valores los modelados con el ClimGen. Se verific la
recprocos de la seal reconstruida. similitud entre estadgrafos de las seales
reconstruidas con la seal original (anlisis
El mtodo propuesto para reconstruir datos no mostrado). Se evalu la bondad de ajuste
faltantes en una seal de precipitacin entre cada seal modelada y la seal
pluvial diaria consiste en combinar completa, mediante el coeficiente de
informacin de la estacin incompleta (que determinacin (R2) y la prueba de Kol-
se requiere completar) con informacin de mogorov-Smirnov; asimismo se utiliz el
otra estacin cercana (estacin de apoyo), RMSE (Raz del error medio cuadrtico) y el

82
Autor(es)-RPGA
RECONSTRUCCIN DE DATOS FALTANTES DE PRECIPITACIN PLUVIAL DIARIA

MAE (Error Absoluto Medio), indicadores no RESULTADOS


probabilsticos de predicciones para variables
continuas (Wilks, 2006). Adicionalmente, se Similitud de Patrones en el Altiplano
analiz la diferencia porcentual de entropas Las reconstrucciones de las seales de
entre reconstrucciones con la hiptesis de que lluvia diaria en el Altiplano peruano se
cuando la diferencia tiende a cero las seales realizaron luego de estudiar y encontrar un
se rigen por la misma ley dinmica (Feng & patrn similar de comportamiento a diferentes
Tse, 2008). Finalmente, se realiz un anlisis magnitudes y dispersiones en la mayora de
residual por cada reconstruccin. estaciones. Dicho anlisis se realiz mediante

(a)

(b)

(c)

Fig. 3. Datos observados (lnea continua) y datos reconstruidos con las tcnicas de reconstruccin
de la TW (lnea discontinua) y generador de datos ClimGen (lnea punteada) para a) Cabanillas, b)
Ilave y c) Arapa.

83
Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

la prueba de Kolmogorov-Smirnov, La prueba de Kolmogorov-Smirnov


comparando las seales diarias muestra que las distribuciones de los
estandarizadas (anlisis de 28 estaciones, no datos reconstruidos con TW y ClimGen
mostrado), habindose encontrado mayor son equivalentes a la distribucin de los
similitud entre estaciones cercanas. datos observados (Tabla 2. D: mxima
desviacin vertical entre distribuciones
Reconstruccin de Seales acumuladas).

Luego de aplicado el modelo Wavelet y el La diferencia porcentual de entropa de


Generador ClimGen se completaron los datos las seales indica que ambos mtodos de
ausentes (producto de la generacin de vacos reconstruccin dan resultados que se
aleatorios) y se obtuvieron las siguientes asemejan a los medidos. Cuando la
seales completadas (Ver Fig. 3). diferencia entre los mtodos fue mayor al
5%, el mtodo de la reconstruccin con la
En todos los casos los valores de TW present una menor diferencia con la
coeficiente de determinacin (0.82, 0.86 seal medida.
y 0.77), correspondientes a las series
reconstruidas con la tcnica de la TW, Anlisis residual
fueron superiores (p <5%) a los obtenidos
con las reconstrucciones con el generador Los estadgrafos calculados y los test
ClimGen (0.70, 0.71 y 0.40). Los resultados estadsticos realizados entre los valores
estadsticos de la comparacin entre datos observados y los valores reconstruidos con
reales y datos reconstruidos se muestran en la tcnica de la TW y el generador ClimGen
la Tabla 2. Los estadgrafos de las seales muestran que las seales reconstruidas son
reconstruidas en ambos casos (media, similares a la seal observada. Sin embargo,
desviacin estndar, coeficiente de es importante conocer la proporcin de los
asimetra, curtosis) no muestran errores respecto a las observaciones mediante un
diferencias estadsticamente significativas anlisis residual. Se determinaron los
(Tabla 2). residuales para los tres casos (Fig. 4),
encontrndose en todos los casos que la
Las medidas de precisin de los modelos reconstruccin con ClimGen tiene mayor
(MAE y RMSE) indican que en todos los cantidad de residuales que se encuentran
casos el modelo Wavelet complet los fuera del intervalo de confianza y que en su
datos ausentes con menor error, sin mayora son de mayor magnitud. El 95.5% de los
embargo segn el BIAS se sobreestimaron residuales estn comprendidos dentro del
ligeramente algunos de los valores reales, intervalo [+2s, -2s], donde es la media del
mientras que la completacin con ClimGen residual y s es la desviacin estndar residual.
subestim en menor medida dichos valores.

Tabla 2. Comparacin Estadstica de las Reconstrucciones.


Estacin Reconstruida R2 MAE RMSE BIAS p-value* D* H%
TW 0.82 1.14 2.90 0.05 1.00 0.08 3.94
Cabanillas
ClimGen 0,70 1.27 3.70 0.11 1.00 0.08 10.57
TW 0.86 0.74 2.40 0.06 0.99 0.07 0.55
Ilave
ClimGen 0.71 1.31 3.70 0.03 1.00 0.00 1.10
TW 0.77 0.63 2.20 0.10 1.00 0.07 3.12
Arapa
ClimGen 0.40 1.19 3.90 -0.06 1.00 0.06 2.33

Tabla 3. Valores de estadgrafos principales del anlisis residual.


Cabanillas Ilave Arapa
TW ClimGen TW ClimGen TW ClimGen
Media residual 0.22 0.46 0.23 0.13 0.27 0.16
s residual 2.96 3.74 2.44 3.70 2.17 3.96

84
Autor(es)-RPGA
RECONSTRUCCIN DE DATOS FALTANTES DE PRECIPITACIN PLUVIAL DIARIA

Fig. 4. Anlisis residual de las reconstrucciones con la TW (o) y ClimGen (), de: a) Cabanillas, b)
Ilave y c) Arapa. Se muestran intervalos de confianza del 95.5% de los datos residuales, con la tcnica
de la TW (lnea horizontal negra) y ClimGen (lnea horizontal gris).

Los valores residuales de las sin embargo las desviaciones estndares


reconstrucciones se encuentran distribui- reflejan una mayor dispersin del error e
dos normalmente con media cercana a cero intervalos de confianza ms amplios en las
para todas las reconstrucciones realizadas, reconstrucciones con ClimGen.

85
Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

DISCUSIN DE RESULTADOS los dems casos. Sin embargo, la reconstruc-


cin con la TW no se ve afectada en ninguno
La TW est basada en principios fsico- de los casos indicados anteriormente, ya que
matemticos que estn asociados al proceso el mtodo TW propuesto utiliza la variabilidad
de la seal, siendo por lo tanto independiente de otra estacin que tiene patrones similares
de la cantidad de informacin utilizada en (misma aleatoriedad), en un mismo tiempo
el proceso de anlisis (reconstruccin). Esto (Ver Fig. 3).
no ocurre con una tcnica estadstica clsi-
ca, donde se infieren los parmetros proba- En el presente trabajo se utilizaron series de
bilsticamente de una muestra representativa precipitacin diarias que presentan una alta
del proceso. Esto convierte a la TW en una variabilidad lo que las hace difcil de modelar.
herramienta muy til para este tipo Esta variable, a nivel diario en comparacin
de procesos. Esta ventaja permiti las con otras variables de menor ruido o mayor
reconstrucciones a partir de pocas estaciones escala temporal, no ha sido bien estudiada.
y un nmero reducido de datos. Tambin, las reconstrucciones a escalas de
tiempo mayores (como las mensuales) se
El perodo de anlisis de las tres seales van haciendo ms sencillas debido a que la
de lluvia diaria de las estaciones en precipitacin mensual (u otra variable climti-
estudio se seleccion teniendo en cuenta ca) es de carcter estacional y adems la
diferentes perodos y cantidad de datos, y la correlacin entre estaciones meteorolgicas
presencia de eventos extremos, para tratar de cercanas es por lo general muy alta.
observar diversos escenarios. Por ejemplo, la
Fig. 3a muestra 64 datos de la seal diaria de CONCLUSIONES
Cabanillas, que es una seal de bajas
frecuencias o baja variabilidad temporal La metodologa desarrollada permiti
(debido principalmente al poco nmero de completar series de precipitacin
datos). Por otro lado, las estaciones de Ilave diaria para tres estaciones meteorolgicas,
(Fig. 3b) y Arapa (Fig. 3c), de 128 datos cada obtenindose mejores resultados que con el
una, tienen un comportamiento de mayor generador ClimGen, segn los indicadores
variabilidad temporal (de altas frecuencias). En estadsticos, no probabilsticos y fsicos
el caso de Ilave, la seal muestra propiedades utilizados. En consecuencia, este modelo de
estacionales con una variabilidad temporal reconstruccin es una alternativa eficiente
creciente al inicio y decreciente en la parte para completar datos faltantes, cuando se
final; es decir, la seal sigue una cuenta con informacin del mismo periodo,
tendencia con pendiente positiva y luego en la misma escala temporal y con similares
negativa. Lo contrario se observa en Arapa, probabilidades de ocurrencia, proveniente de
que tiene una seal con mucho ruido y sin otra estacin cercana.
tendencia. Es as que el ruido en las seales
supone una mayor complejidad para su La reconstruccin es posible siempre y
modelamiento. En estos casos las seales cuando se demuestre que tanto la seal
diarias o con eventos climticos extremos incompleta como la seal de apoyo
(como El Nio), son poco modelables o los estandarizadas tienen la misma
resultados suelen ser poco reales y requieren probabilidad acumulada de ocurrencia para
de registros prolongados. Esto ltimo es un mismo intervalo de tiempo.
mostrado en la grfica de residuales y en los
valores del coeficiente de determinacin (R2), La tcnica de reconstruccin descrita es
obtenidos al comparar los valores observados aplicada a datos de lluvia diaria, no
versus los reconstruidos con ClimGen, los que obstante su aplicacin es de uso genrico para
son menores a los de la reconstruccin con la otras variables climticas a distintas escalas
TW. Para el caso de Arapa (seal con mucho temporales (horas, cada 2 das, semanal,
ruido), el valor de R2 es mucho menor que en quincenal, mensual, anual, etc.). Esta

86
Autor(es)-RPGA
RECONSTRUCCIN DE DATOS FALTANTES DE PRECIPITACIN PLUVIAL DIARIA

aplicacin genrica se basa en que el anlisis Tsinghua University Press and World Scientific
con la TW est influenciado por los eventos Publishing Co. Pte. Ltd., 218p.
locales, preservndose el aspecto temporal. Foufoula-Georgiou, E. & Kumar, P. (Eds.).
(1994). Wavelets in geophysics. Academic
Una ventaja de utilizar la tcnica de la TW Press, 373p.
es que no requiere periodos de informacin Gao, W. & Li, B.L. (1993). Wavelet analysis
pasados para su desarrollo (como s lo requiere of coherent structure at the atmosphere-forest
ClimGen y otros modelos); sin embargo, su interface. Journal of Applied Meteorology 32
eficiencia est asociada directamente a la (11), 1717-1725.
relacin que existe entre la variabilidad de Giddings, L. & Soto, M. (2006).
la estacin a reconstruir con la de alguna Participacin de Amrica Latina y del Caribe
otra estacin vecina y al porcentaje de datos en los Registros Globales Climatolgicos,
faltantes en cada particin de 2N datos, y no al GHCN. Interciencia: Revista de Ciencia y
tamao del registro histrico. Tecnologa de Amrica, 31(9), 632-637.
Goupillaud, P., Grossmann, A. & Morlet, J.
El anlisis conjunto de la TW y el AMR (1984). Cycle-octave and related transforms in
es una tcnica flexible que permite seismic signal analysis. Geoexploration 23 (1),
estudiar las series de datos y su variabilidad en 85-102.
diferentes resoluciones de manera dinmica. Grace, B. (1985). El clima del altiplano,
Es as como en las reconstrucciones con este departamento de Puno, Per. INIPA CIPA XV.
mtodo la presencia de eventos extremos y Estacin Experimental Salcedo.
singularidades se mantiene, al ser heredados Graps, A. (1995). An introduction to wavelets.
de la estacin cercana, como se verific en el IEEE Computational Science and Engineering
anlisis espectral. 2 (2), 50-61.
Grossmann, A. & Morlet, J. (1984).
Agradecimientos Decomposition of Hardy functions into square
integrable wavelets of constant shape. SIAM
A la Divisin de Sistemas de Produccin y Journal on Mathematical Analysis 15 (4), 723-
Ambiente del Centro Internacional de la Papa 736.
y al Servicio Nacional de Meteorologa e Jaffard, S. (2004). Wavelet techniques in
Hidrologa. Este trabajo fue financiado por el multifractal analysis, fractal geometry and
Proyecto ALTAGRO con fondos del CIDA- applications, In: AMS (Ed.), Proceedings of
Canad. Symposia in Pure Mathematics, Providence,
RI.
Katul, G. & Vidakovic, B. (1996). The
REFERENCIAS partitioning of attached and detached eddy
motion in the atmospheric surface layer
Das, N.N. & Mohanty, B.P. (2008). Temporal using Lorentz wavelet filtering. Boundary
dynamics of PSR-based soil moisture across Layer Meteorol, 77(2), 153-72.
spatial scales in an agricultural landscape Kumar, P. & Foufoula-Georgiou, E. (1993).
during SMEX02: A wavelet approach. Remote A multicomponent decomposition of spatial
Sensing of Environment, 112(2), 522-534. rainfall fields: 1. Segregation of large-and
Dunne, T. & Leopold, L.B. (1978). Water small-scale features using wavelet transform.
in Environmental Planning: W.H. Freeman & Water Resources Research, 29(8), 2515-2532.
Company, 1st Ed., 818 p. Kumar, P. & Foufoula, E. (1997).
Farge, M. (1992). Wavelet transforms and Wavelet Analysis for Geophysical
their applications to turbulence. Annual Applications. Reviews of Geophysics 35(4),
Review of Fluid Mechanics 24, 395-458. 385-412.
Feng, J.C. & Tse, C.K. (2008). Labat, D., Ababou, R. & Mangin, A. (2000).
Reconstruction of chaotic signals with Rainfall-runoff relations for karstic springs.
applications to chaos-based communications. Part. II: Continuous wavelet and discrete

87
Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

ortoghonal multiresolution analyses. Journal Manual, Version 2007. (http://www.engr.


of Hydrology 238(3-4), 149-178. colostate.edu/Sams-CSU-USBR/SAMS/
Liu, P.C. (1994). Wavelet spectrum Resources/SAMS2007_User_Manual.pdf).
analysis and ocean wind waves. In: Foufoula- Accesado en febrero 08 de 2010.
Georgiou, E. and Kumar, P. (Eds.), Wavelets in UNESCO/Rostlac. (1982). Gua
Geophy- sics. Academic Press, New York, pp. metodolgica para la elaboracin del balance
151-166. hdrico de Amrica del Sur.
Nakken M. (1999). Wavelet analysis of Vuille, M. & Keimig, F. (2004).
rainfall-runoff variability isolating climatic Interannual variability of summertime
from anthropogenic patterns. Environmental convective cloudiness and precipitation
Mo- deling and Software, 14(4), 283-295. in the central Andes derived from ISCCP-
Nelson, R. (2002). ClimGen Climatic Data B3 data. Journal of Climate 17(17), 3334-
Generator Users Manual. Washington. 3348.
Posadas, A.N.D., Quiroz, R., Zorogasta, Wackernagel, H. (2003). Multivariate
P. & Len-Velarde, C. (2005). Multifractal geostatistics: An introduction with
Characterization of the Spatial Distribution of applications. Third Edition. Springer-
Ulexite in a Bolivian Salt Flat. Int J Remote Verlag Berlin, Heidelberg, New York,
Sens. 26(3), 615-627. 403 p.
Quiroz, R., Len-Velarde, C., Valdivia, R., Yarlequ, C. (2009). Anlisis de campos
Zorogasta, P., Baigorria, G., Barreda, C., de biomasa del altiplano usando wavelet
Reinoso, J., Holle, M. & Li Pun, H. (2003). y parmetros universales multifractales.
Making a difference to Andean livelihoods Tesis de Licenciatura en Fsica.
through an integrated research approach. Universidad Nacional del Callao,
In: Harwood, R.R., Kassam, A.H. (Eds.), Per. p 202.
Research Towards Integrated Natural Yarlequ, C., Posadas & A., Quiroz,
Resources Management. CGIAR, Rome, pp. R. (2007). Reconstruccin de datos de
111-122. precipitacin pluvial en series de tiempo
Quiroz, R., Yarlequ, C., Posadas, A., mediante transformadas de wavelet con
Mares, V. & Immerzeel, W.W. (2010). dos niveles de descomposicin. Centro
Improving daily rainfall estimation from Internacional de la Papa, Working Paper
NDVI using a wavelet transform. Submitted to No. 2007-2, Lima, Per, 17 p.
Environmental Modelling & Software. Wilks, D. (2006). Statistical
Sveinsson, O.G.B., Salas, J.D, Lane, W.L. Methods in the Atmospheric Sciences.
& Frevert, D.K. (2007). Stochastic analysis, Volume 91, Second Edition (International
modeling, and simulation (SAMS). Users Geophy- sics). 627 p.

88
Autor(es)-RPGA

También podría gustarte