Está en la página 1de 13

REVISTA PERUANA GEO-ATMOSFÉRICA RPGA (2), 76-88 (2010)

www.senamhi.gob.pe\rpga
Editado por el Servicio Nacional de Meteorología e Hidrología del Perú
©RPGA-Autor(es)

Reconstrucción de datos faltantes de precipitación pluvial diaria mediante la


Transformada Wavelet

Daily rainfall data-gap filling using a Wavelet Transform-based methodology

MARIELLA CARBAJAL CARRASCO1, 2, CHRISTIAN YARLEQUÉ1, ADOLFO


POSADAS1, 3, ELIZABETH SILVESTRE4, ABEL MEJÍA2 & ROBERTO QUIROZ1,*

1
División de Sistemas de Producción y Ambiente, Centro Internacional de la Papa, Av. La Molina 1895, Lima 12, Perú
2
Universidad Nacional Agraria La Molina, MRH-EPG-UNALM, Av. La Molina s/n, La Molina, Lima 12, Perú
3
EMBRAPA, Rua XV de Novembro, 1452, Sao Carlos, SP, CEP 13560-970, Brasil
4
Servicio Nacional de Meteorología e Hidrología, SENAMHI, Castilla 1308, Lima 11, Perú.
*r.quiroz@cgiar.org
Resumen Abstract
Se describe la aplicación de un nuevo método para This paper describes the application of a new
la completación de datos faltantes de precipitación wavelet transform-based method to fill data
diaria utilizando la “Transformada de Wavelets” gaps in daily rainfall signals. Complete rainfall
(TW). Series completas de datos de precipitación di- gauge data from six weather stations located in
aria para los períodos 1999-2000, 2003-2004, 2004- the high plateau of Peru, spanning the periods:
2005, seis estaciones meteorológicas del altiplano 1999-2000, 2003-2004, 2004-2005 were used
peruano fueron utilizadas en el análisis. El proceso for the study. The process entailed the decom-
consistió en la descomposición y reconstrucción de position and reconstruction of the signal at two
la señal, a dos niveles, usando el Wavelet Haar. El levels using the wavelet Haar. The software de-
programa desarrollado utiliza la señal que resulta del veloped utilizes the low-pass signal from the
filtro de baja frecuencia, proveniente de la estación target weather station and the high-pass signal
a ser corregida y el detalle o señal de alta frecuencia from a neighbor weather station which confer the
proveniente de una estación vecina, la que propor- random element to the reconstruction of a daily
ciona el detalle aleatorio que se usa en el llenado de signal to fill in the data gaps. The selection of the
datos faltantes. La selección de la estación vecina neighbor weather station was based on the simi-
se basó en la similitud de la distribución acumulada larity of the standardized cumulative distribu-
de ambas señales previamente estandarizadas. El tion function of both signals. The procedure was
procedimiento se validó generando vacíos aleato- validated by generating random data gaps, fill-
rios, llenando éstos con la transformada de Wave- ing the gaps with the wavelet transformed (WT)
lets o el generador de datos climáticos ClimGen y method or the standard ClimGen software and
comparando las señales reconstruidas con la señal comparing the reconstructed signals to the full
original sin alteración en todos los casos. Son com- signal prior to the generation of the data gaps. In
probados en todos los casos, el método basado en la all cases, the WT method produced slightly bet-
TW produjo mejores coeficientes de determinación ter determination coefficients than the standard
que ClimGen. La prueba Kolmogorov-Smirnov ClimGen method. The Kolmogorov-Smirnov
constató que las señales reconstruidas y originales test confirmed that the original and reconstructed
son similares. Otros estimadores estadísticos de las signals were similar; as other statistical estima-
distribuciones también fueron similares. El método tors of the time series did too. The WT method
basado en la TW, parece ser el más apropiado para proposed in this paper seems to be a more suita-
la completación de datos diarios de precipitación ble alternative for filling daily rainfall data gaps
ya que, además de producir datos muy próximos since it provided a closer approximation to the
a los reales, la generación de los parámetros para original data with the plus that it requires much
la reconstrucción requiere de pocos datos en com- less data than standard methods to estimate the
paración con los métodos convencionales. required generating parameters.
Palabras claves: Precipitación Pluvial; descom- Keywords: Rainfall; Decomposition; Recon-
posición; reconstrucción; Transformada Wavelet; struction; Wavelet Transform; ClimGen.
ClimGen.

76
©Autor(es)-RPGA
RECONSTRUCCIÓN DE DATOS FALTANTES DE PRECIPITACIÓN PLUVIAL DIARIA

INTRODUCCIÓN ella datos ausentes en la serie real. La


validación cruzada de la técnica
La precipitación pluvial es una variable propuesta para la reconstrucción de datos
climática de gran importancia para los faltantes se realizó con las mismas seis
sistemas hidrológico, agrícola, industrial estaciones del Altiplano y se comparó con
y energético. El entendimiento de su com- los resultados obtenidos con el generador de
portamiento temporal y espacial es de sumo datos climáticos ClimGen (Nelson, 2002).
interés, especialmente en los estudios de
riesgos climáticos, donde la disponibili- MATERIALES
dad de información de alta resolución y de
buena calidad es esencial. Área de Estudio
El Altiplano peruano está ubicado
En el Perú, la información sobre precipi- alrededor del Lago Titicaca, entre las
tación pluvial diaria es escasa e incom- coordenadas 15°13´59´´ S; 70°2´15´´O;
pleta (Giddings & Soto, 2006), lo que 68°34´4´´ E y 16° 58´ 18´´ S (Ver Fig. 1).
limita la capacidad de análisis de riesgos de La altitud de esta región varía entre los
déficit hídricos en agricultura de secano 3800 y los 4500 metros (m) sobre el nivel
y a su vez constituye una fuente adicional del mar. La precipitación pluvial varía de
de error cuando se modelan los balances <400 hasta 600 mm por año; en promedio
hidrológicos (Giddings & Soto, 2006). la temperatura mínima desciende hasta
10°C y las sequías pueden durar hasta 150
Este inconveniente nos lleva a buscar días (d) por año. El uso predominante de la
alternativas de solución en muchos tierra es de pastizales con áreas cultivadas,
modelos de la literatura, los cuales principalmente cerca al lago (Quiroz et al.,
según sus autores son capaces de generar, 2003).
completar o interpolar datos de
precipitación y otras variables climáticas, La actividad convectiva y la precipitación
utilizando para ello diferentes métodos en el Altiplano ocurren casi exclusiva-
como los modelos regresivos univariados mente durante el verano austral (diciembre-
y multivariados (Sveinsson et al., 2007), la marzo) y están asociadas con la
interpolación con Kriging (Wackernagel, expansión estacional de los vientos del Este
2003), etc. Cada uno de estos modelos superior y relacionadas con la afluencia de la
tiene sus limitaciones según el método que humedad cercana a la superficie
aplique y el número de entradas continental de las tierras bajas del Este
disponibles. (Vuille & Keiming, 2004).

En este contexto, el presente trabajo La variación de precipitación está también


propone la aplicación de un nuevo relacionada con la proximidad al Lago
método para completar datos medidos de Titicaca encontrándose los valores más
lluvia diaria, en base a la transformada altos cerca a éste. Los estudios corro-
Wavelet (TW). El método de reconstruc- boran que más lluvia cae sobre el lago
ción de precipitación diaria con la TW ha Titicaca que sobre cualquier otro lugar del
sido desarrollado y validado por Quiroz et Altiplano. Durante la época de lluvias el
al. (2010), Yarlequé (2009) y Yarlequé et flujo atmosférico general es del sureste
al. (2007). Las pruebas de reconstrucción y las áreas viento arriba del lago Titicaca
de datos climáticos mostradas se realizaron (sureste del lago) tienden a ser más secas
con la información de seis estaciones del que las áreas viento abajo (Grace, 1985).
Altiplano peruano, localizadas en la pro-
vincia de Puno, definiéndose el término
“reconstrucción” como el proceso de
obtener una nueva señal y completar con

77
©Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

Fig. 1. Estaciones meteorológicas empleadas en el Estudio.

Data Meteorológica parametrización del generador. Se


procedió luego a generar la data de toda
La data pluviométrica diaria de seis estaciones la serie de tiempo. Finalmente se extrajo la
meteorológicas fue obtenida del Servicio data del período de análisis (Tabla 1) para su
Nacional de Meteorología e Hidrología del posterior comparación con los resultados
Perú (SENAMHI). La ubicación geográfica obtenidos con el método de la Transformada
de las estaciones climáticas se muestra en la Wavelet.
Fig. 1, y los periodos de análisis de los datos
observados se detallan en la Tabla 1. La data Transformada Wavelet (TW)
fue pre procesada (análisis no mostrado) para
verificar su consistencia mediante la técnica La TW es una técnica matemática introducida
de doble masa (Unesco/Rostlac, 1982; Dunne en el análisis de señales en los primeros años
& Leopold, 1978). de la década de 1980 (Mallat 1999; Prasad &
Iyengar, 1997). La TW se encuentra definida
Cabe mencionar que para la reconstruc- en un dominio de tiempo y escala (frecuen-
ción o completación de datos con el cia), y posee un soporte compacto (Foufoula-
método de la Transformada Wavelet el número Georgiou & Kumar, 1994). Esto permite
de datos utilizado fue el mismo que el estudiar series de tiempo con una resolución
periodo de análisis. Por otro lado, con el definida por la escala; esto es, estructuras
generador ClimGen se utilizó un generales en la señal en una escala grande
registro de 27 a 42 años dependiendo de la (baja resolución) y finas estructuras en
data disponible de cada estación para la escalas pequeñas (alta resolución). Esta
característica es especialmente útil para

Tabla 1. Ubicación y período de análisis de las estaciones meteorológicas en el Altiplano peruano.


Latitud Longitud Altitud
N° Estación Periodo de análisis
S 0 (msnm)
1 Cabanillas 15°38’38’’ 70°20’19’’ 3890 01-12-1999 /02-02-2000 (64
2 Mañazo 15°48’48’’ 70°20’20’’ 3920 días)
3 Ilave 16°05’05’’ 69°38’37’’ 3850 11-11-2003 /17-03-2004 (128
4 Tahuaco 16°18’18 69°04’03’’ 3860 días)
5 Arapa 15°08’08’’ 70°07’07’’ 3920 11-11-2004/ 17-03-2005 (128
6 Huancané 15°12’12’’ 69°45’45’’ 3880 días)

78
©Autor(es)-RPGA
RECONSTRUCCIÓN DE DATOS FALTANTES DE PRECIPITACIÓN PLUVIAL DIARIA

variaciones espaciales que son no- Aquí λ>0 representa la variable de


estacionarias, y que poseen componen- escala (o ancho de la función Wavelet) y μ la
tes que trascienden con una corta duración, variable de translación (ubicación de la función
con estructuras en diferentes escalas, o que Wavelet). La función ψ(t) es la conocida
poseen singularidades, las cuales son ideales Wavelet Madre o Wavelet, que es utiliza-
para mostrar pequeñas fluctuaciones en las da para que sean óptimamente localizados
señales (Posadas et al., 2005). Debido a esta los valores de la transformada en el tiempo
propiedad, el análisis con la TW tiene muchas (espacio) y en distintas escalas (frecuencias).
aplicaciones, en dinámica de fluidos (Farge,
1992; Gao & Li, 1993; Liu, 1994, Katul & El operador Inverso de la Transforma Wavelet
Vidakovic, 1996), geofísica o hidrología (IWT) es definido como (Foufoula-Geourgiou
(Kumar & Foufoula-Georgiou, 1993; Labat et & Kumar, 1994):
al., 2000).

La TW es una técnica física-


matemática (Graps, 1995), que describe
la señal en estudio por intermedio de sus
coeficientes, los que a su vez describen la
diversidad de cambios ocasionados por
eventos (singularidades) locales (Kumar & Para mayor información acerca de las
Foufoula, 1997). La TW no es una técnica propiedades de la TW y el ITW, el
meramente estadística, que requiera un gran lector puede revisar los trabajos recopilados
número de datos, sino que ella representa la en Foufoula-Geourgiou & Kumar (1994).
descomposición de una señal en diferentes
niveles de resolución, proceso conocido como Con el fin de construir algoritmos eficientes
multiresolución. El uso de una represen- para calcular la TW, se realiza la discre-
tación multiresolución ofrece un marco tización del parámetro de escala λ y del
jerárquico simple para interpretar la parámetro de traslación t, lo que produce la
información contenida en la señal. A diferentes Transformada de Wavelet Discreta (y la
resoluciones, los detalles de una señal general- inversa en su forma discreta). La
mente caracterizan diferentes estructuras físi- selección de λ = 2m y t = n2m, resulta en una
cas de ella. A una resolución más gruesa, estos representación discreta ortogonal
detalles generalmente caracterizan las grandes (Foufoula-Geourgiou & Kumar, 1994;
estructuras que su entorno contiene. Daubechies, 1988).
Con un aumento de la resolución obtenemos
detalles más finos. Así, la TW puede ser Análisis de Multiresolución (AMR) con la
discreta o continua: TW

La TW se define como la convolución de El AMR (Mallat, 1989) proporciona un tipo


una función f, con una función de onda de descomposición y reconstrucción de una
(Wavelet) como Kernel de la transformada señal en base a las propiedades de la TW (e
(Foufoula-Geourgiou & Kumar, 1994): ITW), en su forma discreta. Para una informa-
ción detallada, los autores recomiendan revisar
la siguiente documentación (Mallat, 1999;
Foufoula-Geourgiou & Kumar, 1994).
(1)
En términos generales, seleccionando
donde: una cierta función Wavelet Ortogonal
(Foufoula-Geourgiou & Kumar, 1994), es
posible obtener una descomposición de la
(2) función f como:

79
©Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

y así es posible obtener características


(5) singulares en diferentes escalas de estudio.
En general, la relación entre los coeficientes
Aquí AN es llamado el coeficiente de aproxi- de tendencia y detalle en dos niveles de
mación o señal de tendencia; DN es el descomposición (o reconstrucción) está
coeficiente de detalle o señal de detalle; y definido como:
N indica el nivel del proceso de descom-
posición (o reconstrucción), donde la escala (7)
varía creciente o decrecientemente,
respectivamente (Foufoula-Geourgiou & donde: N indica el nivel de descomposición
Kumar, 1994). Las características y diferencias (o reconstrucción) o escala del proceso. Esta
entre estas dos nuevas señales resultan del ecuación (7) de AMR muestra que para
tipo de frecuencias que contiene cada una obtener la señal AN, a una escala menor (mayor
de ellas. En A se tienen las frecuencias más desagregación) N-1, es necesaria la
bajas de f, donde aparecen las frecuencias de los información extra (DN). Así AN-1 viene a
componentes estacionarios, periódicos y ser la nueva señal A en la escala N-1. Este
cíclicos, mientras que en D aparecen las señales proceso es conocido como Downscaling y es
de alta frecuencia existentes en la señal f; equivalente al proceso de reconstrucción de
frecuencias que describen la variabilidad, AMR (Figura 2b), y el proceso inverso es
perturbación y el ruido existente en la data. equivalente al proceso de descomposición
En el presente trabajo las señales A y D, son (donde se generan los DN, Figura 2a). En la
nombrados como Tendencia y Ruido. figura 2, R es equivalente a A, la única
Posteriormente, se puede realizar la misma diferencia es que A se obtiene de un proceso
descomposición para la señal A1, obteniendo: de descomposición y R de un proceso de
reconstrucción.

(6)

Fig. 2. Proceso AMR. a) Descomposición o proceso de Up-scaling. b) Reconstrucción o proceso


de Downscaling. La función Wavalet Madre (ψ) para ambos procesos es la misma. N=0, 1, 2… es
el nivel del proceso (aquí se define la escala como λ=2N y f es la escala asociada a la función ψ).

80
©Autor(es)-RPGA
RECONSTRUCCIÓN DE DATOS FALTANTES DE PRECIPITACIÓN PLUVIAL DIARIA

Generador de datos climáticos ClimGem MÉTODOS

El ClimGen es un generador de datos Generación de vacíos de información


climáticos a escala diaria, basado en aleatorios
correlaciones y regresiones (Nelson, 2002). Para simular la ausencia de datos
Este generador fue desarrollado por el observados (vacíos) en las estaciones N° 1, 3 y
Departamento de Ingeniería de Sistemas 5 (Tabla 1) se generaron vacíos en posiciones
Biológicos de la Universidad Estatal de aleatorias, según el porcentaje de vacíos
Washington, y es un software de libre deseado. En cada caso (Cabanillas, Ilave y
acceso en la Web (www.bsyse.wsu.edu/ Arapa) se generó un total de 25% de datos
climgen/ClimGen/index.html), requiere faltantes en relación con el total de datos.
de series diarias para calcular los
parámetros a utilizar en el proceso de Estudio de la información de vacíos
generación. Las variables climáticas El estudio de vacíos consiste en determinar
que genera son precipitación pluvial, el porcentaje de datos faltantes en las series
temperatura, radiación solar, entre otras temporales estudiadas, para así seleccionar
variables. el nivel de descomposición que se requiere
para iniciar el proceso de reconstrucción.
En el caso de precipitación diaria, la Dicho porcentaje es calculado en distintas
reconstrucción está basada en dos escalas (o niveles de descomposición de
supuestos: primero, que la condición de la base de la función Wavelet de Haar (n))
lluvia en un cierto día i, se relaciona y posiciones. El análisis de ausencia de
con la condición de lluvia en el día i-1 información en una vecindad de cada 2N
(Cadena Markov); segundo, que la cantidad datos, dado por (Número de Vacíos)*100/2N,
de lluvia en los días lluviosos está descrita determinó que el nivel más adecuado para la
por una función de distribución adecuada, reconstrucción era N = 2. Por lo cual, de cada
en cada mes. Los valores diarios de dichas 4 datos analizados el porcentaje de vacíos
probabilidades son interpolados usando puede ser 0, 25, 50, 75 y 100% dependiendo
funciones spline, siendo el requerimiento si hay 0, 1, 2, 3 y 4 datos faltantes. Este nivel
mínimo para poder generar datos con el fue seleccionado considerando un umbral no
ClimGen un registro histórico de mayor a 25% para la mayoría de vecindades,
por lo menos 25 años (continuos, no es decir de donde se pueda obtener una
necesariamente completos). tendencia representativa para la posterior
reconstrucción, asimismo es importante
El ClimGen es uno de los programas tratar de preservar el nivel de detalle y
computacionales más empleado y conocido trabajar con escalas menores.
para generar datos diarios, por ello ha sido
utilizado como referente para evaluar la Modelo de reconstrucción de la función
metodología propuesta para la Wavelet
reconstrucción de datos de precipitación Una vez determinado el nivel N, donde se
diaria en las estaciones y periodos de estudio. cumple la condición de minimizar la pérdida
En este caso, se generaron parámetros y de información en las series no completas en
nuevas series en cada estación a partir de una cierta escala o intervalos de análisis en
registros pluviométricos (incompletos) de toda la serie, se procede a reconstruir con la
entre 27 y 42 años en función de la data Transformada Wavelet.
existente y luego se completó la serie
incompleta con los valores generados para El modelo de reconstrucción se inicia con
los días sin información. la normalización o estandarización de las
señales (ecuación 8, Nakken, 1999) con el
objetivo de convertir los datos de las señales
en adimensionales y llevarlos a una misma

81
©Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

escala (valores entre –1 y 1, con media 0 y comprobando previamente la similitud entre


desviación estándar 1) para poder trabajar sus señales estandarizadas. Dicho modelo de
con ellos. Este procedimiento es realizado reconstrucción así como otros procedi-
solo para los valores correspondientes a mientos útiles para el análisis de datos fueron
condiciones de lluvia (mayores a 0). programados en el software de cálculo
matemático Matlab.
(8)
A continuación se describe el algoritmo de
reconstrucción:
Con las señales estandarizadas se procede a
determinar la tendencia de la estación a 1. Seleccionar dos estaciones vecinas, una
completar y a extraer la variabilidad a con vacíos (f) y la otra completa (g), de una
heredar de la estación de apoyo en la escala N. La misma familia de distribución y con indicadores
tendencia se obtiene dividiendo la señal en climáticos similares.
particiones de 2N y calculando el promedio 2. Estandarizar las señales f y g siguiendo la
de los valores observados en cada partición metodología descrita por Nakken (1999).
(sin considerar en el promedio los vacíos) 3. Descomponer la señal como en las ecuaciones
resultando una nueva señal del tipo de las señales 3 y 4, hasta un cierto nivel de descomposición N,
de tendencia A1N (Fig. 2), cuyo número de escogido según la cantidad de vacíos existentes
datos será: (longitud de la señal original)/2N. en f.
La variabilidad es extraída con la Transfor- 4. Promediar los valores de f en el nivel N,
mada Wavelet (filtro Haar, ya que reduce la cada 2N datos. Esto debe corresponder a una
distorsión de los datos, según Das & Mohanty, aproximación de A, por lo que se toma este
2008) al descomponer la señal completa hasta resultado como la tendencia en la reconstrucción
el nivel N, generando las señales A2N y D2N para (en lugar de A utilizamos el ponderado de f cada
todo N=1,2… Luego se procede a reconstruir 2N vecindades).
como se muestra en la Fig. 2, pero a partir del 5. Tomar la tendencia de f (obtenida en 4) en
nivel N, se toma la tendencia A1N y los detalles el nivel N y todos los ruidos de g de todos los
D2N con N=N, (N-1)… 1. Posteriormente, se niveles N,(N-1),..., 1.
realiza el proceso contrario a la estandarización 6. Realizar el proceso inverso de la
de los datos correspondientes a días lluviosos, y se estandarización de la parte dos y obtener la señal
eliminan los posibles errores por negatividad en h.
la señal reconstruida e inexistencia de ruido en la 7. Los valores faltantes de la señal f son
señal vecina. Los errores en el primer caso son reemplazados por los valores que se generaron
debido a la matemática utilizada en la obtención en el proceso de reconstrucción de la señal h.
de tendencias y ruidos a diferentes escalas, y los
errores en el segundo caso se dan cuando la señal Métodos de Validación
vecina registró un día sin lluvia, pero la tenden-
cia en la escala de descomposición presenta Las pruebas comparativas con los datos
valor positivo producto de su cálculo. Ambos observados completos son importantes para
errores son reemplazados con cero. Finalmente, la verificación de los datos modelados, tanto
se completan los datos faltantes en la señal con el método de Transformada Wavelet como
original, reemplazándolos con los valores los modelados con el ClimGen. Se verificó la
recíprocos de la señal reconstruida. similitud entre estadígrafos de las señales
reconstruidas con la señal original (análisis
El método propuesto para reconstruir datos no mostrado). Se evaluó la bondad de ajuste
faltantes en una señal de precipitación entre cada señal modelada y la señal
pluvial diaria consiste en combinar completa, mediante el coeficiente de
información de la estación incompleta (que determinación (R2) y la prueba de Kol-
se requiere completar) con información de mogorov-Smirnov; asimismo se utilizó el
otra estación cercana (estación de apoyo), RMSE (Raíz del error medio cuadrático) y el

82
©Autor(es)-RPGA
RECONSTRUCCIÓN DE DATOS FALTANTES DE PRECIPITACIÓN PLUVIAL DIARIA

MAE (Error Absoluto Medio), indicadores no RESULTADOS


probabilísticos de predicciones para variables
continuas (Wilks, 2006). Adicionalmente, se Similitud de Patrones en el Altiplano
analizó la diferencia porcentual de entropías Las reconstrucciones de las señales de
entre reconstrucciones con la hipótesis de que lluvia diaria en el Altiplano peruano se
cuando la diferencia tiende a cero las señales realizaron luego de estudiar y encontrar un
se rigen por la misma ley dinámica (Feng & patrón similar de comportamiento a diferentes
Tse, 2008). Finalmente, se realizó un análisis magnitudes y dispersiones en la mayoría de
residual por cada reconstrucción. estaciones. Dicho análisis se realizó mediante

(a)

(b)

(c)

Fig. 3. Datos observados (línea continua) y datos reconstruidos con las técnicas de reconstrucción
de la TW (línea discontinua) y generador de datos ClimGen (línea punteada) para a) Cabanillas, b)
Ilave y c) Arapa.

83
©Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

la prueba de Kolmogorov-Smirnov, La prueba de Kolmogorov-Smirnov


comparando las señales diarias muestra que las distribuciones de los
estandarizadas (análisis de 28 estaciones, no datos reconstruidos con TW y ClimGen
mostrado), habiéndose encontrado mayor son equivalentes a la distribución de los
similitud entre estaciones cercanas. datos observados (Tabla 2. D: máxima
desviación vertical entre distribuciones
Reconstrucción de Señales acumuladas).

Luego de aplicado el modelo Wavelet y el La diferencia porcentual de entropía de


Generador ClimGen se completaron los datos las señales indica que ambos métodos de
ausentes (producto de la generación de vacíos reconstrucción dan resultados que se
aleatorios) y se obtuvieron las siguientes asemejan a los medidos. Cuando la
señales completadas (Ver Fig. 3). diferencia entre los métodos fue mayor al
5%, el método de la reconstrucción con la
En todos los casos los valores de TW presentó una menor diferencia con la
coeficiente de determinación (0.82, 0.86 señal medida.
y 0.77), correspondientes a las series
reconstruidas con la técnica de la TW, Análisis residual
fueron superiores (p <5%) a los obtenidos
con las reconstrucciones con el generador Los estadígrafos calculados y los test
ClimGen (0.70, 0.71 y 0.40). Los resultados estadísticos realizados entre los valores
estadísticos de la comparación entre datos observados y los valores reconstruidos con
reales y datos reconstruidos se muestran en la técnica de la TW y el generador ClimGen
la Tabla 2. Los estadígrafos de las señales muestran que las señales reconstruidas son
reconstruidas en ambos casos (media, similares a la señal observada. Sin embargo,
desviación estándar, coeficiente de es importante conocer la proporción de los
asimetría, curtosis) no muestran errores respecto a las observaciones mediante un
diferencias estadísticamente significativas análisis residual. Se determinaron los
(Tabla 2). residuales para los tres casos (Fig. 4),
encontrándose en todos los casos que la
Las medidas de precisión de los modelos reconstrucción con ClimGen tiene mayor
(MAE y RMSE) indican que en todos los cantidad de residuales que se encuentran
casos el modelo Wavelet completó los fuera del intervalo de confianza y que en su
datos ausentes con menor error, sin mayoría son de mayor magnitud. El 95.5% de los
embargo según el BIAS se sobreestimaron residuales están comprendidos dentro del
ligeramente algunos de los valores reales, intervalo [μ+2s, μ-2s], donde μ es la media del
mientras que la completación con ClimGen residual y s es la desviación estándar residual.
subestimó en menor medida dichos valores.

Tabla 2. Comparación Estadística de las Reconstrucciones.


Estación Reconstruida R2 MAE RMSE BIAS p-value* D* ΔH%
TW 0.82 1.14 2.90 0.05 1.00 0.08 –3.94
Cabanillas
ClimGen 0,70 1.27 3.70 –0.11 1.00 0.08 –10.57
TW 0.86 0.74 2.40 –0.06 0.99 0.07 –0.55
Ilave
ClimGen 0.71 1.31 3.70 –0.03 1.00 0.00 1.10
TW 0.77 0.63 2.20 –0.10 1.00 0.07 3.12
Arapa
ClimGen 0.40 1.19 3.90 -0.06 1.00 0.06 2.33

Tabla 3. Valores de estadígrafos principales del análisis residual.


Cabanillas Ilave Arapa
TW ClimGen TW ClimGen TW ClimGen
Media residual 0.22 –0.46 –0.23 –0.13 –0.27 –0.16
s residual 2.96 3.74 2.44 3.70 2.17 3.96

84
©Autor(es)-RPGA
RECONSTRUCCIÓN DE DATOS FALTANTES DE PRECIPITACIÓN PLUVIAL DIARIA

Fig. 4. Análisis residual de las reconstrucciones con la TW (o) y ClimGen (Δ), de: a) Cabanillas, b)
Ilave y c) Arapa. Se muestran intervalos de confianza del 95.5% de los datos residuales, con la técnica
de la TW (línea horizontal negra) y ClimGen (línea horizontal gris).

Los valores residuales de las sin embargo las desviaciones estándares


reconstrucciones se encuentran distribui- reflejan una mayor dispersión del error e
dos normalmente con media cercana a cero intervalos de confianza más amplios en las
para todas las reconstrucciones realizadas, reconstrucciones con ClimGen.

85
©Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

DISCUSIÓN DE RESULTADOS los demás casos. Sin embargo, la reconstruc-


ción con la TW no se ve afectada en ninguno
La TW está basada en principios físico- de los casos indicados anteriormente, ya que
matemáticos que están asociados al proceso el método TW propuesto utiliza la variabilidad
de la señal, siendo por lo tanto independiente de otra estación que tiene patrones similares
de la cantidad de información utilizada en (misma aleatoriedad), en un mismo tiempo
el proceso de análisis (reconstrucción). Esto (Ver Fig. 3).
no ocurre con una técnica estadística clási-
ca, donde se infieren los parámetros proba- En el presente trabajo se utilizaron series de
bilísticamente de una muestra representativa precipitación diarias que presentan una alta
del proceso. Esto convierte a la TW en una variabilidad lo que las hace difícil de modelar.
herramienta muy útil para este tipo Esta variable, a nivel diario en comparación
de procesos. Esta ventaja permitió las con otras variables de menor ruido o mayor
reconstrucciones a partir de pocas estaciones escala temporal, no ha sido bien estudiada.
y un número reducido de datos. También, las reconstrucciones a escalas de
tiempo mayores (como las mensuales) se
El período de análisis de las tres señales van haciendo más sencillas debido a que la
de lluvia diaria de las estaciones en precipitación mensual (u otra variable climáti-
estudio se seleccionó teniendo en cuenta ca) es de carácter estacional y además la
diferentes períodos y cantidad de datos, y la correlación entre estaciones meteorológicas
presencia de eventos extremos, para tratar de cercanas es por lo general muy alta.
observar diversos escenarios. Por ejemplo, la
Fig. 3a muestra 64 datos de la señal diaria de CONCLUSIONES
Cabanillas, que es una señal de bajas
frecuencias o baja variabilidad temporal La metodología desarrollada permitió
(debido principalmente al poco número de completar series de precipitación
datos). Por otro lado, las estaciones de Ilave diaria para tres estaciones meteorológicas,
(Fig. 3b) y Arapa (Fig. 3c), de 128 datos cada obteniéndose mejores resultados que con el
una, tienen un comportamiento de mayor generador ClimGen, según los indicadores
variabilidad temporal (de altas frecuencias). En estadísticos, no probabilísticos y físicos
el caso de Ilave, la señal muestra propiedades utilizados. En consecuencia, este modelo de
estacionales con una variabilidad temporal reconstrucción es una alternativa eficiente
creciente al inicio y decreciente en la parte para completar datos faltantes, cuando se
final; es decir, la señal sigue una cuenta con información del mismo periodo,
tendencia con pendiente positiva y luego en la misma escala temporal y con similares
negativa. Lo contrario se observa en Arapa, probabilidades de ocurrencia, proveniente de
que tiene una señal con mucho ruido y sin otra estación cercana.
tendencia. Es así que el ruido en las señales
supone una mayor complejidad para su La reconstrucción es posible siempre y
modelamiento. En estos casos las señales cuando se demuestre que tanto la señal
diarias o con eventos climáticos extremos incompleta como la señal de apoyo
(como El Niño), son poco modelables o los estandarizadas tienen la misma
resultados suelen ser poco reales y requieren probabilidad acumulada de ocurrencia para
de registros prolongados. Esto último es un mismo intervalo de tiempo.
mostrado en la gráfica de residuales y en los
valores del coeficiente de determinación (R2), La técnica de reconstrucción descrita es
obtenidos al comparar los valores observados aplicada a datos de lluvia diaria, no
versus los reconstruidos con ClimGen, los que obstante su aplicación es de uso genérico para
son menores a los de la reconstrucción con la otras variables climáticas a distintas escalas
TW. Para el caso de Arapa (señal con mucho temporales (horas, cada 2 días, semanal,
ruido), el valor de R2 es mucho menor que en quincenal, mensual, anual, etc.). Esta

86
©Autor(es)-RPGA
RECONSTRUCCIÓN DE DATOS FALTANTES DE PRECIPITACIÓN PLUVIAL DIARIA

aplicación genérica se basa en que el análisis Tsinghua University Press and World Scientific
con la TW está influenciado por los eventos Publishing Co. Pte. Ltd., 218p.
locales, preservándose el aspecto temporal. Foufoula-Georgiou, E. & Kumar, P. (Eds.).
(1994). Wavelets in geophysics. Academic
Una ventaja de utilizar la técnica de la TW Press, 373p.
es que no requiere periodos de información Gao, W. & Li, B.L. (1993). Wavelet analysis
pasados para su desarrollo (como sí lo requiere of coherent structure at the atmosphere-forest
ClimGen y otros modelos); sin embargo, su interface. Journal of Applied Meteorology 32
eficiencia está asociada directamente a la (11), 1717-1725.
relación que existe entre la variabilidad de Giddings, L. & Soto, M. (2006).
la estación a reconstruir con la de alguna Participación de América Latina y del Caribe
otra estación vecina y al porcentaje de datos en los Registros Globales Climatológicos,
faltantes en cada partición de 2N datos, y no al GHCN. Interciencia: Revista de Ciencia y
tamaño del registro histórico. Tecnología de América, 31(9), 632-637.
Goupillaud, P., Grossmann, A. & Morlet, J.
El análisis conjunto de la TW y el AMR (1984). Cycle-octave and related transforms in
es una técnica flexible que permite seismic signal analysis. Geoexploration 23 (1),
estudiar las series de datos y su variabilidad en 85-102.
diferentes resoluciones de manera dinámica. Grace, B. (1985). El clima del altiplano,
Es así como en las reconstrucciones con este departamento de Puno, Perú. INIPA CIPA XV.
método la presencia de eventos extremos y Estación Experimental Salcedo.
singularidades se mantiene, al ser heredados Graps, A. (1995). An introduction to wavelets.
de la estación cercana, como se verificó en el IEEE Computational Science and Engineering
análisis espectral. 2 (2), 50-61.
Grossmann, A. & Morlet, J. (1984).
Agradecimientos Decomposition of Hardy functions into square
integrable wavelets of constant shape. SIAM
A la División de Sistemas de Producción y Journal on Mathematical Analysis 15 (4), 723-
Ambiente del Centro Internacional de la Papa 736.
y al Servicio Nacional de Meteorología e Jaffard, S. (2004). Wavelet techniques in
Hidrología. Este trabajo fue financiado por el multifractal analysis, fractal geometry and
Proyecto ALTAGRO con fondos del CIDA- applications, In: AMS (Ed.), Proceedings of
Canadá. Symposia in Pure Mathematics, Providence,
RI.
Katul, G. & Vidakovic, B. (1996). The
REFERENCIAS partitioning of attached and detached eddy
motion in the atmospheric surface layer
Das, N.N. & Mohanty, B.P. (2008). Temporal using Lorentz wavelet filtering. Boundary
dynamics of PSR-based soil moisture across Layer Meteorol, 77(2), 153-72.
spatial scales in an agricultural landscape Kumar, P. & Foufoula-Georgiou, E. (1993).
during SMEX02: A wavelet approach. Remote A multicomponent decomposition of spatial
Sensing of Environment, 112(2), 522-534. rainfall fields: 1. Segregation of large-and
Dunne, T. & Leopold, L.B. (1978). Water small-scale features using wavelet transform.
in Environmental Planning: W.H. Freeman & Water Resources Research, 29(8), 2515-2532.
Company, 1st Ed., 818 p. Kumar, P. & Foufoula, E. (1997).
Farge, M. (1992). Wavelet transforms and Wavelet Analysis for Geophysical
their applications to turbulence. Annual Applications. Reviews of Geophysics 35(4),
Review of Fluid Mechanics 24, 395-458. 385-412.
Feng, J.C. & Tse, C.K. (2008). Labat, D., Ababou, R. & Mangin, A. (2000).
Reconstruction of chaotic signals with Rainfall-runoff relations for karstic springs.
applications to chaos-based communications. Part. II: Continuous wavelet and discrete

87
©Autor(es)-RPGA
MARIELLA CARBAJAL ET AL.

ortoghonal multiresolution analyses. Journal Manual, Version 2007. (http://www.engr.


of Hydrology 238(3-4), 149-178. colostate.edu/Sams-CSU-USBR/SAMS/
Liu, P.C. (1994). Wavelet spectrum Resources/SAMS2007_User_Manual.pdf).
analysis and ocean wind waves. In: Foufoula- Accesado en febrero 08 de 2010.
Georgiou, E. and Kumar, P. (Eds.), Wavelets in UNESCO/Rostlac. (1982). Guía
Geophy- sics. Academic Press, New York, pp. metodológica para la elaboración del balance
151-166. hídrico de América del Sur.
Nakken M. (1999). Wavelet analysis of Vuille, M. & Keimig, F. (2004).
rainfall-runoff variability isolating climatic Interannual variability of summertime
from anthropogenic patterns. Environmental convective cloudiness and precipitation
Mo- deling and Software, 14(4), 283-295. in the central Andes derived from ISCCP-
Nelson, R. (2002). ClimGen – Climatic Data B3 data. Journal of Climate 17(17), 3334-
Generator User’s Manual. Washington. 3348.
Posadas, A.N.D., Quiroz, R., Zorogastúa, Wackernagel, H. (2003). Multivariate
P. & León-Velarde, C. (2005). Multifractal geostatistics: An introduction with
Characterization of the Spatial Distribution of applications. Third Edition. Springer-
Ulexite in a Bolivian Salt Flat. Int J Remote Verlag Berlin, Heidelberg, New York,
Sens. 26(3), 615-627. 403 p.
Quiroz, R., León-Velarde, C., Valdivia, R., Yarlequé, C. (2009). Análisis de campos
Zorogastúa, P., Baigorria, G., Barreda, C., de biomasa del altiplano usando wavelet
Reinoso, J., Holle, M. & Li Pun, H. (2003). y parámetros universales multifractales.
Making a difference to Andean livelihoods Tesis de Licenciatura en Física.
through an integrated research approach. Universidad Nacional del Callao,
In: Harwood, R.R., Kassam, A.H. (Eds.), Perú. p 202.
Research Towards Integrated Natural Yarlequé, C., Posadas & A., Quiroz,
Resources Management. CGIAR, Rome, pp. R. (2007). Reconstrucción de datos de
111-122. precipitación pluvial en series de tiempo
Quiroz, R., Yarlequé, C., Posadas, A., mediante transformadas de wavelet con
Mares, V. & Immerzeel, W.W. (2010). dos niveles de descomposición. Centro
Improving daily rainfall estimation from Internacional de la Papa, Working Paper
NDVI using a wavelet transform. Submitted to No. 2007-2, Lima, Perú, 17 p.
Environmental Modelling & Software. Wilks, D. (2006). Statistical
Sveinsson, O.G.B., Salas, J.D, Lane, W.L. Methods in the Atmospheric Sciences.
& Frevert, D.K. (2007). Stochastic analysis, Volume 91, Second Edition (International
modeling, and simulation (SAMS). User’s Geophy- sics). 627 p.

88
©Autor(es)-RPGA

También podría gustarte