Está en la página 1de 22

COMPARACION DE MTODOS ESTADISTICOS PARA LA ESTIMACION DE

DATOS FALTANTES DE PRECIPITACION EN LA SUBCUENCA DEL RO


LENGUAZAQUE (COLOMBIA)
[STATISTICAL COMPARISON OF METHODS FOR ESTIMATING MISSING
DATA OF PRECIPITATION IN THE RIVER SUBBASIN LENGUAZAQUE
(COLOMBIA)]
CAON RAMOS, Miguel ngel; MENA RENTERIA, Darwin
1
y NAVARRETE
LOPEZ Claudia
2
.
RESUMEN
En este proyecto se compar y evalu la aplicabilidad de mtodos estadsticos
para la estimacin de datos faltantes de precipitacin, en la subcuenca del rio
Lenguazaque, ubicada en los departamentos de Cundinamarca y Boyac,
Colombia. Los mtodos utilizados fueron el mtodo de regresin lineal simple,
mtodo de razones de distancia, mtodo por promedios vecinales, mtodo de
razones de promedio, mtodo de correlacin con estaciones vecinales y el mtodo
de regresiones mltiples. El anlisis empleado para determinar la efectividad de
los mtodos se realiz mediante el uso de tres herramientas estadsticas, el
coeficiente de correlacin (r), Error estndar de estimacin EEE y el test de
concordancia de Bland y Altman. El anlisis se realiz utilizando valores de
precipitacin real eliminados aleatoriamente en cada una de las estaciones y los
valores estimados a partir de diferentes metodologas para completar datos
faltantes. De tal forma se determin que los mtodos que presentaban el mayor
rendimiento y precisin en la estimacin de datos segn las condiciones con las
que se contaban son el mtodo de regresiones mltiples con tres estaciones
prximas y un esquema de aplicacin aleatorio apoyado en el comportamiento de
la precipitacin de las series de datos relacionadas.
ABSTRACT
In this project we compared and evaluated the applicability of statistical methods
for estimation of missing precipitation data in the basin of the river Lenguazaque
located in the departments of Cundinamarca and Boyac, Colombia. The methods
used were the method of simple linear regression, distance reasons method,
neighborhood averaging method, average method reasons, correlation method
with neighborhood stations and multiple regression method. The analysis used to
determine the effectiveness of the methods is performed by using three statistical

1
Director de tesis, Ingeniero ambiental, Especialista en gestin ambiental, Magister en evaluacin de
recursos hdricos.
2
Directora de tesis, Ingeniera Agrnoma, Magister en Estadstica y Experimentacin Agrcola y Agronmica
tools, the correlation coefficient (r ), standard error of estimate and the test using
Bland and Altman. The analysis was performed using actual rainfall values out
randomly in each of the seasons and the estimates from different methodologies
for completing missing data values. So it was determined that the methods had the
highest performance and accuracy in the estimation of data according to conditions
that were counted are the method of multiple regressions with three nearby
stations and an outline application supported random behavior precipitation of
related data sets.
INTRODUCCION
Al ser precipitacin la fuente primaria
del agua en la superficie terrestre es
necesario conocer su
comportamiento, para recolectar su
informacin se emplean instrumentos
como pluvimetros los cuales
proporcionan informacin de la
cantidad de lluvia puntual en un
determinado periodo de tiempo y
pluviografos que proporcionan
valores de lluvia continua los cuales
sirven para determina la hora de
inicio y fin de la precipitacin adems
de su intensidad, la recoleccin de
estos datos se realiza cada 24 de
forma manual en la mayora de casos
por un operario. Esta informacin es
de gran importancia para el desarrollo
de estudios y proyectos relacionados
con el uso y control del agua, con
este tipo de datos se puede
demostrar el comportamiento en una
determinada rea conociendo la
distribucin de la variable.
Ocasionalmente, hay estaciones que
por diferentes problemas no
recolectan la informacin de
precipitacin, ya sea por la ausencia
del observador o por fallas en la
instrumentacin, debido a esto se
generan varias problemticas en
cuanto al desarrollo de proyectos, ya
que no existe gran precisin respecto
a la viabilidad de la informacin en las
series de datos y es por esto que
surgen diferentes metodologas para
completar datos faltantes
Cada una de las metodologas
propuestas tiene en cuenta diversas
variables para la estimacin de los
valores, esto repercute en la exactitud
de cada mtodo, por lo que se hace
necesario un anlisis comparativo
que evidencia cul de estos mtodos
es el ms apropiado para las
condiciones de una determinada
zona.
Las bases de datos de precipitacin
completas son de gran importancia
en la ingeniera para el desarrollo de
obras civiles, estructuras hidrulicas,
indicadores de sostenibilidad y
disponibilidad hdrica. Estos datos de
precipitacin son empleados en el
clculo de caudales mximos,
caudales de diseo, caudales
ecolgicos, balances hdricos, oferta
hdrica, precipitacin media de una
determina rea, ndice de escasez,
entre otros procedimientos
encaminados a conocer el
comportamiento de esta variable y la
utilidad que puede tener para la
humanidad.

AREA DE ESTUDIO
El rea seleccionada para el
desarrollo del proyecto corresponde a
la subcuenca del rio Lenguazaque, la
cual se encuentra ubicada entre los
departamentos de Cundinamarca y
Boyac, en la superficie de la
subcuenca se encuentran dos zonas
climticas, para bajo y semihumedo;
cuenta con condiciones favorables
por los altos niveles de humedad
debido a las corrientes de viento que
logran dejar importantes cantidades
de agua que inciden y determinan la
riqueza hdrica de la zona [1].
Figura 1 Mapa delimitacin de la
subcuenca rio Lenguazaque

ESTACIONES
La subcuenca rio Lenguazaque al
hacer parte de la jurisdiccin de la
CAR cuenta con cuatro estaciones de
tipo pluviografico encargadas de
monitorear las variables
meteorolgicas con registros de datos
desde 1960 hasta la fecha. Las
estaciones ubicadas en el rea de la
cuenca son:
Tabla 1 Estaciones meteorolgicas
cuenca rio Lenguazaque

ESTACIO
N


TIPO

ALTUR
A
(msnm)

N

E
ESPINO Pluviografic
o
2500 10814
40
10381
10
TRIANGU
LO
Pluviografic
o
2800 10783
10
10512
30
TAPIAS Pluviomtric
o
258 10776
87
10399
72
PUENTE Pluviografic
o
2810 10847
30
10452
30

Para desarrollar el proyecto fue
necesario generar mapas mostrando
la ubicacin de las estaciones que
posteriormente serviran para
establecer esquemas de aplicacin
para cada una de las metodologas
propuestas para completar datos
faltantes.
Figura 2 Mapa comportamiento de la
precipitacin subcuenca rio
Lenguazaque.

METODOS
Se aplicaran las metodologas para la
estimacin de la precipitacin puntual
propuestas por la Organizacin de las
Naciones Unidas para la Educacin
Cientfica y Cultural y la Oficina
regional de Ciencia y Tecnologa para
Amrica Latina y el Caribe
(UNESCO-ROSTLAC), dentro del
marco de elaboracin del balance
hdrico para amrica latina y el
caribe.
Mtodo de regresin lineal
Este mtodo se aplica en la
estimacin de datos mensuales y
anuales de precipitacin entre la
estacin en estudio (y) y las
estaciones cercanas (x) las cuales
cuenten con una estadstica
consistente [2]
Se requiere establecer una regresin
lineal entre una estacin completa y
la estacin con informacin faltante,
mediante una ecuacin lineal del tipo:
(1)
Dnde:
y: valor estimado de precipitacin
para la estacin con carencia.
x: valor de precipitacin registrado en
la estacin con informacin completa.
a, b: constantes de la regresin lineal.
Este mtodo a pesar de ser de muy
fcil aplicacin, no puede ser usado
en todos los casos, ya que es
necesario conocer la calidad de los
datos, una bondad de ajuste baja
entre las dos estaciones, puede llevar
a la generacin de informacin
inconsistente, lo que generara
errores en las series de datos que se
pretenden completar [3].

Se requiere utilizar la herramienta
estadstica del coeficiente de
correlacin r, el cual informa el grado
de relacin entre dos variables, la
estacin estudio y la estacin con
estadstica completa, su rango se fija
entre [-1 r 1], donde el valor 0
indica una relacin lineal nula, y los
valores -1 y 1 indican una relacin
lineal perfectamente positiva o
perfectamente negativa.
Para este estudio se consider
aceptable una regresin cuyo valor
de r se encontrara entre 0.7, para
as poder realizar el mtodo y los
valores hallados fueran consistentes.
Mtodo de razones de distancia
Este mtodo suele utilizarse para
datos menores de un ao en zonas
planas, las estaciones deben tener
una distribucin espacial lineal, en la
cual la estacin con datos faltantes
(x) se encuentra en el medio de dos
estaciones (A,B) con informacin
completa, este mtodo tiene en
cuenta las distancias entre las
estaciones con informacin completa
y la estacin con datos faltantes, las
distancias estn representadas como
a,b como se muestra en la figura 3
[4].
Figura 3 Distribucin espacial lineal
mtodo de razones de distancia

En este mtodo se aplica la siguiente
ecuacin:
[
()
()
] (2)
Dnde:
px: valor estimado de precipitacin
para estacin con carencia
PA, PB: valor de precipitacin de las
estaciones A y B
A, B: distancia de las estaciones A y
B a la estacin X

Mtodo por promedios vecinales

Este mtodo se utiliza en bases de
datos con valores mensuales de
precipitacin, se puede desarrollar
con mayor eficacia en zonas no
montaosas, tiene una distribucin
espacial en la cual la estacin con
carencia de datos se encuentra
dentro de tres estaciones que
cuentan con informacin completa,
como se muestra en la figura 4 [5].
Figura 4 Distribucin espacial
mtodo de estimacin por promedios
vecinales

Este mtodo conssteme en un
promedio aritmtico con las
estaciones involucradas.

(3)

Dnde:
PX: valor estimado de precipitacin
para la estacin con carencia de
informacin en mm.
Pi: precipitacin de la estacin i en el
periodo de estudio.
n: nmero total de estaciones

Mtodo por razones de promedio

Es complementario del mtodo
anterior, utiliza la misma distribucin
espacial y su variacin consiste en
generar una relacin entre los datos
de las estaciones completas para el
periodo de tiempo en el cual se
encuentren los vacios en la
informacin de la estacin de estudio
y los promedios de las estaciones de
series entre 20 y 30 aos [4].
La expresin utilizada es:

] (4)



Dnde:
Px: valor estimado de precipitacin
para la estacin con carencia.
PX, PA, PB, PN: promedio normal de
las precipitaciones anuales
registradas en un periodo comn para
las N estaciones y la estacin X.
Pa, pb, pn: precipitacin en las N
estaciones durante el periodo que
falta en X.

Mtodo de correlacin con estaciones
vecinales

Este mtodo se utiliza con
informacin de tipo anual, consiste en
generar correlaciones entre la
estacin con datos faltantes y cada
una de las estaciones ms cercanas,
a las que se les asociarn sus
respectivos coeficientes de
correlacin para su desarrollo [4].
Este mtodo se aplicara para dos y
tres estaciones para determinar si el
nmero de estaciones influye en la
exactitud de los valores hallados.
La expresin utilizada es:

(5)
Dnde:
PX: valor estimado de precipitacin
de la estacin con carencia.
PXA, PXB...PXI: valor estimado de
precipitacin en X, a partir de las
correlaciones con cada una de las i
estaciones.
rXa, rXb, rXn: coeficiente de
correlacin entre los registros de la
estacin X, y cada una de las i
estaciones.

Mtodo de regresiones mltiples

Es una extensin del mtodo de
regresin simple y su forma de
estimar la precipitacin se basa en la
siguiente expresin matemtica:
(6)
Dnde:
Y: es el valor de precipitacin
estimada para la estacin con
carencia de informacin
Xi: valor de precipitacin en
estaciones con informacin completa
a, b, c, n: constantes de la regresin

METODOLOGIA

Para el desarrollo de este estudio se
plante la siguiente metodologa, la
cual se compone por cuatro
diferentes aspectos que van desde la
recoleccin de la informacin, su
procesamiento y la aplicacin de los
mtodos.

Recoleccin de informacin y anlisis
descriptivo

La primera etapa del proyecto se
bas en la recoleccin de la
informacin de la cuenca y de las
series de precipitacin, las cuales se
obtuvieron de la corporacin
autnoma regional de Cundinamarca
CAR, se tom la cuenca de acuerdo a
las delimitaciones ya establecidas,
luego se ubicaron las estaciones
pertenecientes a la subcuenca del rio
Lenguazaque para poder realizar el
anlisis estadstico de sus series de
datos.
Se identificaron cuatro estaciones con
informacin pluviomtrica con series
de tiempo de ms de 40 aos,
Estacin El Espino, Estacin Tapias,
Estacin El Puente, y la Estacin El
Tringulo; Para aplicar los mtodos
se utilizaron cuatro aos 1985, 1991,
1999 y 2001, los aos escogidos no
deban presentar vacos ni errores en
su informacin.
Se realiz un anlisis descriptivo de
los datos seleccionados, realizando
histogramas para determinar la
distribucin espacio temporal y
anlisis de sus estadsticos
principales para observa la calidad de
los datos.
Prueba de homogeneidad
Al observar la variacin en los datos
de precipitacin de una estacin a
otra siendo estas muy prximas, se
realiz una prueba de homogeneidad
para establecer la calidad de la
informacin y determinar si no haba
estado alterada por algn motivo
ambiental o antrpico.
Se realiz una prueba de
homogeneidad basada en el
estadstico t-student la cual se
fundamenta en la comparacin de las
medias mustrales; al tener cuatro
muestras correspondientes a las
cuatro estaciones se utiliz la
siguiente metodologa para aplicar la
prueba:
Tabla 2 Esquema de aplicacin
prueba de homogeneidad
METODOLOGIA PRUEBA
HOMOGENEIDAD
MUESTRA 1 MUESTRA 2
ESPINO TRIANGULO
ESPINO PUENTE
ESPINO TAPIAS
TRIANGULO PUENTE
TRIANGULO TAPIAS
PUENTE TAPIAS

Se tuvieron en cuenta todas las
posibles combinaciones entre
estaciones, con la finalidad de
realizar una comparacin dos a dos,
en donde cada muestra corresponda
a una estacin determinada. Se
utiliz un nivel de significancia del 5%
y el procedimiento se realiz en los
cuatro aos con las que se contaba
1985, 1991, 1999 y 2001.
Vacos en la informacin
Se generaron vacos en la
informacin, que posteriormente
serviran para evaluar la eficacia de
los mtodos; los vacos en la
informacin se generaron de forma
aleatoria, en cada uno de los aos
seleccionados 1985, 1991, 199 y
2001. Estos vacos deban ser los
mismos en las cuatro estaciones, ya
que al desarrollar las metodologa
cada estacin jugara el papel de
estacin estudio o con informacin
incompleta y de estacin con
informacin completa.
Los valores de precipitacin
eliminados se tuvieron en cuenta
como valores reales de precipitacin,
los cuales permitieron realizar un
anlisis con los valores estimados.
Se contaba con informacin de
precipitacin media mensual de
cuatro aos 1985, 1991, 1999 y 2001
lo que nos llevaba a un total de 192
datos en las cuatro estaciones.

Se eliminaron al azar datos para cada uno de los aos, se eliminaron en total 64
datos lo que corresponde al 33% del total de datos.
Tabla 3 Datos Eliminados de Precipitacin para cada una de las series
AO MESES
ESTACIONES
EL ESPINO EL TRIANGULO EL PUENTE TAPIAS
1985
Enero 38,7 39,9 8,5 14,9
Junio 33 80,3 33,9 54
Septiembre 30,4 83,7 85,6 159,8
Diciembre 63,8 37,5 90,5 45,1
1991
Febrero 6,1 45 26 0
Mayo 48,7 91,7 63,7 31,2
Agosto 13,9 83,3 49,8 29,7
Noviembre 81,8 148,6 241,1 165
1999
Febrero 104 88,7 95 82,7
Mayo 45,9 99,4 12,5 31
Septiembre 138,1 218,9 197,2 129,1
Diciembre 55,5 88,9 116,3 51,4
2001
Abril 12,6 19,8 0 2,8
Julio 24,7 46,2 2,8 12,8
Octubre 35,8 85,9 53,4 86,8
Diciembre 111,4 57,7 41,1 47,6
Fuente propia
Metodologas a desarrollar
Luego de tener establecidos los
vacos en la informacin, se aplicaron
los diferentes mtodos siguiendo
esquemas metodolgicos los cuales
mostraban en cuales estaciones se
desarrollara el mtodo teniendo en
cuenta la distribucin espacial de la
estacin y las condiciones que el
mtodo requera.

Mtodo de regresin lineal
Para establecer el esquema de
aplicacin en este mtodo fue
necesario conocer el coeficiente de
correlacin entre las diferentes
estaciones, se tuvo en cuenta un r
superior a 0,7 y la cercana de la
estacin con informacin completa a
la estacin estudio con vacos en su
informacin.
Tabla 4 Esquema de aplicacin mtodo
regresin lineal y sus respectivas
distancias.
Esquema De Aplicacin Mtodo Regresin Lineal
Estacin
Faltante Y
Estaciones Utilizadas(X) Para
Completar Datos En Estacin (Y)
X1 Cercana
X2
Cercana
X3 Cercana
El Puente El Espino
Triangul
o Tapias
7,8 8,8 8,8
El Espino
Tapias Puente Triangulo
4,2 7,8 13,5
Tapias
El Espino Puente Triangulo
4,2 8,8 11,3
Triangulo
Puente Tapias Espino
8,8 11,3 13,5
.
Mtodo por razones de distancia
Este mtodo depende de una
distribucin espacial lnea, en donde
la estaciones incompleta se debe
encontrar en el centro de dos
estaciones con informacin completa,
para establecer el esquema de
aplicacin se ubicaron las estaciones
en un mapa y se determinarlos las
distancias todo por medio de un
sistema de informacin geogrfica.



Tabla 5 Esquema de aplicacin
mtodo razones de distancia, con
distancias a la estacin con carencia
de informacin
Esquema De Aplicacin Mtodo Razones De
Distancia
Estacin incompleta
Estaciones Completas
Estacin Con Carencia
De Informacin A B
El Espino
Tapias
El
Puente
4,2 7,8
Tapias
El Espino
Triangul
o
4,2 11,3
Triangulo
Tapias
El
Puente
11,3 8,8
El Puente
Triangulo
El
Espino
8,8 7,8

Mtodo por promedios vecinales
En este mtodo se debe tener en
cuenta una distribucin espacial de
tipo triangular donde la estacin con
informacin completa se encuentre
en el centro de tres estaciones las
cuales formen por su ubicacin un
tringulo, es necesario contar con la
cartografa en donde se observe la
ubicacin de todas las estaciones
involucradas.
Por los requerimientos de este
mtodo el procedimiento solo se
desarroll utilizando una estacin con
informacin incompleta.


Tabla 6 Esquema de aplicacin
mtodo promedios vecinales
Esquema De Aplicacin Mtodo De Promedios
Vecinales
Estacin Faltante
Estaciones Completas
Estacin Con
Carencia De
Informacin A B C
Tapias
El
Puente
Triangul
o
El
Espino

Mtodo de razones de promedio
Este mtodo utiliza la misma
distribucin espacial que el anterior,
por lo tanto solo se realiz el
procedimiento para una estacin.
Para el desarrollo del mtodo es
necesario realizar el clculo de PN
que corresponde al promedio de las
precipitaciones normales en un
periodo de tiempo (mes), para
realizar el clculo de ste, es
necesario contar con informacin de
ms de 20 aos, en este proyecto se
tomaron datos de 40 aos para todas
las estaciones; se hallo el promedio
mensual multianual (PN) en las
estaciones con informacin completa
y en la estacin patrn para los
meses en los que se pretenda
completar la informacin.
De este modo se hallaron los valores
de PX, PA, PB Y PC; el clculo del
mtodo se basa en un promedio
aritmtico utilizando los promedios
mensuales multianuales de las
estaciones involucradas.
Mtodo correlacin con estaciones
vecinales
En este procedimiento es necesario
realizar estimaciones por el mtodo
de regresin lineal y tener en cuenta
los coeficientes de correlacin de las
estaciones con informacin completa
y las estaciones con carencia de
informacin para luego ser aplicados
en la expresin matemtica
correspondiente.
Este mtodo no depende de ninguna
distribucin espacial, por lo tanto se
aplic para cada una de las
estaciones, adems de esto se
plantearon dos escenarios para
ejecutar el mtodo, en el primero se
utilizaron dos estaciones con
informacin completa y en el segundo
se utilizaron tres estaciones con
informacin completa, esto con el fin
de determinar si el nmero de
estaciones influye en la exactitud de
los datos a completar.
Tabla 7 Esquema de aplicacin
mtodo por correlacin con
estaciones vecinales, con dos
estaciones.
Esquema De Aplicacin Mtodo Correlacin Con
Estaciones Vecinales Dos Estaciones
Estacin Faltante (X) A B
Tapias El Espino El Puente
El Espino Tapias Triangulo
El Puente El Espino Tapias
Triangulo Tapias El Espino




Tabla 8 Esquema de aplicacin
mtodo por correlacin con
estaciones vecinales, con tres
estaciones.
Esquema De Aplicacin Mtodo Correlacin Con
Estaciones Vecinales 3 Estaciones
Estacin
Faltante (X) A B C
El Espino El Puente Triangulo Tapias
El Puente El Espino Triangulo Tapias
Tapias El Espino El Puente
Triangul
o
Triangulo El Puente El Espino Tapias


Mtodo de regresiones mltiples

Para realizar este mtodo se tuvo en
cuenta el mismo esquema de
aplicacin del mtodo por correlacin
con estaciones vecinales, se realiz
con dos y tres estaciones con
informacin completa y se agreg un
nuevo escenario en el cual se tuvo en
cuenta la ubicacin de la estacin y la
similitud en el comportamiento de la
precipitacin de las estaciones
prximas.
Para realizar el tercer escenario fue
necesario realizar mapas de
interpolacin mediante el mtodo
IDW (Inverso de la distancia), los
cuales permiten observar el
comportamiento de la precipitacin en
toda la cuenca; es necesario contar
con la ubicacin espacial de las
estaciones en medio cartogrfica y
los datos de precipitacin que se
requieren interpolar.
Figura 3 Ejemplo mapa
comportamiento dela precipitacin
ao 1985

Al desarrollar los mapas de
interpolacin se pudo determinar el
esquema de aplicacin para este
mtodo utilizando dos estaciones con
informacin completa. El esquema de
aplicacin de este mtodo vara para
cada uno de los aos seleccionados
ya que el comportamiento de la
precipitacin no es homogneo en
todos los perodos de tiempo. Los
esquemas de aplicacin basados en
los mapas de interpolacin, los
podemos observar a continuacin.
Tabla 9 Ao 1985
1985
Y X1 X2
Tapias Triangulo Puente
Espino Puente Tapias
Puente Espino Tapias
Triangulo Tapias Puente


Tabla 10 Ao 1991
1991
Y X1 X2
Tapias Espino Puente
Espino Tapias Puente
Puente Triangulo Tapias
Triangulo Puente Tapias

Tabla 11 Ao 1999
1999
Y X1 X2
Tapias Espino Puente
Espino Tapias Puente
Puente Triangulo Espino
Triangulo Puente Espino

Tabla 12 Ao 2001
2001
Y X1 X2
Tapias Puente Espino
Espino Triangulo Tapias
Puente Tapias Espino
Triangulo Espino Tapias

Anlisis estadstico
Los resultados de los mtodos
aplicados fueron evaluados con los
datos reales por medio de
herramientas estadsticas tales como
el coeficiente de correlacin, el error
estndar de estimacin y el test de
concordancia de Bland y Altman
Coeficiente de correlacin
El coeficiente de correlacin de
Pearson, es un ndice que mide el
grado de covariacion entre distintas
variables relacionadas linealmente,
puede haber variables relacionadas,
pero no de forma lineal, en este caso
no puede aplicarse la correlacin de
Pearson [6].
Este ndice es de fcil ejecucin, e
igualmente de fcil interpretacin, en
primera instancia, sus valores
absolutos oscilan entre 0 y 1, esto si
se tienen dos variables X e Y, y se
define el coeficiente de correlacin
entre estas dos variables como rxy
entonces:
0 rxy 1
Se habla en trminos de valores
absolutos pero en realidad se
contempla el signo en el coeficiente
de correlacin el cual oscila entre -1 y
+1. No obstante se indica la magnitud
de la relacin por el valor numrico
del coeficiente, reflejando el signo la
direccin de tal valor. En este sentido,
es tan fuerte una relacin de +1 como
de -1 [6].
Error estndar de estimacin
Permite calcular la disparidad
promedio entre los valores reales de
precipitacin y los estimados; en
donde los valores cercanos a cero
indican la buena descripcin de la
precipitacin que hace el mtodo
desarrollado [5].
Su expresin matemtica es la
siguiente:
(
()

) (7)
Dnde:
y = precipitaciones mensuales reales.
Y= precipitaciones mensuales
estimadas.
n= nmero de datos considerados.
r= nmero de variables consideradas.

Test de concordancia de Bland y
Altman
Se basa en las diferencias de los
promedios existentes entre el valor
real y el estimado; permite determinar
cul de los mtodos se aproxima de
mejor forma a la precipitacin real [5].
Su expresin matemtica es:
LC=dp 1.96*sd (8)
Dnde:
dp: diferencia promedio entre valor
estimado y el valor real.
sd: desviacin estndar de la
diferencia entre el valor estimado y el
valor real.
LC: lmite de concordancia, para un
95% de confianza y un 5% de
significancia.

El mejor ajuste entre el valor real y el
estimado ser un valor dp lo ms
cercano a cero. En caso de existir
diferencias mnimas del valor dp, se
determina como mejor ajuste aquel
que presente un menor valor en su
desviacin estndar y sus lmites
sean estrechos [4].

RESULTADOS
El anlisis de resultados se realiz
para cada una de las cuatro
estaciones, utilizando las tres
herramientas estadsticas
mencionadas anteriormente, el
procedimiento se desarroll utilizando
los valores reales de precipitacin en
cada una de las estaciones para las
cuatro series de datos seleccionadas
y los valores estimados por cada uno
de los mtodos propuestos.
Estacin Tapias
Teniendo en cuenta los tres anlisis
realizados las mejores estimaciones
son presentadas por los mtodos de
regresiones mltiples en dos de los
tres escenarios planteados utilizando
tres estaciones con informacin
completa (RM3) y un esquema de
aplicacin basado en el
comportamiento de la precipitacin
segn el mapa de interpolacin
(RM2M) y el mtodo de correlacin
con tres estaciones (C3); la cantidad
de estaciones es un factor que si
influye en los valores estimados.
La cantidad de variables involucradas
en una regresin mltiple mejoran
considerablemente el resultado, en
este caso la cantidad de estaciones
que se utilicen para completar datos
faltantes influyen considerablemente
en el valor estimado, sin embargo al
utilizar un esquema de aplicacin en
base al comportamiento de la
precipitacin empleando dos
estaciones, los resultados son
similares al mtodo de regresiones
mltiples con tres estaciones.
Los mtodos que presentaron ms
bajas estimaciones teniendo en
cuenta los anlisis estadsticos
corresponden a los mtodos de
regresin lineal con la primera (R1) y
segunda estacin ms cercana (R3) y
el mtodo de razones de distancia
(RD).
Los resultados se presentan en la
siguiente tabla:



Tabla 13 Anlisis estadstico estacin tapias mtodos de estimacin de datos
faltantes de precipitacin
METODO
3

COEFICIENTE
DE
CORRELACION
( r )
EEE
TEST DE BLAND Y ALTMAN
DP LIMITE 1 LIMITE2 AMPLITUD
R1
0,54 67,48 -46,70 35,53 127,07
91,54
R3 0,81 70,91 -48,42 8,78 103,68
94,90
RD 0,37 67,43 13,61 117,95 91,27
-26,68
PV 0,78 42,70 -9,28 56,42 74,61
18,20
RP 0,75 48,81 -13,38 59,90 86,12
26,22
C2
0,69 46,94 -5,74 68,47 79,72
11,25
C3 0,79 42,26 -4,33 62,73 71,22
8,48
RM2 0,73 44,36 -5,96 64,00 75,68
11,69
RM3 0,89 30,40 -4,79 42,89 52,27
9,38
RM2M 0,85 34,49 -3,59 51,11 58,16
7,04
Fuente: propia
Estacin Espino
Los mtodos que presentaron una mayor relacin lineal segn el coeficiente de
correlacin son los mtodos de regresiones mltiples en los tres escenarios
planteados con dos (RM3) y tres estacin (RM3) y un esquema de aplicacin
basado en la similitud de la precipitacin entre las estaciones (RM2M), los
mtodos de regresin lineal con la segunda (R2) y tercera (R3) estacin tambin
comparten el mismo coeficiente de correlacin de 0,77 aunque como no fue
posible la aplicacin en las cuatro series de datos no es relevante el resultado.

3
Ri Mtodo regresin lineal, estacin de la ms prxima a las ms lejana; RD Mtodo razones de distancia; PV Mtodo
promedios vecinales; RP Mtodo razones de promedio; Ci mtodo correlacin con dos y tres estaciones vecinales; RMi
Mtodo regresiones mltiples con dos y tres estaciones con informacin completa; RM2M Mtodo regresiones mltiples
utilizando mapa IDW para distribucin espacial.
La peor estimacin segn el anlisis por coeficientes de correlacin corresponde
al mtodo de razones de distancia y el mtodo de regresin lnea con la primera
estacin ms prxima.
Segn el Error Estndar de Estimacin los mtodos que presentaron una
desviacin promedio menor en relacin a los datos reales son los mtodos de
regresiones mltiples en los tres escenarios planteados (RM2, RM3, RM2M). Los
mtodos que presentaron una mayor desviacin en sus valores estimados
corresponden al mtodo de razones de distancia RD) y regresin lineal con la
primera estacin cercana (R1).
Los mtodos que presentan una mejor concordancia presentando valores en la
diferencia promedio de 1,43 y una amplitud en los lmites de -2,81 es el mtodo de
regresiones mltiples con dos
estaciones y un esquema de
aplicacin con base a mapas de
interpolacin (RM2M), los otros dos
escenarios para el mtodo de
regresiones mltiples presentaron
buenos resultados con diferencias
promedio de 1,79 para los dos casos
y una amplitud entre -3,50 y -3,52.
Segn el test de concordancia los
mtodos con peores estimaciones
son el mtodo de razones de
distancia (RD) y el mtodo de
regresin lineal con la primera
estacin ms prxima (R1).

Tabla 14 El resultado de los anlisis estadsticos se muestra a continuacin
METODO
4
COEFICIENTE DE CORRELACION EEE
TEST DE BLAND Y ALTMAN
DP LIMITE 1 LIMITE2 AMPLITUD
R1 0,65 37,97 4,30 64,44 56,00 -8,43
R2 0,77 24,86 5,23 62,43 52,19 -10,24
R3 -0,77 15,95 3,10 59,73 53,65 -6,08
RD 0,37 64,08 -3,01 99,36 105,26 5,90
C2 0,67 35,52 2,79 59,35 53,88 -5,47
C3 0,69 34,57 4,07 58,78 50,79 -7,99
RM2 0,77 29,91 1,79 49,52 46,02 -3,50
RM3 0,77 30,05 1,79 49,75 46,23 -3,52
RM2M 0,75 31,09 1,43 51,11 48,30 -2,81
Fuente: propia



4
Ri Mtodo regresin lineal, estacin de la ms prxima a las ms lejana; RD Mtodo razones de distancia; PV Mtodo
promedios vecinales; RP Mtodo razones de promedio; Ci mtodo correlacin con dos y tres estaciones vecinales; RMi
Mtodo regresiones mltiples con dos y tres estaciones con informacin completa; RM2M Mtodo regresiones mltiples
utilizando mapa IDW para distribucin espacial.
Estacin El Puente
Segn el anlisis de correlacin los mtodos que tienen una mayor relacin lineal
corresponden al mtodo de regresiones mltiples en los tres escenarios
planteados (RM2, RM3, RM2M), aunque el que presenta una mayor correlacin no
muy alejada de los dems es el mtodo de regresiones mltiples con tres
estaciones con informacin completa (RM3).
Los mtodos con menor correlacin son los mtodos de correlacin con
estaciones vecinales con dos y tres estaciones (C2, C3).
Segn el Error Estndar de Estimacin las mejores estimacin se presentaron por
los mtodos de regresiones mltiples en los tres escenarios en donde se aplicaron
los mtodos y los dos mtodos con las peores estimaciones fueron el mtodo de
correlacin con estaciones vecinales con dos y tres estaciones.
Los mejores mtodos segn el Test de concordancia de Bland y Altman
pertenecen a los mtodos de regresiones mltiples en los tres escenarios y las
peores estimaciones estn dadas por los mtodos de razones de distancia y
correlacin con estaciones vecinales con tres estaciones.
Tabla 15 Anlisis estadstico estacin El Puente mtodos de estimacin de datos
faltantes de precipitacin
METODO
5

COEFICIENTE
DE
CORRELACION
EEE
TEST DE BLAND Y ALTMAN
DP LIMITE 1 LIMITE2 AMPLITUD
R1
0,86 35,36 -11,78 67,29 90,39
23,09
RD 0,72 69,65 -27,94 68,10 122,86
54,76
C2 0,62 66,93 8,12 113,96 98,05
-15,91
C3 0,51 101,65 -18,63 139,62 176,13
36,52
RM2 0,87 43,12 -0,58 63,54 64,69
1,15
RM3
0,89 38,43 2,84 64,07 58,50
-5,57
RM2M 0,88 40,08 7,66 74,91 59,89
-15,01
Fuente: propia
TRIANGULO
Para la estacin El tringulo segn el anlisis por coeficientes de correlacin los
mtodos que presentaron mejores estimaciones corresponden al mtodo de
regresiones mltiples en los tres escenarios planteados siendo el mtodo de
regresiones con tres estaciones (RM3) el de mayor correlacin. Los mtodos con

5
Ri Mtodo regresin lineal, estacin de la ms prxima a las ms lejana; RD Mtodo razones de distancia; PV Mtodo
promedios vecinales; RP Mtodo razones de promedio; Ci mtodo correlacin con dos y tres estaciones vecinales; RMi
Mtodo regresiones mltiples con dos y tres estaciones con informacin completa; RM2M Mtodo regresiones mltiples
utilizando mapa IDW para distribucin espacial.
las menores correlaciones son el mtodo de regresin lnea con la segunda
estacin ms cercana (R2) y el mtodo de razones de distancia (RD).
El anlisis de error estndar de estimacin nos muestra que los mtodos que
presentaron mejores estimacin son el mtodo de regresiones mltiples en los tres
escenarios planteados siendo el mtodo de regresiones con tres estaciones (RM3)
el que presenta el menor error, los mtodos que presentan mayor error son el
mtodo de razones de distancia (RD) y el mtodo de regresin lineal con la
primera estacin ms prxima (R1).
Los valores estimados que presentaron mejores resultados en el test de
concordancia de Bland y Altman, con menor DP y amplitud entre los lmites son el
mtodo de regresiones mltiples con dos estaciones con esquema de aplicacin
aleatorio (RM2) y con esquema de aplicacin basado en mapas de interpolacin
de la precipitacin (RM2M).
Tabla 16 Anlisis estadstico estacin El Tringulo mtodos de estimacin de
datos faltantes de precipitacin
METODO
6

COEFICIENTE DE
CORRELACION
EEE
TEST DE BLAND Y ALTMAN
DP LIMITE 1 LIMITE2
R1
0,79 40,46 8,46 70,91 54,33
R2 0,15 32,65 0,00 76,48 76,48
RD 0,48 74,07 28,41 132,06 76,38
C2 0,62 38,92 -8,06 52,04 67,84
C3 0,84 34,31 8,80 60,73 43,47
RM2
0,85 36,59 5,66 59,38 48,28
RM3 0,87 30,48 11,69 65,26 42,35
RM2M 0,83 34,32 5,63 53,06 42,02
Fuente propia

6
Ri Mtodo regresin lineal, estacin de la ms prxima a las ms lejana; RD Mtodo razones de distancia; PV Mtodo
promedios vecinales; RP Mtodo razones de promedio; Ci mtodo correlacin con dos y tres estaciones vecinales; RMi
Mtodo regresiones mltiples con dos y tres estaciones con informacin completa; RM2M Mtodo regresiones mltiples
utilizando mapa IDW para distribucin espacial.
CONCLUSIONES
Para la subcuenca del ro
Lenguazaque los mtodos con mayor
efectividad en la estimacin de datos
faltantes de precipitacin, fueron los
mtodos de regresiones mltiples en
los tres escenarios planteados, con
dos, tres estaciones y con una
distribucin espacial basada en el
comportamiento de la precipitacin
para cada serie.
Al ser la precipitacin una variable
aleatoria que representa un volumen
de agua en una determinada rea y
cuyos valores se obtiene a partir de
mediciones de eventos; al integrarse
mas estaciones en la estimacin de
datos faltantes se reducen los
posibles errores por aleatoriedad del
modelo de regresiones mltiples.
Tener en cuenta aspectos
climatolgicos y geogrficos al utilizar
el mtodo de regresiones mltiples
genera mejores estimaciones, ya que
dicho mtodo no tiene en cuenta el
origen de las variables.
Los mtodos que presentaron mayor
nivel de error en sus estimaciones
para las cuatro estaciones fueron el
mtodo de razones de distancia y el
mtodo de regresin lineal con las
tres estaciones ms cercanas.
Los mtodos de promedios vecinales
y razones de promedio propuestos
por UNESCO-ROSTLAC, arrojaron
buenos resultados aunque por los
requerimientos que tienen en cuanto
a su distribucin espacial triangular
su uso es limitado, debido a que en
nuestro territorio la densidad de
estaciones es muy baja.
Para la subcuenca del rio
Lenguazaque el mtodo que present
mayores inconvenientes fue el
mtodo de regresin lineal, ya que la
correlacin entre las estaciones de
estudio y las estaciones con
informacin completa era demasiado
baja, se utiliz un r superior a 0.7 el
cual solo permiti la aplicacin del
mtodo en algunas series de datos.
El mtodo de razones de distancia se
aplic para todas las estaciones pero
los resultados no fueron los ms
exactos; ya que la metodologa
sugiere su aplicacin en zonas de
baja pendiente y el rea de estudio
presenta altas variaciones en su
topografa las cuales pueden influir en
el comportamiento de la precipitacin.
Los mtodos de correlacin con
estaciones vecinales dieron buenos
resultados en series de datos que no
presentaron grandes variaciones en
la precipitacin de las estaciones con
informacin completa. Su efectividad
depende de la alta correlacin de las
variables al realizar las regresiones
lineales.
La cantidad de estaciones de
referencia es un parmetro que
influye en el resultado de los valores
estimados para los mtodos de
regresiones mltiples y correlacin
con estaciones vecinales; ya que al
utilizarse tres estaciones las
estimaciones se aproximan ms al
valor de la precipitacin real.
El integrar aspectos climatolgicos y
topogrficos a los modelos
estadsticos para la estimacin de
datos faltantes, puede mejorar los
resultados y as determinar que
mtodo es el mas adecuado para
aplicar en las diferentes condiciones
en que se requiera.
RECOMENDACIONES
Debido a los resultados obtenidos por
este proyecto se platean varias
recomendaciones para aplicacin de
mtodos estadsticos para la
estimacin de datos faltantes de
precipitacin, en cualquier tipo de
cuenca con caractersticas similares a
las de la subcuenca del rio
Lenguazaque.
Al completar datos faltantes se
recomienda utilizar las estaciones
ms prximas, ya que estas puede
que compartan las mismas
caractersticas hidrolgicas de la
zona generando mejores
estimaciones.
Se recomienda utilizar el mtodo de
regresin lineal simple por su fcil
aplicacin cuando se encuentren
coeficientes de correlacin r 0.8
entre la estacin con informacin
completa y la estacin a completar
datos. Esto se prob observando que
los resultados generados en
regresiones con un r=0.7 no
generaban resultados tan buenos
como en las regresiones con
coeficientes superiores a 0.8.
El mtodo de razones de distancia
puede arrojar resultados muy buenos
si se aplica en cuencas sin altas
pendientes, se debe seguir la
distribucin espacial lineal requerida
por el mtodo y las estaciones deben
estar ubicadas en zonas planas.
Se recomienda aplicar los mtodos
de promedios vecinales y razones de
promedio propuestos por UNESCO-
ROSTLAC, por su fcil aplicacin
siempre y cuando cumpla con la
distribucin espacial triangular
requerida.
El mtodo de correlacin con
estaciones vecinales aunque arroja
buenos resultados presenta como
limitante su procedimiento poco gil
para ser realizado manualmente. Por
lo que se requiere la utilizacin de un
software estadstico o hidrolgico
para completar bases de datos con
muchos vacos en su informacin.
El mtodo ms efectivo y el que se
recomienda utilizar es el mtodo de
regresiones mltiples, se debe contar
con un software estadstico o
hidrolgico como SPSS, Hidroesta o
Excel para hacer su aplicacin mucho
ms gil.
El generar mapas de interpolacin de
precipitacin de la cuenca para crear
esquemas de aplicacin del mtodo
de regresiones mltiples puede ser
de gran ayuda aunque no es muy
efectivo con bases de datos grandes
debido a la cantidad de
procedimientos que se deben
realizar.
Si no se cuenta con mapas de
interpolacin se pueden observar los
promedios multianuales en cada
periodo a completar o los promedios
anuales de las series y con base en
los valores generar esquemas de
aplicacin con las estaciones que
cuenten con informacin similar.
Observar el comportamiento de la
precipitacin y caractersticas como el
relieve al generar esquemas de
aplicacin para cualquier mtodo,
puede mejorar las estimaciones, ya
que todas las metodologas aplicadas
en este proyecto solo tiene en cuenta
parmetros estadsticos y de
ubicacin espacial.
REFERENCIAS
[1] UNION TEMPORAL AUDICON
ABIOTEC, Elaboracion de los
estudios de diagnostico prospectiva y
formulacion para la cuenca
hidrografica de los rios Ubate y
Suarez (Departamento de
cundinamarca), bogota, 2006.
[2] M. V. Bjar, Hidrologia,
tecnologica de costa rica, 2004.
[3] W. Y. M. Austin Cahuana
Andia, Material de apoyo didactico
para la enseanza y aprendizaje de la
asignatura de hidrologia,
Cochabamba, Bolivia: universidad
mayor de san simon, 2009.
[4] U. -. ROSTLAC, Guia
metodologica para la elaboracion del
balance hidrico de america del sur,
1982.
[5] Organizacion meteorologica
mundial, organizacion mundual
meteorologica biblioteca, omm, 13
junio 2013. [En lnea]. Available:
http://library.wmo.int/opac/index.php?
&lvl=categ_see&id=10270&main=1&i
d_thes=2. [ltimo acceso: 26 julio
2013].
[6] red latinoamericana de
desarrollo de capacidad para la
gestion integrada del agua,
Conceptos hidrologicos basicos,
2009. [En lnea]. Available:
http://www.la-
wetnet.org/lasmiradasdelagua/descar
gas/Conceptos%20Hidrol%C3%B3gic
os%20B%C3%A1sicos.pdf. [ltimo
acceso: 26 julio 2013].
[7] laanunciataikerketa.com,
laanunciataikerketa.com,
pluviometros, 2011. [En lnea].
Available:
http://www.laanunciataikerketa.com/tr
abajos/eguraldia/pluviometro.pdf.
[ltimo acceso: 20 julio 2013].
[8] Ingenieria hidraulica y
ambiental, captacion de lluvia con
pluviogrados de cubeta y su
postprocesamiento, cuba, 20013.
[9] P. A. A. Tapia, Evaluacion de
Metodos Hidrologicos para la
Completacion De datos faltantes,
Talca, 2005.
[10] P. A. D. A. C. S. L. L. F. B.
Roberto Pizarro, Evaluacion de
Metodos Hidrologicos para la
Completaciones de Datos Faltantes
de Precipitacion en Estacopmes de la
Region del Maule, Chile, Talca, 2009.
[11] personal.us.es,
http://personal.us.es/, coeficiente
de correlacion linea de Pearson, [En
lnea]. Available:
http://personal.us.es/vararey/adatos2/
correlacion.pdf. [ltimo acceso: 22
julio 2013].
[12] M. V. Bejar, Hidroesta, lima:
MAXSOFT, 2006.
[13] arcgis, arcmap, de lincencia
universidad santo tomas, 2013.
[14] M. H. DEGROOT, Probabilidad
y estadistica, valencia: ADDISON-
WESLEY IBEROAMERICANA, 1986.
[15] W. L. DONN,
METEOROLOGIA, New york:
REVERTE, S.A., 1978.
[16] F. J. A. Mijares, fundamentos
de hidrologia de superficie, mexico:
LIMUSA S.A, 1990.
[17] B. M. Chavez, evaluacion de
metodos hidrologicos para la
completaciones de datos faltantes de
precipitacion en estaciones
pluviometricas de la region de pasco,
peru., Lima,peru: La molina.
[18] IDEAM, ESTUDIO NACIONAL
DEL AGUA, BOGOTA: IDEAM, 2010.
[19] M. V. Bejar, Hidrologia
estadistica, lima: MAXSOFT, 2006.
[20] D. W. l. casimiro, Analisi
estadistico de datos climaticos, la
molina, 2005.
[21] W. L. Casimiro, clase2
estimacion y completacion de datos
faltantes, lima, 2012.
[22] C. t. d. h. ambiental,
evaluacion de parametros y proceso
hidrologicos, universidad de talca
chile, talca, 2003.
[23] m. g. Fernando Medina,
Datos faltantes, metodos de
imputacion, naciones unidas,
santiago de chile, 2007.
[24] G. A. S. Medina, Hidrologia
Basica, universidad nacional,
bogota.
[25] C. S. Roberto Pizarro,
Estudios Hidrologicos en la Region
del Maule v, centro tecnologico de
Hidrologia ambiental, talca, 2002.
[26] P. E. V. C, HIDROLOGIA,
pontificia universidad catolica de
chile, Santiago, 2005.
[27] FAO, Guia para la
determinacion de los requerimientos
de agua de los cultivos, fao, roma,
2006.
[28] CAR, Estudio de
aprovechamiento Hidraulico de la
cuenca del rio lengiazaque, car,
bogota.
[29] CAR, http://www.car.gov.co/,
12 08 2013. [En lnea]. Available:
http://www.car.gov.co/?idcategoria=1
2647. [ltimo acceso: 5 11 2012].
[30] CAR, CENTRO DE
MONITOREO HIDROLOGICO Y DEL
CLIMA, CAR, BOGOTA, 2012.
[31] A. L.Webster, Estadistica
Aplicada, Mac Graw Hill, 2005.
[32] CAR, Estado del arte y linea
base del conocimiento de la region
central, car, bogota, 2008.

También podría gustarte