Está en la página 1de 8

CLASE.

COMPLETACION DE DATOS

COMPLETADO Y EXTENSIÓN DE INFORMACIÓN HIDROLÓGICA


Rendon (2009) menciona que, dentro de este proceso, la extensión es el más importante, ya que
al extender, se está creando una serie de registros larga, y sus parámetros serán diferentes a los
de la serie original (Serie corta). Es por ello que para aceptar la extensión de un registro corto, es
indispensable que la serie larga proporcione mejores estimados de los parámetros que ésta.
De los métodos de estimación, los criterios prácticos, como es el relleno de datos con el
promedio; pueden generar efectos muy negativos en la información y por ende conclusiones
erróneas. El efecto más importante es que la variancia de la serie puede ser reducida
sustancialmente; ya que al colocar en un dato faltante un promedio se está amortiguando los
desvíos propios de la muestra, de tal manera que pierde uno de sus parámetros más importantes,
distorsionándola así por completo como serie histórica. En cambio los métodos estadísticos
proporcionan las herramientas necesarias para determinar si la nueva serie ha mejorado la
estimación de parámetros o la ha empeorado.
El método estadístico más usado en estos casos, es el de Correlación y Análisis de Regresión que
matemáticamente se hacen en simultáneo, que puede ser con una o más variables, y sirve tanto
para completar como para extender la información.
Se puede usar el modelo de Regresión Lineal Simple, es decir que el registro que se quiere
extender sólo está correlacionado con una serie de registro largo.

COMPLETACION DE DATOS HIDROLOGICOS

Mejía (2001), menciona que, muchas estaciones de precipitación o descargas (caudal) tienen
periodos faltantes en sus registros, debido a la ausencia del observador o a fallas instrumentales. A
menudo es necesario estimar algunos valores faltantes para lo cual existen muchas formas de
suplir estas deficiencias y el grado de aceptación de uno de estos métodos va a depender de la
cantidad de observaciones faltantes en el registro de datos. Entre estos métodos podemos
mencionar los siguientes:

- Método del promedio simple.


- Método de razones normales.
- Método de correlación entre dos estaciones.

Completación de datos mediante un promedio simple

Si dentro del registro de datos faltan menos del 5% de información estos se pueden completar con
un simple promedio de todos los datos existentes o la semisuma de los datos del año anterior y
del siguiente.

Completacion de datos mediante el método de razones normales

Puede haber en los registros de los datos, días o intervalos grandes sin información, por
imposibilidad del operador o falla del instrumento registrador. En ese caso, la serie de datos de
que se dispone en una estación X, de los cuales se conoce la media en un determinado número de
años, presenta vacíos que deben ser rellenados. Un procedimiento simple de completacion parte

1
de la premisa de que la precipitación PX en la estación X, sea proporcional a las precipitaciones de
las estaciones vecinas A, B y C en un mismo período, precipitaciones que serán llamadas PA, PB, PC.

Se acepta que el coeficiente de proporcionalidad sea la relación entre la media MX y las medias
MA, MB y MC en el mismo período de tiempo; esto es, que las precipitaciones sean directamente
proporcionales a sus medias. Se adopta, entonces, como valor del dato faltante PX, la media entre
los tres valores calculados a partir de A, B y C.

( )

Este método se basa en el empleo de tres estaciones cercanas a la estación problema y que sirven
de estaciones índices. Cuando la precipitación normal anual de cualquiera de las estaciones índices
difiere más del 10% de la precipitación normal de la estación problema, se emplea la ecuación
anterior. Donde P es la precipitación en la estación indicada (X, A, B, C) y M es la precipitación
media anual. Este método es adaptable a regiones con grandes variaciones en la precipitación
debido a la orografía.

Ejemplo. Se desea determinar la precipitación en la estación X del año 1972 en el que dejo de
funcionar. Teniendo los siguientes datos en las estaciones A, B y C.

Estación Precipitación 1972 (mm) Precipitación promedio de 30 años (mm)


A 412 399
B 517 530
C 389 400
X ¿? 290

Solución

( )

Completación de datos mediante regresión simple

Es importante indicar que en todos los casos de completacion de datos, las estaciones, a ser
correlacionadas deben tener similitud en su ubicación (altitud, latitud, longitud, distancia a la
divisoria de aguas de la cuenca) y estén cercanas.

Entre los principales modelos de regresión usados en hidrología, podemos mencionar:

Regresión lineal simple: Y=a+bX

Regresión logarítmica: Y=a+b×ln(X)

Regresión potencial: Y=aXb con forma linealizada ln(Y)=ln(a)+b×ln(X)

2
Regresión exponencial: Y=a×exp(bX) con forma linealizada ln(Y)=ln(a)+bX, exp() es la función
exponencial.

Todas estas ecuaciones pueden ser analizadas como modelos de regresión lineal simple, usando su
forma linealizada.

Para completar la información mediante regresión, es importante contar al menos con una
estación cercana a la estación problema, además deben tener similitud en cuanto a los registros y
estén ubicadas en la misma cuenca o en su defecto en cuencas con parámetros geomorfológicos
similares. La estación cercana (B) deberá abarcar necesariamente un periodo de registro mayor
que la estación problema (A), de este modo se puede establecer una ecuación de regresión entre
los datos de períodos comunes y completar los datos que faltan en la estación problema (A). Es
importante para el empleo de este método que el valor del coeficiente de determinación entre las
precipitaciones de A y B sea alto R2≥0.7.

Regresión lineal

El análisis de regresión se refiere al problema de describir o estimar el valor de una variable,


llamada variable dependiente (Y), sobre la base de otra (X) u otras variables llamadas
independientes (X1, X2,…, Xn).

La regresión es uno de los modelos más simples y comunes en la hidrología está basado en la
suposición de que dos variables se relacionan en forma lineal. En general, el objetivo de un
modelo de esta naturaleza es poder estimar el valor de una variable, que se denomina variable
dependiente (Y), a partir del valor de la otra, que se llama variable independiente (X).

El análisis de este modelo es establecer una relación lineal entre la variable independiente ( ) y la
variable dependiente (Y), El modelo de la regresión poblacional es:

Yi    X   i .

En este modelo y representan valores reales, sin embargo será necesario preguntarnos

qué valores de y son los más representativos para el modelo Un criterio intuitivo nos

conduce a que y deben tener valores que minimice la desviación ei entre los valores

observados Yi y los valores predecidos Yˆi . Los estimadores de y son a y b


respectivamente.

(Y i  Y i )  ei  (Yi  


ˆ  ˆX i )  (Yi  a  bX i )

La ei  0 puede ser positivo o negativo, por lo que este criterio no es del todo conveniente ya
que en la ecuación:

3
Y  a  bX , la e i será igual a cero si la recta para por dos puntos. La e
i será
también cero cuando la recta sobreestima un punto en la misma proporción de subestima el otro

punto y de ese modo se tienen una infinidad de líneas que hagan e i  0.

Por las consideraciones de las desviaciones mencionadas se opta por minimizar la suma del
cuadrado de las desviaciones.

M  ei2  (Yi  Yˆi )2  (Yi  a  bX i )2

Esta suma puede minimizarse para a y b, derivando parcialmente M respecto de a y b e


igualando a cero.

= -2∑ Yi – a – b Xi)2 = 0

= -2∑ Yi – a – b Xi)2 = 0

Esta suma puede minimizarse para a y b, derivando parcialmente M respecto de a y b e igualando


a cero.

X .Yi 
 X . Y i i

b
i
n 
 ( X  X )(Y  Y )
i i

( X i )2 (X  X ) 2

 X i2 
n
i

a  (Yi  b X i ) / n  (Y  b. X )

La línea Y  a  bX es comúnmente conocida como la línea de regresión de Y en X. el


procedimiento de determinación de a y b se conoce como regresión simple.

La relación entre la suma de cuadrados total respecto a la media es denotada por r 2 se llama
coeficiente de determinación.

r2 
 (Yˆi  Y )2
b
 ( X  X ) (Y
i
2
i Y)

 ( X i  X ).( Yi  Y ) 
2

 (Y i  Y )2  (Y  Y ) i
2
(X i  X ) 2 .(Yi  Y ) 2

r 2  b2.
(X  X ) i
2

 b2.
Sx
 (Y Y ) i
2
Sy

Sx
r  b. Donde ⌊ 1  r  1 ⌋;
Sy

4
r
(X i  X ).( Yi  Y )

S xy
 ( X i  X ) . (Yi  Y )
2

2 1/ 2 S x .S y

r =coeficiente de correlación; S x =desviación estándar de X.; S y =desviación estándar de Y. y S xy


= desviación estándar de X e Y.

Ejemplo: Completación de datos utilizando Excel. Se tiene dos estaciones pluviométricas cercanas:
Ayaviri y Pucará. Se requiere completar la precipitación mensual del mes de marzo de la estación
Pucará en los años 1996, 1997 y 1998.

Año Marzo-Ayaviri Marzo-Pucará


1987 58.1 58.7
1988 157.1 181.3
1989 99.0 110.1
1990 38.6 85.5
1991 109.8 150.8
1992 45.3 54.7
1993 120.0 132.6
1994 144.6 113.2
1995 132.5 78.9
1996 61.0
1997 174.1
1998 115.2
1999 129.7 147.7
2000 108.6 107.9
2001 99.9 224.9
2002 68.0 113.3
2003 163.2 122.2
2004 86.6 104.1
2005 130.2 123.3
2006 105.6 124.6
2007 162.4 197.6
2008 58.3 62.4
2009 89.8 131.8

En Excel seleccionamos las celdas con los datos, y vamos a insertar grafico tipo dispersión en
puntos.

5
Seleccionamos los puntos y agregamos lineal de tendencia

Seleccionamos el modelo de regresión que queremos probar, y marcamos que nos presente la
ecuación y el valor de R2

6
Si seleccionamos lineal, y luego hacemos lo mismo con el modelo potencial, se obtiene el siguiente
gráfico de dispersión, mostrando las ecuaciones de estos modelos. Se puede hacer el
procedimiento varias veces y probar muchos modelos de regresión disponibles para la línea de
tendencia.

7
Puesto que el valor de R2 es mayor para el modelo Potencial, se utiliza esta ecuación para
completar los datos. En general se recomienda siempre escoger el modelo de regresión que tenga
el mayor valor de R2. Así se tiene los datos completados siguientes.

Año Marzo-Ayaviri Marzo-Pucará


1987 58.1 58.7
1988 157.1 181.3
1989 99.0 110.1
1990 38.6 85.5
1991 109.8 150.8
1992 45.3 54.7
1993 120.0 132.6
1994 144.6 113.2
1995 132.5 78.9
1996 61.0 84.8
1997 174.1 162.2
1998 115.2 125.7
1999 129.7 147.7
2000 108.6 107.9
2001 99.9 224.9
2002 68.0 113.3
2003 163.2 122.2
2004 86.6 104.1
2005 130.2 123.3
2006 105.6 124.6
2007 162.4 197.6
2008 58.3 62.4
2009 89.8 131.8

También podría gustarte