Está en la página 1de 15

METODOS ESTADSTICOS

Introduccin.

Uno de los objetivos de la asignatura de Hidrologa, es mostrar a los alumnos,


las herramientas de clculo utilizadas en Hidrologa Aplicada para diseo de
Obras Hidrulicas. Una de esas herramientas de clculo que se utiliza es a
travs del uso de las tcnicas estadsticas para determinar los eventos de
diseo mximos, asociados a diferentes periodos de retorno.

Este procedimiento de clculo se fundamenta en correlacionar los registros


histricos de las estaciones hidromtricas, con las diferentes distribuciones
de probabilidad que existen.

Sin embargo, el desarrollar en forma completa un ejemplo de aplicacin real, a


travs de esta tcnica, conlleva varias horas clase que en muchos casos hace
que el alumno pierda de vista el concepto fundamental, por esa razn, en este
trabajo, se plantea utilizar el proceso de automatizacin de los mtodos
estadsticos, a travs de programar en Visual Basic for Application de Excel,
las distribuciones de probabilidad ms utilizadas, con el objetivo de que el
alumno, interacte con la computadora para darle solucin a un problema y
preste ms atencin a los conceptos bsicos del tema, as como pueda utilizar
el programa para asignaturas consecuentes.

El trabajo consiste en tres partes fundamentales:

La primera, muestra los aspectos tericos relacionados con los mtodos


estadsticos para maximizacin de eventos hidrolgicos, la segunda, presenta
las caractersticas del programa de automatizacin y finalmente, la tercera
parte, presenta un ejemplo de aplicacin a un registro hidromtrico real.

Asimismo, este material didctico incluye un disco que contiene el archivo


Analisis de frecuencia.xls, que sirve para aplicar el proceso de
automatizacin a cualquier registro hidromtrico.

108
I MTODOS ESTADSTICOS EN HIDROLOGA.

I.1 ANLISIS DE FRECUENCIA.

Uno de los problemas ms importantes en la hidrologa consiste en obtener una


interpretacin de eventos probabilsticos a futuro, asociados a un registro en
el pasado.
Ejemplo de este caso, es la estimacin de gastos mximos y su procedimiento
se conoce con el nombre de anlisis de frecuencia.
Muchos procesos en Hidrologa deben ser analizados y explicados con base a la
ciencia probabilstica, por su inherente aleatoriedad. Por lo tanto, no es posible
predecir una avenida o una precipitacin con base nicamente determinstica.
Afortunadamente, los mtodos estadsticos permiten presentar, organizar y
reducir datos para facilitar su interpretacin y evaluacin. Esta parte del
trabajo presenta los gastos mximos anuales cuantificados y presentados con
distribuciones de probabilidad continua.
Muchas funciones de densidad de probabilidad continuas son usadas en la
Hidrologa, sin embargo este trabajo hace nfasis solo en las ms comunes.
Ellas son:

Distribucin Exponencial con dos parmetros


Distribucin Gamma de dos parmetros.
Distribucin Gamma de tres parmetros (Pearson tipo III).
Distribucin General de Valores Extremos (Gumbel)
Distribucin Gumbel de dos poblaciones (Gumbel 2p)
Distribucin Log-Normal.
Mtodo de Nash.
Distribucin Normal.

Para poder correlacionar una muestra de registro hidromtrico a una


distribucin de probabilidad, se requiere de un mtodo de estimacin de
parmetros que permita relacionar la informacin muestral con la poblacional,
los mtodos de estimacin de parmetros que se conocen son:

Momentos. Iguala momentos poblacionales con muestrales.


Mxima Verosimilitud. Supone que el mejor parmetro de una funcin debe
ser aquel que maximiza la probabilidad de ocurrencia de la muestra observada.

109
Mnimos cuadrados. Minimiza la suma de los cuadrados de todas las
desviaciones entre los valores calculados y observados.
Probabilidad Pesada. Deriva expresiones para los parmetros de
distribuciones cuyas formas inversas se puede definir inversamente.
Sextiles. El rango de la variable es dividida en 6 intervalos, tal que la
probabilidad acumulada en cada intervalo es de un sexto.
Momentos L.

Este material didctico, considera el mtodo de momentos para la estimacin


de parmetros en las funciones de distribucin.

Se debe recordar que una variable aleatoria, es aquella que no se puede


predecir con certeza al realizar un experimento y su comportamiento se
describe mediante su ley de probabilidades, la cual se especifica por su funcin
de densidad de probabilidad f(x), o por su funcin de densidad acumulada F(x)
que representa el rea bajo la curva de la funcin de densidad, representando
la probabilidad de ocurrencia del evento.

I.2 DISTRIBUCIN EXPONENCIAL CON DOS PARMETROS.

La funcin de distribucin exponencial se define como:


x
(
F ( x ) = 1 e x dx ) (I.1)
0

y la funcin de densidad de probabilidad es:

f ( x ) = e x (I.2)

donde, se conoce como parmetro de escala.

La estimacin del parmetro de escala por el mtodo de momentos se har a


travs de la siguiente ecuacin:

110
1
=
x$
(I.3)

donde x, es la media de la muestra, que se calcular a travs de la siguiente


expresin:
n
xi
x$ = n
(I.4)
i =1

La ecuacin para determinar los gastos calculados a travs de la muestra con


la distribucin Exponencial es:
1
Ln
T
Qcalc. = (I,5)

donde, T es el periodo de retorno en aos y Qcalc, es el gasto de diseo


calculado con la distribucin exponencial para un periodo de retorno dado.

I.3 DISTRIBUCIN GENERAL DE VALORES EXTREMOS I. (GUMBEL)

Supngase que se tienen N muestras, cada una de las cuales contiene n


eventos. Si se selecciona el mximo x de los n eventos de cada muestra, es
posible demostrar que, a medida que n aumenta, la funcin de distribucin de
probabilidad de x tiende a:
x
( x )
F ( x) = e e dx (I.6)
0

La funcin de densidad de probabilidad es entonces:

f ( x) = e
[ (x ) e ( x ) ]
(I.7)

donde y son los parmetros de escala y forma de la funcin, y se estiman


por el mtodo de momentos como = 0.78 s y = x -0.5772, donde x

111
representa la media de la muestra y se vala con la ecuacin I.4 y s es la
desviacin estndar que se calcular con la siguiente ecuacin:

n
( xi x$ )
i =1
s= (I.8)
n1

Despejando x de la ec. 1.6, la ecuacin para determinar los gastos a travs de


la distribucin Gumbel es:

T
x = Qcalc = ln ln (I.9)
T 1

I.4 MTODO DE NASH.

Utilizando la funcin de distribucin de probabilidad de Gumbel de una


poblacin, Nash propone la siguiente metodologa para calcular los parmetros
de la funcin:
Sea:

T
Qcalc = a + c ln ln (I.10)
T 1

Comparando la ec. I.10 con la I.9, a = y c = -

Con un cambio de variable, la ec. I.10 queda:

Qcalc = a + cx (I.11)

T
x = ln ln (I.12)
T 1

y a y c son los parmetros de la funcin, que se obtendrn a travs de un


anlisis de correlacin lineal simple con el criterio de los mnimos cuadrados.

112
n n n n

yi xi 2 xi y xi
i =1 i =1 i =1 i =1
a= (I.13)
2
n n
n xi 2 xi
i =1 i =1

n n n
n xi yi xi yi
b = i =1 i =1 i =1
2
(I.14)
n n

n xi 2
xi
i =1 i =1

El subndice i representa los datos muestrales.

I.5 DISTRIBUCIN GUMBEL DE DOS POBLACIONES (GUMBEL 2P).

En muchos lugares, los gastos mximos anuales pertenecen a dos poblaciones


diferentes, la primera es la de los gastos producidos por precipitaciones
relacionadas con los fenmenos meteorolgicos dominantes en la regin en
estudio, y la segunda es la de los gastos producidos por precipitaciones
ciclnicas, normalmente mayores que los primeros.

Se ha demostrado que, en estos casos, la funcin de distribucin de


probabilidad se puede expresar como:

[
F ( x ) = F1 ( x ) p + (1 p) F2 ( x ) ] (I.15)

donde F1(x) y F2(x) son, respectivamente, las funciones de distribucin de


probabilidad de los gastos mximos anuales producidos por tormentas
ciclnicas y de los producidos por ellas, y p es la probabilidad de que en un ao
cualquiera el gasto mximo no sea producido por una tormenta ciclnica. El
nmero de parmetros de la funcin anterior es:

n = n1 + n2 + 1 (I.16)

113
donde n1 = nmero de parmetros de F1(x), n2 = nmero de parmetros de F2(x)
y el parmetro restante es p. El valor de p ser entonces:

Nn
p= (I.17)
NT

donde Nn es el numero de aos de registro en que el gasto mximo no se


produce por una tormenta ciclnica y NT es el nmero total de aos de
registro.

F1(x) y F2(x) son del tipo Gumbel, por lo que la funcin de probabilidad queda
as:

1 ( x 1 ) 2 ( x 2 )
F ( x) = e e p + ( p 1)e e (I.18)

donde 1 y 1 son los parmetros correspondientes a la poblacin no ciclnica y


2 y 2 corresponden a la ciclnica.

La estimacin de parmetros 1 , 1 , 2 y 2, por momentos se calculan con el


mismo criterio de la distribucin Gumbel de 1 poblacin.

En este caso no es posible determinar una ecuacin para el clculo de gastos


mximos debido a que la funcin de distribucin de probabilidad de Gumbel de
dos poblaciones es implcita, eso implica que la solucin de dicha ecuacin debe
realizarse a travs de algn mtodo para determinar races en una funcin.

I.6 DISTRIBUCIN NORMAL.

La funcin de densidad de probabilidad normal se define como:

1 x

e2
1
f ( x) = (I.19)
2

donde, y son los parmetros de la distribucin. Estos parmetros


determinan la forma de la funcin f(x) y su posicin en el eje x.

114
Los valores de y son la media y la desviacin estndar de la poblacin y
pueden estimarse como la media y desviacin estndar de los datos. La funcin
de distribucin de probabilidad normal es:

1 x

e 2 dx
x 1
F ( x) =
2
(I.20)

Como se sabe, hoy en da no se conoce analticamente la integral de la ecuacin


F(x), por lo que es necesario recurrir a mtodos numricos para valuarla. Sin
embargo, para hacer esto se requiere una tabla para cada valor de y , por lo
que se ha definido la variable estandarizada:

x
z= (I.21)

que est normalmente distribuida con media cero y desviacin estndar


unitaria. As la funcin de distribucin de probabilidad se puede escribir como:

z2
z 1
F ( x) = F ( z) = 2
e 2 dz (I.22)

La funcin F(z) se ha calculado numricamente y se han publicado tablas de


ella. Debido a que la funcin F(z) es simtrica, en dicha tabla se encuentran
nicamente valores de:

z2
z 1
0 2 e 2 dz (I.23)

con lo que es posible calcular F(z) para cualquier valor de z.

Otra manera ms conveniente de estimar f(z) o F(z), es mediante frmulas


aproximadas. La funcin de densidad f(z) se aproxima, como:

C0 + C1 w + C2 w 2
z = w (I.24)
1 + d1 w + d 2 w 2 + d 3 w 3

115
Donde
Co = 2.515517
C1 = 0.802853
C2 = 0.010328
d1 = 1.432788
d2 = 0.189269
d3 = 0.001308

1
w= ln
2 (I.25)
(1 P(t ))
donde:
1
P(t ) = 1 (I.26)
T

Para calcular los gastos mximos de diseo con esta distribucin, se utiliza la
siguiente expresin:

Qcalc = Q + sz (I.27)

donde: Q y s son respectivamente la media y desviacin estndar de la


muestra.

I.7 DISTRIBUCIN LOG-NORMAL.

En esta funcin los logaritmos naturales de la variable aleatoria se distribuyen


normalmente. La funcin de densidad de probabilidad es:

1 ln x
1 1 2

f ( x) = e (I.28)
2 x

donde y son los parmetros de la distribucin. Los valores de y son


respectivamente la media y la desviacin estndar de los logaritmos de la
variable aleatoria.

116
Esta funcin no necesariamente es simtrica. Los valores de y se estiman a
partir de n observaciones xi, i = 1, 2, 3, ...n, como :

n
ln( xi )
= n
(I.29)
i =1

1
(
n ln x 2 2
)
= i
n (I.30)
i = 1

La funcin de distribucin de probabilidad es:

1 ln x

x 1 1 2
F ( x) = 0 2 x
e dx (I.31)

Los valores de la funcin de distribucin de probabilidad, se obtienen usando la


misma variable estandarizada, que se define para este como:

ln x
z= (I.32)

Por lo que para calcular los gastos mximos de diseo se utiliza la siguiente
expresin:

Qcalc = Q + sz (I.33)

donde: Q y s son respectivamente la media y desviacin estndar de los


logaritmos de la muestra.

117
I.8 DISTRIBUCIN GAMMA DE DOS PARMETROS.

La funcin de distribucin de probabilidad es:

x
1
x x e
F ( x) = dx (I.34)
( )
0

La funcin de densidad de probabilidad gamma de dos parmetros se define


como:

x

x ( 1) e
f ( x) = (I.35)
( )

donde y son los parmetros de escala y forma de la funcin y () es la


funcin Gamma.

Los parmetros y se evalan por el criterio de momentos a partir de las


siguientes ecuaciones:
s2
= (I.36)
x$

2
x$
= (I.37)
s

donde x y s son la meda y desviacin estndar de los datos.

Para obtener los eventos de diseo para diferentes periodos de retorno la


distribucin Gamma puede ser obtenida en forma aproximada utilizando la
variable estandarizada z de la distribucin Normal a travs de la siguiente
ecuacin de aproximacin:

118
3
1
Qcalc. = ( )( ) 1
1
+z (I.38)
9 9

I.9 DISTRIBUCIN PEARSON TIPO III. (GAMMA CON TRES


PARMETROS)

La funcin de densidad de probabilidad de la distribucin Pearson tipo III se


define como:

x x0
1 x x0 1
F ( x) = e (I.39)
( )

donde: , y x0 son los parmetros de escala, de forma y de ubicacin


respectivamente.

Los parmetros , y x0 se estiman a travs del criterio de momentos con las


siguientes ecuaciones:

gs
= (I.40)
2

4
= (I.41)
g2

x0 = x$ (I.42)

donde, x, s y g son la media, la desviacin estndar y el coeficiente de


asimetra respectivamente de la muestra.
Para determinar los eventos de diseo para cualquier periodo de retorno la
distribucin Pearson tipo III puede ser evaluada a travs de una aproximacin
con la variable estandarizada z de la distribucin normal, utilizando la siguiente
ecuacin:

3
1
Qcalc. = ( )( ) 1
1
+z + x0 (I.43)
9 9

119
I.10 MTODO DEL ERROR CUADRTICO MNIMO.

Consiste en calcular, para cada funcin de distribucin, el error cuadrtico


como:

1
n 2
E = (Qci Qmi ) 2 (I.44)
i = 1

Donde, Qci es el i-simo dato calculado con la distribucin de probabilidad,


Qmi es i-simo dato del registro hidromtrico en cuestin y E es el error
cuadrtico mnimo.

La funcin de probabilidad de mayor ajuste al registro hidromtrico ser


entonces aquella que cumpla un valor de E cercano a cero.

I.11 PROCEDIMIENTO DE CLCULO PARA CORRELACIONAR UNA


MUESTRA A UNA DISTRIBUCIN DE PROBABILIDAD.

1. Obtener los valores de la muestra.

2. Ordenar los gastos de la muestra de mayor a menor (Ya que el objetivo


es determinar gastos mximos).

3. Calcular el periodo de retorno para cada ao de registro, a travs de la


ecuacin:

n+1
T= (I.45)
m

donde
n, nmero de aos del registro
m, nmero de orden que se asigna a la muestra
T, periodo de retorno.

120
4. Determinar la probabilidad de excedencia

1
P( x ) = (I.46)
T

(En algunos casos ser necesario determinar la probabilidad de no


excedencia)

5. Calcular el gasto mximo de acuerdo a la distribucin de probabilidad


elegida.
6. Determinar los errores al cuadrado, con base en las diferencias entre
gasto calculado y medido.
7. Finalmente, evaluar la sumatoria de errores al cuadrado.

Ejemplo:
Los siguientes gastos anuales han sido obtenidos de los registros
hidromtricos de un ro. Estime la magnitud del gasto para un periodo de
retorno de 20 aos.

Ao Q(m3/s) Q m T T/T-1 Xi X2 Qi2*106 XiQi


1967 4000 5100 1 13 1.08 -2.50 6.55 26.01 -12877
1968 5100 4400 2 6.5 1.18 -1.79 3.20 19.36 -7871.6
1969 3270 4000 3 4.33 1.30 -1.34 1.80 16.00 -5352.0
1970 2860 3690 4 3.25 1.44 -1.00 1.00 13.63 -3690
1971 2660 3460 5 2.60 1.63 -0.72 0.52 11.97 -2501.6
1972 4400 3270 6 2.17 1.85 -0.49 0.24 10.69 -1566.3
1973 3690 3120 7 1.86 2.16 -0.26 0.07 9.73 -801.8
1974 3120 2990 8 1.63 2.59 -0.05 0.0025 8.94 -137.5
1975 3460 2860 9 1.44 3.27 0.17 0.0289 3.18 471.9
1976 2570 2760 10 1.30 4.33 0.38 0.14 7.62 1057.1
1977 2760 2660 11 1.18 6.55 0.63 0.40 7.08 1665.2
1978 2990 2570 12 1.08 13.50 0.96 0.92 6.61 2423.5

121
40880 6.04 14.642 145.8 29180.7
sustituyendo en la ecuacin:

Qm =
40880
12
[
= 3406.7 m 3 / s ]

122

También podría gustarte