Está en la página 1de 70

Captulo 5

REVISIN DE CONCEPTOS DE ESTADSTICA Y


PROBABILIDAD

73

La planeacin y el diseo de proyectos relacionados con el agua necesitan


informacin de diferentes eventos hidrolgicos que no son gobernados por
leyes fsicas y qumicas conocidas, sino por las leyes de azar. Por ejemplo,
el caudal de un ro vara da a da y ao tras ao, y no puede predecirse
exactamente cual ser su valor en un perodo de tiempo cualquiera. En el
caso del diseo de un puente, el estudio hidrolgico determinara la
creciente asociada con una probabilidad crtica(se busca determinar el caso
crtico), la cual se supone representa el riesgo para el puente. Esto solo
puede determinarse a travs del anlisis probabilstico y estadstico basado
en los registros hidrolgicos del pasado.
Es dable afirmar que la hidrologa, en algunos casos, trata con variables
aleatorias cuyo comportamiento no puede predecirse con certidumbre. El
comportamiento de una variable aleatoria est descrito por una ley de
probabilidades, la cual asigna medidas de probabilidad a posibles valores o
rangos de ocurrencia de la variable aleatoria. Las variables aleatorias
pueden ser discretas o continuas.
Se dice que una variable aleatoria es discreta si ella slo puede tomar
valores especficos. Por ejemplo, si N denota el nmero de das lluviosos en
el mes de diciembre, entonces N es una variable aleatoria discreta. En este
caso, la ley de probabilidades asocia medidas de probabilidad a cada posible
ocurrencia de la variable aleatoria.
U

Una variable aleatoria es continua si puede tomar todos los valores en un


rango de ocurrencia. Por ejemplo, si Q es una variable aleatoria que denota
el valor de los caudales promedios diarios del ro Magdalena, entonces Q
U

74

puede asumir cualquier valor y es entonces una variable aleatoria continua


En este caso la ley de probabilidades asigna medidas de probabilidad a
rangos de ocurrencia de la variable aleatoria.
En el anlisis probabilstico y estadstico en hidrologa, se asume que la
informacin histrica disponible de una variable hidrolgica representa una
muestra tomada de una poblacin cuyas caractersticas se desconocen. En el
anlisis probabilstico se analizan posibles leyes de probabilidad que pueden
describir el comportamiento de las variables de la poblacin. En el anlisis
estadstico, se hacen inferencias sobre la variable (la poblacin), usando la
muestra. Por ejemplo, cuando se calcula una media con observaciones
disponibles, se est infiriendo que la media calculada es la media de la
poblacin, lo cual no necesariamente es verdad, pues esto depender de la
calidad de la informacin, del nmero de observaciones y otros aspectos.
El hecho es que muchos fenmenos hidrolgicos son errticos, complejos y
de naturaleza aleatoria, y solo pueden ser interpretados en un sentido
probabilstico. Uno de los problemas ms importantes en hidrologa es la
interpretacin de registros de eventos pasados para inferir la ley de
probabilidades de la variable hidrolgica (poblacin) de inters,
procedimiento que en hidrologa se conoce con el nombre de anlisis de
frecuencia.
Por ejemplo supngase que se tienen registros del caudal del ro Magdalena
durante un perodo de 50 aos. Son factibles dos tipos de anlisis:
descriptivo y de inferencia. El primero se realiza sin ninguna referencia a su
poblacin, de la cual se tiene una muestra de 50 aos. Consiste,
bsicamente, en calcular propiedades estadsticas, como media, varianza y
otras. En el segundo, la muestra se analiza para inferir las propiedades de su
poblacin, lo cual ayudar a derivar las caractersticas probabilsticas del
caudal. El primero es una aplicacin de los mtodos estadsticos que

75

requieren poca decisin y poco riesgo. El segundo involucra riesgos y


requiere una total comprensin de los mtodos empleados y el peligro
involucrado en la prediccin y estimacin de las variables.
Los objetivos bsicos de la estadstica en la hidrologa son entre otros:
1)
2)
3)
4)
5)

Interpretacin de las observaciones


Anlisis de la calidad de la informacin
Inferencia sobre el comportamiento de la variable
Extraccin del mximo de informacin de los registros
Presentacin de la informacin en grficas, tablas, ecuaciones, que
bsicamente ayudan a la toma de decisiones en el planeamiento de
los recursos hdricos.

En resumen, el objetivo principal de la estadstica en hidrologa es obtener


informacin de los fenmenos hidrolgicos pasados y hacer inferencias
acerca de su comportamiento en el futuro.

5.1 CONCEPTOS BSICOS


5.1.1 Concepto de probabilidad.
La probabilidad de ocurrencia de un evento dado es igual a la relacin entre
el nmero de sucesos favorables m y el nmero de sucesos totales, n:
P( X = x ) =

m
n

La teora de la probabilidad se basa en los siguientes axiomas:

76

(5.1)

1)

La probabilidad de ocurrencia de un evento, Pi, siempre tiene un


valor entre 0 y 1, as:
B

0 Pi 1

(5.2)

.
La probabilidad de un evento cierto es 1:

i =1

=1

(5.3)

2) Si X1 y X2 son eventos independientes y mutuamente excluyentes,


entonces:
B

P ( X 1 X 2 ) = P( X 1 ) + P( X 2 )

(5.4)

Dos eventos son independientes si la probabilidad de ocurrencia de uno no


se ve afectada por la ocurrencia del otro,. y se dice que son mutuamente
excluyentes cuando la ocurrencia de uno imposibilita la ocurrencia del otro.
Los axiomas anteriores permiten la definicin de conceptos importantes.
Por ejemplo, si dos eventos X1 y X2 no son mutuamente excluyentes, la
probablidad de que ocurra X1 u ocurra X2 est dada as:
B

P ( X1 X 2 ) = P ( X1 ) + P ( X 2 ) P ( X1 X 2 )

(5.5)

La P( X 1 X 2 ) es llamada unin de probabilidades y se lee la probabilidad


de X1 o X2.
B

77

La probabilidad de que dos eventos independientes ocurran de manera


simultnea es el producto de las probabilidades individuales as:

P ( X1 X 2 ) = P ( X1 ) P ( X 2 )

(5.6)

La P( X 1 X 2 ) es llamada la probabilidad de interseccin y se lee la


probabilidad de X1 y X2.
B

La probabilidad de que ocurra un evento X1 dado que ha ocurrido X2 se


llama probabilidad condicional y se denota as:
B

P(

X1

X2

) = P(

X1 X 2
)
P( X 2 )

(5.7)

Ejemplo 5.1
Supngase que el ro Cauca alcanza cada invierno un nivel de creciente con
una frecuencia relativa de 0.2. En el Cauca hay un puente cuya
probabilidad de falla en los estribos es 0,3 y la experiencia muestra que
cuando hay creciente, las probabilidades de esta falla suben a 0,5. Las
probabilidades son:
P(creciente) = P(C) = 0,2
P(no creciente) = P(C) = 0,8
P(falla) = P(F) = 0,3
P(no falla) = P(F) = 0,7
P (falla dada creciente) = P(F/C)= 0,5
Se desea conocer la probabilidad de falla del puente.
Solucin:
El puente falla (queda inutilizado) cuando falla en los estribos o cuando hay
creciente; esto se puede denotar as:

78

P( C F ) = P( C ) + P( F ) P( C F )

Aplicando la ecuacin 5.7 de probabilidad condicional:


P ( C F ) = P( C ) P ( F )
C
Reemplazando valores, se obtiene:
P ( C F ) = 0. 2 . 0 . 5 = 0. 1
Al reemplazar este valor en la expresin de unin de probabilidades, se
concluye finalmente que P(CF)=0.4

5.1.2

Perodo de retorno:

Se define el perodo de retorno, Tr, de un evento de cierta magnitud como el


tiempo promedio que transcurre entre la ocurrencia de ese evento y la
prxima ocurrencia de ese evento con la misma magnitud. Se define
tambin como el tiempo que transcurre para que un evento sea excedido o
igualado, al menos una vez en promedio. Si P es la probabilidad de
excedencia, se puede demostrar matemticamente que:
1
(5.8)
Tr =
P
B

Por ejemplo, si un caudal de 8098 m3/s es excedido en promedio una vez


cada 10000 aos, entonces su perodo de retorno, Tr, es de 10000 aos.
P

5.1.3

Concepto de riesgo.

En el diseo de obras hidrulicas expuestas a grandes avenidas, es necesario


considerar el riesgo asociado con el valor seleccionado para el diseo. Por
lo comn, el ingeniero disea una obra para resistir una avenida de cierta
magnitud. Se define el riesgo R de un diseo como la probabilidad de que la
avenida para la cual se disea la obra sea excedida. Se entiende que sta es

79

una situacin de riesgo, pues la obra se disea para soportar cierta avenida
mxima , y crecientes mayores le podran hacer dao o incluso destruirla. El
riego R puede entonces escribirse como:
1 n
R = 1 - (1 - )
(5.9)
Tr
La confiabilidad se define como el complemento del riesgo (Confiabilidad =
1-R). Se quiere que la obra tenga un riesgo pequeo de daarse o, lo que es
lo mismo, una alta confiabilidad.
Ejemplo 5.2
Qu perodo de retorno debe escoger un ingeniero en el diseo de un
box-culvert, si se acepta solo el 10% de riesgo de avenida en una vida til,
n, de 25 aos?
Solucin:
Aplicando la ecuacin 5.9 se tiene:
R = 0.1 = 1 - (1 -

1
Tr

25
T

Reemplazando los valores de Tr y n se obtiene:


B

TR = 238 aos
B

Ejemplo 5.3
Una presa por gravedad puede fallar por deslizamiento (A), por crecientes
(B), o por ambas. Asumir que :
1) La probabilidad de falla por deslizamiento es dos veces la
probabilidad de falla por creciente: P(A)=2 P(B)

80

2) La probabilidad de falla por deslizamiento, dado que ha habido creciente,


es 0.8
3) La probabilidad de falla de la presa es de 1*10-3
P

Determinar la probabilidad de que ocurra un deslizamiento, P(A).


Solucin:
La presa queda inutilizada cuando se presenta una falla por deslizamiento o
cuando hay una creciente, lo que puede expresarse como:
P( A B ) = 0.001 = P( A ) + P( B ) P( A B )

(1)

Se tiene adems que:


P(A) = 2 P(B)

(2)

Reemplazando la (2) en la (1):


0.001 = 3P( B ) P( A B )

(3)

AB
)
P( B )

(4)

Se sabe que:
P(

A
B

) = 0.8 = P(

Resolviendo simultneamente la (3) y la (4), se obtiene:


P(A) = 9.1 * 10-4
P

81

Ejemplo 5.4
De 1000 circuitos de tubera de acueducto en una ciudad, se reportan 15
contaminados con materias fecales; 5 tienen excesivas concentraciones de
plomo (Pb) y entre stos dos de ellos contaminados tambin por materias
fecales. Se pregunta:
B

a)
b)

c)
d)

Cul es la probabilidad de que un sistema seleccionado al azar


resulte con contaminacin fecal?
Suponiendo que un sistema se encuentre contaminado con materias
fecales, cul es la probabilidad de que tambin est contaminado con
plomo?
Cul es la probabilidad de que un sistema seleccionado al azar est
contaminado?
Suponiendo que la probabilidad de contaminacin hallada en el
numeral anterior no es satisfactoria, y que se desea que no exceda de
0.01, cul es el valor permisible para la probabilidad de
contaminacin por materias fecales, asumiendo que el valor de la
probabilidad condicional hallada en el numeral b an se puede
aplicar?

Solucin:
Llamemos P(F) a la probabilidad de contaminacin por materia fecal, P(Pb)
a la probabilidad de contaminacin por plomo y P(C) a la probabilidad de
contaminacin por plomo o por materia fecal. Se tiene entonces:
B

a) P(F) = 17/1000
b) La probabilidad condicional P(Pb/F) puede expresarse como:
B

P( Pb / F ) =

P(Pb F)
P(F)

82

y P(Pb) = 5/1000. Reemplazando, se obtiene que:


P(PBI/F) = 2/17
B

c)Se pregunta en este numeral el valor de P(C); este valor establece la


probabilidad de que un circuito est contaminado con plomo o con materias
fecales. Como hay 15 circuitos contaminados con materias fecales y 5
contaminados con plomo, se tiene entonces que:
P(C) = 20/1000= 0.002
d) La probabilidad de contaminacin C se puede expresar como:
P( C) = P( F Pb ) P( F ) + P( B ) P( F Pb )

(1)

y se conoce el valor de la probabilidad condicional:


P( Pb / F ) = 2 / 17 = P( Pb F )

(2)

P( F )

Resolviendo la (1) y la (2) simultneamente se halla que:


P(F) = 0.00567

5.2 DISTRIBUCIONES DE FUNCIONES DE PROBABILIDADES EN


HIDROLOGIA

Tal como se haba mencionado anteriormente, el comportamiento de las


variables aleatorias discretas o continuas se describe con la ley de
probabilidades asociada, que asigna medidas de probabilidad a ocurrencias
o a rangos de ocurrencia de la variable. Estas leyes de probabilidad reciben
el nombre de funciones de distribuciones de probabilidad. Como notacin,
se representa por una letra mayscula la variable aleatoria, y por una letra
minscula, un valor especfico, una relacin o una muestra de la variable.
U

P(X = a) indica la probabilidad de que la variable aleatoria X tenga un valor


de a; similarmente, P(a<X<b) indica la probabilidad que la variable

83

aleatoria X est en el intervalo [a, b] .Si se conoce la probabilidad P(a<X<b)


para todos los posibles valores de a y b, se dice que se conoce la
distribucin de probabilidades de la variable X.
Si se tiene una muestra cuyas observaciones se asumen extradas de una
misma poblacin (idnticamente distribuidas), ellas pueden presentarse
como un histograma de frecuencias. Todo el rango disponible de la variable
aleatoria se divide en intervalos discretos; se cuenta el nmero de
observaciones que cae en cada intervalo, y el resultado se dibuja en un
diagrama de barras como el mostrado en la Figura 3.1, que representa la
precipitacin promedio anual en una estacin.
U

FIGURA 5.1 Histograma de frecuencias.


Supngase que se tiene una variable continua y el ancho x del intervalo
que se usa para el histograma se escoge tan pequeo como sea posible;
supngase igualmente que se tiene el suficiente nmero de observaciones en
cada intervalo, para que el histograma de frecuencia muestre variaciones
suaves en todo el rango de valores.
Si el nmero de observaciones ni en el intervalo i que cubre el rango [xi-x,
xi] se divide por el nmero total de observaciones, N, el resultado se
denomina funcin de frecuencia relativa fs (x):
B

84

ni
n

f s ( xi ) =

(5.10)

la cual es un estimado de P( xi -x<X<xi), la probabilidad de que la variable


aleatoria X caiga en el intervalo [xi -x, xi]. El subndice s indica que la
funcin es calculada de los datos muestrales.
B

La suma de los valores de las frecuencias relativas en un punto es la funcin


de frecuencia acumulada, Fs(x),dada como:
U

F S ( x i ) = f S ( x j)

(5.11)

j =1

Este es un estimado de P(X xi), la probabilidad acumulada de xi, o funcin


acumulada de probabilidades.
B

Las funciones de frecuencia relativa y frecuencia acumulada se definen para


una muestra. Las funciones correspondientes a la poblacin se obtienen en
el lmite cuando n: y x 0. En el lmite, la funcin de frecuencia
relativa dividida por el intervalo x, se convierte en la funcin de densidad
de probabilidades fX(x)
U

(x)
f X (x) = lim f S
n
x
x 0

(5.12)

La funcin de frecuencia acumulada se convierte en la funcin acumulada


de distribucin de probabilidades FX(x)
U

FX (x) = lim FS (x)


n
x 0

85

(5.13)

cuya derivada es la funcin de densidad de probabilidad:

f X (x) =

dFX (x)
dx

(5.14)

Para un valor dado de la variable aleatoria X, Fx(x) es la probabilidad


acumulada P(X x), y puede expresarse como la integral de la funcin de
densidad para el rango X x.
B

P(X x) = FX (x) =

(u)du

(5.15)

en donde u es una variable de integracin. Si se tiene la funcin de


distribucin acumulada para una variable X y se tiene un valor xA de esa
variable, (ver Figura 5.2) se cumple que:
B

FX (xA ) = P (X x A )

(5.16)

Una forma bastante usada en hidrologa para escribir el valor de una


variable hidrolgica asociada a cierto perodo de retorno es la de utilizar lo
que se conoce como factor de frecuencia, K. En este caso, el valor de la
variable se puede escribir como:
X A = + K

86

(5.17)

Donde representa la media y es la desviacin tpica de la variable


hidrolgica. XT es el valor de la variable aleatoria asociada a un perodo de
retorno T. Como se sabe:
B

FX (X T ) = P (X XT )

= 1 - P (X > XT )

P(XXT ) representa la probabilidad de excedencia, la cual est relacionada


con el perodo de retorno como:
B

FX(x)

P( X X T ) =

1
T

(5.18)

1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1

FIGURA 5.2 Distribucin acumulada

De donde:
FX ( X T ) = 1

87

1
T

10

O:
1
T

FX ( + K ) = 1

Y se obtiene finalmente:
K=

1 1
1
FX 1

FX-1 ( ) representa el inverso de la distribucin acumulada de


probabilidades. Por ejemplo, para obtener FX-1 (1 - 1/T), se entra al grfico
5.2 con el valor de 1-1/T al eje de probabilidades, y se lee en el otro eje el
valor del inverso de la distribucin acumulada de probabilidades. Lo que
significa que el factor de frecuencia es funcin de la distribucin de
probabilidades y del perodo de retorno que se escoja.
B

PB

PB

La funcin de densidad de probabilidades tiene las siguientes caractersticas


cuando la variable aleatoria es continua:
1)

(x)dx = 1

(5.19)

2)
b

P(a X b) = f X (x)dx

(5.20)

3)
b

f X (x)dx = 0

(5.21)

Cuando la variable aleatoria es discreta las anteriores propiedades se pueden


denotar as:

88

1)
(5.22)

f (x ) = 1
i

2)
P( a X b ) =

xi b

f (x )

xi a

(5.23)

3)
i= j

P( X x j ) = f ( x i )

(5.24)

i =1

Lo que implica que las probabilidades se definen solo como reas bajo la
funcin de densidad de probabilidades, FDP, entre lmites finitos.
Ejemplo 5.5
Hallar la funcin de distribucin acumulada para una variable aleatoria que
se define como el nmero de veces que se lanza una moneda, hasta que
aparece cara.
Solucin:
La probabilidad de que caiga cara en cualquier ensayo es y es
independiente de la probabilidad de que caiga sello.
Si A es el evento de que caiga sello en el primer ensayo y B (es el evento)
de que caiga sello en el segundo ensayo, la probabilidad que suceda A y B
es:

89

P(AB) = P(A) + P(B) = (1/2)2


P

Si hay x-1 ensayos, la probabilidad de que caiga sello en el ensayo (x-1) es


(1/2)x-1 y la probabilidad de cara en el x-avo ensayo es:
P

(1/2)x-1 = (1/2)x
P

se tiene entonces que:


x

P(X=x)

Fx(x)

1
2
3

1/8

7/8

en donde x es el nmero de ensayos, P(X=x) es la probabilidad de


ocurrencia de sello en todos los ensayos y FX(x) es la funcin de
probabilidades acumulada.
B

5.3 MOMENTOS DE LAS DISTRIBUCIONES

Las propiedades matemticas de las distribuciones estadsticas pueden ser


definidas en trminos de los momentos de la distribucin.
Los momentos representan parmetros que tienen significado fsico o
geomtrico. Se reconocer fcilmente la analoga entre los momentos
estadsticos y los momentos de rea estudiados en mecnica de slidos.
El r-avo momento con relacin al origen se define como:

r =

f X (x)dx

90

(5.25)

o en el caso discreto:
n

r = xri f X ( xi )

(5.26)

i =1

El subndice se usa para momentos respecto al origen. El primer momento


con respecto al origen representa la media de la distribucin.
Los momentos pueden definirse con respecto a otro punto distinto al origen.
Por ejemplo, el r-avo momento con respecto a la media se puede escribir
como:

r = (x - ) f X (x)dx

(5.27)

r = f X ( x i )( x ) r

(5.28)

-
n

i =1

La primera de estas ecuaciones para el caso de una variable aleatoria continua


y la segunda si la variable es discreta.
Rara vez se necesita calcular ms de tres momentos. Estos son usados para
estimar los parmetros y describir las caractersticas de la distribucin.

5.4

CARACTERISTICAS ESTADISTICAS BASICAS

Uno de los usos de la estadstica es extraer la informacin esencial de una


muestra de datos, para determinar las caractersticas y el comportamiento de
la poblacin. Hay algunas caractersticas bsicas, como la media, la
varianza y otras que se pueden calcular o estimar utilizando la muestra de
datos disponibles, para tratar de entender el comportamiento general de la
poblacin.

91

En general, las caractersticas estadsticas bsicas se calculan como el valor


esperado E de alguna funcin de una variable aleatoria. El valor esperado de
una funcin g(X) de una variable aleatoria X se define como:
U

E[g( X )] =

g( u )f

( u )du

(5.29)

En donde fX (u) representa la funcin de distribucin de probabilidades


(FDP) de la variable X
B

Las principales caractersticas son:


-

La media : representa el valor esperado de la variable misma. Para


una variable aleatoria X, la media E(X) es el primer momento con
respecto al origen; es una medida de la tendencia central de la
distribucin:

E(X) = =

xf

(x)dx

(5.30)

El estimador de la media a partir de una muestra se puede escribir


como:

1 N
x = xi
N i =1
-

(5.31)

La varianza 2: mide la variabilidad de los datos, la dispersin de


los mismos alrededor de la media. Es el segundo momento respecto
a la media:
P

92

E[(X - ) ] = 2 = (x - ) f X (x)dx
2

(5.32)

El estimador de la varianza a partir de una muestra est dado por:


2
x =

1 N
2
(

x
i
x )

N - 1 i =1

(5.33)

La desviacin estndar : es una medida de la variabilidad con las


mismas dimensiones que X; es la raz cuadrada de la varianza y su

valor estimado se denota por . Mientras mayor sea la desviacin


estndar, mayor es la dispersin de los datos. ( ver Figura 5.3).
-

El coeficiente de variacin CV: est definido por la relacin de la


desviacin estndar y la media, y se puede escribir como:
CV =

(5.34)

x
; es una medida adimensional de la
x
variabilidad. alrededor de la media.
cuyo estimado es

Asimetra: la distribucin de los valores de una distribucin


alrededor de la media se mide por la asimetra, la cual est dada por
el tercer momento alrededor de la media:

E[(X - ) ] = (x - ) f X (x)dx
3

93

(5.35)

FIGURA 5.3 Distribucin de probabilidades con diferente desviacin


estndar.
La asimetra se hace adimensional dividiendo la anterior ecuacin
por 3 y se obtiene as, el coeficiente de asimetra :
P

E[(x - ) ]

(5.36)

El estimador de est dado por:


N

x =

N ( xi - x )

(5.37)

i =1

(N - 1)(N - 2) x

Como se muestra en la Figura 5..4, para >0, asimetra positiva, los datos
se concentran a la derecha y para <0, asimetra negativa, los datos se
concentran a la izquierda.

94

<0

>0

fX (x)

FIGURA 5.4. Distribucin de Probabilidades con Diferentes


Coeficientes
Ejemplo 5.6
En una estacin pluviomtrica se tienen precipitaciones promedias
mensuales multianuales de un determinado mes, cuyas frecuencias absolutas
se muestran en la tabla siguiente. Encontrar la precipitacin promedia
mensual.
Frecuencia
Intervalo en mm

Absoluta

100-110
110-112
120-130
130-140
140-150
150-160
160-170

10
16
9
10
20
15
20

Solucin:

95

En total se tiene 100 valores, para cada intervalo se halla el valor medio o
marca de clase y se le asigna una frecuencia relativa, la cual es la frecuencia
absoluta sobre el nmero total de valores (100). El valor medio de cada
intervalo es xi y la frecuencia relativa es fx(xi).
B

Se elabora entonces la tabla siguiente.

Intervalo
clase (mm)

xi fx(xi)

Valor
medio xi
(mm)

F. absoluta

100-110

105

10

0.1

10.5

110-120

115

16

0.16

18.4

120-130

125

0.09

11.25

130-140

135

10

0.1

13.5

140-150

145

20

0.2

29

150-160

155

15

0.15

23.25

160-170

165

20

0.2

33

F. relativa

fx(xi)
B

=100

=138.90

Aplicando la ecuacin 5.29 la media se puede expresar como:

x = xifx(xi)=138.9 mm.
B

5.5

DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES


ALEATORIAS DISCRETAS

El uso de estas distribuciones se restringe a aquellos eventos aleatorios en


los cuales el resultado puede ser descrito solamente como un xito o como

96

un fracaso, esto es, solo hay dos eventos mutuamente excluyentes para un
experimento. Adems, los experimentos sucesivos son independientes y la
probabilidad permanece constante de ensayo a ensayo. Un ejemplo en
hidrologa sera la probabilidad de que un da sea lluvioso o seco. La
distribuciones de este tipo ms usadas en hidrologa son la distribucin
binomial y la geomtrica.

5.5.1 Distribucin binomial.


Consideramos como p la probabilidad de que el caudal mximo en un ao
en un ro exceda un valor de 1800 m3/s .La probabilidad de no excederlo, q,
es 1-p .Supngase que se est considerando un perodo de 3 aos. La
probabilidad de excedencia en el ao 3 y no en los aos 1 y 2 es qqp, dado
que los eventos son independientes ao a ao. La probabilidad de
excedencia en cualquiera de los 3 aos es pqq +qpq + qqp debido a que la
excedencia pudo ocurrir en el 1o., 2o o en el 3o. ao. La probabilidad de
excedencia en 3 aos est dada como 3q2p. La probabilidad de dos
excedencias en 5 aos es ppqqq, pqpqq1....qqqpp. Se puede ver que cada
uno de estos trminos es q3p2; el nmero de trminos es igual al nmero de
formas de arreglar dos items dentro de 5 items. Esto es (5/2) = 5x4/2 = 10 y
la probabilidad de tener dos excedencias en 5 aos es (5/2)q3p2
P

Puede generalizarse de tal manera que la probabilidad de x excedencias es n


aos est dada por (n/x)pxqn-x , lo que tambin puede expresarse as:
P

P( X = x ) =

n!
p x (1 p )n x
x! (n x)!

(5.38)

expresin conocida como distribucin binomial. Los parmetros de esta


distribucin son:

97

= np
2 = np(1 p )
=

(5.39)

(q p )
npq

Ejemplo 5.7
Como se dijo anteriormente, una creciente de Tr aos de perodo de retorno
se define como aqulla que tiene una probabilidad de excedencia de 1/Tr en
cualquier ao. Asumiendo que las mximas crecientes anuales son
independientes, la distribucin binomial permite resolver varios problemas
prcticos en hidrologa, as:
B

a) Cul es la probabilidad de que una creciente con un perodo de retorno


de 50 aos ocurra exactamente en ese perodo?
Aplicando la ecuacin 5.38 se tiene:

P( X = 1) =
b)

50 1
( ) 1 (1 1 / 50) 49 = 0.37
3 50

Cul es la probabilidad de que en 50 aos se presenten 3 crecientes


que igualen o excedan la de Tr =50 aos?
B

Con la misma ecuacin anterior se tiene:


P( X = 3) =

c)

50
(1 / 50) 3 (1 1 / 50)47 = 0.06
3

Cul es la probabilidad de que una o ms crecientes excedan el


caudal con 50 aos de perodo de retorno en ese mismo tiempo?

La clave para contestar esta pregunta est en las palabras una o ms.
Como los eventos son independientes y mutuamente excluyentes, se puede
escribir:

98

P[una o ms crecientes en 50 aos] = 1 - P[no crecientes en 50 aos] o lo


que es lo mismo:
P[una o ms crecientes en 50 aos]= 1

50
(1 / 50) 0 (1 1 / 50) 50 = 0.64
0

5.5.2 Distribucin Geomtrica.


Cuando se construye una obra con un caudal de diseo determinado, es de
inters para los diseadores conocer cuntos aos pasarn antes que este
caudal de diseo sea igualado o excedido. Si p es la probabilidad de
excedencia del caudal de diseo (1/Tr) , la probabilidad de falla en el n-avo
ao,P, es:
B

P = (1 p )n 1 p

(5.40)

Esta es la llamada distribucin geomtrica. La media y la varianza de la


distribucin geomtrica son:
1
P
(1 P )
2 =
P2

(5.41)

Ejemplo 5.9
El mximo nivel de la creciente anual de un ro se denota por H (metros):
Asumiendo que la funcin de densidad de probabilidad se describe como se
muestra en la grfica, determinar:
a) La altura de inundacin para un perodo de 20 aos.

99

b) Cul es la probabilidad de que durante los prximos 20 aos la altura


hallada en el numeral anterior sea excedida al menos una vez?.
c) Cul es la probabilidad de que durante los prximos 5 aos este valor
sea excedido exactamente una vez?

F(H)

H(m)

Solucin:
a) El rea bajo la funcin de densidad es 1, que equivale a P(5[H[7) =1.
Para un caudal con un Tr de 20 aos se cumple que:
B

P( H H Tr=20 ) = 1 / 20 = 0.05
lo que significa que 0.05 es un rea bajo la funcin de densidad y:
P( H H Tr=20 ) = 1 0.05 = 0.95

y se plantea la siguiente relacin:

100

(7 H Tr=20 )(0.95)

0.05 =

Despejando el valor de H, se obtiene finalmente:


H Tr=20 = 6.9 m

b) Se puede escribir la siguiente ecuacin:


P(HTr=20 sea excedida al menos una vez) =1 - P(HTr=20 no sea excedida)
B

Aplicando la ecuacin 5.38 (binomial ) se puede escribir entonces:


sea
excedida
P(HTr=20
20
1 (0.05) 0 (0.95) 20 = 0.642
0
B

al

menos

una

vez)

O sea que P(HTr=20 sea excedida al menos una vez) = 0.642


B

b) Aplicando tambin la ecuacin 5.38, se tiene:


5
P( H Tr = 20 = 1) = (0.05)1 (0.95) 0.4 = 0.024
1

Ejemplo 5.9
Tres diques de control de inundaciones se construyen en una planicie por la
cual corren dos ros, tal como se muestra en la figura. Los diques se disean
as:
El dique I tiene un caudal de diseo con un perodo de retorno de 20 aos.
El dique II tiene un caudal de diseo con un perodo de retorno de 10 aos
El dique III tiene un caudal de diseo con un perodo de retorno de 25 aos.
Asumir que las crecientes en los ros A y B son estadsticamente
independientes y que las fallas de los diques I y III tambin lo son.

101

a) Cul es la probabilidad de inundacin en un ao cualquiera producida


solamente por el ro A.
b) Cul es la probabilidad de inundacin de la planicie en un ao?
c) Cul es la probabilidad de que no haya inundacin en los prximos 4
aos?

Solucin:
a)El ro A puede producir inundacin en la planicie si falla el dique I o si
falla el dique II, lo que se puede expresar como:
P(I II ) = P(I ) + P(II ) P(I II )
P(I II ) = 0.05 + 0.1 0.1 0.05 = 0.145

b) La probabilidad de inundacin se da por el ro A o por el ro B, lo que


puede expresarse como:
P( A B ) = P( A ) + P( B ) P( A B )
P(A)=0.145, hallado en el numeral anterior y P(B) =1/25=0.04, lo que
implica que:

102

P( A B ) = 0.145 + 0.04 0.145 0.04 = 0.179

c) La probabilidad de inundacin, P, en cualquier ao, es 0.179, como se


explic en el numeral anterior, y la probabilidad ,q, de no inundacin
ser entonces:
q =1 -P =1 - 0.179 =0.821
y la probabilidad de no inundacin en 4 aos ser entonces:

P(no inundacin en 4 aos) =(0.821)4 =0.454


P

Ejemplo 5.10
Un proyecto se disea con un caudal que tiene un perodo de retorno de 10
aos. Cul es la probabilidad de que este caudal se presente por primera vez
al quinto ao de acabado el proyecto?

Solucin:
Este es un ejemplo donde puede aplicarse la distribucin geomtrica, as:
La probabilidad de excedencia, p, para este caso es :

p =1/Tr=1/10=0.1
Entonces:

P(probabilidad de inundacin 5 ao)=(0.1)(1-0.1) =0.06561

5.6. DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES


ALEATORIAS CONTINUAS

103

La mayora de las variables hidrolgicas son variables aleatorias continuas.


Enseguida se describen brevemente las distribuciones de probabilidades ms
usadas en anlisis de frecuencia de estas variables.

5.6.1 La distribucin Normal


La distribucin Normal es una distribucin simtrica en forma de campana,
conocida tambin como Campana de Gauss. Es fundamental en el dominio de
la estadstica y la probabilidad. Una razn es que el teorema del lmite central
establece que para varias condiciones muy generales, la distribucin de la
suma de un gran nmero de variables aleatorias puede aproximarse a la
Normal, sin importar a qu distribucin pertenezcan ellas mismas. Muchos
procesos fsicos pueden conceptualizarse como la suma de procesos
individuales. Por otra parte, muchos procesos de inferencia estadstica se
basan en suposiciones de que la variable aleatoria se distribuye normalmente.
Es por ello que la Normal encuentre tantas aplicaciones en hidrologa: en
pruebas de hiptesis, intervalos de confianza, etc.
Una variable aleatoria X se distribuye de acuerdo con una distribucin de
probabilidades Normal si su FDP est dada como:

f X (x) =

1
x 2

( x x )2
2 2 x

(5.42)

Los parmetros de la distribucin son dos: la media,x, y la desviacin


estndar x. La asimetra de la distribucin es cero. Esta distribucin tiene una
forma de campana simtrica, como se muestra en la Figura 5.5, por lo tanto la
media, la moda y la mediana son iguales.
B

Si se hace la siguiente transformacin:

104

= (x x ) / x
se obtiene como FDP y como funcin acumulada de la variable :

f u (u) =

1 - u2
e 2
2

1
Fu (u) =
2

-w
2

(5.43)
d

FIGURA 5.5 Distribucin normal.


La variable u es llamada variable estandarizada, tiene media cero y desviacin
estndar uno. Debido a que la variable normal estandarizada tiene todos sus
parmetros conocidos, existen tablas para encontrar la funcin acumulada de
esa variable. La tabla 5.1 es una de ellas.
Aunque la simetra de la distribucin la hace inaplicable para valores
extremos, la distribucin Normal describe el comportamiento probabilstico
de los valores medios bastante bien.
La distribucin normal se usa para:

105

Aproximar la distribucin de probabilidades de errores aleatorios .

Comparar distribuciones: las propiedades de una muestra de variables no


normales pueden compararse con las de variables normales.

Muchos estadsticos pueden ser normalmente distribuidos, como, por


ejemplo, la media de la mayora de las variables hidrolgicas.

106

5.6.1.1 Estimacin de parmetros


Solo se presentar en estas notas la estimacin de parmetros por el mtodo
de los momentos, que fue desarrollado en 1902 por Karl Pearson. El
consider que un buen estimativo de los parmetros de una distribucin de
probabilidades es aqul para el cual los momentos de la funcin de densidad
de probabilidades son iguales a los momentos correspondientes de la muestra.
Los estimadores de los parmetros de la distribucin normal por el mtodo de
los momentos son:
1 N
xi
N i =1

(5.44)

N
1
= ( x i )1 / 2
N

(5.45)

5.6.1.2 Factor de frecuencia


Para la distribucin normal, el factor de frecuencia est dado como:
K=

x -

(5.46)

que es la misma variable reducida, definida por la ecuacin (5.41).


La magnitud de la variable XT para un perodo de retorno dado T puede
encontrarse, utilizando el factor de frecuencia, con el siguiente procedimiento:
1
1
1.
F u (K ) = 1 K = Fu1 (1 )
T
T
B

107

Usando el valor calculado de 1 en la tabla 5.1, se lee el valor


T
de x en la primera columna, que corresponde a K o F-1 (1- 1/T)

2.

3.

Se calcula el valor buscado como:

X T = + K
Ejemplo 5.11
Se tiene una estacin con 30 aos de datos de caudales medios anuales con
media de 117 m3/s y desviacin estndar de 94 m3/s. Si los datos se ajustan a
una distribucin Normal, cul es el caudal correspondiente a un perodo de
retorno, Tr, de 100 aos?.
P

Solucin:
En este caso se puede escribir:
Fu(K) = 1 - 1/Tr = 0.99
K = Fu-1 (0.99)
Con el valor de 0.99 en la tabla 5.1, se obtiene:
K = 2.326
El valor asociado a Tr=100 se calcula como:
Q100 = Q + Q K = 117 + 94 x 2.326 = 335.6 m3/s
B

PB

5.6.1.3 Intervalos de confianza


Cuando se desea hallar cualquier estadstico, por ejemplo la media,
generalmente se dispone de una muestra de tamao limitado. Se quiere saber
qu tan cercano puede estar ese estimado al verdadero valor desconocido de la
poblacin. En otras palabras, se quisiera conocer con una cierta certeza
(probabilidad) la franja de valores entre los cuales se encontrara el verdadero
valor de la poblacin. Si esa franja es grande, habr mucha incertidumbre en el

108

valor estimado de la media, y si es pequea, habr, por el contrario, mucha


confianza en ese valor estimado. Con ese fin se utilizan los llamados intervalos
de confianza.
Supngase, por ejemplo, que se desea estimar la media de la poblacin, .
Asmase que 1 y 2 son dos estadsticos (funciones de la muestra aleatoria)
tales que: 1 < 2 y P(1< < 2) =;. Entonces [1 , 2] es llamado el
intervalo de confianza para la media ., ; es llamado el nivel de confianza
(nivel de probabilidad) y 1 y 2 son llamados los lmites de confianza inferior
y superior, respectivamente. Esta definicin puede extenderse al intervalo de
estimacin de un parmetro cualquiera o a una funcin del parmetro.
Se debe tener en cuenta que los intervalos de confianza y los lmites de
confianza son realmente variables aleatorias, ya que son funciones del tamao
de la muestra y de estimadores a su vez, funcin de muestras aleatorias. Como
los tamaos de la muestra varan, los intervalos de confianza cambian de una
muestra a otra. Mientras ms estrecho es el intervalo de confianza, mejor es el
procedimiento de estimacin.

Para el valor estimado asociado a un perodo de retorno cualquiera, los


intervalos de confianza se calculan usando el error estndar, ST, el cual es una
medida de la desviacin estndar de la magnitud de un evento calculado a
partir de una muestra respecto a la verdadera magnitud del evento. Se
presentarn para todas las distribuciones, los intervalos de confianza para los
diferentes cuantiles de la poblacin.
B

Para la distribucin Normal, los lmites de confianza para el verdadero valor de


un cuantil asociado con un periodo de retorno T son:

XT u1- ST

109

(5.47)

en donde ; es el nivel de probabilidad, u1- es el cuantil de la distribucin


Normal estandarizada para una probabilidad acumulada de 1- y ST es el error
estndar.
B

Cada distribucin tiene expresiones para hallar el error estndar, por ejemplo,
el de la distribucin Normal es:

ST =

1
x
(1 + K 2 / 2)2
N

(5.48)

Ejemplo 5.12
Los caudales medios anuales de un ro con media 1.5 m3/s y desviacin
estandar de 0.6 m3/s se distribuyen normalmente. Cul es la probabilidad de
que se produzca un caudal medio igual o menor a 1 m3/s, en cualquier ao?.
P

Solucin:
Se tiene entonces que:
P( X 1) = P(

1
)

Reemplazando los valores:


P (

1 1 .5
) = P( 0.83)
0 .6

En la tabla 5.1, se encuentra P(-0.83). Considerando la simetra de la


distribucin normal (ver Figura 5.6 en donde A = B), se tiene:

P( -0.83) = 1 - P( 0.83) = 1 - 0.797 = 0.203

110

FIGURA 5.6 Simetra de la distribucin normal.


Ejemplo 5.13
La escorrenta anual de una pequea cuenca se distribuye normalmente con
media de 356 mm y desviacin estndar de 76.2 mm. Determinar la
probabilidad de que la escorrenta anual sea menor que 280 mm en todos los
tres siguientes aos.

Solucin:

P 280) = P(

280 356
) = P( 0.997)
76.2

y:
P( 0.997 ) = 1 0.8413 = 0.1587

La probabilidad de que sea menor en tres aos consecutivos es:

0,1587 x 0,1587 x 0,1587 = 0,00399


5.6.2 Distribucin Log Normal
Consideremos un clculo hipottico de la escorrenta en una cuenca. La
escorrenta es el producto de varios factores aleatorios, como lluvia, rea

111

contribuyente, prdidas, coeficiente de evaporacin, etc. En general, cuando


la variable aleatoria X es el producto de un gran nmero de otras variables
aleatorias, la distribucin de los logaritmos de X puede aproximarse a la
Normal, ya que los logaritmos de X son la suma de los logaritmos de los
factores contribuyentes. Si se tiene una variable aleatoria X y ln X = Y se
ajusta a una distribucin Normal, se dice que la variable aleatoria X es
lognormalmente distribuida.
La funcin de densidad de esta distribucin, si se asume que Y=loga(X),
donde a es la base del logaritmo, es:
B

1 y - y
1
f X (x) =
exp 2
y x 2
2 y

y es el parmetro de escala y y es el parmetro de forma.


B

La forma de la distribucin lognormal se muestra en la Figura 5.7.

FIGURA 5.7 Distribucin lognormal.

112

(5.49)

Se ha demostrado que la distribucin lognormal puede aplicarse en un amplio


nmero de eventos hidrolgicos, especialmente a aquellos casos en los cuales
la variable tiene un lmite inferior, la distribucin emprica no es simtrica y
los factores que causan los eventos son independientes y multiplicativos.
Si la variable aleatoria X tiene un lmite inferior xo diferente de cero, y la
variable Z = X -xo sigue una distribucin lognormal con dos parmetros,
entonces X se ajusta a una distribucin lognormal con tres parmetros. La
funcin de densidad de esta distribucin es:
B

1 ln (X - xo ) - y
1
f X (x) =
exp 2 (X - xo ) y
y
2

(5.50)

donde los parmetros y, y y xo son llamados los parmetros de escala, forma


y localizacin respectivamente.
B

La distribucin lognormal con tres parmetros puede aplicarse a eventos con


valores positivos o negativos, siempre que x x0; mientras que la lognormal
con dos parmetros solo puede aplicarse a eventos con valores positivos.
B

5.6.2.1 Estimacin de parmetros


Para la distribucin lognormal de dos parmetros, usando el mtodo de
momentos, los parmetros se pueden estimar como:
Y =

1 N
log a ( X i )
N i =1

1 N
2
Y = [log a ( X i ) Y ]
N i =1

(5.51)
12

(5.52)

Para la distribucin lognormal de tres parmetros, xo debe tambin estimarse.


Una manera de estimar xo requiere que el coeficiente de asimetra sea
B

113

positivo. En este mtodo, el segundo momento de Z = X - xo no depende de


x0, esto es, z = x y z = x - x0, entonces el lmite inferior xo se puede
expresar como:
Cv x

(5.53)
x0 = x 1 Cv z
Donde:
B

Cv x =

x
x

(5.54)

Cv z = z
z

Donde:

(1- w )
2/3

Cvz =

1
w = - x + 2x + 4
2

1/3

1/2

(5.55)

];

x > 0

en donde x es el coeficiente de asimetra de x.


B

Los parmetros de la distribucin lognormal de dos parmetros tambin


pueden estimarse con base en las relaciones entre los parmetros de la
variable transformada Y y Y y los parmetros de la variable original X y
X, dadas como:
1 2
Y = log a ( X ) Y
(5.56)
2
B


Y = log a 1 + X 2
X

114

1
2

(5.57)

En este caso, se estiman X y X con los datos originales, y con las


ecuaciones anteriores se estiman Y y Y los parmetros de la distribucin
lognormal.
B

Ejemplo 5.14
Los caudales medios de un ro en una estacin hidromtrica han sido
modelados con las siguientes distribuciones:
a) Normal con parmetros = 256.7 m3/s y = 191 m3/s
b) Lognormal con parmetros y = 5.228 y y = 0.84
P

Calcular la probabilidad de que el caudal medio est entre 300 y 400 m3/s
P

Solucin:
a) Si se usa la Normal se tiene:

P(300[Q[400)= FX(400)-FX(300)
B

Si se usa la variable estandarizada , se tiene entonces que:

300 x
400 - x

Fu
P(300Q400)= F
x
x
= Fu (u400) - Fu (u300)
donde:
B

u300 = (300 - 256.7)/191 = 0.2267


B

con este valor, se va a la tabla 5.1 y se encuentra que Fx (0.2267) = 0.5871


y
u400 = (400 - 256.7)/191 = 0.75
B

de la tabla 5.1, se tiene: Fx (0.75) = 0.7734


B

115

lo que implica que:

P(300Q400)=0.7734 - 0.5871=0.1863
b) Si se usa la distribucin lognormal:

P(300Q400)=FY(ln(400))-FY(ln(300))
ln(400) Y
ln(300) Y
Fu

= Fu
Y
Y

y:
ln(300) = 5.704
ln(400) = 5.99
B

se tiene entonces que:


F(5.99 ) = (5.99 - 5.228)/0.84 = 0.91
de la tabla 5.1 se tiene que F(0.91) = 0.8186
F(5.704 )= (5.704 - 5.228)/0.84 = 0.564
de la tabla 5.1 se obtiene F(0.564) = 0.7123
se encuentra finalmente:
B

P(300 Q 400) = 0.8186 - 0.7123 = 0.106


Este ejemplo se puede resolver tambin calculando Y y Y a partir de x y
x con las ecuaciones 5.56 y 5.57.
B

5.6.2.2 Factor de frecuencia


Se utiliza el mismo factor de frecuencia que en la distribucin Normal,
excepto que este se aplica a los logaritmos de la variable y la ecuacin, para
un cuantil cualquiera XT queda:
B

ln (X T ) = y + K y

116

(5.58)

1
en donde K = Fu 1 1

Si se quiere trabajar con la variable no transformada al campo logartmico se


tiene que:
2

1/2 ln (1 + Cv )
expK T (ln(1 + Cv 2 )) -
- 1
2

K=
Cv

(5.59)

1
-1
K T = Fu 1 -
Tr

(5.60)

donde:

1
1
Fu 1 es el inverso de la funcin de distribucin Normal estandarizada
T

acumulada y Cv es el coeficiente de variacin


B

5.6.2.3 Intervalos de confianza


En el campo transformado, los lmites estn dados por los de la distribucin
Normal como:

ln(XT ) u1- 2 ST

(5.61)

en donde:

ST =

Y
N

117

(5.62)

1/2

= 1 + K T
2

(5.63)

Ejemplo 5.15
Se tiene un ro con caudales mximos anuales lognormalmente distribuidos,
con x =15 m3/s y x =5 m3/s; se da tambin Y =2.6554 y Y =0.3246.
Encontrar el caudal para un perodo de retorno de 100 aos. Si se tiene un
perodo de retorno de 30 aos de registro, cules son los lmites de confianza
para un ; de 10%?.
P

Solucin:
El coeficiente de variacin se calcula como:

5
Cv = x =
= 0.33
x 15
Para hallar KT, se procede as:
B

Fu (K T ) = 1 -

1
TI

= 1-

1
= 0.99
100

De la tabla 5.1:

K T = F1 (0.99) = 2.33
El valor de K se puede calcular usando la ecuacin (5.59) como:
2

1/2 ln (1 + 0. 33 )
exp 2.33 (ln(1 + 0. 332 )) -
- 1
2

K=
0.333

118

K= 3.028
El valor asociado a un perodo de retorno de 100 aos ser:

XT = 15 + 5 x 3.028 = 30.14 m3/s


B

Los lmites de confianza se hallan as en el campo transformado:


ln(XT ) u1- 2 ST
Se calcula primero con la ecuacin (5.63) y luego ST con la ecuacin (5.60),
el resultado es:
B

1/2

= 1 + 2.33 = 1.93
2

0.3246
= 0.11
ST = 1.93 *
30

De la tabla 5.1, se lee: 1-;=0.95=1.64


B

Por lo tanto:
ln (30.28) 1.64 * 0.11
= 3.41 0.1875
= [3.2225, 3.5975]
= [e3.2225, e3.5975] = [25.091, 36.5]
P

5.6.3 Distribucin Gumbel


Una familia importante de distribuciones usadas en el anlisis de frecuencia
hidrolgico es la distribucin general de valores extremos, la cual ha sido
ampliamente utilizada para representar el comportamiento de crecientes y
sequas. A partir de la distribucin general de valores extremos, se pueden
derivar tres tipos de distribuciones: la tipo I, comnmente conocida como
Gumbel, la tipo II y la tipo III, llamada tambin Weibull.

119

Ellas difieren entre s por el valor del parmetro de forma. La expresin


general de la funcin de densidad de probabilidades para la distribucin
extrema tipo I o Gumbel es:

f X (x) =

x -
1
x -
exp- exp

(5.64)

En donde y son los parmetros de la distribucin. La distribucin Gumbel


tiene la forma mostrada en la figura 5.8.

5.6.3.1 Estimacin de parmetros


Por el mtodo de momentos, los estimadores de los parmetros son:
=

= - 0.5772

(5.65)
(5.66)

donde y son la media y la desviacin estndar estimadas con la muestra.

5.6.3.2 Factor de frecuencia


El factor de frecuencia para la distribucin Gumbel es:
K=-

6
{0.577 + ln[lnTr - ln(Tr - 1)]}

donde TI es el perodo de retorno.


B

5.6.3.3 Intervalos de confianza

120

(5.67)

Los lmites de confianza por el mtodo de momentos para un nivel de


probabilidad ; son:
X T u 1- 2 S T

(5.68)

FIGURA 5.8 Distribucin Gumbel


ST =

(5.69)

= [1 + 1.1396K + 1.1 K 2]

1/2

(5.70)

K es el factor de frecuencia de la distribucin, dado por la ecuacin 5.67.

5.6.4 Distribucin Gamma


Esta distribucin ha sido una de las ms usadas en hidrologa. Como la
mayora de las variables hidrolgicas son sesgadas, la funcin Gamma se
utiliza para ajustar la distribucin de frecuencia de variables tales como
crecientes mximas anuales, caudales mnimos, volmenes de flujo anuales y
estacionales, valores de precipitaciones extremas y volmenes de lluvia de
corta duracin. La funcin de distribucin Gamma tiene dos o tres

121

parmetros. La ltima funcin es llamada tambin Distribucin Pearson tipo


III. La distribucin Gamma est relacionada con otras distribuciones muy
conocidas como las distribuciones Chi-cuadrado y la exponencial negativa,
que son casos particulares de la distribucin Gamma.
La distribucin Gamma de dos parmetros tiene una funcin de densidad de
probabilidades de la forma:
-1

1
x - x
f X (x) =
e
| | ( )

(5.71)

Donde:
0 x < para ; > 0
-: < x ; para ; < 0

; y son los parmetros de escala y forma, respectivamente, y () es la


funcin Gamma completa.
El parmetro siempre es mayor que cero, mientras que ; puede ser positivo o
negativo. La funcin Gamma completa est dada por:

() = z-1 e-z dz

(5.72)

La distribucin Gamma de tres parmetros tiene la siguiente funcin de


densidad de probabilidades:
-1

1
x - xo
x - xo
f X (x) =

exp
| | ( )

Donde:
xo x < ; para ; > 0
B

122

(5.73)

-: < x xo para ; < 0


B

; y son los parmetros de escala y forma, respectivamente, y xo es el


parmetro de localizacin.
La Figura 5.9 muestra formas de la funcin de densidad de probabilidades
Gamma para ; > 0.
B

5.6.4.1 Estimacin de parmetros


Para la distribucin Gamma de dos parmetros, usando el mtodo de los
momentos, se tienen las siguientes expresiones (para sus parmetros).
=

(5.74)

2 = 2

(5.75)

FIGURA 5.9 Distribucin Gamma.( Varas, Bois, 1998)


Los estimadores de los parmetros, por el mtodo de momentos, son los
siguientes:

123

1
= 2

Cv

(5.76)

$ son la media, desviacin estndar y coeficiente de variacin


$ , $ y C
v

calculados con la muestra, respectivamente.


Para la distribucin Gamma con tres parmetros o Pearson tipo III, los
parmetros, por el mtodo de momentos, pueden estimarse por:

2
=

0 =
X
$ es el coeficiente de asimetra calculado usando la muestra.

(5.77)

(5.78)

(5.79)

5.6.4.2 Factor de frecuencia


Si se define:

1
K T = Fu 1 -
Tr
el factor de frecuencia K tiene la siguiente forma:

124

(5.80)

1



2
2
3
K K T + (K t 1) + (K T 6K T ) (K T 1) + K T
6 3
6
6
6 (5.81)

Para la distribucin Pearson tipo III o Gamma de 3 parmetros, existen tablas,


como la 5.2, que dan el factor de frecuencia en funcin del coeficiente de
asimetra calculado con la muestra.

5.6.4.3 Intervalos de confianza


Si se tiene que:

XT u 1 2 S T

ST =
N

(5.82)

=(,Tr) y est tabulado para la Gamma de dos parmetros y para la Pearson


tipo III. La tabla 5.3 da valores de , para hallar el intervalo de confianza de la
distribucin Pearson tipo III.
B

5.6.5 Distribucin log Pearson Tipo III


Si los logaritmos de la variable aleatoria X se ajustan a una distribucin
Pearson Tipo III, se dice que la variable aleatoria X se ajusta a una
distribucin Log Pearson Tipo III. Esta distribucin es ampliamente usada en
el mundo para el anlisis de frecuencia de caudales mximos. Su funcin de
densidad est dada por:

1
ln(x) - y o
f x (x) =

x ()

-1

ln (x)- y o
-

(5.83)

donde ; es el parmetro de escala, es el parmetro de forma y yo el


parmetro de localizacin.
B

125

126

TABLA 5.2. VALORES DE KT PARA LA DISTRIBUCIN PEARSON


III (ASIMETRA POSITIVA)
B

Coeficiente

Probabilidad de Excedencia

de Asimetra

0.500

0.200

0.100

0.040

0.020

0.010

0.005

3.0

-0.396

0.420

1.180

2.278

3.152

4.051

4.970

2.9

-0.390

0.440

1.195

2.277

3.134

4.013

4.909

2.8

-0.384

0.460

1.210

2.275

3.114

3.973

4.847

2.7

-0.376

0.479

1.224

2.272

3.093

3.932

4.783

2.6

-0.368

0.499

1.238

2.267

3.071

3.889

4.718

2.5

-0.360

0.518

1.250

2.262

3.048

3.845

4.652

2.4

-0.351

0.537

1.262

2.256

3.023

3.800

4.584

2.3

-0.341

0.555

1.274

2.248

2.997

3.753

4.515

2.2

-0.330

0.574

1.284

2.240

2.970

3.705

4.444

2.1

-0.319

0.592

1.294

2.230

2.942

3.656

4.372

2.0

-0.307

0.609

1.302

2.219

2.912

3.605

4.298

1.9

-0.294

0.627

1.310

2.207

2.881

3.553

4.223

1.8

-0.282

0.643

1.318

2.193

2.848

3.499

4.147

1.7

-0.268

0.660

1.324

2.179

2.815

3.444

4.069

1.6

-0.254

0.675

1.329

2.163

2.780

3.388

3.990

1.5

-0.240

0.690

1.333

2.146

2.743

3.330

3.910

1.4

-0.225

0.705

1.337

2.128

2.706

3.271

3.828

1.3

-0.210

0.719

1.339

2.108

2.666

3.211

3.745

1.2

-0.195

0.732

1.340

2.087

2.626

3.149

3.661

1.1

-0.180

0.745

1.341

2.066

2.585

3.087

3.575

1.0

-0.164

0.758

1.340

2.043

2.542

3.022

3.489

0.9

-0.148

0.769

1.339

2.018

2.498

2.957

3.401

0.8

-0.132

0.780

1.336

1.993

2.453

2.891

3.312

0.7

-0.116

0.790

1.333

1.967

2.407

2.824

3.223

0.6

-0.099

0.800

1.328

1.939

2.359

2.755

3.132

0.5

-0.083

0.808

1.323

1.910

2.311

2.686

3.041

0.4

-0.066

0.816

1.317

1.880

2.261

2.615

2.949

0.3

-0.050

0.824

1.309

1.849

2.211

2.544

2.856

0.2

-0.033

0.830

1.301

1.818

2.159

2.472

2.763

0.1

-0.017

0.836

1.292

1.785

2.107

2.400

2.670

0.0

0.000

0.842

1.282

1.751

2.054

2.326

2.576

127

FIGURA 5.10 Distribucin Log-Pearson Tipo III. (Salas, 1992).


5.6.5.1 Estimacin de Parmetros
Los estimadores de los parmetros por el mtodo de los momentos son:
2
=

y

= y

2
y 0 = y

(5.84)

Donde y , y y son la media, desviacin estndar y coeficiente de


asimetra calculados usando los logaritmos de los datos, respectivamente.

5.6.5.2 Factor de frecuencia


Si se cumple que Y= ln X, se tiene que:

128

YT = ln XT = y + K y

(5.85)

En donde Y y y son la media y desviacin estndar de los logaritmos de X,


y K se obtiene de la tabla 5.2.
B

TABLA 5.3 VALORES DE PARA LA DISTRIBUCION PEARSON


TIPO III

0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0

Tr=2
1.0801
1.0808
1.0830
1.0866
1.0913
1.0987
1.1073
1.1179
1.1304
1.1449
1.1614
1.1799
1.2003
1.2223
1.2157
1.2701
1.2952
1.3204
1.3452
1.3690
1.3913
B

Tr=5
1.1698
1.2006
1.2309
1.2609
1.2905
1.3199
1.3492
1.3785
1.4082
1.4385
1.4699
1.5030
1.5382
1.5764
1.6181
1.6643
1.7157
1.7732
1.8374
1.9091
1.9888
B

Tr=10
1.3748
1.4367
1.4989
1.5610
1.6227
1.6838
1.7441
1.8032
1.8609
1.9170
1.9714
2.0240
2.0747
2.1237
2.1711
2.2173
2.2627
2.3081
2.3541
2.4018
2.4525
B

Tr=20
1.6845
1.7810
1.8815
1.9852
2.0915
2.1998
2.3094
2.4198
2.5303
2.6403
2.7492
2.8564
2.9613
3.0631
3.1615
3.2557
3.3455
3.4303
3.5100
3.5844
3.6536
B

Tr=50
2.1988
2.3425
2.4986
2.6656
2.8423
3.0277
3.2209
3.1208
3.6266
3.8374
4.0522
4.2699
4.4996
4.7100
4.9301
5.1486
5.3644
5.5761
5.7827
5.9829
6.1755
B

Tr=100
2.6363
2.8168
3.0175
3.2365
3.4724
3.7238
3.9895
4.2684
4.5595
4.8618
5.1741
5.4952
5.8240
6.1592
6.4992
6.8427
7.1881
7.5339
7.8783
8.2196
8.5562
B

5.6.5.3 Intervalos de confianza


Se utiliza la tabla 5.3 para hallar valores del parmetro y se cumple que:

129

y
N

ST =

(5.86)

Los lmite de confianza se pueden expresar como:

ln X T 1 / 2S T

(5.87)

5.7 ANLISIS DE FRECUENCIA

El anlisis de frecuencia puede hacerse de dos maneras: usando los llamados


factores de frecuencia o hallando la distribucin emprica de los datos
muestrales, por el mtodo de "Plotting position" o posicin de graficacin.
Como regla general, el anlisis de frecuencia no debe realizarse para perodos
cortos, menores de 10 aos de registros.
A continuacin se describe brevemente los dos procedimientos propuestos
para realizar el anlisis de frecuencia.

5.7.1 Posicin de graficacin o"Plotting Position"


La posicin de graficacin o plotting posittion" trabaja con la probabilidad
de excedencia asignada a cada valor de la muestra. Para determinar sta, se
han propuesto numerosos mtodos empricos. Si n es el nmero total de
valores y m es el rango de un valor en una lista ordenada de mayor a menor
(m = 1 para el valor mximo y m=n para el menor valor), la probabilidad de
excedencia se puede obtener por medio de las siguientes expresiones:

California:
P=

m
n

130

(5.88)

Weibull:
m
n +1

(5.89)

2m -1
2n

(5.90)

P=

Hazen:
P=

La expresin acumulada de probabilidades ms usada es la de Weibull. Con


las anteriores ecuaciones, se halla la que se conoce como distribucin
emprica de una muestra. Luego se puede hacer un anlisis para ajustar a la
distribucin emprica una de las distribuciones tericas vistas anteriormente.
La distribucin acumulada de una variable puede ser representada
grficamente en un papel de probabilidad diseado para la distribucin. En
este papel, las ordenadas representan el valor de x en una cierta escala y las
abscisas representan la probabilidad de P(X >x) o P(X< x), el perodo de
retorno o la variable reducida. Las escalas de las ordenadas y las abcisas son
diseadas de tal manera que cuando una muestra es de una poblacin con esa
distribucin, la grfica debe ajustarse a una lnea recta. El propsito de este
papel es "linealizar" las relaciones de probabilidad para que los datos puedan
ser fcilmente dibujados y usados en extrapolacin o propsitos de
comparacin. Se puede observar en las pginas siguientes los papeles de
probabilidad correspondientes a las distribuciones Gumbel y Log-Normal.

5.7.2 Factores de frecuencia


Ven te Chow propuso que toda muestra se puede ajustar a una expresin
como la siguiente:

X = + K

(5.91)

til para el anlisis de frecuencia hidrolgico, donde K es el factor de


frecuencia, $ es la media estimada y $ es la desviacin estndar estimada.
Cada distribucin tiene su factor de frecuencia como se vio anteriormente.

131

132

133

5.8 BONDAD DE
PROBABILIDADES

AJUSTE

DE

UNA

DISTRIBUCION

DE

En los numerales anteriores, se ha descrito el uso de varias distribuciones de


probabilidad para estimar eventos con perodos de retorno mayores que los de
los eventos histricos. Surge entonces el interrogante de cul de estas
distribuciones se debe utilizar para una muestra particular. No hay un acuerdo
entre los hidrlogos acerca de cul de las distribuciones debe usarse. Las
pruebas para comprobar la bondad del ajuste son necesarias, pero no son
suficientes para aceptar una distribucin. Tal vez las dos pruebas de bondad
de ajuste ms utilizadas en hidrologa son la Chi - Cuadrada y la Smirnov Kolmogorov.Con estas pruebas se escogera con la muestra, la distribucin de
probabilidades que representa el comportamiento probabilstico de la
poblacin. Una prueba adicional puede hacerse calculando la suma de los
cuadrados de las diferencias entre los valores observados y los calculados.
Aunque los procedimientos estadsticos no pueden por s solos determinar la
mejor distribucin de frecuencia, si pueden suministrar argumentos para
escoger la distribucin ms adecuada.
Por ejemplo, las distribuciones Pearson tipo III y Log-Pearson tipo III
requieren la estimacin del coeficiente de asimetra de datos muestrales. Esto
puede ser una razn suficiente para preferir cualquier otra distribucin, ya que
este parmetro tiene un comportamiento muy sesgado, por lo cual se
necesitara una gran cantidad de registros para tener un estimado ms o menos
confiable, y dichos registros no se consiguen fcilmente en nuestro medio. Por
otra parte, las distribuciones de dos parmetros tienen un valor fijo o ignoran
la asimetra de la poblacin, lo cual tampoco es conveniente.
En resumen, no hay un procedimiento nico para escoger la mejor
distribucin. Las pruebas estadsticas ayudan; el ajuste grfico tambin puede
contribuir; en definitiva, prima el juicio de quien est haciendo el anlisis.
5.8.1 Prueba Smirnov - Kolmogorov

134

El estadstico Smirnov - Kolmogorov, D, considera la mxima desviacin de


la funcin de distribucin de probabilidades emprica de la muestra, FE(x), de
la funcin de distribucin de probabilidades terica, escogida , Fx (x), tal que:
B

Dn = Max | FE(x) - Fx (x) |

(5.92)

La prueba requiere que el valor Dn calculado con la expresin anterior sea


menor que el valor tabulado Dn para el nivel de probabilidad requerido.
B

Esta prueba es fcil de realizar y comprende las siguientes etapas:


El estadstico Dn es la mxima diferencia entre la funcin de
distribucin acumulada emprica de la muestra y la funcin de
distribucin acumulada terica escogida.Se fija el nivel de
probabilidad. Valores como 0.05 y 0.01 son los ms usuales.
El valor crtico Da de la prueba debe ser obtenido de tablas como la
tabla 5.4. Este estadstico es funcin de y n.
Si el valor calculado Dn es mayor que Da, la hiptesis de que la
distribucin terica escogida se ajusta adecuadamente al
comportamiento probabilstico de la poblacin debe rechazarse, de
otra manera, se acepta esta hiptesis.
B

5.8.2 Prueba Chi Cuadrado


La prueba Chi-cauadrado se usa tambin para determinar el grado de ajuste de
una distribucin de probabilidades terica a una distribucin emprica.
Supongase que en una muestra se tengan una serie de posibles eventos E1, E2,
....Ek que ocurren con frecuencias observadas de O1, O2, .....Ok. Si se tiene
una distribucin terica de probabilidades se espera que esos eventos ocurran
con frecuencias e1, e2,....ek
B

TABLA 5.4 VALORES DE Dn


B

135

N
5
10
15
20
25
30
35
40
45
50
N50

;=0.20
0.45
0.32
0.27
0.23
0.21
0.19
0.18
0.17
0.16
0.15

;=0.10
0.51
0.37
0.30
0.26
0.24
0.22
0.20
0.19
0.18
0.17

;=0.05
0.56
0.41
0.34
0.29
0.27
0.24
0.23
0.21
0.20
0.19

;=0.01
0.67
0.49
0.40
0.36
0.32
0.29
0.27
0.25
0.24
0.23

1.07
N

1.22
N

1.36
N

1.63
N

Se est interesado en conocer como difieren las frecuencias observadas de las


frecuencias esperadas (halladas con una distribucin terica de
probabilidades). Una medida de la discrepancia entre frecuencias observadas
y calculadas est dada por el estadstico 2 as:
P

k
(O e ) 2
2 = i i
ei
i =1

(5.93)

donde:
Oi = ei
Si 2 =0, significa que las distribucion terica y emprica ajustan exactamente,
mientras que si 20, ellas difieren. La distribucin de la variable 2 se puede
asimilar a una distribucin Chi-cuadrado con (k-n-1) grados de libertad,
donde k es el nmero de intervalos y n es el nmero de parmetros de la
distribucin terica. La funcin 2 est tabulada en muchos textos de
estadstica.Supngase que la hiptesis Ho es aceptar que una distribucin
emprica se ajusta a una distribucin Normal. Si el valor calculado de 2 por la
ecuacin 5.89 es mayor que algn valor crtico de 2 ,con niveles de
significancia ;de 0.05 o 0.01 ( el nivel de confianza se define como 1-;, siendo
P

136

frecuentemente utilizados niveles de confianza del 95%), se puede decir que


las frecuencias observadas difieren significativamente de las frecuencias
esperadas y entonces la hiptesis Ho se rechaza (para esos niveles de
significancia). Si ocurre lo contrario, entonces se acepta. Este procedimiento
es llamado la prueba de hiptesis Chi- cuadrado.
B

Ejemplo 5.16
Se tienen los valores de temperatura mensual de una ciudad, mostrados en la
tabla 5.5 . Se supone que estas temperaturas se ajustan a una distribucin
Normal. Usando la prueba Smirnov-Kolmogorov, verificar la validez de esta
hiptesis.

Solucin:
La media de la muestra es 76.4F y la desviacin estndar es 3.1 F. Se fijan
dos hiptesis: una hiptesis Ho estipula que la variable X es normalmente
distribuida con los valores de la media y desviacin estndar calculados
anteriormente y la otra hiptesis alternativa, Ha, es lo contrario de sta.
B

Se puede fijar un intervalo de 1 F y se hace la tabla 5.6 donde FE(T) es la


frecuencia acumulada de la muestra, fT (t) es la frecuencia, FE(t)N es la
distribucin de probabilidades acumulada emprica y FT(t) es la distribucin
de probabilidades acumulada Normal (se halla utilizando el concepto de
variable reducida u y usando la tabla 5.1)
B

El mayor valor Dn es 0.0758. El valor Da obtenido de la tabla 5.5 para un ; del


90% es igual a 0.1963, lo cual significa que la hiptesis Ho puede aceptarse.
B

TABLA 5.5 Temperaturas en F8


P

137

Ao

Junio

Julio

Agosto

1944

77

77

77

1945

72

76

76

1946

76

78

74

1947

74

74

83

1948

78

80

76

1949

75

79

74

1950

75

73

70

1951

73

78

78

1952

82

81

77

1953

79

80

78

1954

78

83

80

1955

69

80

79

1956

74

77

77

1957

75

76

74

1958

72

76

74

1959

72

75

76

TABLA 5.6 Distribuciones de probabilidades emprica y


Normal para la temperatura.

138

fT(t)

FE(t)

FE(t)N

FT(t)

FE(t)N -FT(t)

68

0.0035

0.0045

69

0.0208

0.0084

0.0124

70

0.0417

0.0197

0.022

71

0.0417

0.0409

0.0008

72

0.1042

0.0778

0.0264

73

0.1458

0.1357

0.0101

74

14

0.2917

0.2206

0.0711

75

18

0.3750

0.3264

0.0486

76

25

0.5208

0.488

0.0328

77

31

0.6458

0.5753

0.0705

78

37

0.7708

0.6950

0.0758

79

40

0.83333

0.7995

0.0338

80

44

0.9167

0.8770

0.0397

81

45

0.9375

0.9306

0.0069

Ejemplo 5.17

139

Se tienen los caudales mximos instantneos de la estacin RP-3 en el Ro


Murr, en el departamento de Antioquia. Se desea encontrar el caudal de un
perodo de retorno de 50 aos hallado con las distribuciones Gumbel,
Lognormal de dos parmetros y Log Pearson tipo III.

Ao

Q m3/s

1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991

3239.0
3431.7
4577.9
3612.0
4151.8
1949.0
2342.9
1345.0
1862.2
1652.8
4220.0
4958.4
2664.9
1392.7

Solucin
Distribucin Gumbel
Aplicando la ecuacin de Ven Te Chow se tiene que:
Q Tr = 50 = + K
y:
= 2957.2 m3/s
P

= 1234 .58 m3/s


P

140

De la ecuacin 5.67 se halla el factor de frecuencia K=2.5924


Se tiene entonces que:
QTr=50=6158 m3/s
B

Aplicando la ecuacin 5.68 y 5.69 para hallar el error estandar, ST se obtiene


que:
B

ST=1111.458 m3/s
B

Para ;=0.05 se obtiene de la tabla 5.1 que T0.95=1.645 y aplicando la ecuacin


5.70 para los intervalos de confianza se obtiene finalmente que:
B

(4329.37 QTr=50=61587986.07)
B

Distribucin Log-Normal
Con los logaritmos de los valores de caudales mximos instantneos se
obtiene que:
y = 7.903

y = 0.4504
Aplicando la ecuacin 5.59 para hallar el factor de frecuencia K y utilizando
la tabla 5.1 se halla:
K=2.055
De la ecuacin 5.58:

ln QTr=50=8.8286
y sacando el antilogaritmo :
B

QTr=50=6827 m3/s
B

Con las ecuaciones 5.62 y 5.63 se obtiene un error estandar ST=0.2123


B

141

Para un ;=0.05 se obtiene de la tabla 5.1 T0.95=1.64. Finalmente :


B

(4814.4QTr=50=68279679.84)
B

Distribucin Pearson Tipo III


Se tiene que:
= 2957.2
= 1234.6
= 0.1702
De la tabla 5.2 se obtiene el valor del factor de frecuencia K:

K=2.144
y aplicando la ecuacin de Ven TE Chow:

QTr=50=5604 m3/s
B

Con la ecuacin 5.82 y con la tabla 5.3 se obtiene un error estandar ST=809.05
y los intervalos de confianza para ;=0.05 son entonces:
B

(4273QTr=50=56046934.9)
B

142

También podría gustarte