Está en la página 1de 14

39

Probabilidad y Estadística en Hidrología J. Abel Mejía M.

5 DISTRIBUCION DE PROBABILIDADES DE VARIABLES ALEATORIAS CONTINUAS

5.1 DISTRIBUCION UNIFORME O RECTANGULAR

En la distribución uniforme la probabilidad se distribuye uniformemente a lo largo de un


intervalo [a,b]. La función de densidad uniforme se define como:

1
f (X )  a≤X≤b
ba

Figura 5.1: Función de Densidad Uniforme

De manera similar la función de distribución resulta:

F(X) = 0 para X<a

X 1 X a
F ( X )  P( X  X 0 )   dx  para a≤X≤b
a ba ba

F(X) = 1 para X>b

F(X)

a b
Figura 5.2: Función de Distribución Uniforme

La media de la distribución uniforme es:

b x ab
E( X )     dx 
a ba 2
40
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

La varianza de la distribución uniforme está dada por:

a  b (b  a) 2
2
b x2
 ²  M 2  E ( X   )²  M 2  M   2
dx   
ba  2 
1
a 12

5.2 DISTRIBUCION NORMAL

La distribución normal, es una distribución de dos parámetros cuya función de densidad es:

( X  1 ) 2

2 22
e
f (X )  - < X < 
2 22

Los parámetros 1 y 22, estimados por el método de momentos o el método de máxima


verosimilitud son 1 =  (media aritmética) y 22 = 2 (varianza)

Por esta razón la distribución normal se expresa generalmente como:

( X  )2

2 2
e
f (X )  - < X < 
 2

La distribución normal es una función continua y simétrica con respecto a  por tanto el
coeficiente de asimetría es cero.

Si una variable aleatoria X tiene distribución normal con media  y varianza ² y además Y =
a + bX, la distribución Y también es normal con media Y = a + b y varianza 2Y = b²²

12
12 < 22 < 32

22

32

 X

Figura 5.3: Distribución Normal con la misma media y diferentes varianzas

2

1 2 3

Figura 5.4: Distribución Normal con la misma varianza y diferentes medias


41
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

DISTRIBUCION NORMAL ESTANDAR

Es la distribución normal en términos de la variable aleatoria estándar Z 


X    y tiene

como función de densidad:

Z2
1 2
f (Z )  e para: - < Z < 
2

La función de distribución acumulada F(Z) es:

t2
Z 1 2
F ( Z )  P( Z  Z 0 )   e dt

2

Una característica fundamental de la distribución normal estándar es que:  = 0 y ² = 1. De


la misma forma, el 68.26% de valores se encuentran en el rango (  ), el 95.44% en el
rango (  2) y el 99.74% dentro del rango (  3).

Figura 5.5: Distribución Normal Estándar con Media  y Desviación Estándar 

Ejemplo 5.1:

Se asume que los datos de caudales de un cierto río se distribuyen normalmente con media
igual a 15 m3/s y una varianza igual a 25. Determinar la probabilidad de encontrar valores de
caudales comprendidos entre 15.6 m3/s y 20.4 m3/s.

Solución:
( X 15) 2

225
20.4 20.4 e
P(15.6  X  20.4)   f ( X )dx   dX
15.6 15.6
5 2

Como la integración de la ecuación es complicada, es necesario transformar a su forma


estándar.

Q1  Q  15.6  15 Q2  Q  20.4  15


Z1    0.12 Z2    1.08
SQ 5 SQ 5

Entonces: P(0.12  Z  1.08) = P(Z  1.08) – P(Z  0.12)


42
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

De la tabla de distribución normal estándar P(0.12  Z  1.08) = 0.8599-0.5478 = 0.3121. Por


lo tanto: P(15.6  Q  20.4) = P(0.12  Z  1.08) = 0.3121

Ejemplo 5.2:

a) Construir la curva de densidad normal y el polígono de frecuencias relativas para los


datos de caudales de la tabla de distribución de frecuencias, cuya media es de 54 m3/s
y la desviación estándar de 16.4 m3/s
b) Determinar el valor de la descarga que ocurre una vez en 500 años o todos los
caudales mayores a ella.
c) Determinar la probabilidad de que ocurran caudales mayores o iguales a 95 m3/seg.

Solución:

a) Elaboración de la Tabla de Distribución de frecuencias relativas observadas y de


densidad normal

Tabla 5.1: Cálculo de la Frecuencia Relativa y Curva de Densidad Normal

Intervalo Marca de Frecuencia Frecuencia Límite de Z F(Z) Frecuencia


de clase clase Absoluta Relativa clase Qi (Qi - Q)/S P(Q<Qi) Relativa
(m3/s) Observada Observada fo (m3/s) Esperada fe
20 - 30 25.0 3 0.075 20.0 -2.073 0.0191 0.0526
30 - 40 35.0 5 0.125 30.0 -1.463 0.0717 0.1250
40 - 50 45.0 7 0.175 40.0 -0.854 0.1966 0.2070
50 - 60 55.0 11 0.275 50.0 -0.244 0.4037 0.2391
60 - 70 65.0 8 0.200 60.0 0.366 0.6428 0.1926
70 - 80 75.0 4 0.100 70.0 0.976 0.8354 0.1082
80 - 90 85.0 2 0.050 80.0 1.585 0.9436 0.0424
90.0 2.195 0.9859
Suma 40 1.000 Suma 0.97

Los valores de la función de distribución normal, F(Z), se obtienen de la tabla de distribución


normal estándar o en su defecto haciendo uso de la función estadística
DISTR.NORM.ESTAND.N del Microsoft EXCEL. Los valores de la frecuencia relativa
esperada, fe, se obtienen por diferencia entre los valores de F(Z) que corresponde a cada
límite.

Figura 5.6: Función de Densidad Normal Vs. Función de Densidad Observada

0.30

0.25
Frecuencia Relativa

0.20

0.15

0.10

0.05

0.00
0 10 20 30 40 50 60 70 80 90
Caudal (m3/s)

Observado Normal
43
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

b) La magnitud del caudal que ocurre una vez en 500 años es:

P(Q  Qi) = 1/500 = 0.002 = 0.2%

Determinamos el valor de Z a partir de la tabla normal estándar para:

P(Q < Qi) = 1 – 0.002 = 0.998; para lo cual Z = 2.88

Qi  Q Q  54
Z  0.2%  2.88 . Por lo tanto Q0.2% = 101.2 m3/s
S 16.4

QQ 95  54
c) Z    2.5
S 16.4

De la tabla de distribución normal estándar se obtiene:

P(Q  95) = 0.99 y P(Q > 95) = 1 - 0.99 = 0.01

Este valor de 0.01 = 1%, corresponde a la probabilidad de ocurrencia de caudales


mayores o iguales a 95 m3/s o que ocurre 1 vez en 100 años.

Ejemplo 5.3:

Las precipitaciones medias para el mes de Enero de dos cuencas A y B están normalmente
distribuidas con medias 80 mm y 83 mm respectivamente y desviaciones estándar de 6 y 3
mm, respectivamente. Se extrae al azar una muestra de 25 datos de precipitación
correspondiente a 25 años de registro para la cuenca A y otra muestra también de 25 datos
para la cuenca B. Determinar:

a) P( P A  P B  4 mm)
b) P( P A  P B  0)

Solución:
 
 
a)

P( P A  P B  4)  P  Z 
P A  P B    A   B 

4  (3) 
 5.2
1 / 2
  A2  B2  45 
  
 25 
  n A nB  

P( PA  PB  4)  P(Z  5.2)

De la tabla de distribución normal se obtiene: P(Z  5.2) = 0; por lo tanto


P( P A  P B )  4  0
44
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

 
 0  (3) 
b) P( P A  P B )  0  P  Z    P( Z  2.24)  0.9875
 45 
 25 

5.3 DISTRIBUCION EXPONENCIAL

La distribución exponencial continua es el equivalente de la distribución geométrica discreta.


Esta ley de distribución describe procesos en los que interesa saber el tiempo hasta que
ocurre un determinado evento; se utiliza para modelar tiempos de supervivencia como el
caso del tiempo que tarda una partícula radiactiva en desintegrarse. Una característica
importante de esta distribución es la propiedad conocida como “falta de memoria”; esto
significa que el tiempo transcurrido desde cualquier instante dado t0 hasta que ocurre el
evento, no depende de lo que haya ocurrido antes del instante t0. La distribución exponencial
se puede caracterizar como la distribución del tiempo entre sucesos consecutivos generados
por un proceso de Poisson.

Figura 5.7: Función de Densidad Exponencial

Figura 5.8: Función de Distribución Exponencial

Función de densidad: f ( X )  e X


X
Función de distribución: F ( X )   e t dt  1  e X
0

Rango de aplicación: X > 0 y  > 0


 1
Media de la distribución: E ( X )     Xe X dX 
0 
2
 1 1

X
Varianza de la distribución:   M 2  E ( X   )²  M 2  M 
2 2
X e
2
dX     2
  
1
0

Coeficiente de asimetría: g = 2 (constante hacia la derecha)


45
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

1
  (Estimado por el método de momentos y de máxima verosimilitud)
X

Ejemplo 5.4:

En el estudio de las características físicas de un terreno se ha tabulado la distribución del


número de depresiones y sus correspondientes superficies o áreas.

Tabla 5.2: Tabla de Distribución de Frecuencias – Distribución Exponencial

Área N° de depresiones Frecuencia Relativa Marcas de Frecuencia


(Ha) Frecuencia absoluta Observada Clase Relativa Esperada
Observada (fi) (fo) Xi (fe)

0.0 - 0.5 106 0.500 0.25 0.3200


0.5 - 1.0 36 0.170 0.75 0.2200
1.0 - 1.5 18 0.080 1.25 0.1500
1.5 - 2.0 9 0.040 1.75 0.1000
2.0 - 2.5 12 0.060 2.25 0.0700
2.5 - 3.0 2 0.009 2.75 0.0500
3.0 - 3.5 5 0.023 3.25 0.0300
3.5 - 4.0 1 0.005 3.75 0.0200
4.0 - 4.5 4 0.019 4.25 0.0140
4.5 - 5.0 5 0.023 4.75 0.0090
5.0 - 5.5 2 0.009 5.25 0.0060
5.5 - 6.0 6 0.028 5.75 0.0040
6.0 - 6.5 3 0.014 6.25 0.0030
6.5 - 7.0 1 0.005 6.75 0.0020
7.0 - 7.5 1 0.005 7.25 0.0010
7.5 - 8.0 1 0.005 7.75 0.0009
total 212 1.000 1.0000

a) Graficar el polígono de frecuencia relativa de los datos observados y superponga la


mejor aproximación de la curva de distribución exponencial.

b) Estimar la probabilidad de que una depresión seleccionada al azar tenga un área mayor
de 2.25 has.

Solución:
1 k
a) Media = X   X i fi 
1
0.25  106  0.75  36  ......  7.75  1  1.27 ha
n i 1 212
1
  0.787
X

La frecuencia relativa esperada, se calcula a partir de: fe = X.f(X), donde X es el


tamaño del intervalo y f(X) la función de densidad exponencial.

f(X) = e-X = 0.787e-0.787X con X correspondiente a la marca de clase

fe = Xf(X) = (0.5)(0.787e-0.787X ) = 0.3935e-0.787X

así: para X = 0.75 se tiene que fe = 0.22

b) P(X > 2.25) = P(área > 2.25) = 1 – P(X  2.25)


46
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

2.25
P( X  2.25)  1   0.787e 0.787X dX
0

 1  2.25
P( X  2.25)  1  0.787  e 0.787X   0.170
 0.787  0
P(X > 2.25) = 0.170

Figura 5.9: Distribución Observada Vs. Distribución Exponencial


0.6

0.5
Frecuencia Relativa

0.4

0.3

0.2

0.1

0
0.25 0.75 1.25 1.75 2.25 2.75 3.25 3.75 4.25 4.75 5.25 5.75 6.25 6.75 7.25 7.75
Marcas de Clase (ha)

Observado Exponencial

Ejemplo 5.5:

Una estructura se diseña en función de la fuerza de arrastre del viento. Para tal efecto
se tienen registros de valores de velocidad máxima anual. Determinar la función de
densidad y la función de distribución para estos valores teniendo en cuenta las
siguientes consideraciones:

- Los valores anuales máximos de velocidad del viento siguen aproximadamente una
distribución exponencial
- La probabilidad de registrar valores de velocidades mayores de 70 Km/hora es 0.1

Solución:

Función de densidad:

para X  0 ; k = constante

 k
 0
keX dX 

1 puesto que el área bajo la curva es 1; por lo tanto: k = 

x
Función de distribución: F ( X )  
0
e t dt  1  e X para X  0

P(0  X  70)  1  e X  1  e 70  1  0.1  0.9

de donde:  = 0.033
47
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

Por consiguiente: f(X) = 0.033 e-0.033X (Función de densidad)

F(X) = 1 – e-0.033X (Función de distribución)

Función complementaria de distribución: G(X) = 1 – F(X) = 1 – (1 – e-0.033X) = e-0.033X

Figura 5.10: Función de Densidad y Función de Distribución Exponencial

5.4 DISTRIBUCION GAMMA

La distribución gamma es una generalización de la distribución exponencial ya que, en


ocasiones, se utiliza para modelar variables que describen el tiempo hasta que se
produce α veces un determinado suceso. La distribución gamma, con parámetros α y ,
tiene la siguiente función de densidad.

X

 1
X e 
f (X )  para X > 0
 ( )

f(X) = 0 para X  0

f(X)

α=1

α=2

α=3

X
Figura 5.11: Función de Densidad Gamma

La función de distribución gamma, está dada por:


48
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

t

 1 
X t e
F(X )   
dt
0  ( )
Si  es entero la función de distribución gamma puede ser evaluado, según Mood (1974),
de:

j
X
X  1 
  

F ( X )  1 e   

j 0 j!

La distribución exponencial se deriva de la distribución gamma, para el caso particular de:


 = 1 y  = 1/

La función gamma de (); se define por siguiente función matemática:


( )   X  1e  X dX para  > 0
0

Propiedades de la Función Gamma:

() = ( - 1) si  = 1, 2, 3...


( + 1) = () si  > 0
(1) = (2) = 1
(1/2) = 
(  1)
( )  <0

La media para la distribución gamma es: E(X) =  = 

La varianza para la distribución gamma es: Var (X) = ² = ²

2
El coeficiente de asimetría para la distribución gamma es: g

Los estimadores para los parámetros de la distribución gamma por el método de


momentos son:

S² X²
ˆ  ˆ 
X S²

Donde X es la media aritmética y S² la Varianza de la muestra.

Por el método de la máxima verosimilitud los estimadores para los parámetros  y  son:

 X 
ln ˆ    ˆ   ln   ˆˆ  X
X 
 g 
49
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

1/ n
n 
  X 1  X 2  X 3 ... X n n
1
Donde: X g    X i  (media geométrica de la muestra)
 i 1 

ln ( X ) 
d
 (X ) 
dX

Thom (1958) propuso una relación aproximada para el estimar el parámetro , basado en el
truncamiento de la serie expandida de máxima verosimilitud:

4Y
1 1
3
ˆ   ˆ
4Y

Donde:

Y  ln X  ln X ̂ (Término de corrección)

Tabla 5.3: Factor de Corrección ( ̂ ) para el Estimador del Parámetro  por el
Método de Máxima Verosimilitud

̂ ̂ ̂ ̂ ̂ ̂


0.2 0.034 1.0 0.009 1.8 0.004
0.3 0.029 1.1 0.008 1.9 0.003
0.4 0.025 1.2 0.007 2.2 0.003
0.5 0.021 1.3 0.006 2.3 0.002
0.6 0.017 1.4 0.006 3.1 0.002
0.7 0.014 1.5 0.005 3.2 0.001
0.8 0.012 1.6 0.005 5.5 0.001
0.9 0.011 1.7 0.004 5.6 0.000

La tabla anterior muestra los valores de ̂ en función de ̂ comprendidos entre 0.2 y 5.6.
Para ̂ > 5.6 la corrección es despreciable. El procedimiento para calcular el factor de
4
1  1 Y
corrección consiste en considerar en un primer momento que ˆ 
3 y luego
4Y
calcular el valor de ̂ de la tabla, correspondiente al valor ̂ inicial. Para estimar el

parámetro ˆ 
ˆ

Thom (1958), comprobó que para  < 10 el método de momentos genera estimados
inaceptables para  y . Para  cercanos a uno, el método de momentos usa solo 50% de
la información de la muestra para estimar ˆ y solo el 40% para estimar ̂ . Esto indica que
los estimadores por máxima verosimilitud dan buenos resultados con la mitad de
observaciones.

Greenwood y Durand (1960) Presentaron la siguiente relación para los estimadores de


máxima verosimilitud:
50
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

0.5000876  0.1648852Y  0.0544274Y 2


ˆ  Para 0  Y  0.5772 (con error de 0.0088%)
Y

8.898919  9.0595Y  0.9775373Y ²


ˆ  Para 0.5772 < Y  17.0 (con error de 0.0054)
Y (17.79728  11.968477Y  Y ²)

Y  ln X  ln X

Las expresiones anteriores tienen un ligero sesgo asintótico que para pequeñas muestras,
éste puede ser apreciable.

Bowman y Sheton (1968) presentaron la siguiente relación aproximada para estimar el


sesgo en el parámetro , cuando se emplean la ecuación de Thom, Greenwood y Durand.

1  0.111 0.032 
E ˆ      3  0.677    Para n  4 y   1
n 3  3 

Donde: E ˆ    es el sesgo de , con un error menor que 1.4% y n es el tamaño de la


muestra.

Bowman y Shenton (1968) sugieren que el sesgo en ̂ , puede ser aproximado por:

3ˆ (n  3)ˆ
E ˆ     ; E    ; n4
n n

Ejemplo 5.6:

Para los datos anuales de precipitación correspondiente al mes de enero, de la cuenca del
río Cañete (Tabla 1.1); estimar los parámetros de distribución gamma usando los métodos
de momentos y de máxima probabilidad. Estime la probabilidad que un valor de precipitación
anual excede 150 mm, si se considera que los datos siguen una distribución gamma.

Tabla 5.4: Precipitación para el mes de enero – Cuenca del río Cañete

P (mm)
Año Ln (P)
Mes de enero
1986 138.8 4.933
1987 199.3 5.295
1988 156.6 5.054
1989 159.9 5.075
1990 97.2 4.577
1991 106.2 4.665
1992 69.2 4.237
1993 114.6 4.741
1994 151.1 5.018
1995 99.8 4.603
1996 165.9 5.111
1997 120.2 4.789
1998 167.2 5.119
1999 99.8 4.603
2000 151.3 5.019
Suma 1997.1 72.840
51
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

Solución:

a) Método de momentos:

X
X 
1997.1
 133.14
n 15

S
X²  nX ²

(283295.25  265893.89)
 35.26
(n  1) 14

X ² 133.14 2 S ² 35.26 2
    14.26  
ˆ   9.34
S² 35.26 2 X 133.14

b) Método de máxima verosimilitud

 Procedimiento de Thom
15

 ln X i
72.840
ln X  i 1
  4.856
15 15

lnX = ln(133.14) = 4.891

Y  ln X  Ln X  4.891  4.856  0.035

1 1  1.333Y 1  1  1.333  0.035


ˆ    14.286
4Y 4  0.035

X 133.14
ˆ    9.320
ˆ 14.286

 Procedimiento de Green Wood y Durand

Y  ln X  Ln X  4.891  4.856  0.035

( 0.5000876 + 0.1648852Y - 0.0544274Y²)


αˆ=  14.287
Y

X 133.14
ˆ    9.319
ˆ 14.287

Estos estimadores de los parámetros  y , pueden ser corregidos

3ˆ 3  14.287
E ˆ       2.857
n 15

Eˆ     Eˆ   E   ˆ  E 


52
Probabilidad y Estadística en Hidrología J. Abel Mejía M.

E   ˆ  Eˆ     14.287  2.857  11.429

El valor de  = 11.429 se sustituye en la ecuación de Bowman y Shenton y resulta:

1  0.111 0.032 
E ˆ      3  0.677   
n 3  3 

1  0.032 
E ˆ    
0.111
 3  11.429  0.677     2.802
15  3  11.429 11.429 3 

Este valor de Eˆ     2.802 , se aproxima a 2.857 por lo que finalmente los estimadores
son:

ˆ  11.429

X 133.140
ˆ    11.649
ˆ 11.429

c) P(precipitación > 150 mm) = 1 – P(precipitación  150 mm)

Si consideramos los parámetros estimados por máxima verosimilitud se tiene:

X X
 
 1  11.4291 11.649
150 X e 150 X e
P( precipitac ion  150)  1   
dX  1   dX
0  ( ) 0 11.64911.429
(11.429)

La integral puede ser evaluada usando tablas de distribución Gamma, o en su defecto


haciendo uso de la función estadística DISTR.GAMMA.N del Microsoft EXCEL, que calcula
la función de distribución gamma.
X

 1
150 X e 
Para X = 150;  = 11.429 y  = 11.649, se tiene: F ( X )   0   ( )
dX  0.6947

El valor de 0.6947 es calculado de: DISTR.GAMMA.N(150,11.429,11.649,VERDADERO).


Por lo tanto:
X

 1
150 X e 
G( X )  P( X  150)  1  P( X  150)  1   dX  1  0.6947  0.3053
0   ( )

También podría gustarte