Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 Distribuciones de Probabilidad en Hidrologia: # Dias Nublados
1 Distribuciones de Probabilidad en Hidrologia: # Dias Nublados
Por P(x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente P(a
x b) denota la probabilidad de que un evento se encuentre en el intervalo (a,b). Si
conocemos la probabilidad P(a x b) para todos los valores de a y b, se dice que
conocemos la Distribución de Probabilidades de la variable x.
Ejemplo
Se tienen las probabilidades de que haya 1, 2, 3, ... etc, días nublados por semana en un
determinado lugar, con ellos calcule la distribución de probabilidades
x P(x) F(x)
0 0.05 0.05
1 0.15 0.20
2 0.25 0.45
3 0.20 0.65
4 0.15 0.80
5 0.10 0.90
6 0.08 0.98
7 0.02 1.00
Total 1.0
0.30
0.25 1.20
1.00
0.20
0.80
0.15
0.60
0.10 0.40
0.05
F(
f(
0.20
0.00 0.00
01234567
# dias nublados
0 2 4 6 8
# dias nublados
1
x P(x) F(x)
1 0.05 0.05
2 0.10 0.15
3 0.15 0.30
4 0.20 0.50
5 0.10 0.60
6 0.10 0.70
7 0.15 0.85
8 0.10 0.95
9 0.05 1.00
Total 1.00
0.25
0.20 1.20
0.15 1.00
0.80
0.10
0.60
0.05
0.40
0.00 F(
f(
0.20
123456789 0.00
Qmáx instántaneo *10² (m³/s)
0 2 4 6 8 10
Qmáx instántaneo *10² (m³/s)
0.35
0.30 1.20
0.25 1.00
0.20 0.80
0.15 0.60
0.10 0.40
F(
f(
0.05 0.20
0.00 0.00
12345678910
Qmáx instántaneo *10² (m³/s)
0 5 10 15
Qmáx instántaneo *10² (m³/s)
i)
f (x)dx 1
2
ii) P(a x b) b
f (x)dx
a
b
iii) b
f (x)dx 0
Lo que implica que las probabilidades se definen solo como AREAS bajo la función de
densidad de probabilidad (FDP) entre límites finitos.
n
M r xr f para la variable discreta
(x)
j1
n
M r (x )r f para la variable discreta
(x)
j 1
1.2.1 Media :
es el valor esperado de la variable misma . Primer momento respecto a la origen. Muestra
la tendencia central de la distribución
x f (x)dx
3
el valor estimado de la media a partir de la muestra es
1 n
x x
n i1 i
4
1.2.2 Varianza ²:
mide la variabilidad de los datos. Es el segundo momento respecto a la media.
2 (x )2 f
(x)dx
1
en el cual el divisor es n-1 en lugar de n para asegurar que la estadística de la muestra no
sea sesgada, es decir, que no tenga una tendencia, en promedio, a ser mayor o menor que
el valor verdadero. Las unidades de la varianza son la media al cuadrado, la desviación
estándar es una medida de la variabilidad que tiene las mismas dimensiones que la media
y simplemente es la raíz cuadrada de la varianza, se estima por s. El significado de la
desviación estándar se ilustra en la siguiente figura
1.00
0.80
0.60
f(
0.40
0.20
0.00
0 2 4 6 8 10
x
Efectos de la función de densidad
0.50de probabilidad
1.00 causados
1.30 por cambios en la desviación
estándar.
Coeficiente de variación Cv es una medida adimensional de la variabilidad su
estimado es s
Cv
x
5
1.2.3 Coeficiente de asimetría
la distribución de los valores de una distribución alrededor de la media se mide por la
asimetría. Se obtiene a partir del tercer momento alrededor de la media, dividiéndolo por el
cubo de la desviación estándar para que sea adimensional.
E[(x )3] (x )3 f
tercer momento respecto a la media
(x)dx
1
E`[(x )3 ]
3
n
n (x x)3
i1
Un estimativo del coeficiente de asimetría está dado por C
s (n 1)(n 2)* s3
Ejemplo
2 ANALISIS DE FRECUENCIA
6
Para determinar la magnitud de eventos extremos cuando la distribución de probabilidades
no es una función fácilmente invertibles se requiere conocer la variación de la variable
respecto a la media. Chow en 1951 propusó determinar esta variación a partir de un factor
de frecuencia KT que puede ser expresado:
X T KT
XT x K s
T
Para una distribución dada, puede determinarse una relación entre K y el período de retorno
Tr. Esta relación puede expresarse en términos matemáticos o por medio del uso de una
tabla.
1 1 ( x
2
)2
f (x) exp 2 x
2
7
Los dos parámetros de la distribución son la media y desviación estándar para los
cuales x (media) y s (desviación estándar) son derivados de los datos.
1 n
x x
n i1 i
1
s 21
n
(x x)2
n 1
i
i1
xT
KT
este factor es el mismo de la variable normal
K F 1(1 1T )
estándar T
XTr t(1 ) Se
Esta distribución es muy usada para el calculo de valores extremos por ejemplo Qmax,
Qmínimos, Pmax, Pmínima (excelentes resultados en Antioquia). Tiene la ventaja que X>0
y que la transformación Log tiende a reducir la asimetría positiva ya que al sacar logaritmos
se reducen en mayor proporción los datos mayores que los menores.
8
Limitaciones: tiene solamente dos parámetros, y requiere que los logaritmos de la variables
estén centrados en la media
1 ( y y )
f (x) 1 2 y
x22 exp x0
y = ln x
donde, y : media de los logaritmos de la población (parámetro escalar), estimado y
y : Desviación estándar de los logaritmos de la población, estimado sy.
1
s 21
n
(ln(x ) y)2
y
n 1
i
i1
Ln(XTr) = xTr+KSy
de donde,
XTr = eln (x T)
con K con variable normal estandarizada para el Tr dado, xy media de los logaritmos y Sy
es la desviación estándar de los logaritmos.
9
1
ExpKT *(Ln(1 Cv 2 ))2 ln(1 Cv ) 1
2
2
Kt
Cv
s
K es la variable normal estandarizada para el Tr dado, Cv es el coeficiente de
x
variación, x media de los datos originales y s desviación estándar de los datos originales.
En el campo transformado.
Ln(XTr ) t(1 ) ST
1
Se ( S y
2 2
1 KT
)n
2
Solución:
n=30
x= 15 m3/s xy=2.655
s = 5 m3/s sy = 0.324
En el campo original
1
ln(1 Cv2 )
ExpK *(Ln(1 Cv )) 2
2
1
2
Kt
Cv
10
s
Cv = 5/15 = 0.33
x
KT = 3.06
QTr = 15 + 5 * 3.028
QTr = 30.14 m3/s
LnQTr100 = 3.40992
Limites de confianza
Ln (QTr) t(1-) Se
( S
) 1
K 2 2
S y
1 T
e n 2
1 2
1
2.33 2
2
= 1.93
1.93 0.324
Se 30 0.11
11
t(1-) = t(0.95) = 1.645 (Leído de la tabla de la normal)
12
Ln(30.28) (1.645 ) (0.11)
3.41 0.18095
[3.22905 3.59095]
[e3.22905 e3.59095]
Ln(42.5) = 3.75
t = (3.75 - 2.655)/0.324
F(x)
f (x)dx
(x )
exp
exp
13
3.3.2 Estimación de parámetros
6
s
x 0.5772
Tr
6
KT 0.5772 lnln 1
T
r
Donde Tr es el periodo de retorno. Para la distribución Gumbel se tiene que el caudal para
un período de retorno de 2.33 años es igual a la media de los caudales máximos.
Xt t(1-) Se
s
Se
n
1
[11.1396KT 1.1KT 2
]2
QTr100 = x + KT s
KT 6
0.577 ln[ln100 ln(99)]
KT = 3.14
14
QTr100 = 15 + 3.14*5
QTr100 = 30.7 m3/s
Intervalos de confianza
= 3.93
(3.93) (5)
Se 30
Se 3.58 m3 / s
Xt t(1-) Se
Esta distribución ha sido una de las mas utilizadas en hidrología. Como la mayoría de las
variables hidrológicas son sesgadas, la función Gamma se utiliza para ajustar la
distribución de frecuencia de variables tales como crecientes máximas anuales, Caudales
mínimos, Volúmenes de flujo anuales y estacionales, valores de precipitaciones extremas y
volúmenes de lluvia de corta duración. La función de distribución Gamma tiene dos o tres
parámetros.
1 x x xˆ
xˆ 1
exp
0 0
f (x)
donde,
x0 x para 0
x x0 para 0
15
y son los parámetros de escala y forma, respectivamente , y x0 es el parámetro de
localización.
2
2 Cs
ˆ Cs ; ˆ s 2 ; xˆ0 x ˆ
Cs 1 5
2Cs 3Cs 4Cs 1 Cs
K z (z 2 1) (z3 6z) (z 2 1) z
6 3 6 6 3 6
6
donde z es la variable normal estandarizada
Xt t(1-) Se
S
Se n
16
QTr100 = X+ SK
17
(2.0,100) = 3.605
Intervalos de
confianza Xt t(1-) Se
S
Se n
(3311) (8.4922)
Se
30
Se = 5133.56 pie3/s
Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución Pearson tipo
III, se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo III.
Esta distribución es ampliamente usada en el mundo para el análisis de frecuencia de
Caudales máximos. Esta se trabaja igual que para la Pearson Tipo III pero con X y y Sy
como la media y desviación estándar de los logaritmos de la variable original X.
1 ln(x)
y
ln(x) y
f (x)
1
exp 0
0
x
18
19
donde,
y0 y para 0
y y0 para 0
ln(YTr ) xy K sy
Cs 1 5
2Cs 3Cs 4Cs 1 Cs
K z (z 2 1) (z3 6z) (z 2 1) z
6 3 6 6 3 6
6
donde z es la variable normal estandarizada
Xt t(1-) Se
Sy
Se
n
21
4 AJUSTE DE DISTRIBUCIONES
Para la modelación de caudales máximos se utilizan, entre otras, las distribuciones Log -
Normal, Gumbel y Log-Gumbel principalmente. Para seleccionar la distribución de
probabilidades de la serie histórica se deben tener en cuenta algunas consideraciones.
Para ajustar distribuciones de tres parámetros (Log Normal III, Log Pearson) se
requiere estimar el coeficiente de asimetría de la distribución; para ello es necesario
disponer de una serie con longitud de registros larga, mayor de 50 años, (Kite,
1988). Las distribuciones de dos parámetros son usualmente preferidas cuando se
dispone de pocos datos, porque reducen la varianza de la muestra, (Ashkar, et al.
1994).
Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la
distribución que mejor se ajusta a los caudales máximos y recomiendan seleccionar
el mejor ajuste a criterio del modelador con la prueba de ajuste gráfico o basado en
el comportamiento de las pruebas estadísticas de bondad del ajuste (por ejemplo Chi
Cuadrado, Smirnov-Kolmogorov, Cramer-Von Mises) en las que se calcula un
estimador y se compara con un valor tabulado para determinar si el ajuste es
adecuado o no. En la prueba de ajuste gráfica se dibujan los valores registrados en
la serie contra la distribución teórica de probabilidades y de manera visual
(subjetiva) se determina si el ajuste es adecuado o no.
1
Aunque no existe una definición generalmente aceptada, se puede entender como valores extremos, muy
superiores a los demás registrados (Ashkar, et al. 1994).
22
Cuando la información es adecuada el análisis de frecuencia es la metodología más
recomendable para la evaluación de eventos extremos, ya que la estimación depende
solamente de los caudales máximos anuales que han ocurrido en la cuenca y no da cuenta
de los procesos de transformación de la precipitación en escorrentía. Obviamente tiene
algunas limitaciones relacionadas con el comportamiento de la serie histórica y con el
tamaño y calidad de los datos de la muestra.
El ajuste a distribuciones se puede hacer de dos técnicas, con el factor de frecuencia como
se refirió en el numeral 2 o hallando la distribución empírica de los datos muestrales, por el
método de Plotting Position.
m
California P
n
m
Weibull P
n
1
Hazen 2m 1
P 2n
La expresión más utilizada es la Weibull. Con las anteriores expresiones se halla lo que se
conoce como la distribución empírica de una muestra, esta luego se puede ajustar a una de
las distribuciones teóricas presentadas anteriormente. Los resultados pueden ser dibujados
en el papel de probabilidad; este es diseñado para que los datos se ajusten a una línea recta
y se puedan comparar los datos muestrales con la distribución teórica (línea recta).
23
4.3 Pruebas de Ajuste
Para determinar que tan adecuado es el ajuste de los datos a una distribución de
probabilidades se han propuesto una serie de pruebas estadísticas que determinan si es
adecuado el ajuste. Estos son análisis estadísticos y como tal se deben entender, es decir,
no se puede ignorar el significado físico de los ajustes.
La prueba requiere que el valor Dn calculado con la expresión anterior sea menor que el
valor tabulado Dn para un nivel de probabilidad requerido.
Una medida de las discrepancia entre las frecuencias observadas (fo) y las frecuencias
calculadas (fc) por medio de una distribución teórica esta dada por el estadístico χ²
2
k
( f f )2
o c en donde fc
f
i1 fc o