Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribuciones de Probabilidad en Hidrologia PDF
Distribuciones de Probabilidad en Hidrologia PDF
Por P(x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente P(a
≤ x ≤ b) denota la probabilidad de que un evento se encuentre en el intervalo (a,b). Si
conocemos la probabilidad P(a ≤ x ≤ b) para todos los valores de a y b, se dice que
conocemos la Distribución de Probabilidades de la variable x.
Ejemplo
Se tienen las probabilidades de que haya 1, 2, 3, ... etc, días nublados por semana en un
determinado lugar, con ellos calcule la distribución de probabilidades
x P(x) F(x)
0 0.05 0.05
1 0.15 0.20
2 0.25 0.45
3 0.20 0.65
4 0.15 0.80
5 0.10 0.90
6 0.08 0.98
7 0.02 1.00
Total 1.0
Si se tiene una variable aleatoria continua, la figura presenta el histograma de 85 años de
registro de caudales de crecientes (máximos instantáneos) en el río Magdalena, agrupados
en 9 intervalos de clase.
x P(x) F(x)
1 0.05 0.05
2 0.10 0.15
3 0.15 0.30
4 0.20 0.50
5 0.10 0.60
6 0.10 0.70
7 0.15 0.85
8 0.10 0.95
9 0.05 1.00
Total 1.00
ii)
iii)
Lo que implica que las probabilidades se definen sólo como ÁREAS bajo la función de
densidad de probabilidad (FDP) entre límites finitos.
1.2.1 Media µ :
es el valor esperado de la variable misma . Primer momento respecto a la origen. Muestra
la tendencia central de la distribución
el valor estimado de la media a partir de la muestra es
1.2.2 Varianza σ ²:
mide la variabilidad de los datos. Es el segundo momento respecto a la media.
estimado es
1.2.3 Coeficiente de asimetría γ
la distribución de los valores de una distribución alrededor de la media se mide por la
asimetría. Se obtiene a partir del tercer momento alrededor de la media, dividiéndolo por el
cubo de la desviación estándar para que sea adimensional.
Ejemplo
Frecuencia Frecuencia
Intervalo (mm) Xi medio x f(x)
absoluta relativa
100 110 105 10 0.1 10.5
110 120 115 16 0.16 18.4
120 130 125 9 0.09 11.25
130 140 135 10 0.1 13.5
140 150 145 20 0.2 29
150 160 155 15 0.15 23.25
160 170 165 20 0.2 33
Total=100 = Σ 138.9
2 ANALISIS DE FRECUENCIA
Para una distribución dada, puede determinarse una relación entre K y el período de retorno
Tr. Esta relación puede expresarse en términos matemáticos o por medio del uso de una
tabla.
Esta distribución es muy usada para el calculo de valores extremos por ejemplo Qmax,
Qmínimos, Pmax, Pmínima (excelentes resultados en Antioquia). Tiene la ventaja que X>0
y que la transformación Log tiende a reducir la asimetría positiva ya que al sacar logaritmos
se reducen en mayor proporción los datos mayores que los menores.
Limitaciones: tiene solamente dos parámetros, y requiere que los logaritmos de la variables
estén centrados en la media
y = ln x
donde,
µ y : media de los logaritmos de la población (parámetro escalar), estimado σ y :
Desviación estándar de los logaritmos de la población, estimado sy.
Ln(XTr) = xTr+KSy
de donde,
XTr = eln (xTr)
con K con variable normal estandarizada para el Tr dado, xy media de los logaritmos y Sy
es la desviación estándar de los logaritmos.
En el campo transformado.
Solución:
n=30
x= 15 m3/s xy=2.655
s = 5 m3/s sy = 0.324
En el campo original
= 5/15 = 0.33
KT = 3.06
QTr = 15 + 5 * 3.028
QTr = 30.14 m3/s
LnQTr100 = 3.40992
Limites de confianza
Ln (QTr) ± t(1-α ) Se
δ = 1.93
3.41 ± 0.18095
[3.22905 3.59095]
[e3.22905 e3.59095]
[25.26 36.29] Intervalos de confianza para QTr100
Ln(42.5) = 3.75
t = (3.75 - 2.655)/0.324
Donde Tr es el periodo de retorno. Para la distribución Gumbel se tiene que el caudal para
un período de retorno de 2.33 años es igual a la media de los caudales máximos.
Xt ± t(1-α ) Se
QTr100 = x + KT s
KT = 3.14
QTr100 = 15 + 3.14*5
QTr100 = 30.7 m3/s
Intervalos de confianza
Xt ± t(1-α ) Se
Esta distribución ha sido una de las mas utilizadas en hidrología. Como la mayoría de las
variables hidrológicas son sesgadas, la función Gamma se utiliza para ajustar la
distribución de frecuencia de variables tales como crecientes máximas anuales, Caudales
mínimos, Volúmenes de flujo anuales y estacionales, valores de precipitaciones extremas y
volúmenes de lluvia de corta duración. La función de distribución Gamma tiene dos o tres
parámetros.
donde,
Xt ± t(1-α ) Se
QTr100 = X+ SK
Intervalos de confianza
Xt ± t(1-α ) Se
δ = F(1.981,100) de tablas se obtiene δ =8.4922 (1.9,100) = 8.2196
(2.0,100) = 8.5562
Se = 5133.56 pie3/s
Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución Pearson tipo
III, se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo III.
Esta distribución es ampliamente usada en el mundo para el análisis de frecuencia de
Caudales máximos. Esta se trabaja igual que para la Pearson Tipo III pero con Xy y Sy
como la media y desviación estándar de los logaritmos de la variable original X.
donde,
Xt ± t(1-α ) Se
4 AJUSTE DE DISTRIBUCIONES
Para la modelación de caudales máximos se utilizan, entre otras, las distribuciones Log -
Normal, Gumbel y Log-Gumbel principalmente. Para seleccionar la distribución de
probabilidades de la serie histórica se deben tener en cuenta algunas consideraciones.
• Para ajustar distribuciones de tres parámetros (Log Normal III, Log Pearson) se
requiere estimar el coeficiente de asimetría de la distribución; para ello es necesario
disponer de una serie con longitud de registros larga, mayor de 50 años, (Kite,
1988). Las distribuciones de dos parámetros son usualmente preferidas cuando se
dispone de pocos datos, porque reducen la varianza de la muestra, (Ashkar, et al.
1994).
• Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la
distribución que mejor se ajusta a los caudales máximos y recomiendan seleccionar
el mejor ajuste a criterio del modelador con la prueba de ajuste gráfico o basado en
el comportamiento de las pruebas estadísticas de bondad del ajuste (por ejemplo Chi
Cuadrado, Smirnov-Kolmogorov, Cramer-Von Mises) en las que se calcula un
estimador y se compara con un valor tabulado para determinar si el ajuste es
adecuado o no. En la prueba de ajuste gráfica se dibujan los valores registrados en
la serie contra la distribución teórica de probabilidades y de manera visual
(subjetiva) se determina si el ajuste es adecuado o no.
El ajuste a distribuciones se puede hacer de dos técnicas, con el factor de frecuencia como
se refirió en el numeral 2 ANALISIS DE FRECUENCIA o hallando la distribución
empírica de los datos muestrales, por el método de Plotting Position.
California
Weibull
Hazen
La expresión más utilizada es la Weibull. Con las anteriores expresiones se halla lo que se
conoce como la distribución empírica de una muestra, esta luego se puede ajustar a una de
las distribuciones teóricas presentadas anteriormente. Los resultados pueden ser dibujados
en el papel de probabilidad; este es diseñado para que los datos se ajusten a una línea recta
y se puedan comparar los datos muestrales con la distribución teórica (línea recta).
Para determinar que tan adecuado es el ajuste de los datos a una distribución de
probabilidades se han propuesto una serie de pruebas estadísticas que determinan si es
adecuado el ajuste. Estos son análisis estadísticos y como tal se deben entender, es decir,
no se puede ignorar el significado físico de los ajustes.
Una medida de las discrepancia entre las frecuencias observadas (fo) y las frecuencias
calculadas (fc) por medio de una distribución teórica esta dada por el estadístico χ²
en donde
si el estadístico χ²=0 significa que las distribuciones teórica y empírica ajustan exactamente,
mientras que si el estadístico χ²>0, ellas difieren. La distribución del estadístico χ² se puede
asimilar a una distribución Chi-cuadrado con (k-n-1) grados de libertad, donde k es el
número de intervalos y n es el número de los parámetros de la distribución teórica. La
función χ² se encuentra tabulada. Supongase que una hipótesis Ho es aceptar que una
distribución empírica se ajusta a una distribución Normal. Si el valor calculado de χ² por la
ecuación anterior es mayor que algún valor crítico de χ², con niveles de significancia α de
0.05 y 0.01 (el nivel de confianza es 1-α ) se puede decir que las frecuencias observadas
difieren significativamente de las frecuencias esperadas (o calculadas) y entonces la
hipótesis Ho se rechaza, si ocurre lo contrario entonces se acepta.
2
[1] Aunque no existe una definición generalmente aceptada, se puede entender como
valores extremos, muy superiores a los demás registrados (Ashkar, et al. 1994).