Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Módulo 02
Análisis de Datos y Estadísticas
Hidrológicas
Análisis de Datos y Estadísticas
Hidrológicas
El análisis de datos y estadísticas hidrológicas
desempeña un papel fundamental en la
planificación y diseño de proyectos relacionados
con recursos hídricos, como presas, canales,
sistemas de drenaje, y más.
Este módulo aborda diversos aspectos
relacionados con el análisis de datos y
estadísticas hidrológicas, incluyendo definiciones,
funciones de densidad de probabilidad,
conceptos básicos de modelos probabilísticos
discretos y continuos, análisis de frecuencias,
probabilidades de excedencia, periodos de
retorno y riesgo hidrológico, así como métodos
gráficos y analíticos.
Datos Hidrológicos
s ( x ) f ( x ) ( x)dx
2 2 s 2
( x ) 2
P ( x ) s 2
k
x
k 1 n 1
s
c ( x ) 3 f ( x)dx / s 3 ( x)
DEFINICIONES BASICAS
DEFINICIONES BASICAS
Coef. Asimetría
Desv. Estandar
Varianza
REPASO ESTADÍSTICA BÁSICA
La probabilidad de un evento es
igual a la relación entre el numero
de sucesos favorables, m, y el
numero de sucesos totales, n:
• La probabilidad de un evento Pi
siempre tiene un valor entre 0 y 1.
• La probabilidad de un evento cierto
es 1.
• Si X1 y X2 son eventos
independientes y mutuamente
excluyentes entonces.
REPASO ESTADÍSTICA BÁSICA
REPASO ESTADÍSTICA BÁSICA
Histograma de frecuencia.
1
1
REPASO ESTADÍSTICA BÁSICA
Es un estimativo de la
probabilidad acumulada de xi,
P(X≤Xi)
REPASO ESTADÍSTICA BÁSICA
Bernoulli
El modelo de Bernoulli se utiliza para describir
eventos binarios, donde solo existen dos
resultados posibles, como sí/no o éxito/fracaso.
En hidrología, esto podría aplicarse a eventos
como la ocurrencia de una tormenta.
Probabilidad de que en un año cualquiera ocurra
Q≥Q* es p
De un año a otro crecidas son independientes
por lo tanto si se define variable aleatoria
discreta
X=1 si ocurre Q≥Q*
X=0 en cualquier otro caso
Modelos Probabilísticos Discretos
Px(x) = p si x = 1
= 1-p si x = 0
Ejemplo:
¿Cuál es la probabilidad de que esa crecida ocurra
4 veces en los próximos 5 años?
Modelos Probabilísticos Discretos
Binomial
El modelo binomial se usa cuando se repite un
experimento de Bernoulli un número fijo de
veces y se registra el número de éxitos. Por
ejemplo, se podría aplicar al estudio de la
probabilidad de que ocurran 'n' tormentas en un
período específico.
Distribución Binomial B(n,p)
Combinatoria
Modelos Probabilísticos Discretos
mx = E[x] = np
s2x = E[(x-mx)2] = np(1-p)
Ejemplo:
Si P excedencia de Q* en un año es 0,02
Geométrico
El modelo geométrico describe el número de
repeticiones de un experimento de Bernoulli
antes de que ocurra el primer éxito. Puede
aplicarse al estudio de la cantidad de tiempo
antes de que ocurra la primera tormenta en una
serie de observaciones.
P(crecida en año n)= (1-p)n-1p
¿Cuál es la probabilidad de que la próxima crecida
ocurra en n años o menos?
ó
¿Cuál es la probabilidad de que ocurra al menos 1
crecida en los próximos n años?
Modelos Probabilísticos Discretos
mN=1/p
s2N =(1-p)/p2
Modelos Probabilísticos Discretos
Ejemplo:
¿Cuál es la probabilidad de que en 50 años
ocurra exactamente 1 crecida mayor o igual
que la de T =50 años?
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos
Ejemplo:
¿Cuál es la probabilidad de que en 50 años
ocurran exactamente 3 crecidas mayores o
iguales que la de T =50 años?
Modelos Probabilísticos Discretos
Ejemplo:
¿Cuál es la probabilidad de que en 50 años
ocurran 1 o más crecidas que excedan o
igualen la de T =50 años?
Modelos Probabilísticos Discretos
Ejemplo:
Se han dispuesto 15 sistemas independientes para el
control de crecidas, usando T=200 años. Cuál será la
distribución del número de sistemas que fallan debido a
la ocurrencia de la crecida de T=200 años, al menos 1
vez después de 50 años de la construcción?
Probabilidad de tener
exactamente x sucesos
en un intervalo
determinado, siendo m
la tasa de ocurrencia.
Modelos Probabilísticos Discretos
Proceso de Markov
El proceso de Markov es un modelo en el que la
probabilidad de un evento depende solo del
estado actual y no de los estados anteriores. Se
utiliza en la modelización de series temporales
hidrológicas.
La probabilidad en cualquier tiempo, de que el
sistema esté en un estado dado, depende sólo
en el conocimiento del estado del sistema en el
tiempo inmediatamente anterior.
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos
Es proceso de Markov?
Modelos Probabilísticos Continuos
Normal
La distribución normal (o gaussiana) se utiliza
comúnmente para modelar variables hidrológicas
como caudal. Es conocida por su forma de
campana y está completamente definida por su
media y desviación estándar.
DISTRIBUCIÓN NORMAL (Gauss)
Su función de densidad es:
Logarítmico-Normal
La distribución logarítmico-normal es útil para
describir variables que tienen una distribución
normal cuando se toma su logaritmo. Puede ser
aplicada a variables como la precipitación
acumulada.
DISTRIBUCIÓN LOG-NORMAL
Se define la variable y como: y = log x
1 ( y y ) 2 / 2s 2y
f ( y) e
2 s y
en que: y = (log x)
sy = s (log x)
En este caso se debe “reducir” o normalizar la
variable normal según la siguiente transformación:
x y
z
sy
Finalmente se debe transformar a la variable
original x = 10y
Modelos Probabilísticos Continuos
Gama
La distribución gamma se emplea para modelar
variables positivas y continuas, como los tiempos
entre eventos hidrológicos. Tiene dos
parámetros: la forma y la escala.
DISTRIBUCIÓN GAMMA
Su función de densidad es:
x
1
f ( x) x 1 e
( )
Pearson
La distribución de Pearson es una familia de
distribuciones que incluye la normal, la
logarítmico-normal y otras. Se utiliza para ajustar
modelos a datos hidrológicos con diferentes
características.
DISTRIBUCION PEARSON
Se define el factor de frecuencia KT como:
1 1
K T z ( z 2 1) k ( z 3 6 z ) k 2 ( z 2 1) k 3 z k 4 k 5
3 3
donde: k = Cs/6
Cs : coeficiente de asimetría.
z : variable normal estándar.
xT x K T S x
Modelos Probabilísticos Continuos
Log-Pearson
Similar a la distribución de Pearson, pero se
aplica después de tomar el logaritmo de los
datos. Puede ser útil para datos que siguen una
distribución logarítmica.
DISTRIBUCION LOG-PEARSON
Se define la variable y como: y = log x
El factor de frecuencia sigue dados por:
1 1
K T z ( z 2 1) k ( z 3 6 z ) k 2 ( z 2 1) k 3 z k 4 k 5
3 3
donde: k = Cs/6
Cs : coeficiente asimetría para la variable y.
z : variable normal estándar.
YT y K T S y
Gumbel
La distribución de Gumbel se usa comúnmente
para modelar eventos extremos en hidrología,
como inundaciones máximas. Tiene aplicaciones
en el análisis de frecuencias.
DISTRIBUCIÓN GUMBEL
DISTRIBUCIÓN GUMBEL
Otra forma de expresar la función.
xx y y y y
K x s x x
sx sn sn
N y sn N y sn
10 0.495 0.950 60 0.552 1.175
15 0.513 1.021 70 0.555 1.185
20 0.524 1.063 80 0.557 1.194
25 0.531 1.091 90 0.559 1.201
30 0.536 1.112 100 0.560 1.206
35 0.540 1.128 200 0.567 1.236
40 0.544 1.141 500 0.572 1.259
45 0.546 1.152 1000 0.575 1.269
50 0.549 1.161 0.577 1.283
Análisis de Frecuencias
El análisis de frecuencias implica el estudio de la
ocurrencia de eventos hidrológicos a lo largo del
tiempo. Esto permite estimar la probabilidad de que
eventos de cierta magnitud o frecuencia ocurran en
un período dado. Se emplean modelos de probabilidad
para ajustar a los datos y calcular probabilidades de
excedencia y periodos de retorno.
Probabilidades de Excedencia
Las probabilidades de excedencia representan la
probabilidad de que un evento hidrológico (por
ejemplo, una crecida) supere un valor dado en un año
específico. Se utilizan para evaluar el riesgo asociado
a eventos extremos.
Periodos de Retorno
El periodo de retorno se refiere al intervalo medio de
tiempo en el que se espera que ocurra un evento
hidrológico de cierta magnitud. Se calcula a partir de
la probabilidad de excedencia y es crucial para la
planificación de infraestructuras hidrológicas.
PERIODO DE RETORNO (T)
T: Corresponde al intervalo de tiempo promedio en que un evento
de magnitud dada, es igualado o excedido una vez. Equivale al
inverso de la Probabilidad de Excedencia.
Probabilidad de Excedencia de una variable, es la Probabilidad de
que un valor dado de dicha variable, sea superado o excedido.
PERIODO DE RETORNO (T)
El "período de retorno o de recurrencia" (T) es el intervalo promedio,
expresado en años en el que un valor extremo alcanza o supera al
valor "x", al menos una sola vez.
Evento
Magnitud
Dada.
l1 l2 l3 l4 l5 l6 l7 t
Evento Magnitud dada (Q (m3/s)
; P(mm)) Esta asociado a un
periodo T*, tal que : Donde: F(X) : función de distribución de
probabilidad.
PERIODO DE RETORNO (T)
La confiabilidad del diseño, representada por la probabilidad que no
falle la estructura durante su vida útil, considera el hecho que no
ocurra un evento de magnitud superior a la utilizada en el diseño,
durante la vida útil.
Hazen (2m-1)/2N
Weibull(*) m/(N+1)
m: Número de orden
N: Número de datos
(*):Método más utilizado en Chile
CÁLCULO DE PROBABILIDAD
Otros métodos:
m=1 m=5
NOMBRE AÑO Probabilidad de N=10
excedencia (P) P T P T
California 1923 m (*) 0.10 10 0.500 2
N N = número
Hazen 1930 2m 1 0.05 20 0.450 2.2 total de
2N valores de la
Weibull 1939 m 0.091 11 0.455 2.2
muestra.
N 1
Beard(**) 1943 1 ( 0.5 )
1/ N 0.067 14.9 0.452 2.2
Chegodayev 1955 m 0.3 0.067 14.9 0.451 2.2 m = número
N 0.4
de orden de
Blom 1958 m 3 / 8 0.061 16.4 0.451 2.2
N 1/ 4 los valores
Tukey 1962 3m 1 0.065 15.4 0.451 2.2 ordenados de
3N 1 mayor a
Gringorten 1963 m 0.44 0.055 18.2 0.447 2.2
menor.
N 0.12
CÁLCULO DE PROBABILIDAD
Distribución temporal en la cuenca
CURVAS DE DURACIÓN
Es una distribución de frecuencia
acumulada que indica el porcentaje del
tiempo durante el cual los caudales han
sido igualados o excedidos.
100%
CURVAS DE VARIACIÓN ESTACIONAL
En general, se utilizan para visualizar la variación
de los gastos medios mensuales y es la Base de
un estudio de evaluación de Recursos Hídricos.
EJEMPLO DE CVE
Dibujar la Curvas de Variación Estacional por
semestre para 15 y 85% de probabilidad de
excedencia.
AÑO CUATRIMESTRE 1 CUATRIMESTRE 2 CUATRIMESTRE 3
1973 9.13 156.17 29.659
1974 7.9 72.23 18.319
1975 22.43 217.77 30.24
1976 6.63 34.07 73.85
1977 3.33 49 21 m/(N+1)
1978 1 29 4.431
1979 3.7 26.03 37.009
1980 15.17 103 13.72
1981 0.67 76.83 113.4
1982 2.33 25 74.2
1983 11.33 114.67 121.681
1984 0.33 67.83 38.031
1985 7.83 186.5 50.519
Se ordenan los datos, se aplica Weibull y se asigna una
probabilidad de excedencia en porcentaje.
Nº CUATRIM. 1 CUATRIM. 2 CUATRIM. 3 Prob.
1 22.43 217.77 121.68 7.1
2 15.17 186.50 113.40 14.3
3 11.33 156.17 74.20 21.4
4 9.13 114.67 73.85 28.6
5 7.90 103.00 50.52 35.7
6 7.83 76.83 38.03 42.9
7 6.63 72.23 37.01 50.0
8 3.70 67.83 30.24 57.1
9 3.33 49.00 29.66 64.3
10 2.33 34.07 21.00 71.4
11 1.00 29.00 18.32 78.6
12 0.67 26.03 13.72 85.7
13 0.33 25.00 4.43 92.9
6,4 (30,3)
X 156,17 X 183,5
7,1
Finalmente se obtienen los siguientes valores.
Prob. Exc. CUATRIM. 1 CUATRIM. 2 CUATRIM. 3
15% 14.8 183.5 109.5
85% 0.7 26.3 14.2
200
180
160
140
120
100
80
60
40
20
0
CUATRIM. 1 CUATRIM. 2 CUATRIM. 3
ESTADISTICA
HIDROLÓGICA
DISTRIBUCIONES DE FRECUENCIA
PRUEBA DE CHI-CUADRADO
Permite definir si la función de densidad de
frecuencia es apropiada para la muestra.
Se comparara el valor de2 la variable obtenida a
partir de la muestra con el valor para 2la
distribución, con un cierto nivel de confianza , A
Si
2
2
,A se acepta la hipótesis de que los datos tienen
la distribución elegida.
Si 2 2, A se rechaza la hipótesis, ya que es muy poco
probable.