Está en la página 1de 78

HIDROLOGIA

Módulo 02
Análisis de Datos y Estadísticas
Hidrológicas
Análisis de Datos y Estadísticas
Hidrológicas
 El análisis de datos y estadísticas hidrológicas
desempeña un papel fundamental en la
planificación y diseño de proyectos relacionados
con recursos hídricos, como presas, canales,
sistemas de drenaje, y más.
 Este módulo aborda diversos aspectos
relacionados con el análisis de datos y
estadísticas hidrológicas, incluyendo definiciones,
funciones de densidad de probabilidad,
conceptos básicos de modelos probabilísticos
discretos y continuos, análisis de frecuencias,
probabilidades de excedencia, periodos de
retorno y riesgo hidrológico, así como métodos
gráficos y analíticos.
Datos Hidrológicos

 Los datos hidrológicos se refieren a la


información recopilada sobre las características y
el comportamiento de los recursos hídricos,
como ríos, cuencas, precipitación y caudal.
 Estos datos son esenciales para comprender y
gestionar los recursos hídricos de una región.
MODELOS PROBABILÍSTICOS
 El análisis de frecuencia en hidrología surge de
la necesidad de estimar eventos hidrológicos
futuros a partir de datos históricos
(estadísticos), a través de modelos discretos o
continuos.
REPASO ESTADÍSTICA BÁSICA

1. Los eventos hidrológicos no son gobernados por leyes


físicas, sino por leyes del AZAR. Son fenómenos
ERRATICOS, COMPLEJOS y de NATURALEZA ALEATORIA.
2. El conocimiento de la Hidrología es básico para el
diseño en la ingeniería (definición de condiciones
críticas).
3. La definición del comportamiento hidrológico requiere:
análisis probabilísticos y estadísticos basados en registros
históricos.
4. Hidrología trata con VARIABLES ALEATORIAS
DEFINICIONES BASICAS
 Media, valor esperado o promedio: parámetro poblacional
empleado como medida de tendencia central.
n
xk

   Px ( x)  x  
  x  f ( x) ( x)dx k 1 n


 Desviación típica o estándar (s): parámetro poblacional


usado como medida de dispersión.
 Varianza: se define como s2.
n
( x   ) 2



s   ( x   )  f ( x ) ( x)dx
2 2 s 2
  ( x   ) 2
P ( x ) s 2
 k
x
k 1 n 1


 Coeficiente de Variación: es la relación entre la


desviación típica y la media. s
C  V

 Coeficiente de Asimetría: es una medida de la falta de
simetria de una distribución. 

s 
c  ( x   ) 3  f ( x)dx / s 3 ( x)

DEFINICIONES BASICAS
DEFINICIONES BASICAS

La asimetría es la medida que indica la simetría de la


distribución de una variable respecto a la media
aritmética, sin necesidad de hacer la representación
gráfica. Los coeficientes de asimetría indican si hay el
mismo número de elementos a izquierda y derecha de
la media.
DEFINICIONES BASICAS
DEFINICIONES BASICAS

Coef. Asimetría

Desv. Estandar

Varianza
REPASO ESTADÍSTICA BÁSICA

El objetivo principal de la estadística en


hidrología es obtener información de los
fenómenos hidrológicos pasados y hacer
inferencias acerca de su comportamiento en el
futuro.
Otros objetivos son:
1.Interpretación de observaciones.
2.Análisis de la calidad de la información.
3.Inferencia sobre el comportamiento de la variable
4.Extracción del máximo de información de los registros.
5.Información en gráficas tablas, ecuaciones para toma
de decisiones en el planeamiento en Recursos Hídricos.
REPASO ESTADÍSTICA BÁSICA

La probabilidad de un evento es
igual a la relación entre el numero
de sucesos favorables, m, y el
numero de sucesos totales, n:
• La probabilidad de un evento Pi
siempre tiene un valor entre 0 y 1.
• La probabilidad de un evento cierto
es 1.
• Si X1 y X2 son eventos
independientes y mutuamente
excluyentes entonces.
REPASO ESTADÍSTICA BÁSICA
REPASO ESTADÍSTICA BÁSICA

Histograma de frecuencia.
1

1
REPASO ESTADÍSTICA BÁSICA

Función de frecuencia relativa.


fs(x) indica la probabilidad que la
variable aleatoria “x” caiga en un
intervalo dado. El subíndice “s”
indica que la función se calculo
con datos muestrales.

Función de frecuencia relativa acumulada.

Es un estimativo de la
probabilidad acumulada de xi,
P(X≤Xi)
REPASO ESTADÍSTICA BÁSICA

La función de frecuencia acumulada se convierte


en la función de distribución de probabilidad.

La función de densidad de probabilidad seria la derivada


de Fx(x):
REPASO ESTADÍSTICA BÁSICA
Población: conjunto total de
objetos considerados.
Muestra: subconjunto de la
población total que permite
inferir ciertas propiedades.
Variable Aleatoria: es una
función que asocia ciertos
números a los resultados de un
experimento.
Probabilidad: es una función
cuyo dominio es el conjunto de
todos los eventos del espacio
muestral y su rango son
elementos reales entre 0 y 1.
Función de Distribución: es
la relación entre los valores de
una variable aleatoria discreta
y las correspondientes
probabilidades de no
excedencia.
Función de Densidad: es
una función de una variable
aleatoria continua que permite
determinar probabilidades de
ciertos eventos.
REPASO ESTADÍSTICA BÁSICA
Ejemplo:
CÁLCULO DE PROBABILIDAD
 Para efectos de análisis hidrológico, muchas
veces es necesario estimar caudales cuyo
período de retorno T es superior al período de
registro. Afortunadamente, se encuentra que las
variables hidrológicas de interés se "distribuyen"
de acuerdo a funciones conocidas de densidad
de frecuencia.

 - Análisis de Frecuencias: Probabilidades de


Excedencia; Períodos de Retorno; Riesgo
Hidrológico, Métodos Gráficos y Analíticos.
 - Modelos Probabilísticos Continuos: Normal;
Logarítmico-Normal; Gama; Pearson; Log-
Pearson; Gumbel.
Estadísticas Hidrológicas

 Las estadísticas hidrológicas involucran la


aplicación de técnicas estadísticas para analizar y
describir los datos hidrológicos. Esto incluye el
cálculo de medidas de tendencia central,
dispersión y distribución de probabilidades.
Modelos Probabilísticos Discretos

 Bernoulli
 El modelo de Bernoulli se utiliza para describir
eventos binarios, donde solo existen dos
resultados posibles, como sí/no o éxito/fracaso.
En hidrología, esto podría aplicarse a eventos
como la ocurrencia de una tormenta.
 Probabilidad de que en un año cualquiera ocurra
Q≥Q* es p
 De un año a otro crecidas son independientes
por lo tanto si se define variable aleatoria
discreta
X=1 si ocurre Q≥Q*
X=0 en cualquier otro caso
Modelos Probabilísticos Discretos

Px(x) = p si x = 1
= 1-p si x = 0

mx = E[x] = 1*p + 0*(1-p)


s2x = E[(x-mx)2] = (1-p)*p

Ejemplo:
¿Cuál es la probabilidad de que esa crecida ocurra
4 veces en los próximos 5 años?
Modelos Probabilísticos Discretos

P(4 crecidas en 5 años) = 5p4(1-p)


Modelos Probabilísticos Discretos

 Binomial
 El modelo binomial se usa cuando se repite un
experimento de Bernoulli un número fijo de
veces y se registra el número de éxitos. Por
ejemplo, se podría aplicar al estudio de la
probabilidad de que ocurran 'n' tormentas en un
período específico.
Distribución Binomial B(n,p)

Combinatoria
Modelos Probabilísticos Discretos

mx = E[x] = np
s2x = E[(x-mx)2] = np(1-p)

Ejemplo:
Si P excedencia de Q* en un año es 0,02

En promedio, en 50 años ocurre 1 vez,


con una varianza de 0,98

¿Cuantos años pasarán antes que el caudal


Q* se iguale o exceda?
Modelos Probabilísticos Discretos

 Geométrico
 El modelo geométrico describe el número de
repeticiones de un experimento de Bernoulli
antes de que ocurra el primer éxito. Puede
aplicarse al estudio de la cantidad de tiempo
antes de que ocurra la primera tormenta en una
serie de observaciones.
P(crecida en año n)= (1-p)n-1p
¿Cuál es la probabilidad de que la próxima crecida
ocurra en n años o menos?
ó
¿Cuál es la probabilidad de que ocurra al menos 1
crecida en los próximos n años?
Modelos Probabilísticos Discretos

mN=1/p
s2N =(1-p)/p2
Modelos Probabilísticos Discretos

F(t)=0 para t<0 y


para t>0 :

Ejemplo:
¿Cuál es la probabilidad de que en 50 años
ocurra exactamente 1 crecida mayor o igual
que la de T =50 años?
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos

Ejemplo:
¿Cuál es la probabilidad de que en 50 años
ocurran exactamente 3 crecidas mayores o
iguales que la de T =50 años?
Modelos Probabilísticos Discretos

Ejemplo:
¿Cuál es la probabilidad de que en 50 años
ocurran 1 o más crecidas que excedan o
igualen la de T =50 años?
Modelos Probabilísticos Discretos

Ejemplo:
Se han dispuesto 15 sistemas independientes para el
control de crecidas, usando T=200 años. Cuál será la
distribución del número de sistemas que fallan debido a
la ocurrencia de la crecida de T=200 años, al menos 1
vez después de 50 años de la construcción?

Probabilidad de que cualquiera de


los sistemas falle al menos 1 vez en
los 50 años cuando en cualquier
año la probabilidad de falla es
p=1/T = 1/200
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos
 Proceso de Poisson
 Número de sucesos que ocurren en intervalos
determinados de tiempo o espacio, suponiendo
que los sucesos ocurren en forma independiente
y a una tasa constante.
 El proceso de Poisson se utiliza para modelar
eventos raros o aleatorios en un período de
tiempo continuo. En hidrología, podría aplicarse
al estudio de la ocurrencia de inundaciones.

Probabilidad de tener
exactamente x sucesos
en un intervalo
determinado, siendo m
la tasa de ocurrencia.
Modelos Probabilísticos Discretos

 Proceso de Markov
 El proceso de Markov es un modelo en el que la
probabilidad de un evento depende solo del
estado actual y no de los estados anteriores. Se
utiliza en la modelización de series temporales
hidrológicas.
 La probabilidad en cualquier tiempo, de que el
sistema esté en un estado dado, depende sólo
en el conocimiento del estado del sistema en el
tiempo inmediatamente anterior.
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos
Modelos Probabilísticos Discretos

Es proceso de Markov?
Modelos Probabilísticos Continuos

 Normal
 La distribución normal (o gaussiana) se utiliza
comúnmente para modelar variables hidrológicas
como caudal. Es conocida por su forma de
campana y está completamente definida por su
media y desviación estándar.
DISTRIBUCIÓN NORMAL (Gauss)
 Su función de densidad es:

La función de densidad de una distribución normal tiene


forma de campana. Es simétrica en torno a la media. El
área total bajo la curva es 1 (como corresponde a una
función de densidad). La densidad está concentrada en
torno a la media y se hace muy pequeña conforme nos
alejamos del centro por la derecha o la izquierda (las
'colas' de la distribución). Cuanto más alejado es el
valor del centro de la función de densidad menos
probable es observar ese valor.
DISTRIBUCIÓN NORMAL (Gauss)
 El caso particularmente importante es el de la
distribución normal estándar. Usamos tablas y
ordenadores para hacer estos cálculos. Una notación
habitual para este caso de la función de distribución es:

Z: Variable Reducida o tipificada


x
z
s La variable z también es llamada variable
estandarizada media cero y desviación estándar
uno, variable normal estándar
Modelos Probabilísticos Continuos

 Logarítmico-Normal
 La distribución logarítmico-normal es útil para
describir variables que tienen una distribución
normal cuando se toma su logaritmo. Puede ser
aplicada a variables como la precipitación
acumulada.
DISTRIBUCIÓN LOG-NORMAL
 Se define la variable y como: y = log x
1  ( y   y ) 2 / 2s 2y
f ( y)  e
2  s y

en que: y =  (log x)
sy = s (log x)
En este caso se debe “reducir” o normalizar la
variable normal según la siguiente transformación:
x  y
z
sy
 Finalmente se debe transformar a la variable
original x = 10y
Modelos Probabilísticos Continuos

 Gama
 La distribución gamma se emplea para modelar
variables positivas y continuas, como los tiempos
entre eventos hidrológicos. Tiene dos
parámetros: la forma y la escala.
DISTRIBUCIÓN GAMMA
 Su función de densidad es:
x

1
f ( x)   x  1  e 
   ( )

Donde () es la función gamma completa, definida


por: 
( )  y  1  e  y dy

0

Esta función no es integrable analíticamente, por lo


que es necesario aplicar tablas numéricas ya
calculadas.
Los parámetros  y  cumplen las siguientes
relaciones:
s x2
2
 x 
    
 sx  x
Modelos Probabilísticos Continuos

 Pearson
 La distribución de Pearson es una familia de
distribuciones que incluye la normal, la
logarítmico-normal y otras. Se utiliza para ajustar
modelos a datos hidrológicos con diferentes
características.
DISTRIBUCION PEARSON
 Se define el factor de frecuencia KT como:
1 1
K T  z  ( z 2  1)  k  ( z 3  6 z )  k 2  ( z 2  1)  k 3  z  k 4   k 5
3 3

donde: k = Cs/6
Cs : coeficiente de asimetría.
z : variable normal estándar.

xT  x  K T  S x
Modelos Probabilísticos Continuos

 Log-Pearson
 Similar a la distribución de Pearson, pero se
aplica después de tomar el logaritmo de los
datos. Puede ser útil para datos que siguen una
distribución logarítmica.
DISTRIBUCION LOG-PEARSON
 Se define la variable y como: y = log x
El factor de frecuencia sigue dados por:
1 1
K T  z  ( z 2  1)  k  ( z 3  6 z )  k 2  ( z 2  1)  k 3  z  k 4   k 5
3 3

donde: k = Cs/6
Cs : coeficiente asimetría para la variable y.
z : variable normal estándar.

YT  y  K T  S y

 Finalmente se debe transformar a la variable


original x = 10y
Modelos Probabilísticos Continuos

 Gumbel
 La distribución de Gumbel se usa comúnmente
para modelar eventos extremos en hidrología,
como inundaciones máximas. Tiene aplicaciones
en el análisis de frecuencias.
DISTRIBUCIÓN GUMBEL
DISTRIBUCIÓN GUMBEL
 Otra forma de expresar la función.

F ( x)  e e  y y   ln( ln( F ( x))


Donde “y” se denomina variable reducida

En la practica se usa la relación:

xx y y  y y
K  x     s x  x
sx sn  sn 

Donde y y sn se denominan variables reducidas y se


encuentran tabuladas en función del número de
datos de la muestra.
VARIABLE REDUCIDAS
 Los valores del promedio y la desviación para la
variable reducida se encuentran tabulados
según el número N de datos de la muestra.

N y sn N y sn
10 0.495 0.950 60 0.552 1.175
15 0.513 1.021 70 0.555 1.185
20 0.524 1.063 80 0.557 1.194
25 0.531 1.091 90 0.559 1.201
30 0.536 1.112 100 0.560 1.206
35 0.540 1.128 200 0.567 1.236
40 0.544 1.141 500 0.572 1.259
45 0.546 1.152 1000 0.575 1.269
50 0.549 1.161  0.577 1.283
Análisis de Frecuencias
 El análisis de frecuencias implica el estudio de la
ocurrencia de eventos hidrológicos a lo largo del
tiempo. Esto permite estimar la probabilidad de que
eventos de cierta magnitud o frecuencia ocurran en
un período dado. Se emplean modelos de probabilidad
para ajustar a los datos y calcular probabilidades de
excedencia y periodos de retorno.
Probabilidades de Excedencia
 Las probabilidades de excedencia representan la
probabilidad de que un evento hidrológico (por
ejemplo, una crecida) supere un valor dado en un año
específico. Se utilizan para evaluar el riesgo asociado
a eventos extremos.
Periodos de Retorno
 El periodo de retorno se refiere al intervalo medio de
tiempo en el que se espera que ocurra un evento
hidrológico de cierta magnitud. Se calcula a partir de
la probabilidad de excedencia y es crucial para la
planificación de infraestructuras hidrológicas.
PERIODO DE RETORNO (T)
 T: Corresponde al intervalo de tiempo promedio en que un evento
de magnitud dada, es igualado o excedido una vez. Equivale al
inverso de la Probabilidad de Excedencia.
 Probabilidad de Excedencia de una variable, es la Probabilidad de
que un valor dado de dicha variable, sea superado o excedido.
PERIODO DE RETORNO (T)
El "período de retorno o de recurrencia" (T) es el intervalo promedio,
expresado en años en el que un valor extremo alcanza o supera al
valor "x", al menos una sola vez.

Evento
Magnitud
Dada.

l1 l2 l3 l4 l5 l6 l7 t
Evento Magnitud dada (Q (m3/s)
; P(mm)) Esta asociado a un
periodo T*, tal que : Donde: F(X) : función de distribución de
probabilidad.
PERIODO DE RETORNO (T)
La confiabilidad del diseño, representada por la probabilidad que no
falle la estructura durante su vida útil, considera el hecho que no
ocurra un evento de magnitud superior a la utilizada en el diseño,
durante la vida útil.

Por ejemplo, la probabilidad de que una inundación con periodo de


retorno de 100 años ocurra durante los próximos 100 años es
PERIODO DE RETORNO (T)
Existen fenómenos hidrológicos excepcionales que se
repiten en determinados períodos de tiempo. Este
intervalo promedio de tiempo en que un evento de
magnitud dada es igualado o superado en magnitud, se
define como período de retorno.
Métodos Gráficos y Analíticos
 En el análisis de datos hidrológicos, se utilizan
métodos gráficos y analíticos para visualizar y
comprender los patrones de comportamiento de las
variables hidrológicas, así como para ajustar modelos
probabilísticos a los datos observados.

 Métodos gráficos incluyen:


 Histogramas: Representan la distribución de los datos.
 Gráficos de probabilidad: Comparan los datos con una
distribución teórica.
 Hidrogramas: Muestran la variación temporal del
caudal.
Métodos Gráficos y Analíticos
 Métodos analíticos incluyen:
 Ajuste de distribuciones de probabilidad: Se ajustan
modelos probabilísticos a los datos para estimar
parámetros y realizar análisis de frecuencias.
 Regresión: Se utiliza para relacionar variables
hidrológicas con otras variables que puedan influir en
su comportamiento.
 Análisis de series temporales: Se aplican métodos
estadísticos para identificar patrones y tendencias en
los datos hidrológicos a lo largo del tiempo
CÁLCULO DE PROBABILIDAD
 Análisis de Frecuencia: Los métodos más
utilizados para determinar directamente la
probabilidad de excedencia son:
NOMBRE PROBABILIDAD
DE
EXCEDENCIA
California m/N

Hazen (2m-1)/2N

Weibull(*) m/(N+1)

m: Número de orden
N: Número de datos
(*):Método más utilizado en Chile
CÁLCULO DE PROBABILIDAD
 Otros métodos:
m=1 m=5
NOMBRE AÑO Probabilidad de N=10
excedencia (P) P T P T
California 1923 m (*) 0.10 10 0.500 2
N N = número
Hazen 1930 2m  1 0.05 20 0.450 2.2 total de
2N valores de la
Weibull 1939 m 0.091 11 0.455 2.2
muestra.
N 1
Beard(**) 1943 1  ( 0.5 )
1/ N 0.067 14.9 0.452 2.2
Chegodayev 1955 m  0.3 0.067 14.9 0.451 2.2 m = número
N  0.4
de orden de
Blom 1958 m 3 / 8 0.061 16.4 0.451 2.2
N 1/ 4 los valores
Tukey 1962 3m  1 0.065 15.4 0.451 2.2 ordenados de
3N  1 mayor a
Gringorten 1963 m  0.44 0.055 18.2 0.447 2.2
menor.
N  0.12
CÁLCULO DE PROBABILIDAD
 Distribución temporal en la cuenca
CURVAS DE DURACIÓN
Es una distribución de frecuencia
acumulada que indica el porcentaje del
tiempo durante el cual los caudales han
sido igualados o excedidos.

100%
CURVAS DE VARIACIÓN ESTACIONAL
 En general, se utilizan para visualizar la variación
de los gastos medios mensuales y es la Base de
un estudio de evaluación de Recursos Hídricos.
EJEMPLO DE CVE
 Dibujar la Curvas de Variación Estacional por
semestre para 15 y 85% de probabilidad de
excedencia.
AÑO CUATRIMESTRE 1 CUATRIMESTRE 2 CUATRIMESTRE 3
1973 9.13 156.17 29.659
1974 7.9 72.23 18.319
1975 22.43 217.77 30.24
1976 6.63 34.07 73.85
1977 3.33 49 21 m/(N+1)
1978 1 29 4.431
1979 3.7 26.03 37.009
1980 15.17 103 13.72
1981 0.67 76.83 113.4
1982 2.33 25 74.2
1983 11.33 114.67 121.681
1984 0.33 67.83 38.031
1985 7.83 186.5 50.519
 Se ordenan los datos, se aplica Weibull y se asigna una
probabilidad de excedencia en porcentaje.
Nº CUATRIM. 1 CUATRIM. 2 CUATRIM. 3 Prob.
1 22.43 217.77 121.68 7.1
2 15.17 186.50 113.40 14.3
3 11.33 156.17 74.20 21.4
4 9.13 114.67 73.85 28.6
5 7.90 103.00 50.52 35.7
6 7.83 76.83 38.03 42.9
7 6.63 72.23 37.01 50.0
8 3.70 67.83 30.24 57.1
9 3.33 49.00 29.66 64.3
10 2.33 34.07 21.00 71.4
11 1.00 29.00 18.32 78.6
12 0.67 26.03 13.72 85.7
13 0.33 25.00 4.43 92.9

Se interpola para 15 y 85 % de probabilidad. Por ejemplo


para el segundo cuatrimestre, se tiene:
(21,4  14,3) (21,4  15) (21,4  15)  (156,17  186,5)
  (156,17  X ) 
(156,17  186,5) (156,17  X ) (21,4  14,3)

 6,4  (30,3) 
X  156,17     X  183,5
 7,1 
 Finalmente se obtienen los siguientes valores.
Prob. Exc. CUATRIM. 1 CUATRIM. 2 CUATRIM. 3
15% 14.8 183.5 109.5
85% 0.7 26.3 14.2

CURVA DE VARIACION 15%


85%
Q

200
180
160
140
120
100
80
60
40
20
0
CUATRIM. 1 CUATRIM. 2 CUATRIM. 3
ESTADISTICA
HIDROLÓGICA
DISTRIBUCIONES DE FRECUENCIA
PRUEBA DE CHI-CUADRADO
Permite definir si la función de densidad de
frecuencia es apropiada para la muestra.
Se comparara el valor de2 la variable obtenida a
partir de la muestra   con el valor para 2la
distribución, con un cierto nivel de confianza  , A
 
Si 
2
  2
 ,A  se acepta la hipótesis de que los datos tienen
la distribución elegida.
 Si  2   2, A  se rechaza la hipótesis, ya que es muy poco
probable.

Este Test permite rechazar una distribución por


no ser adecuada, pero en ningún caso permite
probar que una distribución sea correcta.
Si dos o más distribuciones son aceptadas, se
elige como más probable aquella que dé el
mínimo valor para la variable  2
PRUEBA DE CHI-CUADRADO
Ejercicio tipo prueba
Se tiene una estadística de 42 datos de
caudales con una media y una desviación de
750 m3/s y 366 respectivamente. Se ha
determinado que los datos se comportan
adecuadamente como una distribución
Gumbel. Determine el caudal para un Periodo
de Retorno de 100 años.
e y
F ( x)  e
y   ln(  ln( F ( x ))
xx y y
K  
sx sn

También podría gustarte