Está en la página 1de 74

Hidrología Estadística

Dr. Victor Parra


M. Sc. Makarena Henríquez
Departamento de Ingeniería Ambiental
Universidad de Concepción
vparrar@udec.cl
Estadística
Conceptos básicos
• Estadística es la ciencia de recolectar, organizar, describir, interpretar datos para
transformarlos en información que contribuya a la toma eficiente de decisiones.
– Estadística descriptiva → Uso de la información y de la estadística para
describir determinados fenómenos.

Describe, analiza y representa un grupo de datos utilizando


métodos numéricos y gráficos, que resumen y presentan la
información contenida en ellos.

– Estadística inferencial → Uso de la información y de la estadística para inferir


y proyectar fenómenos.

Apoyándose en el cálculo de probabilidades y a partir de datos


muestrales efectúa estimaciones, decisiones y predicciones
sobre un conjunto mayor de datos (población).
Estadística
Conceptos básicos
• Estadística descriptiva

Analiza una serie de datos con el fin de concluir sobre el comportamiento de una
variable.
– Incluye la tabulación, representación y descripción de conjuntos de datos.
– A partir de ellos se puede organizar, simplificar y resumir información básica.
Estadística
Conceptos básicos
• Estadística inferencial
– Proporciona métodos para estimar las características de un grupo (población) basándose
en los datos de un conjunto pequeño (muestra).

• Población: Universo (conjunto) de todos los elementos que estamos estudiando, acerca de
los cuales intentamos sacar conclusiones.

• Muestra: Pequeña parte de la población que debería ser representativa de la población.

• Eventos: Resultados posibles que se pueden presentar en la realización de un experimento.


Estadística
Conceptos básicos
➢ Espacio muestral (S): Es el conjunto de todas las muestras posibles de una población.

➢ Evento: Es un subconjunto cualquiera del espacio muestral.


Estadística
Conceptos básicos
• Estadígrafo: Función que permite caracterizar y definir el comportamiento de
una población a partir de datos muéstrales.

Por ejemplo, la media y la desviación estándar.


Estadística
Conceptos básicos

• Variable: Una variable estadística es una propiedad que puede fluctuar y cuya variación
es susceptible de adoptar diferentes valores, los cuales pueden medirse u observarse.

• Dato: Son los valores cualitativos o cuantitativos mediante los cuales se miden las
características de los objetos, sucesos o fenómenos a estudiar.
Estadística
Conceptos básicos
Variable Aleatoria (va): Es una variable estadística cuyos valores están influenciados por el azar.

➢ Por convención, la va se representa con una letra mayúscula, mientras que el valor que
toma la va se representa con minúsculas. P (X<x)

➢ Las va puede ser discretas (conjunto finito o infinito numerable de valores) o


continuas (cualquier valor dentro de un rango).

➢ La función matemática que describe los valores posibles de una va y sus


probabilidades asociadas se denomina distribución de probabilidad.
Estadística
Conceptos básicos
• Tipos de variables

– Variables Cualitativas: Son aquellas


que no aparecen de forma numérica,
sino como categorías o atributos
• Genero,
• Profesión,
• Color de ojos,
• Estudios,
• Región, etc

– Variables cuantitativas: Son aquellas


que pueden caracterizarse
numéricamente.
• Precipitación
• Caudal
• Temperatura
HIDROLOGIA ESTADSTICA
En hidrología y su relación con la estadística existen dos enfoques.

• Uno basado en la teoría de bayes o de probabilidad condicional (el evento x depende de la


ocurrencia del evento y), y uno basado en una naturaleza aleatoria (todos los eventos tienen
igual probabilidad).

• Si bien el enfoque bayesiano tiene mucho más sentido en términos físicos (la probabilidad de
que mañana llueva depende de la ocurrencia de lluvia hoy), el enfoque aleatorio ha
demostrado ser un enfoque mucho más simple e igualmente útil en la práctica.

• Por lo tanto, debido a su simplicidad, el enfoque aleatorio es el más utilizado en la práctica.


Hidrología estadística
La probabilidad de un evento A se denota por P(A), y
representa la posibilidad de que el evento A ocurra
cuando se hace una observación de la va. P(A) ≥ 0.

• Si una muestra de N observaciones tiene NA valores


en el rango del evento A, entonces la probabilidad
que ocurra un evento A es :

NA
P(A)= N

– Al arrojar una moneda la probabilidad de que


salga cara es ½.
– Al lanzar un dado la probabilidad de que salga
un número mayor o igual a que 3 es 4/6.

Probabilidad condicional: Si tenemos dos eventos A y B,


la pb condicional representa a la pb conjunta de que
ocurran A y B, es decir, que ocurra el evento B dado que
ocurrió A. Ejemplo: ¿Si llueve el día de mañana, cuanto
podrá llover?
Hidrología estadística
El concepto de eventos independientes u observaciones independientes es fundamental para una interpretación
correcta de los análisis estadísticos de información hidrológica, pues si los eventos son independientes, estos se pueden
analizar sin tener en cuenta el orden de ocurrencia de los eventos

Si los eventos son independientes:


𝑃 𝑋 < 𝑥1 = 𝑝𝑜𝑐𝑢
Que se repita n veces el evento
𝑝𝑜𝑐𝑢 𝑛
Hidrología estadística

• Para extraer conclusiones estadísticas a partir de series de datos


pluviométricos o fluviométricos es necesario definir una serie histórica
de al menos 30 años para que sea representativa.
Hidrología estadística

En hidrología 2 tenemos dos situaciones practicas:

Valor Probabilidad
• Evaluar la probabilidad de que un valor de Q o P sea mayor o menor a un
valor determinado.

¿Probabilidad de que un caudal sea mayor a 1000 (l/S)?

Probabilidad Valor:
• Evaluar qué valor de Q o P será superado un determinado % de los años.

¿Qué caudal de un rio será superado en un 10 %?


Hidrología estadística
Distribuciones
Histograma

Cuando las observaciones de una muestra están idénticamente distribuidas, i.e., cada
valor observado proviene de la misma distribución de probabilidad (conocida o no), estas
se pueden ordenar para construir un histograma de frecuencias relativas.

1. El rango de los valores muestreados se divide en n intervalos discretos.


2. Se cuenta el número de observaciones dentro de cada intervalo.
3. El resultado se dibuja en un gráfico de barras, pero sin espacio entre barras.
Hidrología estadística
Distribuciones
• Representación gráfica de una muestra.

– Histograma de frecuencias. ¿Cómo construirlo?

1. Ordenar los datos de la muestra en forma creciente o decreciente.


2. Determinar el rango de la muestra R = Xmax-Xmin
3. Seleccionar el número de intervalos de clase (NC).

𝑁𝐶 = 1.33 ∙ 𝑙𝑛 𝑁 + 1 (Yevjevich)

4. Calcular la amplitud de cada intervalo de clase (∆𝑥)

𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
∆𝑥 =
𝑁𝐶 − 1

Al considerar NC-1 lo que se hace es aumentar el rango en ∆𝑥, incluyendo un


intervalo extra. Este intervalo se agrega como ∆𝑥/2 en cada extremo de la serie,
favoreciendo que el histograma se aproxime de mejor manera a una función de
densidad teórica.
Hidrología estadística
Distribuciones
Representación gráfica de una muestra.

Histograma de frecuencias. ¿Cómo construirlo?

5. Calcular los límites de clase de cada uno de los intervalos. Con el paso 4 se
consigue que Xmax y Xmin coincidan con la marca de clase de la primera y última
clase. Luego, los límites superior e inferior de dichas clases se calculan como:
∆𝑥
𝐿𝐶𝐼1 = 𝑥𝑚𝑖𝑛 −
2
∆𝑥
𝐿𝐶𝑆1 = 𝑥𝑚𝑖𝑛 +
2
Los límites siguientes se obtienen sumando la amplitud ∆𝑥 al límite de clase
anterior.

6. Calcular las marcas de clase (centro de cada intervalo).


7. Calcular la frecuencia absoluta de cada intervalo.
8. Calcular la frecuencia relativa de cada intervalo.
9. Calcular la frecuencia relativa acumulada.
Hidrología estadística
Distribuciones
La función de frecuencia relativa de un evento xi se denota por fs(xi) y se calcula
como el número de ocurrencias del evento, ni, sobre el total de ocurrencias, n:

𝑛𝑖
𝑓𝑠 𝑥𝑖 =
𝑛

La suma de las frecuencias relativas hasta un punto dado se llama la función de


frecuencias acumulada Fs(x):
𝑖

𝐹𝑠 𝑥𝑖 = ෍ 𝑓𝑠 𝑥𝑖
𝑗=1

Consecuentemente se define la función de densidad de pbb 𝑓(x), PDF, y de


distribución de pbb, CDF, 𝐹 𝑥 como:
𝑓𝑠 𝑥𝑖 𝐹𝑠 𝑥𝑖
𝑓 𝑥 = 𝑛→∞
lim 𝐹 𝑥 = 𝑛→∞
lim
∆𝑥→0
∆𝑥 ∆𝑥→0
∆𝑥
Hidrología estadística
Distribuciones
Histograma
Función de frecuencias relativas

• Al observar una serie de datos (e.j caudales,


precipitaciones, temperaturas), se podría
comprobar, en general, que los valores
intermedios son más frecuentes, mientras que
los valores elevados o pequeños se presentan
con menor frecuencia.

• Supongamos que se han medido varios caudales


medios en un periodo, y hemos distribuido los
valores en grupos (por ejemplo, de 5 en 5 l/s).
Hidrología estadística
Distribuciones
Función de densidad

• Si se hacen intervalos más pequeños y aumentamos los valores medidos, el grafico


continúa teniendo la misma forma, pero se suavizaría progresivamente hasta
convertirse en una cuerva continua.

Se conoce como
distribución normal o
campana de Gauss.
Hidrología estadística
Distribuciones

FUNCION DE DISTRIBUCION DE PROBABILIDAD


• Si en lugar de considerar que caudal o caudales quedan dentro de cada intervalo,
consideramos que caudal queda incluido hasta ese intervalo.
• Pj. ¿Cuál es la probabilidad de un valor menor o igual a 180?
• P(X<=180)
Hidrología estadística
Distribuciones
• FUNCION DE DENSIDAD Y FUNCION DE DISTRIBUCION

Función de densidad (PDF) Función de distribución de probabilidad (CDF)

F(x)=0.88

F(x)=0.88

La función de densidad representa la probabilidad de ocurrencia de un valor determinado de la variable X.


Mientras que la función de distribución acumulada representa la probabilidad de ocurrencia de un rango
de la variable X medido desde 0 ó −∞ hasta un valor límite x de X.
Hidrología estadística
Distribuciones

Histograma de Función de
frecuencias densidad
relativas

Función de Función de
frecuencias distribución de
acumulada probabilidad
Hidrología estadística
Distribuciones
• Las estadísticas son números que resumen algunas de las características más importantes de
la muestra a partir de la cual son calculados.

• Los parámetros estadísticos son características de la población, y se calculan como el valor


esperado de alguna función de va.

• Descriptores comúnmente utilizados para mostrar las propiedades estadísticas de una va.

(1) Tendencia Central

(2) Dispersión

(3) Asimetría
Momentos
(4) Curtosis estadísticos
Son indicadores genéricos
de una distribución.

24
Hidrología estadística
Distribuciones
• Parámetros de una función de distribución:
Parámetros de tendencia central

– Media: Valor medio de una función de


distribución 𝜇 . Representa el valor
esperado de la variable X. También se
denomina momento de primer orden.
fx(x)
Proporciona información acerca de dónde fx(x)

se concentran los valores que toma X.

– Mediana: Valor que separa el 50% superior


e inferior de los datos de la variable X.
x
x

(a) Uni-modal distribution


– Moda: Valor de ocurrencia más frecuente fx(x)
fx(x)
(a) Uni-modal distribution

en una muestra.

• Una función de densidad de pbb puede ser uni-


modal, bimodal, o multi-modal.
x
x
(b) Bi-modal distribution
(b) Bi-modal distribution
Hidrología estadística
Distribuciones
• Parámetros de una función de distribución:
Parámetros de dispersión
– Varianza: Es el segundo momento central con respecto a la media. Mide la variabilidad o
dispersión con respecto a la media.
1
𝜎2 = 𝑉 𝑋 = ∙ ෍ 𝑥𝑖 − 𝑥ҧ 2
𝑛−1
– Desviación estándar: Corresponde a la raíz cuadrada de la varianza. Representa también
una medida de dispersión con respecto a la media.

– Coeficiente de variación: Es una medida relativa de dispersión. También se considera


como una medida adimensional de variabilidad de los datos con respecto a la media. Se
utiliza normalmente para comparar diferentes tipos de datos.
𝐶𝑣 = 𝑆𝐷 Τ𝑥ҧ
Hidrología estadística
Distribuciones
• Parámetros de una función de distribución:
– Desviación estándar v/s coeficiente de variación

La dispersión de la primera muestra es relativamente mayor (CV=0.13), su desviación estándar


equivale el 13% de la media, mientras que, en la segunda muestra, es solamente un 5% de la
media (CV=0.05).
Hidrología estadística
Distribuciones
• Parámetros de una función de distribución:
– Coeficiente de asimetría: Es una medida de asimetría con
respecto de la media de la función.

𝑛
∙ σ 𝑥𝑖 − 𝑥ҧ
𝑛−1 ∙ 𝑛−2
𝛾=
𝑆𝐷 3

Si 𝛾= 0 la distribución es simétrica.
Si 𝛾 > 0 la distribución tiene sesgo (“cola”) hacia el lado derecho.
Si 𝛾 < 0 la distribución tiene sesgo (“cola”) hacia el lado izquierdo.
Hidrología estadística
Distribuciones
• Parámetros de una función de distribución:

– Curtosis: Es una medida de


achatamiento de una función. Indica el
grado de llanura de la función de
densidad.
Hidrología estadística
Distribuciones
Los cuantiles son puntos tomados a intervalos
regulares de la función de distribución de pbb
de una variable aleatoria. El cuantil de orden p
de una distribución (0 ≤ p ≤ 1) es el valor que
identifica a una proporción de la población como
menores o iguales.
Cuantiles típicos utilizados:
• Los cuartiles: dividen a la distribución en
cuatro partes (corresponden a los cuantiles p
= 0.25, 0.5 y 0.75)
• Los quintiles, dividen a la distribución en
cinco partes (0.20, 0.40, 0.60 y 0.80).
• Los deciles en diez partes, y los percentiles
en cien partes.

30
Hidrología estadística
Distribuciones
Moment Measure of Definition Continuous Variable Discrete Variable Sample Estimator

Central Mean, Expected value μx =  xk p( xk ) x =  xi / n
First
Location E(X)=x
x =  x f ( x) dx
−
x all x's

Variance, Var(X)=2= x2 


 =  (x − μx ) fx (x) dx
2 2
2
 =  ( xk −  x ) Px ( xk )
2 s2 =
1
n −1
(
 xi − x ) 2

x x all x ' s
−

Standard deviation, x  x = Var ( X )


Second Dispersion 1
(
 xi − x )
2

 x = Var ( X ) s=
n −1

Coefficient of variation, x x = x  x x = x  x
Cv = s x
μ3 =  ( xk − μx )3 px ( xk )
( )

n
 xi − x
3
Skewness
μ3 =  ( x − μx ) f x ( x) dx
3
m3 =
Third Asymmetry −
all x's (n − 1)(n − 2)

Skewness coefficient, x x = 3 / x3 x = 3 / x3 g = m3 / s3


n (n + 1)
(
 xi − x )
4
μ4 =  ( xk − μx )4 px ( xk ) m4 =

μ4 =  (x − μ ) f x ( x) dx
4
x
all x's
(n − 1)(n − 2)(n − 3)
−

Fourth Peakedness
Kurtosis, x x = 4 / x4 k = m4 / s4
x = 4 / x 4

Excess coefficient, x x = x −  x = x − 

31
Hidrología estadística
Análisis de frecuencia

• Los sistemas hidrológicos generalmente se ven impactos por eventos extremos,


como inundaciones o sequías.
• La magnitud de un evento extremo es inversamente proporcional a su frecuencia
de ocurrencia.
• El objetivo del análisis de frecuencias es relacionar la magnitud de un evento
extremo con su frecuencia de ocurrencia, a través del uso de distribuciones de
probabilidad.
• Principales supuestos: los datos analizados son eventos independientes y el
sistema hidrológico que genera los datos es estocástico.
Hidrología estadística
Análisis de frecuencia
Se define la excedencia de un evento extremo cuando una va 𝑋 ≥ 𝑥𝑇
• Período de retorno (T) → Intervalo promedio de tiempo (en años) dentro del cual,
un evento de magnitud X puede ser igualado o excedido por lo menos una vez en
promedio.
• Variable de período de retorno (VT) → Variable que es igualada o excedida en
promedio al menos una vez cada T años.
• Si llamamos p a la probabilidad de excedencia del evento (𝑋 ≥ 𝑥𝑇 ):

1
𝑃 𝑋≥𝑥 =
𝑇

1
∴𝑃 𝑋 <𝑥 =1−
𝑇
Hidrología estadística
Análisis de frecuencia
• Riesgo (R) → Probabilidad de falla o excedencia de una condición de diseño.

– Por ejemplo, si un caudal de diseño Q, tiene un período de retorno T años, y


una probabilidad de excedencia P, se tiene:

1
– P = Probabilidad de que sea superado un caudal Q.
𝑇

1
– Por lo tanto, la probabilidad de que no sea superado será 𝑃ത = 1 − 𝑃 = 1 −
𝑇

– Luego, la probabilidad de que no falle en N años será 𝑃𝑁𝐹 ∙ 𝑃𝑁𝐹 ∙ 𝑃𝑁𝐹 … 𝑃𝑁𝐹 N
𝑛 1 𝑛
veces. Es decir 𝑃𝑁𝐹 = 𝑃𝑁𝐹 .

– Por complementariedad, la probabilidad de que 𝑛


sí falle en N años o el riesgo
1
(R) de falla de dicha obra será R = 1 − 1 − .
𝑇
Hidrología estadística
Análisis de frecuencia
• Probabilidad empírica o experimental vs teórica.

– La probabilidad empírica es aquella estimada a partir


de un experimento, donde la base de datos será la
muestra.

– La probabilidad teórica corresponde a aquella


calculada a partir de la población. Corresponde a la
probabilidad correcta o real de una observación
determinada.

– En hidrología la muestra de una variable hidro-


meteorológica puede cambiar constantemente y
puede verse alterada por una medición puntual (e.j.
crecida y lluvias del año 2006, 2023).

– Producto de ello existen diferentes autores que


proponen realizar el cálculo de la probabilidad
experimental considerando que la muestra puede
estar incompleta o que puede ser perfectible. Para ello
se proponen las siguientes ecuaciones.
Hidrología estadística
Análisis de frecuencia
• Probabilidad experimental acumulada.

– California 𝑚Τ
𝑛

Las ecuaciones buscan reducir el numerador y


𝑚−1Τ2
– Hazen aumentar el denominador, con lo que se
𝑛
consigue considerar, la probabilidad de
𝑚 ocurrencia de valores mayores a los
– Weibull observados en la muestra.
𝑛+1

𝑚−0.3 De lo contrario, el valor máximo observado


– Chegadayev 𝑚+0.4
tendría una probabilidad de ocurrencia de
100% y de excedencia de 0%.
𝑚−3Τ8
– Blom
𝑛+1Τ4

3𝑚−1
– Tukey
3𝑛+1

Donde m es el número de orden (número de la observación ordenados de menor a


mayor), n es el número total de observaciones.
Hidrología estadística
Análisis de frecuencia
Ejercicio. usando los “CAUDALES MAXIMOS
Q (m3/s) n PWeibull Pex T (Años) INSTANTANEOS DE ESTACION LAJA EN PUENTE
288.2 1 0.032 0.968 1.03
581.6 2 0.065 0.935 1.07
PERALES”, utilizados en el histograma de
591.6 3 0.097 0.903 1.11 frecuencias, estime los caudales de 3 y 6 años de
610.9 4 0.129 0.871 1.15 periodo de retorno.
751.4 5 0.161 0.839 1.19
771.1 6 0.194 0.806 1.24 Procedimiento
775.6 7 0.226 0.774 1.29 • Ordenar de menor a mayor los caudales.
785.2 8 0.258 0.742 1.35 • Asignar número de orden a cada caudal.
812.2 9 0.290 0.710 1.4 • Calcular la probabilidad empírica (se recomienda usar
898.9 10 0.323 0.677 1.5 Weibull). Pw=Poc=P(Q<Ql)=N/(30+1)
903.7 11 0.355 0.645 1.6
• Con la probabilidad de Weibull calcular la Pexcedencia
913.1 12 0.387 0.613 1.6
(Pex)
918.6 13 0.419 0.581 1.7
• Calcular el periodo de retorno asociado a cada
960.4 14 0.452 0.548 1.8
probabilidad.
987.8 15 0.484 0.516 1.9
1138.6 16 0.516 0.484 2.1 • Calcular el caudal para los distintos periodos de
1217 17 0.548 0.452 2.2 retorno interpolando.
1282.4 18 0.581 0.419 2.4
1496 19 0.613 0.387 2.6 𝑚3
1504.4 20 0.645 0.355 2.8
Q(T=3 años)=1511 𝑠
1516.1 21 0.677 0.323 3.1
1516.2 22 0.710 0.290 3.4
1619.5 23 0.742 0.258 3.9 𝑚3
1632.2 24 0.774 0.226 4.4 Q(T=6 años)=1693 𝑠
1678.8 25 0.806 0.194 5.2
1704.8 26 0.839 0.161 6.2
1989.9 27 0.871 0.129 7.8
2160.7 28 0.903 0.097 10.3
2302.2 29 0.935 0.065 15.5
2599.7 30 0.968 0.032 31.0
Hidrología estadística
Distribuciones
Ejercicio
Con los datos entregados “CAUDALES MAXIMOS INSTANTANEOS DE ESTACION LAJA
EN PUENTE PERALES” se le pide construir el histograma de frecuencia.

Año caudal (m3/s) Año caudal (m3/s)


1977 913.1 1992 771.1
1978 1282.4 1993 1516.2
1979 1516.1 1994 960.4
1980 898.9 1995 918.6
1981 1138.6 1996 591.6
1982 1496 1997 987.8
1983 1504.4 1998 288.2
1984 751.4 1999 581.6
1985 1217 2000 1619.5
1986 1632.2 2001 2160.7
1987 812.2 2002 1989.9
1988 903.7 2003 2302.2
1989 785.2 2004 610.9
1990 775.6 2005 1678.8
1991 1704.8 2006 2599.7
Hidrología estadística
Distribuciones
Ejercicio en clases: solución
1) Rango

Numero de datos (N) = 30

• Xmax =2599.7 m3/s


• Xmin= 288.2 m3/s Rango = 2311.5

2) Numero de intervalos de clases (Nc)

𝑁𝐶 = 1.33 ∗Ln(N) +1 =5.52= 6 intervalos

3) Amplitud

𝑋𝑚𝑎𝑥−𝑋𝑚𝑖𝑛
∆x= = 462.3
𝑁𝑐−1
.
Hidrología estadística
Distribuciones
Ejercicio en clases: solución

Dividir Frecuencia
Promedio de cada absoluta por N
Xmin +∆x/2 intervalo

Xmin -∆x/2 INTERVALOS Marca de F relativa


INF SUP clase F absoluta F relativa acumulada
57.05 519.35 288.2 1 0.03 0.03
Todos los limites
siguientes sumar ∆x 519.35 981.65 750.5 13 0.43 0.47
e.j. 981.65 1443.95 1212.8 4 0.13 0.60
Linf2=57.05+462.3= 1443.95 1906.25 1675.1 8 0.27 0.87
519.45 1906.25 2368.55 2137.4 3 0.10 0.97
2368.55 2830.85 2599.7 1 0.03 1.00
Hidrología estadística
Distribuciones de probabilidad
• El uso de funciones de probabilidad teóricas y posterior aplicación de modelos probabilísticos a
fenómenos hidrometeorológicos normalmente se utiliza para extender el rango de aplicabilidad de
la serie de datos observados (muestra). Es decir, para trabajar con probabilidades de excedencia y
ocurrencia que no es posible de determinar a través de la muestra.

• Por ejemplo, si se tiene una muestra de 30 años de datos de caudal máximo instantáneo (serie de
máximos anuales), y estos se ordenan de menor a mayor, el menor dato ha sido igualado o
superado 30 veces en 30 años, por lo que su período de retorno es 1 año (30 años/30 veces
superado).

• De manera análoga, el dato número 28 ha sido igualado o superado 3 veces en 30 años, por lo que
dicho valor tiene asociado, según la muestra utilizada, un período de retorno de 10 años (30/3).

• Así, este análisis se podría extender hasta un máximo de 30 años de período de retorno que
correspondería al máximo valor observado en la serie. Pero, ¿qué sucede si se quiere estimar el
caudal de 100 años de período de retorno?, o ¿cómo podría estimar aquel caudal que tiene
probabilidad de ocurrencia de 99%?
Hidrología estadística
Distribuciones de probabilidad
• Para abordar este problema, se ajustan funciones de
probabilidad teóricas a datos muestrales.

Distribuciones
teóricas
comúnmente
utilizadas en
hidrología
Hidrología estadística
Distribuciones de probabilidad
• Para abordar este problema, se ajustan funciones de
probabilidad teóricas, a datos muestrales.

Distribuciones
teóricas
comúnmente
utilizadas en
hidrología
Hidrología estadística
Distribuciones de probabilidad
• ¿Cómo utilizar una función teórica en un problema en particular en
hidrología?
REGISTRO DE DATOS

SELECCIÓN DE FUNCIONES TEÓRICAS

ESTIMACIÓN DE PARÁMETROS

PRUEBA DE BONDAD DE AJUSTE

NO SÍ
AJUSTE OK

UTILIZAR FUNCIÓN ELEGIDA CON FINES


PREDICTIVOS O DE TOMA DE DECISIÓN
Hidrología estadística
Distribuciones de probabilidad

Distribución Normal
La función Normal es el modelo más utilizado y con mayor importancia en el campo de la
estadística. Sin embargo, su uso es muy limitado en hidrología, dado que las variables
raramente se comportan de esta forma.
Linsley et al. (1988) señalan que el uso de esta función, en términos hidrológicos, debe
reducirse a zonas húmedas donde el valor medio es alto, no siendo recomendable para
valores extremos.

Función de densidad normal:


Hidrología estadística
Distribuciones de probabilidad
Distribución Normal Estándar
• Para resolver esta función se recurren a
métodos numéricos para evaluarla, y
para hacer esto más sencillo se le ha
asignado una variable estandarizada,
cuya expresión es la siguiente:
• La cual está normalmente distribuida
con media cero y desviación estándar
unitaria.
Hidrología estadística
Distribuciones de probabilidad
Distribución Normal Estándar
Hidrología estadística
Distribuciones de probabilidad

Distribución Normal – parámetros

Donde
• 𝑋ത es la media de los datos muestrales. También llamado parámetro de posición.
• S es la desviación estándar o parámetro de escala.
Hidrología estadística
Distribuciones de probabilidad
Distribución Log-Normal
En esta función de logaritmos naturales de la variable aleatoria se distribuyen normal. La función
de densidad de probabilidad es:
Hidrología estadística
Distribuciones de probabilidad
Distribución Log-Normal – parámetros
Los logaritmos de los datos se distribuyen normal.

“Si la variable aleatoria X tiene una distribución Log-Normal, entonces la variable aleatoria Y
= Log(X) se distribuye normal”.

Obs: Por lo tanto, se obtienen los logaritmos de los datos, pero se trabaja con distribución
normal, y luego se vuele a la variable original.
Hidrología estadística
Distribuciones de probabilidad
Distribución Gamma
La función de distribución de probabilidad es:

−𝑥
𝑥 𝛾−1
𝑥 𝑒𝛽
𝐹 𝑥 =න 𝑑𝑥
0 𝛽𝛾 𝑟(𝛾)

• La función de densidad:
−𝑥
𝛾−1
𝑥 𝑒𝛽
𝑓 𝑥 =
𝛽𝛾 𝑟(𝛾)
ß: Parámetro de escala
𝛾: Parámetro de forma
r(𝛾): función Gamma
Hidrología estadística
Distribuciones de probabilidad
Distribución Gamma – Parámetros
Hidrología estadística
Distribuciones de probabilidad
Distribución Gamma de tres parámetros – Distribución Pearson

Función de distribución acumulada.

−(𝑥−𝑥0 )
𝑥 𝛾−1
(𝑥 − 𝑥0 ) 𝑒 𝛽
𝐹 𝑥 =න 𝑑𝑥
𝑋0 𝛽𝛾 𝑟(𝛾)

Función de densidad de probabilidad


−(𝑥−𝑥0 )
(𝑥−𝑥0 )𝛾−1 𝑒 𝛽
f(x) =
𝛽 𝛾 𝑟(𝛾)

Xo: Parámetro de posición


ß: Parámetro de escala (valor > 0)
𝛾: Parámetro de forma
r(𝛾): Función Gamma
Hidrología estadística
Distribuciones de probabilidad
Distribución Pearson- parámetros

4 𝐶𝑠 ∙ 𝑆 2∙𝑆
𝛾= 2 𝛽= 𝑥0 = 𝑋ത −
𝐶𝑠 2 𝐶𝑠

𝑁 2 ∙ 𝑀3
𝐶𝑠 =
(𝑁 − 1)(𝑁 − 2) ∙ 𝑆 2

ത 3
(𝑥 − 𝑋)
𝑀3 = ෍
𝑁
Hidrología estadística
Distribuciones de probabilidad

Distribución Gumbel
Corresponde a una función de valores extremos. También se denomina FVE Tipo I o de
Fisher.
Hidrología estadística
Distribuciones de probabilidad

Distribución Gumbel – Parámetros

6
𝛼= ∙ 𝑆 = 𝟎. 𝟕𝟕𝟗𝟔𝟗𝟔𝟖𝟎𝟏 ∙ 𝑺
𝜋

𝜇 = 𝑋ത − 0.57721566490153286061 ∙ 𝛼 = 𝑿
ഥ − 𝟎. 𝟒𝟓 ∙ 𝑺

La función Gumbel se utiliza generalmente para trabajar con valores extremos como
caudales y precipitaciones máximas o mínimas anuales.
Hidrología estadística
Pruebas de bondad de ajuste
• Las pruebas de bondad de ajuste se utilizan para comprobar gráfica y estadísticamente si la
frecuencia empírica de la serie analizada se ajusta a una determinada función de
probabilidades teórica (seleccionada a priori), cuyos parámetros que caracterizan dicha
distribución son estimados en bases a valores muestrales.

• Técnicamente, las pruebas estadísticas tienen como objetivo medir la certidumbre que se
obtiene al hacer una hipótesis estadística sobre una población, es decir, validar o clasificar el
hecho de asumir que una variable aleatoria (muestra) se distribuye de acuerdo a una función
de probabilidades teórica (población).

• En este curso se analizarán como pruebas de bondad de ajuste las siguientes:

➢ Ajuste gráfico (PDF y CDF)


➢ Chi-Cuadrado
➢ Test K-S (No paramétrico)
Hidrología estadística
Pruebas de bondad de ajuste
1.- AJUSTE GRÁFICO (histograma de frecuencias)

El ajuste gráfico se puede realizar de las siguientes formas:

• Comparación histograma de frecuencias relativas vs función de densidad teórica. A


partir de dicha comparación se puede obtener una opinión cualitativa respecto del nivel
de ajuste, coherencia entre la muestra y la función teórica seleccionada (analizada) y
zonas de “adecuado”/”mal” nivel de ajuste entre serie y función teórica.

0.25 0.25

0.2 0.2

0.15 0.15

0.1 0.1

Buen ajuste Mal ajuste


0.05 0.05

0 0
0 1000 2000 3000 4000 5000 6000 0 1000 2000 3000 4000 5000 6000
(a) Normal (b) EV o Gumbel
Hidrología estadística
Pruebas de bondad de ajuste
1.- AJUSTE GRÁFICO (curva de frecuencias acumuladas)

El ajuste gráfico se puede realizar de las siguientes formas:

• Comparación función de distribución acumulada con distribución de frecuencias


acumuladas. Al igual que el caso anterior, permite identificar aquellas zonas donde se
tiene un “buen” o “mal” ajuste. En este caso se contrastan probabilidades acumuladas,
por lo que su interpretación es de lectura más fácil para el caso de probabilidades de
ocurrencia o excedencia. Desde este punto de vista permite identificar aquellas zonas
donde las probabilidades de la serie se alejan con la de la función teórica seleccionada.

Buen ajuste Mal ajuste


Hidrología estadística
Pruebas de bondad de ajuste
2.- Prueba Chi-Cuadrado (χ2)

• La prueba Chi-cuadrado se basa en la comparación o cálculo de las frecuencias tanto


observadas como esperadas (calculada de acuerdo con la hipótesis nula formulada) para un
número determinado de intervalos. Esta prueba permite determinar si los datos muestrales
se ajustan a una determinada distribución teórica. Permite analizar tanto distribuciones
discretas como continuas.

𝑘 2
𝜃𝑖 − 𝑒𝑖
𝜒𝑐2 =෍
𝑒𝑖
𝑖=1
Donde σ𝑘𝑖=1 𝜃𝑖 = σ𝑘𝑖=1 𝑒𝑖 = 𝑁

𝜒𝑐2 → Valor calculado de Chi-Cuadrado a partir de los datos.


𝜃𝑖 → Número de valores observados en el intervalo de clase i.
𝑒𝑖 → Número de valores esperados en el intervalo de clase i.
𝑘 → Número de intervalos de clase.
Hidrología estadística
Pruebas de bondad de ajuste
2.- Prueba Chi-Cuadrado (χ2)

• El valor obtenido de 𝜒𝑐2 refleja la suma de las diferencias entre las frecuencias relativas del
histograma (muestra) con los valores de la función de densidad teórica de los diferentes
intervalos de clase. Esto también puede ser interpretado como la suma de las diferencias
entre las probabilidades de ocurrencia (probabilidades acumuladas) de los diferentes
intervalos de clase.

• Como criterio de decisión se compara el valor obtenido con un valor límite 𝜒𝑡2 que depende
de la distribución Chi-Cuadrado, del nivel de significancia (α) elegido y de los grados de
libertad (gl).

• Si 𝜒𝑐2 ≤ 𝜒𝑡2 se acepta la hipótesis nula, y por lo tanto se asume que los datos muestrales
siguen la función de distribución teórica pre-seleccionada. De lo contrario se acepta la
hipótesis alternativa (los datos no siguen la función teórica pre-seleccionada).

• Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando esta es verdadera.


El complemento, (1- α) se denomina el nivel de confianza y se traduce en la probabilidad de
aceptar la hipótesis nula cuando esta es verdadera.
Hidrología estadística
Pruebas de bondad de ajuste
2.- Prueba Chi-Cuadrado (χ2)
Caudal Caudal Caudal Caudal
Año Año Año Año
(m3/s) (m3/s) (m3/s) (m3/s)
1971 121.3 1981 79 1991 52.3 2001 144.7
1972 144.9 1982 76.9 1992 36.3 2002 109.2
1973 142.4 1983 110.1 1993 88 2003 48.5
1974 205.8 1984 95.6 1994 122.4 2004 59.6
1975 114.5 1985 48.8 1995 162.1 2005 40.3
1976 72.5 1986 148.3 1996 97.2 2006 112.2
1977 26.7 1987 67.5 1997 52.5 2007 137.1
1978 92.8 1988 70 1998 165.6 2008 32.9
1979 58.8 1989 63.4 1999 64.2
1980 57.4 1990 76.3 2000 110.2

Función de densidad Dist. Normal (PDF) Cálculo de X2


Histograma de frecuencias

Marcas de Frecuencias Frecuencias Frec. Frec.


Intervalos de clase Frecuencias Media Desv. Est. cdf min cdf max Dif Esp
Clase relativa acumulada Esperada Esperada

26.7 8.7 44.7 4 0.11 0.105 106.8 16115.6 0.0292 0.1453 0.1162 4.6 5 0.20
62.7 44.7 80.7 15 0.39 0.500 940.5 11322.0 0.1453 0.4129 0.2676 10.2 10 2.50
98.7 80.7 116.7 9 0.24 0.737 888.3 654.3 0.4129 0.7312 0.3183 12.1 12 0.75
134.7 116.7 152.7 7 0.18 0.921 942.9 13878.1 0.7312 0.9269 0.1957 7.5 8 0.13
170.7 152.7 188.7 2 0.05 0.974 341.4 12969.0 0.9269 0.9890 0.0621 2.4 2 0.00
206.7 188.7 224.7 1 0.03 1.000 206.7 13578.4 0.9890 0.9991 0.0101 0.4 1 0.00
Total 38 1 90.2 43.0 0.9700 Suma 3.58
Chi teorica 7.8147279

X muestra < X teórico por lo tanto se verifica la hipótesis nula.


Hidrología estadística
Pruebas de bondad de ajuste
2.- Prueba Chi-Cuadrado (χ2)

• D Indica la diferencia que busca medir la prueba


Chi-cuadrado.

• Ventajas y limitaciones:

– En la práctica se utiliza para cualquier


función teórica, pero estrictamente es
válida sólo para la función de distribución
normal, puesto que fue desarrollada en
base a datos normales e independientes.
– La prueba se realiza sobre la función de
densidad.
– Requiere de un conocimiento a priori de la
función a comparar.
– Es de fácil aplicación.
– Para su validez, requiere que la frecuencia
absoluta sobre cada clase sea mayor o igual
que 5 → Desventaja. Requiere gran
cantidad de información puesto que
compara el histograma muestral con el
teórico.
Hidrología estadística
Pruebas de bondad de ajuste
3.- Prueba de Kolmogorov-Smirnov (K-S test)

• El K-S test consiste comparar las diferencias que existen entre la probabilidad acumulada
empírica (de los datos de la muestra) con la probabilidad acumulada teórica de la función
pre-seleccionada. Utiliza como valor de comparación la máxima diferencia en valor absoluto
de la probabilidad empírica y teórica, y luego dicho valor se compara con un valor límite que
proviene de la función K-S. La expresión que define dicha diferencia es la siguiente.

𝛥 = 𝑚𝑎𝑥 𝐹 𝑥 − 𝑃(𝑥)

• Donde 𝛥 es el estadístico de comparación, 𝐹 𝑥 la probabilidad de la función teórica y 𝑃 𝑥


la probabilidad experimental o empírica (de la muestra).
• Una forma recomendada para calcular la probabilidad experimental o empírica es mediante
la fórmula de Weibull.
• Al comparar probabilidades opera directamente sobre las curvas de distribución acumulada
empírica y teórica.
Hidrología estadística
Pruebas de bondad de ajuste
3.- Prueba de Kolmogorov-Smirnov (K-S test)

𝑀
𝑃 𝑥 =
𝑁+1

• Donde M corresponde al número de orden y N al número de datos (Weibull).

• Luego es necesario conocer el valor que tomaría la función teórica en el mismo valor x, y que
caracteriza mediante los parámetros media, desviación estándar, coeficiente de asimetría,
etc. Valores obtenidos de la muestra. Con esto se asume que la distribución teórica tiene los
mismos parámetros que la muestra de datos utilizada.

• Conocido el valor de 𝛥, es necesario compararlo con un valor límite (𝛥𝑙𝑖𝑚 ) que depende de la
función K-S, del tamaño de la muestra y del nivel de significancia (α).

• Si 𝛥 < 𝛥𝑙𝑖𝑚 se acepta la hipótesis nula con el nivel de significancia α. Es decir se acepta que
los datos muestrales siguen la función de distribución preseleccionada. De lo contrario se
acepta la hipótesis alternativa (los datos no siguen la función de distribución
preseleccionada) y por lo tanto se debe probar con una función teórica diferente.
Hidrología estadística
Pruebas de bondad de ajuste
3.- Prueba de Kolmogorov-Smirnov (K-S test)

• Para muestras de más de 35 datos, el estadígrafo límite de Kolmogorov-Smirnov se puede


calcular según las siguientes fórmulas.

• Ventajas y limitaciones:
– No requiere un conocimiento a priori de la función de distribución teórica.
– No requiere hacer intervalos de clase, lo que simplifica su utilización. Se aplica sobre la
cdf y no sobre la pdf como el caso de Chi-cuadrado.
– Es válido para cualquier función de distribución.
Hidrología estadística
Pruebas de bondad de ajuste
3.- Prueba de Kolmogorov-Smirnov (K-S test)
Prob. Prob.
Diferencia
Datos Orden Weibull Teórica
(F(x)-P(x))
(Muestra) (Normal)
26.7 1 0.026 0.063 0.037
32.9 2 0.051 0.083 0.031
36.3 3 0.077 0.095 0.018
40.3 4 0.103 0.112 0.010 Dmáx 0.109
48.5 5 0.128 0.153 0.025 Delta lim 0.221 Para n = 38,α = 0.05
48.8 6 0.154 0.155 0.001
52.3 7 0.179 0.175 0.005
52.5
57.4
8
9
0.205
0.231
0.176
0.207
0.029
0.024
Dmax < Dlim Se acepta la hipótesis nula. Los datos se
58.8 10 0.256 0.217 0.040 distribuyen normal.
59.6 11 0.282 0.222 0.060
63.4 12 0.308 0.250 0.058
64.2 13 0.333 0.256 0.078
67.5 14 0.359 0.281 0.078
70 15 0.385 0.301 0.084
72.5 16 0.410 0.322 0.089
76.3 17 0.436 0.354 0.082
76.9 18 0.462 0.359 0.102
79 19 0.487 0.378 0.109
88 20 0.513 0.460 0.053
92.8 21 0.538 0.504 0.034
95.6 22 0.564 0.531 0.034
97.2 23 0.590 0.545 0.044
109.2 24 0.615 0.653 0.038
110.1 25 0.641 0.661 0.020
110.2 26 0.667 0.662 0.005
112.2 27 0.692 0.679 0.013
114.5 28 0.718 0.698 0.020
121.3 29 0.744 0.751 0.007
122.4 30 0.769 0.759 0.010
137.1 31 0.795 0.852 0.057
142.4 32 0.821 0.879 0.058
144.7 33 0.846 0.889 0.043
144.9 34 0.872 0.890 0.019
148.3 35 0.897 0.905 0.007
162.1 36 0.923 0.948 0.025
165.6 37 0.949 0.957 0.008
205.8 38 0.974 0.996 0.022
Hidrología estadística
Pruebas de bondad de ajuste
3.- Prueba de Kolmogorov-Smirnov (K-S test)
Curvas de frecuencias acumuladas (muestral) y de distribución acumulada (teórica, normal).
D Indica la diferencia que busca medir la prueba K-S.
Hidrología estadística
Aplicación de modelos probabilísticos
Curvas de Variación estacional
• Proporcionan información sobre la distribución de los valores hidrológicos, respecto al
tiempo y la probabilidad de que dichos eventos ocurran.

Ej. Caudal que será igualado o superado el 10 % del tiempo.

• Se utilizan para identificar el régimen hidrológico de un rio bajo diferentes


probabilidades de excedencia.

• También se utiliza para conocer los valores de QMM (Caudal medio


mensual) con una determinada Pex o Poc.
Hidrología estadística
Aplicación de modelos probabilísticos
Curvas de Variación estacional
• Muestra las tendencias de la escorrentía que se asocian con los aspectos
morfológicos, geológicos y climáticos de la cuenca.
• Régimen Pluvial con aporte de acuíferos.
Hidrología estadística
Aplicación de modelos probabilísticos
Curvas de Variación estacional
• Muestra las tendencias de la escorrentía que se asocian con los aspectos morfológicos,
geológicos y climáticos de la cuenca.
• Régimen Pluvial sin aporte de acuíferos
Hidrología estadística
Aplicación de modelos probabilísticos

Pluvial

Deshielo

Estiaje
Hidrología estadística
Aplicación de modelos probabilísticos
Curva de Duración General
• Se construye asociando una probabilidad a valores registrados de caudal en un río.
• Indica el porcentaje del tiempo durante el cual los caudales han sido igualados o
excedido. P(X>=x)
• Se utilizan registros diarios o mensuales.
Hidrología estadística
Aplicación de modelos probabilísticos
Ejercicio
Para la serie de datos calcule utilizando la función de distribución Gumbel.

a) La probabilidad de que no se exceda un caudal de 1000 (m3/s).


b) Calcule el periodo de retorno de dicho caudal
c) ¿Cual es el caudal de periodo de retorno de 25 años?

Tabla 1. Caudales máximos instantáneos (m3/s)

Año Q (m3/s)
1982 892
1983 744
1984 1026
1985 898
1986 814
1987 1123
1988 782
1989 984
1990 899
1991 771

También podría gustarte