Resumen Ejecutivo - Probabilidad y Estadistica

UNIVERSIDAD SEÑOR DE SIPAN 12. Bibliografía y Linkografía .....
13
FACULTAD DE INGENIERIA,
ARQUITECTURA Y URBANISMO
1. INTRODUCCION
TRABAJO DE INVESTIGACION N° 02 Un proceso probabilístico en hidrología
consiste en un conjunto de variables al azar;
CURSO: HIDROLOGIA es decir, variables (eventos) que toman
valores en una secuencia a través del
TEMA: PROBABILIDAD Y ESTADISTICA tiempo (horas, días, meses, años). Estos
eventos pueden ser muestreados en forma
EN HIDROLOGIA
discreta o continua.
DOCENTE: Dr. JOSÉ ARBULÚ RAMOS 2. DATOS

HIDROMETEOROLÓGICOS
GRUPO: N° “07”
Existen varios tipos de datos usados en la
hidrología:
ESTUDIANTES:
 Datos históricos de eventos
- ADRIANZÉN VASQUEZ JUAN naturales registrados
MANUEL cronológicamente en forma
- DIAZ TAPIA JOSE FELIX discreta o continua.
- HERRERA VASQUEZ YESSENIA  Levantamiento de datos
- JUAREZ MORALES OMAR hidrológicos en áreas
- REQUEJO RAMOS HEINER  Medidas en laboratorio, como lo
son conductividades hidráulicas
FECHA: Martes, 13 de marzo de 2018. o calidad de aguas.
 Registro simultáneo de un
INDICE evento en dos localidades
1. INTRODUCCION ............................. 1 geográficas diferentes, durante
un determinado período de
2. DATOS
tiempo usado para transferir
HIDROMETEOROLÓGICOS ................ 1
información con propósitos
3. PARÁMETROS ESTADÍSTICOS . 2 diversos.
4. PROBABILIDAD ............................. 3 CALIDAD, HOMOGENEIDAD Y
5. ANÁLISIS DE FRECUENCIA ......... CONSISTENCIA DE LOS DATOS
marzo4 Los datos hidrológicos deben ser

6. DISTRIBUCIÓN DE independientes, homogéneos y lo más
PROBABILIDAD ..................................... 5 representativos posible de la población.
7. AJUSTE DE LA DISTRIBUCIÓN Las fuentes de los errores en datos

10 hidrológicos observados pueden ser:
8. ESTIMACIÓN DE PARÁMETROS - en el sensor (error del registro

10 del dato in situ)
- la transmisión del dato
9. TEST DE BONDAD DE AJUSTE - el registro en la estación de
11 recepción
10. DATOS ATÍPICOS .................... 12 - el procesamiento
- análisis de los datos.
11. ANÁLISIS DE FRECUENCIA
CON POBLACIONES DIVERSAS ..... 12 Dentro de los errores, se consideran errores:
1
Al azar: generalmente se distribuyen MEDIDAS DE TENDENCIA HACIA UN
alrededor del verdadero valor y la desviación VALOR CENTRAL DE LA SERIE
estándar se usa para determinar la magnitud
PROMEDIO ARITMÉTICO O MEDIA
de los desvíos ARITMÉTICA (µ)
Errores sistemáticos: crean inconsistencias Es el primer momento alrededor del origen.

o diferencias en un sólo sentido en relación Se calcula mediante la expresión:
al valor medio que deben ser detectadas y ∑𝑁
𝑖=1 𝑥𝑖
corregidas. 𝑥̅ = 𝜇 = ;
𝑁
Otro tipo de datos a tener en cuenta son los Donde:

no homogéneos o datos afectados por algún 𝑥𝑖 es el valor observado de variable
efecto. La no homogeneidad puede ser
producida por un efecto antrópico N el número de observaciones.
VARIABLES ALEATORIAS PROMEDIO GEOMÉTRICO

Una variable aleatoria X(t) tiene una cierta Se calcula con la siguiente expresión:
distribución probabilística.
𝑥𝑔 = 𝑛√𝑥1 . 𝑥2 . 𝑥3 … 𝑥𝑛
̅̅̅
Esa distribución determina la posibilidad de
que una determinada observación X, de la MEDIANA (M)
variable, caiga dentro de un rango
Es el valor de la variable que deja con igual
especificado de X.
probabilidad de ocurrencia (0.50) los valores
Sí, por ejemplo, la precipitación media de abajo y arriba de ella
enero, en un lugar, es de 50 mm, la
MODA
distribución probabilística podría establecer
que pueda estar en el rango entre 40 y 60 Es el valor de la variable que ocurre con
milímetros. mayor frecuencia.
SERIES DE TIEMPO MEDIDAS DE DISPERSIÓN
Se define como la magnitud de un evento Las medidas de dispersión miden como los
observado en forma discreta a intervalos de valores de una variable se dispersan
tiempo, dt, promediados en ese intervalo o alrededor del valor central o media
registrados en forma continua en un tiempo, aritmética de la serie, es decir, representan
t. una distribución alrededor de un valor
medio.
Las series de tiempo en hidrología pueden
ser: DESVIACIÓN MEDIA (σM)
- Series de duración completa, en Es la media aritmética del valor absoluto de
la cual figuran todos los los errores. Se calcula con la siguiente
registros de la muestra. expresión:
- Series de duración parcial,
donde los datos se seleccionan
de tal manera que su magnitud
es mayor (o menor) que un valor
base predefinido.
3. PARÁMETROS
ESTADÍSTICOS
Un parámetro estadístico es el valor ∑𝑁
𝑖=1|𝑥𝑖 − 𝑥̅ |
𝜎𝑀 =
esperado de alguna variable aleatoria o de 𝑁
alguna función.
2
DESVIACIÓN ESTÁNDAR (σ) Describe la distribución de los datos
alrededor de media.
Se llama también desviación cuadrática. Es
la raíz cuadrada de la varianza y tiene las Una distribución simétrica tiene un
unidades de X. coeficiente de asimetría:
- Igual a cero cuando los datos se

∑𝑁
𝑖=1(𝑥1 − 𝑥̅ )
2
𝜎=√ distribuyen alrededor de la
𝑁−1
media.
- Negativo cuando la distribución
de los datos tiene mayor sesgo
a la izquierda.
- Positivo cuando tiene mayor
sesgo a la derecha, según como
se desvíe hacia valores bajos o
altos con relación a la media.
- Es un parámetro muy usado en estudios
regionales, se calcula con la expresión:
𝑁 ∑𝑁
𝑖=1(𝑥1 − 𝑥̅ )
3
𝑔=
(𝑁 − 1)(𝑁 − 2)𝜎 3
LA VARIANZA:
Es el cuadrado de la desviación estándar

(σ2) y es el segundo momento alrededor
de la media.
Sus unidades son el cuadrado de las

unidades de la variable.
En general, es un indicador que indica

cuanto cerca de la media está el valor de la
variable.
∑𝑁
𝑖=1(𝑥1 − 𝑥̅ )
2 4. PROBABILIDAD
𝜎2 =
𝑁−1
Sea S un espacio muestral asociado a un
experimento, y A cualquier suceso de S, tal
que A es un subconjunto de S, se dice que
COVARIANZA
la probabilidad de P(A) de un evento A, es
Cuando se analiza la varianza de dos (X, Y) un experimento aleatorio que tiene Ns
o más variables (X, Y, Z). Se expresa resultados igualmente posibles y Na
mediante la siguiente ecuación: resultados favorables, está dado por:
𝑁 𝑁𝑎
1 𝑃(𝐴) =
𝐶𝑣(𝑋, 𝑌) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) 𝑁𝑠
𝑁
𝑖=1
Este tiene que satisfacer los siguientes
COEFICIENTE DE VARIACIÓN axiomas.
Es el cociente entre la desviación standard 1., 0 ≤ 𝑃(𝐴) ≥ 1, para todo A ∈ S (Para todo
y el promedio 𝑥̅ . Es adimensional. evento A su probabilidad es positiva y cero
si el evento es imposible).
𝜎 𝜎
𝐶𝑣 = =
𝑥̅ 𝜇 2. P(S)=1
COEFICIENTE DE ASIMETRÍA 3. 𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ … ∪ 𝐴𝑁 ) = 𝑃(𝐴1 + 𝐴2 +
𝐴3 + ⋯ + 𝐴𝑁 ) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + 𝑃(𝐴3 ) +
Es el tercer momento alrededor de la media.
3
⋯ + 𝑃(𝐴𝑁 ) 𝑠𝑖 𝐴1 + 𝐴2 + 𝐴3 + ⋯ +
𝐴𝑁 , 𝑒𝑠 𝑢𝑛𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑚𝑢𝑡𝑢𝑎𝑚𝑒𝑛𝑡𝑒 𝑒𝑥𝑐𝑙𝑢𝑦𝑒𝑛𝑡𝑒
5. ANÁLISIS DE FRECUENCIA
El análisis de frecuencia es una herramienta

Período de Retorno. utilizada para, predecir el comportamiento
Período de retorno es el intervalo medio de futuro de los caudales en un sitio de interés,
tiempo entre ocurrencias de un evento a partir de la información histórica de
hidrológico de una magnitud dada o mayor, caudales. Es un método basado en
generalmente expresada en años. Por procedimientos estadísticos que permite
ejemplo, una inundación de 100 años se calcular la magnitud del caudal asociado a
producirá una vez que el medio en cada 100 un período de retorno. Su confiabilidad
años. Es la inversa de la probabilidad de un depende de la longitud y calidad de la serie
evento. Por lo tanto, una inundación de 100 histórica, además de la incertidumbre propia
años tiene 1% de probabilidad de ocurrir en de la distribución de probabilidades
cada año. Si un lugar tiene una probabilidad seleccionada.
del 2% (0,02) de un sorprendente DISTRIBUCIONES DE PROBABILIDAD
inundación en cualquier año dado, entonces PARA VARIABLES CONTINUAS
esa comunidad esperaría tal inundación, en
promedio, cada 50 años (1 / 0,02). DISTRIBUCION NORMAL
Ejemplo 1 La distribución normal es una distribución

simétrica en forma de campana, también
En un río de Bristol, un flujo máximo anual conocida como Campana de
de más de 10 m 3 / s tiene un período de Gauss. Aunque muchas veces no se ajusta
retorno de 100 años. Si los caudales a los datos hidrológicos tiene amplia
máximos anuales son independientes entre aplicación por ejemplo a los datos
los años, estimar la probabilidad de tal flujo transformados que siguen la distribución
pico se producirá en 2 años consecutivos. normal.
Solución Función de densidad:
A partir de la ecuación (5) La función de densidad está dada por:
La probabilidad de que el flujo máximo de
más de 10m 3 / s es de 0,01, por lo que la
probabilidad de su ocurrencia en dos años
consecutivos será:
Los dos parámetros de la distribución son la
0.01 ∗ 0.01 = 10−4
media m y desviación estándar s para los
Probabilidad total (o probabilidad cuales (media) y s (desviación estándar)
ponderada) son derivados de los datos.
Si B1, B2,..., Bn representa un conjunto de EJEMPLO: Se tiene una estación con 30
eventos mutuamente excluyentes y años de registros de caudales máximos
colectivamente exhaustivos, se puede instantáneos con Media de 4144 pie3/s y
determinar la probabilidad de otro suceso A desviación estándar de 3311 pie3/s. Si el
partir de: coeficiente de asimetría de los caudales es
de 1.981 pie3/s cual es caudal para un
periodo de retorno de 100 años y su
intervalo de confianza.
QTr100 = X+ SK
 Por ejemplo, el análisis de la
radiación solar se puede dividir en K es F (1.981, 100) de tablas se obtiene
días de lluvia y días nonrainy para K=3.595
que la radiación solar total podría
derivarse. (1.9, 100) = 3.553
4
(2.0, 100) = 3.605
QTr100 = 4144+ (3.595) (3311)
QTr100 = 16050 pie3/s

Estas situaciones surgen cuando se
Intervalos de confianza. considera la probabilidad de valores cero o
no cero.
Xt ± t (1-a) Se
DISTRIBUCIÓN BINOMIAL.
La distribución discreta binomial de
probabilidad se aplica a poblaciones que
sólo tienen dos eventos discretos y
d = F (1.981,100) de tablas se complementarios. Una condición esencial
obtiene d =8.4922 para esta aplicación es la independencia de
eventos sucesivos (observaciones o
(1.9, 100) = 8.2196
experimentos) y las probabilidades
(2.0, 100) = 8.5562 constantes p y q de cada ensayo individual.
Donde:
X: es el número de veces que ocurre el
evento.
P(x): es la probabilidad de ocurrencia x = 0,
Se = 5133.56 pie3/s 1, 2 .... etc.
N: es el tamaño de la muestra (número de
t (1-a) = t(0.95) = 1.645 (Leído de la tabla de la observaciones independientes o casos
normal) posibles).
m: es el número de eventos
16050 ± (5133.56) (1.645) q: es la probabilidad de no excedencia, dada
[7605.29 pie3/s 24494.71pie3/s] por:
q = (1 − p)
Intervalos de confianza para QTr100 p: es la probabilidad de excedencia,
calculada mediante la expresión:
6. DISTRIBUCIÓN DE
PROBABILIDAD
es el número combinatorio de n
valores tomados de x, se evalúa
Existen varias distribuciones de probabilidad
así:
que se usan en el diseño hidrológico.
Teniendo en cuenta que en hidrología los
Si x= 0 el número combinatorio es igual a 1
registros disponibles son una pequeña
muestra de la población, resulta lógico
probar diferentes distribuciones para
obtener aquella que mejor se ajuste.
Otro concepto importante en diseño
DISTRIBUCIÓN DE VARIABLES hidrológico es determinar la probabilidad
DISCRETAS. de que un evento de una especificada
magnitud y probabilidad de ocurrencia
pueda repetirse x veces en n años.
Si una muestra de x valores discretos

involucra distribuciones de probabilidad
donde se consideran situaciones de si (p) o Desde el punto de vista estadístico, n es el
de no (q), se obtienen probabilidades número de observaciones independientes
complementarias (p + q = 1). (años de la vida útil), x es el número de
ocurrencias de un evento en n años; p(x) es
5
la probabilidad de que un número x de
ocurrencias se produzcan en n
observaciones (años); p es la probabilidad
anual de ocurrencia (1/TR) y (1-p) es la El único parámetro es m. Cuando
probabilidad de ocurrencia negativa (fallas) teóricamente n tiende a infinito y p tiende a
del evento. cero, pero su producto m tiende a un valor
constante, se selecciona esta distribución.
Los parámetros estadísticos de esta
distribución son: DISTRIBUCIÓN BINOMIAL NEGATIVA
 El valor esperado (promedio): Se usa cuando en un muestreo se supone
que el número de observaciones n, no es
x=n⋅p fijo.
 La varianza:
σ2=n⋅p⋅q la frecuencia relativa (distribución binomial
 El coeficiente de asimetría: negativa o de Pascal) para obtener r
sucesos positivos a partir de n individuos es:
Los términos sucesivos en de una binomial
con índice negativo, son:
 El coeficiente de kurtosis: Cuando r = 1 se

tiene la distribución geométrica:
Si p = 0, la distribución es simétrica.
Siendo m el posicionamiento del valor en la

muestra de ocurrencia en la muestra de
tamaño n. La función binomial negativa de obtener x
eventos positivos es:
DISTRIBUCIÓN DE POISSON.
Aplicable para i > 0, k > 0 y 0 ≤ p ≤ 1.

Donde:
Donde:
x : es el número de ocurrencias de un evento
de pequeña probabilidad p, en un gran p es la probabilidad de un evento positivo.
número de situaciones n. Es frecuente que q es la probabilidad de un evento negativo
una muestra grande (n grande) sea (1 – p).
observada para un evento de muy baja Γ es la función gama de (x+k)
probabilidad de ocurrencia. Los parámetros
estadísticos de esta distribución son: DISTRIBUCIÓN DE VARIABLES
 El valor esperado (promedio): CONTINUAS
se caracterizan porque F(x) es

absolutamente continua.
 La
varianza:
σ2=m
El coeficiente de asimetría:
6
La función de distribución de probabilidad este caso su rango sólo de valores positivos
es F(x) de (x > 0), lo cual en la hidrología es una
ventaja sobre la normal.
Donde y es el logaritmo natural de x:
σy es la desviación standard de y.
μy es el promedio de y se calcula así
La derivada f(x) se denomina función de
densidad de probabilidad y los valores de x
para los cuales f(x) > 0 son el dominio de la
variable aleatoria x.
DISTRIBUCIÓN NORMAL
surge del teorema del límite del valor central,
el cual establece que una variable aleatoria
x está normalmente distribuida con el
promedio μ y la desviación estándar σ. La
función de distribución de probabilidad N es el número de datos de la muestra.
(frecuencia acumulada) proporciona la Los parámetros estadísticos de x
probabilidad de que X sea menor o igual a x
así:  El valor esperado (promedio):
Esta integral es el área bajo la curva de

campana, mostrada en la Figura 4.8
La función de densidad de probabilidad está

dada por.
 Mediana:
 Desviación estándar:
 El coeficiente de asimetría:
Donde:
x es el valor de la variable, μ es el valor
medio de la variable y σ la desviación
estándar.
Al ser simétrica respecto al promedio, el  El
promedio, la moda y la mediana son iguales coeficiente de variación:
y la asimetría es cero.
DISTRIBUCIÓN LOGNORMAL DE DOS

PARÁMETROS
Es una distribución donde la variable x se

reemplaza por su logaritmo (ln x), siendo en
7
Elevando al cuadrado la ecuación es: tablas que se encuentran en la bibliografía
Si α es entero y positivo, el producto se
aplicando logaritmos evalúa mediante la expresión:
De la ecuación se obtiene la expresión para

desviación estándar de la variable y, σy:
 Promedio:
DISTRIBUCIÓN LOGNORMAL DE TRES

PARÁMETROS.
La distribución lognormal se puede  Varianza: σ 2 =α

generalizar para casos en que el límite  Coeficiente de Asimetría:
inferior de la misma no sea cero, en este
caso se introduce un tercer parámetro que
lo sustituya (x-β). La función de densidad de
probabilidad toma la forma:
Donde β es el límite inferior, x la variable. Si

el límite inferior, β, se conoce a priori, la
variable x, se reemplaza por (x-β) y se
procede como en la lognormal de dos
parámetros. Cuando el límite inferior no se
conoce, este se determina por los métodos
de estimación de parámetros descritos más
adelante.
DISTRIBUCIONES TIPO PEARSON

Estas funciones de probabilidad se ajustan
bien a varias distribuciones, la ecuación Figura 4.10 Función de densidad de
general que define la distribución probabilidad (Yevjevich,1972) de la
acumulada. distribución Gamma de un parámetro para
diferentes valores de α
Donde a, b0, b1 y b2 son constantes que se DISTRIBUCIÓN GAMMA DE DOS
deben determinar experimentalmente. PARÁMETROS
En hidrología se usan distribuciones
pertenecientes a esta familia de funciones,
es decir, son casos especiales de la general.
DISTRIBUCIÓN GAMMA DE UN
PARÁMETRO. Donde α es el parámetro de forma (α > 0) y
β el parámetro de escala (β > 0). El
La función de densidad de probabilidad es: producto: Γα se evalúa mediante la
expresión.
 Promedio:
μ =α ⋅β
 Varianza
Donde α es el parámetro de forma. Si α no

es entero, el producto Γα se obtiene de
8
Coeficiente de asimetría: se calcula de β, Po, y E son los parámetros de la
igual manera que para la distribución gama distribución. Se calculan mediante las
de un parámetro expresiones:
Siendo Γβ la función gamma de β, σy la

desviación estándar de y, g el coeficiente
de asimetría de y.
Se
Figura 4.11 Función de densidad de

probabilidad de dos parámetros
(Yevjevich,1972) para α=2 y tres valores de
β recomienda esta distribución para definir
DISTRIBUCIÓN PEARSON III (GAMMA series anuales de crecidas.
DE TRES PARÁMETROS) (KENDALL, Para calcular el coeficiente de frecuencia, k,
1969) de la distribución Log-Pearson III (para
para x ≥E caudales máximos anuales),
la ecuación recomendada
Donde:
Donde: Γβ es la función gamma de β

β, Po, y E son los parámetros de la
distribución. Se calculan mediante las es el promedio de los logaritmos
expresiones. decimales de x.
σx es la desviación estándar de los
logaritmos decimales de x.
k es el factor de frecuencia que es función
del coeficiente de asimetría de los
logaritmos
decimales de los caudales máximos
medios diarios anuales y de la probabilidad
de excedencia (Tabla 4.12).
Log (Q) es el logaritmo decimal del caudal
Siendo σx la desviación estándar de x y g Q en m3/s.
el coeficiente de asimetría de x.
La ecuación sólo es aplicable para valores  Promedio:

de x > E.
DISTRIBUCIÓN LOG PEARSON III
A diferencia de las ecuaciones de lognormal  Desviación estándar:

que usan logaritmos naturales (ln), esta
distribución usan los logaritmos en base 10
(log).
 Coeficiente de asimetría:
Donde y = log x; para log x > E
9
Si se trabaja con asimetría g=0, la Cuando existe un límite superior la
distribución log Pearson III es igual a log- ecuación de probabilidad acumulada es:
normal.
DISTRIBUCIÓN TIPO I (GUMBEL)

Donde α es el parámetro de forma y β el
parámetro de localización (valor central).
Haciendo uso de una variable reducida, y:
Donde: x < E, en el rango de -∞ < x < E
Cuando x o y tienden a +∞ ó a -∞, F(x) tiende

a 0 ó a 1, respectivamente. Los valores de α
y β, están vinculados a la media (μ) y a la
desviación standard (σ) por valores k es el factor de frecuencia, k > 0.
constantes o variables según sea el tamaño E es calculado mediante la siguiente
de la muestra. Conocidos μ y σ los valores
expresión:
de α y β son:
La asimetría 7. AJUSTE DE LA DISTRIBUCIÓN

es constante: (g = 1.139)
Métodos Gráficos
Para calcular el coeficiente de frecuencia, k, El poner directamente los datos a un gráfico
de la distribución Gumbel tipo I (valores preestablecido es una forma práctica muy
extremos), partiendo de la ecuación de corriente en diseño hidrológico. Se grafica una
densidad de probabilidad de Gumbel variable en las ordenadas y la frecuencia o
tiempo de retorno en las abscisas. Esto es lo que
se llama posiciones de graficación (“spotting
positions”).
Donde γ es la constante de Euler igual a

0.57721 (Kreyszic, 1964). 8. ESTIMACIÓN DE
TR es el tiempo de recurrencia o período de PARÁMETROS
retorno en años.
Después que los datos han sido ordenados
y depurados el principal objetivo de la
inferencia estadística es la estimación de los
parámetros de la función de distribución de
probabilidad.
Tabla 4.14 Valores de yn y σn en función Cuanto más confiable sea la estimación de

de la longitud del registro, N, en años. los parámetros en la muestra, mejor y más
confiable será la información que se puede
El valor de la variable reducida se extraer del análisis estadístico. Si los datos
encuentra con la siguiente ecuación: son buenos a mayor número de ellos más
cercano se estará de la verdadera
DISTRIBUCIÓN TIPO III (WEIBULL) distribución.
(CHOW, 1964)
Métodos Analíticos
10
Por este método (Chow, et.al., 1994;
Los métodos descritos a continuación, son Yevjevich, 1972) se determinan los valores
los ajustes analíticos de un conjunto de de los parámetros en forma de obtener la
datos a una curva de distribución de función de verosimilitud. Si se tiene una
probabilidad. función de densidad de probabilidad f(x; a;
ß...) de una variable continua x con los
Método de los Momentos (Chow et.al., parámetros a, ß... a ser estimados, el
1994; Yevjevich, 1972) producto infinito o función de verosimilitud
de una muestra de N valores de una variable
Por este método introducido por Pearson, continua x es:
se establecen relaciones entre los N
parámetros de la distribución seleccionada y
los n primeros momentos de la muestra. Así
para cada parámetro a, β,..N tendrá una
ecuación:
9. TEST DE BONDAD DE
AJUSTE
Una curva de frecuencia desarrollada a

través de una muestra de datos, se supone
que es la mejor estimación de la curva de
frecuencia de la población.
Método de los mínimos cuadrados Existen diferentes pruebas de bondad de

ajuste, en este libro se tratan la Ji-cuadrado
Este es un método muy usado en hidrología, (𝑋 2 ) y el Kolmogorov-Smirnov (K-S). Algo
no sólo para ajustar funciones de importante en estos tests (𝑋 2 y K-S) es que
distribución, sino también curvas de se usan para determinar si hay evidencias
caudales en ríos (relación h/Q), ecuaciones para aceptar o rechazar la hipótesis hecha
de regresión de correlaciones entre para seleccionar determinadas
estaciones de caudales, ajuste de curvas de distribuciones, pero no indican en forma
intensidad – duración – frecuencia de absoluta, cual es mejor.
lluvias, etc. Por este método se calcula una
línea de regresión (en lo posible recta) para Test de Ji-cuadrado (𝑿𝟐 )
ajustar los datos graficados. La línea que se
obtiene puede no representar exactamente
Este método se usa tanto para verificar
la distribución teórica, pero, en general
distribuciones de probabilidad, ya sean
puede producir un ajuste igual o mejor que
distribuciones continuas con grupos de
el método de los momentos.
datos expresados como frecuencia absoluta
de intervalos de clase o como frecuencias
El ajuste de una distribución se puede hacer,
absolutas en distribuciones discretas. Es un
ya sea a una de las conocidas distribuciones
método paramétrico que se evalúa mediante
de frecuencia de probabilidad o a cualquier
la expresión:
otra curva empírica que la observación del
gráfico de los valores de la variable pueda
sugerir. En el caso de una función:
En esta ecuación n es el número de

El método minimiza la suma de los desvíos intervalos de clase para variables discretas
al cuadrado de los valores observados y los o el número de eventos para variables
calculados, así: continuas, 𝑓𝑖 son las frecuencias absolutas
observadas de cada evento (o de cada
intervalo de clase) y 𝑝𝑖 es la probabilidad de
los eventos (o de los intervalos) calculados
con la ecuación a verificar p(x, a, ß, γ...).
Método de Máxima Verosimilitud Test de Kolmogorov-Smirnov (K-S)
11
El método El método Kolmogorov suelo, seguido de fuertes lluvias que
Kolmogorov-Smirnov Smirnov (K-S) se usa producen altos caudales en un río de
cuando no se verifican parámetros de una régimen pluvial o pluvionival.
distribución previa y se trabaja con una
distribución acumulada. Los datos dudosos altos pueden también
deberse a factores naturales no
En este método se determina la máxima meteorológicos como lo son la rotura de
desviación entre la posición de graficación diques glaciarios o diques formados por
experimental (Pxi) la distribución acumulada derrumbes de tipo geológico que luego se
teórica (F(x)). Si se tiene una muestra de n rompen.
datos x1, x2, x3....xn en orden ascendente o
descendente y sus posiciones de En ríos de régimen nival y pluvionival y
graficación dadas por P(xi) = m/n+1, se cuencas grandes, la propia cuenca integra
obtiene el gráfico de una preseleccionada todo y los datos pueden ser tratados, como
distribución empírica. Luego, F(x) el una serie proveniente de una población. Hay
verdadero valor de la distribución teórica la casos que esto no es posible, como por
máxima diferencia se define como:
ejemplo ríos de régimen nival con largas
crecientes de primavera – verano (de fusión
nival) y picos de lluvias torrenciales
montados sobre el hidrograma de fusión
nival.
Donde Do, es el valor de la máxima
desviación entre la curva experimental y la
teórica. En algunos casos, este valor puede 11. ANÁLISIS DE FRECUENCIA
corresponder a la cola de la distribución CON POBLACIONES
donde el ajuste no es tan necesario. DIVERSAS
10. DATOS ATÍPICOS Las crecidas de ciertos ríos son formadas
por diferentes tipos de eventos que son a
Al analizar los datos de un evento (lluvias, veces de distinto origen. Un caso frecuente
caudales) para realizar curvas de frecuencia puede ser crecientes de tipo nival, a las que
y graficar los datos, es frecuente encontrar se superponen crecientes pluviales.
puntos que se separan en forma más o
menos sensible de la línea media de En este caso el análisis se puede realizar
frecuencias. superponiendo el factor de fusión nival,
generalmente en las cuencas altas, al de
Estos datos pueden ser altos o bajos o lluvias en las cuencas medias y bajas.
ambos, consecuentemente, su inclusión sin
un análisis previo puede llevar a una curva Cuando ambos componentes son
de frecuencias distorsionada con relación a producidos por fenómenos meteorológicos
la que la muestra podría indicar. (fusión nival y tormentas de lluvia), los datos
medidos (si existen) integran ambas
El USWRC (1982) define outlier como poblaciones y en general, la separación de
“Evento extremo o dato puntual que se eventos se hace en función de la época de
separan de la tendencia general de la fusión nival y la de lluvias, es decir,
muestra”. separación por estaciones del año
(separación por calendario).
En realidad, el análisis es primeramente
subjetivo, un análisis de consistencia de los COMBINACIÓN DE CURVAS DE
datos resulta útil, por lo menos para separar FRECUENCIA
datos dudosos provenientes de errores de
medición. Cuando la curva de frecuencia resultante se
deriva de dos o más curvas de frecuencia
Una investigación, por ejemplo de un obtenidas separadamente el resultado se
invierno con fuerte acumulación de nieve, refiere a una curva de frecuencia
seguido de altas temperaturas en primavera combinada.
y verano, puede ser una causa natural, que
aclare el concepto del dato registrado o SELECCIÓN DE DATOS
lluvias antecedentes que hayan saturado el
12
El primer paso es obtener todos los datos a (1-𝑷𝟏 ).(1-𝑷𝟐 )
analizar, como si se tratara de una sola
población y realizar un estudio de frecuencia La probabilidad de que cualquiera de los
de acuerdo a lo especificado anteriormente. dos ocurra es:
Este primer estudio, es entonces un análisis 1- (1-𝑷𝟏 ).(1-𝑷𝟐 )
de frecuencia de poblaciones mezcladas.
𝑷𝒄 = 𝑷𝟏 + 𝑷𝟐 − 𝑷𝟏 . 𝑷𝟐
El paso siguiente, para realizar el análisis de
frecuencia de poblaciones combinadas, es
la identificación de los factores causales 12. Bibliografía y Linkografía
que producen la presunta “anomalía”.
COMBINACIÓN DE CURVAS DE  Cap.4. Diseño Hidrológico.

FRECUENCIA Sergio Fattorelli – Pedro
Fernández.
En el caso (HEC, 1982) de combinar dos
curvas de frecuencia desarrolladas en
forma independiente la ecuación general
para combinar curvas múltiples de
frecuencia es:
Donde:
𝑷𝒄 =Es la probabilidad de excedencia de

la curva de frecuencia de la población
combinada para una determinada
descarga.
𝑷𝟏 − 𝑷𝟐 … 𝑷𝒏 =Son las probabilidades de

excedencia asociadas con una
determinada descarga obtenida de las
curvas 1, 2, n.
n=Número de curvas de frecuencias a

combinar.
En caso de trabajar sólo con dos curvas, la

ecuación 4.123, se reduce a:
𝑷𝒄 = 𝑷𝟏 + 𝑷𝟐 − 𝑷𝟏 . 𝑷𝟐
Sin embargo, esta ecuación representa, la

probabilidad de que ambas P1 y P2
ocurrirán. En el caso que se tengan dos
curvas de frecuencia, la pregunta es:
cuando uno u otro evento ocurrirán. La
probabilidad de ocurrencia de uno u otro
evento es equivalente a:
Probabilidad de que ambos no ocurran.

Probabilidad de no ocurrencia para 𝑷𝟏 𝑦 𝑷𝟐 ,
son respectivamente:
(1-𝑷𝟏 ) ; (1-𝑷𝟐 )
Luego la probabilidad combinada de no

ocurrencia es:
13

Resumen Ejecutivo - Probabilidad y Estadistica

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen Ejecutivo - Probabilidad y Estadistica

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD SEÑOR DE SIPAN 12. Bibliografía y Linkografía .....

DOCENTE: Dr. JOSÉ ARBULÚ RAMOS 2. DATOS

marzo4 Los datos hidrológicos deben ser

7. AJUSTE DE LA DISTRIBUCIÓN Las fuentes de los errores en datos

8. ESTIMACIÓN DE PARÁMETROS - en el sensor (error del registro

Errores sistemáticos: crean inconsistencias Es el primer momento alrededor del origen.

Otro tipo de datos a tener en cuenta son los Donde:

VARIABLES ALEATORIAS PROMEDIO GEOMÉTRICO

- Igual a cero cuando los datos se

Es el cuadrado de la desviación estándar

Sus unidades son el cuadrado de las

En general, es un indicador que indica

El análisis de frecuencia es una herramienta

Ejemplo 1 La distribución normal es una distribución

QTr100 = 4144+ (3.595) (3311)

QTr100 = 16050 pie3/s

Si una muestra de x valores discretos

 El coeficiente de kurtosis: Cuando r = 1 se

Siendo m el posicionamiento del valor en la

Aplicable para i > 0, k > 0 y 0 ≤ p ≤ 1.

se caracterizan porque F(x) es

Donde y es el logaritmo natural de x:

Esta integral es el área bajo la curva de

La función de densidad de probabilidad está

DISTRIBUCIÓN LOGNORMAL DE DOS

Es una distribución donde la variable x se

De la ecuación se obtiene la expresión para

DISTRIBUCIÓN LOGNORMAL DE TRES

La distribución lognormal se puede  Varianza: σ 2 =α

Donde β es el límite inferior, x la variable. Si

DISTRIBUCIONES TIPO PEARSON

Donde α es el parámetro de forma. Si α no

Siendo Γβ la función gamma de β, σy la

Figura 4.11 Función de densidad de

Donde: Γβ es la función gamma de β

La ecuación sólo es aplicable para valores  Promedio:

DISTRIBUCIÓN LOG PEARSON III

A diferencia de las ecuaciones de lognormal  Desviación estándar:

Donde y = log x; para log x > E

DISTRIBUCIÓN TIPO I (GUMBEL)

Donde: x < E, en el rango de -∞ < x < E

Cuando x o y tienden a +∞ ó a -∞, F(x) tiende

La asimetría 7. AJUSTE DE LA DISTRIBUCIÓN

Donde γ es la constante de Euler igual a

Tabla 4.14 Valores de yn y σn en función Cuanto más confiable sea la estimación de

Una curva de frecuencia desarrollada a

Método de los mínimos cuadrados Existen diferentes pruebas de bondad de

En esta ecuación n es el número de

COMBINACIÓN DE CURVAS DE  Cap.4. Diseño Hidrológico.

𝑷𝒄 =Es la probabilidad de excedencia de

𝑷𝟏 − 𝑷𝟐 … 𝑷𝒏 =Son las probabilidades de

n=Número de curvas de frecuencias a

En caso de trabajar sólo con dos curvas, la

Sin embargo, esta ecuación representa, la

Probabilidad de que ambos no ocurran.

Luego la probabilidad combinada de no

También podría gustarte