Documentos de Académico
Documentos de Profesional
Documentos de Cultura
13
FACULTAD DE INGENIERIA,
ARQUITECTURA Y URBANISMO
1. INTRODUCCION
TRABAJO DE INVESTIGACION N° 02 Un proceso probabilístico en hidrología
consiste en un conjunto de variables al azar;
CURSO: HIDROLOGIA es decir, variables (eventos) que toman
valores en una secuencia a través del
TEMA: PROBABILIDAD Y ESTADISTICA tiempo (horas, días, meses, años). Estos
eventos pueden ser muestreados en forma
EN HIDROLOGIA
discreta o continua.
1
Al azar: generalmente se distribuyen MEDIDAS DE TENDENCIA HACIA UN
alrededor del verdadero valor y la desviación VALOR CENTRAL DE LA SERIE
estándar se usa para determinar la magnitud
PROMEDIO ARITMÉTICO O MEDIA
de los desvíos ARITMÉTICA (µ)
3. PARÁMETROS
ESTADÍSTICOS
Un parámetro estadístico es el valor ∑𝑁
𝑖=1|𝑥𝑖 − 𝑥̅ |
𝜎𝑀 =
esperado de alguna variable aleatoria o de 𝑁
alguna función.
2
DESVIACIÓN ESTÁNDAR (σ) Describe la distribución de los datos
alrededor de media.
Se llama también desviación cuadrática. Es
la raíz cuadrada de la varianza y tiene las Una distribución simétrica tiene un
unidades de X. coeficiente de asimetría:
𝑁 ∑𝑁
𝑖=1(𝑥1 − 𝑥̅ )
3
𝑔=
(𝑁 − 1)(𝑁 − 2)𝜎 3
LA VARIANZA:
∑𝑁
𝑖=1(𝑥1 − 𝑥̅ )
2 4. PROBABILIDAD
𝜎2 =
𝑁−1
Sea S un espacio muestral asociado a un
experimento, y A cualquier suceso de S, tal
que A es un subconjunto de S, se dice que
COVARIANZA
la probabilidad de P(A) de un evento A, es
Cuando se analiza la varianza de dos (X, Y) un experimento aleatorio que tiene Ns
o más variables (X, Y, Z). Se expresa resultados igualmente posibles y Na
mediante la siguiente ecuación: resultados favorables, está dado por:
𝑁 𝑁𝑎
1 𝑃(𝐴) =
𝐶𝑣(𝑋, 𝑌) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) 𝑁𝑠
𝑁
𝑖=1
Este tiene que satisfacer los siguientes
COEFICIENTE DE VARIACIÓN axiomas.
Es el cociente entre la desviación standard 1., 0 ≤ 𝑃(𝐴) ≥ 1, para todo A ∈ S (Para todo
y el promedio 𝑥̅ . Es adimensional. evento A su probabilidad es positiva y cero
si el evento es imposible).
𝜎 𝜎
𝐶𝑣 = =
𝑥̅ 𝜇 2. P(S)=1
COEFICIENTE DE ASIMETRÍA 3. 𝑃(𝐴1 ∪ 𝐴2 ∪ 𝐴3 ∪ … ∪ 𝐴𝑁 ) = 𝑃(𝐴1 + 𝐴2 +
𝐴3 + ⋯ + 𝐴𝑁 ) = 𝑃(𝐴1 ) + 𝑃(𝐴2 ) + 𝑃(𝐴3 ) +
Es el tercer momento alrededor de la media.
3
⋯ + 𝑃(𝐴𝑁 ) 𝑠𝑖 𝐴1 + 𝐴2 + 𝐴3 + ⋯ +
𝐴𝑁 , 𝑒𝑠 𝑢𝑛𝑎 𝑠𝑒𝑟𝑖𝑒 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑚𝑢𝑡𝑢𝑎𝑚𝑒𝑛𝑡𝑒 𝑒𝑥𝑐𝑙𝑢𝑦𝑒𝑛𝑡𝑒
5. ANÁLISIS DE FRECUENCIA
QTr100 = X+ SK
Por ejemplo, el análisis de la
radiación solar se puede dividir en K es F (1.981, 100) de tablas se obtiene
días de lluvia y días nonrainy para K=3.595
que la radiación solar total podría
derivarse. (1.9, 100) = 3.553
4
(2.0, 100) = 3.605
Donde:
X: es el número de veces que ocurre el
evento.
P(x): es la probabilidad de ocurrencia x = 0,
Se = 5133.56 pie3/s 1, 2 .... etc.
N: es el tamaño de la muestra (número de
t (1-a) = t(0.95) = 1.645 (Leído de la tabla de la observaciones independientes o casos
normal) posibles).
m: es el número de eventos
16050 ± (5133.56) (1.645) q: es la probabilidad de no excedencia, dada
[7605.29 pie3/s 24494.71pie3/s] por:
q = (1 − p)
Intervalos de confianza para QTr100 p: es la probabilidad de excedencia,
calculada mediante la expresión:
6. DISTRIBUCIÓN DE
PROBABILIDAD
es el número combinatorio de n
valores tomados de x, se evalúa
Existen varias distribuciones de probabilidad
así:
que se usan en el diseño hidrológico.
Teniendo en cuenta que en hidrología los
Si x= 0 el número combinatorio es igual a 1
registros disponibles son una pequeña
muestra de la población, resulta lógico
probar diferentes distribuciones para
obtener aquella que mejor se ajuste.
Otro concepto importante en diseño
DISTRIBUCIÓN DE VARIABLES hidrológico es determinar la probabilidad
DISCRETAS. de que un evento de una especificada
magnitud y probabilidad de ocurrencia
pueda repetirse x veces en n años.
5
la probabilidad de que un número x de
ocurrencias se produzcan en n
observaciones (años); p es la probabilidad
anual de ocurrencia (1/TR) y (1-p) es la El único parámetro es m. Cuando
probabilidad de ocurrencia negativa (fallas) teóricamente n tiende a infinito y p tiende a
del evento. cero, pero su producto m tiende a un valor
constante, se selecciona esta distribución.
Los parámetros estadísticos de esta
distribución son: DISTRIBUCIÓN BINOMIAL NEGATIVA
El valor esperado (promedio): Se usa cuando en un muestreo se supone
que el número de observaciones n, no es
x=n⋅p fijo.
La varianza:
σ2=n⋅p⋅q la frecuencia relativa (distribución binomial
El coeficiente de asimetría: negativa o de Pascal) para obtener r
sucesos positivos a partir de n individuos es:
Los términos sucesivos en de una binomial
con índice negativo, son:
Si p = 0, la distribución es simétrica.
DISTRIBUCIÓN DE POISSON.
La
varianza:
σ2=m
El coeficiente de asimetría:
6
La función de distribución de probabilidad este caso su rango sólo de valores positivos
es F(x) de (x > 0), lo cual en la hidrología es una
ventaja sobre la normal.
σy es la desviación standard de y.
μy es el promedio de y se calcula así
La derivada f(x) se denomina función de
densidad de probabilidad y los valores de x
para los cuales f(x) > 0 son el dominio de la
variable aleatoria x.
DISTRIBUCIÓN NORMAL
surge del teorema del límite del valor central,
el cual establece que una variable aleatoria
x está normalmente distribuida con el
promedio μ y la desviación estándar σ. La
función de distribución de probabilidad N es el número de datos de la muestra.
(frecuencia acumulada) proporciona la Los parámetros estadísticos de x
probabilidad de que X sea menor o igual a x
así: El valor esperado (promedio):
Desviación estándar:
El coeficiente de asimetría:
Donde:
x es el valor de la variable, μ es el valor
medio de la variable y σ la desviación
estándar.
Al ser simétrica respecto al promedio, el El
promedio, la moda y la mediana son iguales coeficiente de variación:
y la asimetría es cero.
7
Elevando al cuadrado la ecuación es: tablas que se encuentran en la bibliografía
Si α es entero y positivo, el producto se
aplicando logaritmos evalúa mediante la expresión:
Promedio:
DISTRIBUCIÓN GAMMA DE UN
PARÁMETRO. Donde α es el parámetro de forma (α > 0) y
β el parámetro de escala (β > 0). El
La función de densidad de probabilidad es: producto: Γα se evalúa mediante la
expresión.
Promedio:
μ =α ⋅β
Varianza
8
Coeficiente de asimetría: se calcula de β, Po, y E son los parámetros de la
igual manera que para la distribución gama distribución. Se calculan mediante las
de un parámetro expresiones:
Se
la ecuación recomendada
Donde:
Coeficiente de asimetría:
9
Si se trabaja con asimetría g=0, la Cuando existe un límite superior la
distribución log Pearson III es igual a log- ecuación de probabilidad acumulada es:
normal.
10
Por este método (Chow, et.al., 1994;
Los métodos descritos a continuación, son Yevjevich, 1972) se determinan los valores
los ajustes analíticos de un conjunto de de los parámetros en forma de obtener la
datos a una curva de distribución de función de verosimilitud. Si se tiene una
probabilidad. función de densidad de probabilidad f(x; a;
ß...) de una variable continua x con los
Método de los Momentos (Chow et.al., parámetros a, ß... a ser estimados, el
1994; Yevjevich, 1972) producto infinito o función de verosimilitud
de una muestra de N valores de una variable
Por este método introducido por Pearson, continua x es:
se establecen relaciones entre los N
parámetros de la distribución seleccionada y
los n primeros momentos de la muestra. Así
para cada parámetro a, β,..N tendrá una
ecuación:
9. TEST DE BONDAD DE
AJUSTE
11
El método El método Kolmogorov suelo, seguido de fuertes lluvias que
Kolmogorov-Smirnov Smirnov (K-S) se usa producen altos caudales en un río de
cuando no se verifican parámetros de una régimen pluvial o pluvionival.
distribución previa y se trabaja con una
distribución acumulada. Los datos dudosos altos pueden también
deberse a factores naturales no
En este método se determina la máxima meteorológicos como lo son la rotura de
desviación entre la posición de graficación diques glaciarios o diques formados por
experimental (Pxi) la distribución acumulada derrumbes de tipo geológico que luego se
teórica (F(x)). Si se tiene una muestra de n rompen.
datos x1, x2, x3....xn en orden ascendente o
descendente y sus posiciones de En ríos de régimen nival y pluvionival y
graficación dadas por P(xi) = m/n+1, se cuencas grandes, la propia cuenca integra
obtiene el gráfico de una preseleccionada todo y los datos pueden ser tratados, como
distribución empírica. Luego, F(x) el una serie proveniente de una población. Hay
verdadero valor de la distribución teórica la casos que esto no es posible, como por
máxima diferencia se define como:
ejemplo ríos de régimen nival con largas
crecientes de primavera – verano (de fusión
nival) y picos de lluvias torrenciales
montados sobre el hidrograma de fusión
nival.
Donde Do, es el valor de la máxima
desviación entre la curva experimental y la
teórica. En algunos casos, este valor puede 11. ANÁLISIS DE FRECUENCIA
corresponder a la cola de la distribución CON POBLACIONES
donde el ajuste no es tan necesario. DIVERSAS
10. DATOS ATÍPICOS Las crecidas de ciertos ríos son formadas
por diferentes tipos de eventos que son a
Al analizar los datos de un evento (lluvias, veces de distinto origen. Un caso frecuente
caudales) para realizar curvas de frecuencia puede ser crecientes de tipo nival, a las que
y graficar los datos, es frecuente encontrar se superponen crecientes pluviales.
puntos que se separan en forma más o
menos sensible de la línea media de En este caso el análisis se puede realizar
frecuencias. superponiendo el factor de fusión nival,
generalmente en las cuencas altas, al de
Estos datos pueden ser altos o bajos o lluvias en las cuencas medias y bajas.
ambos, consecuentemente, su inclusión sin
un análisis previo puede llevar a una curva Cuando ambos componentes son
de frecuencias distorsionada con relación a producidos por fenómenos meteorológicos
la que la muestra podría indicar. (fusión nival y tormentas de lluvia), los datos
medidos (si existen) integran ambas
El USWRC (1982) define outlier como poblaciones y en general, la separación de
“Evento extremo o dato puntual que se eventos se hace en función de la época de
separan de la tendencia general de la fusión nival y la de lluvias, es decir,
muestra”. separación por estaciones del año
(separación por calendario).
En realidad, el análisis es primeramente
subjetivo, un análisis de consistencia de los COMBINACIÓN DE CURVAS DE
datos resulta útil, por lo menos para separar FRECUENCIA
datos dudosos provenientes de errores de
medición. Cuando la curva de frecuencia resultante se
deriva de dos o más curvas de frecuencia
Una investigación, por ejemplo de un obtenidas separadamente el resultado se
invierno con fuerte acumulación de nieve, refiere a una curva de frecuencia
seguido de altas temperaturas en primavera combinada.
y verano, puede ser una causa natural, que
aclare el concepto del dato registrado o SELECCIÓN DE DATOS
lluvias antecedentes que hayan saturado el
12
El primer paso es obtener todos los datos a (1-𝑷𝟏 ).(1-𝑷𝟐 )
analizar, como si se tratara de una sola
población y realizar un estudio de frecuencia La probabilidad de que cualquiera de los
de acuerdo a lo especificado anteriormente. dos ocurra es:
Este primer estudio, es entonces un análisis 1- (1-𝑷𝟏 ).(1-𝑷𝟐 )
de frecuencia de poblaciones mezcladas.
𝑷𝒄 = 𝑷𝟏 + 𝑷𝟐 − 𝑷𝟏 . 𝑷𝟐
El paso siguiente, para realizar el análisis de
frecuencia de poblaciones combinadas, es
la identificación de los factores causales 12. Bibliografía y Linkografía
que producen la presunta “anomalía”.
frecuencia es:
Donde:
𝑷𝒄 = 𝑷𝟏 + 𝑷𝟐 − 𝑷𝟏 . 𝑷𝟐
(1-𝑷𝟏 ) ; (1-𝑷𝟐 )
13