Está en la página 1de 30

i

Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos


probabilísticos

TEMA 2: ESTIMACIÓN DE AVENIDAS POR MÉTODOS


PROBABILÍSTICOS

2.1 PRESENTACIÓN DE DATOS.


Un conjunto de datos para su correcto manejo, debe ser presentado de forma adecuada, que
depende de la cantidad y tipo de datos que se dispone, su estructura de cumplir: con una
descripción, método utilizado, exposición de datos y conclusión.
Se puede presentar en texto, tablas, figuras.

2.1.1 Frecuencia absoluta (f). Es una medida estadística que nos da información acerca de la
cantidad de veces que se repite un determinado valor en un estudio estadístico.

2.1.2 Frecuencia relativa (h). Corresponde a las veces que se repite un número den un
conjunto de datos respecto a total, expresado en proporciones o porcentaje, el cociente entre la
frecuencia absoluta f y la frecuencia total N , h=f / N . Las propiedades que posee son:
a. Las frecuencias absolutas y relativas son números enteros positivos, f ≥ 0 ; h ≥ 0.
k
b. La suma de todas las frecuencias absolutas es igual a la frecuencia total, ∑ f i=n.
j=1
k
c. La suma sumatoria las frecuencias relativas es igual a uno, ∑ h j =1.
j=1

2.1.3 Frecuencia acumulada menor que (F). Es el resultado de sumas sucesivamente las
i
frecuencias absolutas o relativas, ordenado de mayor a menor de sus valores, F i=∑ f j . Su
j=1
representación gráfica es un diagrama de líneas suavizado de denomina ojiva. Sus propiedades
que poseen son:
a. Las frecuencias acumuladas absoluta son siempre números enteros positivos mayores
a cero.
b. Las frecuencias relativas acumuladas son siempre números fraccionarios positivos
menores o iguales a uno.
c. La frecuencia absoluta acumulada menor que correspondiente al último valor es igual
a la frecuencia total N .
d. La frecuencia relativa acumulada menor que correspondiente al último valor es igual a
uno.

2
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

2.1.4 Diagrama de barras. Este diagrama consiste en un rectángulo sobre un sistema de ejes
coordenados XY, cuya altura de los rectángulos será proporcional a la frecuencia absoluta, el
ancho de la base debe ser pequeño, no representa nada y los rectángulos deben estar separados
entre sí. También se denomina diagrama de bastones o varillas.

2.1.5 Polígono de frecuencias. Son diagramas de línea que se obtiene al unir los puntos medios
del lado superior de cada rectángulo del histograma correspondiente.

2.1.6 Representación tabular y gráfica de muestras hidrológicas. En hidrología se trabaja


con información hidrometeorológica que puede ser precipitación, caudales, temperatura y
evaporación. En su mayoría se cuenta con una muestra de datos de una población, cuando dicha
información se organiza y tabula el fácil de utilizar, convirtiéndose en una herramienta poderosa
para la toma de decisiones.
Una manera útil de clasificar los datos, es dividirlo en categorías o clases similares, luego se
registra el número de observaciones que se encuentra dentro de la categoría, lo que va
constituyendo una tabla de frecuencias.
Para una muestra dada, se elige un rango R , que contenga todos los valores de la misma, se
subdivide R en subintervalos denominados intervalos de clase, los puntos medios de estos
intervalos se denominan marcas de clase. Se dice que los valores de la muestra en cada intervalo
forman una clase. Al número de valores de la clase se denomina frecuencia de clase; su división
entre el número de datos se denomina frecuencia relativa de clase. Se denomina función de
frecuencias de la muestra se denota f ( x), la función de frecuencias acumuladas de la muestra se
denota F (x) definida como: F ( x )=∑ f ( x i) .
i≤ x

3
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

2.1.6.1 Rango (R). Señala la diferencia entre el valor máximo y el mínimo de una población o
muestra estadística.
2.1.6.2 Intervalo de clase. Son los intervalos en los que se agrupan y ordenan los valores
observados, este intervalo está delimitado (acotado) por dos valores extremos.
2.1.6.3 Amplitud de clase ( Δ x ). Diferencia entre el límite superior e inferior del intervalo de
clase.
2.1.6.4 Marca de clase. Es el punto medio del intervalo de la clase, se obtiene al promediar los
extremos del intervalo.

2.1.7 Procedimiento de cálculo. El proceso practico se emplea para el cálculo distribución de


frecuencias de probabilidad empírica de datos agrupados en intervalos de clase.

a. Se ordena la información recabada de menor a mayor (creciente), o de mayor a menor


(decreciente).
b. Se cuenta el número de datos que representa la frecuencia total N=∑ fi .
c. Se identifica el valor máximo y mínimo x máx ; x mín.
d. Se obtiene el rango de la muestra R=xmáx −x mín.
e. Determina el número de clases NC , en hidrología el número de intervalos esta entre 5
y 25. Yevjevich sugiere seleccionar NC , con las siguientes relaciones empíricas, (El
NC se redondea a un número entero).
NC =1.33∙ ln N
Si N < 30; NC =5
Si 30< N <75 ; 6 ≤ NC ≤10
Si N >75 ; 10≤ NC ≤30
f. Cálculo de la amplitud de cada intervalo ∆ x , según la expresión.
x máx −x mín R
∆ x= =
NC−1 NC −1
g. Se obtiene el nuevo rango R1=NC ∙ Δ x , al dividir el rango entre NC −1, se incrementa
el rango ∆ x , incluyendo un intervalo más, el mismo que resulta, de agregar medio
intervalo ∆ x /2, al extremo menor de la serie ordenada, de manera que la primera
clase coincida con x mín.

h. Calcular los límites de clase de cada intervalo, los límites de clase inferior y superior
Δx Δx
del primer intervalo de clase son: LCI 1=x mín − , LCS1=x mín + =LCI 1+ Δ x .
2 2
i. Cálculo de las marcas de clase de cada intervalo.

4
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

LCIi + LCSi
MC 1=
2
j. Frecuencia absoluta, es igual al número de observaciones que caen dentro del cada
intervalo de clase, que se obtiene por conteo, f i=ni .
k. Cálculo de frecuencia relativa hi , de cada intervalo es la frecuencia absoluta entre el
número total de observaciones.hi=ni /N .
l. Calcular la frecuencia relativa acumulada Hi , según la fórmula.
i i
n 1 i
Hi=∑ f j=∑ j = ∑ n j
j=1 j=1 N N j=1
Ejercicio 1: De la serie histórica de caudales medio anuales en m3/s de un río se muestra en la
tabla.
121,3 26,7 110,1 63,4 122,4 64,2 59,6
144,9 92,8 95,6 76,3 162,1 110,2 40,3
142,4 58,8 48,8 52,3 97,2 144,7 112,2
204,8 57,4 148,3 36,3 52,5 109,2 137,1
114,5 79 67,5 88 165,6 48,5 32,9
72,5 76,9 70

a. Realizar la tabla de frecuencias.


b. Graficar el histograma de distribución de frecuencias relativas, polígono de frecuencias y
ojiva.

2.2 MEDIDAS DESCRIPTIVAS.


Son valores numéricos que resumen la información contenida en un conjunto de datos, se estiman
a partir de los datos de una muestra o población.

2.2.1 Parámetro y estadístico. Los estadísticos se obtienen a partir de los datos de una
muestra. Los parámetros se determinan de datos poblacionales.
2.2.2 Medidas de tendencia central o medidas de localización. Son medidas que permiten
resumir en un solo valor representa la característica de un conjunto de datos.
2.2.2.1 La media aritmética. Se obtiene con la suma de un conjunto de valores dividida entre el
número total de observaciones.

n μ :Media poblacional.
∑ xi x : Media muestral.
μ=
i=1
x i : i-ésimo valor de la muestra.
Datos no
n n : Número de datos de la muestra o
agrupados n población.
Media ∑ xi f i : Frecuencia absoluta intervalo i .
aritmética
x=
i=1 k : Número de intervalos de clase.
n Mc i : Marca de clase del intervalo.
k

Datos agrupados
∑ f i ∙ Mci
i=1
x=
n

5
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

Otorga diversos k x p : Media ponderada.


pesos a los
distintos valores
∑ w i xi w i :Ponderación o peso.
Media x i :Valor i-ésimo de la muestra.
ponderada sobre los que se x p= i=1n
calculan. ∑ fi f i : Frecuencia absoluta intervalo i .
i =1 n : Número de observaciones.
2.2.2.2 La mediana: es un valor medio que se encuentra ubicado en la mitad de los valores
ordenados.

Me( x)=x n+1 , nimpar Me( x) :Mediana muestral.


2 n : Número de datos de la muestra.
Datos no l inf : Límite inferior de la clase mediana.
agrupados xn / 2 + x n
2
+1
F j : Frecuencia acumulada de la clase
Mediana
Me( x)= ,n par
2 mediana.
F j−1 : Frecuencia acumulada de la clase
n
Datos −F j−1 anterior a la clase de la mediana.
2 c i : Amplitud del intervalo de clase i de la
agrupados Me( x)=l inf + c
F j−F j−1 i mediana.

2.2.2.3 La moda: Se define como el número que está representado más veces dentro del conjunto
de datos o valor que aparece como mayor frecuencia en un conjunto de datos.

Mo(x) :Moda muestral.


l inf : Límite inferior de la clase mediana.
∆ 1 : Exceso de la frecuencia modal sobre la
frecuencia de la clase anterior inmediata
Moda
Datos
agrupados.
Mo(x) =l inf +
(∆1
c
∆1 + ∆2 i ) ∆ 1=f j−f j−1 .
∆ 2 : Exceso de la frecuencia modal sobre la
frecuencia de la clase posterior inmediata
∆ 1=f j−f j+1.
c i : Amplitud del intervalo de clase i de la
mediana.

2.2.2.4 Localización de la media, mediana y moda. Las posiciones relativas de estas tres
medidas dependen de la asimetría de la distribución. En el caso que las tres medidas de
tendencia central coinciden se trata de una distribución simétrica, la distribución es
asimétrica si los tres valores divergen, para una distribución unimodal, la moda esta
localizada en el punto más alto y la mediana entre la media y la moda.

6
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

2.2.3 Medidas de dispersión. Indican que tanto se dispersan o agrupan los datos respecto de la
media aritmética, si la dispersión en pequeña señala uniformidad de los datos en la distribución,
gran dispersión indica poca uniformidad.

R : Rango.
Diferencia valor x máx : Máximo valor de la serie de
Rango R=xmáx −x mín
mayor y menor. datos.
x min : Mínimo valor de la serie de datos.
n σ : Desviación estándar de la población.
∑ ( xi −μ )2 S : Desviación estándar de la muestra.
σ 2= i=1 2
σ :Varianza poblacional.
n 2
Datos no S :Varianza muestral.
agrupados n μ= x :Media muestral o poblacional.
∑ ( x i−x )2 x i :i-ésimo valor de la muestra.
S2= i=1 f i :I-ésimo valor de la frecuencia
n−1 absoluta.
Varianza
k k : Número de intervalos de clase
∑ f i ( x i−μ )2 n : Número de datos de la muestra o
2 i=1 población.
σ =
n
Datos agrupados
k

∑ f i ( x i−x )2
2 i=1
S=
n−1


n

∑ ( xi −μ )2
i=1
σ=
n
Datos no


agrupados
n

∑ ( x i−x )2
Desviación S= i=1
estándar n−1
σ =√ σ


2
k
S= √ S2 ∑ f i ( xi −μ )2
i=1
σ=
n
Datos agrupados


k

∑ f i ( x i−x )2
i=1
S=
n−1

7
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

El cociente entre C v : Coeficiente de variación.


Coeficiente la desviación S
de variación estándar y la C v= x
x
media.

2.2.4 Medidas de simetría y asimetría. Si la dispersión de los datos con respecto al centro es
equitativa a ambos lados de éste, la distribución es simétrica, si la dispersión es diferente a un
lado que a otro la distribución es asimétrica.
.

2.2.5 Sesgo estadístico. Permite identificar si los datos se distribuyes de forma uniforme con
respecto al promedio, se usa para medir el nivel de asimetría que posee la curva de frecuencias.
Para fines de comparación se usan los conceptos de media y moda, en la gráfica de la curva
normal ambas medidas coinciden, en una distribución sesgada cuando la curva es asimétrica, la
media esta hacia el lado más largo con respecto a la moda en el eje de las abscisas.

2.2.5.1 Primer coeficiente de Pearson. Mide la desviación de la simetría, expresada la


diferencia entre la media y la moda con respecto a la desviación estándar, solo se emplea
para distribuciones uniformes, unimodales.

[
x−Mo (x) ¿ 0 ; a izquierda o negativa
CaS= ; Cas ¿ 0 ; Normal
S(x)
¿ 0 ;a derecha o positivo

8
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

Donde:
CaS : Coeficiente de asimetría de sesgo.
Mo(x) : Moda
x : Media aritmética
2.2.5.2 Segundo coeficiente de Pearson. Mide la desviación de la simetría, expresada tres veces
la diferencia entre la media y la mediana con respecto a la desviación estándar, solo se
emplea para distribuciones uniformes, unimodales.

[
3(x −Me( x )) ¿ 0 ; a izquierda o negativa
CaS ´= ;Cas ´ ¿ 0 ;Normal
S(x)
¿ 0 ;a derecha o positivo
Donde:
CaS ´ : Coeficiente de asimetría de sesgo.
Me( x) : Mediana.
x : Media aritmética.

2.2.5.3 Sesgo por momentos.

Sesgo μ3 Cs : Coeficiente de sesgo muestral.


poblaciona γ= 3 γ : Coeficiente de sesgo poblacional.
l σ
μ :Media poblacional.
n x : Media muestral.
∑ ( x i−μ )3 σ : Desviación estándar de la población.
Datos no i=1 S : Desviación estándar de la muestra.
μ3 =
agrupados n x i :i-ésimo valor de la muestra.


f i :I-ésimo valor de la frecuencia
k
absoluta.
∑ ( xi −μ )2 k : Número de intervalos de clase
i=1
σ= n : Número de datos de la muestra o
n
población.
Datos μ3
agrupados γ= 3
σ
n

∑ f i ( x i−μ )3
μ3= i=1
n


k

∑ f i ( xi −μ )2
i=1
σ=
n

9
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

n2 M 3
Cs=
( n−1 ) (n−2) S3
n

Datos no
∑ ( x i−x )3
agrupados M 3= i=1
n


k

∑ ( x i−x )2
i=1
S=
Sesgo n−1
muestral
n2 M 3
Cs=
( n−1 ) (n−2) S3
n

Datos
∑ f i ( x i−x )3
i=1
agrupados M 3=
n


k

∑ f i ( x i−x )2
i=1
S=
n−1

2.2.6 Medidas de apuntamientos o curtosis. Se utilizan para contrastar una curva de


frecuencias con respecto a la distribución normal, señala el grado de concentración que presentan
los valores de una variable alrededor de la zona central de la distribución de frecuencias.

Sesgo Datos no μ4 Ck : Coeficiente de curtosis


poblaciona agrupados κ= muestral.
l σ4 κ : Coeficiente de curtosis
n
poblacional.
μ :Media poblacional.
∑ ( x i−μ )4 x : Media muestral.
i=1
μ3 =
n σ : Desviación estándar de la
población.

10
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos


k

∑ ( xi −μ )2 n
xi
; μ=∑
i=1
σ=
n i=1 n
μ4
κ=
σ4
n

∑ f i ( x i−μ )4
Datos μ3= i=1
agrupados n


k
S : Desviación estándar de la
∑ f i ( xi −μ )2 k
f i xi muestra.
; μ=∑
i=1
σ= x i :i-ésimo valor de la muestra.
n i=1 n
f i :I-ésimo valor de la frecuencia
3
n M4 absoluta.
C k=
( n−1 ) ( n−2) ( n−3 ) S 4 k : Número de intervalos de clase
n : Número de datos de la muestra o
n población.
∑ ( x i− x ) 4
Datos no
M 4 = i=1

[
agrupados n ¿ 3 Platicúrtiva
C k =κ ¿ 3 Mesocúrtuva


k
¿ 3 Leptocúrtiva
∑ ( x i−x )2 n
xi
; x=∑
i=1
S=
Sesgo
n−1 i =1 n
muestral 3
n M4
C k=
( n−1 ) ( n−2) ( n−3 ) S4
n

∑ f i ( xi −x )4
Datos
agrupados
M 4 = i=1
n


k

∑ f i ( x i−x )2 k
f i xi
S= i=1
; x=∑
n−1 i=1 n

Ejercicio 2: Se tiene una cuenca en la que se han instalado 8 pluviómetros. Las precipitaciones
promedio anuales registradas en mm, y el área en km 2 se muestran en la siguiente tabla,
determinar la precipitación promedio de la cuenca.
Estació Área Precipitació
n (km2) n

11
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

(mm)
1 150 2915
2 300 2563
3 187 3241
4 600 4017
5 550 5321
6 145 4621
7 278 5002
8 110 4932

Ejercicio 3: Dado los caudales medios del mes de mayo, de un río en m3/s, presentes en la
siguiente tabla.
Año Q (m3/s) Año Q (m3/s)
1971 3.99 1981 4.52
1972 2.96 1982 3.05
1973 1.79 1983 5.00
1974 1.55 1984 6.03
1975 2.48 1985 2.73
1976 2.61 1986 3.13
1977 2.27 1987 4.18
1978 1.86 1988 3.26
1979 2.07 1989 4.03
1980 2.70
a. Determinar la media aritmética, varianza, coeficiente de variación, coeficiente de
asimetría (sesgo), coeficiente de curtosis.
Ejercicio 4: Los datos del problema anterior se agrupan los datos en una tabla en los siguientes
intervalos.
Intervalo de clase
[1-2[
[2-3[
[3-4[
[4-5[
[5-6[
[6-7[
a. Determinar la media aritmética, varianza, coeficiente de variación, coeficiente de
asimetría (sesgo), coeficiente de curtosis para datos agrupados.

2.3 TEORÍA DE PROBABILIDAD.

2.3.1 Experimento. Es aquel proceso complejo en el que se emplean medidas y se realizan


pruebas para comprobar y estudiar algún proceso antes de ejecutarlo, definidas por causas para el
posterior análisis de sus consecuencias.

2.3.2 Experimento determinista. Es aquel experimento que se conoce con toda certeza el
resultado de una observación. Ejemplos: sacar galleta de un paquete de galletas, el tiempo que
demora una piedra en caer, suma de dos números impares el resultado es par.

12
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

2.3.3 Experimento aleatorio. Es aquel experimento, que no es posible predecir su resultado


hasta que no se lleve a cabo, el resultado depende del azar. Ejemplos: Lanzar un dado, lotería,
carrera.

2.3.4 Espacio muestral. Es el conjunto de todos los posibles resultados de un experimento


aleatorio, no es posible determinar con exactitud el resultado de la observación.
Ejercicio 5: Determinar el conjunto del espacio muestral y el número de los elementos del
espacio muestral.
a. El experimento consiste en lanzar una moneda al aire y verificar el resultado.
b. El experimento consiste en lanzar un dado y verificar el número.
c. El experimento consiste en lanzar dos dados y sumar los resultados de cada dado.
d. El experimento consiste en sacar una carta en una baraja inglesa.
2.3.5 Evento o suceso. Es un subconjunto del espacio muestral asociado a un experimento
aleatorio el cual debe cumplir una condición o restricción.
Ejercicio 6: Determinar el subconjunto del evento y número de elementos del suceso.
a. El experimento es lanzar dos monedas, los eventos son: sacar dos escudos, sacar una cara.
b. El experimento consiste en lanzar un dado, los eventos son: sacar un número impar,
mayor a cuatro.
c. El experimento consiste en lanzar dos dados y sumar los números de cada dado, los
eventos son: sacar un siete, sacar un número mayor a 10.
d. El experimento consiste en sacar una carta en una baraja inglesa.

2.3.5.1 Evento seguro o cierto. Es aquel evento E , que tiene la misma cantidad de elementos que
el espacio muestral, es decir η ( E )=η ( S ).
2.3.5.2 Evento imposible. Son aquellos que a veces puedes ocurrir, es decir η ( E )=n.

2.3.6 Variable discreta. Es aquella variable que puede tomar los valores que pertenecen al
conjunto, representados por números enteros. Ejemplos: número de estudiantes, número de presas
en una ciudad, número de estudiantes en un aula.

2.3.7 Variable continua. Es aquella que puede adoptar cualquier valor en el marco de un
intervalo predeterminado o espacio continuo, se trata de experimento que se miden, y está
representado por números reales. Ejemplos: Caudal medio de un río, intensidad de lluvia.

2.3.8 PROBABILIDAD CLÁSICA.


Es una medida estadística que indica la probabilidad de que un suceso ocurra, se expresa como
una fracción de número de casos favorables al evento entre el número de elementos del espacio
muestral.
η( E)
P ( E )=
η(S)
Donde:
P( E) : Probabilidad que ocurra un evento dado.
η( E) : Número de elementos que posee un evento.

13
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

η( S) : Número total de elementos del espacio muestral.

Ejercicio 7: Determinar la probabilidad de los siguientes eventos y expresarlo en fracción y


porcentaje.
a. El experimento es lanzar tres monedas, los eventos son: sacar tres escudos, sacar dos
escudos.
b. El experimento consiste en lanzar un dado, los eventos son: sacar un múltiplo de 3, mayor
igual a cinco.
c. El experimento consiste en lanzar dos dados y sumar los números de cada dado, los
eventos son: sacar un seis, sacar un número menor a cuatro.
d. El experimento consiste en sacar una carta en una baraja inglesa, los eventos son: sacar
una carta roja, sacar una letra negra, sacar un número impar.

2.3.9 Propiedades de la probabilidad clásica. Las propiedades de la probabilidad son:


a. Si ϕ es un evento imposible, entonces la probabilidad de un evento imposible es cero,
P ( ϕ )=0 .
b. La probabilidad de un evento seguro es uno, P ( E )=1.
c. 0 ≤ P( E)≤ 1, para todo evento que pertenece al espacio muestral.
d. La suma de probabilidad de ocurrencia y no ocurrencia es igual a uno, P ( E ) + P ( E )=1.
e. Si E1 , E2 son dos eventos, P ( E1 ∩ E2 )=P ( E1 ) + P ( E2 ) −P( E1 ∪ E2), la probabilidad de la
unión de dos sucesos es la suma de sus probabilidades menos la probabilidad de
intersección.

2.3.10 Probabilidad de eventos independientes. Si E1 y E 2 son eventos independientes de un


espacio muestral S, entonces:
P ( A ∩ B )=P ( E1 ) ∙ P ( E2 ) …

2.3.11 Probabilidad condicional. Es cuando se precisa conocer la probabilidad de un evento,


luego que otro evento previo haya ocurrido. La notación P ( B| A ) se lee como “la probabilidad de
que un evento B ocurra dado que A ha ocurrido” o “la probabilidad condicional de B dado A ”.

P( A ∩B)
P ( B| A )=
P (A )
Ejercicio 8: Supóngase que un rio alcanza cada invierno un nivel de creciente, con una
frecuencia relativa de 0.25 cuando atraviesa la ciudad, hay un puente cuya probabilidad de falla
en los estribos es 0.35, la experiencia muestra que cuando hay creciente la probabilidad suben a
0.55, con esta información se desea conocer la probabilidad de falla en el puente.

2.3.12 Periodo retorno (T). Es el intervalo promedio de tiempo en años, dentro del cual un
evento de magnitud x puede ser igualado o excedido, por lo menos una vez en promedio. Así, si
un evento igual o mayor a x , ocurre una vez en T años, su probabilidad de ocurrencia P , es igual
a 1 en T casos.
1 1
P ( X ≥ x )= ;T =
T P(X ≥ x)

14
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

La probabilidad que no ocurra en cualquier año, se expresa: P ( X < x )=1−P ( X ≥ x ).

1
T=
1−P(X < x)
Donde:
X : Variable aleatoria de la función de probabilidad.
x : Valor particular que adopta la variable aleatoria.
T : Periodo retorno en años.
P( X < x): Probabilidad de ocurrencia de un evento menor a x , (probabilidad de
excedencia).
P( X ≥ x): Probabilidad de ocurrencia de un evento mayor o igual a x dado, (probabilidad
de no excedencia).

2.3.13 Riesgo. Si un evento de diseño, como un caudal tiene un periodo retorno de T en años, y
una probabilidad de excedencia P .
1
P ( Q≥ q )=
T
Donde:
P=P ( Q<q ) : Probabilidad de ocurrencia de un caudal se mayor o igual a uno dado.

La probabilidad de que Q no ocurra en cualquier año P=P ( Q<q ).


1
P=1−P ; P=1−
T

Se supone que la no ocurrencia de un evento en un año cualquiera, es independiente de la no


ocurrencia del mismo, en los años anteriores y posteriores, entonces la probabilidad de que el
evento no suceda en n años sucesivos es:

P ∙ P … P=P = 1−
2
T (
1 n
)
La probabilidad de que un evento, ocurra al menos una vez en n años consecutivos es conocida el
riesgo o falla R.
n n
R+ P =1; R=1−P

( )
n
1
R=1− 1−
T
Donde:
R : Riesgo o falla.
n : Vida útil del proyecto.
T : Periodo retorno en años.

Despejando el periodo retorno

15
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

R=1− 1− ( 1 n
T )( )
; 1−
1 n
T
=1−R

( )
n 1 1
1 n 1 n
1− n
=( 1−R ) ; =1−( 1−R )
T T

1
T= 1
1−( 1−R ) n

Ejercicio 9: Determinar el riesgo o falla de una obra que tiene una vida útil de 20 años, si se
diseña para un período retorno de 10 años.
Ejercicio 10: Para el diseño de una estructura hidráulica, con vida útil de 50años, se acepta solo
el 5% de riesgo. ¿Qué periodo de retorno se debe elegir para el diseño de la estructura?

2.3.14 Cálculo de probabilidad empírica o experimental. Dado un conjunto de datos


ordenados.

Fórmula empírica Probabilidad experimental


acumulada P
California m
P=
n
Hazen m−0.5
P=
n
Weibull m
P=
n+1
Chegadayev m−0.3
P=
n+0.4
Blom m−0.375
P=
n+0.25
Tukey 3 m−1
P=
3 n+1
Donde:
P : Probabilidad experimental acumulada o frecuencia relativa empírica.
m: Número de orden.
n : Número de datos.

2.3.15 Variable aleatoria o variable estocástica. Una variable aleatoria, es una función de X ,
definida sobre un espacio muestral S, que se asigna un valor a esta variable, correspondiente a

16
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

cada punto de un experimento, es decir una variable matemática cuyos valores posibles son las
descripciones numéricas de todos los resultados de un experimento.
Ejercicio 11: El experimento es lazar una moneda tres veces, el suceso es determinar el número
de caras, determinar los posibles resultados que puede adoptar la variable aleatoria.
2.3.15.1 Variable aleatoria discreta. Se dice que una variable aleatoria es discreta, cuando
sus valores se restringen a un conjunto numerable finito o infinito, expresado por número
naturales.
2.3.15.2 Variable aleatoria continua. Se dice que una variable aleatoria X es continua,
cuando sus valores se encuentran en un rango continuo y puede ser representado por
cualquier número real.
2.3.16 Distribución de probabilidad. El comportamiento de una variable aleatoria se describe
mediante una ley de probabilidades que a su vez se puede caracterizar de varias maneras.
f ( x) : Función de densidad, función de probabilidad, distribución de probabilidad.
F(x) : Función acumulada o función de distribución acumulada.

2.3.17 Función de densidad de probabilidad de una variable aleatoria discreta. Es una


función matemática que permite determinar la probabilidad f ( x i ) =P(X =xi ), de que una variable
aleatoria discreta X tome los diferentes valores de x i, dentro del rango en el que está definido,
satisface las siguientes condiciones.

a. 0 ≤ f ( x i )=P( X=x i )≤ 1

b. ∑ f ( x i )=1
i=1
b
c. P ( a ≤ x ≤ b )=∑ f (x i)
i=a

Ejercicio 12: Sea X una variable aleatoria que representa la suma de los puntos que se obtiene al
lanzar dos dados y sumar sus números, esta tiene como función de probabilidad.

2.3.18 Función de densidad de probabilidad de una variable aleatoria continua. Es una


función matemática que permite determinar la probabilidad, de que una variable aleatoria X ,
tome los diferentes valores de x, dentro de un rango en esta definido, cumple con las siguientes
condiciones.

a. 0 ≤ f ( x ) ≤ 1

b. ∫ f ( x ) dx=1
−∞
b
c. P ( a ≤ x ≤ b )=∫ f ( x ) dx
a

Ejercicio 8: Sea X una variable aleatoria continua que tiene la función de densidad de
probabilidad.

17
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

f ( x )= { 0.75 ∙ ( 1−x 2 ) ; Para−1≤ x ≤ 1


0 , para cualquier otro valor de x
a. Elaborar el gráfico de la función de densidad de probabilidad.
b. Calcular P(−0.5 ≤ x ≤ 0.5)

2.3.19 Función de distribución acumulada. Si X es una variable aleatoria (discreta o continua),


se define la función de distribución o función de distribución acumulada F (x), como la
probabilidad de X tome cualquier valor menor o igual que x , es decir.
F ( x)=P( X ≤ x )

2.3.20 Función de distribución acumulada de una variable aleatoria discreta (K). Para el
caso de una variable discreta F ( x), se puede expresar como la sumatoria f ( x i) , para los cuales x i
es menor o igual que x , es decir.

F ( x )=P ( X ≤ x ) =∑ f (x i)
x i ≤x

Ejercicio 13: Un experimento consiste en lanzar 3 monedas al aire y verificar el número de


escudos que salgan.
a. Calcular P( X ≤ 2).
b. Dibujar la función de densidad y función de distribución acumulada.

2.3.21 Función de distribución acumulada de una variable aleatoria acumulada. Para el


caso de una variable continua, F ( x) se representa por.
x
F ( x )=P ( X ≤ x ) =∫ f ( x ) dx
−∞

La relación entre la función de distribución acumulada y la función de densidad de probabilidad


es:
dF (x)
=f (x)
dx

b
P ( a< x ≤b )=F ( b )−F ( a )=∫ f ( x ) dx
a

Esto significa que la probabilidad del evento a< x ≤ b, es igual al área que hay bajo la curva de la
función de densidad de probabilidad f (x), entre x=a y x=b .

18
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

Ejercicio 14: Sea X una variable aleatoria continua, que tiene una función de densidad de
probabilidad.

{
2
f ( x )= 3 x ; Para 0 ≤ x ≤1
0 , para cualquier otro valor de x

a. Determinar el área total bajo la curva.


b. P( X > 0.6)
c. P( X < 0.5)
d. P(0.2 ≤ X ≤0.5)
e. Dibujar la función de distribución acumulada.

2.4 PRUEBAS DE BONDAD DE AJUSTE.


Las pruebas de bondad de ajuste, comprueban gráfica y estadísticamente si una serie de datos
empírica sigue cierta distribución de probabilidad teórica. Las pruebas de bondad de ajuste más
empleadas son: el ajuste gráfico, ajuste estadístico como Chi-cuadrado y Smirnov-Kolmogorov.

2.4.1 Ajuste gráfico. Se puede comparar gráficamente el histograma o función densidad


empírica de la serie de datos con la función densidad teórica y mediante un análisis visual señalar
si hay similitud o diferencia entre ambos.

2.4.2 Prueba de Chi-cuadrado ( χ 2). Es una prueba de hipótesis estadística de una clasificación
de datos, que se usa para definir si es que una variable empírica de una serie de datos se acomode
o no de una distribución teórica específica.

2
k
( θ i−e i ) k k
χ =∑ ; ∑ θi = ∑ e i
2

i=1 ei i=1 i=1

Donde:
χ 2 : Valor calculado del Chi-cuadrado a partir de los datos.
θi : Número de valores observados en el intervalo de clase i .
e i : Número de valores esperados en el intervalo de clase i .
k : Número de intervalo de clase.
h : El número de parámetros a estimarse, h=2 para la distribución normal y log normal de
dos parámetros, h=3 para la distribución log-normal de 3 parámetros.

Nivel de significancia esta entre el 5 y 10%, los grados de libertad g .l .=k−1−h


2.4.2.1 Procedimiento para efectuar el ajuste.
a. La hipótesis será.
Ho: (hipótesis nula) frecuencia empírica≈ frecuencia teórica.
H : (hipótesis alternativa) frecuencia empírica≠ frecuencia teórica
b. Ordena los datos de menor a mayor.

19
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

c. Estima el rango R=xmáx −x mín.


d. Cálculo del número de intervalos de clase, según Yevjevich NC =1+1.33 ln N .
e. Cálculo de la amplitud de clase.
x −x
∆ x= máx mín
NC−1
f. Cálculo de intervalos de clase, marcas de clase, frecuencia absoluta, frecuencia relativa.
g. Cálculo de la media y desviación estándar para datos agrupados.


k k

∑ mci ∙ f i ∑ f i ∙ ( mc i−x )2
x= i=1 ; Sx= i=1
N N −1
h. Cálculo de frecuencia esperada, estima la variable estandarizada para el límite inferior del
x −X
intervalo Z= , se determina la probabilidad de cada límite P( Z< zi ), Se estima el
S
área de cada intervalo P( z i ≤ Z ≤ z i+1) , se multiplica la probabilidad normal de cada
intervalo con la frecuencia absoluta N ∙ P(z i ≤ Z ≤ z i+1 ) se redondea de manera que la suma
de las frecuencias parciales sea igual a N .
2
k
( θ i−e i )
i. Cálculo del Chi cuadrado calculado (empírico) χ c =∑2
.
i=1 ei
j. Cálculo del Chi cuadrado teórico en tabla χ 2t ingresando con el g .l .=k−1−h y α nivel de
significancia
k. Criterios de decisión. Consiste en comparar el valor calculado y el tabulado.
Si el valor del Chi cuadrado calculado es menor o igual que el valor tabular χ 2c ≤ χ 2t ,
entonces se acepta la hipótesis que el ajuste es bueno al nivel de significancia.
Si el Chi cuadrado calculado es mayor que el valor tabular χ 2c > χ 2t , entonces el ajuste es
malo y se rechaza la hipótesis.

2.4.2.2 Ventajas y limitaciones de la distribución Chi cuadrado.


a. Es aplicable para distribuciones normales.
b. Se realiza en función densidad de una clasificación de datos (datos agrupados en
intervalos de clase).
2.4.3 Prueba de Smirnov Kolmogorov. La prueba consiste en comparar las diferencias
existentes entre la probabilidad empírica de los datos de la muestra y la probabilidad teórica,
tomando el valor máximo del valor absoluto, de la diferencia entre el valor observado y el valor
de la recta teórica del modelo, es decir.

Δ=máx|F (x)−P(x)|< ∆ o
Donde:
∆ : Estadístico de Smirnov Kolmogorov, cuyo valor es igual a la diferencia máxima
existente entre la probabilidad teórica y la probabilidad empírica.
∆ o : Valor crítico que depende del número de datos.
F(x) : Probabilidad de la distribución teórica.
P(x) : Probabilidad experimental o empírica de los datos (frecuencia acumulada).

20
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

k : Número de intervalo de clase.


2.4.3.1 Procedimiento para efectuar el ajuste.
a. Calcular la probabilidad empírica o experimental de los datos, para ello se aplica una de
las siguientes expresiones, se recomienda emplear la expresión Weibull.

Fórmula empírica Probabilidad experimental


acumulada P
California m
P=
n
Hazen m−0.5
P=
n
Weibull m
P=
n+1
Chegadayev m−0.3
P=
n+0.4
Blom m−0.375
P=
n+0.25
Tukey 3 m−1
P=
3 n+1
Donde:
P : Probabilidad experimental acumulada o frecuencia relativa empírica.
m: Número de orden.
n : Número de datos.

b. Calcular la probabilidad teórica F(x) .


c. Calcular la diferencia |P(x)−F (x)|, para todos los valores de x .
d. Seleccionar el máximo Δ=máx|F (x)−P(x)|.
e. Calcular el valor crítico del estadístico ∆ o, para un nivel de significancia dado
correspondiente al número de observaciones.
Tamaño Nivel de significancia α
muestral N 0,2 0,1 0,05 0,01
5 0,45 0,51 0,56 0,67
10 0,32 0,37 0,41 0,49
15 0,27 0,3 0,34 0,4
20 0,23 0,26 0,29 0,36
25 0,21 0,24 0,27 0,32
30 0,19 0,22 0,24 0,29
35 0,18 0,2 0,23 0,27
40 0,17 0,19 0,21 0,25
45 0,16 0,18 0,2 0,24
50 0,15 0,17 0,19 0,23

21
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

1.07 1.22 1.36 1.63


  N >50
√N √N √N √N

f. Se compara el valor del estadístico ∆ , con el valor crítico ∆ o, según el presente criterio.
∆ <∆ o → El ajuste es bueno al nivel de significancia seleccionado
∆ ≥ ∆ o → El ajuste no es bueno al nivel de significancia seleccionado, siendo necesario
probar con otra distribución.

2.4.3.2 Ventajas y limitaciones.


a. Es aplicable a distribuciones de datos no agrupados.
b. Es aplicable a cualquier distribución teórica.
c. Se aplica en la función de distribución acumulada.
d. Es una prueba aproximada.

Ejercicio 15: Dado el registro de caudales máximos anuales para cierta estación en m3/s, de 25
años, realizar la prueba de bondad de ajuste, para constarse si los datos se ajustan a la distribución
Normal.
37 62 90 261 49
48 45 70 79 50
86 100 91 83 45
74 230 85 101 182
91 77 67 63 67
Realizar la prueba de bondad de ajuste para Chi cuadrado para un nivel de significancia del 5%,
la prueba Smirnov Kolmogorov para un nivel de significancia del 10%.

2.5 DISTRIBUCIONES TEÓRICAS DE PROBABILIDAD.


Una distribución de probabilidad teórica puede tomarse como modelo para explicar y/o describir
el comportamiento de una variable de interés, y así podrá emplearse para realizar predicciones y
estimar la posibilidad de que algunos valores se presenten.
Las series de datos observadas y recolectados de un experimento describen las características de
la variable denominadas distribuciones empíricas.
La variable aleatoria puede determinarse sobre la base de consideraciones teóricas, sobre las
cuales surge una función matemática que cumple con las propiedades de la función densidad de
probabilidad para variable discreta o continua.
2.5.1 Distribución de probabilidad de variable discreta. Describe el comportamiento de una
variable discreta que toma valores enteros n valores distintos.

Distribuciones discretas
Binomial x : Número de éxitos en n ensayos independientes

() n x n− x
f ( x )=b ( x ; n , p )= p q
x
p : Probabilidad del resultado éxito.
q=1− p : Probabilidad del otro resultado fracaso.
Hipergeométrica. x : Número de éxitos en n ensayos repetidos no
independientes entre sí.

22
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

f ( x )=h ( x ; N ,n , k )=
( x )( n−x )
k N−k N : Tamaño de la población.
n : Tamaño de la muestra.
K : Número de éxitos de la población.
( Nn )
Poisson x : Número de ocurrencia de un hecho o éxitos.
−λ
e ∙λ
x
λ : Es el número medio de ocurrencia de un hecho,
f ( x )=b ( x ; λ ) = media de la distribución.
x!

2.5.1.1 Distribución binomial. Es el número de éxitos que ocurren en n pruebas de Bernoulli,


que es un experimento aleatorio que puede tener dos resultados mutuamente excluyentes,
denominados éxito y fracaso. Sus características son.
a. Las n pruebas son estadísticamente independientes.
b. Para cada ensayo existen dos resultados, mutuamente excluyentes.
c. La probabilidad de éxito en cada ensayo es el mismo.
d. Los n ensayos son independientes.
e. La media E ( x )=np , la varianza V ( x )=npq .

()
n x n− x n
f ( x )=b ( x ; n , p )= p q ; =C k =
x x
n
()
n!
x ! ( n−k ) !
Donde:
x : Número de éxitos en n ensayos independientes
p : Probabilidad del resultado éxito.
q=1− p : Probabilidad del otro resultado fracaso.

2.5.1.2 Distribución hipergeométrica. El experimento consiste en repetir un ensayo n veces, en


el que los resultados posibles de cada ensayo son éxito y fracaso, siendo los resultados de
cada ensayo no son independientes, consiste en muestreos sucesivos sin reposición de una
población finita. Sus características son:
a. Se repiten n veces ellos ensayos.
b. Existen dos resultados posibles, mutuamente excluyentes para cada ensayo.
c. Los n ensayos no son independientes.
d. La probabilidad de éxito no es constante de un ensayo a otro.
N−n k
e. La media E ( x )=np la varianza V ( x )=npq donde p= ; q=1−p .
N−1 N

f ( x )=h ( x ; N ,n , k )=
( x )( n−x )
k N−k

( Nn )
Donde:
x : Número de éxitos en n ensayos repetidos no independientes entre sí.
N : Tamaño de la población.
n : Tamaño de la muestra.
K : Número de éxitos de la población.
23
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

2.5.1.3 Distribución de Poisson. La variable aleatoria surge al observar el número de


ocurrencias de un hecho o éxitos en una unidad especificada. Sus características son.
a. El número de ocurrencias de un hecho, lamba λ , es proporcional al tamaño de la unidad
específica.
b. La probabilidad de un hecho es constante para cada unidad especificada.
c. La variable X discreta puede asumir valores entre 0 e infinito.
d. La ocurrencia de un hecho es independiente de la ocurrencia de otro hecho en la misma
unidad o en otra unidad.
e. La media y varianza es E ( x )=V ( x )=λ .

−λ x
e ∙λ
f ( x )=b ( x ; λ ) =
x!
Donde:
x : Número de ocurrencia de un hecho o éxitos.
λ : Es el número medio de ocurrencia de un hecho, media de la distribución.
2.5.2 Distribución de probabilidad de variable continua. Describe el comportamiento de una
variable continua que puede asumir cualquier valor en un rango continuo número real.

2.5.2.1 Distribución de probabilidad normal o Gaussiana. Es una de las distribuciones de


probabilidad de variable continua que se presenta con mayor frecuencia aparece en
estadística y en la teoría de probabilidad, es importante debido que dicha distribución
permite modelar numerosos fenómenos naturales. La variable aleatoria “ x ”, posee
distribución normal con μ y varianza σ 2, si su función de densidad de probabilidad (fdp)
es:

( )
2
−1 x−μ
1 2 σ
f ( x )= e
σ √2 π
Donde:
f ( x) : Función de densidad de probabilidad Normal de la variable x .
x : Variable aleatoria independiente.
μ : Parámetro de localización de la distribución normal que es igual a la media aritmética.
σ : Parámetro de escala de la distribución normal que es igual a la desviación estándar.

24
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

2.5.2.2 Propiedades de la distribución Normal.


2 ( σ )
2
∞ −1 x−μ
1
a. ∫ e dx=1 , el área total debajo de la curva es igual a uno.
−∞ σ √ 2 π
b. f ( μ+ x )=f (x−μ), indica que es simétrica con respecto al eje vertical que pase por x=μ.
1
c. f máx ( x )= , El valor máximo (moda) que se presenta en x=μ.
σ √2 π
lim f ( x ) =lim f ( x ), En el eje de las abscisas se constituye en una asíntota horizontal de
d. x→−∞ x →∞
la curva, la curva tendera a aproximarse al eje x , sin jamás llegar a interceptarla.
e. x=μ−σ ; x=μ+σ , puntos de inflexión, antes de μ−σ y después de μ+σ la curva es
cóncava, dentro del intervalo μ−σ < x < μ+σ es convexa.
2.5.2.3 Parámetro de escala. Determina la dispersión de una distribución de probabilidad, si es
grande la distribución será amplia, si es pequeño la distribución está concentrada.
2.5.2.4 Parámetro de localización. Es un parámetro de valor escalar o vectorial que determina la
ubicación o desplazamiento de la distribución.
2.5.2.5 Distribución normal estandarizada. Para facilitar y generalizar la variable se cambia la
x −μ
unidad de mediada. Así resulta la transformación Z= , la variable aleatoria Z tiene
σ
una distribución normal particular cuya media es 0 y varianza vale uno N (0,1).
2.5.2.6 Función de distribución acumulada.

( )
2
xi −1 x− μ
1
F ( x i )=P (X ≤ x i )=∫
2 σ
e dx
−∞ σ √2 π

zi −1 2
1 z
F ( Z )=P(Z ≤ z i)= ∫ e 2
dz
−∞ σ √2 π
Donde:
F (X ): Función de distribución acumulada, probabilidad que X sea menor a un x i.
F (Z ): Función de distribución acumulada de la variable estándar, probabilidad que Z sea
menor a z i.
2.5.2.7 Estimación de parámetros, método de momentos y máxima verosimilitud.
Distribución normal o Gaussiana
Parámetro de Localización igual a la media n
xi
aritmética x=μ=∑ N
i=1


Parámetro de Localización igual a la desviación n
estándar. ∑ ( x i−x )2
i=1
S(x)=σ=
N −1

2.5.3 Distribución log-normal. Las distribuciones logarítmicas más conocidas en hidrología


son la log-normal, log-Pearson y log-Gumbel.

25
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

2.5.4 Distribución log normal de 2 parámetros. La variable aleatoria X , es positiva y el límite


inferior es x o no aparece. La variable aleatoria Y =ln X , es normalmente distribuida con media μ y
y varianza σ 2y .
2.5.4.1 Función densidad. Se dice que la variable X, tiene una distribución log-normal de 2
parámetros, si su función de densidad de probabilidad es:
( ) ; 0< x <∞ ; log N (μ
2
−1 ln x−μ y
1 2 σy
f ( x )= e ; σ 2y )
x √2 π σ y
y

Donde:
μ y : Parámetro de escala de la distribución log normal de dos parámetros, igual a la media
aritmética de los logaritmos naturales.
σ y : Parámetro de forma de la distribución log normal de dos parámetros, igual a la
desviación estándar de los logaritmos naturales.

2.5.4.2 Función de distribución en términos y=ln x .

( ) ;−∞< x< ∞ ; y=ln x ; log N ( μ


2
−1 y−μ y
1 2 σy
f ( y )= e ;σ 2y )
x √2 π σ y y

2.5.4.3 Función de la distribución acumulada.

( ) dx ; F ( y ) = ( ) dy
2 2
x −1 ln x−μ y Z −1 y−μ y
1 1
∫e ∫e
2 σy 2 σy
F ( x )=
x √2 π σ y 0 √ 2 π −∞
2
Z −Z
y −μ y ln x−μ y 1
Si Z=
σy
=
σy
; entonces F ( Z )= ∫
√2 π −∞
e 2 dz

Para el calculo de la distribución acumulada tanto para la distribución normal como log-
normal, una vez conocidos sus parámetros y reducida la variable, emplear las tablas de la
distribución normal.

2.5.4.4 Estimación de parámetros, método de momentos.


Distribución log-normal de dos parámetros
Parámetro de escala igual a la media aritmética S
de los logaritmos naturales √
σ y = ln ( 1+C 2v ) ;C v = x
x

( )
Parámetro de forma igual a la desviación 1 x2
estándar de los logaritmos naturales. μ y = ln
2 1+ C2v

2.5.4.5 Estimación de parámetros, método de la máxima verosimilitud.


Distribución log-normal de dos parámetros

26
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

Parámetro de escala igual a la media aritmética 1


n

de los logaritmos naturales σ y= ∑ ln x i


n i=1
Parámetro de forma igual a la desviación 1
n
μ y = ∑ ( ln x i−μ y )
2
estándar de los logaritmos naturales.
n i=1

2.5.5 Distribución Gamma de dos parámetros. Es una distribución muy aplicada en


hidrología tan común como la distribución log-normal.
2.5.5.1 Función densidad. Se dice que una variable aleatoria X, tiene una distribución Gamma si
su función densidad de probabilidad es:
−x
γ −1 0≤ x <∞
x eβ
f ( x )= γ ; 0<γ <∞
β Γ ( γ ) 0< β< ∞
Donde:
γ : Parámetro de forma positivo.
β : Parámetro de escala positivo.
Γ ( γ ) : Función Gamma completa.
2.5.5.2 Función acumulada.
−x
x γ−1
x eβ
F ( x )=∫ γ dx
0 β Γ (γ )

En la función acumulada puede evaluarse para los valores dados mediante una tabla, se
ingresa con los valores de χ 2chi-cuadrado, ν grados de libertad al interceptar dicho valor
se establece la probabilidad de excedencia 1−F (x) .

2.5.5.3 Estimación de parámetros método de máxima verosimilitud. Greenwood y Durand


(1960), presenta las siguientes expresiones aproximadas, por el método de máxima
verosimilitud.
Distribución Gamma de 2 parámetros
Parámetro forma. Se estima la media 0 ≤ y ≤ 0.5772
aritmética y de logaritmo natural x ; ln x 0.5000876+ 0.1648852 y−0.0544274 y
2

. γ=
y
0.5772 ≤ y ≤ 17
Se remplaza en la expresión:
y=ln x−ln x , y se selecciona la 8.898919+9.05995 y−0.9775373 y 2
γ=
expresión que cumpla con el intervalo. y (17.79728+11.968477 y + y 2)
Parámetro de escala. x
β=
γ

2.5.6 Distribución Gumbel. Es una distribución de valor extremos, denominado valor extremo
tipo I, Fisher-Tippett o distribución doble exponencial.
2.5.6.1 Función densidad.

27
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

−x−β

1 −x− β −e α

F ( x )= e α ;−∞< x <∞
α
x−β
Variable reducida de Gumbel, se define como: y=
α
Donde:
α : Es el parámetro de escala de la distribución Gumbel.
β : Parámetro de posición de la distribución Gumbel.

2.5.6.2 Función acumulada.


−x−β
α
−e
F ( x )=e ;−∞< x < ∞

0<α < ∞ , parámetro de escala


0< β < ∞ , parámetro de posición

2.5.6.3 Estimación de parámetros.


Distribución Gumbel para muestras grandes mayor a 200.
Parámetro de escala α √6 α= S
π x
Parámetro de posición (moda) β . β=x−0.5772α

Distribución Gumbel para muestras pequeñas menor a 200.


Parámetro de escala α Sx
α=
σy
Parámetro de posición (moda) β . μy
β=x− S x
σy
μ y , σ y coeficientes que dependen del número de datos obtiene de tablas)

n μy σy n μy σy
10 0,4952 0,9496 60 0,5521 1,1747
15 0,5128 1,0206 65 0,5535 1,1803
20 0,5236 1,0628 70 0,5548 1,1854
25 0,5309 1,0914 75 0,5559 1,1898
30 0,5362 1,1124 80 0,5569 1,1938
35 0,5403 1,1285 85 0,5578 1,1974
40 0,5436 1,1413 90 0,5586 1,2007
45 0,5463 1,1518 95 0,5593 1,2037
50 0,5485 1,1607 100 0,5600 1,2065
55 0,5504 1,1682 200 0,5672 1,2380
Ejercicio 15: Se cuenta con un registro histórico de 25años de precipitaciones máximas en la
estación Coimata, como se muestra en la tabla.
45.3 53.2 58.2 56.4 56.8
48.3 60.7 46.2 61.4 51.0

28
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

60.5 70.2 55.2 48.2 45.8


42.4 60.0 71.6 58.2 70.2
43.1 62.1 60.0 66.6 56.4
a. Realizar la prueba de bondad de ajuste de Smirnov Kolmogorov, para verificar si los
datos se ajustan a las distribuciones de probabilidad log-normal y Gumbel a un nivel de
significancia del 5%.
b. La probabilidad que la precipitación sea menor o igual a 69mm, emplear la distribución
log-normal. La probabilidad que la precipitación sea mayor o igual a 52mm emplear log-
normal. La probabilidad que la precipitación ente comprendida entre 45mm y 55mm,
emplear la distribución Gumbel. La precipitación que corresponde a un periodo retorno de
50 años.
c. El periodo retorno correspondiente a una precipitación de 79.5mm emplear ambas
distribuciones, realizar el análisis de resultados obtenidos y fundamentar que periodo
retorno asumiría (no considerar la prueba de bondad de ajuste).

Ejercicio 16: Se requiere diseñar un puente canal en un tramo carretero para ello se logra recabar
la información de la estación de Yesera Norte para precipitaciones máximas en 24 horas.
38 53 34 73 55
40 97 43 61 68
46 67 52 49 71
51 34 49 52 55
69 47 59 45 45
53 44 56 68 43
De los cuales se obtiene un coeficiente de variación del 25,06% y la varianza de 184,992mm2.
a. Determinar la precipitación máxima para un periodo retorno de 50 años, para la
distribución Gamma y Gumbel.
Ejercicio 17: Se cuenta con un registro histórico de caudales máximos en m3/s que corresponde a
un registro de 30 años.
500 1045 1875 2876 1967
1643 133 186 883 3687
756 250 616 224 122
734 134 1706 2409 551
597 100 606 616 287
121 350 400 294 3384

a. Realizar la prueba de bondad de ajuste de Smirnov Kolmogorov, para verificar si los


datos se ajustan a la distribución log normal, Gumbel y Gamma a un nivel de
significancia del 5%, indicar que distribución teórica presenta el mejor ajuste, justificar la
respuesta, emplear la probabilidad empírica de Blom P=(m−0.375)/(n+0.25).
b. Para la distribución que tenga el mejor ajuste calcular las siguientes probabilidades.
 La probabilidad que el caudal, sea menor o igual a 1250m3/s,
 La probabilidad que el caudal, sea mayor o igual que 2250m3/s.
 La probabilidad que el caudal este comprendido entre 550 y 2222 m3/s.
 El caudal que corresponde a un periodo retorno de 50 años.

29
Ingeniería en recursos hídricos – Estimación de avenidas máximas por métodos
probabilísticos

Ejercicio 18: Una cuenca consta de un registro de precipitaciones, al realizar la prueba de bondad
de ajuste se determina que el mejor arreglo es la distribución log-normal.
De análisis estadístico señala que la probabilidad que la precipitación sea menor a 80.033mm es
95.449%, mientras que la probabilidad de no superar los 90.017mm es 98.461%.
a. Determinar el parámetro de escala y de posición de la distribución log-normal, la media y
desviación estándar.
Ejercicio 19: En una cuenca de 15 km2 de superficie S tiene información de precipitaciones
máximas anuales para una hora de duración las cuales puede asumirse que se ajustan a una
distribución Gumbel. Dicha información indica que la probabilidad de exceder la lámina de
80mm es una hora es 20% mientras que la probabilidad de exceder los 140mm de lluvia, también
es de 5%.
a. Hallar el parámetro de escala, parámetro de posición, media y desviación estándar.

30

También podría gustarte