Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística hidrológica
87
Hidrología de superficie
Sea, por ejemplo, el volumen mensual del escurrimiento en una sección dada de un
río. Al tomar una muestra de los escurrimientos (esto es, al aforar la corriente en un
número finito de meses), se observa que el volumen mensual de escurrimiento es a veces
mayor de 300 000 m3, pero a veces es menor. Si se quisiera aprovechar el agua del río, por
ejemplo, para riego, pero sin hacer una presa, el dato de que el volumen es a veces mayor
de 300 000 m3, pero a veces menor resulta, obviamente, demasiado vago. Por otra parte,
la determinación precisa de los volúmenes mensuales de escurrimiento que se presentarán
durante los siguientes L años (siendo L la vida útil de la obra de captación) involucraría el
análisis de un conjunto de condiciones que van desde las meteorológicas hasta los
cambios que se presentarán en la cuenca de aportación demasiado complicado o para el
cual no se dispone de herramientas adecuadas.
88
Estadística hidrológica
Aunque (5.1) es de mayor utilidad que el dato de que el volumen mensual a veces
es mayor de 300 000 m3, pero a veces menor, todavía es de poca utilidad para el
proyectista. Él recibiría una información mucho más valiosa si se le dice que en
aproximadamente el 70% de los meses el volumen es mayor de 300 000 m3; una
evaluación mucho más completa de los escurrimientos del río sería mostrar, para
cualquier volumen V, el porcentaje v (V) de los meses en que han escurrido no menos de V
m3 en el periodo de datos.
Figura 5.1.
Considérese ahora un grupo grande de series de pruebas (aforos del río) Sea n, el
número de pruebas en la r-ésima serie y µ, el número de pruebas en esta serie en que
ocurre un cierto evento A.
89
Hidrología de superficie
µr
vr =
nr (5.2)
p = P ( A) ≡ v r (5.3)
0 ≤ P ( A) ≤ 1 (5.4)
Por otra parte, cuando, para un evento E, ocurre que µr = nr, se dice que el evento
E es seguro y entonces:
P( E ) = 1 (5.5)
Para que un evento sea seguro debe incluir todos los posibles casos o resultados
del experimento (espacio muestral). Así, en el caso del escurrimiento del río, el evento
seguro es:
E :0 ≤V ≤ ∞ (5.6)
90
Estadística hidrológica
P (V < 0) = 0 (5.7)
Se dice que dos eventos son mutuamente excluyentes cuando no pueden ocurrir
simultáneamente. Por ejemplo, el evento
P (C ) = P( A ∪ B) = P( A) + P( B) (5.10)
91
Hidrología de superficie
X = D1 + D2 (5.11)
donde D1 + D2 son los puntos obtenidos del primero y segundo dado respectivamente, el
espacio muestral1 será mostrado en la tabla 5.1.
Tabla 5.1
1
Se define como espacio muestral al conjunto de todos los posibles resultados de un experimento.
92
Estadística hidrológica
G ( x) = P ( X ≤ x) (5.12)
Tabla 5.2
Figura 5.2.
93
Hidrología de superficie
que se lee como la “probabilidad de que la variable aleatoria X tome un valor menor o
igual que x”. En este caso, dado que la variable aleatoria X es discreta, se escribe:
G ( x) = ∑ P( X = x )
∀xi ≤ x
i
(5.13)
Figura 5.3.
94
Estadística hidrológica
Figura 5.4.
Nótese que, al contrario de lo que sucede con la función masa de la figura 5.2,
cuando una variable aleatoria es continua, la probabilidad de que ésta tome un valor
exacto es siempre nula:
P( X = x) = 0 (5.14)
95
Hidrología de superficie
Figura 5.5.
F ( x) = P( X ≤ x) (5.16)
x
F ( x) = ∫ f ( x)dx
−∞ (5.17)
dF ( x)
f ( x) =
dx (5.18)
f ( x) ≥ 0 (5.19a)
96
Estadística hidrológica
∞
∫
−∞
f ( x)dx = 1
(5.19b)
b a
P ( a ≤ X ≤ b) = P ( X ≤ b) − P ( X ≤ a ) = ∫− ∞ f ( x)dx − ∫− ∞ f ( x)dx = F (b) − F (a)
(5.20)
0 ≤ F ( x) ≤ 1 (5.21)
y además:
97
Hidrología de superficie
Tabla 5.3
Año 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981
Qmáx,
m3/s 2000 5000 4500 3800 2900 3100 1500 2200 3900 4700
Figura 5.6.
y la probabilidad de que dicho gasto sea menor o igual a 5 000 m3/s se encuentra dentro
de los límites
1− m
P ( X ≤ x) = 1 +
n (5.24)
98
Estadística hidrológica
m
P( X ≤ x) = 1 −
n (5.25)
Tabla 5.4
m 1 2 3 4 5 6 7 8 9 10
X=
Qmáx
3
(m /s) 5000 4700 4500 3900 3800 3100 2900 2200 2000 1500
0≤ x≤∞ (5.26)
siempre habrá una probabilidad no nula de que se presente un gasto menor o igual que un
valor cualquiera en este rango, no importa qué tan pequeño o grande sea dicho valor.
De aquí la necesidad de usar una fórmula que asigne una probabilidad no nula a
cualquier evento. Esto puede hacerse con una fórmula del tipo:
2m − 1
P ( X ≤ x) = 1 −
2n (5.27)
99
Hidrología de superficie
m
P ( X ≤ x) = 1 −
n +1 (5.28)
1
P= (5.29)
T
1
T= (5.30)
P
n +1
T=
m (5.31)
100
Estadística hidrológica
A esta probabilidad se le conoce como Riesgo (Riesgo de falla), donde uno o más
eventos de periodo de retorno Tr ocurran durante la vida útil de una obra.
R = 1 − (1 − P ) = 1 − (1 −
N 1 N
) (5.32)
Tr
entonces
1
Tr = (5.33)
1 − (1 − R)1 / N
101
Hidrología de superficie
Figura 5.7. Relación entre el periodo de retorno, la vida útil de la obra y el riesgo(A.6)
102
Estadística hidrológica
∞
E ( x) − µ = ∫− ∞ xf ( x)dx (5.34)
1 n
x= ∑ xi
n i =1 (5.35)
La tabla 5.5 resume las ecuaciones para algunos parámetros de población y de sus
estadísticas de muestra.
[ ] ∞
E ( x − µ ) 2 = σ 2 = ∫ ( x − µ ) 2 f ( x)dx
−∞ (5.36)
1 n
s2 = ∑
n − 1 i =1
( xi − x) 2
(5.37)
103
Hidrología de superficie
⎜⎜ ∏ xi ⎟⎟
⎝ i =1 ⎠
2. Variabilidad
Varianza
σ 2 = E [( x − µ ) 2 ] 1 n
s2 = ∑ ( xi − x) 2
n − 1 i =1
Desviación estándar
{
σ = E [x − µ ]2 } 1/ 2
⎡ 1 n
s=⎢ ∑
⎤
( xi − x) 2 ⎥
1/ 2
⎣ n − 1 i =1 ⎦
Coeficiente de variación
σ s
CV = CV =
µ x
3. Simetría
Coeficiente de asimetría (oblicuidad)
E [( x − µ )]
3 n
γ = n∑ ( xi − x) 3
σ3 Cs = i =1
(n − 1)(n − 2) s 3
104
Estadística hidrológica
[ ] ∞
E ( x − µ ) 3 = ∫ ( x − µ ) 3 f ( x)dx
−∞ (5.38)
γ =
1
σ3
[
E (x − µ)3 ]
(5.39)
105
Hidrología de superficie
n
n∑ ( xi − x) 3
Cs = i =1
(n − 1)(n − 2) s 3 (5.40)
o bien
⎛ n ⎞ ⎛ n ⎞⎛ n ⎞ ⎛ n ⎞
n 2 ⎜ ∑ x 3 ⎟ − 3n ⎜ ∑ x ⎟⎜ ∑ x 2 ⎟ + 2⎜ ∑ x 3 ⎟
Cs = ⎝ i =1 ⎠ ⎝ i =1 ⎠ ⎝ i =1 ⎠ ⎝ i =1 ⎠
n ( n − 1)( n − 2 ) x 3 (5.41)
Tal como se muestra en la figura 5.8b, para la asimetría positiva (γ > 0), la
información está desviada hacia la izquierda. Si los datos tienen una asimetría pronunciada,
un pequeño número de valores extremos causa un efecto significativo en la media
aritmética calculada mediante la ecuación (5.35), luego son apropiadas medidas alternativas
de la tendencia central, tales como la mediana o la media geométrica listadas en la tabla
5.5.
Por ejemplo, puede ser necesario determinar un gasto de diseño como periodo de
retorno de 1 000 años a partir de 25 años de registro. Si los gastos máximos anuales
registrados se dibujan contra sus respectivos periodos de retorno, generalmente se observa
alguna tendencia más o menos definida. El problema radica en cómo extender esa
tendencia hasta el periodo de retorno deseado. Una posibilidad es extrapolar los datos a
106
Estadística hidrológica
ojo, es decir, gráficamente. Aunque este método puede dar muy buenos resultados si se
aplica por una persona con experiencia, tiene la desventaja de la subjetividad; esto es, si
veinte ingenieros diferentes lo aplican, es probable que el resultado sean veinte gráficas
diferentes.
Para eliminar esta subjetividad, se debe buscar entre las distintas funciones de
distribución de probabilidad teóricas la que se ajuste mejor a los datos medidos, y usar
esta función para la extrapolación.
a) Normal.
b) Lognormal.
c) Pearson III.
d) Gumbel.
Las funciones anteriores, aún cuando son las más comúnmente usadas en la
hidrología aplicada, no son todas, pues el enfoque de este texto no es exhaustivo. No
obstante, se presentan las bases necesarias para estudiar cualquier función de distribución
de probabilidad.
107
Hidrología de superficie
resultados, como los gastos máximos o mínimos anuales. La función Pearson III ocupa un
lugar intermedio.
tiende hacia la distribución normal con media nµ y varianza nσ2 a medida que n aumenta.
El punto importante es que esto es cierto sin importar cuál es la función de distribución de
probabilidad de X. Así, por ejemplo, la distribución de probabilidad de la media de la
muestra
1 n
x= ∑ xi (5.43)
n i =1
108
Estadística hidrológica
σ
2
⎛1⎞
2
⎜ ⎟ nσ =
2
(5.44)
⎝n⎠ n
Y = log X (5.45)
está normalmente distribuida, entonces se dice que X está distribuida en forma lognormal.
Chow llegó a la conclusión de que esta distribución se aplica a variables hidrológicas
formadas como productos de otras variables debido a que si
X = X 1 , X 2 , X 3 ..., X n (5.46)
entonces
n n
Y = log X = ∑ log X i = ∑ Yi (5.47)
i =1 i =1
lo cual tiende a la distribución normal para valores grandes de n siempre y cuando los Xi
sean independientes y estén idénticamente distribuidos. Se ha encontrado que la
109
Hidrología de superficie
El sistema de distribuciones Pearson incluye siete tipos, todos soluciones para f(x)
en una ecuación de la forma
d [ f ( x)] f ( x)( x − d )
= (5.48)
dx C0 + C1 x + C2 x 2
donde d es la moda de la distribución (el valor de x para el cual f(x) es un máximo) y C0,
C1 y C2 son coeficientes que deben determinarse. Cuando C2 = 0, la solución de la
ecuación anterior es una distribución Pearson tipo III. Para C1 = C2 = 0, la solución de la
ecuación es una distribución normal. Por tanto, la distribución normal es un caso especial
de la distribución Pearson tipo III para describir una variable no asimétrica. La
distribución Pearson tipo III se aplicó por primera vez en la hidrología para describir la
distribución de probabilidad de picos de crecientes máximas anuales. Cuando la
información es muy asimétrica positivamente, se utiliza una transformación log para
110
Estadística hidrológica
reducir la asimetría.
111
Hidrología de superficie
n xi 1 n
∑ = ∑ xi = x (5.49)
i =1 n n i =1
∞
µ = ∫ xf ( x)dx
−∞ (5.50)
P( A ∩ B ) = P( A)P(B ) (5.51)
como el producto f(x1) dx f(x2) dx ... f(xn) dx = [Πni=1 f(x1)] dxn, y puesto que el tamaño del
intervalo dx es fijo, el maximizar la probabilidad conjunta de la muestra observada es
equivalente a maximizar la función de verosimilitud:
n
L = ∏ f ( xi )
i =1 (5.52)
n
ln L = ∑ ln[ f ( xi )]
i =1 (5.53)
solución analítica para todos los parámetros en términos de las estadísticas de la muestra y
la función logaritmo de verosimilitud debe maximizarse numéricamente, lo cual puede ser
bastante difícil. En general, el método de los momentos es más fácil de aplicar que el
método de la máxima verosimilitud y es más apropiado para análisis prácticos en
hidrología.
n[ f s ( xi ) − p( xi )]
m 2
X =∑ 2
e
i =1 p ( xi ) (5.54)
Para describir la prueba X2, debe definirse la distribución de probabilidad X2. Una
distribución X2 con v grados de libertad es la distribución para la suma de los cuadrados
de v variables aleatorias normales independientes zi; esta suma es la variable aleatoria
v
X v2 = ∑ z i2
i =1 (5.55)
114
Estadística hidrológica
y = a + bx (5.56)
115
Hidrología de superficie
El ajuste de los datos a una recta se hace de tal manera que se minimizan
las desviaciones entre los datos observados y los calculados. Lo anterior se logra
determinando los coeficientes de regresión por el método de mínimos cuadrados:
a= ∑ y ∑ x 2 − ∑ x ∑ xy
(5.57)
n ∑ x 2 − (∑ x )
2
n∑ xy − ∑ x ∑ y
b= (5.58)
n ∑ x 2 − (∑ x )
2
n∑ xy − ∑ x ∑ y
r= ≥ 0.8 (5.59)
[n∑ x ] [n∑ y ]
1 1
− (∑ x ) − (∑ y )
2 2 2 2 2 2
Sx
r =b (5.60)
Sy
Una vez conocidos los coeficientes de regresión, se procede a calcular los valores
complementarios de la estación en estudio, apoyándose en los valores conocidos
simultáneos de la estación análoga.
Cabe hacer notar que las variables x y y deben ser del mismo tipo. Sin embargo, es
posible correlacionar variables de diferente especie (por ejemplo, gasto contra
precipitación) siempre y cuando su correlación sea significativa.
y = a0 + a1 x1 + a2 x2 + ... + an xn (5.61)
∑ yi − na0 − a1 ∑ x1 − a2 ∑ x2 − ... − an ∑ xn = 0
∑ yi x1 − a0 ∑ x1 − a1 ∑ x1 − a2 ∑ x1 x2 − ... − an ∑ x1 xn = 0
2
∑ yi x2 − a0 ∑ x2 − a1 ∑ x1 x2 − a2 ∑ x2 − ... − an ∑ x2 xn = 0
2
(5.62)
...
∑ yi xn − a0 ∑ xn − a1 ∑ x1 xn − a2 ∑ x2 xn − ... − an ∑ xn = 0
2
117
Hidrología de superficie
y = cx k (5.63)
donde c y k son los coeficientes de regresión, por lo que la función queda expresada
como:
c = anti log a0
k = a1
y = a0 + a1 x + a2 x 2 + ... + ak x k (5.65)
∑ yi − na0 − a1 ∑ xi − a2 ∑ xi − ... − ak ∑ x k = 0
2
∑ yi xi − a0 ∑ xi − a1 ∑ xi − a2 ∑ xi − ... − ak ∑ x k +1 = 0
2 2
k +2
∑ yi xi − a0 ∑ xi − a1 ∑ xi − a2 ∑ xi − ... − ak ∑ xi = 0
2 2 3 4
(5.66)
...
k +1 k +2
∑ yi x k − a0 ∑ xi − a1 ∑ xi − a2 ∑ xi − ... − ak ∑ xi
k 2k
=0
118