Está en la página 1de 11

Pontificia Universidad Javeriana

Departamento de Ingeniera Civil

ESTADSTICA EN HIDROLOGA

Pontificia Universidad Javeriana

Departamento de Ingeniera Civil

Hidrologa

Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

CONTENIDO
Introduccin.
Funciones de frecuencia y de probabilidad.
Parmetros estadsticos.
Distribuciones de probabilidad.
Pruebas de bondad de ajuste.

Hidrologa

1
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

INTRODUCCIN
-i-
Los procesos hidrolgicos evolucionan en el espacio y en el tiempo de una forma parcialmente
predecible (componente determinstica), y de una forma parcialmente incierta (componente
aleatoria).

Se define un proceso estocstico como la evolucin de una variable aleatoria en el tiempo. Muchas
variables hidrolgicas se modelan como procesos estocsticos.

En algunos casos, la variabilidad aleatoria es tan grande (comparada con la variabilidad


determinstica), que se justifica tratar el proceso como puramente aleatorio.
80

70

60
P (mm/mes)

50

40

30

20
1980 1985 1990 1995 2000 2005 2010

t (aos) Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

INTRODUCCIN
-ii-
80

Componente determinstica
70

60
P (mm/mes)

80 50

Variable hidrolgica 40
70

60 30
P (mm/mes)

50 20
15

40 Componente aleatoria
10

30
5
P (mm/mes)

20
1980 1985 1990 1995 2000 2005 2010 0

t (aos)
-5

-10

-15
1980 1985 1990 1995 2000 2005 2010

t (aos)

Hidrologa

2
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

INTRODUCCIN
-iii-
Cuando no existe correlacin entre observaciones adyacentes (esto es, la observacin
de un determinado periodo de tiempo no condiciona la observacin que se pueda dar
en el periodo inmediatamente posterior), los procesos hidrolgicos son tratados como
estocsticos, independiente del tiempo.

Un tratamiento puramente aleatorio de la informacin hidrolgica es adecuado para


observaciones de eventos hidrolgicos a nivel anual:

-Eventos extremos: Caudales o precipitaciones mximas (o mnimas) anuales; racha


mxima de das sin lluvia en un ao; temperaturas mximas (o mnimas); etc.

-Informacin promediada en largos intervalos de tiempo: precipitacin anual o


decadal, temperaturas medias anuales, caudales promedios multianuales mensuales,
etc.

-En general, en hidrologa, se considera las cantidades anuales (o con un intervalo de


tiempo superior) como variables aleatorias (v. a.) independientes e idnticamente
distribuidas (i. i. d.).
Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

FUNCIONES DE FRECUENCIA Y PROBABILIDAD


-i-
Un conjunto de observaciones finito x1,
0,24
x2, , xn se denomina una muestra de n = 100
0,22
tamao n de la v. a. X.
0,20
P [X=x ]

0,18
Se supone que las muestras son sacadas
de una poblacin (finita o infinita), cuyas 0,16

propiedades estadsticas poblacionales 0,14 Poblacin


son invariantes, mientras que las 0,12 Muestra
propiedades estadsticas muestrales 0,10

pueden variar de una muestra a otra. 0 1 2 3 4 5 6 7

0,24
x

0,22
n = 10000
Ejemplo: Un dado es un buen ejemplo
para definir poblacin y muestra. La 0,20

poblacin es X = { x/x = 1,2,3,4,5,6 }, con


P [X=x ]

0,18

P[X=xi] = 1/6. Sin embargo, la 0,16

distribucin poblacional puede 0,14 Poblacin


aproximarse calculando las distribuciones 0,12 Muestra
muestrales, para muestras con diferente
0,10
tamao n. 0 1 2 3 4 5 6 7

x
Hidrologa

3
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

FUNCIONES DE FRECUENCIA Y PROBABILIDAD


-iii-
Si las observaciones de una muestra son v. a. i. i. d. (i. i. d. significa que cada valor de
la muestra ha sido extrado de la misma distribucin de probabilidad), stas pueden
ordenarse para formar el histograma de frecuencias.

Se debe distinguir claramente entre las distribuciones muestrales y las


distribuciones de la poblacin.

Muestra Poblacin

Funcin de frecuencia relativa Funcin de densidad probabilidad


f s ( xi )
P[xi x X < xi ] f s ( xi ) = i
n
f ( x ) = lim
n n
x 0
x

Funcin de frecuencia acumulada Funcin de distribucin de probabilidad

P[ X xi ] Fs ( xi ) = f s (x j ) F ( x ) = lim Fs ( xi )
i

n
j =1 x 0

Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

FUNCIONES DE FRECUENCIA Y PROBABILIDAD


-iv-
Fuente: Hidrologa Aplicada,
La funcin de densidad probabilidad es la Chow, V. T., Maidment, D. R. y
Mays, L. W., p. 367.
derivada de la funcin de distribucin:
dF ( x )
f (x ) =
dx

Para un valor dado de x, la funcin de


distribucin de probabilidad F(x) es la
probabilidad acumulada P[Xx]:
x
P[ X x ] = F ( x ) = f ( ) d

De donde se deduce que:

P( xi ) = P[xi x X xi ]
xi xi x i x

P( xi ) = f (x ) dx = f (x ) dx f (x ) dx
x i x

P( xi ) = F ( xi ) F ( xi x )

Hidrologa

4
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

PARMETROS ESTADSTICOS
-i-
Debe tenerse en cuenta que los La varianza est relacionada con el
momentos estadsticos de una variable se segundo momento:
calculan como:
+
[ ]
2 = E ( x )2 = E [x 2 2 x + 2 ]
[ ] x
E xM = M
f ( x ) dx 2 = E [x 2 ] 2 E[x ] + 2
2 = E [x 2 ] 2

La media est relacionada con el primer Para los datos muestrales, la varianza
momento alrededor del origen: muestral es:
+
= E[x ] = x f ( x ) dx ( )
n
1
xi x
2
s2 =
n 1 i =1
Si se utilizan los datos muestrales, se y se define la desviacin tpica (o
obtiene el promedio de los valores de la desviacin estndar) como la raz del
muestra: valor anterior:
1 n = 2
x= xi Poblacin
n i =1
Muestra s = s2
Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

PARMETROS ESTADSTICOS
-ii-
La media es una medida de tendencia La curtosis es un parmetro de forma
central de la distribucin de los datos. que mide el apuntalamiento de las
distribuciones (la concentracin de masa
La varianza (o la desviacin estndar) es alrededor de la media).
una medida de dispersin de los datos.
La curtosis tiene un valor de 3 para la
Para medir la simetra de una distribucin normal. Una distribucin con
distribucin, se utiliza el coeficiente de colas pesadas tendra un valor 2 > 3,
asimetra u oblicuidad (parmetro de mientras que una distribucin muy
forma): concentrada alrededor de la media
tendr 2 < 3.

Poblacin 1 =
1
3
[
E (x )
3
] 2 =
[
E (x )
4
]3
4
n (n + 1) 3 (n 1)
3 4
n
x x
n
x x
2
n
i (n 1) (n 2) (n 3)
G1 = G2 = i
Muestra s (n 2) (n 3)
(n 1) (n 2) i=1 s i =1

Hidrologa

5
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

PARMETROS ESTADSTICOS
-iii-
Ejemplo: Verifquese que los parmetros
estadsticos poblacionales y 2 de la
distribucin uniforme:

1
, si a x b
f (x ) = b a
0 , en otro caso.

Son los siguientes:


a+b
=
2

=
2 (b a)
2

12

Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

DISTRIBUCIONES DE PROBABILIDAD
-i-
Fuente: Hidrologa Aplicada,
Chow, V. T., Maidment, D. R. y
Mays, L. W., p. 383-84.

Hidrologa

6
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

DISTRIBUCIONES DE PROBABILIDAD
-ii-
Fuente: Hidrologa Aplicada,
Chow, V. T., Maidment, D. R. y
Mays, L. W., p. 383-84.

Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

PRUEBAS DE BONDAD DE AJUSTE


Chi-cuadrado (2)

La bondad del ajuste puede verificarse El valor de c2 se compara con 2m-p+1,1-,


comparando los valores tericos de las donde:
funciones de densidad ajustadas
(probabilidad o acumulada), con los m = Nmero de intervalos.
valores muestrales de las funciones de
p = Nmero de parmetros de la
frecuencia (relativa o acumulada).
distribucin.
m-p+1 = Grados de libertad.
La prueba Chi-cuadrado utiliza el
= Nivel de significancia de la prueba.
siguiente estadstico:
1 = Nivel de confianza de la prueba.

n[ f s (xi ) P ( xi )]
m 2
c2 = Se rechaza la hiptesis nula (H0: la
i =1 P ( xi ) distribucin ajustada es adecuada), si:

donde fs(xi) es la frecuencia observada, y


P(xi) es la frecuencia terica de la
c2 > m2 p +1,1
variable x.

Hidrologa

7
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

PRUEBAS DE BONDAD DE AJUSTE


Kolmogorov-Smirnov (KS)

La prueba estadstica de KS compara las Se acepta la hiptesis nula (H0: la


distribuciones acumuladas terica y distribucin ajustada es adecuada), si:
muestral.
< 1 L(d )
D = sup F ( xi ) Fs ( xi )
< 2 ( 1)i 1 exp( 2i 2 d 2 )

i =1
D es la mxima distancia entre las
distribuciones acumuladas. Ejemplo: Calcule los parmetros
estadsticos bsicos para la siguiente
Se ha probado que: serie de caudales promedio anual. Es
correcto suponer que se ajustan a una

[
P n D d = L(d )] distribucin normal?

( )

L(d ) = 1 2 ( 1) exp 2i 2 d 2
i 1
con
i =1

Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

EJEMPLO
-i-
Ejemplo: Calcule los estadsticos bsicos para Los estadsticos de la serie de caudales anuales
la siguiente serie de caudales promedio anual. son los siguientes:
Es correcto suponer que se ajustan a una n = 49
distribucin
> normal?
Ao 3
Q (m /s) Ao 3
Q (m /s) min = 8.32 m 3 /s
1960 60,05 1985 8,32
1961 42,98 1986 31,26 max = 155.58 m 3 /s
1962 56,66 1987 21,64
1963
1964
61,43
36,83
1988
1989
30,46
38,43
x = 45.93 m 3 /s
s = 28.84 m 3 /s
1965 72,81 1990 39,47
1966 39,27 1991 28,22
1967 42,24 1992 10,44
1968 52,77 1993 19,23 G1 = 1.63
1969 65,48 1994 21,93
1970 45,03 1995 13,15 G2 = 3.95
1971 67,22 1996 38,63
1972 71,18 1997 11,17 Una frmula til para calcular el nmero de
1973 62,80 1998 25,53
intervalos para hacer el histograma de
1974 49,52 1999 49,03
1975 53,38 2000 26,96 frecuencias es la siguiente:

m = entero.superior(1 + 3 ln (n ))
1976 72,18 2001 16,04
1977 47,18 2002 22,34
1978 58,91 2003 16,93
1979 155,58 2004 30,94 m = 13
1980 41,63 2005 52,43
1981 125,97 2006 93,02
1982 96,51 2007 53,41
1983 21,91 2008 23,21 Hidrologa
1984 28,8

8
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

EJEMPLO
-ii-
160

140

120

100
Q (m3/s)

80

60

40

20

0
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010

Ao Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

EJEMPLO
-iii-
Bondad de ajuste Prueba 2

Teniendo en cuenta que se construir el histograma con trece (13) intervalos de clase. El valor
mnimo es 8,32 m3/s, y el mximo 155,58 m3/s, entonces el tamao mnimo del intervalo debe ser
11,33 m3/s.

Se elegir, por conveniencia, un tamao del intervalo de clase de 12 m3/s, comenzando por 4 m3/s,
hasta 160 m3/s. Los valores mnimo (8,32 m3/s) y mximo (155,58 m3/s) estn, intencionadamente,
cercanos a la marca de clase del primer (10 m3/s) y ltimo intervalo de clase (154 m3/s),
respectivamente.
Intervalos de Clase Frecuencias 2
ni n (f s -P ) /P
xi x INF x SUP f s (x i ) F (x INF ) F (x SUP ) P (x i )
10 4 16 4 0,0816 0,0730 0,1497 0,0767 0,0155
22 16 28 10 0,2041 0,1497 0,2671 0,1174 3,1366
34 28 40 10 0,2041 0,2671 0,4186 0,1515 0,8948
46 40 52 7 0,1429 0,4186 0,5834 0,1648 0,1433
58 52 64 9 0,1837 0,5834 0,7346 0,1512 0,3424
70 64 76 5 0,1020 0,7346 0,8515 0,1169 0,0927
82 76 88 0 0,0000 0,8515 0,9277 0,0762 3,7352
94 88 100 2 0,0408 0,9277 0,9696 0,0419 0,0014
106 100 112 0 0,0000 0,9696 0,9890 0,0194 0,9516
118 112 124 0 0,0000 0,9890 0,9966 0,0076 0,3718
130 124 136 1 0,0204 0,9966 0,9991 0,0025 6,2894
142 136 148 0 0,0000 0,9991 0,9998 0,0007 0,0340
154 148 160 1 0,0204 0,9998 1,0000 0,0002 123,6987
2 Hidrologa
n 49 c 139,7072

9
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

EJEMPLO
-iv-
Bondad de ajuste Prueba 2

El estadstico calculado para los datos es


c2 = 139,71.
0,25

Poblacin
Este valor se compara con el valor de la
distribucin para 12,0,952 = 21,03.
0,20
Muestra

f
0,15
Los grados de libertad son m-p+1 = 13-2+1
= 12, y se ha escogido un nivel de
0,10
significancia del 5% (nivel de confianza
95%).
0,05

Dado que c2 > 12,0,952, la conclusin de la


0,00
prueba de bondad de ajuste es que los 10 22 34 46 58 70 82 94 106 118 130 142 154
datos no se ajustan a la distribucin x
normal.

Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

EJEMPLO
-v-
Bondad de ajuste Prueba KS
Frmulas de ploteo (Shabri, 2002. A comparison of plotting
Para realizar la prueba de bondad de ajuste formulas for the Pearson Type III distribution. Jurnal
con KS, es necesario asignar probabilidades Teknologi, 36(C), 6174.
de no excedencia empricas a los datos
muestrales (ordenados de forma
ascedente).

Para hacer esto, se utilizan lo que se conoce


en la literatura como frmulas de ploteo
(plotting position formulas), las cuales
tienen la siguiente forma:
ia
Pi =
n +1 2 a
Pi = Probabilidad emprica de no excedencia.
i = Orden del dato en el vector ordenado.
n = Tamao de la muestra.
a = Parmetro, que depende de la
distribucin a ajustar.
Hidrologa

10
Pontificia Universidad Javeriana
Departamento de Ingeniera Civil

EJEMPLO
-vi-
Bondad de ajuste Prueba KS
i xi F s (x i ) F (x i ) abs(F s -F ) i xi F s (x i ) F (x i ) abs(F s -F )
1 8,32 0,02 0,0961 0,0761 26 42,24 0,52 0,4492 0,0708
Utilizando la frmula de Weibull, se 2 10,44 0,04 0,1093 0,0693 27 42,98 0,54 0,4593 0,0807
obtienen los resultados en la tabla. 3 11,17 0,06 0,1140 0,0540 28 45,03 0,56 0,4876 0,0724
4 13,15 0,08 0,1279 0,0479 29 47,18 0,58 0,5174 0,0626
5 16,04 0,10 0,1500 0,0500 30 49,03 0,60 0,5428 0,0572
El valor de D se obtiene como la mayor 6 16,93 0,12 0,1574 0,0374 31 49,52 0,62 0,5495 0,0705
7 19,23 0,14 0,1772 0,0372 32 52,43 0,64 0,5891 0,0509
diferencia (en valor absoluto), entre Fs y F.
8 21,64 0,16 0,1999 0,0399 33 52,77 0,66 0,5937 0,0663
9 21,91 0,18 0,2025 0,0225 34 53,38 0,68 0,6020 0,0780
10 21,93 0,20 0,2027 0,0027 35 53,41 0,70 0,6023 0,0977
El valor de es D = 0,0977, Con este valor 11 22,34 0,22 0,2067 0,0133 36 56,66 0,72 0,6451 0,0749
se calcula d = 491/2D = 0,6836. 12 23,21 0,24 0,2154 0,0246 37 58,91 0,74 0,6737 0,0663
13 25,53 0,26 0,2397 0,0203 38 60,05 0,76 0,6878 0,0722
14 26,96 0,28 0,2553 0,0247 39 61,43 0,78 0,7046 0,0754
Se calcula ahora el valor de L(d), para i = 15 28,22 0,30 0,2696 0,0304 40 62,80 0,80 0,7207 0,0793
1,2,3 (es suficiente, ya que la convergencia 16 28,80 0,32 0,2763 0,0437 41 65,48 0,82 0,7511 0,0689
17 30,46 0,34 0,2958 0,0442 42 67,22 0,84 0,7698 0,0702
es muy rpida): 18 30,94 0,36 0,3017 0,0583 43 71,18 0,86 0,8093 0,0507
19 31,26 0,38 0,3055 0,0745 44 72,18 0,88 0,8186 0,0614

( )

L(d ) = 1 2 ( 1) exp 2i 2 d 2 = 0.2616
20 36,83 0,40 0,3761 0,0239 45 72,81 0,90 0,8244 0,0756
i 1
21 38,43 0,42 0,3974 0,0226 46 93,02 0,92 0,9488 0,0288
22 38,63 0,44 0,4001 0,0399 47 96,51 0,94 0,9603 0,0203
i =1 23 39,27 0,46 0,4087 0,0513 48 125,97 0,96 0,9972 0,0372
24 39,47 0,48 0,4114 0,0686 49 155,58 0,98 0,9999 0,0199

Ya que = 0.05 < 1-L(d), entonces no se


25 41,63 0,50 0,4407 0,0593

rechaza la hiptesis nula.


Hidrologa

Pontificia Universidad Javeriana


Departamento de Ingeniera Civil

EJEMPLO
-vii-
1,00
Bondad de ajuste Prueba KS
0,90

0,80

0,70
D = 0,0977
F

0,60

0,50

0,40

0,30

0,20

0,10 Poblacin
Muestra
0,00
5 50

x
Hidrologa

11

También podría gustarte