Está en la página 1de 24

Pontificia Universidad Javeriana

Departamento de Ingeniería Civil

ESTADÍSTICA EN HIDROLOGÍA

Pontificia Universidad Javeriana

Departamento de Ingeniería Civil

Hidrología

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

CONTENIDO
• Introducción.
• Funciones de frecuencia y de probabilidad.
• Parámetros estadísticos.
• Distribuciones de probabilidad.
• Pruebas de bondad de ajuste.

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

INTRODUCCIÓN
-i-
Los procesos hidrológicos evolucionan en el espacio y en el tiempo de una forma parcialmente
predecible (componente determinística), y de una forma parcialmente incierta (componente
aleatoria).

Se define un proceso estocástico como la evolución de una variable aleatoria en el tiempo. Muchas
variables hidrológicas se modelan como procesos estocásticos.

En algunos casos, la variabilidad aleatoria es tan grande (comparada con la variabilidad


determinística), que se justifica tratar el proceso como puramente aleatorio.
80

70

60
P (mm/mes)

50

40

30

20
1980 1985 1990 1995 2000 2005 2010

t (años) Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

INTRODUCCIÓN
-ii-
80

Componente determinística
70

60

P (mm/mes)
80 50

Variable hidrológica 40
70

60 30
P (mm/mes)

50 20
151980 1985 1990 1995 2000 2005 2010

40 Componente aleatoria
t (años)

10

30
5
P (mm/mes)
20
1980 1985 1990 1995 2000 2005 2010 0

t (años)
-5

-10

-15
1980 1985 1990 1995 2000 2005 2010

t (años)

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

INTRODUCCIÓN
-iii-
Cuando no existe correlación entre observaciones adyacentes (esto es, la observación
de un determinado periodo de tiempo no condiciona la observación que se pueda dar
en el periodo inmediatamente posterior), los procesos hidrológicos son tratados como
estocásticos, independiente del tiempo.

Un tratamiento puramente aleatorio de la información hidrológica es adecuado para


observaciones de eventos hidrológicos a nivel anual:

-Eventos extremos: Caudales o precipitaciones máximas (o mínimas) anuales; racha


máxima de días sin lluvia en un año; temperaturas máximas (o mínimas); etc.

-Información promediada en largos intervalos de tiempo: precipitación anual o


decadal, temperaturas medias anuales, caudales promedios multianuales mensuales,
etc.

-En general, en hidrología, se considera las cantidades anuales (o con un intervalo de


tiempo superior) como variables aleatorias (v. a.) independientes e idénticamente
distribuidas (i. i. d.).
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

FUNCIONES DE FRECUENCIA Y PROBABILIDAD


-i-
Un conjunto de observaciones finito x1,
0,24
x2, … , xn se denomina una muestra de n = 100
tamaño n de la v. a. X. 0,22

0,20

Se supone que las muestras son sacadas


0,18

P [X=x ]
de una población (finita o infinita), cuyas 0,16

propiedades estadísticas poblacionales 0,14 Población


son invariantes, mientras que las 0,12 Muestra
propiedades estadísticas muestrales 0,10

pueden variar de una muestra a otra. 0 1 2 3 4 5 6 7

0,24

n = 10000
x

Ejemplo: Un dado es un buen ejemplo


0,22

para definir “población” y “muestra”. La 0,20

población es X = { x/x = 1,2,3,4,5,6 }, con 0,18


P [X=x ]

P[X=xi] = 1/6. Sin embargo, la 0,16

distribución poblacional puede 0,14 Población


aproximarse calculando las distribuciones 0,12 Muestra
muestrales, para muestras con diferente
0,10
tamaño n. 0 1 2 3 4 5 6 7

x Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

FUNCIONES DE FRECUENCIA Y PROBABILIDAD


-iii-
Si las observaciones de una muestra son v. a. i. i. d. (i. i. d. significa que cada valor de
la muestra ha sido extraído de la misma distribución de probabilidad), éstas pueden
ordenarse para formar el histograma de frecuencias.

Se debe distinguir claramente entre las distribuciones muestrales y las


distribuciones de la población.

Muestra Población

Función de frecuencia relativa Función de densidad probabilidad


f s xi 
Pxi  x  X  xi   f s xi  
ni
f x   lim
n n 
x 0
x

Función de frecuencia acumulada Función de distribución de probabilidad

PX  xi   Fs xi    f s x j  F x   lim Fs xi 


i

n
j 1 x 0

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

FUNCIONES DE FRECUENCIA Y PROBABILIDAD


-iv-
Fuente: Hidrología Aplicada,
La función de densidad probabilidad es la Chow, V. T., Maidment, D. R. y
Mays, L. W., p. 367.
derivada de la función de distribución:
dF x 
f x  
dx

Para un valor dado de x, la función de


distribución de probabilidad F(x) es la
probabilidad acumulada P[Xx]:
x
PX  x  F x    f   d

De donde se deduce que:

P xi   Pxi  x  X  xi 
xi xi xi  x

P xi    f x  dx   f x  dx   f x  dx
x i  x  

P xi   F  xi   F  xi  x 

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

PARÁMETROS ESTADÍSTICOS
-i-
Debe tenerse en cuenta que los La varianza está relacionada con el
momentos estadísticos de una variable se segundo momento:
calculan como:

 
 2  E  x   2  E x 2  2    x   2 
  x
E xM  M
 f x   dx  2  E x 2  2    E x    2
 2  E x 2   2


La media está relacionada con el primer Para los datos muestrales, la varianza
momento alrededor del origen: muestral es:

  Ex   x  f x   dx  
n
1
  xi  x
2
s 
2

 n  1 i 1
Si se utilizan los datos muestrales, se y se define la desviación típica (o
obtiene el promedio de los valores de la desviación estándar) como la raíz del
muestra: valor anterior:
1 n
x    xi Población   2
n i 1
Muestra s  s2
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

PARÁMETROS ESTADÍSTICOS
-ii-
La media es una medida de tendencia La curtosis es un parámetro de forma
central de la distribución de los datos. que mide el apuntalamiento de las
distribuciones (la concentración de masa
La varianza (o la desviación estándar) es alrededor de la media).
una medida de dispersión de los datos.
La curtosis tiene un valor de 3 para la
Para medir la simetría de una distribución normal. Una distribución con
distribución, se utiliza el coeficiente de “colas pesadas” tendra un valor 2 > 3,
asimetría u oblicuidad (parámetro de mientras que una distribución muy
forma): concentrada alrededor de la media
tendrá 2 < 3.

Población 1 

1
3

 E x   
3
 2 

E x   
4
 3
 4

n  n  1 3  n  1
3 4
n x x n 
xi  x 
2

n  1  n  2  n  3 
n
Muestra G1     i  G2     
 n  2   n  3
n  1  n  2 i 1  s  i 1  s 

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

PARÁMETROS ESTADÍSTICOS
-iii-
Ejemplo: Verifíquese que los parámetros
estadísticos poblacionales  y 2 de la
distribución uniforme:

 1
 , si a  x  b
f x    b  a
0 , en otro caso.

Son los siguientes:


ab

2

2 
b  a 2

12

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

DISTRIBUCIONES DE PROBABILIDAD
-i-
La distribución de probabilidad de una variable aleatoria es Uno de los conceptos más importantes de la teoría de
una función que asigna a cada suceso definido sobre la probabilidades es el de variable
variable la probabilidad de que dicho suceso ocurra. La aleatoria que, intuitivamente, puede definirse como
distribución de probabilidad está definida sobre el conjunto cualquier característica medible que
de todos los sucesos y cada uno de los sucesos es el rango toma diferentes valores con probabilidades determinadas.
de valores de la variable aleatoria. También puede decirse Toda variable aleatoria posee una
que tiene una relación estrecha con las distribuciones de
distribución de probabilidad que describe su
frecuencia. De hecho, una distribución de probabilidades
comportamiento. Si la variable es discreta, es
puede comprenderse como una frecuencia teórica, ya que
describe cómo se espera que varíen los resultados. decir, si toma valores aislados dentro de un intervalo, su
distribución de probabilidad
especifica todos los valores posibles de la variable junto
La distribución de probabilidad está completamente
con la probabilidad de que cada uno
especificada por la función de distribución, cuyo valor en
cada x real es la probabilidad de que la variable aleatoria ocurra. En el caso continuo, es decir, cuando la variable
sea menor o igual que x. puede tomar cualquier valor de un
intervalo, la distribución de probabilidad permite
determinar las probabilidades
correspondientes a subintervalos de valores. Una forma
usual de describir la distribución de
probabilidad de una variable aleatoria es mediante la
denominada función de densidad en el
caso de variables continuas y función de masa de
probabilidad en el caso de variables
discretas, en tanto que lo que se conoce como función de
distribución representa las
probabilidades acumuladas
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

DISTRIBUCIONES DE PROBABILIDAD
-ii-
Fuente: Hidrología Aplicada,
Chow, V. T., Maidment, D. R. y
Mays, L. W., p. 383-84.

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

DISTRIBUCIONES DE PROBABILIDAD
-iii-
Fuente: Hidrología Aplicada,
Chow, V. T., Maidment, D. R. y
Mays, L. W., p. 383-84.

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

PRUEBAS DE BONDAD DE AJUSTE


La bondad de ajuste de un modelo estadístico Para calcular si una distribución dada se ajusta
describe lo bien que se ajusta un conjunto de a un conjunto de datos, se pueden utilizar las
observaciones. Las medidas de bondad en general siguientes pruebas:
resumen la discrepancia entre los valores
observados y los valores esperados en el modelo de • Prueba de Kolmogórov-Smirnov
estudio. Tales medidas se pueden emplear en el
contraste de hipótesis, e.g. el test de normalidad • Criterio de Cramér-von Mises
de los residuos, comprobar si dos muestras se • Prueba de Anderson-Darling
obtienen a partir de dos distribuciones idénticas • Test de Shapiro–Wilk
(test de Kolmogorov-Smirnov), o si las frecuencias • Prueba de ji cuadrada
siguen una distribución específica ( c2 Chi- • Criterio de Información de Akaike
cuadrada).

En el análisis de regresión, existen los siguientes


indicadores:

• Coeficiente de determinación (El R2 mide la


bondad de ajuste)
• Lack-of-fit sum of squares.

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

PRUEBAS DE BONDAD DE AJUSTE


Chi-cuadrado (c2)

La bondad del ajuste puede verificarse El valor de cc2 se compara con c2m-p+1,1-a,
comparando los valores teóricos de las donde:
funciones de densidad ajustadas
(probabilidad o acumulada), con los m = Número de intervalos.
valores muestrales de las funciones de
p = Número de parámetros de la
frecuencia (relativa o acumulada).
distribución.
m-p+1 = Grados de libertad.
La prueba Chi-cuadrado utiliza el
a = Nivel de significancia de la prueba.
siguiente estadístico:
1a = Nivel de confianza de la prueba.
n f x   Pxi 
m 2
c  s i
2
Se rechaza la hipótesis nula (H0: la
Pxi 
c
i 1 distribución ajustada es adecuada), si:

donde fs(xi) es la frecuencia observada, y


c c2  c m2  p 1,1a
P(xi) es la frecuencia teórica de la
variable x.

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

PRUEBAS DE BONDAD DE AJUSTE


Kolmogorov-Smirnov (KS)

La prueba estadística de KS compara las Se acepta la hipótesis nula (H0: la


distribuciones acumuladas teórica y distribución ajustada es adecuada), si:
muestral.
a  1  Ld 
D  sup F  xi   Fs  xi 
a  2  1i 1 exp 2i 2 d 2 

i 1
D es la máxima distancia entre las
distribuciones acumuladas. Ejemplo: Calcule los parámetros
estadísticos básicos para la siguiente
Se ha probado que: serie de caudales promedio anual. Es
correcto suponer que se ajustan a una
distribución normal?
 
P n  D  d  Ld 

 

Ld   1  2  1 exp  2i 2 d 2
i 1
con
i 1

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

EJEMPLO
-i-
Ejemplo: Calcule los estadísticos básicos para Los estadísticos de la serie de caudales anuales
la siguiente serie de caudales máximos anuales. son los siguientes:
Es correcto suponer que se ajustan a una n  49
distribución
> normal?
Año Q (m 3/s) Año Q (m 3/s) min  8.32 m 3 /s
1960 60,05 1985 8,32
1961 42,98 1986 31,26 max  155.58 m 3 /s
1962 56,66 1987 21,64
1963
1964
61,43
36,83
1988
1989
30,46
38,43
x  45.93 m 3 /s
1965
1966
72,81
39,27
1990
1991
39,47
28,22 s x  28.84 m 3 /s
G1  1.63
1967 42,24 1992 10,44
1968 52,77 1993 19,23
1969 65,48 1994 21,93
1970 45,03 1995 13,15 G2  3.95
1971 67,22 1996 38,63
1972 71,18 1997 11,17 Una fórmula útil para calcular el número de
1973 62,80 1998 25,53 intervalos para hacer el histograma de
frecuencias es la siguiente:
1974 49,52 1999 49,03
1975 53,38 2000 26,96

m  entero.superior1  3  lnn 
1976 72,18 2001 16,04
1977 47,18 2002 22,34
1978 58,91 2003 16,93
1979 155,58 2004 30,94  m  13
1980 41,63 2005 52,43
1981 125,97 2006 93,02
1982 96,51 2007 53,41
1983 21,91 2008 23,21 Hidrología
1984 28,8
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

EJEMPLO
-ii-
160

140

120

100
Q (m3/s)

80

60

40

20

0
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010

Año Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

EJEMPLO
-iii-
Bondad de ajuste – Prueba c2

Teniendo en cuenta que se construirá el histograma con trece (13) intervalos de clase. El valor
mínimo es 8,32 m3/s, y el máximo 155,58 m3/s, entonces el tamaño mínimo del intervalo debe ser
11,33 m3/s.

Se elegirá, por conveniencia, un tamaño del intervalo de clase de 12 m3/s, comenzando por 4 m3/s,
hasta 160 m3/s. Los valores mínimo (8,32 m3/s) y máximo (155,58 m3/s) están, intencionadamente,
cercanos a la marca de clase del primer (10 m3/s) y último intervalo de clase (154 m3/s),
respectivamente.
Intervalos de Clase Frecuencias
ni n ·(f s -P )2 /P
xi x INF x SUP f s (x i ) F (x INF ) F (x SUP ) P (x i )
10 4 16 4 0,0816 0,0730 0,1497 0,0767 0,0155
22 16 28 10 0,2041 0,1497 0,2671 0,1174 3,1366
34 28 40 10 0,2041 0,2671 0,4186 0,1515 0,8948
46 40 52 7 0,1429 0,4186 0,5834 0,1648 0,1433
58 52 64 9 0,1837 0,5834 0,7346 0,1512 0,3424
70 64 76 5 0,1020 0,7346 0,8515 0,1169 0,0927
82 76 88 0 0,0000 0,8515 0,9277 0,0762 3,7352
94 88 100 2 0,0408 0,9277 0,9696 0,0419 0,0014
106 100 112 0 0,0000 0,9696 0,9890 0,0194 0,9516
118 112 124 0 0,0000 0,9890 0,9966 0,0076 0,3718
130 124 136 1 0,0204 0,9966 0,9991 0,0025 6,2894
142 136 148 0 0,0000 0,9991 0,9998 0,0007 0,0340
154 148 160 1 0,0204 0,9998 1,0000 0,0002 123,6987
Hidrología
n 49 c c2 139,7072
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

EJEMPLO
-iv-
Bondad de ajuste – Prueba c2

El estadístico calculado para los datos es


cc2 = 139,71.
0,25

Población
Este valor se compara con el valor de la
distribución para c12,0,952 = 21,03.
0,20
Muestra
0,15

f
Los grados de libertad son m-p+1 = 13-2+1
= 12, y se ha escogido un nivel de
0,10
significancia del 5% (nivel de confianza
95%).
0,05

Dado que cc2 > c12,0,952, la conclusión de la


0,00
prueba de bondad de ajuste es que los 10 22 34 46 58 70 82 94 106 118 130 142 154
datos no se ajustan a la distribución x
normal.

Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

EJEMPLO
-v-
Bondad de ajuste – Prueba KS
Fórmulas de ploteo (Shabri, 2002. A comparison of plotting
Para realizar la prueba de bondad de ajuste formulas for the Pearson Type III distribution. Jurnal
con KS, es necesario asignar probabilidades Teknologi, 36(C), 61–74.
de no excedencia empíricas a los datos
muestrales (ordenados de forma
ascedente).

Para hacer esto, se utilizan lo que se conoce


en la literatura como “fórmulas de ploteo”
(plotting position formulas), las cuales
tienen la siguiente forma:
ia
Pi 
n 1 2  a
Pi = Probabilidad empírica de no excedencia.
i = Orden del dato en el vector ordenado.
n = Tamaño de la muestra.
a = Parámetro, que depende de la
distribución a ajustar.
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

EJEMPLO
-vi-
Bondad de ajuste – Prueba KS
i xi F s (x i ) F (x i ) abs(F s -F ) i xi F s (x i ) F (x i ) abs(F s -F )

Utilizando la fórmula de Weibull, se


1 8,32 0,02 0,0961 0,0761 26 42,24 0,52 0,4492 0,0708
2 10,44 0,04 0,1093 0,0693 27 42,98 0,54 0,4593 0,0807
obtienen los resultados en la tabla. 3 11,17 0,06 0,1140 0,0540 28 45,03 0,56 0,4876 0,0724
4 13,15 0,08 0,1279 0,0479 29 47,18 0,58 0,5174 0,0626
5 16,04 0,10 0,1500 0,0500 30 49,03 0,60 0,5428 0,0572
El valor de D se obtiene como la mayor 6 16,93 0,12 0,1574 0,0374 31 49,52 0,62 0,5495 0,0705
diferencia (en valor absoluto), entre Fs y F. 7 19,23 0,14 0,1772 0,0372 32 52,43 0,64 0,5891 0,0509
8 21,64 0,16 0,1999 0,0399 33 52,77 0,66 0,5937 0,0663
9 21,91 0,18 0,2025 0,0225 34 53,38 0,68 0,6020 0,0780

El valor de es D = 0,0977, Con este valor 10


11
21,93
22,34
0,20
0,22
0,2027
0,2067
0,0027
0,0133
35 53,41
36 56,66
0,70
0,72
0,6023
0,6451
0,0977
0,0749
se calcula d = 491/2·D = 0,6836. 12 23,21 0,24 0,2154 0,0246 37 58,91 0,74 0,6737 0,0663
13 25,53 0,26 0,2397 0,0203 38 60,05 0,76 0,6878 0,0722
14 26,96 0,28 0,2553 0,0247 39 61,43 0,78 0,7046 0,0754
Se calcula ahora el valor de L(d), para i = 15 28,22 0,30 0,2696 0,0304 40 62,80 0,80 0,7207 0,0793
1,2,3 (es suficiente, ya que la convergencia 16 28,80 0,32 0,2763 0,0437 41 65,48 0,82 0,7511 0,0689

es muy rápida):
17 30,46 0,34 0,2958 0,0442 42 67,22 0,84 0,7698 0,0702
18 30,94 0,36 0,3017 0,0583 43 71,18 0,86 0,8093 0,0507
19 31,26 0,38 0,3055 0,0745 44 72,18 0,88 0,8186 0,0614

 

Ld   1  2  1 exp  2i 2 d 2  0.2616
20 36,83 0,40 0,3761 0,0239 45 72,81 0,90 0,8244 0,0756
i 1
21 38,43 0,42 0,3974 0,0226 46 93,02 0,92 0,9488 0,0288
22 38,63 0,44 0,4001 0,0399 47 96,51 0,94 0,9603 0,0203
i 1
23 39,27 0,46 0,4087 0,0513 48 125,97 0,96 0,9972 0,0372
24 39,47 0,48 0,4114 0,0686 49 155,58 0,98 0,9999 0,0199

Ya que a = 0.05 < 1-L(d), entonces no se


25 41,63 0,50 0,4407 0,0593

rechaza la hipótesis nula.


Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil

EJEMPLO
-vii-
1,00
Bondad de ajuste – Prueba KS
0,90

0,80

0,70
D = 0,0977
0,60
F

0,50

0,40

0,30

0,20

0,10 Población
Muestra
0,00
5 50

x
Hidrología

También podría gustarte