Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 3C Estadistica
Clase 3C Estadistica
ESTADÍSTICA EN HIDROLOGÍA
Hidrología
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
CONTENIDO
• Introducción.
• Funciones de frecuencia y de probabilidad.
• Parámetros estadísticos.
• Distribuciones de probabilidad.
• Pruebas de bondad de ajuste.
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
INTRODUCCIÓN
-i-
Los procesos hidrológicos evolucionan en el espacio y en el tiempo de una forma parcialmente
predecible (componente determinística), y de una forma parcialmente incierta (componente
aleatoria).
Se define un proceso estocástico como la evolución de una variable aleatoria en el tiempo. Muchas
variables hidrológicas se modelan como procesos estocásticos.
70
60
P (mm/mes)
50
40
30
20
1980 1985 1990 1995 2000 2005 2010
t (años) Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
INTRODUCCIÓN
-ii-
80
Componente determinística
70
60
P (mm/mes)
80 50
Variable hidrológica 40
70
60 30
P (mm/mes)
50 20
151980 1985 1990 1995 2000 2005 2010
40 Componente aleatoria
t (años)
10
30
5
P (mm/mes)
20
1980 1985 1990 1995 2000 2005 2010 0
t (años)
-5
-10
-15
1980 1985 1990 1995 2000 2005 2010
t (años)
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
INTRODUCCIÓN
-iii-
Cuando no existe correlación entre observaciones adyacentes (esto es, la observación
de un determinado periodo de tiempo no condiciona la observación que se pueda dar
en el periodo inmediatamente posterior), los procesos hidrológicos son tratados como
estocásticos, independiente del tiempo.
0,20
P [X=x ]
de una población (finita o infinita), cuyas 0,16
0,24
n = 10000
x
x Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
Muestra Población
n
j 1 x 0
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
P xi Pxi x X xi
xi xi xi x
P xi f x dx f x dx f x dx
x i x
P xi F xi F xi x
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
PARÁMETROS ESTADÍSTICOS
-i-
Debe tenerse en cuenta que los La varianza está relacionada con el
momentos estadísticos de una variable se segundo momento:
calculan como:
2 E x 2 E x 2 2 x 2
x
E xM M
f x dx 2 E x 2 2 E x 2
2 E x 2 2
La media está relacionada con el primer Para los datos muestrales, la varianza
momento alrededor del origen: muestral es:
Ex x f x dx
n
1
xi x
2
s
2
n 1 i 1
Si se utilizan los datos muestrales, se y se define la desviación típica (o
obtiene el promedio de los valores de la desviación estándar) como la raíz del
muestra: valor anterior:
1 n
x xi Población 2
n i 1
Muestra s s2
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
PARÁMETROS ESTADÍSTICOS
-ii-
La media es una medida de tendencia La curtosis es un parámetro de forma
central de la distribución de los datos. que mide el apuntalamiento de las
distribuciones (la concentración de masa
La varianza (o la desviación estándar) es alrededor de la media).
una medida de dispersión de los datos.
La curtosis tiene un valor de 3 para la
Para medir la simetría de una distribución normal. Una distribución con
distribución, se utiliza el coeficiente de “colas pesadas” tendra un valor 2 > 3,
asimetría u oblicuidad (parámetro de mientras que una distribución muy
forma): concentrada alrededor de la media
tendrá 2 < 3.
Población 1
1
3
E x
3
2
E x
4
3
4
n n 1 3 n 1
3 4
n x x n
xi x
2
n 1 n 2 n 3
n
Muestra G1 i G2
n 2 n 3
n 1 n 2 i 1 s i 1 s
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
PARÁMETROS ESTADÍSTICOS
-iii-
Ejemplo: Verifíquese que los parámetros
estadísticos poblacionales y 2 de la
distribución uniforme:
1
, si a x b
f x b a
0 , en otro caso.
2
b a 2
12
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
DISTRIBUCIONES DE PROBABILIDAD
-i-
La distribución de probabilidad de una variable aleatoria es Uno de los conceptos más importantes de la teoría de
una función que asigna a cada suceso definido sobre la probabilidades es el de variable
variable la probabilidad de que dicho suceso ocurra. La aleatoria que, intuitivamente, puede definirse como
distribución de probabilidad está definida sobre el conjunto cualquier característica medible que
de todos los sucesos y cada uno de los sucesos es el rango toma diferentes valores con probabilidades determinadas.
de valores de la variable aleatoria. También puede decirse Toda variable aleatoria posee una
que tiene una relación estrecha con las distribuciones de
distribución de probabilidad que describe su
frecuencia. De hecho, una distribución de probabilidades
comportamiento. Si la variable es discreta, es
puede comprenderse como una frecuencia teórica, ya que
describe cómo se espera que varíen los resultados. decir, si toma valores aislados dentro de un intervalo, su
distribución de probabilidad
especifica todos los valores posibles de la variable junto
La distribución de probabilidad está completamente
con la probabilidad de que cada uno
especificada por la función de distribución, cuyo valor en
cada x real es la probabilidad de que la variable aleatoria ocurra. En el caso continuo, es decir, cuando la variable
sea menor o igual que x. puede tomar cualquier valor de un
intervalo, la distribución de probabilidad permite
determinar las probabilidades
correspondientes a subintervalos de valores. Una forma
usual de describir la distribución de
probabilidad de una variable aleatoria es mediante la
denominada función de densidad en el
caso de variables continuas y función de masa de
probabilidad en el caso de variables
discretas, en tanto que lo que se conoce como función de
distribución representa las
probabilidades acumuladas
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
DISTRIBUCIONES DE PROBABILIDAD
-ii-
Fuente: Hidrología Aplicada,
Chow, V. T., Maidment, D. R. y
Mays, L. W., p. 383-84.
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
DISTRIBUCIONES DE PROBABILIDAD
-iii-
Fuente: Hidrología Aplicada,
Chow, V. T., Maidment, D. R. y
Mays, L. W., p. 383-84.
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
La bondad del ajuste puede verificarse El valor de cc2 se compara con c2m-p+1,1-a,
comparando los valores teóricos de las donde:
funciones de densidad ajustadas
(probabilidad o acumulada), con los m = Número de intervalos.
valores muestrales de las funciones de
p = Número de parámetros de la
frecuencia (relativa o acumulada).
distribución.
m-p+1 = Grados de libertad.
La prueba Chi-cuadrado utiliza el
a = Nivel de significancia de la prueba.
siguiente estadístico:
1a = Nivel de confianza de la prueba.
n f x Pxi
m 2
c s i
2
Se rechaza la hipótesis nula (H0: la
Pxi
c
i 1 distribución ajustada es adecuada), si:
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
i 1
D es la máxima distancia entre las
distribuciones acumuladas. Ejemplo: Calcule los parámetros
estadísticos básicos para la siguiente
Se ha probado que: serie de caudales promedio anual. Es
correcto suponer que se ajustan a una
distribución normal?
P n D d Ld
Ld 1 2 1 exp 2i 2 d 2
i 1
con
i 1
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
EJEMPLO
-i-
Ejemplo: Calcule los estadísticos básicos para Los estadísticos de la serie de caudales anuales
la siguiente serie de caudales máximos anuales. son los siguientes:
Es correcto suponer que se ajustan a una n 49
distribución
> normal?
Año Q (m 3/s) Año Q (m 3/s) min 8.32 m 3 /s
1960 60,05 1985 8,32
1961 42,98 1986 31,26 max 155.58 m 3 /s
1962 56,66 1987 21,64
1963
1964
61,43
36,83
1988
1989
30,46
38,43
x 45.93 m 3 /s
1965
1966
72,81
39,27
1990
1991
39,47
28,22 s x 28.84 m 3 /s
G1 1.63
1967 42,24 1992 10,44
1968 52,77 1993 19,23
1969 65,48 1994 21,93
1970 45,03 1995 13,15 G2 3.95
1971 67,22 1996 38,63
1972 71,18 1997 11,17 Una fórmula útil para calcular el número de
1973 62,80 1998 25,53 intervalos para hacer el histograma de
frecuencias es la siguiente:
1974 49,52 1999 49,03
1975 53,38 2000 26,96
m entero.superior1 3 lnn
1976 72,18 2001 16,04
1977 47,18 2002 22,34
1978 58,91 2003 16,93
1979 155,58 2004 30,94 m 13
1980 41,63 2005 52,43
1981 125,97 2006 93,02
1982 96,51 2007 53,41
1983 21,91 2008 23,21 Hidrología
1984 28,8
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
EJEMPLO
-ii-
160
140
120
100
Q (m3/s)
80
60
40
20
0
1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
Año Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
EJEMPLO
-iii-
Bondad de ajuste – Prueba c2
Teniendo en cuenta que se construirá el histograma con trece (13) intervalos de clase. El valor
mínimo es 8,32 m3/s, y el máximo 155,58 m3/s, entonces el tamaño mínimo del intervalo debe ser
11,33 m3/s.
Se elegirá, por conveniencia, un tamaño del intervalo de clase de 12 m3/s, comenzando por 4 m3/s,
hasta 160 m3/s. Los valores mínimo (8,32 m3/s) y máximo (155,58 m3/s) están, intencionadamente,
cercanos a la marca de clase del primer (10 m3/s) y último intervalo de clase (154 m3/s),
respectivamente.
Intervalos de Clase Frecuencias
ni n ·(f s -P )2 /P
xi x INF x SUP f s (x i ) F (x INF ) F (x SUP ) P (x i )
10 4 16 4 0,0816 0,0730 0,1497 0,0767 0,0155
22 16 28 10 0,2041 0,1497 0,2671 0,1174 3,1366
34 28 40 10 0,2041 0,2671 0,4186 0,1515 0,8948
46 40 52 7 0,1429 0,4186 0,5834 0,1648 0,1433
58 52 64 9 0,1837 0,5834 0,7346 0,1512 0,3424
70 64 76 5 0,1020 0,7346 0,8515 0,1169 0,0927
82 76 88 0 0,0000 0,8515 0,9277 0,0762 3,7352
94 88 100 2 0,0408 0,9277 0,9696 0,0419 0,0014
106 100 112 0 0,0000 0,9696 0,9890 0,0194 0,9516
118 112 124 0 0,0000 0,9890 0,9966 0,0076 0,3718
130 124 136 1 0,0204 0,9966 0,9991 0,0025 6,2894
142 136 148 0 0,0000 0,9991 0,9998 0,0007 0,0340
154 148 160 1 0,0204 0,9998 1,0000 0,0002 123,6987
Hidrología
n 49 c c2 139,7072
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
EJEMPLO
-iv-
Bondad de ajuste – Prueba c2
Población
Este valor se compara con el valor de la
distribución para c12,0,952 = 21,03.
0,20
Muestra
0,15
f
Los grados de libertad son m-p+1 = 13-2+1
= 12, y se ha escogido un nivel de
0,10
significancia del 5% (nivel de confianza
95%).
0,05
Hidrología
Pontificia Universidad Javeriana
Departamento de Ingeniería Civil
EJEMPLO
-v-
Bondad de ajuste – Prueba KS
Fórmulas de ploteo (Shabri, 2002. A comparison of plotting
Para realizar la prueba de bondad de ajuste formulas for the Pearson Type III distribution. Jurnal
con KS, es necesario asignar probabilidades Teknologi, 36(C), 61–74.
de no excedencia empíricas a los datos
muestrales (ordenados de forma
ascedente).
EJEMPLO
-vi-
Bondad de ajuste – Prueba KS
i xi F s (x i ) F (x i ) abs(F s -F ) i xi F s (x i ) F (x i ) abs(F s -F )
es muy rápida):
17 30,46 0,34 0,2958 0,0442 42 67,22 0,84 0,7698 0,0702
18 30,94 0,36 0,3017 0,0583 43 71,18 0,86 0,8093 0,0507
19 31,26 0,38 0,3055 0,0745 44 72,18 0,88 0,8186 0,0614
Ld 1 2 1 exp 2i 2 d 2 0.2616
20 36,83 0,40 0,3761 0,0239 45 72,81 0,90 0,8244 0,0756
i 1
21 38,43 0,42 0,3974 0,0226 46 93,02 0,92 0,9488 0,0288
22 38,63 0,44 0,4001 0,0399 47 96,51 0,94 0,9603 0,0203
i 1
23 39,27 0,46 0,4087 0,0513 48 125,97 0,96 0,9972 0,0372
24 39,47 0,48 0,4114 0,0686 49 155,58 0,98 0,9999 0,0199
EJEMPLO
-vii-
1,00
Bondad de ajuste – Prueba KS
0,90
0,80
0,70
D = 0,0977
0,60
F
0,50
0,40
0,30
0,20
0,10 Población
Muestra
0,00
5 50
x
Hidrología