P. 1
coeficiente de asimetría

coeficiente de asimetría

|Views: 185|Likes:
Publicado porGina Alexandra

More info:

Published by: Gina Alexandra on Dec 26, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

01/07/2013

pdf

text

original

1 DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGIA

El comportamiento de las variables aleatorias discretas o continuas se describe con la ayuda
de Distribuciones de Probabilidad. La variable se designa por mayúscula y un valor
especifico de ella por minúscula.
Por P(x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente P(a
≤ x ≤ b) denota la probabilidad de que un evento se encuentre en el intervalo (a,b). Si
conocemos la probabilidad P(a ≤ x ≤ b) para todos los valores de a y b, se dice que
conocemos la Distribución de Probabilidades de la variable x.
Si x es un número dado y consideramos la probabilidad P(X ≤ x):
F(x)= P(X ≤ x):
y llamamos F(x) la función de distribución acumulada
Ejemplo
Se tienen las probabilidades de que haya 1, 2, 3, ... etc, días nublados por semana en un
determinado lugar, con ellos calcule la distribución de probabilidades
x P(x) F(x)
0 0.05 0.05
1 0.15 0.20
2 0.25 0.45
3 0.20 0.65
4 0.15 0.80
5 0.10 0.90
6 0.08 0.98
7 0.02 1.00
Total 1.0
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0 1 2 3 4 5 6 7
# dias nublados
f
(
x
)
0.00
0.20
0.40
0.60
0.80
1.00
1.20
0 2 4 6 8
# dias nublados
F
(
x
)
Si se tiene una variable aleatoria continua, la figura presenta el histograma de 85 años de
registro de caudales de crecientes (máximos instantáneos) en el río Magdalena, agrupados
en 9 intervalos de clase.
x P(x) F(x)
1
1 0.05 0.05
2 0.10 0.15
3 0.15 0.30
4 0.20 0.50
5 0.10 0.60
6 0.10 0.70
7 0.15 0.85
8 0.10 0.95
9 0.05 1.00
Total 1.00
0.00
0.05
0.10
0.15
0.20
0.25
1 2 3 4 5 6 7 8 9
Qmáx instántaneo *10² (m³/s)
f
(
x
)
0.00
0.20
0.40
0.60
0.80
1.00
1.20
0 2 4 6 8 10
Qmáx instántaneo *10² (m³/s)
F
(
x
)
Cuando el número de observaciones se incrementa, el tamaño de los intervalos decrece y se
puede tener algo sí
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
1 2 3 4 5 6 7 8 9 10
Qmáx instántaneo *10² (m³/s)
f
(
x
)
0.00
0.20
0.40
0.60
0.80
1.00
1.20
0 5 10 15
Qmáx instántaneo *10² (m³/s)
F
(
x
)
donde f(x) es la llamada función de densidad de probabilidades y tiene las siguientes
características
i)


∞ −
·1 ) ( dx x f
ii)

· ≤ ≤
b
a
dx x f b x a P ) ( ) (
iii) 0 ) ( ·

b
b
dx x f
2
Lo que implica que las probabilidades se definen solo como AREAS bajo la función de
densidad de probabilidad (FDP) entre límites finitos.
1.1 MOMENTOS DE LAS DISTRIBUCIONES
Las propiedades de las distribuciones pueden ser definidas completamente en términos de
los momentos. Los momentos en estadística son similares a los momentos en física
(rotación respecto al origen)


∞ −
· dx x f x M
r r
) ( para la variable continua

·
·
n
j
r r
x f x M
1
) (
para la variable discreta
o respecto a la media (eje de rotación diferente al origen)


∞ −
− · dx x f x M
r r
) ( ) ( µ para la variable continua

·
− ·
n
j
r r
x f x M
1
) ( ) ( µ
para la variable discreta
1.2 PARÁMETROS ESTADISTICOS
Los estadísticos extraen información de una muestra, indicando las características de la
población. Los principales estadísticos son los momentos de primer, segundo y tercer
orden correspondiente a la media, varianza, y asimetría respectivamente.
1.2.1 Media µ:
es el valor esperado de la variable misma . Primer momento respecto a la origen. Muestra
la tendencia central de la distribución


∞ −
· dx x f x ) ( µ
el valor estimado de la media a partir de la muestra es

·
·
n
i
i
x
n
x
1
1
1.2.2 Varianza σ²:
mide la variabilidad de los datos. Es el segundo momento respecto a la media.


∞ −
− · dx x f x ) ( ) (
2 2
µ σ
3
el valor estimado de la varianza a partir de la muestra es

·


·
n
i
i
x x
n
s
1
2 2
) (
1
1
en el cual el divisor es n-1 en lugar de n para asegurar que la estadística de la muestra no
sea sesgada, es decir, que no tenga una tendencia, en promedio, a ser mayor o menor que
el valor verdadero. Las unidades de la varianza son la media al cuadrado, la desviación
estándar σ es una medida de la variabilidad que tiene las mismas dimensiones que la media
y simplemente es la raíz cuadrada de la varianza, se estima por s. El significado de la
desviación estándar se ilustra en la siguiente figura
0.00
0.20
0.40
0.60
0.80
1.00
0 2 4 6 8 10
x
f
(
x
)
0.50 1.00 1.30 2.00
Efectos de la función de densidad de probabilidad causados por cambios en la desviación
estándar.
Coeficiente de variación
µ
σ
· Cv
es una medida adimensional de la variabilidad su
estimado es
x
s
Cv ·
1.2.3 Coeficiente de asimetría γ
la distribución de los valores de una distribución alrededor de la media se mide por la
asimetría. Se obtiene a partir del tercer momento alrededor de la media, dividiéndolo por
el cubo de la desviación estándar para que sea adimensional.


∞ −
− · − dx x f x x E ) ( ) ( ] ) [(
3 3
µ µ tercer momento respecto a la media
] ) `[(
1
3
3
µ
σ
γ − · x E
4
Un estimativo del coeficiente de asimetría está dado por
3
1
3
* ) 2 )( 1 (
) (
s n n
x x n
C
n
i
s
− −

·

·
Ejemplo
Encontrar el valor medio de la precipitación si se tiene
Intervalo (mm) Xi medio
Frecuencia
absoluta
Frecuencia
relativa
x f(x)
100 110 105 10 0.1 10.5
110 120 115 16 0.16 18.4
120 130 125 9 0.09 11.25
130 140 135 10 0.1 13.5
140 150 145 20 0.2 29
150 160 155 15 0.15 23.25
160 170 165 20 0.2 33
Total=100 x = ∑138.9
2 ANALISIS DE FRECUENCIA
El análisis de frecuencia es una herramienta utilizada para, predecir el comportamiento
futuro de los caudales en un sitio de interés, a partir de la información histórica de
caudales. Es un método basado en procedimientos estadísticos que permite calcular la
magnitud del caudal asociado a un período de retorno. Su confiabilidad depende de la
longitud y calidad de la serie histórica, además de la incertidumbre propia de la
distribución de probabilidades seleccionada. Cuando se pretende realizar extrapolaciones,
período de retorno mayor que la longitud de la serie disponible, el error relativo asociado a
la distribución de probabilidades utilizada es más importante, mientras que en
interpolaciones la incertidumbre está asociada principalmente a la calidad de los datos a
modelar; en ambos casos la incertidumbre es alta dependiendo de la cantidad de datos
disponibles (Ashkar, et al. 1994). La extrapolación de frecuencias extremas en una
distribución empírica de crecientes es extremadamente riesgosa (Garcon, 1994).
Para determinar la magnitud de eventos extremos cuando la distribución de probabilidades
no es una función fácilmente invertibles se requiere conocer la variación de la variable
respecto a la media. Chow en 1951 propusó determinar esta variación a partir de un factor
de frecuencia K
T
que puede ser expresado:
σ µ
T T
K X + ·
y se puede estimar a partir de los datos
s K x X
T T
+ ·
5
Para una distribución dada, puede determinarse una relación entre K y el período de retorno
Tr. Esta relación puede expresarse en términos matemáticos o por medio del uso de una
tabla.
El análisis de frecuencia consiste en determinar los parámetros de las distribuciones de
probabilidad y determinar con el factor de frecuencia la magnitud del evento para un
período de retorno dado.
A continuación se describen las principales distribuciones de probabilidad utilizadas en
hidrología, la forma de estimar sus parámetros, el factor de frecuencia y los límites de
confianza. Estos últimos son indicadores de que tanta incertidumbre se tiene con las
extrapolaciones, puesto que determinar el rango de valores donde realmente estaría la
variables, si el rango es muy grande la incertidumbre es muy alta y si es pequeño, por el
contrario, habrá mucha confianza en el valor estimado.
3 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS
3.1 DISTRIBUCION NORMAL
La distribución normal es una distribución simétrica en forma de campana, también
conocida como Campana de Gauss. Aunque muchas veces no se ajusta a los datos
hidrológicos tiene amplia aplicación por ejemplo a los datos transformados que siguen la
distribución normal.
3.1.1 Función de densidad:
La función de densidad está dada por
∞ < < ∞ − ·
− −
x x f
x
2
2
) (
2
1
exp
2
1
) (
σ
µ
π σ
Los dos parámetros de la distribución son la media µ y desviación estándar σ para los
cuales x (media) y s (desviación estándar) son derivados de los datos.
3.1.2 Estimación de parámetros:

·
·
n
i
i
x
n
x
1
1
2
1
1
2
) (
1
1
¹
;
¹
¹
'
¹


·

·
n
i
i
x x
n
s
6
3.1.3 Factor de frecuencia:
1. Si se trabaja con los X sin transformar el K se calcula como
σ
µ −
·
T
T
x
K
este factor es el mismo de la variable normal estándar
) 1 (
1
1
T r T
F K − ·

3.1.4 Limites de confianza:
e Tr
S t X
) 1 ( α −
t
donde α es el nivel de probabilidad ) 1 ( α −
t
es el cuantil de la distribución normal
estandarizada para una probabilidad acumulada de 1-α y S
e
es el error estándar
3.2 DISTRIBUCION LOGNORMAL DE DOS PARAMETROS
Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X
se distribuye normalmente.
Esta distribución es muy usada para el calculo de valores extremos por ejemplo Qmax,
Qmínimos, Pmax, Pmínima (excelentes resultados en Antioquia). Tiene la ventaja que
X>0 y que la transformación Log tiende a reducir la asimetría positiva ya que al sacar
logaritmos se reducen en mayor proporción los datos mayores que los menores.
Limitaciones: tiene solamente dos parámetros, y requiere que los logaritmos de la variables
estén centrados en la media
3.2.1 Función de densidad:
0 exp
2
1
) (
2
) (
2
1
> ·


x
x
x f
y
y
y
σ
µ
π σ
y = ln x
donde, µ
y
: media de los logaritmos de la población (parámetro escalar), estimado
y
σ
y
: Desviación estándar de los logaritmos de la población, estimado s
y
.
7
3.2.2 Estimación de parámetros:

·
·
n
i
i
x
n
y
1
) ln(
1
2
1
2
1
) ) (ln(
1
1
¹
;
¹
¹
'
¹


·

·
n
i
i y
y x
n
s
3.2.3 Factor de frecuencia:
Puede trabajarse en el campo original y en el campo transformado.
2. Campo transformado : Si se trabaja en el campo transformado se trabaja con la media y
la desviación estándar de los logaritmos, así:
Ln(X
Tr
) = x
Tr
+KS
y
de donde,
XT
r
= e
ln (x
Tr
)
con K con variable normal estandarizada para el Tr dado, x
y
media de los logaritmos y S
y
es la desviación estándar de los logaritmos.
3. Campo original : Si se trabaja con los X sin transformar el K se calcula como
Cv
Cv
Cv Ln K Exp
Kt
T
1
2
) 1 ln(
)) 1 ( ( *
2
2
1
2

¹
;
¹
¹
'
¹

,
_

¸
¸ +
− +
·
K es la variable normal estandarizada para el Tr dado,
x
s
Cv · es el coeficiente de
variación, x media de los datos originales y s desviación estándar de los datos originales.
3.2.4 Limites de confianza:
En el campo transformado.
T Tr
S t X Ln
) 1 (
) (
α −
t
8
2
1
2
2
1
) (

,
_

¸
¸
+ · ·
T
y
e
K
n
S
S δ
δ
en donde, n numero de datos, Se error estándar, K
T
variable normal estandarizada.
EJEMPLO: En un río se tienen 30 años de registros de Qmáximos instantáneos anuales
con x= 15 m
3
/s, S = 5 m
3
/s (media y desviación estándar para los datos originales).
x
y
=2.655, s
y
= 0.324 (media y desviación estándar de los datos transformados). Encontrar el
caudal para un periodo de retorno de 100 años y los limites de confianza para un α = 5%.
Calcular la probabilidad de que un caudal de 42.5 m
3
/s no sea igualado o excedido P(Q≤
4.25).
Solución:
n=30
x= 15 m
3
/s x
y
=2.655
s = 5 m
3
/s s
y
= 0.324
En el campo original
Kt
Exp K Ln Cv
Cv
Cv
·
+ −
+ ¸
¸

_
,

¹
'
¹
¹
;
¹
− *( ( ))
ln( )
1
1
2
1
2
1
2
2
x
s
Cv · = 5/15 = 0.33
K = F
-1
(1-1/Tr) = F
-1
(1-1/100) = F
-1
(0.99)
de la tabla de la normal se obtiene KT=2.33
33 . 0
1
2
) 33 . 0 1 ln(
)) 33 . 0 1 ( ( * 33 . 2
2
2
1
2

¹
;
¹
¹
'
¹

,
_

¸
¸ +
− +
·
Ln Exp
K
T
K
T
= 3.06
QTr = 15 + 5 * 3.028
QTr = 30.14 m
3
/s
En el campo transformado se tiene que:
LnQ
Tr100
= 2.655 + 2.33*0.324
9
LnQ
Tr100
= 3.40992
Q
Tr100
= Exp (3.40992)
Q
Tr100
= 30.26 m
3
/s
Limites de confianza
Ln (QTr) t t
(1-α)
Se
2
1
2
2
1
) (

,
_

¸
¸
+ · ·
T
y
e
K
n
S
S δ
δ
δ· +
¸
¸

_
,
1
2 33
2
2
1
2
.
δ = 1.93
Se ·

·
193 0 324
30
011
. .
.
t
(1-α)
= t
(0.95)
= 1.645 (Leído de la tabla de la normal)
Ln(30.28) t (1.645 ) (0.11)
3.41 t 0.18095
[3.22905 3.59095]
[e
3.22905
e
3.59095
]
[25.26 36.29] Intervalos de confianza para Q
Tr100
b) Calcular la probabilidad de que un caudal de 45 m
3
/s no se igualado o excedido P(Q≤
4.25).
Ln(42.5) = 3.75
t = (3.75 - 2.655)/0.324
F(3.38) = 0.9996 Leído de la tabla de la normal
P(Q≤ 4.25) = 99.9%
10
3.3 DISTRIBUCION GUMBEL O EXTREMA TIPO I
Una familia importante de distribuciones usadas en el análisis de frecuencia hidrológico es
la distribución general de valores extremos, la cual ha sido ampliamente utilizada para
representar el comportamiento de crecientes y sequías (máximos y mínimos).
3.3.1 Función de densidad:
1
]
1

¸

,
_

¸
¸ − −

− −
·
α
β
α
β
α
) (
exp
) (
exp
1
) (
x x
x f
En donde α y β son los parámetros de la distribución.
∫ 1
]
1

¸

,
_

¸
¸ −
− − · ·
α
β) (
exp exp ) ( ) (
x
dx x f x F
3.3.2 Estimación de parámetros
α β
π
α
5772 . 0
6
− ·
·
x
s
donde
s y x
son la media y la desviación estándar estimadas con la muestra.
3.3.3 Factor de frecuencia:
¹
¹
¹
;
¹
¹
¹
¹
'
¹
1
]
1

¸

,
_

¸
¸

+ − ·
1
ln ln 5772 . 0
6
r
r
T
T
T
K
π
Donde Tr es el periodo de retorno. Para la distribución Gumbel se tiene que el caudal para
un período de retorno de 2.33 años es igual a la media de los caudales máximos.
3.3.4 Limites de confianza
Xt t t
(1-α)
Se
n
s
Se

·
δ
11
2
1
2
] 1 . 1 1396 . 1 1 [
T T
K K + + · δ
K
T
es el factor de frecuencia y t
(1-α)
es la variable normal estandarizada para una
probabilidad de no excedencia de 1-α.
EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 años de periodo de retorno y
los intervalos de confianza. x= 15 m
3
/s, s = 5 m
3
/s
Q
Tr100
= x + K
T
s
{ } )] 99 ln( 100 ln[ln 577 . 0
6
− + − ·
π
T
K
K
T
= 3.14
Q
Tr100
= 15 + 3.14*5
Q
Tr100
= 30.7 m
3
/s
Intervalos de confianza
t
(1-α)
= t
(0.95)
= 1.645 (Leído de la tabla de la normal)
δ · + + [ . ( . ) . ( . ) ] 1 11396 314 11 314
2
1
2
δ = 3.93
Se
Se m s
·

·
( . ) ( )
. /
393 5
30
358
3
Xt t t
(1-α)
Se
30.7 m
3
/s t (1.64) (3.58)
[24.83 m
3
/s 36.58 m
3
/s] Intervalo de confianza para QTr100
3.4 DISTRIBUCION GAMA DE TRES PARAMETROS O PEARSON TIPO 3
Esta distribución ha sido una de las mas utilizadas en hidrología. Como la mayoría de las
variables hidrológicas son sesgadas, la función Gamma se utiliza para ajustar la
distribución de frecuencia de variables tales como crecientes máximas anuales, Caudales
12
mínimos, Volúmenes de flujo anuales y estacionales, valores de precipitaciones extremas y
volúmenes de lluvia de corta duración. La función de distribución Gamma tiene dos o tres
parámetros.
3.4.1 Función de densidad:
( )

,
_

¸
¸ −

,
_

¸
¸ −
Γ
·

α α β α
β
0
1
0
ˆ
exp
ˆ 1
) (
x x x x
x f
donde,
x
0
≤ x < ∝ para α > 0
∝ < x ≤ x
0
para ∝ < 0
α y β son los parámetros de escala y forma, respectivamente , y x
0
es el parámetro de
localización.
3.4.2 Estimación de parámetros:
β α α β
ˆ
ˆ ;
2
ˆ ;
2
ˆ
0
2
− · ·

,
_

¸
¸
· x x
Cs
s
Cs
Cs es el coeficiente de asimetría,
s y x
son la media y la desviación estándar de la
muestra respectivamente.
3.4.3 Factor de frecuencia:
5 4 3
2
2
3 2
6 3
1
6 6
) 1 (
6
) 6 (
3
1
6
) 1 (

,
_

¸
¸
+

,
_

¸
¸
+

,
_

¸
¸
− −

,
_

¸
¸
− + − + ≈
Cs Cs
z
Cs
z
Cs
z z
Cs
z z K
donde z es la variable normal estandarizada
Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.
3.4.4 Intervalos de confianza:
Xt t t
(1-α)
Se
Se
S
n
·
⋅ δ
13
Donde S es la desviación estándar de la muestra, n es el número de datos y δ se encuentra
tabulado en función de Cs y Tr.
EJEMPLO: Se tiene una estación con 30 años de registros de caudales máximos
instantáneos con Media de 4144 pie
3
/s y desviación estándar de 3311 pie
3
/s. Si el
coeficiente de asimetría de los caudales es de 1.981 pie
3
/s cual es caudal para un periodo de
retorno de 100 años y su intervalo de confianza.
QTr100 = X+ SK
K es F(1.981, 100) de tablas se obtiene K=3.595 (1.9,100) = 3.553
(2.0,100) = 3.605
QTr100 = 4144+ (3.595) (3311)
QTr100 = 16050 pie
3
/s
Intervalos de confianza
Xt t t
(1-α)
Se
Se
S
n
·
⋅ δ
δ = F(1.981,100) de tablas se obtiene δ =8.4922 (1.9,100) = 8.2196
(2.0,100) = 8.5562
Se ·
⋅ ( ) ( . ) 3311 8 4922
30
Se = 5133.56 pie
3
/s
t
(1-α)
= t
(0.95)
= 1.645 (Leído de la tabla de la normal)
16050 t (5133.56) (1.645)
[7605.29 pie
3
/s 24494.71pie
3
/s] Intervalos de confianza para QTr100
3.5 DISTRIBUCION LOG GAMMA O LOGPEARSON DE 3 PARAMETROS
Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución Pearson tipo
III, se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo III.
Esta distribución es ampliamente usada en el mundo para el análisis de frecuencia de
14
Caudales máximos. Esta se trabaja igual que para la Pearson Tipo III pero con X
y
y S
y
como la media y desviación estándar de los logaritmos de la variable original X.
3.5.1 Función de densidad:
( )

,
_

¸
¸ −

,
_

¸
¸ −
Γ
·

α α β α
β
0
1
0
) ln(
exp
) ln( 1
) (
y x y x
x
x f
donde,
y
0
≤ y < ∝ para α > 0
∝ < y ≤ y
0
para ∝ < 0
α y β son los parámetros de escala y forma, respectivamente , y y
0
es el parámetro de
localización.
3.5.2 Estimación de parámetros:
β α α β
ˆ
ˆ ;
2
ˆ ;
2
ˆ
0
2
− · ·

,
_

¸
¸
·
y y
x x
Cs
s
Cs
Cs es el coeficiente de asimetría, , y y
s y x
son la media y la desviación estándar de los
logaritmos de la muestra respectivamente.
3.5.3 Factor de frecuencia:
y y Tr
s K x Y ∗ + · ) ln(

5 4 3
2
2
3 2
6 3
1
6 6
) 1 (
6
) 6 (
3
1
6
) 1 (

,
_

¸
¸
+

,
_

¸
¸
+

,
_

¸
¸
− −

,
_

¸
¸
− + − + ≈
Cs Cs
z
Cs
z
Cs
z z
Cs
z z K
donde z es la variable normal estandarizada
Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra.
3.5.4 Intervalos de confianza:
Xt t t
(1-α)
Se
15
Se
S
n
y
·
⋅ δ
Donde S
y
es la desviación estándar de los logaritmos de la muestra, n es el número de datos
y δ se encuentra tabulado en función de Cs y Tr.
4 AJUSTE DE DISTRIBUCIONES
Para la modelación de caudales máximos se utilizan, entre otras, las distribuciones Log -
Normal, Gumbel y Log-Gumbel principalmente. Para seleccionar la distribución de
probabilidades de la serie histórica se deben tener en cuenta algunas consideraciones.
• Cuando en la serie histórica se observan “outliers
1
” es necesario verificar la
sensibilidad del ajuste debido a la presencia de estos, (Ashkar, et al. 1994)
• Para el ajuste a las distribuciones Log-Normal, Log-Gumbel y Log-Pearson se
requiere transformar la variable al campo logarítmico para modelarla, con lo que se
disminuye la varianza muestral, pero también se filtran las variaciones reales de los
datos.
• Las distribuciones de dos parámetros fijan el valor del coeficiente de asimetría, lo
que en algunos casos puede no ser recomendable. La distribución Log - Normal de
dos parámetros sólo es recomendable sí el coeficiente de asimetría es cercano a
cero. Las distribuciones Gumbel y Log - Gumbel son recomendables si el
coeficiente de asimetría de los eventos registrados es cercano a 1.13
• Para ajustar distribuciones de tres parámetros (Log Normal III, Log Pearson) se
requiere estimar el coeficiente de asimetría de la distribución; para ello es necesario
disponer de una serie con longitud de registros larga, mayor de 50 años, (Kite,
1988). Las distribuciones de dos parámetros son usualmente preferidas cuando se
dispone de pocos datos, porque reducen la varianza de la muestra, (Ashkar, et al.
1994).
• Para seleccionar la distribución de probabilidades adecuada se debe tratar de utilizar
información adicional del proceso hidrológico que permita identificar la forma en
que se distribuye la variable. Usualmente es muy difícil determinar las propiedades
físicas de los procesos hidrológicos para identificar el tipo de distribución de
probabilidad que es aplicable.
• Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la
distribución que mejor se ajusta a los caudales máximos y recomiendan seleccionar
el mejor ajuste a criterio del modelador con la prueba de ajuste gráfico o basado en
el comportamiento de las pruebas estadísticas de bondad del ajuste (por ejemplo Chi
Cuadrado, Smirnov-Kolmogorov, Cramer-Von Mises) en las que se calcula un
1
Aunque no existe una definición generalmente aceptada, se puede entender como valores extremos, muy
superiores a los demás registrados (Ashkar, et al. 1994).
16
estimador y se compara con un valor tabulado para determinar si el ajuste es
adecuado o no. En la prueba de ajuste gráfica se dibujan los valores registrados en
la serie contra la distribución teórica de probabilidades y de manera visual
(subjetiva) se determina si el ajuste es adecuado o no.
Cuando la información es adecuada el análisis de frecuencia es la metodología más
recomendable para la evaluación de eventos extremos, ya que la estimación depende
solamente de los caudales máximos anuales que han ocurrido en la cuenca y no da cuenta
de los procesos de transformación de la precipitación en escorrentía. Obviamente tiene
algunas limitaciones relacionadas con el comportamiento de la serie histórica y con el
tamaño y calidad de los datos de la muestra.
• Cuando se presenten cambios o tendencias en la serie histórica se deben utilizar
técnicas estadísticas que permitan removerlos para poder realizar el análisis de
frecuencias (Kite, 1988; Mamdouh, 1993; Ashkar, et al. 1994).
• La selección inadecuada de la distribución de probabilidades de la serie histórica
arrojará resultados de confiabilidad dudosa, (Ashkar, et al. 1994).
• El tamaño de la muestra influye directamente en la confiabilidad de los resultados,
así a mayor período de retorno del estimativo mayor longitud de registros necesaria
para mejor confiabilidad en los resultados.
El ajuste a distribuciones se puede hacer de dos técnicas, con el factor de frecuencia como
se refirió en el numeral 2 o hallando la distribución empírica de los datos muestrales, por el
método de Plotting Position.
4.1 Plotting Position
Trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. Se han
propuesto numerosos métodos empíricos. Si n es el total de valores y m es el rango de un
valor en una lista ordenada de mayor a menor (m=1 para el valor máximo) la probabilidad
de excedencia se puede obtener por medio de las siguientes expresiones
California
n
m
P ·
Weibull
1 +
·
n
m
P
Hazen
n
m
P
2
1 2 −
·
La expresión más utilizada es la Weibull. Con las anteriores expresiones se halla lo que se
conoce como la distribución empírica de una muestra, esta luego se puede ajustar a una de
las distribuciones teóricas presentadas anteriormente. Los resultados pueden ser dibujados
17
en el papel de probabilidad; este es diseñado para que los datos se ajusten a una línea recta
y se puedan comparar los datos muestrales con la distribución teórica (línea recta).
4.2 Pruebas de Ajuste
Para determinar que tan adecuado es el ajuste de los datos a una distribución de
probabilidades se han propuesto una serie de pruebas estadísticas que determinan si es
adecuado el ajuste. Estos son análisis estadísticos y como tal se deben entender, es decir,
no se puede ignorar el significado físico de los ajustes.
4.2.1 Prueba Smirnov Kolmogorov
El estadístico Smirnov Kolmogorov D considera la desviación de la función de distribución
de probabilidades de la muestra P(x) de la función de probabilidades teórica, escogida
Po(x) tal que
)) ( ) ( max( x Po x P Dn − ·
.
La prueba requiere que el valor Dn calculado con la expresión anterior sea menor que el
valor tabulado Dn para un nivel de probabilidad requerido.
Esta prueba es fácil de realizar y comprende las siguientes etapas:
• El estadístico Dn es la máxima diferencia entre la función de distribución
acumulada de la muestra y la función de distribución acumulada teórica escogida.
• Se fija el nivel de probabilidad α, valores de 0.05 y 0.01 son los más usuales.
• El valor crítico Dα de la prueba debe ser obtenido de tablas en función de α y n.
• Si el valor calculado Dn es mayor que el Dα, la distribución escogida se debe
rechazar.
4.2.2 Prueba Chi Cuadrado
Una medida de las discrepancia entre las frecuencias observadas (f
o
) y las frecuencias
calculadas (f
c
) por medio de una distribución teórica esta dada por el estadístico χ²

·

·
k
i c
c o
f
f f
1
2
2
) (
χ
en donde ∑ ∑
·
c
o
f f
si el estadístico χ²=0 significa que lae distribuciones teórica y empírica ajustan
exactamente, mientras que si el estadístico χ²>0, ellas difieren. La distribución del
estadístico χ² se puede asimilar a una distribución Chi-cuadrado con (k-n-1) grados de
libertad, donde k es el número de intervalos y n es el número de los parámetros de la
distribución teórica. La función χ² se encuentra tabulada. Supongase que una hipótesis Ho
es aceptar que una distribución empírica se ajusta a una distribución Normal. Si el valor
calculado de χ² por la ecuación anterior es mayor que algún valor crítico de χ², con niveles
de significancia α de 0.05 y 0.01 (el nivel de confianza es 1-α) se puede decir que las
frecuencias observadas difieren significativamente de las frecuencias esperadas (o
calculadas) y entonces la hipótesis Ho se rechaza, si ocurre lo contrario entonces se acepta.
18

30 0.20 0.05 0.15 0.00 1.10 0.35 0.10 0.00 f(x) 0.25 F(x) 1.85 0.20 0.40 0.60 0.00 1 2 3 4 5 6 7 8 9 10 Qmáx instántaneo *10² (m³/s) 0 5 10 15 Qmáx instántaneo *10² (m³/s) donde f(x) es la llamada función de densidad de probabilidades y tiene las siguientes características i) ii) iii) ∫ ∫ b ∞ − ∞ f ( x ) d =1 x b a P ( a ≤ x ≤ b) = ∫ f ( x) dx b f ( x ) dx = 0 2 .30 0.00 0.10 0.10 0.20 1.20 0.15 0.10 0.60 0.70 0.15 0.00 f(x) 0. el tamaño de los intervalos decrece y se puede tener algo sí 0.15 0.80 F(x) 0.00 1 2 3 4 5 6 7 8 9 Qmáx instántaneo *10² (m³/s) 0 2 4 6 8 10 Qmáx instántaneo *10² (m³/s) Cuando el número de observaciones se incrementa.60 0.15 0.20 1.05 0.80 0.1 2 3 4 5 6 7 8 9 Total 0.25 0.20 0.50 0.00 0.10 0.00 0.95 1.40 0.20 0.05 1.05 0.05 0.

segundo y tercer orden correspondiente a la media. Muestra la tendencia central de la distribución ∞ µ = ∫ x f ( x) dx −∞ el valor estimado de la media a partir de la muestra es 1 n x = ∑ xi n i =1 1.Lo que implica que las probabilidades se definen solo como AREAS bajo la función de densidad de probabilidad (FDP) entre límites finitos.2.1 MOMENTOS DE LAS DISTRIBUCIONES Las propiedades de las distribuciones pueden ser definidas completamente en términos de los momentos. y asimetría respectivamente. 1. indicando las características de la población.2 Varianza σ²: mide la variabilidad de los datos. Primer momento respecto a la origen. Los momentos en estadística son similares a los momentos en física (rotación respecto al origen) M r = ∫ x r f ( x ) dx para la variable continua −∞ ∞ M r = ∑ x r f ( x ) para la variable discreta j =1 n o respecto a la media (eje de rotación diferente al origen) M r = ∫ ( x − µ) r f ( x ) dx para la variable continua −∞ ∞ M r = ∑( x − µ) r f ( x) para la variable discreta j =1 n 1. Es el segundo momento respecto a la media.2 PARÁMETROS ESTADISTICOS Los estadísticos extraen información de una muestra. Los principales estadísticos son los momentos de primer. ∞ σ 2 = ∫ ( x − µ) 2 f ( x) dx −∞ 3 . varianza.1 Media µ: es el valor esperado de la variable misma . 1.2.

00 0. Coeficiente de variación Cv = µ es una medida adimensional de la variabilidad su estimado es Cv = s x σ 1.30 8 2. a ser mayor o menor que el valor verdadero.2. es decir.60 0.40 0.00 10 Efectos de la función de densidad de probabilidad causados por cambios en la desviación estándar.80 f(x) 0.00 x 6 1.20 0. E[( x − µ) 3 ] = ∫ ( x − µ) 3 f ( x ) dx tercer momento respecto a la media −∞ ∞ γ= 1 E `[( x − µ ) 3 ] 3 σ 4 . que no tenga una tendencia. dividiéndolo por el cubo de la desviación estándar para que sea adimensional. la desviación estándar σ es una medida de la variabilidad que tiene las mismas dimensiones que la media y simplemente es la raíz cuadrada de la varianza. en promedio.3 Coeficiente de asimetría γ la distribución de los valores de una distribución alrededor de la media se mide por la asimetría.50 2 4 1.00 0 0. Las unidades de la varianza son la media al cuadrado. El significado de la desviación estándar se ilustra en la siguiente figura 1. se estima por s. Se obtiene a partir del tercer momento alrededor de la media.el valor estimado de la varianza a partir de la muestra es 1 n s2 = ∑ ( xi − x) 2 n − 1 i =1 en el cual el divisor es n-1 en lugar de n para asegurar que la estadística de la muestra no sea sesgada.

Chow en 1951 propusó determinar esta variación a partir de un factor de frecuencia KT que puede ser expresado: X T = µ + KT σ y se puede estimar a partir de los datos X T = x + KT s 5 . Cuando se pretende realizar extrapolaciones.9 2 ANALISIS DE FRECUENCIA El análisis de frecuencia es una herramienta utilizada para.2 15 0. además de la incertidumbre propia de la distribución de probabilidades seleccionada. Su confiabilidad depende de la longitud y calidad de la serie histórica.25 33 x = ∑138.5 29 23.1 20 0. 1994).1 16 0. el error relativo asociado a la distribución de probabilidades utilizada es más importante.5 18.09 10 0. 1994). Es un método basado en procedimientos estadísticos que permite calcular la magnitud del caudal asociado a un período de retorno.2 Total=100 x f(x) 10. mientras que en interpolaciones la incertidumbre está asociada principalmente a la calidad de los datos a modelar.Un estimativo del coeficiente de asimetría está dado por Cs = n∑ ( x − x) 3 (n − 1)( n − 2) * s 3 i =1 n Ejemplo Encontrar el valor medio de la precipitación si se tiene Intervalo (mm) 100 110 120 130 140 150 160 110 120 130 140 150 160 170 Xi medio 105 115 125 135 145 155 165 Frecuencia Frecuencia absoluta relativa 10 0.25 13. predecir el comportamiento futuro de los caudales en un sitio de interés.15 20 0. La extrapolación de frecuencias extremas en una distribución empírica de crecientes es extremadamente riesgosa (Garcon.16 9 0. Para determinar la magnitud de eventos extremos cuando la distribución de probabilidades no es una función fácilmente invertibles se requiere conocer la variación de la variable respecto a la media. en ambos casos la incertidumbre es alta dependiendo de la cantidad de datos disponibles (Ashkar. a partir de la información histórica de caudales. et al.4 11. período de retorno mayor que la longitud de la serie disponible.

f ( x) = 1 −1 ( x − µ ) 2 2 σ2 3.1. puesto que determinar el rango de valores donde realmente estaría la variables. si el rango es muy grande la incertidumbre es muy alta y si es pequeño.1. la forma de estimar sus parámetros.1 Función de densidad: La función de densidad está dada por exp −∞ < x< ∞ σ 2π Los dos parámetros de la distribución son la media µ y desviación estándar σ para los cuales x (media) y s (desviación estándar) son derivados de los datos. 3. también conocida como Campana de Gauss. Esta relación puede expresarse en términos matemáticos o por medio del uso de una tabla. por el contrario.1 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS DISTRIBUCION NORMAL La distribución normal es una distribución simétrica en forma de campana. El análisis de frecuencia consiste en determinar los parámetros de las distribuciones de probabilidad y determinar con el factor de frecuencia la magnitud del evento para un período de retorno dado. habrá mucha confianza en el valor estimado. 3 3. puede determinarse una relación entre K y el período de retorno Tr. Aunque muchas veces no se ajusta a los datos hidrológicos tiene amplia aplicación por ejemplo a los datos transformados que siguen la distribución normal.2 Estimación de parámetros: x= 1 n ∑ xi n i =1 1  1 n 2 s = ∑( xi − x) 2  n −1 i =1  6 . el factor de frecuencia y los límites de confianza.Para una distribución dada. A continuación se describen las principales distribuciones de probabilidad utilizadas en hidrología. Estos últimos son indicadores de que tanta incertidumbre se tiene con las extrapolaciones.

1 Función de densidad: f ( x) = 1 xσ 2π −1 ( y − µ y ) 2 σ y2 exp x>0 y = ln x donde. Tiene la ventaja que X>0 y que la transformación Log tiende a reducir la asimetría positiva ya que al sacar logaritmos se reducen en mayor proporción los datos mayores que los menores.4 Limites de confianza: X Tr ±t (1− ) S e α donde α es el nivel de probabilidad t(1− ) es el cuantil de la distribución normal α estandarizada para una probabilidad acumulada de 1-α y Se es el error estándar 3. Qmínimos. Esta distribución es muy usada para el calculo de valores extremos por ejemplo Qmax. Si se trabaja con los X sin transformar el K se calcula como xT − µ σ KT = este factor es el mismo de la variable normal estándar KT = F − 1 (1 − T1r) 3. Pmax.3 Factor de frecuencia: 1. y 7 .1. Pmínima (excelentes resultados en Antioquia). µy : media de los logaritmos de la población (parámetro escalar). estimado sy. Limitaciones: tiene solamente dos parámetros.2 DISTRIBUCION LOGNORMAL DE DOS PARAMETROS Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X se distribuye normalmente. y requiere que los logaritmos de la variables estén centrados en la media 3.2.1. estimado σy : Desviación estándar de los logaritmos de la población.3.

Campo transformado: Si se trabaja en el campo transformado se trabaja con la media y la desviación estándar de los logaritmos. xy media de los logaritmos y Sy es la desviación estándar de los logaritmos.3. Cv = s es el coeficiente de x variación. L ( X Tr ) ±t (1− ) ST n α 8 . x media de los datos originales y s desviación estándar de los datos originales. así: Ln(XTr) = xTr+KSy de donde.2. Campo original: Si se trabaja con los X sin transformar el K se calcula como 1   ln(1 + Cv 2 )   − 1 Exp K T * ( Ln (1 + Cv 2 )) 2 −    2    Kt = Cv K es la variable normal estandarizada para el Tr dado. XTr = eln (xTr) con K con variable normal estandarizada para el Tr dado.2 Estimación de parámetros: y= 1 n ∑ln( xi ) n i =1 1  1 n 2 sy =  ∑(ln( xi ) − y ) 2  n −1 i =1  3. 3. 2.2.4 Limites de confianza: En el campo transformado. 3.2.3 Factor de frecuencia: Puede trabajarse en el campo original y en el campo transformado.

Calcular la probabilidad de que un caudal de 42.5 m3/s no sea igualado o excedido P(Q≤ 4.33*0.33 2 )   −1 Exp 2. KT variable normal estandarizada.028 QTr = 30.33 x K = F-1(1-1/Tr) = F-1(1-1/100) = F-1(0. n numero de datos. Solución: n=30 x= 15 m3/s s = 5 m3/s En el campo original 1   ln(1 + Cv 2 )   2 2 Exp K * ( Ln(1 + Cv )) −   −1 2    Kt = Cv xy=2.06 QTr = 15 + 5 * 3.33 * ( Ln (1 + 0.33 1   ln(1 + 0.324 (media y desviación estándar de los datos transformados).25). Se error estándar.Se = (δ S y ) n  K 2 2 δ = 1 + T   2    1 en donde.324 9 . EJEMPLO: En un río se tienen 30 años de registros de Qmáximos instantáneos anuales con x= 15 m3/s.655.99) de la tabla de la normal se obtiene KT=2.324 Cv = s = 5/15 = 0.33 2 )) 2 −    2    KT = 0. sy = 0.655 + 2. xy=2.14 m3/s En el campo transformado se tiene que: LnQTr100 = 2. S = 5 m3/s (media y desviación estándar para los datos originales). Encontrar el caudal para un periodo de retorno de 100 años y los limites de confianza para un α = 5%.655 sy = 0.33 KT = 3.

9% 10 .93 ⋅ 0.11) 3.59095] 36.LnQTr100 = 3.75 t = (3.22905 [25.26 m3/s Limites de confianza Ln (QTr) ± t(1-α) Se Se = (δ S y ) 2  K δ = 1 + T  2 n  1 2    1  2.33 2  2 δ = 1 +  2   δ = 1.59095] e3.41 ± 0.29] Intervalos de confianza para QTr100 b) Calcular la probabilidad de que un caudal de 45 m3/s no se igualado o excedido P(Q≤ 4.28) ± (1.93 Se = 1.25).25) = 99.75 .645 (Leído de la tabla de la normal) Ln(30.645 ) (0.5) = 3.38) = 0. Ln(42.40992 QTr100 = Exp (3.18095 [3.655)/0.40992) Q Tr100 = 30.324 30 = 0.9996 Leído de la tabla de la normal P(Q≤ 4.11 t(1-α) = t(0.324 F(3.22905 [e3.2.95) = 1.26 3.

Para la distribución Gumbel se tiene que el caudal para un período de retorno de 2. 3.3.5772 α donde x y s son la media y la desviación estándar estimadas con la muestra.3. 3. la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y sequías (máximos y mínimos).3.5772 + ln ln  T − 1    π    r     Donde Tr es el periodo de retorno.   ( x − β )  F ( x ) = ∫ f ( x )dx = exp − exp  −  α     3.3 Factor de frecuencia: KT = −   Tr    6   0.3 DISTRIBUCION GUMBEL O EXTREMA TIPO I Una familia importante de distribuciones usadas en el análisis de frecuencia hidrológico es la distribución general de valores extremos.1 Función de densidad: f ( x) = − (x − β ) 1  − ( x − β )  exp  − exp   α α α    En donde α y β son los parámetros de la distribución.4 Limites de confianza Xt ± t(1-α) Se Se = δ⋅ s n 11 .33 años es igual a la media de los caudales máximos. 3.3.3.2 Estimación de parámetros α= 6 π s β = x −0.

4 DISTRIBUCION GAMA DE TRES PARAMETROS O PEARSON TIPO 3 Esta distribución ha sido una de las mas utilizadas en hidrología. .645 (Leído de la tabla de la normal) 1 δ = [1 +11396 (314 ) +11 (314 ) 2 ] 2 . δ = 3.7 m3/s ± (1.83 m3/s 36.7 m3/s Intervalos de confianza t(1-α) = t(0.58 m 3 / s Xt ± t(1-α) Se 30. Caudales 12 . Como la mayoría de las variables hidrológicas son sesgadas.14*5 QTr100 = 30. s = 5 m3/s QTr100 = x + KT s KT = − 6 π {0.14 QTr100 = 15 + 3.58 m3/s] Intervalo de confianza para QTr100 3.93 Se = (3.64) (3.δ = [1 + 1.1396KT + 1.93 ) ⋅ (5) 30 Se = 3. . EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 años de periodo de retorno y los intervalos de confianza. x= 15 m3/s.95) = 1. .1KT ] 1 2 2 KT es el factor de frecuencia y t(1-α) es la variable normal estandarizada para una probabilidad de no excedencia de 1-α. la función Gamma se utiliza para ajustar la distribución de frecuencia de variables tales como crecientes máximas anuales.577 + ln[ln 100 − ln( 99 )]} KT = 3.58) [24.

4.2 Estimación de parámetros: 2 ˆ  2  β =  . muestra respectivamente. La función de distribución Gamma tiene dos o tres parámetros. 3.4. Volúmenes de flujo anuales y estacionales. 3. x0 ≤ x < ∝ para α > 0 ∝ < x ≤ x0 para ∝ < 0 α y β son los parámetros de escala y forma. valores de precipitaciones extremas y volúmenes de lluvia de corta duración.3 Factor de frecuencia: Cs 1 3  Cs   Cs   Cs  1  Cs  2 K ≈ z + ( z −1) + ( z − 6 z )  − ( z −1)  + z  +   6 3  6   6   6  3 6  2 2 3 4 5 donde z es la variable normal estandarizada Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra. 2 ˆ x0 = x −α β ˆ x y s Cs es el coeficiente de asimetría. y x 0 es el parámetro de localización. son la media y la desviación estándar de la 3. 3.  Cs  α =s ˆ Cs .4. respectivamente .mínimos.1 Función de densidad: 1  x − x0  ˆ f ( x) =   α Γ( β )  α  β −1  x − x0  ˆ exp  −  α   donde.4 Intervalos de confianza: Xt ± t(1-α) Se Se = δ ⋅S n 13 .4.

553 (2.100) = 3.981.2196 (2.645 (Leído de la tabla de la normal) 16050 ± (5133.Donde S es la desviación estándar de la muestra. 100) de tablas se obtiene K=3.645) [7605.4922 ) 30 de tablas se obtiene δ =8.56) (1.595) (3311) QTr100 = 16050 pie3/s Intervalos de confianza Xt ± t(1-α) Se Se = δ ⋅S n δ = F(1.71pie3/s] Intervalos de confianza para QTr100 3.5562 Se = Se = 5133.100) ( 3311 ) ⋅ (8. Esta distribución es ampliamente usada en el mundo para el análisis de frecuencia de 14 .9.5 DISTRIBUCION LOG GAMMA O LOGPEARSON DE 3 PARAMETROS Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución Pearson tipo III.95) = 1. EJEMPLO: Se tiene una estación con 30 años de registros de caudales máximos instantáneos con Media de 4144 pie3/s y desviación estándar de 3311 pie3/s.981.605 QTr100 = 4144+ (3. QTr100 = X+ SK K es F(1.100) = 3.0.29 pie3/s 24494.56 pie3/s t(1-α) = t(0.100) = 8.595 (1.100) = 8. Si el coeficiente de asimetría de los caudales es de 1.981 pie3/s cual es caudal para un periodo de retorno de 100 años y su intervalo de confianza. se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo III.4922 (1.0.9. n es el número de datos y δ se encuentra tabulado en función de Cs y Tr.

respectivamente . 3.2 Estimación de parámetros: ˆ  2  β =  .3 Factor de frecuencia: ln( YTr ) = x y + K ∗s y K ≈ z + ( z 2 −1) donde z es la variable normal estandarizada Cs 1 3  Cs   Cs   Cs  1  Cs  2 + ( z − 6 z )  − ( z −1)  + z  +   6 3  6   6   6  3 6  2 3 4 5 Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra. x y y s y son la media y la desviación estándar de los logaritmos de la muestra respectivamente.5. 3. . y y 0 es el parámetro de localización.1 Función de densidad: f ( x) = 1  ln( x ) − y0    x α Γ( β )  α  β −1  ln( x ) − y0  exp  −  α   donde. Esta se trabaja igual que para la Pearson Tipo III pero con Xy y Sy como la media y desviación estándar de los logaritmos de la variable original X.5.5. 3. 2 ˆ x0 = x y −α β ˆ Cs es el coeficiente de asimetría.  Cs  2 α = sy ˆ Cs . y0 ≤ y < ∝ para α > 0 ∝ < y ≤ y0 para ∝ < 0 α y β son los parámetros de escala y forma.5.Caudales máximos. 3.4 Intervalos de confianza: Xt ± t(1-α) Se 15 .

muy superiores a los demás registrados (Ashkar. 1988). et al. entre otras. Usualmente es muy difícil determinar las propiedades físicas de los procesos hidrológicos para identificar el tipo de distribución de probabilidad que es aplicable. Smirnov-Kolmogorov. Log-Gumbel y Log-Pearson se requiere transformar la variable al campo logarítmico para modelarla. para ello es necesario disponer de una serie con longitud de registros larga. se puede entender como valores extremos. Para seleccionar la distribución de probabilidades de la serie histórica se deben tener en cuenta algunas consideraciones. porque reducen la varianza de la muestra. mayor de 50 años. Log Pearson) se requiere estimar el coeficiente de asimetría de la distribución. con lo que se disminuye la varianza muestral. pero también se filtran las variaciones reales de los datos.Normal de dos parámetros sólo es recomendable sí el coeficiente de asimetría es cercano a cero. las distribuciones Log Normal. Cramer-Von Mises) en las que se calcula un • • • • Aunque no existe una definición generalmente aceptada. et al. Gumbel y Log-Gumbel principalmente. Las distribuciones Gumbel y Log .13 Para ajustar distribuciones de tres parámetros (Log Normal III. 1994) Para el ajuste a las distribuciones Log-Normal. Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la distribución que mejor se ajusta a los caudales máximos y recomiendan seleccionar el mejor ajuste a criterio del modelador con la prueba de ajuste gráfico o basado en el comportamiento de las pruebas estadísticas de bondad del ajuste (por ejemplo Chi Cuadrado. (Ashkar. La distribución Log . 1994). 4 AJUSTE DE DISTRIBUCIONES Para la modelación de caudales máximos se utilizan. (Kite.Gumbel son recomendables si el coeficiente de asimetría de los eventos registrados es cercano a 1. 1 16 . (Ashkar. Para seleccionar la distribución de probabilidades adecuada se debe tratar de utilizar información adicional del proceso hidrológico que permita identificar la forma en que se distribuye la variable. n es el número de datos y δ se encuentra tabulado en función de Cs y Tr. Las distribuciones de dos parámetros son usualmente preferidas cuando se dispone de pocos datos. 1994). • • Cuando en la serie histórica se observan “outliers1” es necesario verificar la sensibilidad del ajuste debido a la presencia de estos. Las distribuciones de dos parámetros fijan el valor del coeficiente de asimetría.Se = δ ⋅S y n Donde Sy es la desviación estándar de los logaritmos de la muestra. lo que en algunos casos puede no ser recomendable. et al.

Con las anteriores expresiones se halla lo que se conoce como la distribución empírica de una muestra. 1993. 1994). En la prueba de ajuste gráfica se dibujan los valores registrados en la serie contra la distribución teórica de probabilidades y de manera visual (subjetiva) se determina si el ajuste es adecuado o no. ya que la estimación depende solamente de los caudales máximos anuales que han ocurrido en la cuenca y no da cuenta de los procesos de transformación de la precipitación en escorrentía. Los resultados pueden ser dibujados 17 . Mamdouh. La selección inadecuada de la distribución de probabilidades de la serie histórica arrojará resultados de confiabilidad dudosa. • • El ajuste a distribuciones se puede hacer de dos técnicas. El tamaño de la muestra influye directamente en la confiabilidad de los resultados. Obviamente tiene algunas limitaciones relacionadas con el comportamiento de la serie histórica y con el tamaño y calidad de los datos de la muestra. 1988. et al. Se han propuesto numerosos métodos empíricos. (Ashkar. esta luego se puede ajustar a una de las distribuciones teóricas presentadas anteriormente. Ashkar. Si n es el total de valores y m es el rango de un valor en una lista ordenada de mayor a menor (m=1 para el valor máximo) la probabilidad de excedencia se puede obtener por medio de las siguientes expresiones California Weibull Hazen P= m n m n +1 2m −1 2n P= P= La expresión más utilizada es la Weibull. por el método de Plotting Position. Cuando la información es adecuada el análisis de frecuencia es la metodología más recomendable para la evaluación de eventos extremos. con el factor de frecuencia como se refirió en el numeral 2 o hallando la distribución empírica de los datos muestrales. 1994).1 Plotting Position Trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. 4. así a mayor período de retorno del estimativo mayor longitud de registros necesaria para mejor confiabilidad en los resultados. et al. • Cuando se presenten cambios o tendencias en la serie histórica se deben utilizar técnicas estadísticas que permitan removerlos para poder realizar el análisis de frecuencias (Kite.estimador y se compara con un valor tabulado para determinar si el ajuste es adecuado o no.

valores de 0.05 y 0.01 son los más usuales. ellas difieren. • Si el valor calculado Dn es mayor que el Dα.2 Pruebas de Ajuste Para determinar que tan adecuado es el ajuste de los datos a una distribución de probabilidades se han propuesto una serie de pruebas estadísticas que determinan si es adecuado el ajuste.01 (el nivel de confianza es 1-α) se puede decir que las frecuencias observadas difieren significativamente de las frecuencias esperadas (o calculadas) y entonces la hipótesis Ho se rechaza. la distribución escogida se debe rechazar.2. Supongase que una hipótesis Ho es aceptar que una distribución empírica se ajusta a una distribución Normal. es decir. con niveles de significancia α de 0. La distribución del estadístico χ² se puede asimilar a una distribución Chi-cuadrado con (k-n-1) grados de libertad. 4.2. no se puede ignorar el significado físico de los ajustes.en el papel de probabilidad. La prueba requiere que el valor Dn calculado con la expresión anterior sea menor que el valor tabulado Dn para un nivel de probabilidad requerido. mientras que si el estadístico χ²>0. Estos son análisis estadísticos y como tal se deben entender. 18 . Si el valor calculado de χ² por la ecuación anterior es mayor que algún valor crítico de χ². 4. donde k es el número de intervalos y n es el número de los parámetros de la distribución teórica. escogida Po(x) tal que Dn = max( P ( x) − Po ( x)) . La función χ² se encuentra tabulada.2 Prueba Chi Cuadrado Una medida de las discrepancia entre las frecuencias observadas (fo) y las frecuencias calculadas (fc) por medio de una distribución teórica esta dada por el estadístico χ² k ( f − fc )2 χ2 = ∑ o en donde ∑f o = ∑f c fc i =1 si el estadístico χ²=0 significa que lae distribuciones teórica y empírica ajustan exactamente. si ocurre lo contrario entonces se acepta. • Se fija el nivel de probabilidad α. 4. • El valor crítico Dα de la prueba debe ser obtenido de tablas en función de α y n.05 y 0. este es diseñado para que los datos se ajusten a una línea recta y se puedan comparar los datos muestrales con la distribución teórica (línea recta). Esta prueba es fácil de realizar y comprende las siguientes etapas: • El estadístico Dn es la máxima diferencia entre la función de distribución acumulada de la muestra y la función de distribución acumulada teórica escogida.1 Prueba Smirnov Kolmogorov El estadístico Smirnov Kolmogorov D considera la desviación de la función de distribución de probabilidades de la muestra P(x) de la función de probabilidades teórica.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->