P. 1
Estadistica valores extremos. arth.

Estadistica valores extremos. arth.

|Views: 494|Likes:

More info:

Published by: Luis Arturo Jara Bardales on Apr 07, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

04/18/2013

pdf

text

original

1

DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGIA

El comportamiento de las variables aleatorias discretas o continuas se describe con la ayuda de Distribuciones de Probabilidad. La variable se designa por mayúscula y un valor especifico de ella por minúscula. Por P(x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente P(a ≤ x ≤ b) denota la probabilidad de que un evento se encuentre en el intervalo (a,b). Si conocemos la probabilidad P(a ≤ x ≤ b) para todos los valores de a y b, se dice que conocemos la Distribución de Probabilidades de la variable x. Si x es un número dado y consideramos la probabilidad P(X ≤ x): F(x)= P(X ≤ x): y llamamos F(x) la función de distribución acumulada Ejemplo Se tienen las probabilidades de que haya 1, 2, 3, ... etc, días nublados por semana en un determinado lugar, con ellos calcule la distribución de probabilidades x 0 1 2 3 4 5 6 7 Total
0.30 0.25 0.20 0.15 0.10 0.05 0.00 0 1 2 3 4 5 6 7 # dias nublados
F(x)

P(x) 0.05 0.15 0.25 0.20 0.15 0.10 0.08 0.02 1.0
1.20 1.00 0.80 0.60 0.40 0.20 0.00 0

F(x) 0.05 0.20 0.45 0.65 0.80 0.90 0.98 1.00

f(x)

2

4 # dias nublados

6

8

Si se tiene una variable aleatoria continua, la figura presenta el histograma de 85 años de registro de caudales de crecientes (máximos instantáneos) en el río Magdalena, agrupados en 9 intervalos de clase.

1

00 1 2 3 4 5 6 7 8 9 10 Qmáx instántaneo *10² (m³/s) 1.35 0.95 1.10 0.20 1.05 1.15 0.10 0.05 0.40 0.00 0.20 0.00 f(x) 0.15 0.15 0.60 0.10 0.60 0.05 0.10 0.25 F(x) f(x) 0.85 0.25 0.05 0.10 0.00 1.70 0.00 0.20 0. el tamaño de los intervalos decrece y se puede tener algo sí 0.05 0.60 0.30 0.10 0.15 0.40 0.x 1 2 3 4 5 6 7 8 9 Total 0.20 0.20 P(x) 0.80 F(x) 0.30 0.80 0.00 F(x) 0.20 0.50 0.00 0 5 10 15 Qmáx instántaneo *10² (m³/s) donde f(x) es la llamada función de densidad de probabilidades y tiene las siguientes características i) ∫ ∞ −∞ f ( x)dx = 1 2 .20 1.00 1 2 3 4 5 6 7 8 9 Qmáx instántaneo *10² (m³/s) 0 2 4 6 8 10 Qmáx instántaneo *10² (m³/s) Cuando el número de observaciones se incrementa.15 0.

2 PARÁMETROS ESTADISTICOS Los estadísticos extraen información de una muestra. segundo y tercer orden correspondiente a la media. Los principales estadísticos son los momentos de primer. varianza. indicando las características de la población. 1.1 Media μ: es el valor esperado de la variable misma . y asimetría respectivamente. 1.ii) iii) P (a ≤ x ≤ b) = ∫ f ( x)dx a b ∫ b b f ( x)dx = 0 Lo que implica que las probabilidades se definen solo como AREAS bajo la función de densidad de probabilidad (FDP) entre límites finitos.1 MOMENTOS DE LAS DISTRIBUCIONES Las propiedades de las distribuciones pueden ser definidas completamente en términos de los momentos.2. Los momentos en estadística son similares a los momentos en física (rotación respecto al origen) M r = ∫ x r f ( x)dx para la variable continua −∞ ∞ M r = ∑ x r f ( x) para la variable discreta j =1 n o respecto a la media (eje de rotación diferente al origen) M r = ∫ ( x − μ ) r f ( x)dx para la variable continua −∞ ∞ M r = ∑ ( x − μ ) r f ( x) para la variable discreta j =1 n 1. Primer momento respecto a la origen. Muestra la tendencia central de la distribución ∞ μ = ∫ x f ( x)dx −∞ el valor estimado de la media a partir de la muestra es 1 n x = ∑ xi n i =1 3 .

que no tenga una tendencia.80 f(x) 0.00 0.30 8 2. σ 2 = ∫ ( x − μ ) 2 f ( x)dx −∞ ∞ el valor estimado de la varianza a partir de la muestra es 1 n s2 = ∑ ( xi − x) 2 n − 1 i =1 en el cual el divisor es n-1 en lugar de n para asegurar que la estadística de la muestra no sea sesgada. Coeficiente de variación Cv = estimado es Cv = σ es una medida adimensional de la variabilidad su μ s x 4 .20 0.1. Es el segundo momento respecto a la media.50 2 4 x 1. a ser mayor o menor que el valor verdadero.2.2 Varianza σ²: mide la variabilidad de los datos.00 10 Efectos de la función de densidad de probabilidad causados por cambios en la desviación estándar. es decir.00 0 0. El significado de la desviación estándar se ilustra en la siguiente figura 1.40 0. en promedio. la desviación estándar σ es una medida de la variabilidad que tiene las mismas dimensiones que la media y simplemente es la raíz cuadrada de la varianza.60 0.00 6 1. se estima por s. Las unidades de la varianza son la media al cuadrado.

1994). Es un método basado en procedimientos estadísticos que permite calcular la magnitud del caudal asociado a un período de retorno. 5 . et al.09 10 0. en ambos casos la incertidumbre es alta dependiendo de la cantidad de datos disponibles (Ashkar. 1994). el error relativo asociado a la distribución de probabilidades utilizada es más importante. mientras que en interpolaciones la incertidumbre está asociada principalmente a la calidad de los datos a modelar. dividiéndolo por el cubo de la desviación estándar para que sea adimensional.25 13.9 2 ANALISIS DE FRECUENCIA El análisis de frecuencia es una herramienta utilizada para. Cuando se pretende realizar extrapolaciones.25 33 x = ∑138.1 16 0. además de la incertidumbre propia de la distribución de probabilidades seleccionada.2. predecir el comportamiento futuro de los caudales en un sitio de interés.1 20 0. Su confiabilidad depende de la longitud y calidad de la serie histórica. Se obtiene a partir del tercer momento alrededor de la media.15 20 0.16 9 0.5 29 23.3 Coeficiente de asimetría γ la distribución de los valores de una distribución alrededor de la media se mide por la asimetría. a partir de la información histórica de caudales. período de retorno mayor que la longitud de la serie disponible. E[( x − μ ) 3 ] = ∫ ( x − μ ) 3 f ( x)dx −∞ ∞ tercer momento respecto a la media γ= 1 σ3 E `[( x − μ ) 3 ] n∑ ( x − x)3 n Un estimativo del coeficiente de asimetría está dado por C s = (n − 1)(n − 2) * s 3 i =1 Ejemplo Encontrar el valor medio de la precipitación si se tiene Intervalo (mm) 100 110 120 130 140 150 160 110 120 130 140 150 160 170 Xi medio 105 115 125 135 145 155 165 Frecuencia Frecuencia absoluta relativa 10 0. La extrapolación de frecuencias extremas en una distribución empírica de crecientes es extremadamente riesgosa (Garcon.1.5 18.4 11.2 15 0.2 Total=100 x f(x) 10.

puesto que determinar el rango de valores donde realmente estaría la variables.1 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS DISTRIBUCION NORMAL La distribución normal es una distribución simétrica en forma de campana. El análisis de frecuencia consiste en determinar los parámetros de las distribuciones de probabilidad y determinar con el factor de frecuencia la magnitud del evento para un período de retorno dado.1. A continuación se describen las principales distribuciones de probabilidad utilizadas en hidrología.1 Función de densidad: La función de densidad está dada por f ( x) = 1 exp −1 ( x − μ ) 2 2 σ2 σ 2π −∞ < x < ∞ 6 . también conocida como Campana de Gauss. Estos últimos son indicadores de que tanta incertidumbre se tiene con las extrapolaciones. Aunque muchas veces no se ajusta a los datos hidrológicos tiene amplia aplicación por ejemplo a los datos transformados que siguen la distribución normal. Esta relación puede expresarse en términos matemáticos o por medio del uso de una tabla. si el rango es muy grande la incertidumbre es muy alta y si es pequeño.Para determinar la magnitud de eventos extremos cuando la distribución de probabilidades no es una función fácilmente invertibles se requiere conocer la variación de la variable respecto a la media. Chow en 1951 propusó determinar esta variación a partir de un factor de frecuencia KT que puede ser expresado: X T = μ + KT σ y se puede estimar a partir de los datos X T = x + KT s Para una distribución dada. 3. el factor de frecuencia y los límites de confianza. habrá mucha confianza en el valor estimado. la forma de estimar sus parámetros. por el contrario. puede determinarse una relación entre K y el período de retorno Tr. 3 3.

4 Limites de confianza: X Tr ± t(1−α ) S e donde α es el nivel de probabilidad t(1−α ) es el cuantil de la distribución normal estandarizada para una probabilidad acumulada de 1-α y Se es el error estándar 3.2 DISTRIBUCION LOGNORMAL DE DOS PARAMETROS Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se dice que X se distribuye normalmente. Pmínima (excelentes resultados en Antioquia). Esta distribución es muy usada para el calculo de valores extremos por ejemplo Qmax. 7 .1. Qmínimos. Tiene la ventaja que X>0 y que la transformación Log tiende a reducir la asimetría positiva ya que al sacar logaritmos se reducen en mayor proporción los datos mayores que los menores. Pmax.Los dos parámetros de la distribución son la media μ y desviación estándar σ para los cuales x (media) y s (desviación estándar) son derivados de los datos.1. 3.3 Factor de frecuencia: 1.2 Estimación de parámetros: x= 1 n ∑ xi n i =1 1 ⎧ 1 n ⎫2 s=⎨ ∑ ( xi − x) 2 ⎬ ⎩ n − 1 i =1 ⎭ 3. Si se trabaja con los X sin transformar el K se calcula como KT = xT − μ σ 1 este factor es el mismo de la variable normal estándar K T = F −1 (1 − Tr ) 3.1.

XTr = eln (xTr) con K con variable normal estandarizada para el Tr dado. μy : media de los logaritmos de la población (parámetro escalar).3 Factor de frecuencia: Puede trabajarse en el campo original y en el campo transformado.2. Campo original: Si se trabaja con los X sin transformar el K se calcula como 8 . 3. 2. estimado y σy : Desviación estándar de los logaritmos de la población. estimado sy.1 Función de densidad: f ( x) = 1 xσ 2π exp −1 ( y − μ y ) 2 σ y2 x>0 y = ln x donde.2.2 Estimación de parámetros: y= 1 n ∑ ln( xi ) n i =1 1 ⎧ 1 n ⎫2 sy = ⎨ ∑ (ln( xi ) − y) 2 ⎬ ⎩ n − 1 i =1 ⎭ 3. xy media de los logaritmos y Sy es la desviación estándar de los logaritmos. Campo transformado: Si se trabaja en el campo transformado se trabaja con la media y la desviación estándar de los logaritmos. y requiere que los logaritmos de la variables estén centrados en la media 3. así: Ln(XTr) = xTr+KSy de donde.Limitaciones: tiene solamente dos parámetros. 3.2.

655. Se error estándar. Ln( X Tr ) ± t(1−α ) ST Se = (δ S y ) n ⎛ K 2 ⎞2 δ = ⎜1 + T ⎟ ⎜ 2 ⎟ ⎝ ⎠ 1 en donde. Encontrar el caudal para un periodo de retorno de 100 años y los limites de confianza para un α = 5%. Solución: n=30 x= 15 m3/s s = 5 m3/s En el campo original 1 ⎧ ⎛ ln(1 + Cv 2 ) ⎞ ⎫ Exp ⎨K * ( Ln(1 + Cv 2 )) 2 − ⎜ ⎟⎬ −1 2 ⎝ ⎠⎭ ⎩ Kt = Cv xy=2. S = 5 m3/s (media y desviación estándar para los datos originales).324 9 . K es la variable normal estandarizada para el Tr dado. x media de los datos originales y s desviación estándar de los datos originales.25).324 (media y desviación estándar de los datos transformados). EJEMPLO: En un río se tienen 30 años de registros de Qmáximos instantáneos anuales con x= 15 m3/s. n numero de datos.2.4 Limites de confianza: En el campo transformado.655 sy = 0. xy=2.1 ⎧ ⎛ ln(1 + Cv 2 ) ⎞⎫ ⎟⎬ − 1 Exp ⎨ K T * ( Ln(1 + Cv 2 )) 2 − ⎜ ⎜ ⎟ 2 ⎝ ⎠⎭ ⎩ Kt = Cv s es el coeficiente de x variación. Cv = 3. sy = 0. Calcular la probabilidad de que un caudal de 42. KT variable normal estandarizada.5 m3/s no sea igualado o excedido P(Q≤ 4.

645 (Leído de la tabla de la normal) 10 .99) de la tabla de la normal se obtiene KT=2.33 x K = F-1(1-1/Tr) = F-1(1-1/100) = F-1(0.655 + 2.14 m3/s En el campo transformado se tiene que: LnQTr100 = 2.Cv = s = 5/15 = 0.324 .332 ) ⎞⎫ 2 2 ⎟⎬ − 1 Exp ⎨2.95) = 1.33 * ( Ln(1 + 0.332 ⎞ 2 δ = ⎜1 + ⎟ 2 ⎠ ⎝ δ = 1. 30 = 011 .33 KT = 3. t(1-α) = t(0.33*0.06 QTr = 15 + 5 * 3.93 Se = 193 ⋅ 0.33 1 ⎧ ⎛ ln(1 + 0.26 m3/s Limites de confianza Ln (QTr) ± t(1-α) Se Se = (δ S y ) ⎛ K 2 ⎞2 δ = ⎜1 + T ⎟ ⎜ 2 ⎟ n ⎝ ⎠ 1 1 ⎛ 2.33 )) − ⎜ ⎜ ⎟ 2 ⎝ ⎠⎭ ⎩ KT = 0.028 QTr = 30.40992 QTr100 = Exp (3.40992) Q Tr100 = 30.324 LnQTr100 = 3.

3 DISTRIBUCION GUMBEL O EXTREMA TIPO I Una familia importante de distribuciones usadas en el análisis de frecuencia hidrológico es la distribución general de valores extremos. ⎡ ⎛ ( x − β ) ⎞⎤ F ( x) = ∫ f ( x)dx = exp ⎢− exp⎜ − ⎟ α ⎠⎥ ⎝ ⎣ ⎦ 11 .59095] e3. 3.2.645 ) (0.5) = 3.Ln(30.11) 3.59095] 36.25) = 99.28) ± (1.18095 [3.9% 3.26 3.25).38) = 0.3.324 F(3.9996 Leído de la tabla de la normal P(Q≤ 4.655)/0.29] Intervalos de confianza para QTr100 b) Calcular la probabilidad de que un caudal de 45 m3/s no se igualado o excedido P(Q≤ 4.41 ± 0. la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y sequías (máximos y mínimos).22905 [e3. Ln(42.22905 [25.1 Función de densidad: f ( x) = ⎡ − (x − β ) ⎛ − ( x − β ) ⎞⎤ exp ⎢ − exp⎜ ⎟⎥ α α ⎝ ⎠⎦ ⎣ α 1 En donde α y β son los parámetros de la distribución.75 .75 t = (3.

x= 15 m3/s.3 Factor de frecuencia: KT = − ⎡ ⎛ Tr ⎞⎤ ⎫ 6⎧ ⎪ ⎪ ⎨0.4 Limites de confianza Xt ± t(1-α) Se Se = δ⋅ s n 1 δ = [1 + 1. 3. s = 5 m3/s QTr100 = x + KT s KT = − 6 π {0.5772α donde x y s son la media y la desviación estándar estimadas con la muestra.3.33 años es igual a la media de los caudales máximos.577 + ln[ln100 − ln(99)]} KT = 3.1KT 2 ] 2 KT es el factor de frecuencia y t(1-α) es la variable normal estandarizada para una probabilidad de no excedencia de 1-α.1396K T + 1.14*5 12 .3.3.14 QTr100 = 15 + 3. 3. EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 años de periodo de retorno y los intervalos de confianza.3.5772 + ln ⎢ln⎜ ⎜ T − 1 ⎟⎥ ⎬ ⎟ π ⎪ ⎣ ⎝ r ⎠⎦ ⎪ ⎩ ⎭ Donde Tr es el periodo de retorno. Para la distribución Gumbel se tiene que el caudal para un período de retorno de 2.2 Estimación de parámetros α= 6 s π β = x − 0.

4. Volúmenes de flujo anuales y estacionales. .58 m 3 / s Xt ± t(1-α) Se 30.7 m3/s Intervalos de confianza t(1-α) = t(0. la función Gamma se utiliza para ajustar la distribución de frecuencia de variables tales como crecientes máximas anuales. Como la mayoría de las variables hidrológicas son sesgadas.58) [24.4 DISTRIBUCION GAMA DE TRES PARAMETROS O PEARSON TIPO 3 Esta distribución ha sido una de las mas utilizadas en hidrología.645 (Leído de la tabla de la normal) δ = [1 + 11396 (314 ) + 11 (314 ) ] .93 Se = (3. 2 1 2 δ = 3. 3.64) (3.83 m3/s 36. Caudales mínimos.QTr100 = 30. La función de distribución Gamma tiene dos o tres parámetros.1 Función de densidad: f ( x) = 1 ⎛ x − x0 ⎞ ˆ ⎟ ⎜ α Γ(β ) ⎝ α ⎠ β −1 ⎛ x − x0 ⎞ ˆ exp⎜ − ⎟ α ⎠ ⎝ donde.93) ⋅ (5) 30 Se = 3. .58 m3/s] Intervalo de confianza para QTr100 3. x0 ≤ x < ∝ para α > 0 ∝ < x ≤ x0 para ∝ < 0 13 .95) = 1.7 m3/s ± (1. . valores de precipitaciones extremas y volúmenes de lluvia de corta duración.

100) = 3.605 14 . y x0 es el parámetro de localización. x muestra respectivamente. 2 ˆ x0 = x −α β ˆ y s son la media y la desviación estándar de la Cs es el coeficiente de asimetría.9.100) = 3.4. QTr100 = X+ SK K es F(1. respectivamente .4.0.553 (2.4. EJEMPLO: Se tiene una estación con 30 años de registros de caudales máximos instantáneos con Media de 4144 pie3/s y desviación estándar de 3311 pie3/s. 100) de tablas se obtiene K=3. 3. Si el coeficiente de asimetría de los caudales es de 1. 3.595 (1.2 Estimación de parámetros: 2 ˆ ⎛ 2 ⎞ β =⎜ ⎟ . n es el número de datos y δ se encuentra tabulado en función de Cs y Tr.3 Factor de frecuencia: Cs 1 3 ⎛ Cs ⎞ ⎛ Cs ⎞ ⎛ Cs ⎞ 1 ⎛ Cs ⎞ + ( z − 6 z )⎜ ⎟ − ( z 2 − 1)⎜ ⎟ + z ⎜ ⎟ + ⎜ ⎟ K ≈ z + ( z − 1) 6 3 ⎝ 6 ⎠ ⎝ 6 ⎠ ⎝ 6 ⎠ 3⎝ 6 ⎠ donde z es la variable normal estandarizada 2 2 3 4 5 Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra. ⎝ Cs ⎠ α =s ˆ Cs .981. 3.α y β son los parámetros de escala y forma.4 Intervalos de confianza: Xt ± t(1-α) Se Se = δ ⋅S n Donde S es la desviación estándar de la muestra.981 pie3/s cual es caudal para un periodo de retorno de 100 años y su intervalo de confianza.

4922 (1.645 (Leído de la tabla de la normal) 16050 ± (5133.100) = 8.56 pie3/s t(1-α) = t(0.100) Se = ( 3311) ⋅ (8.56) (1.5 DISTRIBUCION LOG GAMMA O LOGPEARSON DE 3 PARAMETROS Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución Pearson tipo III.5. 3.0. Esta se trabaja igual que para la Pearson Tipo III pero con Xy y Sy como la media y desviación estándar de los logaritmos de la variable original X.9.QTr100 = 4144+ (3. Esta distribución es ampliamente usada en el mundo para el análisis de frecuencia de Caudales máximos. β −1 ⎛ ln( x) − y0 ⎞ exp⎜ − ⎟ α ⎠ ⎝ 15 .95) = 1.981.1 Función de densidad: 1 ⎛ ln( x) − y0 ⎞ f ( x) = ⎟ ⎜ x α Γ(β ) ⎝ α ⎠ donde. se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo III.595) (3311) QTr100 = 16050 pie3/s Intervalos de confianza Xt ± t(1-α) Se Se = δ ⋅S n de tablas se obtiene δ =8.5562 δ = F(1.71pie3/s] Intervalos de confianza para QTr100 3.100) = 8.645) [7605.29 pie3/s 24494.2196 (2.4922) 30 Se = 5133.

x y y s y son la media y la desviación estándar de los logaritmos de la muestra respectivamente. 2 ˆ x0 = x y −α β ˆ Cs es el coeficiente de asimetría. 3.4 Intervalos de confianza: Xt ± t(1-α) Se Se = δ ⋅Sy n Donde Sy es la desviación estándar de los logaritmos de la muestra.y0 ≤ y < ∝ para α > 0 ∝ < y ≤ y0 para ∝ < 0 α y β son los parámetros de escala y forma. .2 Estimación de parámetros: ˆ β =⎜ ⎛ 2 ⎞ ⎟ . n es el número de datos y δ se encuentra tabulado en función de Cs y Tr. 3.5.5.3 Factor de frecuencia: ln(YTr ) = x y + K ∗ s y Cs 1 3 ⎛ Cs ⎞ ⎛ Cs ⎞ ⎛ Cs ⎞ 1 ⎛ Cs ⎞ + ( z − 6 z )⎜ ⎟ − ( z 2 − 1)⎜ ⎟ + z ⎜ ⎟ + ⎜ ⎟ K ≈ z + ( z − 1) 6 3 ⎝ 6 ⎠ ⎝ 6 ⎠ ⎝ 6 ⎠ 3⎝ 6 ⎠ donde z es la variable normal estandarizada 2 2 3 4 5 Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con la muestra. respectivamente . y y0 es el parámetro de localización. 3. 4 AJUSTE DE DISTRIBUCIONES 16 .5. ⎝ Cs ⎠ 2 α = sy ˆ Cs .

muy superiores a los demás registrados (Ashkar. 1994). et al. Gumbel y Log-Gumbel principalmente. La distribución Log . para ello es necesario disponer de una serie con longitud de registros larga. Log Pearson) se requiere estimar el coeficiente de asimetría de la distribución. • • • • Cuando la información es adecuada el análisis de frecuencia es la metodología más recomendable para la evaluación de eventos extremos. 1994). Las distribuciones Gumbel y Log . Smirnov-Kolmogorov. las distribuciones Log Normal. se puede entender como valores extremos. et al. porque reducen la varianza de la muestra. Log-Gumbel y Log-Pearson se requiere transformar la variable al campo logarítmico para modelarla. • • Cuando en la serie histórica se observan “outliers1” es necesario verificar la sensibilidad del ajuste debido a la presencia de estos.Normal de dos parámetros sólo es recomendable sí el coeficiente de asimetría es cercano a cero.13 Para ajustar distribuciones de tres parámetros (Log Normal III. Cramer-Von Mises) en las que se calcula un estimador y se compara con un valor tabulado para determinar si el ajuste es adecuado o no. 17 . lo que en algunos casos puede no ser recomendable. entre otras.Gumbel son recomendables si el coeficiente de asimetría de los eventos registrados es cercano a 1. (Kite. con lo que se disminuye la varianza muestral. Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cual es la distribución que mejor se ajusta a los caudales máximos y recomiendan seleccionar el mejor ajuste a criterio del modelador con la prueba de ajuste gráfico o basado en el comportamiento de las pruebas estadísticas de bondad del ajuste (por ejemplo Chi Cuadrado. Para seleccionar la distribución de probabilidades de la serie histórica se deben tener en cuenta algunas consideraciones. Las distribuciones de dos parámetros son usualmente preferidas cuando se dispone de pocos datos. Las distribuciones de dos parámetros fijan el valor del coeficiente de asimetría. 1988). mayor de 50 años. Para seleccionar la distribución de probabilidades adecuada se debe tratar de utilizar información adicional del proceso hidrológico que permita identificar la forma en que se distribuye la variable. 1994) Para el ajuste a las distribuciones Log-Normal. En la prueba de ajuste gráfica se dibujan los valores registrados en la serie contra la distribución teórica de probabilidades y de manera visual (subjetiva) se determina si el ajuste es adecuado o no. Usualmente es muy difícil determinar las propiedades físicas de los procesos hidrológicos para identificar el tipo de distribución de probabilidad que es aplicable.Para la modelación de caudales máximos se utilizan. (Ashkar. et al. ya que la estimación depende 1 Aunque no existe una definición generalmente aceptada. pero también se filtran las variaciones reales de los datos. (Ashkar.

solamente de los caudales máximos anuales que han ocurrido en la cuenca y no da cuenta de los procesos de transformación de la precipitación en escorrentía. et al.2 Pruebas de Ajuste 18 .1 Plotting Position Trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. El tamaño de la muestra influye directamente en la confiabilidad de los resultados. por el método de Plotting Position. et al. Ashkar. 4. 1988. así a mayor período de retorno del estimativo mayor longitud de registros necesaria para mejor confiabilidad en los resultados. con el factor de frecuencia como se refirió en el numeral 2 o hallando la distribución empírica de los datos muestrales. 4. La selección inadecuada de la distribución de probabilidades de la serie histórica arrojará resultados de confiabilidad dudosa. • Cuando se presenten cambios o tendencias en la serie histórica se deben utilizar técnicas estadísticas que permitan removerlos para poder realizar el análisis de frecuencias (Kite. (Ashkar. Si n es el total de valores y m es el rango de un valor en una lista ordenada de mayor a menor (m=1 para el valor máximo) la probabilidad de excedencia se puede obtener por medio de las siguientes expresiones California P= m n Weibull P= m n +1 2m − 1 2n Hazen P= La expresión más utilizada es la Weibull. Obviamente tiene algunas limitaciones relacionadas con el comportamiento de la serie histórica y con el tamaño y calidad de los datos de la muestra. Mamdouh. • • El ajuste a distribuciones se puede hacer de dos técnicas. 1993. Los resultados pueden ser dibujados en el papel de probabilidad. Se han propuesto numerosos métodos empíricos. esta luego se puede ajustar a una de las distribuciones teóricas presentadas anteriormente. este es diseñado para que los datos se ajusten a una línea recta y se puedan comparar los datos muestrales con la distribución teórica (línea recta). 1994). Con las anteriores expresiones se halla lo que se conoce como la distribución empírica de una muestra. 1994).

Estos son análisis estadísticos y como tal se deben entender. mientras que si el estadístico χ²>0.05 y 0. 19 .2 Prueba Chi Cuadrado Una medida de las discrepancia entre las frecuencias observadas (fo) y las frecuencias calculadas (fc) por medio de una distribución teórica esta dada por el estadístico χ² k ( f − f )2 χ 2 = ∑ o c en donde ∑ f o = ∑ f c fc i =1 si el estadístico χ²=0 significa que lae distribuciones teórica y empírica ajustan exactamente. • El valor crítico Dα de la prueba debe ser obtenido de tablas en función de α y n. La función χ² se encuentra tabulada. • Si el valor calculado Dn es mayor que el Dα.05 y 0. no se puede ignorar el significado físico de los ajustes. Supongase que una hipótesis Ho es aceptar que una distribución empírica se ajusta a una distribución Normal.01 son los más usuales. valores de 0. Si el valor calculado de χ² por la ecuación anterior es mayor que algún valor crítico de χ². con niveles de significancia α de 0. donde k es el número de intervalos y n es el número de los parámetros de la distribución teórica. es decir. la distribución escogida se debe rechazar. 4.2. Esta prueba es fácil de realizar y comprende las siguientes etapas: • El estadístico Dn es la máxima diferencia entre la función de distribución acumulada de la muestra y la función de distribución acumulada teórica escogida. escogida Po(x) tal que Dn = max( P ( x) − Po( x)) . La prueba requiere que el valor Dn calculado con la expresión anterior sea menor que el valor tabulado Dn para un nivel de probabilidad requerido. 4.1 Prueba Smirnov Kolmogorov El estadístico Smirnov Kolmogorov D considera la desviación de la función de distribución de probabilidades de la muestra P(x) de la función de probabilidades teórica. • Se fija el nivel de probabilidad α.01 (el nivel de confianza es 1-α) se puede decir que las frecuencias observadas difieren significativamente de las frecuencias esperadas (o calculadas) y entonces la hipótesis Ho se rechaza. La distribución del estadístico χ² se puede asimilar a una distribución Chi-cuadrado con (k-n-1) grados de libertad. si ocurre lo contrario entonces se acepta. ellas difieren.Para determinar que tan adecuado es el ajuste de los datos a una distribución de probabilidades se han propuesto una serie de pruebas estadísticas que determinan si es adecuado el ajuste.2.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->