Está en la página 1de 11

3. ANÁLISIS DE DATOS DE PRECIPITACIÓN.

Teniendo en cuenta que la mayoría de procesos estadísticos se comportan de


forma totalmente aleatoria, es decir, un evento dado no está influenciado por los
demás, se puede hacer uso de la estadística como herramienta de análisis de los
mismos. Sin embargo, en este documento no se hará una presentación
exhaustiva de fundamentos estadísticos, por lo que se sugiere al lector, recordar
estos conceptos vistos en los cursos de Probabilidad y estadística.

Análisis de frecuencias y determinación del periodo de retorno. Es necesario


presentar inicialmente el concepto de periodo de retorno, el cual se define como el
número de años que deben transcurrir para que un evento de una magnitud dada
sea igualado o superado. Como se trata de igualar o exceder un evento, el
periodo de retorno está vinculado a la probabilidad de excedencia, es decir la
probabilidad que tiene un evento dado de exceder un valor determinado, de la
siguiente forma.

1
T (1)
P( X  x)

Donde T, es el periodo de retorno [años]; P( X  x) , es la probabilidad de


excedencia. De acuerdo a la teoría de probabilidad tenemos que:

P( X  x)  P( X  x)  1 (2)

Con lo que la Ecuación 1 queda:

1
T (3)
1  P( X  x)

Los valores de una serie de datos cuando tienen que ver con mediciones
hidrológicas, se denominan series hidrológicas. Para su estudio estadístico, las
series hidrológicas se pueden ajustar a una distribución de probabilidad. Una
distribución de probabilidad se puede expresar como la probabilidad de ocurrencia
de una variable aleatoria,

Las distribuciones de probabilidad más comúnmente usadas son la Normal, la


Lognormal, la Exponencial, la Gamma y la de Pearson. Para una discusión más
profunda acerca de estas, le solicitamos al lector remitirse al módulo de
probabilidad y estadística.

Las series hidrológicas estudiadas pueden ser de tres tipos:

 Series completas. Es una serie compuesta por toda la información


disponible. Estas generalmente tienen datos de mediciones diarias durante
al menos 15 años.

1
 Series parciales. Estas series se componen por aquellos datos que
exceden un valor determinado, definido por el investigador. Estas series
permiten analizar eventos especiales, por ejemplo, analizar el
comportamiento de las lluvias con una intensidad mayor a 50 mm/h.

 Series extremas. Este tipo de series está compuesta por los valores
máximos o mínimos de la serie, durante el periodo de muestreo, siendo
este tomado normalmente igual a 1 año.

Para la evaluación de las series hidrológicas se utilizan básicamente dos formas:

 Análisis directo. Este análisis implica el contar con todos los datos para
ser analizados en conjunto. Si se posee una gran cantidad de datos, estos
se agrupan en intervalos de clase. Si se poseen pocos datos, estos se
analizan ordenándolos, generalmente de mayor a menor (en esta forma se
determina probabilidad de excedencia).

La Probabilidad de excedencia se puede calcular cuando se tienen series


de datos usando la Frecuencia relativa, la cual representa el número de
éxitos dentro de la población. Cuando se cuenta con un gran número de
datos y estos agrupados en intervalos de clase, la Frecuencia de
excedencia se calcula como la diferencia entre la Frecuencia de excedencia
y la frecuencia relativa. En este caso la primer Frecuencia de excedencia
toma el valor de 1 y los demás valores se calculan mediante la diferencia
comentada.

Ejemplo. Calcular la Frecuencia relativa, la frecuencia de excedencia y el periodo


de retorno en años para los datos de lluvias del mes de Junio, agrupados en los
siguientes intervalos de clase.

INTERVALO
ORDEN FRECUENCIA
(mm/día)

1 0 - 25 294
2 25 - 50 262
3 50 - 75 63
4 75 - 100 28
5 100 - 125 12
6 125 - 150 6
7 150 - 175 3
8 175 - 200 2
9 200 - 225 1
10 225 - 250 1
SUMA 672

2
La frecuencia relativa se calcula dividiendo el valor de la frecuencia entre el
número total de datos. El periodo de retorno se calcula de acuerdo con la
Ecuación 1. Lo que debe tenerse en cuenta, es que como los datos son del mes
de Junio, para calcular el periodo de retorno en años se divide el valor por 30 días,
dado que el año tiene 30 días (cada año tiene 30 días de junio). Los datos se
presentan en la siguiente tabla.

PERIODO
FRECUENCIA
INTERVALO FRECUENCIA DE
ORDEN FRECUENCIA DE
(mm/día) RELATIVA RETORNO
EXCEDENCIA
(AÑOS)
1 0 - 25 294 0,4375 1 0,0333
2 25 - 50 262 0,3899 0,5625 0,0593
3 50 - 75 63 0,0938 0,1726 0,1931
4 75 - 100 28 0,0417 0,0789 0,4226
5 100 - 125 12 0,0179 0,0372 0,8960
6 125 - 150 6 0,0089 0,0193 1,7231
7 150 - 175 3 0,0045 0,0104 3,2000
8 175 - 200 2 0,0030 0,0060 5,6000
9 200 - 225 1 0,0015 0,0030 11,2000
10 225 - 250 1 0,0015 0,0015 22,4000
SUMA 672 1,0000

Cuando no se cuenta con la serie completa, la probabilidad se puede calcular


usando la Frecuencia de excedencia, esta se calcula por medios matemáticos de
acuerdo a una distribución que asigna la probabilidad de acuerdo al número de
datos y al orden en que se encuentra, estos valores de frecuencia se asignan
sobre todo cuando los datos van a ser graficados y por tanto importa su ubicación
dentro de la serie de datos. En este caso podemos decir en términos generales
que el valor de N, corresponde al número total de datos en la serie. El valor de r,
representa el orden que ocupa el valor dentro de la serie, es decir, su posición
relativa dentro de la misma. Ver Tabla 1 (Chow, 1994).

Tabla 1. Ecuaciones para calcular la probabilidad de excedencia.

NOMBRE AÑO ECUACIÓN


1
California 1923
N
2r  1
Hazen 1930
2N
r
Weibull 1939
N 1
r  0.3
Chegodayev 1955
N  0.4

3
3
r
Blom 1958 8
1
N
4
3r  1
Tukey 1962
3N  1
r  0.44
Gringorten 1963
N  0.12
Fuente: Chow (1994 : 406 - 407)

Ejemplo. Calcular la Frecuencia de excedencia y el periodo de retorno en años


para los datos de lluvias del mes de Junio, Que se presentan en la siguiente
Tabla. Utilizar la ecuación de Weibull para calcular la Frecuencia.

Tabla 16. Datos para el cálculo de Frecuencias.

INTENSIDAD
ORDEN
(mm/día)

1 215
2 208
3 193
4 23
5 45
6 98
7 65
8 78
9 125
10 49
11 178
12 129
13 49
14 21
15 53

Lo primero que hacemos es ordenar los datos de mayor a menor, esto nos permite
calcular la frecuencia de excedencia. Luego usamos la Ecuación de Weibull, para
el cálculo de la frecuencia de excedencia y obtenemos el periodo de retorno de
acuerdo a la Ecuación 1.

4
FRECUENCIA PERIODO DE
INTENSIDAD
ORDEN DE RETORNO
(mm/día)
EXCEDENCIA (AÑOS)
1 215 0,0625 16,00
2 208 0,1250 8,00
3 193 0,1875 5,33
4 178 0,2500 4,00
5 129 0,3125 3,20
6 125 0,3750 2,67
7 98 0,4375 2,29
8 78 0,5000 2,00
9 65 0,5625 1,78
10 53 0,6250 1,60
11 49 0,6875 1,45
12 49 0,7500 1,33
13 45 0,8125 1,23
14 23 0,8750 1,14
15 21 0,9375 1,07

 Análisis indirecto. Este análisis implica el ajustar los datos a una


distribución de probabilidad. En Colombia para el análisis de series
hidrológicas se utiliza la distribución de Gumbel, también llamada
distribución de valores extremos. Se llama distribución de valores
extremos, porque generalmente se analizan los valores máximos o mínimos
de la serie, por ejemplo cuando se analizan datos de precipitación o
caudales de una fuente hídrica, puede ser interesante tomar los valores
máximos de varios años, o por el contrario los mínimos, este análisis es
muy común en aplicaciones de Ingeniería donde se deben tener en cuenta
las condiciones extremas a la hora de realizar diseños.

La distribución de valores extremos presenta tres variaciones, siendo la de


tipo I, la más utilizada. Esta fue definida por Gumbel en 1941 y define la
probabilidad que presenta un dato en particular de no exceder un valor
determinado. Esta distribución presenta la siguiente forma:

1  x       x    
P( x)  e   e   (15)
      

Donde a, es el parámetro de escalamiento y m, el parámetro de


localización. Ambos parámetros de la distribución deben ser estimados
usando métodos analíticos o bien métodos gráficos.

 Método gráfico. Para la determinación de los parámetros por el método


gráfico, se sigue la siguiente metodología:

5
1. Obtener la muestra.
2. Ordenar los datos de menor a mayor, para obtener probabilidades de no
excedencia.
3. Asignar probabilidad a cada uno de los valores. Para esto, se utiliza la
Ecuación de Gringorten, que es la que más se adapta para la distribución
de Gumbel.
4. Estimar el valor de la variable estandarizada de Gumbel.
5. Graficar lo datos de la variable estandarizada de Gumbel en el eje X y los
de la muestra en el eje Y.
6. Obtener del gráfico los valores de los parámetros.1

Para estimar el valor de la variable estandarizada de Gumbel se procede de la


siguiente manera:

1  x       x    
P( X  x)  e   e  
      

Si tomamos x 
x   

Podemos definir que:

e  x  e  x 
1
P( X  x) 

Para definir la función de distribución de probabilidad derivamos la Ecuación


anterior, lo que nos da:

F ( X )  e e  x 

Aplicando logaritmo natural a ambos lados tenemos:

ln( F ( X ))  e  x
 ln( F ( X ))  e  x

Aplicando logaritmo natural nuevamente tenemos:

ln(  ln( F ( X )))   x


x   ln(  ln( F ( X ))) (16)
x   ln(  ln( P( X  x)))

1
Recordar que en una ecuación de la forma Y=mX+b; m, representa la pendiente de la recta y b,
representa el punto de intersección con el eje Y. Remitirse al Módulo de Algebra, Geometría y
Trigonometría para una discusión más profunda al respecto.

6
De acuerdo a la Ecuación 14 tenemos que:

1
T
1  P( X  x)
1
T
1 F(X )

Despejando F(X), tenemos que:


T 1
F(X ) 
T

Reemplazando este valor en la Ecuación 16 tenemos:

 T 1
x   ln(  ln   (17)
 T 

Ejemplo 5. Obtener los parámetros de la distribución de Gumbel por el método


gráfico, usando los datos del Ejemplo 4 y la Ecuación 17.

Tabla 18. Cálculo parámetros distribución de Gumbel.

INTENSIDAD
ORDEN P(X<x) y
(mm/día)
1 21 0,037 -1,193
2 23 0,103 -0,820
3 45 0,169 -0,574
4 49 0,235 -0,369
5 49 0,302 -0,181
6 53 0,368 0,000
7 65 0,434 0,180
8 78 0,500 0,367
9 98 0,566 0,564
10 125 0,632 0,780
11 129 0,698 1,025
12 178 0,765 1,315
13 193 0,831 1,685
14 208 0,897 2,217
15 215 0,963 3,277

Los valores de P(X<x), se calcularon utilizando la Ecuación de Gringorten y los


valores de “y” la Ecuación 17. Graficamos estos valores tomando los valores de
“y” para el eje X y los valores de precipitación para el eje Y. Como solo se colocan
los puntos, después se debe ajustar una recta a la nube de puntos para que sea
más fácil determinar los valores de los parámetros. El programa Microsoft Excel
permite ajustar una línea de tendencia a la nube de puntos, tal como se muestra a
continuación.

7
Figura 22. Método gráfico para la determinación de los parámetros de la
Ecuación de Gumbel.

300

250

200

150

100

50

0
-2,000 -1,000 0,000 1,000 2,000 3,000 4,000

La Ecuación de la recta ajustada a la nube de puntos es de la siguiente forma:

Y  X  

Con base en el gráfico observamos que el valor de , es aproximadamente 71.

Para calcular el valor de la pendiente () tomamos dos puntos y usamos la


siguiente ecuación:

Y2  Y1
 (18)
X 2  X1

Tomando los en el Eje X los valores de 1.000 y 0.000, observamos que los
respectivos valores de Y, definidos por la línea de tendencia son: 125 y 71,
respectivamente, aplicando la Ecuación (18), tenemos:

125  71

1.000  0.000
  54

Luego la ecuación de la recta ajustada es:

Y  54 X  71

8
Por ejemplo para encontrar la precipitación para una lluvia con un periodo de
retorno de 5 años, calculamos primero el valor de x usando la Ecuación 17:

 T 1
x   ln(  ln  
 T 
 5 1
x   ln(  ln  
 5 
4
x   ln(  ln  
5
x  1.4999

Reemplazando este valor en la Ecuación de la recta tenemos:

Y  54 X  71
Y  54(1.4999)  71
Y  152mm / día

 Método analítico. Para esto se aplica el método de los momentos que


permite ajustar los datos a una distribución de Gumbel. Del proceso
obtenemos los valores de  y , en este apartado no se presentará el
procedimiento para obtener estos valores, pero se recomienda al lector
recordar estos conceptos en el Módulo de Probabilidad y estadística.

Los valores de  y  son (Aparicio, 2004):

  0.7797 * S
(19)
  X  0.5772

Donde X , representa el valor promedio de los datos y S, la desviación estándar.


Recordar que el valor promedio de una serie de datos se calcula mediante la
siguiente expresión:
n

x i
X  i 1
(20)
n

El valor de la desviación estándar se calcula mediante la expresión:

 x  X
n
2
i
S i 1
(21)
n 1

9
Ejemplo 6. Obtener los parámetros de la distribución de Gumbel por el método
analítico, usando los datos del Ejemplo 4.

Tabla 19. Datos para el cálculo de parámetros por el método analítico.

INTENSIDAD
ORDEN
(mm/día)
1 215
2 208
3 193
4 23
5 45
6 98
7 65
8 78
9 125
10 49
11 178
12 129
13 49
14 21
15 53
Media 101,933
Desv. Est. 68,322

Los parámetros son:

  0.7797 * S

  0.7797 * 68.322

  53.271

  X  0.5772

  101.933  0.5772 * 53.271

  71.185

Luego la Ecuación de la recta ajustada es:

10
Y  X  

Y  53.271X  71.185

Para calcular la precipitación de una lluvia con un periodo de retorno dado se


procede de forma análoga a lo descrito en el método gráfico. Por ejemplo para
encontrar la precipitación para una lluvia con un periodo de retorno de 5 años
tenemos:

 T 1
x   ln(  ln  
 T 
 5 1
x   ln(  ln  
 5 
4
x   ln(  ln  
5
x  1.4999

Reemplazando este valor en la Ecuación de la recta tenemos:

Y  53.271X  71.185

Y  53.271(1.4999)  71.185

Y  151.09mm / día

Se observa que independientemente del método escogido el valor de la


precipitación es muy similar. Este procedimiento se aplica de igual forma si lo que
se está evaluando son los caudales de una fuente o la precipitación en un
intervalo de tiempo.

11

También podría gustarte