Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumen
La estimacin de la probabilidad de ocurrencia de eventos extremos en climatologa e hidrologa (eventos de precipitacin
extrema y crecidas) es un tema de primer inters, tanto terico como prctico. Por un lado, la obtencin de estadsticos
sobre el carcter ms o menos extremo de las precipitaciones ayuda a caracterizar el clima o el rgimen hdrico de un
lugar. Por otro lado, los sucesos extremos en climatologa e hidrologa constituyen un importante factor de riesgo para la
actividad humana, y en ocasiones llegan a convertirse en verdaderas catstrofes con saldo en vidas humanas. Es por ello
que el clculo de la probabilidad de ocurrencia de eventos extremos es parte importante en el diseo y planificacin de
cualquier obra civil o infraestructura. Aunque la bibliografa es abundante en trabajos sobre el tema, en la prctica el
mtodo clsico de series de mximos anuales ajustados a una distribucin Gumbel sigue siendo predominante. En este
trabajo se expone el uso de series de excedencias, que permiten utilizar ms informacin de las series originales. Se
explica la utilizacin de las distribuciones bi- y triparamtricas ms utilizadas en la bibliografa (EV1 o Gumbel, General
de Valores Extremos, Exponencial y General de Pareto), y se comparan los resultados obtenidos a partir del ejemplo de
12 estaciones climticas pirenaicas. Finalmente se ofrecen algunas pautas sobre en qu casos conviene utilizar una u otra
distribucin.
Palabras clave
Eventos extremos, periodo de retorno, series de excedencias, distribucin de Gumbel, distribucin General de Valores
Extremos, distribucin Exponencial, distribucin General Pareto
Abstract
The estimation of the occurrence probability of extreme events is an important issue in Climatology and Hydrology, and it
has both theoretical and practical interest. On one hand, the calculation of statistics on extremes helps on characterizing
the climate of a specific site. On the other hand, extreme climatologic and hydrologic events are an important risk factor
for human activities, and can even became natural catastrophes. For this reason the calculation of the occurrence
probability of extreme events plays an important role on designing civil or hydrologic structures. Although there are many
works on this topic in the literature, in practice the classic methodology based on annual maximum series fitted to a
Gumbel distribution is commonly used by researchers and engineers. In this work the method of exceedance or partial
duration series is explained. Different commonly used bi- and tri-parametric distributions are explained and compared. 12
climatic stations in the Spanish Pyrenees have been used as example.
Keywords
Extreme events, return periods, exceedance series, partial duration series, Gumbel distribution, General Extreme Values
distribution, Exponential distribution, Generalized Pareto distribution
Precipitacin diaria (L m )
-2
lo causar. En la figura 1 se muestra la curva de 50
1 0.5 0.2 0.1 0.01 0.001 A 1970 1971 1972 1973 1974 1975 1976
140
75
120
Precipitacin diaria (L m )
-2
50
Precipitacin diaria (mm)
100
u
80 25
60
0
40 B 1970 1971 1972 1973 1974 1975 1976
20
Figura 2 Estrategias de muestreo de eventos extremos: series de
mximos anuales (A); series de excedencias sobre un umbral (B)
0
1 10 100 1000
Las series de mximos es con diferencia el mtodo
Periodo de retorno (aos)
ms utilizado debido a su sencillez. Sin embargo,
conviene tener en cuenta el presupuesto subyacente de
Figura 1 Curva de magnitud / probabilidad / recurrencia de la que los valores mximos de cada ao constituyen
precipitacin diaria en la estacin de Hecho (Pirineo oriental).
sucesos suficientemente excepcionales. Esto no siempre
El anlisis de frecuencias de eventos extremos se se cumple, pues los mximos de algunos aos pueden
basa en los siguientes presupuestos: no ser realmente extremos (incumpliendo la condicin
a) Los eventos climticos o hidrolgicos extremos son c). En las series de excedencias, en cambio, la seleccin
una variable aleatoria que puede ser expresada mediante del valor de umbral permite definir con precisin lo que
una distribucin de probabilidad. se considera un evento extremo de la variable.
b) La serie de eventos extremos es independiente; es
decir, la magnitud de cada suceso no tiene correlacin La seleccin del valor de umbral permite, por otra
con los sucesos anteriores. parte, controlar el tamao final de la muestra. Este es un
c) La distribucin de probabilidad que explica el aspecto de gran importancia en todo procedimiento de
proceso extremo no vara en el tiempo, ni tampoco regresin, donde el tamao de la muestra condiciona la
cambia en funcin de la magnitud de la variable. fiabilidad de los resultados. En este sentido, las series de
excedencias hacen un uso mucho ms eficiente de la
El anlisis de frecuencias de eventos extremos tiene informacin contenida en las series originales, pues
que ver con el estudio de las colas de la distribucin de permiten incluir ms de un evento por ao si ste
frecuencias de la variable, por lo que resulta necesaria cumple el requisito para ser considerado extremo. En las
alguna tcnica de muestreo para extraer de las series de series de mximos anuales se pierden muchos eventos
datos originales los valores de magnitud excepcional. secundarios que pueden ser mayores que los mximos
Existen principalmente dos procedimientos de muestreo de otros aos, y por tanto proporcionan valiosa
de valores extremos en series hidroclimticas: las series informacin.
de mximos (AMS) y las series de excedencias o de
duracin parcial (PDS). Las primeras se construyen a El mayor problema relacionado con el uso de series
partir de los valores mximos de la variable tomados a de excedencias es la dificultad para asegurar la
intervalos fijos de tiempo, habitualmente un ao, por lo independencia de las observaciones (condicin b). En
que el tamao final de la muestra es igual al nmero de efecto, en las series de mximos anuales se asegura el
aos de registro. Las series de excedencias, en cambio, espaciado temporal de los sucesos muestreados, al
se construyen extrayendo de la serie original todos contrario de lo que sucede con las series de excedencias.
aquellos valores superiores a un determinado umbral En stas, un valor de umbral excesivamente bajo puede
fijado de antemano, por lo que el tamao de la muestra hacer que las ocurrencias aparezcan agrupadas en el
es variable. En la figura 2 se comparan ambos tiempo, en lugar de aleatorias. Sin embargo, se ha
procedimientos. demostrado (Beguera, 2001) que la violacin de este
presupuesto no afecta significativamente a los
resultados.
J.M. Cuadrat, S.M. Vicente y M.A. Saz (eds.), 2002, La informacin climtica como herramienta de gestin ambiental, Univ. de Zaragoza, pp. 83-92
f ( x) = e e
Exponencial (EXP), empleada con series de (2)
excedencias. Ambas distribuciones son funciones
biparamtricas derivadas de expresiones ms generales, donde x puede tomar valores en el rango - x . y
como son respectivamente la distribucin de General son parmetros de escala y origen respectivamente.
Valores Extremos (GEV) y la distribucin General
Pareto (GP). Al ser stas funciones triparamtricas La funcin de distribucin o de probabilidad
ofrecen un mejor ajuste a las series de datos, por lo que acumulada es:
muchos autores las prefieren a las primeras.
x
F ( x X ) = e e
=15, =60
0.2
=5, =60
=1, =60
0.0
60 80 100 120 140
X (mm)
Figura 3 rea de estudio y estaciones utilizadas: 1: Artieda; 2: Figura 4 Distribucin EV1 o de Gumbel, con distintas
Barrosa; 3: Biescas; 4: Canfranc; 5: Balneario de Panticosa; 6: parametrizaciones
Pineta; 7: Plandescn; 8: Pueyo de Jaca; 9: Sabinigo; 10:
Seira; 11: Villana; 12: Yesa.
Inviertiendo la expresin anterior se puede calcular
la precipitacin mxima correspondiente a un periodo
2. METODOLOGA de retorno determinado:
*
2.1.- Distribuciones de probabilidad para series 1
de mximos: EV1 (Gumbel) y GEV xT = log log1 (4)
T
* NOTA IMPORTANTE: El logaritmo en la frmula 4
debera ser neperiano, es decir ln.
J.M. Cuadrat, S.M. Vicente y M.A. Saz (eds.), 2002, La informacin climtica como herramienta de gestin ambiental, Univ. de Zaragoza, pp. 83-92
*
1
La distribucin General de Valores Extremos, GEV, xT = + 1 log1 (7)
es una generalizacin de la distribucin EV1, al T
aadirse un parmetro de forma, . As, EV1 se obtiene
a partir de GEV cuando vale 0. La f.d.p. de GEV es:
2.2.- Distribuciones de probabilidad para series
1 1
1 de excedencias: EXP y GP
1 x x
1
f ( x) = 1 e (5)
La series de excedencias se forman a partir de la
serie hidroclimtica original y un valor de umbral x0,
Aunque puede tomar cualquier valor, GEV slo puede definindose la serie transformada y{y1, y2, ..., yn}:
utilizarse para mximos de variables climticas cuando
es negativo, pudiendo tomar x valores en el rango y n = xm x0 xm x0 (8)
+ / x . Para valores positivos de k la
distribucin tiene una asntota (lmite superior) en x =
+ /, por lo que se suele utilizar entonces la La forma de las distribuciones anteriores no las hace
distribucin EV1. adecuadas para las series de excedencias. Las
distribuciones ms utilizadas son en cambio la
La funcin de distribucin o de probabilidad exponencial (EXP) y la General Pareto (GP). La ms
acumulada es: sencilla de la dos es EXP, cuya f.d.p. es:
x
1
1
x
f ( x) = e
(9)
1
F (x X ) = e (6)
La variable x puede tomar cualquier valor en el rango
La figura 5 muestra la f.d. GEV, con varias < x , siendo igual al umbral de corte de la serie de
parametrizaciones. Adems del cambio de escala, la excedencias, x0. es un parmetro de escala.
variacin del parmetro influye en el mayor o menor
peso de la cola de la distribucin. Se ha incluido un La f.d. de EXP es:
ejemplo con valor de positivo, para el que la curva
presenta una asntota vertical. x
F (x X ) = 1 e
(10)
GEV
En la figura 6 se presenta la distribucin EXP, con
1.0
X (mm)
generalizacin de los momentos ordinarios, en los que maneras para seleccionar la mejor distribucin para
el peso de cada observacin depende de su probabilidad unos datos. Ello suele hacerse mediante las grficas de
terica de ocurrencia: L-momentos, en las que se comparan los L-coeficientes
de sesgo (3) y curtosis (4) de las estaciones con los
{
M p ,r , s = E x p [F ( x )] [1 F ( x)]
r s
} (15) correspondientes a las distribuciones de probabilidad
consideradas.
A efectos de estimacin de parmetros, habitualmente Hosking (1990) ofrece aproximaciones polinomiales
se emplean los momentos s = M1,0,s o r = M1,r,0. a la relacin entre 3 y 4 para diversas distribuciones de
Debido a la dificultad de estimar la probabilidad valores extremos, permitiendo la construccin de
acumulada F(xX), para la que se han propuesto grficas de L-momentos. En este trabajo se han utilizado
diversas frmulas (Cunnane, 1989), se puede utilizar el las siguientes:
estimador no sesgado de Landwehr et al. (1979), que
desarrollado para los tres primeros momentos es: EV1: 3 = 0.1699 4 = 0.1504 (17)
GEV: 4 = 0.10701 + 0.11090 3 + 0.84838 32
1 N
0 = xi 0.06669 33 +0.00567 34 0.04208 35 + 0.03763 36
N i =1 EXP: 3 = 1/3 4 = 1/6
1 N 1 ( N i ) GP: 4 = 3 (1 + 53) / (5 + 3)
1 = xi
N i =1 ( N 1)
(16)
1 N 2 ( N i ) ( N i 1) 2.4.- Estimacin de parmetros mediante L-
2 = xi
N i =1 ( N 1) ( N 2) momentos
2 = 2 1 0 b = 1 0.5772157
(16)
3 = 6 2 6 1 + 0 El circunflejo, ^, indica que se trata de estimadores
4 = 20 3 30 2 + 12 1 0 muestrales.
0.2
EV1
EXP
mediante frmulas no paramtricas sencillas (ver
Cunnane, 1989), pero no nos permite comparar unas
GEV
distribuciones con otras, puesto que dicha frecuencia es
tambin una estimacin.
AMS
0.0
GP PDS
Los distintos autores que han estudiado el problema
0.0 0.2 0.4 0.6 de cmo comparar la bondad de varios mtodos de
3 estimacin de frecuencias han recurrido en general a dos
Figura 8 Grfica de L-momentos, mostrando el ajuste de las procedimientos: comparacin a nivel terico del error
estaciones a las distribuciones analizadas estndar de cada una de las distribuciones; o anlisis de
tipo Montecarlo, utilizando un gran nmero de series
En la figura puede comprobarse el buen grado de simuladas a partir de parmetros fijados por el
ajuste entre las series muestrales y las distribuciones investigador, en cuyo caso s se conoce la frecuencia
tericas. Las distribuciones GP y EXP aparecen exacta asociada a cada evento y se pueden emplear los
procedimientos ordinarios de comparacin.
J.M. Cuadrat, S.M. Vicente y M.A. Saz (eds.), 2002, La informacin climtica como herramienta de gestin ambiental, Univ. de Zaragoza, pp. 83-92
PDS-GP
10 10
n
3.3.- Comparacin entre distribuciones bi- y tri- Figura 10 Lmites de confianza inferior para k=0, con
paramtricas =0.05, en funcin del nmero de elementos de la serie de
excedencias (n). A partir de Rosbjerg et al. (1992)
J.M. Cuadrat, S.M. Vicente y M.A. Saz (eds.), 2002, La informacin climtica como herramienta de gestin ambiental, Univ. de Zaragoza, pp. 83-92
En la figura 10 se muestra el lmite inferior para la distinto de cero, resulta preferible emplear
hiptesis nula =0 a un nivel de confianza =0.05, distribuciones biparamtricas por su mayor robustez.
segn Rosbjerg et al. (1992). Se indica en color gris el Combinando los dos puntos anteriores, el
rea en la que no puede rechazarse la hiptesis nula, por procedimiento ptimo para el anlisis de estaciones
lo que slo si el valor estimado de cae por debajo del aisladas parece ser el de series de excedencias
lmite inferior podr asumirse 0. El lmite superior no ajustados a una distribucin exponencial (PDS-
se ha incluido, puesto que no son aceptables valores EXP).
positivos de , por lo que en caso de que aparezcan se
debe utilizar =0. Finalmente se han comparado los resultados
obtenidos con los distintos procedimientos en las
En la figura 11 se comparan los resultados obtenidos estaciones del rea de estudio, llegndose a las
mediante distribuciones bi- y triparamtricas. En el caso siguientes conclusiones:
de las series de mximos anuales (AMS-EV1 y AMS- Las series de mximos (AMS) tienden a subestimar
GEV) se observa cmo los resultados apenas difieren, el periodo de retorno de los eventos de ms de 5 aos
por lo que resulta irrelevante optar por una u otra de recurrencia, con respecto a las series de
distribucin. En el caso de las series de excedencias excedencias (PDS).
(PDS-EXP y PDS-GP) se observa cmo empiezan a Las distribuciones biparamtricas y triparamtricas
aparecer divergencias a partir de los 10 aos de ofrecen resultados similares, sin que unas sub- o
recurrencia, aunque no puede decirse que en general sobreestimen con respecto a las otras. Sin embargo,
uno de los modelos sobreestime o subestime con existe una mayor divergencia entre EXP y GP que
respecto al otro, pues el error est distribuido entre EV1 y GEV.
aleatoriamente.
AGRADECIMIENTOS
100 100
PDS-GP
10 10