Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribuciones Estadsticas
Introduccin. Para qu sirve esto?
Con frecuencia nos planteamos dos tipos de cuestiones relacionadas con la probabilidad de que
se presente un cierto caudal o de que se produzca cierta precipitacin:
1. Cul es la probabilidad de que el caudal supere 40 m3/seg?
2. Qu caudal ser superado un 2% de los aos?
Vemos que una es la inversa de la otra: A patir del valor calcular la probabilidad o al revs.
Y a veces en lugar de hablar de probabilidad se habla de periodo de retorno y la pregunta 2 se
plantea como: Cul es el caudal con un periodo de retorno de 50 aos?
Primero veremos conceptos bsicos, necesarios: muestra y poblacin, media aritmtica y
desviacin tpica, etc. Despus abordaremos la manera de responder a cuestiones como las
planteadas ms arriba con ejemplos concretos.
Poblacin y muestra
Poblacin es el conjunto total de individuos o sucesos que queremos estudiar.
A veces disponemos de medidas de toda la poblacin estudiada, pero generalmente, esto sera
muy difcil (medir la estatura de todos los espaoles) o imposible (estudiando el caudal de un ro
tendramos que medir los caudales de todos los aos pasados y futuros). En estos casos debemos
conformarnos con medir una parte de la poblacin (una muestra). En cualquier caso,
consideramos los datos disponibles y con ellos intentamos extraer estimaciones vlidas para toda
la poblacin.
Muestra es una pequea parte de la poblacin elegida adecuadamente para que sea
representativa del total de la poblacin.
Si yo midiera la estatura de mis alumnos para conocer la estatura media del curso, ellos seran
toda la poblacin estudiada. Pero si, a partir de ellos, yo quiero extraer conclusiones sobre la
estatura de toda la juventud espaola, mis alumnos seran solamente una muestra representativa de
la poblacin estudiada.
30
Estatura N % casos
(cm) casos 25 Figura 1
145-150 3 1,23 20
150-155 8 3,29
155-160 20 8,23 15
casos
160-165 39 16,05
10
%
165-170 63 25,93
170-175 58 23,87 5
175-180 31 12,76
0
180-185 13 5,35
14
15
15
16
16
17
17
18
18
19
5-
0-
5-
0-
5-
0-
5-
0-
5-
0-
185-190 6 2,47
15
15
16
16
17
17
18
18
19
19
0
190-195 2 0,82
Totales.... 243 100
% casos acumulado
(cm) casos casos acumulado acumulado 80
En este grfico podemos leer qu porcentaje de la muestra es inferior p.ej. a 175 cm, o qu
estatura deja por debajo, p.ej., al 80% de los casos.
Trabajando con caudales o precipitaciones el nmero de datos puede ser de 30 40, o a veces
menos, y no son suficientes para agruparlos en intervalos (caudales entre 5 y 10, entre 10 y 15,
etc.). Pero s podemos realizar un grfico acumulado como el anterior con los datos individuales.
Veamos como ejemplo 21 precipitaciones anuales en Central Park, New York . A la izquierda de
la tabla aparecen en orden cronolgico. A la derecha se han clasificado de mayor a menor, y en la
ltima columna se refleja el porcentaje de datos que supera ese valor. Por ejemplo, para n=4,
n/N=4/21*100=19 %. Quiere decir que el 19% de los datos es igual o menor que 896 mm.1
Representando grficamente las dos ltimas columnas, obtenemos un grfico equivalente a la
Figura 2, que habamos preparado con las
Ao P (mm) n P (mm) n/N *100
estaturas acumuladas; no tiene la misma suavidad,
1962 944 1 663 4,8
1963 871 2 838 9,5
al tratarse de un nmero reducido de datos reales,
1964 838 3 871 14,3 pero la lectura de ambos grficos ha de ser la
1965 663 4 896 19,0 misma: En este ltimo podramos leer
1966 1013 5 944 23,8 directamente la probabilidad de que la
1967 1248 6 968 28,6 precipitacin sea <1300 mm, o, a la inversa, qu
1968 1107 7 1013 33,3 valor de precipitacin no se supera el 30% de los
1969 1233 8 1049 38,1 aos.
1970 896 9 1052 42,9
100
1971 1442 10 1107 47,6
% casos que son menores que esa P
90
1972 1703 11 1132 52,4
80
1973 1454 12 1211 57,1
70
1974 1211 13 1233 61,9 Figura 3
60
1975 1555 14 1248 66,7
50
1976 1049 15 1265 71,4
40
1977 1390 16 1324 76,2
30
1978 1265 17 1390 81,0 20
1979 1324 18 1442 85,7 10
1980 1132 19 1454 90,5 0
1981 968 20 1555 95,2 600 800 1000 1200 1400 1600 1800
1
En realidad se divide por n/(N+1) o por (n0,5)/N, para evitar que al llegar al mayor salga el 100%. La ltima
columna de la tabla es correcta para esta muestra: el 100% son iguales o menores que 1703 mm., el ao ms lluvioso
registrado; pero no podemos suponer que nunca en el futuro se vaya a presentar un ao mayor que 1703 mm.
Coeficiente de Variacin
Si ambas series tienen la misma media, su desviacin tpica nos indica el grado de dispersin
de los valores a los lados de la media. Pero si las medias son distintas, la simple comparacin de
las desviaciones tpicas no sirve de nada. Supongamos ahora que queremos comparar la primera
de las series anteriores con otra nueva serie cuyos valores estn en un rango distinto, y deseamos
saber cual est mas dispersa a ambos lados de su media:
As vemos que la segunda serie parece que presenta una mayor dispersin (s = 64,8 parece muy
alta comparada con s = 3,0 de la primera). Pero s=3,0 en valores que rondan la media de 23 es
mayor que s = 64,8 en una poblacin de media 1365. Esta idea se cuantifica mediante el
Coeficiente de Variacin (C.V.) :
Desviacin Tpica
C.V . =
Media aritmtica
Puntuaciones tipificadas
Cuando abordamos el problema de qu probabilidad existe de que tal variable supere tal
valor?, las puntuaciones (valores) brutas estn medidas en cm, mm, pulgadas o m3/seg,
dependiendo de la variable estudiada, del rango de valores en que sta se mueve y de las unidades
utilizadas. Se hace necesario homogeneizar la unidad de medida. Vemoslo con un ejemplo:
Deseamos comparar un pequeo arroyo (caudal medio=6,3 litros/seg; desviacin tpica= 0,9
litros/seg.) con un gran ro (caudal medio= 97 m3/seg; desviacin tpica 13,4 m3/seg). En un ao
hmedo ambos superaron la media: en el primero el caudal fue de 7,9 litros/seg, y en el segundo
de 112 m3/seg. Cul de los dos datos fue mas excepcional (comparado con los datos de su propia
historia, claro), cul se apart ms de su media? .
El arroyo super a su media en 7,9-6,3= 1,6 l/s. El caudal del gran ro estuvo 112-97= 15
m3/seg sobre su media. Pero en lugar de expresarlo en litros/seg o en m3/seg, vamos a expresarlo
en desviaciones tpicas:
7,9 6,3
El caudal del arroyo super a su media en =1,78 desviaciones tpicas.
0,9
112 97
El caudal del gran ro super a su media en =1,12 desviaciones tpicas .
13, 4
Por tanto, el caudal del arroyo era ms excepcional (estaba ms alejado de su media) que el del
gran ro.
Puntuacin bruta-Media
Generalizando: Puntuacin tipificada =
Desviacin tpica
Esta ley de distribucin de frecuencias se utiliza para el estudio de los valores extremos. Por
ejemplo, si hemos elegido el da mas caudaloso o de mayor precipitacin de cada ao de una serie
de aos.
La probabilidad de que se presente un valor inferior a x es:
b= (x u)
b
F ( x) = e e (1) siendo: (2)
= y / sx (3)
u = x - y / (4)
e = base de los logaritmos neperianos
x = media aritmtica de la muestra
sx = desviacin tpica de la muestra
y , y = consultar en la tabla adjunta, segn el nmero de datos de la muestra2]
(Ver nota3 )
Mediante las expresin anteriores podremos calcular la n datos y y
frecuencia a partir del valor x, es decir: calcularcon qu 10 0,4952 0,9496
frecuencia (o periodo de retorno) se presentar un cierto 15 0,5128 1,0206
caudal o precipitacin. 20 0,5236 1,0628
25 0,5309 1,0914
Para solucionar el caso inverso (qu caudal o 30 0,5362 1,1124
precipitacin se producirn cada n aos) debemos 35 0,5403 1,1285
despejar b en la expresin (1), obteniendo: 40 0,5436 1,1413
45 0,5463 1,1518
b = ln (ln (F(x))) (3) 50 0,5485 1,1607
55 0,5504 1,1682
Y, finalmente, despejando x en (2): 60 0,5521 1,1747
x =b/ + u (4) 65
70
0,5535
0,5548
1,1803
1,1854
75 0,5559 1,1898
Ejemplo.- De una serie de 55 caudales extremos (el 80 0,5569 1,1938
caudal diario mximo de cada ao)4, hemos calculado: 85 0,5578 1,1974
Media= 21,97 m3/seg 90 0,5586 1,2007
95 0,5593 1,2037
Desv tpica=13,22 m3/seg 100 0,5600 1,2065
-->infinito 0,5772 1,2825
2
y , y son, respectivamente, la media y la desviacin tpica de una serie de valores yi
(i = 1 a N ; N = n de datos de la muestra) que dependen solamente del nmero de datos, y N + 1)
que corresponden a la siguiente expresin: y i = ln ln
(Clculo de estos parmetros en un documento Excel, en la web, seccin Complementos) i
3
En Chow et al. (1984) el valor de es el inverso del presentado aqu (y en muchos textos, como Aparicio, 1997),
pero el resultado final es el mismo, ya que en la expresin (2) de Chow et al. (op.cit.) est en el denominador
4
Datos de Hoyos del Espino, en la cabecera del ro Tormes, cuanca receptora 88 km2
a) Cual ser la probabilidad de que (el da ms caudaloso del ao) el caudal supere el valor
de 60 m3/seg?
1) De acuerdo con la tabla adjunta, para 55 datos, tomamos los valores:
y = 0,5504 y = 1,1682
2) Calculamos y u:
= y / sx = 1,1682 / 13,22 = 0,0884
u = x - y / = 21,97 0,5504 / 0,0884 = 15,741
3) Calculamos el exponente b:
b= (xu) = 0,0884 (60 15,741) =3,917
4) Aplicamos la ecuacin de Gumbel (1) para el caudal del problema (60 m3/s). La probabilidad
de que se presente un caso menor que x ser:
3 , 917
F ( x)= e e = 0,9803 98,03%
Por tanto, la probabilidad de que se presente un caso mayor que x ser:
1- F (x) = 1 -0,9803 = 0,0197 (= 1,97%)
Finalmente, el periodo de retorno es el inverso de la probabilidad:
Periodo de retorno= 1/0,0197 = 50,8 aos
Si un caudal se superar el 1% de los aos, ser inferior el 99%, es decir: F(x) =0,99.
La simplificacin mostrada a lo largo de todas estas pginas (indicando que los valores medios se ajustan
a Gauss, y los valores extremos se ajustan a Gumbel) es solamente vlida con fines didcticos, para una
primera aproximacin al tema.
Existen muchas otras distribuciones, entre las que destacan, como ms utilizadas, la lognormal (los
logaritmos de los valores son los que se ajustan a la ley de Gauss) o la ley Pearson III, adoptada por las
agencias federales en USA. Ver, por ejemplo en Viessman, 2003, captulo 3.
En Espaa los organismos oficiales para precipitaciones mximas aplican la distribucin SQRT-max5
5
Ver en http://web.usal.es/javisan/hidro (Secin Complementos)
Vamos a denominar a la ltima expresin obtenida arriba es el riesgo de fallo (R), es decir: la
probabilidad de que s se produzca alguna vez un suceso de periodo de retorno T a lo largo de un
periodo de n aos:
n
1
R = 1 1
T
Ejemplo: Se va a construir un canal cuya vida til es de 75 aos. Si el caudal supera el valor
correspondiente al periodo de retorno de 100 aos, se desbordar. Calcular la probabilidad de que
se produzca un desbordamiento en alguno de los prximos 75 aos
75
1
R = 1 1 = 0,529 = 52,9%
100
Por tanto, existe un 52,9% de probabilidad de que el caudal de retorno 100 aos se alcance en
alguno de los prximos 75 aos.
Se produce la siguiente paradoja: si consideramos un caudal con retorno de 100 aos, parece
seguro que se presente en alguno de los prximos 100 aos. Pero si aplicamos la frmula anterior,
haciendo T= 100 y n=100, y obtenemos 0,633 , es decir solamente un 63,3 %
(*)
Las probabilidades de dos sucesos complementarios (debe suceder uno u otro) suman 1. Por ejemplo: probabilidad
de obtener un 3 en un dado= 1/6. Probabilidad de obtener un valor distinto de 3= 1-1/6 = 5/6
(**)
La probabilidad de que se produzcan dos sucesos independientes es el producto de sus probabilidades; por ejemplo:
probabilidad de obtener un 3 en un dado= 1/6. Probabilidad de obtener dos 3 seguidos = 1/6.1/6 =1/36
Bibliografa
Aparicio, F.J. (1997).- Fundamentos de Hidrologa de Superficie. Limusa, 303 pp
Chow, V.T.; D.R. Maidment & L.W. Mays (1993).- Hidrologa Aplicada. McGraw-Hill, 580 pp.
Viessman, W. & G. L. Lewis (2003).- Introduction to Hydrology. Pearson Education Inc., 5 ed.,
612 pp.
Wanielista, M. (1997).- Hydrology and Water Quality Control 2 edicin. Ed. Wiley
0 1 2 3 4 5 6 7 8 9
0,0 0,50000 0,49601 0,49202 0,48803 0,48405 0,48006 0,47608 0,47210 0,46812 0,46414
0,1 0,46017 0,45620 0,45224 0,44828 0,44433 0,44038 0,43644 0,43251 0,42858 0,42465
0,2 0,42074 0,41683 0,41294 0,40905 0,40517 0,40129 0,39743 0,39358 0,38974 0,38591
0,3 0,38209 0,37828 0,37448 0,37070 0,36693 0,36317 0,35942 0,35569 0,35197 0,34827
0,4 0,34458 0,34090 0,33724 0,33360 0,32997 0,32636 0,32276 0,31918 0,31561 0,31207
0,5 0,30854 0,30503 0,30153 0,29806 0,29460 0,29116 0,28774 0,28434 0,28096 0,27760
0,6 0,27425 0,27093 0,26763 0,26435 0,26109 0,25785 0,25463 0,25143 0,24825 0,24510
0,7 0,24196 0,23885 0,23576 0,23270 0,22965 0,22663 0,22363 0,22065 0,21770 0,21476
0,8 0,21186 0,20897 0,20611 0,20327 0,20045 0,19766 0,19489 0,19215 0,18943 0,18673
0,9 0,18406 0,18141 0,17879 0,17619 0,17361 0,17106 0,16853 0,16602 0,16354 0,16109
1,0 0,15866 0,15625 0,15386 0,15151 0,14917 0,14686 0,14457 0,14231 0,14007 0,13786
1,1 0,13567 0,13350 0,13136 0,12924 0,12714 0,12507 0,12302 0,12100 0,11900 0,11702
1,2 0,11507 0,11314 0,11123 0,10935 0,10749 0,10565 0,10383 0,10204 0,10027 0,09853
1,3 0,09680 0,09510 0,09342 0,09176 0,09012 0,08851 0,08692 0,08534 0,08379 0,08226
1,4 0,08076 0,07927 0,07780 0,07636 0,07493 0,07353 0,07215 0,07078 0,06944 0,06811
1,5 0,06681 0,06552 0,06426 0,06301 0,06178 0,06057 0,05938 0,05821 0,05705 0,05592
1,6 0,05480 0,05370 0,05262 0,05155 0,05050 0,04947 0,04846 0,04746 0,04648 0,04551
1,7 0,04457 0,04363 0,04272 0,04182 0,04093 0,04006 0,03920 0,03836 0,03754 0,03673
1,8 0,03593 0,03515 0,03438 0,03362 0,03288 0,03216 0,03144 0,03074 0,03005 0,02938
1,9 0,02872 0,02807 0,02743 0,02680 0,02619 0,02559 0,02500 0,02442 0,02385 0,02330
2,0 0,02275 0,02222 0,02169 0,02118 0,02068 0,02018 0,01970 0,01923 0,01876 0,01831
2,1 0,01786 0,01743 0,01700 0,01659 0,01618 0,01578 0,01539 0,01500 0,01463 0,01426
2,2 0,01390 0,01355 0,01321 0,01287 0,01255 0,01222 0,01191 0,01160 0,01130 0,01101
2,3 0,01072 0,01044 0,01017 0,00990 0,00964 0,00939 0,00914 0,00889 0,00866 0,00842
2,4 0,00820 0,00798 0,00776 0,00755 0,00734 0,00714 0,00695 0,00676 0,00657 0,00639
2,5 0,00621 0,00604 0,00587 0,00570 0,00554 0,00539 0,00523 0,00508 0,00494 0,00480
2,6 0,00466 0,00453 0,00440 0,00427 0,00415 0,00402 0,00391 0,00379 0,00368 0,00357
2,7 0,00347 0,00336 0,00326 0,00317 0,00307 0,00298 0,00289 0,00280 0,00272 0,00264
2,8 0,00256 0,00248 0,00240 0,00233 0,00226 0,00219 0,00212 0,00205 0,00199 0,00193
2,9 0,00187 0,00181 0,00175 0,00169 0,00164 0,00159 0,00154 0,00149 0,00144 0,00139
3,0 0,00135 0,00131 0,00126 0,00122 0,00118 0,00114 0,00111 0,00107 0,00104 0,00100