Está en la página 1de 244

ESTADÍSTICA Y PROBABILIDAD EN LA

HIDROLOGIA
(Diseño Hidrológico)

Abelardo M. Díaz Salas


ESTADÍSTICA Y PROBABILIDAD EN LA
HIDROLOGIA
(Diseño Hidrológico)

0.80 , 1

0.60) 1
fo

0.40 4

0.20 +

0.00
12 14

Abelardo M. Díaz Salas

Ingeniero agrícola. Universidad Nacional Agraria La Molina. Lima-Perú.


Magíster of Sciantie en Ingeniería de Recursos Hídricos. Universidad Nacional
Agraria La Molina. Lima-Perú.
Profesor principal de la Facultad de Ciencias Agrarias de la Universidad Nacional
sariiago Antúnez de Mayolo. Huaraz-Perú.
== diante de la Escuela de Posgrado de la Universidad Nacional Agraria La Molina.
>-oerama de Doctorado en Recursos Hídricos. Lima-Perú.
3achiller en Ingeniería Civil. Universidad Católica Los Ángeles de Chimbote.
Huaraz-Perú
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA
(Diseño Hidrológico)

Edición a cargo de : Asamblea Nacional de Rectores


Fondo Editorial
Calle Aldabas 337 - Surco
Teléf.: 275-4608
Web: www.anr.edu.pe

Presidente : Dr. Iván Rodríguez Chávez

Autor : Abelardo M. Díaz Salas


Instituto de Estudios Universitarios
"José Antonio Encinas"

Primera Edición A Noviembre 2010

Impreso en Perú

Tiraje : 1000 ejemplares


Año 2010

Registro de Proyecto Editorial. : 11501021001114


ISBN : 978-612-4011-46-7
Hecho Depósito Legal en la
Biblioteca Nacional del Perú N“: 2010-15871

Diseño de carátula
Billy Solano Anchante

Diseño, diagramación e impresión —: Instituto Pacífico S.A.C.


Jr. E. Larrabure y Unanue N* 188 - Of. 63,
Urb. Sta. Beatriz - Lima 1 / Teléf.: 332-5766
E-mail: institutoQaempresarial.com
Web: www.aempresarial.com

Queda terminantemente prohibida por la ley del Perú la reproducción total o parcial de esta obra por
cualquier medio, ya sea electrónico, mecánico, químico, óptico, incluyendo sistema de fotocopiado, sin
autorización escrita de la Asamblea Nacional de Rectores y Autor.
“Hay que trabajar como si uno fuera a vivir eternamente,
y vivir como si uno fuera a morirse hoy mismo”

OG MANDINO
A mi esposa Ing. Flor Consuelo Vergara Tinoco y a mis
hijos Abelardo y Pablo.
Al Colegio Nacional Mixto Pachacútec del distrito de
San Marcos, de la provincia de Huari, de la Región
Ancash, donde estudié la secundaria.
Presentación

M e complace sobremanera facilitar la publicación y entregar a profesores y


alumnos de ciencias y tecnología este libro de Estadística y probabilidad
en la Hidrología (Diseño Hidrológico) que tiene como autor al ingeniero
aoelardo M. Díaz Salas, profesor del curso en la Universidad Nacional Santiago
Antúnez de Mayolo de Huaraz.

>:n pertenecer a esta esfera profesional altamente especializada, en el Perú la


obliografía sobre estas materias es casi inexistente.

Además de este hecho, y fundamentalmente por su pertinencia, este texto cobra


s.ngular importancia por el problema de escasez del agua que, según pronósticos,
<ectaría gravemente a nuestro país.
11 tal sentido, el aporte del ingeniero Díaz Salas significa una herramienta de
=studio, diagnóstico y construcción de propuestas que deberán ser recibidas como
una contribución de la universidad peruana en una coyuntura natural e histórica de
zorizontes dramáticos.

-a Asamblea Nacional de Rectores siente cumplir con un deber académico asencial


con el profesor, ingeniero Abelardo M. Díaz Salas y de poner al alcance de los
=.umnos una fuente de consulta sumamente útil y necesaria para su formación desde
as aulas.

Octubre, 2010

Dr. Iván Rodríguez Chávez


Presidente de la Asamblea Nacional de Rectores y
Rector de la Universidad Ricardo Palma
Indice
Dedicatoria
Índice
Índice de cuadros
Índice de figuras
INTRODUCCIÓN
L ESTADÍSTICA APLICADA EN LA HIDROLOGÍA .cococcoconocono
nono nionn
nonnnaa,
1.1. Generalidades ....
1.1.1. MUES$A cocooncocccocononccnonacinnncnninoos
Estadística de la muestra
DTA2. Pobla cc
Parámetros de una población ..ocnnonnnonnnnononnnoconncnoninnonos
1.2, MÉLODOS EStAdÍStiCOS ooo

1.3.1. Recopilación cocconnnninnicininococecninconnannencnno


cnn rcncn
1.3.2. Clasificación
Í.
Procedimiento para obtener las distribuciones de frecuencias...
1.3.3, Presentación de katOS....ccocococoncononocnonicoconocnonococonononnn
no connnc conan conan
i. Presentación tabular o distribuciones de frecuencias................
ll. Presentación en forma gláfiCa .coccccnonoconcocccnnoccanonicncnons
11,1. — Distribuciones de frecuencias absolutaS onu...
1.1.1. Histograma de frecuencias absolutaS ooo ccnncccnnicconcno.....
11.1.2. Polígono de frecuencias absolutas .........
11.2. Distribuciones de frecuencias relativas
1i.2.1. Histograma de frecuencias relativas ooo...
11.2.2. Polígono de frecuencias relativaS ooo.
11.3. Distribuciones de frecuencias absolutas acumuladas. Ojivas....
1.4. Distribuciones de frecuencias relativas acumuladas. Ojivas .....
1.5. — Función de densidad empírica
1.3.4. Aplicaciones en hidrología
1.3.5. Descripción de datos oo oocconnncnciconononocconnnanooncanononnncnocons
l Estadísticas de pOSICiÓN....oooninnccnnncnconocoooooncnconononcnnnrnnnnnnono
¡.T. Meal cococococonanononcononnnnonoannnnnoncononcancnoncaoroncnonnnnnon
nrnnnranorenenanans
1.1.1. Media aritméltiCa....oooncocicicinoninncnnicioaornncannicaricicnnnon
1.1.2. Media global .ooooocococcocononoceconccnoonoconononoconcoooon
cn ncnncnnonono
onnonor
1.2. Mediada cooincccoccccccnononononicnccnnonins A rn cnn en ac
1.3.
11. 61
11,2. 61
11.3. 64
¡.4. Coeficiente de variación 67
1.4. Momentos muestrales, medidas de asimetría y CUMLOSIS....oooonnconnnnoncerencrnncnnanas» 67
1.4.1. Punto medio o promedio ...... 69
1.4.2. Medidas de variabilidad ........ 69
1.4.3. Medida de asimetría.............. 69
1.4.4. Medida de apuntamiento ...... 71
1.5. Estadística inferencial y modelos de probabilidad .... 74
PROBABILIDAD APLICADA EN LA HIDROLOGÍA cooccociocionionioncononconconconinnanccincnns 75
2.1. Generalidades .....ooonnoccniononnonnncnncnnn 75
2.2. Fenómeno aleatOriO....oooomonninnononccaes 75
2.3. Espacio muestial..oonncocinnnnnnonnonnono 76
2,4, Eventos — ssuesrsrrsrars 76
2.5. Diagrama de Venn y álgebra de eventOS ..ocoiononnconnccncanennanononconcrrcncononnrnnorennnnoo 76
2.5.1. Unión de dos eventos A y B 77
2.5.2. Intersección de dos eventos A y Bonocicnnocniononannncnnncananananoonorncnnnanananenannos 17
2.5.3. Complemento de un evento B..oooccccncnnonnononenennennancononroncrnnenonnonennnnos 78
2.5.4. Eventos mutuamente excluyentes ...ooconocconnonnnnnnannano
naar oronnonananacannnnnnono 78
2.5.5. Eventos colectivamente exhaustiVOS ..ooocoooonnccoonorononnnncnnono
car ronenccnanancnnn 79
2.5.6. Eventos independientes......... 79
2.5.7. Álgebra de eventOS...ococococoos. 79
2.6. Probabilidad de un evento 80
2.6.1. Axiomas de probabilidad 82
2.6.2. Reglas aditivaS...oooococcicinco.. 83
2.6.3. Probabilidad condicional ...... 85
2.6.4. Regla de multiplicación......... 87
2.6.5. Probabilidad condicional para eventos independientes ...oocionnccnnnonors» 87
2.7. Técnicas de COMÍ8O co occcccnconanonnnnnnonoss 90
2.7.1. Permutaciones 90
l Permutaciones de n objetos distintos tomados todos a la vez... 90
i. Permutaciones de n objetos distintos tomados de r en r........... 91
2.7.2. Combinaciones ...ccccnmononnenccnns 93
2.7.3. Binomio de NewtOM....coo....... 95
VARIABLE ALEATORIA Y DISTRIBUCIONES. ESPERANZA MATEMÁTICA Y
MOMENTOS DE LAS DISTRIBUCIONES 99
3.1. Generalidades ..........cooonoocnnnnnnnnnnnnnno 99
3.2. Variables aleatorias y distribuciones 99
l Función de densidad de probabilidades
ii. Distribución acumulada Cia
108
A O A cc
110
3.3.1. Propiedades de la ESPEranZa
MateMátiCa cconoc
o ocoroconon o... 113
3.4. Momentos de la distribución de Una
variable aleta
116
3.4.1. Momentos de una distribución de
probabilidades con respecto al
origen
117
Í.
117
3.4.2. Momentos con respecto a la media
118
Í.
118
ii.
120
iii. Puntiagudez o apuntamiento de una
distribución 121
MODELOS PROBABILÍSTICOS APLICADOS EN
LA HIDROLO GÍA coco. 133
4.1. Modelos probabilísticos o distribuci
ones de probabilidades
133
2.2. Modelos probabilísticos discretos
133
4.2.1. Distribución Bernal
133
AA DU a
135
ES
138
4.2.4. Distribución binomial negativa
140
E AAN
142
E Modelos pr CS O
144
AO A cc
144
PR Dd O O
153
IDO O A
.. 159
A O A
162
i CIÓN A cc
162
A a
177
4.3.6. Distribución de Gumbel
6.2.1. Comparación gráfica de las funciones de densidad de probabilidad ..... 203
6.2.2. Comparación gráfica de las funciones de probabilidad acumulada....... 207
l Gráfica de la probabilidad acumulada empíliCa ooo... 207
il. Gráfica de la probabilidad acumulada teórica... 208
6.3. MÉtOdO EStadístiCO ..ooooocioononnonnoncanononanoncaranononarnoccnnn
ono ro ronone aran conan encarna 214
6.3.1. Prueba de Chi-cuadrado ...oocoonoonnononnnononanininononarinoronoronenanernonncnnananonacas 214
6.3.2. Prueba de Kolmogorov-SMINOV ..ccooccccocinonoconinonanncancnn
ona nononnc ono nncnnrn nos 222
VII. PERÍODO DE RETORNO 227
7.1. Generalidades .....ooococonnmo....... 227
7.2. Perl0do de TetOMO...oooccicconicioroncononnonaninn
anno nonrononero corona na nencnconono rn non conca nnnannnnins 227
7.3. Relación entre el período de retorno y la probabilidad ......onnonnnnnionin........ 231
7.4. Relación entre el período de retorno y la función de distribución acumulada.... 234
VIII DISEÑO HIDROLÓGICO coccociconicononnncnononncnnnnonrnoncnornnomnasiooicno
cono ranenne cone cinco 237
8.1. Generalidades ..ooooninonocinionacnonnonanononnnnnnnanos 237
8.2. Aproximación empírica 238
8.3. «ANÁLISIS dé TIESBO vecs
si eran corr rra corner pne emanan 238
8.4. CriteriOs ECONÓMICOS ..oooooccoccooncconononconononannnnnnnonnnonencono
ron eonoronn non carac ne onrnn cian 242
8.4.1. Evaluación de los costos de la obra 242
8.4.2. Evaluación de los costos de los daños 244
i Costo de los daños 245
il Valor esperado del costo de los daños (S/. añO)...ocioninnincicinnins. 245
ii, Costo de riesgo del daño (S/. AñO) ..ococcniconioninnioniciccnacinacanannonos 249
8.4.3. Evaluación del costo total.....ooonnonicnnn.... AAN 249
8.4.4. Período de retorno óptimo 249
IX. BIBLIOGRAFÍA — cncoccconnncnonccnonnononninnonocnnoscnnnoonns
conan onnorennoncnnor coran cnnorr craneo 253
Indice de cuadros

Capítulo |
..1.1.. Descargas máximas instantáneas anuales del río Querococha (M/S) cc... 28
:.3.1. Descargas del río Querococha (m/s) — Estación Querococha occ. 32
1.3.2. Formato para llenar las frecuencias absolutas 36
7.3.3. Formato de la tabla de frecuencias (m3/s) 38
"3.4. Descargas máximas instantáneas anuales del río Querococha ordenadas en
forma ascendente (M/S) ccoccocconioninionconocio acanecononono nonnncnn
nono onnaniciciaas 42
7.3.5. Tabla de frecuencias de las descargas máximas instantáneas anuales del río
Querococha — Estación Querococha (M/S) .cocioicnncnioncnicocconoronorccnnnorcnnnacininns 43
“3.6, Frecuencia relativa, frecuencia relativa acumulada mayor y menor obtenidas
aplicando la ley de la probabilidad (datos del cuadro N% Td coo. 47
“3.7. Descargas medias anuales del río Querococha (MV ooo cccociconononononcononanoo. 50
“.3.8. Frecuencia relativa, frecuencia relativa acumulada mayor obtenidas aplicando
la ley de la probabilidad (datos del cuadro NO 1.3.7) mccncinconcononnecicnnananianos 51

Capítulo Il
2 Precipitaciones diarias (mm) en la estación de Querococha-1974 occ... 89

Capítulo HI
E Resultados posibles del ejemplo 3.1. cociconocncninninnoncoannnnonnonaniccnncnns 100
3.-. Ley de probabilidades del ejemplo 3.2. .... 100
23. Función discreta masa de probabilidades del ejemplo 3.2. 104

Capítulo 1V
Función masa de probabilidades de la distribución binomial del ejemplo 4.2.2... 137
La

2
Función masa de probabilidades de la distribución geométrica del ejemplo 4.2.4. 139
La

+ -.5. Función masa de probabilidades de la distribución binomial negativa del


SE 141
+- -. Función masa de probabilidades de la distribución Poisson del ejemplo 4.2.8. .... 143
+=”. Función de densidad de la distribución normal para diferentes valores de y yo... 145
i -.-. Función de densidad de la variable normal estándar z > (O/Dhiicinininincinininico 147
225. Valores de h(z) y z del ejemplo 4.3.T.conniciciinininninnoonoooorionconnrccronorcnnnranncinns 150
22. Aplicación del método de Newton-Raphson para encontrar el valor de Izl
para probabilidad de 0.2 del ejemplo 4.3.1. 0occcncnnonnnonconocnnnananncnncnancnonocnon 152
2233. Valores de X según la distribución normal (caudales máximos instantáneos
anuales del ríO QUerococha) ..oococonicinonononocccnonoc
oooncnnninocnonca
co noni nconcncannciciaion
non 153
i 20. Función de densidad de la distribución logarítmico normal para diferentes
Valores de UY O conaconcnnocanonnconononnonr corno nrnnnanoncoron
cnnnn na ronononr non nnrnnrnerarr
cncononcenar 155
3.7. Valores de X según la distribución logarítmico normal (caudales
máximos instantáneos anuales del río QUerococha) .nccccnnnnonniconnenanaccnnacinonons 159
4.3.8. Función de densidad de la distribución exponencial para diferentes
A AN 159
4.3.9. Valores de X según la distribución exponencial (caudales máximos
instantáneos anuales del río QUErococha)...ooooconocconcononncnncnncnanincononrn
ono rn cra racincnnos 162
4.3.10. Función gamma para 1 < au < 2.I(a) = [edx ernnnnnnn ore ron anno ra non rra rana rinanaros 166
4.3.11. Valores de la función galMIMa....conccccnnoconononononanonncnnrononerananccnn
cnn con canon cncncccnccnnss 168
4.3.12. Valores de la función de densidad del modelo gamma (ecuación 4.3.39.) ........... 170
Sis . y y AN
4.3.13. Distribución gamma incompleta G (y) = [ V CEA GA 173
F(a)
4.3.14, Descargas máximas instantáneas anuales del río Santa (m?/s). Estación: Recreta... 174
4.3,15, Valores de h(y) e y del ejemplo 4.3.5, cococococonoconnncnnnnronincnononinncancno
racer onorrnninrinanos 175
4.3.16. Aplicación del método de Newton-Raphson para encontrar el valor de y
para probabilidad de 0.2 [G(Y) = 0.2] del ejemplo 4.3.5. .occonconionioninnicnionnicnininanos 177
4.3.17. Valores de X según la distribución gamma (caudales máximos instantáneos
anuales del río Santa. Estación: Recreta)...oooonononinnnnnnnncnonannonannincionancncona
nro ncna cocino 177
4.3.18. Valores de la función de densidad del modelo Pearson ll para x,=10 (ecuación
ALSO.) cocccccacccnono cn ncnnnnnonnnccnn crono ncnn casona rason nr ron rrnnn nro nen ro nn nn rra nrnnn nana re onn errar ce rann erronea 179
4.3.19. Descargas máximas instantáneas anuales del río Santa Cruz (m?/s). Estación: Colcas. 182
4.3.20. Valores de h(Y) e y de la distribución Pearson !ll del ejemplo 4.3.6. ..noooocn.c.... 183
4.3.21. Valores de X según la distribución Pearson lI! para la probabilidad
IS 184
4.3.22. Valores de X según la distribución Pearson III (caudales máximos instantáneos
anuales del río Santa Cruz. Estación: COÍCAS) ...oooocicnconnnaniccnncininccnrnnnacanononororionanos 185
4.3.23. Valores de la función de densidad del modelo Gumbel ..oncionicnonicninnnoncinnicinnnnins 186
4.3.24. Valores de X según la distribución Gumbel (caudales máximos instantáneos
anualesidal Ho ¡QUECO errar 190

Capítulo V
5.1. Logaritmo de la función de verosimilitud del ejemplo 5.3. c.ooconononininiininnim.. 200

Capítulo VI
6.1. — Funciones de densidad: empírica, distribución normal y distribución exponencial
de las descargas máximas instantáneas anuales del río QUerocCoCha....occcocinosnonoso 206
6.2. Probabilidades acumuladas: empíricas y teóricas de la distribución normal y
exponencial del ejemplo 6.2. .oncocccicnnonconooncanannconcnnncnnonconnon
non cono rno rn ocn nceronanronnnonos 213
6.3. Función de densidad de la distribución x? para diferentes grados de libertad ...... 215
6.4. Prueba de bondad de ajuste de la distribución normal de las descargas
máximas instantáneas anuales del río QUerococha .ccoccocccconencconnnnonennnocanononeninanos 221
6.5. Prueba de bondad de ajuste de la distribución exponencial de las descargas
máximas instantáneas anuales del río QUErococha ..moccoocccnonananinoonnnononnnnnnnnrnonana 221
6.6. Prueba de bondad de ajuste de la distribución Gumbel de las descargas
máximas instantáneas anuales del río QUerococha ...oooooocionnccionnneniorinnnoncnnacanecanes 222
6.7. Prueba de bondad de ajuste de Kolmogorov-Smirnov (distribución normal) del
Ejemplo 6.h. conconon cncononnonncononanonnononnon
nono nono naco n rra rar rra coran aora rro rra r rana rra canaria 225
6.8. Prueba de bondad de ajuste de Kolmogorov-Smirnov (distribución exponencial)
del ejemplo Ghs vrs ar RITA e NOA 226

Capítulo VII
7.1. Interpretación del tiempo de fetOTMO ...ooonicincnononconnnnnnona
conan nono nooo nono ncnnninrananrnnnninoo 228
7.2. Descargas máximas instantáneas anuales del río Querococha (m/s). — tiempo de
(HOMO prat
AI EINER AEREA 230
7.3. Función de densidad del período de retOrMO.....oocononorconononananonnnnonanonnnnnonnnononncnnnos 233

Capítulo VIH
Ss 2 Períodos de retorno para el riesgo permisible durante la vida esperada de la obra 240
E 2.2. Descargas (m/s) para diferentes períodos de retorno del ejemplo 8.3. ................. 244
E 23.3. Costo de la obra y costo de los daños del río Querococha ...cocooconcccnonnnconaninnnnnnass 250
h 23.4. Análisis económico del ejemplo 8.4. ..o.oooononnconiccnionnonnonnconnonnnnononnnocononnonononnrnnnnnnns 251
Índice de figuras

Capítulo |
“.1.1. Descargas máximas instantáneas anuales del río QUerococCha....ooconicnciociommm.... 29
7.3.1, Histograma de frecuencias absolutas de las descargas máximas instantáneas
añuales del río Querococha seur eos 43
*.3.2. Polígono de frecuencias absolutas de las descargas máximas instantáneas
anuales del ríO QUErOcCocha ..ocoocccociconnnonnononnnnocinninncnncanononnncononnoranonanan
nan sn nicas 44
7.3.3. Frecuencias absolutas acumuladas menores de las descargas máximas
instantáneas anuales del río QUerococha coccion niccconnccnorenornonorarenon con rnrrnonnnnos 44
1.3.4. Histograma de frecuencias relativas de las descargas máximas instantáneas
anuales del río QUErocCocha.....cconmonnnnnonnorncacinnonacancnnconoor
cono on arc rn o narra anaonr ancora A5
7.3.5. Polígono de frecuencias relativas de las descargas máximas instantáneas
anuales del ríO QUErococha ...ciomiccnonnnonnonnonccnnonnonaronconoraconornornnonanno
rn nono ninonaanacianns 45
7.3.6. Frecuencias relativas acumuladas menores de las descargas máximas
instantáneas anuales del río QUErococha .cocoocccnccnonononoonncoanonanonanconornnnnnc
cono rnnonos 46
1.3.7. Función de densidad empírica de las descargas máximas instantáneas
anuales del ríO QUEeroCocha concocoicconnconninoniorianascaronononnonn
conca roronnono aca nancs ron narnnoros 46
1.3.8. Frecuencias relativas acumuladas mayores o la probabilidad de la descarga de
ser igualado O SUPerado AQ eccccicnnicicnnnconcnnoncnnoconroncononnonco
non n nn rn rnnoronn orar nina rinruons 48
3.9. Frecuencias relativas acumuladas menores o la probabilidad de la descarga de
SET MENOFA O. rr A A Sr men nera 48
7.3.10, Estadísticas de posición o de localización (valor central) de la
distribución de frecuencias 54
1.3.11. Nlustración gráfica de la clase mediana 59

Capítulo Il
2.1. Diagrama de Venn. Unión de dos eventos. Región sombreada AUB ..oooniccccnncnos. 77
2.2. Diagrama de Venn. Intersección de dos eventos. Región sombreada AB.............. 77
2.3. Diagrama de Venn. Complemento de un evento. Región no sombreada ............. 78
>
Diagrama de Venn. Eventos mutuamente excluyentes ...ooooconccooncncnnnncncnccconccnonnoss 79
+

2.5. Diagrama probabilidad condicional PIB/A) ..oooonoccnnicnnicnnircormarirorcorornorcrnrnrcarns 85

Capítulo 1!
3.1. — Ley de probabilidades para ¡ilustrar el lanzamiento de dos dados
3.2. Función discreta masa de probabilidades del ejemplo 3.2. ....ooooccociccniccnccanicconnnnss
3.3. Distribución acumulada discreta del ejemplo 3.2. ..ooococcccccnnnonnnoooncconacinonornnonnnncos 105
3.4. — Función de densidad de probabilidades del ejemplo 3.5. ....onoonnnnnononncnnuniannonanasos 108
3.5. Distribución acumulada continua del ejemplo B.6....ooooconccconocnccocnnconncoonnnonnrornnonns 110
3.6. Frecuencia relativa del experimento del lanzamiento de monedas del
CN 112
3.7. — Función de densidad de probabilidades del ejemplo 3.12. .oconcnnicinnconmmmmms. 123
Capítulo IV
4.2.1. Función masa de probabilidades de b(4,0.1) y b(4,0.5) del ejemplo 4.2.2. ..........
4,2,2, Función masa de probabilidades de la distribución geométrica del
ejemplo 4.2:4 0D Y E0D errata
4.2.3. Función masa de probabilidades de distribución binomial negativa del
ejemplo 42. ccoo cococccccnoncnnncn cnn ron ocn nr non ran rc cnnrrn nro rnnnrnnnnnninnrnn enanas 142
4.24. Función masa de probabilidades de la distribución de Poisson
A 143
4.3.1. Función de densidad de la distribución normal para igual sigma y
diferentes MediaS c.occoccnnonnoncnonnconcnnnnconnoonrnnr
cone r nn nen rear ona rena rana rare carne canaria
4.3.2. Función de densidad de la distribución normal para igual media y
diferentes valores de SigIMa ....onnconicnonnnonecnncananoraconaronananannronraran
arc cana an orar enn r carino
4.3.3. Función de densidad de la variable normal estándar .
4.3.4. Valores de híz) para la probabilidad de (B=0.2) Del ejemplo 4.3.1. ..oconnninnnninnn.
4.3.5. Función de densidad de la distribución logarítmico normal para igual
desviación estándar y diferentes valores de Media ..oooooncnnnnnnncnnonnonnoncnnancnnoonncnnon
4.3.6. Función de densidad de la distribución logarítmico para igual media y
diferentes valores de desviación estándaF...oooococoncccononnnnononnnonnonanonooncncnornarnonononanon
4.37. Función de densidad de la distribución exponencial ....ononinninnnnccinnnonorecncnncnnono
4.3.8. Función gamma para |< alfa< Zniiinnainnnicnaninoninnananoncc
canon narran rancia
4.3.9. Gráfica; de 13 FUNCIÓN LATTMA ecovacorcoconnrrn a
4.3.10. Función de densidad del modelo gamma para beta=1 y diferentes
valores de alía .onconiccninconoconononcnnnnonnonnonrnonnn
cnn ncnn no ren nara na nr na narrar narran crnnaranannnns
4.3.11. Función de densidad del modelo gamma para alfa=4 y diferentes
valoresidebela cerrar
4.3.12. Gráfica de h(y) para la probabilidad de G(Y)=0.2 del ejemplo 4.3.5. 0omoooncc.o....
4.3.13, Función de densidad del modelo Pearson III para x,=10, beta =1 y
diferentes valores de alfaro ni AAA
4.3.14. Función de densidad del modelo Pearson lll para alfa =5, x¿=10 y
diferentes valores de Deta ..oooconnoncnonennincnanonononncnoncnnnnonnno
cono ccoo rn reno ncannrnn ren rrra renos
4,.3.15. Gráfica de h(y) para la probabilidad de G(y) =0.2 de la distribución
Pearson Ill del ejemplo 4.3.6. coooooccocccoccionoonnnoncnononancnnncnn
ano no rana ninon o rro ronca econo 184
4.3.16. Función de densidad del modelo de Gumbel para beta =3 y diferentes
valores delalía, — cr os EEN AAA
4.3.17. Función de densidad del modelo de Gumbel para alfa=2 y diferentes
Valores de Deta— nmmciccnnnnnnnncancnnonoronrono
nro roncrarrnrcannnnaaarrrrrrarin
Capítulo V
3.1. Logaritmo de la función
de verosimilitud del HO
201
Capítulo VI
5.1. — Función de densidad:
empírica, distribución nor
O mal y distribución
O
5.2. Probabilidad acumulada: 207
empírica, normal Y expone
6.3. — Función de densidad ncial del ejemplo 6.2. .....
de la O .. 212

Capítulo VII 215

1. Caudales máximos instantá


neos anuales del O QU
7.2. Función de densidad del e a
período de retorno 231

Capítulo VIII 233

2.1. Riesgo de ocurrencia de una


vez del evento hidrológico
ITA durante la vida
3.2. Descargas para diferentes ida 240
períodos de SEC
3.3 Relación entre la función 244
de densidad y el evento A
3.4. Relación entre la función 246
de densidad y el costo
de los daños
3.5. Costo de daños para diferent 246
es probabilidades
3.6. — Análisis económico 247
O A cr
252
Introducción

taria, me permito
Después de varios años de experiencia en la docencia universi
Ta
az

libro que trata de la aplicac ión de la estadís tica y probabilidad en la


--asentar el
>rología con énfasis en el diseño hidroló gico.
y de la probabilidad que
= "bro está relacionado a la aplicación de la estadística ran
gicas que se conside
2="mitan interpretar el comportamiento de las variables hidroló
32m0 sucesos al azar.
ntes y los
=-*es
x
de la aparición de las computadoras personales, los estudia (T=student,
estadíst icas
-">esionales que aplicaban la estadística se ayudaban de tablas
etación fácil, estos
- --mal estandarizada, etc.), cuyo manejo no es de interpr
los usuario s de estas tablas no visuali zan objetivamente
-convenientes surgen porque
En la actuali dad, con la ayuda
-s procedimientos de la generación de dichas tablas. ina de métodos
con los conoci miento s de la discipl
== 'as computadoras personales y interpr etación y
cual la
- _méricos, es posible generar las tablas estadísticas, con lo
se hace sencillo .
=" ¿cación de la estadística y probabilidades
trabaja con la ley de
=- hidrología y en cualquier otra disciplina cuando se
probabilidades adecuada
--obabilidades, es necesario conocer la ley O leyes de
(muestr as). Para seleccionar el modelo
- adecuadas para los datos experimentales de chi-cuadrado,
s, como por ejempl o la prueba
=zecuado existen varios método necesar io generar
drado, es
zara realizar la prueba de bondad de ajuste de chi-cua
.= ores de la variable aleatoria.
do para eventos extremos
Después de seleccionar el modelo probabilístico adecua
de diseño (por ejempl o descargas) para un
—áximos), se cuantifica el evento se encuentra de tres
==terminado período de retorno. El período de retorno de diseñoel análisis económico.
asumie ndo un nivel de riesgo O median te
— 2neras: empírica,
capítulos segundos,
primer capítulo trata sobre la estadística descriptiva; en los s probabilísticos
probabi lidad y los modelo
-="cero y cuarto se estudia las leyes de
¿s usados en la hidrología.
n estimar los parámetros de
=- el capítulo quinto se estudia los métodos que permita
=s distribuciones de probabilidad (discret o o continu o). En el capítulo sexto se trata
gráficos y estadís ticos que permite n seleccionar el modelo
== "os diversos métodos
de datos (muestra). En el
os modelos probabilísticos adecuados para un conjunto ilidad y el período de
apítulo séptimo se analiza la relació n que existe entre la probab
Los valores de diseño
=-orno. En el capítulo octavo se estudia el diseño hidrológico. modelo probabilístico
retorno y para un
- drológico se calculan para un período de
o de retorno de diseño.
=cecuado, este capítulo está orientado a determinar el períod datos hidrológicos.
=- todos los capítulos existen ejemplos de aplicación usando
Santiago Antúnez de Mayolo
go llegar mi agradecimiento a la Universidad Nacional
de Rector es por su apoyo, por haber hecho realidad la
. a la Asamblea Nacional
- uplicación del presente libro.
te publicación, por favor
= nalmente, debo indicar que si existen errores en la presen
ción.
=enen comunicar para realizar su respectiva correc
CAPÍTULO

Estadística aplicada en la hidrología

1.1. Generalidades
La interpretación del comportamiento espacial y temporal de las variables
hidrológicas (precipitación, descargas, etc.) se puede realizar mediante
la estadística.
En hidrología es costumbre trabajar con los datos como los mostrados en
el cuadro N* 1.1.1., estos datos son recopilados de las oficinas como del
Servicio Nacional de Meteorología e Hidrología (SENAMHIen el Perú.
Los datos tienen dos partes: la fecha de suceso, en este caso los años,
y los números que representan la ocurrencia o suceso de una variable
hidrometeorológica (datos observados o medidos), que son las descargas
máximas instantáneas anuales en este caso.
En la hidrología se recopilan datos como lo indicado en el cuadro
N? 1.1.1. (muestra), con el objeto de inferir las conclusiones respecto a la
fuente de observaciones (población). Comúnmente en la hidrología para
evaluar el comportamiento de los datos en el espacio y en el tiempo, son
graficados de dos maneras: gráfica de la serie histórica o las gráficas de
las frecuencias. Los estudiantes están más familiarizados con la gráfica
de la serie histórica como se muestra en la figura N* 1.1.1.
Estapística Y PROBABILIDAD EN LA HiDROLOGÍA (DISEÑO HiproLócico)

Cuadro N* 1.1.1.

Descargas máximas instantáneas anuales del río Querococha (m*/s)

Q Año Q Año Q
+ ¿Año
1963-1964 5.88 1973-1974 7.48
1953-1954 6.94

7.95 1964-1965 9.10 1974-1975 10.72


1954-1955

1965-1966 6.52 1975-1976 10.21


1955-1956 6.50

1966-1967 9.80 1976-1977 8.97


1956-1957 6.77

1967-1968 4.93 1977-1978 8.13


1957-1958 6.39

1968-1969 3.98 1978-1979 8.96


1958-1959 6.26

1969-1970 6.87 1979-1980 4.89


1959-1960 8.90

1970-1971 6.70 1980-1981 9.40


1960-1961 8.00

1971-1972 8.90 1981-1982 10.78


1961-1962 9.40

5.80 ]
1 962-1963 7.56 1972-1973

Fuente: Hidroservice

Los conceptos de muestra y población se diferencian en el número de


datos. La muestra tiene una cantidad reducida de datos en comparación
con los datos de la población que pueden tener finita O infinita cantidad
de datos. La definición de población en la estadística es utilizada por-
que las primeras investigaciones se hacían en las poblaciones humanas
ico
especialmente por los economistas y sociólogos, el trabajo estadíst
se realizaba en una parte de la población humana llamado muestra. Por
tanto, las definiciones de población y muestra se deben a las primeras
investigaciones. En hidrología se acostumbra usar estas mismas defini-
ciones y decimos que el número de datos de una población es infinito;
por ejemplo, no es posible conocer la totalidad de sucesos (observacio-
la
nes) de las descargas máximas instantáneas anuales en un punto de
cuenca.
ABELARDO M. Díaz SALAS

>

Descarga (m/s)
ho
1
Ps6lec6L |

+
8561-2561

2961-1961

9961-5961

0Z61-6961

VL6L-EL6L

8L61-2Z61

C861-1861
Tiempo (Años)

Figura N* 1.1.1. Descargas máximas instantáneas anuales


del río Querococha

1.1.1. Muestra
Es el conjunto de observaciones (datos) que se obtienen de alguna
fuente de observación (población). El número de datos de una
muestra es finito, es decir, se puede cuantificar por ejemplo la mues-
tra del cuadro N? 1.1.1. que tiene 29 datos de descargas máximas
instantáneas anuales. Si la muestra es representativa de la población,
entonces se pueden inferir conclusiones importantes acerca de la
población, a partir de los análisis de los datos muestrales.
i. Estadísticas de la muestra
Son magnitudes que se calculan para caracterizar a un conjunto
de observaciones o datos llamada muestra aleatoria extraída de
una población. Usualmente a la estadística de la muestra se le
denomina estadístico o estadística. El valor del estadístico no es
una magnitud constante, por ejemplo el promedio de las preci-
pitaciones máximas diarias anuales de una estación determinada
es diferente para una muestra de 10 años frente a una muestra
de la misma estación de un período de 20 años de registro. Por
tanto, un estadístico se puede definir como una función de las
variables aleatorias que constituyen una muestra. A los estadís-
ticos se acostumbra representarlos mediante el alfabeto Latino,
como por ejemplo el promedio se representa por x.

E
CO)
Estapística Y PROBABILIDAD EN La HIDROLOGÍA (DISEÑO HIDROLÓGI

1.1.2. Población
número
Es la fuente de observación o de los datos, por ejemplo el
s ins-
de datos de la población formada por las descargas máxima
n de Queroc oha es infinito , porque
tantáneas anuales de la estació
desde
se considera a las descargas máximas instantáneas anuales
a instan tánea anual en esta
el primer suceso de la descarga máxim
se podrán contabi lizar la
estación de aforo; como es lógico, nunca
totalidad de estos datos.
l.. Parámetros de una población
Son magnitudes que caracterizan a la población y cuyo valor no
se puede calcular con exactitud, sólo se pueden estimar a través
de los estadísticos. Los parámetros dependen básicamente del
a
tipo de distribución de la variable aleatoria que representa
o, la poblac ión de las precip itacio nes
la población; por ejempl
ución
medias anuales puede ser explicada mediante la distrib
la media y la varian za o”. El
normal, cuyos parámetros son
valor del parámetro no se ve afectado por muestras tomadas
de la población. A los parámetros se acostumbra representar-
los mediante el alfabeto griego, como por ejemplo la media
poblacional se representa por y.

1.2.Métodos estadísticos
la pobla-
Son los métodos que permiten obtener conclusiones acerca de
estadística
ción a partir de la muestra, o por medio de muestras; la palabra
estadís ticos. Los estudia ntes
se usa comúnmente en vezde usar métodos
ticos, es
en el curso de Estadística están aprendiendo los métodos estadís
r las conclu-
decir, están aprendiendo las técnicas que permiten obtene
tamiento de la
siones relacionadas a la población, analizando el compor
muestra.
s en principios
Los métodos estadísticos, o la estadística, están basado
conjun to de obser-
matemáticos que describen el comportamiento de un
los datos mismos sin
vaciones (muestra), donde se centra la atención en
decir, la estadística
considerar las causas que influyeron en el suceso; es
de causalidad.
es una ciencia de descripción de los resultados y no
define como una
Por las consideraciones indicadas, a la estadística se
permiten recopi-
técnica que proporciona un conjunto de métodos que
esta parte de la
lar, clasificar y presentar los datos en forma adecuada, a
parte de la
estadística se le denomina la estadística descriptiva. La otra
la población a
estadística que permite tomar decisiones relacionadas a
ación de parámetros
partir de la muestra es la estadística inferencial (estim
y prueba de hipótesis).

o
ABELARDO M.. Díaz SALAS

1.3.Estadística descriptiva
La estadística descriptiva recopila, clasifica, presenta y describe los datos;
es la parte de la estadística que se ocupa de describir la muestra, sin inferir
conclusiones acerca de la población, también se le denomina estadística
deductiva.

1.3.1. Recopilación
La recopilación de la información en la hidrología se realiza tomando
muestras (datos), dado que no es posible recopilar todos los datos
de la población referente a una variable hidrometeorológica. Como
se trata de una muestra y se considera que la recopilación de los
datos se efectúa al azar, se dice que el muestreo es aleatorio y por
consiguiente a la muestra se le denomina muestra aleatoria.
Un ejemplo de datos recopilados se muestra en el cuadro N* 1.3.1.
En los cursos de Estadística los estudiantes están acostumbrados
a trabajar con datos de encuestas, o con datos de las notas de los
exámenes de un curso; en la hidrología estos datos son medidos o
observados en el campo en una estación hidrometeorológica (datos
medidos o observados por SENAMHI u otra institución).

1.3.2. Clasificación
Los datos hidrometeorológicos que se recopilan son registrados como
se muestra en el cuadro N? 1.3.1. Para facilitar la interpretación y
la evaluación correspondiente, estos datos deben ser clasificados o
categorizados o distribuidos en clases; es decir, los datos deben ser
organizados en clases o grupos. La clasificación se logra ordenando
los datos según su magnitud en forma ascendente o descendente y
luego se agrupan en clases. Al clasificar los datos, se determina el
número de datos en cada clase, dado que cada una de estas clases
tiene sus límites (valores) superior e inferior definidos.
IDINMISOIPIH '3JUINJ
“IDIAYISOJAIH 0d SOPeuI!]sa SOJeQ - 2861 9 1861 :0poag
S/gu ELL = Opolad J9p OIPauoJg "N1dOY DALI 10d soperunso sojeg (y)
690 sel 86'1 v6'L oz 20'L 680 +90 LEO eurayus
9%) LEZ ee € US e79 A 1S€ 6L'£ 691 vO'L PuIIxBuL
7A0) 8/0
690 971 Grez LLE este 097 LUZ 091 v1L 2190 e1paul
6t'0 8r0
- - + . z - ¿SE £ST es! 560 £8-28
- + * - 3 78-18
LO 290 LOL 91uz zO'£ 90's 97€ 08€ 6LE 071 6r0
seo 8/01 LOz 8£'0 18-08
2590 950 960 voz 86'€ 895 LEZ 6L7 z6'L srl 960
seo ob'6 261 6r'0 08-62
990 980 EEL sz SST LUZ 881 951 801 160 980
8s'0 68't LL 8/0 61-82
290 50 6b"L €8'€ 196 E8'€ s6'L TUT 9r'L 80'L vO'L
0s0 968 907 TO ELO 8/L
sy0 0S'0 780 8£'L 06'L E9€ Lp 96'1L 6UZ Sez vol
eco £L8 8/1 vt'0 LE9L
150 150 890 szL zOZ 687 ob”E vo cel 680 10
0b'0 168 6£'L 6-0 9/8£
80 ev'O 890 s6'0 0LZ sr'€ TES ee z 981 Obv'L vEL
ee0 1301 D8'L 190 obv'0 Se bL
LL 190 eso 00'L suZz 6yz v6p 867 «897 801 160
yE0 7L'01 68'L €90 vL-EL
evz 6£'0 vv0 8/0 vo'L ev'€ 06'y 6€'S tE b S'E€ voz
670 8bZ 10 6v'0 EL TL
£9'L vS0 £5'0 8/0 UL v9€ v9€ ESE 97 091 +60
veo 08's SUL 950 TL-1L
EST 6L'L +6'0
Estapística Y PROBABILIDAD EN La HiDROLOGÍA (DisEÑñO HibroLóGiIco)

9€0 06'8 08'L or'0 sr0 vZ'0 6EL TUE 2S L9z


290 01L 9yz ely Ss6'£ 997 LE: Suz trL +60 1-02
Ly0 0/9 TOZ z750 8b'0 04-69
8/0 931 LEZ ULT 00€ 6£€ Ev 3 EL 560 ss0 '
0v'0 189 607 290 69-89
8€'0 040 vo'L Ev z TUz £Oz TL eTL 965t 9€1 090
e70 86€ D€'L ebr'0 150 89-49
LO TEO 9r'0 6%0 sel 61€ vEz 98'L 91 S6'1 121
Lv0 26'p vel 110 19-99
10 150 290 071 96'L 26€ E79 LEZ LO LES 19
0€'0 086 £6'L 0L'L 680 99-59
9L1 290 290 90 091 181 LT 6 vTE 697 8/1
Ly0 25'9 911 8s0 s9-p9
est sr'0 9y'0 yO 10'L 6UZ s/p v6'L 961 ss ELL
se'0 016 O7'L 090 v9-£9
76'1 050 850 10 0s'L LT 0€'£ 19€ LT ETE >»UZ
ezO 88s 960 +90 9rv'0 £9-79
9sL 291 ob0 9£0 790 zO'L TEE et'y s6'£ 80'£ 071
+10 LOZ s90 050 79-19
or'6 161 LEO vE0 +<'0 901 Wiz tv 66'£ elb 967
LLO vEL s60 +vS0 19-09
00'8 91 ov0 10 08'0 SEL L87 6L'€ L9Z LUE LL
110 SEL eZ'L 790 09-65
06'8 9/1 8b0 9t'0 990 151 97 86'L 66€ +67 vo E
210 siíL 560 tOoL 10 65-86
979 os só0 10) 590 zS'L VEZ E6'£ 14M 191
210 LZL E9L 971 190 85-26
oL'0 6£9 sel 650 sy0 s90 90'L TZ LE LUZ 191
290 eTL SsUz 197 oy z 0z'L zi 160 sol ESO 16-98
910 119 yl 150 ESO
9t'0 s6'0 SsUz 967 ELE E0z 061 zO'L 90 vr0 96-56
91'0 059 6£'L LE0 9€0
250 911 97 z0'S £0'S £0'£ os't +60 940 10 SS-pS
010 S6'L L8'L 670 seo
vr'0 eZ'L SL 9£€ Ssoz er£ 991 8/1 280 LY0 vS-ES6L
600 169 154 00) 870
sapenuy saenuy ¡emisy
'0By mí “unf “Ae “qy BN “qua ou a “LON "PO vs oUYy
801 sur
E "20 PIP
eyoodoJanO UOIDeJs] - (S/¿LU) BydonolangO) Oy [ap se31e3959(
“1"£"L oN O4Pen)
ABELARDO MI. Díaz SALAS

Una forma de presentación adecuada de los datos es mediante una


tabla donde los datos están agrupados en clases con sus respectivas
frecuencias por cada clase, esta manera de ordenar los datos se conoce
con el nombre de distribución de frecuencias o tabla de frecuencias;
por tanto, la frecuencia (absoluta) representa el número de datos
de cada clase. A los datos ordenados y resumidos en una tabla de
frecuencias, se le suele llamar datos agrupados. Los términos celda,
intervalo de clase, clase o grupo son sinónimos en la estadística.
i. Procedimiento para obtener las distribuciones de frecuencias
El procedimiento recomendado para clasificar los datos es el
siguiente:
1. Ordenar los datos en forma descendente.

XmnáxrXmín. ] (1.3.1)
[

Donde
x = variable hidrológica (valor numérico de la muestra)
- =valor máximo de la muestra
X mín, = Valor mínimo de la muestra

Por ejemplo, los valores de x pueden ser las descargas


máximas instantáneas anuales del río Querococha.
Calcular el rango o la amplitud de la muestra mediante la
siguiente ecuación:

R = Xmáx. _ Kmnín. a 3.2.)

Donde:
R = rango.
Calcular el número de intervalos de clase.
El número de intervalos de clase se calcula mediante la
ecuación de Sturges:

K = 1.33 LN (n) + 1 | (1.3.3.)

Donde:
K- = número de intervalos
de clase
n = tamaño de la muestra o número de datos de la muestra
LN = logaritmo natural o neperiano

: 33 |
EstapísTICA Y PROBABILIDAD EN LA HiDRoLOGÍA (Diseño HiDroLóGICO)

Si se trabaja con datos hidrológicos, Villón 207 sugiere


considerar las siguientes relaciones:
Si n<30>K<5
Si 30<n<75>8<K<10
Si n>75>10<K:<30

Calcular la amplitud de cada intervalo de clase.


La amplitud o tamaño de cada intervalo de clase o ancho
de cada clase se calcula mediante la siguiente ecuación
(se obtienen intervalos de clase de igual tamaño):

AX e (1.3.4.)
K

Donde:
AX = tamaño de cada intervalo de clase
5. Calcular los límites de clase de cada intervalo de clase.
+ Los límites de clase del primer intervalo de clase se
calculan mediante las siguientes ecuaciones:

l Aín, (1.3.5,

LS, = Ll, + Ax a (1.3.6,)

Donde:
Ll, = límite inferior del primer intervalo de clase
LS,= límite superior del primer intervalo de clase

+ Para los demás intervalos de clase los límites se ob-


tienen mediante las siguientes ecuaciones:

LI, = Ll,_, + Ax (1.3.7)

MA LS, = Ll, + Ax (1.3.8,)


ABELARDO MI. Díaz SALAS

Donde:
LI, = límite inferior de un intervalo de clase
LS; = límite superior de un intervalo de clase
¡ =2,3,....K (intervalo de clase)

Calcular las marcas de clase.


La marca de clase de cada intervalo es el punto medio
de cada intervalo de clase, el cual se calcula mediante la
siguente ecuación:

me t1Si
Hi == (1.3.9)

Donde:
MC = marca de clase
LS; = límite superior de un intervalo de clase (K;)
LI, = límite inferior de un intervalo de clase (K;)
¡ =12..K

Calcular la frecuencia absoluta,


Es igual número de observaciones o datos que existen en
cada intervalo de clase. La frecuencia absoluta se obtiene
contando el número de datos en cada intervalo de clase,
se acostumbra simbolizar por n, representado mediante la
siguiente ecuación:

! fa, = 1 (1.3.10,)

Donde:
¡=1,2,...K
ni número de datos de intervalo de clase (K;)
Il

Para calcular la frecuencia absoluta, se tabulan los datos


(observaciones) llenando el siguiente formato.
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)

Cuadro N? 1.3.2.
Formato para llenar las frecuencias absolutas

N*de clase o Límite de Tabulación o conteo coo as


intervalo de clase clase de datos observados cada clase (n)

1 Ll, -1S, pio n,


5 LI, -1S, po 1 n,

K Ly —LSy mn De
Total Suma n

8. Calcular la frecuencia absoluta acumulada mediante la


siguiente ecuación:

K K

Fa¡= fa; = Dm; =0M;1=1,2,....K (1.3.11,)


i=1 i=1

9. Calcular la frecuencia relativa de cada intervalo de clase.

fr = "1 (1.3.12)
n

Donde:
fr, = frecuencia relativa del intervalo de clase i
n; = número de observaciones en el intervalo de clase i
n = número total de datos (observaciones)
¡=1,2,...K
La frecuencia relativa tiene las siguientes propiedades:
i OSfr<1 Y = 1,2...15
k

¡ Dfi=1 ¡=12..K
i=1

10. Calcular la frecuencia relativa acumulada


La frecuencia relativa acumulada se calcula mediante la
siguiente ecuación:

(1.3.13.)
ABELARDO M. Díaz SALAS

11. Calcular la función densidad empírica.


Las frecuencias relativas obtenidas mediante la ecuación
(1.3.12.) son dependientes del tamaño del intervalo de
clase Ax y de la posición del límite de clase. Para corregir
esta influencia o dependencia, la frecuencia relativa se
divide entre el tamaño del intervalo de clase obteniéndose
la ecuación (1.3.14.). En la ecuación (1.3.4.) se observa
que cuando el tamaño de clase tiende a cero, el número
de intervalos tiende a infinito.
Las funciones de frecuencia relativa y de frecuencia relativa
acumulada son definidas para la muestra, estas funciones
para describir la población se aproximan como la función
de límites a medida que N > «o y Ax > 0, en el límite la
función de frecuencia dividida por el intervalo de tamaño
Ax se convierte en la función de densidad de probabilidad
f(x). La función de densidad de probabilidad se estudia
con más detalle en el capítulo II.
La función de densidad empírica para los datos de la
muestra se calcula mediante la siguiente ecuación:

fe.=lim—m—l= i (1.3.14.)

Por las consideraciones indicadas para definir el modelo


probabilístico adecuado como normal, exponencial, etc.,
para un conjunto de datos observados (muestra), es nece-
sario determinar la función de densidad empírica, lo cual
se compara con la función de densidad teórica. Sobre
el tema de selección del modelo adecuado se trata en el
capítulo VI.

1.3.3. Presentación de datos


Después de la clasificación de datos, es necesario presentar los re-
sultados en forma de tablas y en forma de gráficos, con la finalidad
de facilitar su interpretación y su posterior análisis.
i. Presentación tabular o distribuciones de frecuencias
La presentación tabular o las distribuciones de frecuencia o
tabla de distribuciones de frecuencias es una tabla que divide
los datos de la muestra en cierto número de clases, donde se
muestra el número de datos en cada clase, a este número de
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)

datos en cada clase se le conoce con el nombre de frecuencia


de clase o simplemente frecuencia. La presentación tabular o
la tabla de frecuencias tienen el siguiente formato:

Cuadro N* 1.3.3.
Formato de la tabla de frecuencias (m3/s)

Frecuencia
relativa
(5)

ii. Presentación en forma gráfica


Una distribución de frecuencia como lo indicado en el cuadro
N? 1.3.3. es más fácil de interpretar en presentaciones gráfi-
cas. Las presentaciones gráficas son: histograma, polígono de
frecuencias, distribución de frecuencias acumuladas, distribu-
ciones de frecuencias relativas acumuladas y función densidad
empírica.
ii.1. Distribuciones de frecuencias absolutas
Existen dos representaciones gráficas de las distribuciones
de las frecuencias absolutas.
ii.1.1. Histograma de frecuencias absolutas
Un histograma o histograma de frecuencias consiste en
una serie de rectángulos que tienen las siguientes carac-
terísticas:
+ Las bases de los rectángulos son trazadas en el eje de
la abscisa, el centro de cada rectángulo es la marca
de clase y el ancho del rectángulo es igual al tamaño
de cada intervalo de clase (Ax).
+ Laaltura de cada rectángulo es la frecuencia absoluta
de cada intervalo de clase.
El histograma se obtiene trazando en el eje de la abscisa
la columna 2 y en el eje de las ordenadas la columna 4
del cuadro N* 1.3.3.
AñeLarDO Mi. Díaz SALAS

111.2. Polígono de frecuencias absolutas


Un polígono de frecuencias es un gráfico de línea que se
obtiene uniendo los puntos medios de las partes superiores
de los rectángulos del histograma de frecuencias absolutas.
El polígono de frecuencias (absolutas) se obtiene grafican-
do la columna 3 en el eje de la abscisa y en el eje de la
ordenada la columna 4 del cuadro N* 1.3.3. Para que el
polígono de frecuencias llegue al eje horizontal, a ambos
lados de la columna 3 se agrega un intervalo de clase con
frecuencia igual a cero.
11.2. Distribuciones de frecuencias relativas
Son dos las presentaciones gráficas de la distribución de
frecuencias relativas.
1.2.1. Histograma de frecuencias relativas
Un histograma o histograma de frecuencias relativas con-
siste en una serie de rectángulos que tienen las siguientes
características:
+ Lasbases de los rectángulos son trazadas en el eje de
la abscisa, el centro de cada rectángulo es la marca
de clase y ancho del rectángulo es igual al tamaño
de cada intervalo de clase (Ax).
+ Laaltura de cada rectángulo es la frecuencia relativa
de cada intervalo de clase.
El histograma se obtiene trazando en el eje de abscisa, la
columna 2 y en el eje de la ordenada la columna 5 del
cuadro N* 1.3.3.
1.2.2. Polígono de frecuencias relativas
Un polígono de frecuencias es un gráfico de línea que se -
obtiene uniendo los puntos medios de las partes superiores
de los rectángulos del histograma de frecuencias relativas.
El polígono de frecuencias relativas se obtiene graficando la
columna 3 en el eje de la abscisa y en el eje de la ordenada
columna 5 del cuadro N* 1.3.3. Para que el polígono de
frecuencias llegue al eje horizontal a ambos lados de la
columna 3 se agrega un intervalo de clase con frecuencia
igual a cero.
ii.S. Distribuciones de frecuencias absolutas acumuladas. Ojivas
Hay dos tipos de ojivas: la curva que representa las frecuen-
cias absolutas acumuladas menores al límite superior del
cada intervalo de clase denominada frecuencias absolutas

E
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HibroLÓGICO)

acumuladas menores y la curva que representa las frecuen-


cias acumuladas mayores al límite inferior de cada intervalo
de clase denominada frecuencias acumuladas mayores.
Por tanto las ojivas se obtienen graficando los límites supe-
riores o inferiores de cada intervalo de clase en la abscisa
y las frecuencias absolutas acumuladas en el eje de la
ordenada. Lo que comúnmente se usa son las frecuencias
absolutas acumuladas menores que se obtienen trazando
en el eje de la abscisa los límites superiores de cada inter-
valo de clase y en el eje de la ordenada la columna 6 del
cuadro N? 1.3.3.
1i,4, Distribuciones de frecuencias relativas acumuladas. Ojivas
Estas ojivas se obtienen usando las frecuencias relativas,
a cambio de frecuencias absolutas del caso anterior. Por
tanto las ojivas se obtienen graficando los límites superiores
o inferiores de cada intervalo de clase en la abscisa y las
frecuencias relativas acumuladas en el eje de la ordenada.
Como se ha indicado, lo que comúnmente se usa son las
frecuencias relativas acumuladas menores, que se obtienen
trazando en el eje de la abscisa los límites superiores de
cada intervalo de clase y en eje de la ordenada la columna
7 del cuadro N* 1.3.3.
11.5. Función de densidad empírica
El gráfico de la función de densidad empírica se obtiene
trazando en la abscisa los datos de la columna 3 y en la
ordenada los datos de la columna 8 del cuadro N* 1.3.3,
El gráfico es paralelo al polígono de frecuencias relativas,
siendo más pequeños los valores en eje vertical, los puntos
son unidos mediante una curva.

1.3.4. Aplicaciones en hidrología


La estadística descriptiva descrita hasta esta parte en la hidrología
tiene dos aplicaciones: relacionar las frecuencias relativas con las
probabilidades y obtener la función de densidad empírica.

1) Relación entre las frecuencias relativas con las probabilidades


y las frecuencias relativas acumuladas con las probabilidades
acumuladas.
En el capítulo II se estudia la ley de probabilidades donde a las
descargas máximas o cualquier evento extremo se considera
como eventos independientes, la probabilidad de evento se
representa por:
ABELARDO M. Díaz SALas

pl (1.3.15,)
n

Donde:

fr = frecuencia relativa

n = número total de datos

La probabilidad acumulada se calcula mediante la siguiente


ecuación:

PIX2x) == ra ] (1.3.16,)
n

Donde:
X = variable aleatoria

x = valor de la variable aleatoria


m= número de orden del dato ordenado en forma descendente
n; = número de datos que superan o igualan a x.

Y fr, = suma de frecuencias relativas ordenadas en forma des-


cendente.

Para el cálculo de la ecuación (1.3.16.) algunos autores indican


que al denominador se debe sumar 1, de tal manera que la
probabilidad de exceder o igualar al dato más bajo no resulte
100% (no permite hacer inferencias estadísticas). Pero como
se trata de comparar la frecuencia relativa con la probabilidad
en este capítulo se utilizará la ecuación (1.3.16.).
La probabilidad de ocurrencia de que un evento sea menor a
un valor se determina mediante la siguiente ecuación:

prx<xo= Er, (1.3.17.)

Donde:

m;, = número de datos que son menores a x.

> fra = suma de frecuencias relativas de los datos ordenados


de menor a mayor

E
HibroLÓGICO)
EstapísTiCA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño

2) Obtención de la función de densidad empírica.


cionar gráfica-
La función de densidad empírica sirve para selec
un conjunto de
mente el modelo probabilístico adecuado para
o probabilís-
datos (muestra). El tema de la selección del model
nte capítulo
tico adecuado se ve en el capítulo VI. En el prese
ientes
se trata de la obtención de valores y figuras correspond
a la función de densidad empírica.
Ejemplo 1.1.
de distribu-
a) Para los datos del cuadro N? 1.1.1., hallar la tabla
de frecue ncias, las
ción de frecuencias, histogramas, polígonos
densidad
funciones de distribución acumulada y la función de
empírica.
bilidad que
b) Hallar la frecuencia relativa de cada dato, la proba
deter minad o (ecuación
el evento sea mayor o igual a un valor
a un
1.3.16.) y la probabilidad de que el evento sea menor
valor dado (ecuación 1.3.17.)
Solución a):
se muestran en el
1. Los datos ordenados del cuadro N' 1.1.1.
cuadro N* 1.3.4.

Cuadro N* 1.3.4.
Descargas máximas instantáneas anuales
(m?/s)
del río Querococha ordenadas en forma ascendente

8.96

2. Enel cuadro N? 1.3.4. se observa que:


Xmáx. = 10.78
Xin. = 3.98
n = 29

3. Siguiendo el procedimiento indicado se obtiene:


R =10.78-3.98 = 6.8
K =5.48= 5
Ax = 1.361

9
ABELARDO M.. Díaz SALAS

4. Los demás resultados se muestran en el cuadro N* 1.3.5. y en


las figuras del N* 1.3.1. al N* 1.3.7.

Cuadro N?* 1.3.5.


Tabla de frecuencias de las descargas máximas instantáneas anuales
del río Querococha-Estación Querococha (m?/s)

Intervalo Marca Frecuencia | Frecuencia Pos nes pación de


de clase de clase absoluta relativa lada tada O
2 : 6 6 5) acumula acimul emplrica
A ¿ : (0). tm 8)
.. 1 3.980-5.341 4.661 3 0.103 3 0.103 0.076
: 2 5.341-6.702 6.022 7 0,241 10 0.345 0.177

3 6.702-8.063 7.383 d 0.241 17 0.586 0.177


4 8.063-9.424 8.744 8 0.276 25 0.862 0.203

5| 9.424-10.785 10.105 4 0.138 29 1.000 0.101

h Total 29 1.00

12

104

3 6-7

2,

0 - : r , :
3 4 5 6 7 8 9 10 11 12
Descarga (m/s)
4

Figura 1.3.1. Histograma de frecuencias absolutas


de las descargas máximas instantáneas anuales del río Querococha
ESTADÍSTICA Y PROBABILIDAD EN La HiDROLOGÍA (Diseño HIDROLÓGICO)


Y 8.00
ME

e 37 7.00 7.00 _AA


E 7. 7 N
Y.

mad A Ln

26] Y
ú /
53 £
£Da,
4 e
Z 200 7 / o
> 3 4 A a

E?
L
A SN, DS
1 5, 0.00
0 r - - ——de
2 2 4 5 6 7 3 2 10 11 12

DESCARGA M3/5)
_)

Figura 1.3.2. Polígono de frecuencias absolutas de las


descargas máximas instantáneas anuales del río Querococha

30 - |
e]S |
52 :
j
E
=

Bo2000 >

E3 15 L
0 0
< 10-> A
pe5 S vd
>a 5-7
ui
dl
lu
0 , e , > " , a
2 3 4 5 6 ? 8 3 10 11 Ea
DESCARGA (M3/5)

Figura 1.3.3. Frecuencias absolutas acumuladas menores de las


descargas máximas instantáneas anuales del río Querococha
ABELARDO M. Díaz SALAS

FRECUENCIA RELATIVA

0.2

0.15

B.1

0.05

10 11
DESCARGA (M3/5)

Figura 1.3.4. Histograma de frecuencias relativas de las


descargas máximas instantáneas anuales del río Querococha
161]
Sa
da
FRECUENCIA RELATIVA
2
m
a
37
a
e

0.103
a
=
a
A
o
2

3 4 > 6 7 3 9 10 11
ba

DESCARGA (M3/5)

Figura 1.3.5. Polígono de frecuencias relativas de las


descargas máximas instantáneas anuales del río Querococha
ESTADÍSTICA Y PROBABILIDAD En La HiproLoGíA (Diseño HiDROLÓGICO)

1.2
10.785, 1.000
1
9.424, 0.862
3
E
E 08-
3
S 8.063, 0.586
g 06 -
EE
2
eS 047 6.702, 0.345
vu
E]

3
5 024 5.341, 0.103
3.980, 0.000

2 3 4 5 6 7 8 9 10 11 12
Descarga (m?/s)

Figura 1.3.6. Frecuencias relativas acumulas menores de las


descargas máximas instantáneas anuales del río Querococha

0.25
0.203
5 02.
Y
5
EDo
30.15 y
3
Éo
o

8 017
Lal
3
2
Q

Zo 054

0.000
0 :
0 2 12 14
Descarga (m3/s) |

Figura 1.3.7. Función de densidad empírica de las


descargas máximas instantáneas anuales del río Querococha

Solución b):
De las ecuaciones del (1.3.15.) al (1.3.17.) se obtienen el cuadro
N* 1.3.6. y figuras N* 1.3.8. y 1.3.9.
ABELARDO MI. DÍAZ SALAS

Cuadro N? 1.3.6.
Frecuencia relativa, frecuencia relativa acumulada mayor y menor
obtenidas aplicando la ley de la probabilidad (datos del cuadro N* 1.1.1.)

Frecuencia Número de
Descara relativa datos que Námero de Ojiva Ojiva
quis
q (+ > 2)3 son . superiores datos que son
inferiores a q mayor menor
m E ñ 0 Qe 29 a 5) (6)

10.78 0.0345 1 29 0.034 1.000


10.72 0.0345 2 28 0.069 0.966
10.21 0.0345 3 27 0.103 0.931
9.80 0.0345 4 26 0.138 0.897
9.40 0.0345 5 25 0,172 0.862
9.40 0.0345 6 24 0.207 0.828
9,10 0.0345 7 23 0.241 0.793

8.97 0.0345 8 22 0.276 0.759


8.96 0.0345 9 21 0.310 0.724
8.90 0.0345 10 20 0.345 0.690
8.90 0.0345 11 19 0.379 0.655
8.13 0.0345 12 18 0.414 0.621
8.00 0.0345 13 Le 0.448 0.586
7.95 0.0345 14 16 0.483 0.552

7.56 0.0345 15 15 0.517 0.517


7.48 0.0345 16 14 0.552 0.483
6.94 0.0345 17 13 0.586 0.448
6.87 0.0345 18 12 0.621 0.414
6.77 0.0345 19 11 0.655 0.379
6.70 0.0345 20 10 0.690 0.345
6.52 0.0345 21 9 0.724 0.310
6.50 0.0345 22 8 0.759 0.276

6.39 0.0345 23 7 0.793 0.241

6.26 0.0345 24 6 0.828 0.207


5.88 0.0345 25 5 0.862 0.172
5.82 0.0345 26 4 0.897 0.138
4.93 0.0345 27 3 0.931 0.103
4.89 0.0345 28 2 0.966 0.069
3.98 0.0345 29 1 1.000 0.034
ESTADÍSTICA Y PROBABILIDAD EN La HibROLOGÍA (Diseño HIDROLÓGICO)

1.20

1.00 y

Frecuencia relativa acumulada mayor


0.80 +

0.40 7

0,20 4

0.00 7 7 Y 7 7

2 4 6 8 10 12

Descarga máxima instantánea anual del río Querococha (m?/s)

Figura 1.3.8. Frecuencias relativas acumuladas mayores


o la probabilidad de la descarga de ser igualado o superado a q

1.207

1.00 y
Frecuencia relativa acumulada menor

0.60 y

0,40 7

0.20 4

0.00 7 7 Y 7

0.00 2.00 4.00 6.00 8.00 10.00 12.00

Descarga máxima instantánea anual del río Querococha (m?/s)

Figura 1.3.9. Frecuencias relativas acumuladas menores


o la probabilidad de la descarga de ser menor a q

Ejemplo 1.2.
Usando las informaciones de los cuadros N* 1.3.5., N* 1.3.6. y de
las figuras N? 1.3.6. y N* 1.3.9. hallar:
1. ¿Qué porcentaje de las descargas máximas instantáneas anuales
del río Querococha son menores a 6.71 m/s?
2. ¿Cuál es la probabilidad de que las descargas máximas instan-
táneas anuales del río Querococha sean menores a 6.71 m/s?
ABELARDO M. Díaz SALAS

3. ¿Qué porcentaje de descargas máximas instantáneas anuales


del río Querococha son superiores a 8.06 m3/s?
4. ¿Cuál es la probabilidad de que las descargas máximas instan-
táneas anuales del río Querococha sean mayores a 8.06 m*/s?
5. ¿Qué porcentaje de las descargas máximas instantáneas anuales
del río Querococha están entre 6.7 y 8.06 m?*/s?
6. ¿Cuál es la probabilidad de que las descargas máximas instan-
táneas anuales del río Querococha estén entre 6.7 y 8.06 m3/s?
7. ¿Qué porcentaje de las descargas máximas instantáneas anuales
del río Querococha están entre 6 y 8 m*/s?
8. ¿Cuál es la probabilidad de que las descargas máximas instan-
táneas anuales del río Querococha estén entre 6 y 8 m*/s?
Solución
Como se ha indicado, para solucionar este ejemplo es necesario con-
siderar las variables hidrológicas como variables aleatorias (suceden
al azar); es decir, el suceso es independiente del tiempo, por esta ra-
zÓn al clasificar los datos observados no se tiene en cuenta la secuen-
cia en el tiempo. De la tabla de distribución de frecuencias (cuadro
N? 1.3.5.), del cuadro N* 1.3.6. (frecuencias relativas acumuladas
según la ley de probabilidades), de las figuras de las frecuencias rela-
tivas acumuladas menores (figura N? 1.3.6. y N* 1.3.9.) se obtienen:
L. El 34.5% de las descargas máximas instantáneas anuales del
río Querococha son menores a 6.71 m/s (obtenida del cuadro
N* 1.3.5. comulna 6 y de la figura N* 1.3.6.).
La probabilidad de que las descargas máximas instantáneas
anuales del río Querococha sean menores a 6.71 m/s es
10 .
P(Q<6.71) = 79 0345; es decir, hay 10 datos que son menores a
6.71 m3/s como se observa en cuadro N* 1.3.6. y en la figura
N?* 1.3.9.
Las otras preguntas son resueltas con los mismos criterios es-
tablecidos en 1 y 2.
El porcentaje de las descargas máximas instantáneas anuales
del río Querococha que son superiores o iguales a 8.06 m/s
es: 100(1 - 0.586) = 41.4%.
La probabilidad de que las descargas máximas instantáneas
anuales del río Querococha sean mayores a 8.06 m/s es
P(Q > 8.06) ==0.414, Es decir, hay 12 datos que son mayores
ESTADÍSTICA Y PROBABILIDAD EN La HiDROLOGÍA (Diseño HIDROLÓGICO)

a 8.06 como se observa en cuadro N* 1.3.6. y en la figura


N? 1.3.8.
5. El porcentaje de las descargas máximas instantáneas anuales
del río Querococha que están entre 6.71 y 8.06 m/s es:
100[1 — (0.345 + 0.414)] = 24.1%.
6. La probabilidad de que las descargas máximas instantáneas
anuales del río Querococha estén entre 6.71 y 3.06 m3/s es 0.241
P(6.71<Q.<8.06) =1-P(Q<6.71) - P(Q > 8.06) =1-0.345-0.41=0.241= =
porque hay 7 datos en este rango.
7. La solución de las preguntas 7 y 8 se deja para que las pueda
resolver el lector.
Ejemplo 1.3.
En el cuadro NC 1.3.7., se tienen las descargas medias anuales del
río Querococha.

Cuadro N* 1.3.7.
Descargas medias anuales del río Querococha (m/s)

Q. Año Q Año Q
Año

1953-1954 1.51 1963-1964 1.92 1973-1974 2.43


1954-1955 1.81 1964-1965 1.53 1974-1975 1.71
1955-1956 1.39 1965-1966 1.76 1975-1976 1.80
1956-1957 1.24 1966-1967 1.97 1976-1977 1.39
1957-1958 1.35 1967-1968 1.34 1977-1978 1.78
1958-1959 1.50 1968-1969 1.30 1978-1979 2.06
1959-1960 1.76 1969-1970 2.09 1979-1980 1.43
1960-1961 1.64 1970-1971 2.02 1980-1981 1.97
1961-1962 1.97 1971-1972 1.80 1981-1982 2.01
| 1962-1963 1.68 1972-1973 1.67 |

Se pide:
a) Hallar los caudales para las probabilidades de persistencia de
50%, 75% y 90%.
b) ¿Qué probabilidad de persistencia tiene el caudal promedio?
Comentar el uso de estos valores.
ABELARDO M. Díaz SALAS

Solución
Considerando a las descargas medias anuales como eventos alea-
torios independientes, se puede hacer la tabla de frecuencias y la
presentación gráfica, este trabajo se deja al lector.
Como las probabilidades son iguales a las frecuencias relativas, por
lo tanto, para contestar las preguntas del ejemplo 1.3. se utilizará
los conceptos de probabilidad. Las frecuencias relativas, las fre-
cuencias relativas acumuladas mayores se muestran en el cuadro
N? 1.3.8., sin necesidad de gráfico se resuelven las preguntas del
ejemplo 1.3.

Cuadro N?* 1.3.8.


Frecuencia relativa, frecuencia relativa acumulada mayor
obtenidas aplicando la ley de la probabilidad (datos del cuadro N* 1.3.7.)

Frecuencia : : o

Descansa a
(s = Ay
as.
o iguales a q (nd
OL
2.43 0.0345 1 0.034
2.20 0.0345 2 0.069
2.09 0.0345 3 0.103
2.06 0.0345 4 0.138
2.01 0.0345 5 0.172
1.97 0.0345 6 0.207
1.97 0.0345 7 0.241
1.97 0.0345 8 0.276
1.92 0.0345 9 0.310
1.81 0.0345 10 0.345
1.80 0.0345 11 0.379
1.80 0.0345 12 0.414
1.78 0.0345 13 0.448
1.76 0.0345 14 0.483
1.76 0.0345 15 0.517
1.71 0.0345 16 0.552
1.68 0.0345 17 0.586
1.67 0.0345 18 0.621
1.64 0.0345 19 0.655
1.53 0.0345 20 0.690
1.51 0.0345 21 0.724
1.50 0.0345 22 0.759
EsTaDÍSTICA Y PROBABILIDAD EN La HIDROLOGÍA (Diseño HibroLóGIico)

Frecuencia
relativa Número de datos m
pa 24 que son superiores rlQza)= E
: fra Ñ o iguales a q mi)

1.43 0.0345 23 0.793


1.39 0.0345 24 0.828
1.39 0.0345 25 0.862
1.35 0.0345 26 0.897
1.34 0.0345 27 0.931
1.30 0.0345 28 0.966
M 1.24 0.0345 29 1.000

1. Solución a
+ El caudal para una probabilidad de 50% de persistencia,
se obtiene del cuadro N? 1.3.3.
3 3

Para P =0.5 se tiene Q>1.76 = 6P (Q2176 mos


+ El caudal para una probabilidad de 75% de persistencia
se obtiene por interpolación del cuadro N* 1.3.8.:

o
0.75-0.724 41.51=1.503 m*/s por consiguiente:
q =(1.50-1.51) 222
0.759 -0.724

Para P=0.75se tiene Q21.503-- ó P |Q21.503 - |=0.5


m? m?

e El caudal para una probabilidad de 90% de persistencia:


Por interpolación del cuadro N* 1.3.8., se obtiene:
0.9- 0.897 1 o
q =(1.34-1.35) 0:9-0:897 35=1.349 m*/s, por consiguiente:
0.931 -0.897
mé m
Para P=0.90 se tiene Q>1.349 ó P [Q21,.349 =- ]=0.9

2. Solución b
El caudal promedio del período de registro es q=1.724m"s, del
cuadro N* 1.3.8., se obtiene la probabilidad de persistencia:
P=(0.552-0.517)
1.724-1.76 +0.517 =0.54
1.71-1.76

Por tanto se tiene:


P(Q > q) =0.54
ABELARDO M. Díaz SALAS

Solución c
Resumiendo se tiene:
a. PMQ>1.76m/s) = 0.5

b. PIQ>7) = 0.54
C. P(Q>1.503 ms) = 0.75
d. P(Q>1.349 ms) = 0.90
En el río Querococha, según estos resultados en cien años, el
comportamiento de los caudales probablemente será:
a. Q=> 1.76 m/s se presentarán 50 años y en los 50 años
restantes los caudales serán menores a 1.76 m?/s.
b. Q=q= 1.724 m/s se presentarán 54 años y en los 46
años restantes los caudales serán menores a 1.724 mi/s
(caudal promedio).
c. Q> 1.503 mi/s se presentarán 75 años y en los 25 años
restantes los caudales serán menores a 1.503 m/s.
d. Q > 1.349 ms se presentarán 90 años y en los 10 años
restantes los caudales serán menores a 1.349 mi/s.
Los resultados anteriores indican que no es recomendable
diseñar obras hidráulicas como un canal para caudal prome-
dio O para caudal con 50% de persistencia, porque la obra
prestará servicio óptimo aproximadamente la mitad del tiempo
(horizonte del proyecto); por consiguiente, el proyecto se sobre-
dimensionaría. Para obras de riego es recomendable trabajar
con 75% de persistencia y en obras de centrales hidroeléctricas
se diseñan los canales para caudales con 90% de persistencia,
porque la demanda de agua para generar energía eléctrica es
más exigente que en los proyectos de riego.

1.3.5. Descripción de datos


La razón fundamental de clasificar los datos en una tabla y graficar
las frecuencias es para describir la naturaleza de la distribución de
frecuencias. La descripción se realiza mediante los estadísticos o los
estadígrafos.
l. Estadísticas de posición
Son números que indican la localización del valor medio o valor
central de la distribución de frecuencias, estos estadísticos son
denominados como medidas de localización o medidas de ten-
dencia central; por tanto, las medidas de posición determinan la
Locía (Diseño HIDROLÓGICO)
EstapísTICA Y PROBABILIDAD EN LA Hioro

s de una distribución de
ubicación del valor central de los dato
ción comúnmente usados
frecuencias. Los estadísticos de posi
son: media, mediana y moda.
tra en la figura N* 1.3.10.,
La ubicación del valor central se mues
de los datos de la muestra
donde se observa que el valor central
tivamente al valor central
A y B son iguales y menores cuantita
de la muestra C y D.

—A— Distr. A
—5-— Distr. B
—>— Distr. €
—+-— Distr. D

Variable Hidrológica

l)
ión o de localización (valor centra
Figura 1.3.10. Estadísticas de posic
de la distribución de frecuencias

i.1. Media
más usadas son la media
En la hidrología estadística las medias
aritmética y la media global.
1.1.1. Media aritmética
mético, es un estadístico que
Llamada también promedio arit
ribución; es decir, localiza el
localiza el valor central de la dist El
centro de gravedad de la distribución en el eje de la abscisa.
mediante las siguientes
valor de la media aritmética se calcula
ecuaciones:
1. Para datos no clasificados

(1.3.18.)
ABELARDO M. Díaz SALAS

Donde:
x = valor de la variable hidrometeorológica
n = número total de datos de la muestra
¡=1,2,....n
2. Para los datos clasificados o agrupados

K K
Y¿ xn; Y xm; K
x= i=1 - df =D xfr; (1.3.19.)

5
Ma

T
>

Donde:
Xar Xy10=»1x, = Marcas de clase
n,, n,,...n, = frecuencias absolutas
A frecuencias relativas
K = número de intervalos de clase
n = número total de datos de la muestra

Ejemplo 1.4.
De los datos del cuadro N* 1.1.1., hallar la media aritmética consi-
derando datos sin agrupar y datos agrupados (clasificados).

Descargas máximas instantáneas anuales del río Querococha (m/s)

AñO 0 AñO 0 Año Q


1953-1954 6.94 1963-1964 5.88 1973-1974 7.48

1954-1955 7.95 1964-1965 9.10 1974-1975 10.72

1955-1956 6.50 1965-1966 6.52 1975-1976 10.21

1956-1957 6.77 1966-1967 9.80 1976-1977 8.97

1957-1958 6.39 1967-1968 4.93 1977-1978 8.13

1958-1959 6.26 1968-1969 3.98 1978-1979 8.96

1959-1960 8.90 1969-1970 6.87 1979-1980 4.89

1960-1961 8.00 1970-1971 6.70 1980-1981 9.40

1961-1962 9.40 1971-1972 8.90 1981-1982 10.78

1962-1963 1972-1973
SO

ESTADÍSTICA Y PROBABILIDAD EN La HiproLOGÍA (Diseño HIDROLÓGICO)

a ea
Solución
Considerando datos sin agrupar aplicando la ecuación (1.3.18.)

A
se obtiene: x = 7.68 m*/s
Considerando como datos agrupados aplicando la ecuación :
(1.3.19.) se obtiene: Y

K Intervalo de clase Marca de Frecuencia. | Frecuencia Columna Columna


mm (2) clase (3) absoluta (1) relativa (5) 05) ra
1 3.980 - 5.341 4.66 3 0.10 13.98 0.48

2 5.341 - 6.702 6.02 7 0.24 42.14 1.45

2 6.702 - 8.063 7.38 Z 0.24 51.66 1.78

4 8.063 - 9,424 8.74 9 0.28 69.92 2.41

3 9.424- 10.785 10.10 4 0.14 40.40 1.39

Total 29 1.00 218.1 7.52

Promedio PDZ

El promedio es x = 7.52 m%/s (ecuación 1.3.19.)


1.1.2. Media global
La media global es útil en hidrología, por ejemplo en el análisis
de saltos donde los datos recopilados se dividen en submuestras,
por lo que es necesario calcular la media de cada submuestra y
el promedio global se calcula mediante la siguiente ecuación:

2mX (1.3.20,)
8 n

Donde:
= media global
xl

n= número de datos de cada submuestra


n = número de datos de la muestra
m = número de submuestras
x, = media de cada submuestra

Mediana
La mediana es un estadístico que localiza el valor central de
una distribución de frecuencias, lo cual se calcula después de
ordenar los datos en forma ascendente o descendente. La
ABELARDO M.. Díaz SALAS

mitad de los datos ordenados son inferiores a la mediana y la


otra mitad son superiores a la mediana. La mediana se calcula
para datos agrupados y no agrupados.
1. Para datos no agrupados
La mediana se calcula mediante las siguientes ecuaciones:

| Em X (m2) | (1.3.21,)

X= Xx (n/2) +X [n +22] | (1.3.22,)


2

Donde:
Xy) Xo,:»:, X, =datos de la muestra no agrupados ordenados
en forma creciente o decreciente.
X_. m = mediana
n =mnúmero total de datos de la muestra.
La ecuación (1.3.21.) se usa cuando n es impar y la ecua-
ción (1.3.22.) cuando n es par.
Según la ley de probabilidades la mediana representa la
variable hidrológica con 50% de persistencia.
2. Para datos agrupados o clasificados
Para calcular la mediana de datos agrupados es importante
definir la clase mediana. La clase mediana es el intervalo
de clase que contiene la mediana; esta clase se identifica
a partir de las frecuencias absolutas o relativas y es la clase
que acumula la mitad del número total de datos (n/2 ó
0.5n) o los que superó por primera vez la mitad de los
datos. La clase mediana se calcula mediante las ecuaciones
siguientes:

ln= [Lo E )0% 8 lev gr) ] (1.3.23,

X= Lats (CP) (1.3.24,)


Am
ESTADÍSTICA Y PROBABILIDAD EN LA HiproLOGÍA (Diseño HIDROLÓGICO)

La ecuación (1.3.24.) se obtiene de la figura N* 1.3.11.


Por semejanza de triángulos 123 y 145 se obtiene:

Nm Nim-1 —Lm017Lm (1.3.25,)

(n/2)> Nm-1 Xi Lam a

Siendo:

l we = Lo Lo ) (1.3.26,)

Reemplazando la ecuación (1.3.26.) en (1.3.25.) se ob-


tiene:

zp 1,
W..((n/2) —N
ol(0/2)= Nm) (1.3.27,)

Nin =Nim-1

Donde:
m-1
Nm (1.3.28,)
i=1

[ Mo Nip 1 ) (1.3.29,)

m = clase mediana
Xx, = mediana
L, = límite inferior de la clase mediana
La. = límite superior de la clase mediana
n= número total de los datos de la muestra
N,., = frecuencia absoluta acumulada hasta la clase
inmediatamente anterior a la clase mediana
n, = frecuencia absoluta acumulada de la clase mediana
w, = ancho de la clase mediana
ABELARDO M.. Díaz SaLas

ON

Y
Figura 1.3.11. Ilustración gráfica de la clase mediana

Es importante comentar que la media está influenciada por los va-


lores extremos de los datos de la muestra y como es la medida del
centro de gravedad de la distribución, tiende a inclinarse hacia el de
mayor valor o mayor frecuencia. Si hay datos extremos que difieren
considerablemente del resto de los datos, la media no localiza el
centro de gravedad en el valor medio de la distribución, en cambio
la mediana no es influenciada por los valores extremos y localiza el
centro de la distribución en posición central; por tanto, la mediana
resulta mejor estadístico en el sentido de la localización del valor
central de la distribución, sin embargo en general la media es más
representativa que la mediana como estadístico de localización,
según García [71.
Ejemplo 1.5.
De los datos del cuadro N* 1.1.1., hallar la mediana considerando
datos sin agrupar y datos agrupados (clasificados).

Descargas máximas instantáneas anuales del río Querococha (m3/s)

Año Q Año o Año Q


1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HIDROLÓGICO)

Año Q Año Q Año Q


1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
1962-1963 7.56 1972-1973 5.80

Solución
1. Mediana de los datos no agrupados
Considerando datos sin agrupar, pero ordenados, aplicando la
ecuación (1.3.21.) donde n=29 (impar) se obtiene:
= x,5=7.56m7s (ver cuadros N? 3.4. y N* 1.3.6.)
maz
2. Considerando datos agrupados del cuadro N? 1.3.5., se calcula
la mediana mediante el siguiente procedimiento:
a. Identificar la clase mediana
En el cuadro siguiente se observa que 0.5 n = 0,5 * 29 =
14.5, entonces la clase o el intervalo de clase que superó
la mitad de los datos por primera vez es el intervalo de
clase N9 3. (columna 6); por tanto, acorde con la ecuación
(1.3.23.) la clase mediana es:
Ko m = (Lala);
nom 1
Xy EL yor, m+1 1) > K,=16.702 — 8.063)

Tabla de frecuencias de las descargas máximas instantáneas anuales


del río Querococha-Estación de Querococha (m%/s)

(0 o o 0 a acumulada | acumulada | empirica


(6) wm (8)
1 3.980-5.341 4.661 3 0.103 3 0.103 0.076
2 5.341-6.702 6.022 7 0.241 10 0.345 0.177
3 6.702-8.063 7.383 7 0.241 17 0.586 0.177
4 8.063-9.424 8.744 8 0.276 25 0.862 0.203

5 | 9.424-10,785 10.105 4 0.138 29 1.000 0.101

Total 29 1.00

b. La mediana se encuentra mediante la ecuación (1.3.24.),


obteniéndose:
L = 6.702
Asearpo M. Díaz SaLAs

w. = 8.063 - 6.702 = 1.361

29/2 <= 14.5

2N

moon
10 (columna 6)

z
17 (columna 6)

li
NN, y = 17-10 =7

Il
3
Reemplazando los valores en la ecuación (1.3.24.) se tiene:
12)-N 14.5-10
X= Ly+ 00 20M) = 6.702 +1.361 5 =7.577 m/s = 7.58m/s
n m
7

1.3. Moda
La moda es el estadístico que localiza el dato más frecuente,
puede haber distribuciones unimodales, bimodales, etc. Si la
muestra presenta frecuencias iguales, se dice que la distribución
no tiene moda, entonces la distribución es de tipo uniforme.
il. Medidas muestrales de dispersión
Estos estadísticos (números) indican el grado de dispersión
o desfases en los datos de la muestra, poca dispersión indica
una uniformidad en los valores de la muestra, mientras que
alta dispersión indica poca uniformidad en los valores de la
muestra. Cuando los valores son muy cercanos al promedio
existe uniformidad y cuando los valores de la muestra son
muy alejados al promedio se dice que no hay uniformidad;
es decir, los valores de la muestra son diferentes o dispersos.
Los estadísticos de dispersión son: rango, varianza, desviación
estándar y coeficiente de variación.
En la figura N? 1.3.10. se observa que los datos de la curva A
son más dispersos que los datos de la curva B y los datos de la
curva C son más dispersos que los datos de la curva D.
ii.1. Rango
El rango se calcula mediante la ecuación (1.3.2.), el estadístico
rango mide la variabilidad en forma imperfecta, pues sólo con-
sidera los valores extremos, más no así los valores intermedios;
puede suceder que dos muestras que tienen mismo rango, una
puede ser homogénea y otra heterogénea.
11.2. Varianza
Es media aritmética de la suma de cuadrados de las desviaciones
(diferencias) de los datos con respecto al promedio.
EstaDístiCa Y PROBABILIDAD EN La HibroLoGíA (Diseño HipRoLÓGICO)

En este caso la palabra error o desviación o dispersión es la


diferencia entre el valor de la muestra y el promedio represen-
tado por la siguiente ecuación:

(x, -X) = error = e, | (1.3.30.)

Donde:
x = promedio
x, = valor del dato (muestra)
A la ecuación (1.3.30.) se le conoce con el nombre de des-
viaciones con respecto a la media, esta ecuación indica que si
todos los datos de la muestra son iguales, la desviación es cero;
pero en la realidad se observa que todos los datos de la mues-
tra tienen valores diferentes. Las estadísticas como la media,
mediana no describen la variabilidad de los datos. Se observa
que la dispersión o desviación es pequeña si los valores de los
datos están muy cercas a la media y la dispersión es grande
cuando los valores de los datos están dispersos con relación a
la media. Por las consideraciones indicadas, es razonable medir
la variabilidad de la muestra, considerando las desviaciones o
dispersiones con respecto a la media o promedio.
Las dispersiones son positivas y negativas y por tanto el resul-
tado de la sumatoria de todas desviaciones con respecto a la
media es cero, matemáticamente expresada por:

Y 3) Ne 0 (1.3.31,)
i=1 i=0

Donde:
n = número total de datos
¡= 1,2,...,n

La expresión matemática (ecuación 1.3.31.) no es una medida


adecuada de la variabilidad, una alternativa para medir la va-
riabilidad de la muestra es elevar al cuadrado las desviaciones,
obteniéndose:

So) = Ye? (1.3.32)


ABELARDO MI. Díaz SALAS

Según esta ecuación las muestras de mayor tamaño tendrían


siempre variabilidad mayor, para evitar que la variabilidad de-
penda del tamaño de la muestra la ecuación (1.3.32.) se divide
entre n-1, que permite obtener la variabilidad promedio de la
muestra, llamada varianza de la muestra.
La ecuación (1.3.32.) se divide entre n-1, porque se tiene
en consideración un promedio derivado previamente de los
datos, es decir, se usa como un dato más para determinar S*,
en estadística esta operación se indica que se pierde un grado
de libertad. Otra justificación de dividir por n-1 a la sumatoria
de los cuadrados del error es que no hay desviación si hay un
solo dato.
En una muestra la varianza se calcula mediante las siguientes
expresiones:

1. Para datos no agrupados

L 12
(1.3.33.)
s A
n=

Donde:
n = número total de datos
x = promedio de la muestra no agrupada
x, = valor de la i-ésima variable aleatoria
¡ = 1,2,...,n

2. Para datos agrupados

SS —y2

9 2 Yin (1.334)
n-1

Donde:
n = número total de datos
x = promedio de la muestra agrupada
x, = valor de la i-ésima marca de clase
K = número de intervalos de clase
n. = valor de la i-ésima frecuencia absoluta
¡o = 1,2,...,K
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HiDroLóGICO)

3. Desviación estándar

La desviación estándar o también denominada desviación


típica mide la variabilidad de datos, la desviación estándar
es la raíz cuadrada de la varianza. La desviación estándar
es la medida de variabilidad más adecuada que la variancia
porque está dada en las mismas unidades que las observa-
ciones (datos). La desviación estándar se calcula para datos
agrupados y para datos no agrupados, mediante las siguientes
expresiones:
1. Para datos no agrupados

(1.3.35,)

Donde:
n= número total de datos
x = promedio de datos sin agrupar
x, = valor del dato
i = 1,2....n

2. Para datos agrupados

(1.3.36,)

Donde:
An = número total de datos
promedio de datos agrupados.
x!

x = valor de la i-ésima marca de clase


kK = número de intervalos de clase
n, = valor de la i-ésima frecuencia absoluta
¡o = 1,2,...K

Ejemplo 1.6.
De los siguientes datos: 5, 8, 11 calcular la desviación estándar y
comentar el resultado.

a
ABELARDO MI. Díaz SALAS

Solución
Los cálculos se muestran en el siguiente cuadro:

Xx Xx
5 8
8 8
8
sedia

Total

=rror promedio muestral (D.S.)

Como se observa en el cuadro, la desviación estándar es 3 que mide


la variabilidad de los datos con respecto al promedio y la sumatoria
del error total es cero, por lo tanto, el promedio del error con respecto
a la media es 0. Para evitar que el error promedio resulte cero y para
hallar el error promedio o la desviación estándar a la desviación,
se eleva al cuadrado, luego se halla la suma total del error elevado
a la potencia 2, lo cual se divide entre n-1 para hallar finalmente la
raíz cuadrada.
Ejemplo 1.7.
De los datos del cuadro N* 1.1.1., hallar la varianza, desviación están-
dar considerando datos sin agrupar y datos agrupados (clasificados).

Descargas máximas instantáneas anuales del río Querococha (m?/s)

Año . 0 Año Q Año Q


1953-1954 6.94 1963-1964 5.88 1973-1974 7.A8

1954-1955 7.95 1964-1965 9.10 1974-1975 10.72

1955-1956 6.50 1965-1966 6.52 1975-1976 10,21

1956-1957 6.77 1966-1967 9.80 1976-1977 8.97

1957-1958 6.39 1967-1968 4.93 1977-1978 8.13

1958-1959 6.26 1968-1969 3.98 1978-1979 8.96

1959-1960 8.90 1969-1970 6.87 1979-1980 4.89

1960-1961 8.00 1970-1971 6.70 1980-1981 9.40

1961-1962 9.40 1971-1972 8.90 1981-1982 10.78

1962-1963 1972-1973
ESTADÍSTICA Y PROBABILIDAD EN LA HibroLocía (Diseño HibroLóGIcO)

Solución
a. Considerando datos sin agrupar
Cálculo de la varianza
La variancia muestral se obtiene mediante la ecuación
(1.3.33.).

Cálculo de la desviación estándar


La desviación estándar se halla mediante la ecuación
(1.3.35.).

b. Considerando datos agrupados


Cálculo de la varianza
La varianza se calcula mediante la ecuación (1.3.34.):

A
g? = 2.82 m*/5?
n-1

Cálculo de la desviación estándar


La desviación estándar se calcula mediante la ecuación
(1.3.36.)

Los resultados se muestran en el siguiente cuadro:

K Límites de clase... Marca de clase pcia (Colum.3 - xP 1065)


(D (1 (5 (8) Bo (60)
1 3.980 -5.341 4.66 3 8.18 24.59
2 5.341 -6.702 6.02 7 2.25 15.79
3 6.702 -8.063 7.38 7 0.02 0.14
ABELARDO MI. Díaz SALAS

K 3" 05)
6)
4 8.063 -9.424 11.91
5 9.424 -10.785 26.65
Total 79.07
>romedio 7.52
Warlancia 2.82
Desviación estándar 1.68

ii.4. Coeficiente de variación

La desviación estándar y la variancia son estadísticas de varia-


ción absoluta, es decir, miden la cantidad real de variación en
un conjunto de datos y dependen de la escala de medición. Para
comparar la variación (variabilidad) de diferentes conjuntos de
datos, es preferible medir la variación relativa y no la variación
absoluta, para esto se usa el coeficiente de variación que es
denominado también como el coeficiente de variabilidad que
expresa la desviación estándar como un porcentaje de la media
expresada mediante la siguiente expresión:

Cv=1002 (1.3.37.)

1.4. Momentos muestrales, medidas de asimetría y curtosis


Para evaluar el tipo de una curva de una distribución de frecuencias y
para comparar las distribuciones, es necesario calcular cuatro valores a
partir de la muestra:
+ Promedio que mide la localización del valor central de la distribución
de frecuencias.
+ Desviación estándar que mide el grado de dispersión de las frecuen-
cias con respecto al valor central.
+ Coeficiente de asimetría que mide el grado asimetría o la falta de
equilibrio de la distribución de frecuencias entre las dos regiones
en que queda dividida la curva de la distribución por la ordenada
trazada sobre el valor más alto de la distribución de frecuencias
(moda).
* Coeficiente de curtosis que mide el grado de concentración en los
valores centrales de la curva.
po
AA

Estapística Y ProBasiLiDaD En La HiproLocía (Diseño HiDROLÓGICO)

Existen varias clases de descriptores aritméticos, siendo los momentos el


método adecuado para calcular los estadígrafos; es decir, con el cálculo
de momentos se determina los estadígrafos o estadísticos. Como en los
cursos de estática, resistencia de materiales, física, matemáticas, etc., se
calculan los momentos de órdenes primero, segundo, etc., generalizando
se tiene: momento con respecto al origen de coordenadas y momentos
con respecto a la media.
1. Elr-ésimo momento muestral con respecto al origen de coordenadas ¿t
se define por:
y

P
i
. Para datos no clasificados
$
_— A

m,(x) =x"=Yx (1.3.38,)


n i=1

Donde:
r = orden del momento

valor de la variable hidrometeorológica


Il
pS

número total de datos de la muestra


¡| = 1,2,...,n

*+ Para datos clasificados

— K 7
2 (1.3.39,)
m0) =X' =2Y xn
D¡=1

Donde:
r = orden del momento
X,Xyx, = marcas de clase
n,n,...n, = frecuencias absolutas
K = número de intervalos de clase
n = número total de datos de la muestra
2. El r-ésimo momento muestral con respecto a la media o momento
central se define:
+. Para datos no clasificados

memo) 1260 (1.3.40,)


AsBeLARDO MI. Díaz SALAS

Donde:
r = orden del momento
x = valor de la variable hidrometeorológica
x = promedio de los datos no agrupados
n = número total de datos de la muestra
io = 1,2...

+ Para datos clasificados

; y 1 o
m=M((x; -x))=- (6 Dn, (1.3.41,)
i=1

Donde:
r = orden del momento
Xy X2r:::X, = marcas de clase
Xx = promedio de los datos agrupados
n,m..n, = frecuencias absolutas
K = número de intervalos de clase
n = número total de datos de la muestra
El primer momento con respecto al origen de coordenadas es la media
muestral m') = x. El segundo momento con respecto a la media es la va-
rianza muestral Mí((x - x)2) = s?. Teóricamente se pueden obtener momentos
de cualquier orden, pero los que comúnmente se usan es hasta de cuarto
orden.

1.4.1. Punto medio o promedio


Es el primer momento con respecto al origen de coordenadas dada
por las ecuaciones (1.3.38.) y (1.3.39.) donde r=1.

1.4.2. Medidas de variabilidad


Es el segundo momento con respecto a la media donde r=2, la
variancia se obtiene mediante las ecuaciones (1.3.40.) y (1.3.41.).

1.4.3. Medida de asimetría


La asimetría de una muestra se mide mediante el coeficiente de
asimetría, para el cálculo del coeficiente de asimetría se emplea
el tercer momento con respecto a la media y para que este coefi-
ciente no tenga dimensiones el tercer momento se divide entre
la desviación estándar elevado a la potencia 3. El coeficiente de
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HIDROLÓGICO)

asimetría o sesgo de una muestra se calcula mediante las siguientes


ecuaciones:
Í
| g=é _ Mm (1.3.42)
$ (n= ín-2) $?

1. Datos no agrupados

12 33 (1.3.43,)
| my = (Xx)
i=1

s = desviación estándar para datos no agrupados


x = valor de la variable hidrometeorológica .
x = promedio de los datos no agrupados E
n = número total de datos de la muestra
¡o = 1,2,...,n

La ecuación (1.3.42.) es lo que se utiliza en las hojas de cálculo


(Microsoft Excel).
2. Datos agrupados

ma == > (-x) ni (1.3.44.)


i=1

X¡Xy1:x. = marcas de clase


Xx = promedio de los datos agrupados
S = desviación estándar para datos agrupados
| nm...n, = frecuencias absolutas
| K = número de intervalos de clase
n = número total de datos de la muestra D
|

| + — Sig=0 es una distribución simétrica


+ Sig>0esuna distribución sesgada a la derecha (polígono
de frecuencias con cola más larga a la derecha)
» Sig<0esuna distribución sesgada a la izquierda (polígono
| de frecuencias con cola más larga hacia la izquierda).
|
El sesgo del polígono de frecuencias se aprecia trazando una vertical
por la moda donde se diferencia la cola del polígono de frecuencias. E

o
AbeLarDO MI. Diaz SALAS

Es importante indicar que los tres números x, s y g son suficientes


para tener una idea de la forma del polígono de frecuencias.

1.4.4. Medida de apuntamiento


El grado apuntamiento del polígono de frecuencias (forma puntia-
guda del polígono de frecuencias) se mide mediante el coeficiente
de curtosis. Para el cálculo del coeficiente de curtosis, se emplea el
cuarto momento con respecto a la media y para que este coeficiente
no tenga dimensiones el cuarto momento se divide entre la desvia-
ción estándar elevado a la potencia 4. El coeficiente de curtosis de
una muestra se calcula mediante las siguientes ecuaciones:

3
E, > —_ (1.3.45.)
(n — Dn — 2)n
— 3) S

1. Para datos no agrupados

n
—,4
Eo Y
my = ———
(1.3.46,)
n

Donde:
s = desviación estándar para datos no agrupados
x = promedio para datos no agrupados
x, = valor del dato
o = 1/2...,n
n = número total de datos
2. Para datos agrupados
K
(x= xy n;
A ! ! (1.3.47.)
My A —
n

Donde:
s = desviación estándar para datos agrupados
promedio para datos agrupados
xl

x. = marca de clase del intervalo i


valor de la i-ésima frecuencia absoluta
>
ol

número de intervalo de clase


A

número total de datos


Il
pe

¡o = 172...k
Estapística Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HiprotóGICO)

Según Benjamín at el. [2] el valor del coeficiente de curtosis es


costumbre comparar con C, - 3 que es coeficiente de apunta-
tamiento de una curva continua de forma de una campana
(curva normal).
e Sic, >3es una distribución leptocúrtica, picuda o puntia-
guda.
e Sic, =3esuna distribución mesocúrtica O moderada (curva
normal)
+ Sic, <3esuna distribución platicúrtica, achatada o plana.
Nota: Como se ha indicado, los parámetros se estiman a partir de
alguna función de una variable aleatoria (población) y los estadísticos
son estimados a partir de una muestra.
Ejemplo 1.8.
A partir de los datos del cuadro N? 1.1.1., calcular el coeficiente de
asimetría y el coeficiente de curtosis, considerando datos sin agrupar
y datos agrupados. Presentar el polígono de frecuencias y comentar
los resultados.

Descargas máximas instantáneas anuales del río Querococha (m*/s)

QQ. Año Q AñO Q


Año
1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
6.39 1967-1968 4.93 1977-1978 8.13
1957-1958
1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
8.90 1969-1970 6.87 1979-1980 4.89
1959-1960
8.00 1970-1971 6.70 1980-1981 9.40
1960-1961
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
| 1962-196 3 7.56 1972-1973 5.80

Solución

a. Cálculo del coeficiente de sesgo


+ Para datos sin agrupar, el coeficiente de sesgo se ha ca.-
culado mediante las ecuaciones (1.3.42.) y (1.5.43.).
m, = -0.40
n = 29
s = 5.73
ABELARDO MI. Díaz SALAS

n7m
g=C, e —0.08
(n — Din —2)S

+ Paralos datos agrupados, los resultados se muestran en el


siguiente cuadro, el coeficiente de asimetría se ha hallado
mediante las ecuaciones (1.3,42.) y (1.3.44.).

gc 009
(nin 2? :

Cálculo del coeficiente de asimetria-para datos agrupados

Límites de Marta de Frecuencia


E clase clase absoluta o dl er
1 (3) (4
1 3.980 - 5.340 4.66 3 -23,41 -2.42
a 5.340 - 6.700 6.02 7 -3.38 -0.82
E 6.700 - 8.060 7.38 E 0.00 0.00
4 8.060 - 9.420 8.74 8 1.81 0.50
5 9.420 - 10.780 10.10 4 17.16 2.37
Total 29 -0.37 -
Promedio 7.52
Variancia 2.82
Desviación estándar 1.68
m3 — 2)(n — 1) 1.1124
Coeficiente de sesgo -0.09

b. Cálculo del coeficiente de curtosis


+ Para datos sin agrupar, el coeficiente de curtosis se ha
calculado mediante las ecuaciones (1.3.45.) y (1.3.46.).
m, = 21.09
n =29
s: = 10,24
Eg = mm,
A = 2.55
(n—1)n — 2)tn 3,5%

+ Paralos datos agrupados, los resultados se muestran en el


siguiente cuadro, que se han hallado mediante las ecua-
ciones (1.3.45.) y (1.3.47.).
3
n ma
Ck= ———_— LH 4 = 2.32
(n—D(n— 2)(n-—3)5
EN LA HIDROLOGÍA (Diseño HiDroLóGICO)
ESTADÍSTICA Y PROBABILIDAD

Cálculo del coeficiente de curtosis-datos agrupados


Marca de Frecuencia ¿Colum.3 - XI 5 0)Ín
K Límites de
clase (3) absoluta (4) 5 (6)
(0 clase (2)
3 66.97 6.93
1 3.980 - 5.340 4.66
2 5.07 1.22
2 5.340 - 6.700 6.02
7 0.00 0.00
2 6.700 - 8.060 7.38
8 2.21 0.61
4 8.060 - 9.420 8.74
4 44.26 6.10
5 9.420- 10.780 10.10
29 14.91
Total
7.52
Promedio
2.82
Variancia
1.68
Desviación estándar
1.2408
(n3/(a-3)(n-2)(n-1))
232. y
Coeficiente de curtosis

Resumen de los resultados

nadas arroces
Estadísticos.
7.68 7.52
Media
3.20 2.82
Variancia
1.79 1.68
Desviación estándar
23.30 22.34
Coeficiente de variación (%)
-0.08 -0.09
Coeficiente de asimetría
2.55 2.32 J
Coeficiente de curtosis

izquierda,
Los resultados indican que es una distribución sesgada a la
observ ar en la
es una distribución platicúrtica, los cuales se pueden
figura N? 1.3.5.

1.5.Estadística inferencial y modelos de probabilidad


a partir de
Con la finalidad de obtener las conclusiones acerca de los datos
tener en cuenta
la estadística descriptiva o a partir de la muestra, se debe
Las conclusio-
que estos datos suceden según la casualidad (aleatorio).
posibilidades
nes lógicas de la muestra se obtienen suponiendo algunas
de los datos (muestra);
(probabilidades) de obtener los diferentes valores
aire el resulta do puede
por ejemplo, al lanzar una moneada 10 veces al
no signific a que la moneda
ser que 8 veces se obtiene cara, este resultado
futuros, y que sólo por
tenga necesariamente más caras en lanzamientos
idades se estu-
casualidad haya caído 8 veces. A las suposiciones O casual
para los datos o muestra.
dian a través de los modelos de probabilidad
de un mode-
Por tanto, la estadística inferencial consiste en la formulación
cual la estadística
lo de probabilidad para describir la muestra, y para lo
de probab ilidad es. La
inferencial requiere del conocimiento de la teoría
is y de la estima ción
estadística inferencial trata sobre la prueba de hipótes
la presen te public ación se
de parámetros de un modelo probabilístico. En
trata esta última parte en el capítulo V.

E
CAPÍTULO

Probabilidad
aplicada en la hidrología

2.1. Generalidades
En este capítulo se estudia la teoría de probabilidades y la aplicación de
la probabilidad en la hidrología. El comportamiento de la variable hi-
drometeorológica como la precipitación, temperatura del aire, descargas,
etc., en la naturaleza son aleatorios, especialmente las variables extremas
(máximas o mínimas); el medio adecuado para estudiar las variables
aleatorias es a través de la teoría de probabilidades.
En los cursos de estadística y probabilidades generalmente los enfoques
teóricos se explican con ejemplos que no son datos hidrometeoroló-
gicos como son el lanzamiento de dados o monedas, por esta razón
se hace complicado relacionar los conceptos teóricos con la realidad,
para superar esta dificultad se trabajará con ejemplos de datos de
hidrología.

2.2.Fenómeno aleatorio
Es aquel fenómeno que bajo las mismas condiciones experimentales se
presenta en más de una manera, o también se le denomina fenómeno
que sucede al azar. En el lenguaje de probabilidades las palabras: fe-
nómeno, suceso, experimento, observación o dato son términos que se
usan indistintamente. Por ejemplo, todas las variables hidrológicas como
las precipitaciones, descargas, etc., son consideradas como fenómenos o
sucesos aleatorios, porque se consideran como sucesos al azar. La palabra
aleatoria deriva del latín alea, lo cual significa "suerte" o "azar". El azar
hace que algunas cosas ocurran de manera fortuita e impredecible. Los
fenómenos aleatorios se estudian a través de la ley de probabilidades
(posibilidades).

E
oGíA (Diseño HiproLóciIco)
Estabística Y PROBABILIDAD EN LA HiDroL

2.3. Espacio muestral


ias o resultados posibles de un
Es el conjunto de todas las ocurrenc
S. En un experimento aleatorio
experimento aleatorio, se denota por
el resultado, pero sí es posible
no es posible predecir con anticipación
tados posibles, llamado espacio
conocer el conjunto de todos los resul
muestral.
o continuo. Es discreto si el número
El espacio muestral puede ser discreto
contable), por ejemplo al lanzar
de elementos es finito o infinito (pero número de
interesados en el
un dado equilibrado una vez, si estamos con seis
la cara, que queda haciaarriba el espacio muestral es discreto
El espacio muestral es continuo
elementos como es: S = 11,2,3,4,5,6).
esta clase de espacio muestral en
si el número de elementos es infinito,
de un experimento aleatorio
la práctica se presenta cuando los resultados
s, como descarga, precipitación,
son mediciones de propiedades física
niveles del embalse, etc., estas
velocidad del viento, temperatura del aire,
(todos los valores de una recta
mediciones se dan en escala continua
tral de las descargas máximas
numérica); por ejemplo, el espacio mues
ha medidas en la estación de
instantáneas anuales del río Querococ
continuo, porque está definido
Querococha son de tipo espacio muestral límites reales no
desde cero hastael infinito positivo la pesar de que los
son ciertos).
idades en el caso del ejemplo
Para visualizar la aplicación de probabil eto y por
del cuadro N* 1.1.1., se considera como espacio muestral discr
tanto el tamaño del espacio muestral es 29,

2.4.Eventos
evento también se puede defi-
Es un subconjunto del espacio muestral, un espacio muestral
onjuntos en
nir como la colección de puntos O subc
Por ejemplo, un evento A puede
que tienen características COMUNES. anual menor de
instantánea
ser la ocurrencia de una descarga máxima
6.71 m/s del río Querococha.

tos
2.5. Diagramas de Venn y álgebra de even
tación gráfica de eventos que
El diagrama de Venn es una represen
as o algebraicas de eventos. En
sirve para ilustrar las relaciones lógic ante un
el diagrama de Venn el espacio muestral S se representa medi
tados dentro de los círculos en
rectángulo y los eventos están represen ar indicados som-
el rectángulo; los eventos de interés pueden qued
| rama. Álgebra de eventos es una
breando regiones apropiadas del diag de
herramienta y terminología para manejar y utilizar los conceptos

E __
u_ probabilidad.
ABELARDO M. Díaz SALAS

2.5.1. Unión de dos eventos A y B


Es la colección de puntos que están en A o en B o en ambos, la
unión de dos eventos se representa por A+B o AUB. El diagrama
de Venn que representa la unión de dos eventos se muestra en la
figura N? 2.1.

Figura 2,1. Diagrama de Venn. Unión de dos eventos. Región sombreada AUB

2.5.2. Intersección de dos eventos A y B


Es la colección de puntos que están incluidos en el evento A y B, la
intersección de A y B se representa por AB o ANB. El diagrama de
Venn que representa la intersección de dos eventos se muestra en
la figura N* 2.2.
(A

A ST e IS B

/ En |
/ £ . o, Ni
Lo...) y,
A

TA
ep

Figura 2.2. Diagrama de Venn. Intersección de dos eventos. Región sombreada AB


ESTADÍSTICA Y PROBABILIDAD En LA HiproLoGÍA (Diseño HIDROLÓGICO)

2.5.3. Complemento de un evento B


Son todos los puntos del espacio muestral que no están incluidos | ;
en el evento B, un caso especial es el evento nulo o vacío que es el |
complemento del evento S. El diagrama de Venn que representa el
complemento de un evento se muestra en la figura N? 2.3. repre-
sentado por B'.

A
A
e
Figura N? 2,3. Diagrama de Venn. Complemento de un evento, '
Región no sombreada ,

2.5.4. Eventos mutuamente excluyentes


Dos eventos A y B son mutuamente exclusivos o excluyentes o dis-
juntos o ajenos, si ningún punto del universo (espacio muestral) está
incluido en más de un evento. Es decir, A y B no tienen elementos
comunes, matemáticamente se representa mediante la siguiente
ecuación:

E ANB=4 (2.1)

Dos eventos A y B son mutuamente exclusivos si ambos no pueden


ocurrir simultáneamente, generalizando se dice para una colec-
ción de eventos: E,,E,,....E, son mutuamente excluyentes si no hay
traslape entre cualquiera de ellos, es decir para todos los pares se
tiene: ENE =9. Por ejemplo, los eventos A y B de la figura N* 2.4.
son eventos mutuamente excluyentes.
ABELARDO Ml. Díaz SALAS

[+
Figura N* 2.4. Diagrama de Venn. Eventos mutuamente excluyentes

2.5.5. Eventos colectivamente exhaustivos


Un conjunto de eventos es colectivamente exhaustivo si a lo menos
uno de ellos debe ocurrir, es decir, su unión es el evento universal
(espacio muestral).
Un conjunto de eventos puede ser mutuamente exclusivo, colectiva-
mente exhaustivo, tener ambas propiedades o bien ninguna. Varas
[17].

2.5.6. Eventos independientes


Dos eventos A y B son independientes o mutuamente independientes
si y sólo si A es independiente de B o B es independiente de A.

2.5.7. Álgebra de eventos


Los conceptos anteriores y los postulados siguientes definen el ál-
gebra de eventos.
i. Ley conmutativa

A+B=B+A
Q.2)
AUB=BUA
ESTADÍSTICA Y PROBABILIDAD EN La HiDROLOGÍA (Diseño HioroLóGico)

li. Ley asociativa

A+(B+C)=(A+B)+C 2.3)

AU(BUC)=(AUB)UC o

2.6.Probabilidad de un evento
Un experimento se debe describir a través de un modelo (ecuación mate-
mática), para lo cual se requiere asignar alguna medida de cuantificación
que represente la posibilidad o probabilidad de que ese evento ocurra,
esta medida es la probabilidad. Si una muestra de n observaciones (datos)
tiene n, valores en el rango del evento A, entonces la frecuencia relativa
de Á es:

fr, =2 (2.4)

Por ejemplo si se considera los datos del cuadro N? 1.3.4. el evento A se


puede definir como A = Q < 6.71 m?/s.
Si el tamaño de n aumenta la ecuación (2.4.) se convierte en la mejor
estimación de la probabilidad del evento A, según esta definición se
tiene:

P(A) = lim LA
hos» py
(2.5)

Estas probabilidades son conocidas como probabilidades posteriores


porque dependen de las observaciones de la variable aleatoria (resultados
del experimento).
Es costumbre calcular la probabilidad futura de un evento sobre la base
de las observaciones de la muestra, por tanto la probabilidad de cualquier
evento A que contenga n, elementos de estos n puntos (tamaño de la
muestra o del especio muestral) es la razón del número de elementos en A
al número de elementos en la muestra. Matemáticamente esta definición
se expresa por:

PLA) |
= Ma _ Casos favorables i 0.6)
n casos posibles
ABELARDO M. Díaz SALAS

Donde:
n, €s considerado como el número de resultados o puntos favorables o
como los éxitos, entonces la probabilidad de éxito (que ocurra A) está
dada por la ecuación (2.6.), pero cabe aclarar que los términos favorable
o éxito es meramente enunciativo,
En el lenguaje de las probabilidades se usan los términos éxito o favorable
y fracaso de manera arbitraria, sin implicar que el éxito o favorable sea
necesariamente lo deseable.
Si un espacio muestral S (espacio muestral con resultados igualmente
probables) contiene n eventos equiprobables y m de estos eventos están
contenidos en A, entonces la probabilidad es: P(A) = —A = TA,
Ejemplo 2.1. d3

Con los datos del cuadro N* 1.3.4., determinar el número de elementos


de cada evento.
+ Evento A= Q < 6.71 ms,
+ Evento B= Q > 8.06 m?/s y
+ Evento C= 6.71 m/s < Q < 8.06 m/s.

Descargas máximas instantáneas anuales


del río Querococha ordenadas en forma ascendente (m?/s)

3.98 4.89 | 4.93 5.8 5.88 6.26 6.39 6.5 6.52 6.7
6.77 6.87 6.94 7.48 7.56 7.95 8 8.13 8.9 8.9
8.96 8.97 9.1 9.4 9.4 9.8 10.2 10.72 | 10.78
Solución
La determinación del número de elementos de cada evento se realiza
por conteo directo de las descargas ordenadas en forma ascendente o
descendente, sin considerar los años de suceso como se muestra en el
cuadro siguiente y N* 1.3.4.

Descargas máximas instantáneas anuales del río Querococha


(resultados igualmente probables)
EsTapísTicCA Y PROBABILIDAD EN La HiDRoLOGÍA (Diseño HiDroLóGIco)

El número de elementos de cada evento es: n, = 10, nz = 12yn¿=7


Ejemplo 2.2.
Considerando las descargas máximas instantáneas anuales del río Que-
rococha, hallar la probabilidad de que las descargas sean menores a
6.71 m/s.
Solución

En el ejemplo 2.1. se observa que los caudales menores a 6.71 m?/s


son en número de 10 (casos favorables) de un total de 29 datos (casos
posibles), por tanto se tiene: m = n, = 10,n = 29. La probabilidad es:
P(A) =P(Q< 6.71m/s) = 190.35
29

Este mismo resultado se obtuvo en el ejemplo 1.2.

2.6.1. Axiomas de probabilidad


i. Axioma l
Si A es un evento cualquiera, entonces se tiene:

O<P(A)<1 ) (2.7.)

La probabilidad de cualquier evento es mayor o igual a cero


porque en un experimento no existe algún número de evento
negativo, por ejemplo no podemos afirmar que las descargas
máximas instantáneas anuales han sucedido menos 5 veces en
una muestra de 20 años.
ii Axioma 2

Si A y B son eventos mutuamente excluyentes se tiene:

PA UB) = P(A) + P(B)


conAMNB =p (284

Este axioma permite calcular las probabilidades asociadas


a eventos más complejos, como es el caso de que se puede
calcular la probabilidad de eventos simples mutuamente exclu-
yentes.
ABELARDO MÍ. Díaz SaLas

iii. Axioma 3
Si S es el espacio muestral se tiene:

( P(S) = 1 ) (2.9.)

Cuando la probabilidad es 1 quiere decir que han ocurrido


todos los eventos.
Ejemplo 2.3.
Considerando las descargas máximas instantáneas anuales del río
Querococha dado en el cuadro N* 1.3.4.
1. Hallar la probabilidad de que las descargas sean menores a
6.71 ms.
2. Hallar la probabilidad de que las descargas sean mayores a
8.06 m/s.
3. Hallar la probabilidad de que las descargas sean mayores o
iguales a 6.71 m*/s y menores o iguales a 8.06 m/s.
Solución . E
Del ejemplo 2.1. se tiene:
P(A)=P(Q<6.71m/8) = 1_035
29
3 12
P(B)=P(Q>8.06m/s) = 39504

P(C)=P(6.71<0Q< 8.06m*/s)= E =0.24

Estos mismos resultados se obtuvieron en el ejemplo 1.2.


En este caso la suma de elementos de los eventos A, B, C es igual
al tamaño de la muestra, por lo tanto para eventos mutuamente
excluyentes y colectivamente exhaustivos, se tiene:

P(AUBUC)=P(S) 1
= P(Q< 6.71)+ P(6.7 <Q <8.06)+P(Q > 8.06) = at"

2.6.2. Reglas aditivas


1. SiAyB son dos eventos cualquiera, entonces se tiene:

( P(AUB) = P(A) + P(B) - P(ANB) | (2.10.)

KE
ESTADÍSTICA Y PROBABILIDAD EN LA HibroLOGÍA (Diseño HIDROLÓGICO)

La ecuación (2.10.) se deduce de la figura N*2.1., donde P(4UB)


es la suma de los puntos muestrales en a u B, la suma de las
probabilidades Pía) + PB) representa la suma de todas las pro-
babilidades en A más todas las probabilidades en B, en esta
adición se ha considerado dos veces las probabilidades en
PA 8), por lo tanto a la probabilidad de ría u 8) se debe restar
una vez las probabilidades PA a B).
2. Si A y B son eventos mutuamente excluyentes, entonces se
tiene:

( PAU B) = P(A) + P(B) ] (2.11)

Según la ecuación (2.1.) se tiene para este tipo de eventos An B=>,


por tanto P(A 7 8) = P(4) - O (ver ejemplos 2.3. y 2.4..).
3. Si el espacio muestral S tiene resultados igualmente probables
(equiprobables) o si A, A,...., A, es una partición del espacio mues-
tral S y mutuamente excluyentes, entonces se tiene: S=(A,, A, ...,
A), la probabilidad de ocurrencia de cada elemento individual
está expresado por:

P(A)===p (2.12)

En la hidrología a los datos recopilados como por ejemplo datos


del cuadro N? 1.1.1. se consideran que cada punto o cada dato
del espacio muestral tienen la misma probabilidad o posibilidad
de ocurrir. En estos casos, como ya se ha indicado, los eventos
A son mutuamente excluyentes y su probabilidad es:

( P(A,) = PA) =... = PÍA) =p ] (2.13.)

De los axiomas 2 y 3 y de las ecuaciones (2.11.) y (2.12.) se


obtiene:

( P(A,¿UA,,... VA,)=P(A)+P(AJ)+... + P(A,) =P(S)=1=np (2.14)

Ejemplo 2.4.
Con los datos del cuadro N* 1.3.4., hallar la probabilidad de ocu-
rrencia de cada descarga y la probabilidad de S (especio muestral).
ABELARDO MI. Díaz SALAS

Descargas máximas instantáneas anuales del río Querococha


ordenadas en forma ascendente (m*/seg.)
3.98 4.89 4.93 5.8 5.88 6.26 6.39 6.5 6.52 6.7
6.77 6.87 6.94 7.48 7.56 7.95 8 8.13 8.9 8.9
8.96 8.97 9.1 9.4 9.4 9.8 10.2 10.72 | 10.78

Solución
De la ecuación (2.13.) se tiene:
;
PLA, =3.98) = P(A , =4.89) =...= P(A ¿9=10.78) =

De la ecuación (2.12.) y del Axioma 3 para todo evento Á se tiene:


PA) = número de puntos en A Ma
n n

Por la definición del espacio muestral S con resultados igualmente


probables la probabilidad de cada evento A es igual a la proporción
de puntos o datos en el espacio muestral que están contenidos en A.
De la ecuación (2.14.) se halla la probabilidad de todo el espacio
muestral S:
1
PAJA
21. A p)= PIA)+P(A3) o. +P(A,) =P(5) =29=1

2.6.3. Probabilidad condicional


Si y B son eventos en S, la P(An B) se encuentra mediante el siguiente
razonamiento (ver figura N* 2.5.).
A

Figura 2.5. Diagrama de probabilidad condicional P (B/A)


ESTADÍSTICA Y PROBABILIDAD EN La HIDROLOGÍA (Diseño HIDROLÓGICO)

Supongamos que se desea conocer la ocurrencia de 8 sujeta a la


condición de que a ha ocurrido con certeza o va ocurrir, dado que
ha ocurrido los únicos resultados del experimento que se consideran
son aquellos correspondientes a la ocurrencia de a, lo cual matemá-
ticamente se representa por:

e Puy BRAIB) (2.15)

Donde:
n(a) = número de resultados de la ocurrencia de A
nía e B) número de resultados de la ocurrencia de An B
La ecuación (2.15.) es la probabilidad de que ocurra 5 sujeta a la
restricción de que A ocurra.
La ecuación (2.15.) se demuestra con la ayuda de la figura N* 2.5.
y teniendo las definiciones:

P(A) = (2.16.)

e ans = 10D | (2.17)

Dividiendo la ecuación (2.17.) entre (2.16.) se tiene:

| POB) _MAN8) | 018


P(A) n(A)

Reemplazando la ecuación (2.18.) en (2.15.) se tiene:

peajay PALO] HAM) | (2.19)


A P(A)

La ecuación (2.19.) es la probabilidad de ocurrencia de B dado que


ha ocurrido A, que es igual a la probabilidad de A y B dividido entre
la probabilidad de A.
ABELARDO M. Díaz SaLas

2.6.4. Regla de multiplicación


La probabilidad de que dos eventos ocurran es igual a la probabili-
dad de que ocurra el primer evento, multiplicado por la probabilidad
condicional de que ocurra el segundo cuando con certeza ha ocu-
rrido el primer evento, esta regla se obtiene a partir de la ecuación
(2.19.) representada por:

PIA A B) = P(A) P(B/A) ) (2.20.)

2.6.5. Probabilidad condicional para eventos independientes


Como se ha indicado, dos eventos A y 58 son independientes o
mutuamente independientes si y sólo si B es independiente de A es
decir se cumple:

a P(B/A) = P(B) 2) (2.21,)

Por tanto para eventos independientes se tiene:

o PIA A B) = P(A) P(B) 2) (2,22.

Ejemplo 2.5.
De los datos del cuadro N? 1,1.1., hallar la probabilidad de que las
descargas del río Querococha sean superiores a 8.061 m3/s en dos
años sucesivos.
Solución
Como el suceso de las descargas máximas instantáneas anuales
son independientes de un año a otro y como se ha definido en el
.
ejemplo 2.2. P(B) =P(Q>8.06m/s) = 2912 7 041, en un año
- .
cualquiera y
sea D el evento de que Q > 8.06 m3/s ocurra en dos años sucesivos
entonces la probabilidad que en dos años sucesivos las descargas
sean superiores a 8.06 m/s es:
P(D) = (P(Q > 8.06)? = (12/29)? = 0.17

Esta respuesta la podemos comparar con los datos del cuadro si-
guiente (números en negrita), donde se observa que existen 5 pares
de años con descarga mayor a 8.06 m/s de los 28 pares posibles,
donde se puede estimar P(D) = = =0.18.

K
ESTADÍSTICA Y PROBABILIDAD EN La HiDrOLOGÍA (Diseño HIDROLÓGICO)

Descargas máximas instantáneas anuales del río Querococha (m?/s)


(considerado como resultados de un experimento aleatorio)
Año e Año : Q Año 0
1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78 O]
1962-1963 7.56 1972-1973 5.80

Los resultados obtenidos son aproximados.

Problemas
2.1. Suponiendo que se tiene un año representativo (muestra) de las
precipitaciones diarias mostrada en el cuadro N* 2.1., con respecto
al mes de abril:
1. Hallar la probabilidad de tener un día lluvioso.
i 2. Hallar la probabilidad de tener un día seco seguido de otro día
¡ seco.
3. Hallar la probabilidad de tener un día seco seguido por un día
lluvioso.
Nota: Considerar día lluvioso día en el cual ha sido medida la altura
de precipitación igual o superior a un 1 mm.
2.2. Usando las probabilidades del problema 2.1., y si en abril de un año
cualquiera se observa que el día 15 es lluvioso ¿cuál es la probabi-
lidad de que los dos siguientes sean lluviosos?
ABeLarDO M. Díaz SALas

ON FU
PR

Duo
DIA
AHOGAN DIARIO AMO
A ido MAJA MARU

002200 YONMÍE Ommamay Mmavom CMA no


42... ..... o ..sn .... . as
DIC»

MODA ADON= DNITO PND Ne >


xo
195 3

coco arooo nao 20m


M5

uo
e... e... a... ....» ... .
NOV.

a00cn ono 0000 PRNNO N ow


«e ..
¡IE VBas, 2990-00

su
x=
ORO L NAMND DONNA nan? ran 0
*e.

....« o... . o... .... a... -..


otT.

DONOM Dam CONMO Sedo Som Nu o


0 -<
a
«fe
+ a
o >
FM aro00o Oocono ento
ES
-= MILIMETROS

...... .». >... ....o


SET,

9005 odos dose ONE4TO “a =


“í x
Cuadro N? 2.1. Prec ¡pi taciones di tarias (mm)

*e

DOBCOo ono —cono 2209009 EST Mn e


en la estación de Querococha-1974

..... e... o. ... .. a


DÍ DAFO ADOOS dorso nócos cx se
AGa

- ma
NET
DIARIA
OUEROCOCHA

-
..
2050090 00000 a E '9o0u9e ET
e... ..... ..... ..... o ao
JUL.

0060060 OGodco c ásudea cor _


a
Ar
PRECIPITACIÓN
1974

o
2
o]
*a

ey An
eo... e.
4
JUN.

onoo FO=00 a x
mn =
ANO
303

ur
x=

+ n= |
santa nacos acoso ones Suu
..
yu
o.
A a
.
Lo». »ro.n... .....
MAY.

ÍSdoma domos ¿osVa dedo os ad sr


. 2
ESTACION

o
a
DE

noma o Sot CERA a +0


e...» o. > e
ABR.

dr men ie =
REGISTROS

e reo «
<
_ =
S
YANAYACU

mom c o
17.4

Nos E «
man ea.
FAR
SINTA

mo ur
eu > .
0 -
*ee

a e
Do -
ue
Nr.
FEB.

a
nt no
ma wo
ma

WODDO — MRLDAEN SAO Metu omonmm Som “


* > eo ras ys. ja
17.5

e. .o.o ec. Se sn...


ENE.

A o IDO tor o om ER
a] a n= o <o
Ñ De
>
1

Fuente: Electroperú

z5
mn a
CUADRE]

Oo a
ue ol
Ls o] un
ARO DIARIO A DARDO a Das o a «<<
PIA

ii pS NA NANA = er
31
EstabísTiCA Y PROBABILIDAD EN LA HiproLoGÍA (Diseño HIDROLÓGICO)

2.7. Técnicas de conteo


La probabilidad es definida mediante la ecuación (2.6.) que viene a ser
la división entre casos favorables y casos posibles. En los ejemplos que
se han visto hasta el momento, los casos favorables y los casos posibles
han sido cuantificados por conteo directo, en otras aplicaciones esta
cuantificación directa es tediosa para determinar el número de elemen-
tos de un espacio muestral finito, por esta razón es importante conocer
las técnicas de conteo utilizadas en matemáticas como permutaciones,
combinaciones, etc. Por ejemplo, si queremos averiguar para los datos
del cuadro N* 1.1.1. la probabilidad de que cinco caudales máximos
instantáneos anuales mayores a 8.06 m*/s exactamente ocurran en 50
] años, la respuesta como se verá oportunamente se halla mediante la
| técnica de combinación.

2.7.1. Permutaciones
i. Permutaciones de n objetos distintos tomados todos a la vez
Las permutaciones son los ordenamientos (cambios de orden),
por ejemplo tres personas que sean alumnos de un colegio de
nombre Augusto, Bernardino y Claudio pueden ordenarse en
su formación de la siguiente manera:
Augusto, Bernardino, Claudio
DAIP»ApN

Augusto, Claudio, Bernardino


Bernardino, Augusto, Claudio
Bernardino, Claudio, Augusto
Claudio, Augusto, Bernardino
Claudio, Bernardino, Augusto
Entonces las permutaciones u ordenamientos diferentes (o arre-
alos ordenados) que se pueden hacer con todos ellos tomados
a la vez en este caso es 6. Por tanto, ordenamientos diferentes
de los mismos objetos (en este caso personas) se encuentran
mediante las permutaciones.
Cuando los objetos a ordenar en cantidad son grandes, no
es práctico hacer el listado de todas las permutaciones y con
frecuencia sólo interesa conocer el número de ordenamientos
O permutaciones, como en el caso del cálculo del tamaño del
espacio muestral.
Para entender mejor este concepto es necesario trabajar con el
| sistema de casilleros; para el caso del ejemplo anterior de tres
| personas, para hallar el número de permutaciones u ordena-
ABELARDO M. Díaz SALAS

mientos, tomados todos a la vez se dibuja un casillero con tres


casillas que representan los posibles ordenamientos:

LJ (1 E
En el casillero avanzando de izquierda a derecha, la primera
casilla tiene tres maneras distintas de ser ocupada, ya sea por
Augusto, Bernardino o Claudio. Una vez ocupada la primera
casilla, supongamos por Augusto, la segunda casilla será ocupada
sólo de dos maneras diferentes, ya sea por Bernardino o Claudio,
supongamos que sea ocupado por Claudio. Después de que
haya sido ocupada la segunda casilla en este caso por Claudio,
la tercera casilla podrá ser ocupada de una única manera, por
la persona que queda como en este caso es Bernardino.
Por tanto, si en la parte baja de cada casilla se anota el número
de distintas maneras en que pueda ocupar (ordenar) la perso-
na en tal posición después de haber sido ocupada la posición
anterior por una de las opciones correspondientes a ella, y
finamente multiplicando los tres números se obtiene:

3x2 X 1 =3!= 6 maneras distintas.


Del ejemplo se deduce que en general n objetos distintos pue-
den ser permutados (ordenados) todos a la vez mediante la
siguiente ecuación:

( nin — Din — 2) ... 211) = n! =P, ] (2.23.)

Donde:
n! = número de maneras distintas de ordenamiento (permu-
tación).
Por tanto el número de permutaciones de n objetos distintos
es n!.

Permutaciones de n objetos distintos tomados de r en r


Para este caso consideremos que se quiere calcular el número
de permutaciones (ordenamientos diferentes) de 5 personas
tomadas de 2 en 2, sin repetición.
Las cinco personas son:
1. Augusto representado por la letra A
2. Bernardino representado por la letra B
3. Claudio representado por la letra C
ESTADÍSTICA Y PROBABILIDAD EN La HIDROLOGÍA (Diseño HIDROLÓGICO)

4. Dimas representado por la letra D


5. Eladio representado por la letra E
Primeramente calculemos los ordenamientos (permutaciones)
mediante un casillero con dos casillas; la primera casilla puede
ser ocupada de 5 maneras distintas (por cualquiera de las 5
personas), por ejemplo por Augusto.
Una vez ocupada la primera casilla por Augusto la segunda
casilla puede ser ocupada de cuatro maneras distintas, por
cualquiera de las 4 personas restantes (Bernardino, Claudio,
Dimas o Eladio).

5 X 4 = 20 ordenamientos diferentes.
Estos ordenamientos diferentes de las 5 personas tomadas de
2 en 2 sin repetirse se muestran en el siguiente cuadro:

[AB | BA CA DA [| ta |
AC BC C8 DB EB
AD BD CD DC EC
AE BE CE DE ED 7
En el cuadro anterior también se muestra que el número de
permutaciones de 5 objetos (en este caso personas) tomados
de dos en 2 es 20 y se puede representar por:
Sx4x3! 51 5!
20=5x4= == Y
31 31 (5-2)!
Generalizando, se establece que si r objetos se eligen de un
conjunto de n objetos distintos, cualquier arreglo u ordenación
se denomina permutación. Para encontrar el número total de
permutaciones de r objetos escogidos entre n objetos distintos,
observemos que la primera elección se realiza en el conjunto
completo de n objetos, la segunda se efectúa los n-1 objetos
que quedan después de la primera elección y la r-ésima elección
de los n-(r-1)= n-r+1 objetos, los que quedan después que las
primeras r-1 elecciones que se han realizado. Por tanto, por la
regla de multiplicación de opciones, el número de permutaciones
de r objetos elegidos de un conjunto de n objetos distintos es:

Pp, = (2.24)
ABELARDO M. Díaz SALAS

Ejemplo 2.6.
¿En cuántas formas se puede hacer una primera, segunda y tercera
elección entre 10 empresas constructoras?
Solución:
10!
10Py = = 720
(103)!

2.7.2. Combinaciones
Existen numerosos problemas en los cuales debemos encontrar el
número de formas en que r objetos pueden elegirse de un conjunto
de n objetos, donde no interesa el orden (el ordenamiento en fila
no interesa) en que se realiza la selección. La combinación de n
elementos en grupos de r elementos están constituidas por grupos,
de tal forma que cada grupo es diferente a los demás por el conte-
nido de sus elementos. Para encontrar el número de formas en que
r objetos pueden elegirse de un conjunto de n objetos distintos, se
utiliza el concepto de combinación que es calculada mediante la
siguiente ecuación:

n AP n!
| )- __ (2.25)

Para aclarar la interpretación de la combinación veamos el siguiente


ejemplo de los alumnos que se ha indicado en el estudio de permu-
taciones, en ese caso se ordenaban a los alumnos en fila y cada fila
era diferente, por la ubicación de los alumnos. En este caso veamos
cuántos comités de junta directiva de tres miembros se pueden
formar con los cinco alumnos, como es lógico una junta directiva
formada por Augusto, Bernardino y Claudio es el mismo que la junta
formada por Bernardino, Claudio y Augusto, pues el orden de los
alumnos no interesa, entonces todos los comités posibles de junta
directiva que se pueden formar se muestra en el siguiente cuadro:

AB,C A,B,D A,B,E AC/D ACE


ADE B,C,D B,C,E 8,DÉ C,D,E

El número de combinaciones es 10.


¿C3=
5 255% 10
3 317 3(5-3)!
(Diseño HiproLóGico)
EstapísTiCA Y PROBABILIDAD EN LA HIDROLOGÍA

Ejemplo 2.7.:
años de registro de
Si en una estación hidrológica se cuenta con 12
los cuale s 4 valores han
precipitaciones máximas diarias anuales de
s):
sido medidos con error (resultados defectuoso
de los 12 dispo-
1) Si se seleccionan 3 valores en forma aleatoria
nacio nes se puede n obtener
nibles, ¿cuántas formas o combi
para estas condiciones?
cionar 1 dato de
2) ¿Cuál es el número posible de formas de selec
4 malos y 4 datos de 8 datos buenos?
Solución:
que se pueden
1) El número total de combinaciones o formas
seleccionar de 3 datos de 12 dispo nible s es:

( 7 121
=-=220
3) 9131

2) El número total de formas de seleccionar es:


AY87 4 8l
= —x ——=280
14) 3m 44

Ejemplo 2.8.
rga cualquiera, por
De los datos del cuadro N? 1.3.4. una desca
as maneras pueden
ejemplo las descargas mayores 8 m/s , de cuánt
do de 5 años de
presentarse en dos años exactamente en un perío
terminado el proyecto.
Solución
suceda p en dos
Sea p > 8m/sy q <8 mí/s las posibilidades que
proyecto se muestra
años exactamente durante los 5 de terminado el
en el siguiente cuadro:
Año cc
* NS de
2 ! 3 4 5
posibilidades 1
2 q q q
1 p
q p q q
2 p
q q Pp q
3 p
q q q p
4 p
Y q q z
5 q p
Y g Pp q
6 q
p q q p
7 q
q p p q
8 q
q p q Pp
9 q
q q p Y
10 q
ABELARDO MI. Díaz SALAS

Se observa que existen 10 resultados posibles que en 5 años se


presenten exactamente 2 años con caudales mayores 8.06 mI/s,
este resultado es igual a o.

2.7.3. Binomio de Newton


En el capítulo IV se estudian las distribuciones de variable aleatoria
discreta, y para hallar la esperanza matemática (promedio) de una
distribución se usa el concepto de momentos. La esperanza mate-
mática de la distribución geométrica es el tiempo de retorno. Para
estimar el tiempo de retorno definido en el capítulo VII, es importante
:
revisar el desarrollo del binomio de Newton, definida mediante la
siguiente ecuación:

L x+ay" ] (2.26.)

1. Desarrollo del binomio de Newton con exponente positivo y


entero:

Para demostrar el desarrollo del binomio de Newton analicemos


el desarrollo del producto de los siguientes binomios:

( O alix+b)=x?+ (a+ b)x+ab ) (2.27,

( (x+ 8) bx O == + (a+ b+ 0x2 + (ab +ac+ box +abc ) (2.28.

bra +blx+oOR+ a =x + (a+ b+c+ dx + (2.29)


(ab + ac +ad+bc+ db +cd)x?+(abc+abd + bcd +acd)x + abcd an

Generalizando para n factores se tiene:

( ora b)..(ps s s E, ) (2.30)

Donde:

s, = suma de las letras a, b, c,..., p

S) suma de los productos de estas “n” letras tomadas de 2 en 2


suma de los productos de estas “n” letras tomadas de 3 en 3
Il

producto de todas las “n letras”


1
un
EsTADÍSTICA Y PROBABILIDAD En La HiproLOGÍA (Diseño HIDROLÓGICO)

Si todas las letras son iguales, es decir, se tiene:

E e ) (2.31)

Los valores de s serán:

|| »
| a Jr (2.32,)
n

| 1) 1

5y= E5 PP2 2.33,


|
| ]
| e Q.34)
| 3 31

a [pr-[2)r- pr (2.35,
n ñ

| El producto de n factores (x+r) es (x+r". Reemplazando las ecua-


| ciones del (2.32.) al (2.35.) en (2.30.) se obtiene:

n n n ]
capte jrta (2.36.) E
E

En forma general el binomio se puede expresar mediante la


siguiente ecuación:

e +1)” = (ojo eee


0 1
A; eje
2
r? ese
3
TN [nj
a (2.37.) EE

Ejemplo 2.9.
Desarrollar: (x+ 1)*
Solución:
Reemplazando n=4 en la ecuación (2.37.) se tiene:
4 4 4 4 dE
SA Jena Jer ho, Y A
0 1 2 3 4 E

=x 494x614 xr + 1?
ABELARDO M. Díaz SALAS

2. Desarrollo del binomio de Newton con exponente negativo y/o


fraccionario.

Cuando el binomio tiene exponente negativo y/o fraccionario


reemplazando las ecuaciones del (2.32.) al (2.35.) en (2.30.):

a ps | (2.38.)

La ecuación (2.38.) puede ser escrita como:

=- —-1 =-
f ys xr — 1) Any a | (2.39.)

Ejemplo 2.10.
Desarrollar: (1+132
Solución:
De la ecuación (2.39.) se obtiene:

(o) =1+(2)x+ ES == Dt. (0:40)


(1497 =14+(2)x+ (3x2 + (9x8 +

Ejemplo 2.11.
Desarrollar: (1+x)?
Asumiendo x=-(1-p)=(p-1)
Solución:
De la ecuación (2.40.) se obtiene:

(14+3=1-2x4 324. ] (2.41.)


[1+(p-D1?=1-2(p-1)
+ 3(p-12-4(p-19 +...

| (py? =L 1+201-p)+30-p2+4(01-pY +. | (2.42)


p

Nota: En las ecuaciones (2.41.) y (2.42.) p es la probabilidad cuya


interpretación se estudia en el capítulo VII.
CAPÍTULO

Variable aleatoria y distribuciones. Esperanza matemática


y momentos de las distribuciones

3.1. Generalidades
Como se ha indicado en el capítulo II, las variables hidrometeorológicas
como las descargas, precipitaciones, temperaturas, horas de sol, etc., son
consideradas como variables aleatorias y por lo tanto se pueden describir
mediante las distribuciones o modelos de probabilidades de tipo discreto
o continuo.

En una muestra es importante describir las curvas de frecuencias mediante


las estadísticas, de igual manera en el estudio de la variable aleatoria la
descripción de la distribución de probabilidades (curva que describe la
población) se realiza a través de los parámetros que se estiman, como
por ejemplo mediante la esperanza matemática o momentos de la dis-
tribución de probabilidades. La esperanza matemática o los momentos
de la distribución vienen a ser uno de los métodos que permiten evaluar
los descriptores de la distribución (parámetros), como por ejemplo el
coeficiente de sesgo.
En este capítulo se estudia el comportamiento probabilístico de la va-
riable aleatoria, tipos de variable aleatoria, tipos de las distribuciones de
probabilidades, esperanza matemática (media), los momentos de una
distribución de probabilidades y los descriptores numéricos de la pobla-
ción (parámetros) como media, variancia, etc.

3.2. Variables aleatorias y distribuciones


Para entender la definición de la variable aleatoria, analicemos un ejemplo
que no es de hidrología, pero que permite definir el concepto de variable
aleatoria.
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HIDROLÓGICO)

Ejemplo 3.1.
Si X es la variable aleatoria definida como la suma de los números al
lanzar dos dados no sesgados, hallar la probabilidad para los valores de
la variable aleatoria y graficar las probabilidades.
Solución
En el experimento del lanzamiento de dos dados se tienen los resultados
posibles siguientes (elementos del espacio muestral), donde el primer
número de cada par indica el número que aparecería en el primer dado
y el segundo número indica el que aparecería en el segundo dado. Es
importante indicar que los dados son distintos o bien que se lanzan en
ese orden.
En este caso la variable aleatoria puede tomar cualquier valor entero
entre 2 y 12 y su probabilidad está dada por el número de resultados
posibles entre el tamaño del espacio muestral, los cuales se muestran en
los cuadros N* 3.1. y N* 3.2. y en la figura N* 3.1.
Por consiguiente, una variable aleatoria se puede definir como una función
X sobre un espacio muestral que asocia un número real o valor a esta
variable con cada elemento del espacio muestral, por tanto la variable
aleatoria es una variable numérica, cuyo valor no puede predecirse antes
de un experimento u observación.

Cuadro N? 3.1.
Resultados posibles del ejemplo 3.1.
1,1 2,1 3,1 41 5,1 6,1
1,2 2,2 3,2 4,2 5,2 6,2
1,3 2,3 3,3 43 5,3 6,3
14 2,4 3,4 44 5,4 6,4
1,5 2,5 3,5 45 5,5 6,5
1,6 2,6 3,6 4,6 5,6 6,6

Las probabilidades asociadas a la variable aleatoria son:


Cuadro N? 3.2.
Ley de probabilidades del ejemplo 3.2.

(1,0 Px=2)=1/36

(1,2), (2,1) P(x=3) =2/36


(1,3), 2,2, 8,1 P(x=4)=3/36
(1,4), (2,3), 8,2, (4,1) P=5)=4136
AseLarDO M. Díaz SALAS

Resultado e Variable aleatoriax. Probabilidad


3), (2,9), (3,3), (4,2), (5,1) 6 P(x=6)=5/36
0), (2,5), 6,4), (4,3), (5,2), (6,1) 7 P(x=7)=6/36
2.6),(3,5), (4,4), (5,3), (6,2) 8 P(x=8)=5/36
3,6), (4,5), (5,4), (6,3) 9 P(x=9)=4/36
2,6), (5,3), (6,4) 10 P(x=10)=3/36
5,6), (6,5) 11 Px=11)=2/36
6,6) 12 P(X= 12) =1/36

0.18
D.16

0.14
ha
D
a

0.10
1)

$08
0.06
0.04 4
0.02 y
0.00
2 3 4 5 6 7 3 2 10 11 12
VARIABLE ALEATORIA X (SUMA DE LOS DOS NUMEROS QUE APARECEN EN LA CARA SUPERIOR)

Figura N? 3.1. Ley de probabilidades para ilustrar el lanzamiento de dos dados

La definición teórica de la variable aleatoria no es adecuada porque se


define como una función sobre los elementos del espacio muestral, sin
embargo se le denomina variable, esta definición como variable aleatoria
a una función se conserva debido a que los valores que puede tomar
(variable aleatoria) dependen del resultado del experimento, es decir,
dependen del azar. En algunos casos (datos Al cada evento
elemental es una característica numérica y se tendrá xv = x, los datos del
cuadro N* 1.1.1. es un ejemplo de este caso. En la oráctica en la mayoría
de los casos no interesa la naturaleza funcional de X (variable aleatoria),
sino sus posibles valores.

En matemáticas usamos las funciones como fi = -2


E en esta función
la variable es x. En caso de modelos probabilísticos existen variables
X llamadas variables aleatorias, y el comportamiento de una variable
aleatoria se describe mediante la ley de probabilidades (distribuciones).
Para representar la variable aleatoria se usa la letra mayúscula y la misma
letra en minúscula representa los valores que puede tomar la variable
aleatoria. La función de probabilidad determina la posibilidad de que
ESTADÍSTICA Y PROBABILIDAD EN LA HiproLoGíA (Diseño HIDROLÓGICO)

una observación x (resultado de un experimento aleatorio) caiga en un


rango específico de X, así por ejemplo de los datos del cuadro 1.1.1.
se tiene que Q (variable aleatoria) representa a las descargas máximas
instantáneas anuales del río Querococha, y un rango de valores de esta
variable aleatoria sería Q < (q = 6.71 m?/s).
Como el valor de la variable aleatoria está determinado por el resultado
del experimento (suceso aleatorio de caudales, precipitaciones, etc.) se
puede asignar probabilidades a sus valores posibles (función de proba-
bilidad). La asignación de probabilidades se hace en la muestra que se
supone que es representativa de la población.
La distribución de probabilidad de una variable aleatoria X es una descrip-
ción de las probabilidades asociadas con los posibles valores de X, según
esta definición se tiene la distribución de probabilidades siguientes:
+ Para el caso de variables aleatorias discretas: función de masa de
probabilidad o función discreta masa de probabilidades y la función
de distribución acumulada o distribución acumulada discreta.
» Parael caso de variables aleatorias continuas: función de densidad
de probabilidad o función de densidad de probabilidades y la función
de distribución acumulada o distribución acumulada continua.
En el cuadro N* 3.2. y en la figura N* 3.1. se muestra la relación que
existe entre la variable aleatoria y la probabilidad (función discreta masa
de probabilidades).

3.2.1. Variable aleatoria discreta


Son las variables aleatorias que tienen un número finito o infinito
contable de valores posibles (resultados del experimento), los valo-
res de los resultados de la variable aleatoria discreta son números
enteros positivos 0,1,2,...
i. Función discreta masa de probabilidades (FMP)
Es la ley de probabilidades o la ley de distribución de probabi-
lidades de una variable aleatoria discreta y se representa por:

PO) = p(X = x) ] (3.1)

La función masa de probabilidad debe cumplir con los tres


axiomas de la teoría de probabilidades:

( 0 <p (x) < 1 para todo x ] (3.2)


ABELARDO M. Díaz SALAS

Pla<xX < b]= ot) a


x2a

|
|
L
2P0:)=1
€ (3.4.)

La función discreta masa de probabilidades también es deno-


minada función masa de probabilidades.
Ejemplo 3.2.
En una estación meteorológica referida a las precipitaciones
anuales de 8 años se ha detectado que existen 3 datos con erro-
res (error de trascripción). Un estudiante de hidrología escoge
al azar dos de estos datos y quiere determinar la distribución
de probabilidad para el número de datos con errores. Graficar
la función masa de probabilidad.
Solución
Del enunciado del problema se deduce que existen 3 datos con
errores y 9 datos correctos, al escoger dos datos al azar existen
las siguientes posibilidades:
* 2 datos correctos, es decir O datos con errores.
+ 1 dato con error y 1 dato correcto.
* 2 datos con error.
Si X es la variable aleatoria (define el número de errores) las
funciones de probabilidad son:

P(0)= P(X=0)= ola 1 ——=0.357


v_

E
P(1)= P(X =1)= so == 770536

a.
P()=P(X =2)=
lo == 370.107

()
La función discreta masa de probabilidades se muestra en el
siguiente cuadro y figura siguiente:
EstapísTICA Y PROBABILIDAD En LA HiDRoLOGÍA (Diseño HiDRoLÓGICO)

Cuadro N* 3.3.
Función discreta masa de probabilidades del ejemplo 3.2.

X 0 1 2

P0) 0.375 0.536 0.107

0.6
15/28

DAS d

5114

3/28

0 1 2
VARIABLE ALEATORIA X

Figura N? 3.2. Función discreta masa de probabilidades del ejemplo 3.2.

La función discreta masa de probabilidades se representa


mediante la figura N* 3.2., donde en el eje de las ordenadas
la altura de las barras representa la probabilidad y en el eje de
las abscisas el valor de la variable aleatoria.
Distribución acumulada discreta
Esta función representa la probabilidad del suceso de que la
variable aleatoria tome valores menores o iguales a x.
En el caso de variables aleatorias discretas esta función es la
suma de los valores de la función masa de probabilidades sobre
los valores menores o iguales a x de la variable aleatoria X, lo
cual matemáticamente se representa por:

FQ)=P(X <x)= ZP 04) XX


6.5)

A esta función se le denomina también como la función de


distribución acumulada (FDA).
AseLarDO M.. Díaz SALAS

Ejemplo 3.3.
Hallar la distribución acumulada del ejemplo 3.2. y graficar.
Solución
Aplicando la ecuación (3.5.) se obtiene:
0 x<0
Fx) = 0.357 para 0< x<1
0.893 lSx<2
1 x22

La función de distribución acumulada o distribución acumulada


discreta se muestra en la figura N* 3.3.

08 >
FO)

06 >
DA q
02-

0 1 2 3
VARIABLE ALEATORIA X

Figura N* 3.3. Distribución acumulada discreta del ejemplo 3.2.

Ejemplo 3.4,
Probar si la función p6) 2 para x = 1,2,3,4 es una función
masa de probabilidad.
Solución
Para que sea una función masa de probabilidad, se debe cum-
plir las condiciones establecidas en las ecuaciones del (3.2.) al
(3.4..).
p(1)= 5 no cumple la condición establecida en la ecuación (3.2.)
porque la probabilidad es negativa, por tanto esta función no
es función masa de probabilidad.

3.2.2. Variable aleatoria continua


Las variables continuas aparecen cuando se hacen mediciones en
una escala continua, como por ejemplo las mediciones de descarga,
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HiDRoLÓGICO)

precipitación, etc., este tipo de variables tienen una probabilidad cero


de tomar exactamente cualquiera de sus valores y su distribución de
probabilidad no se puede presentar en forma de tablas. Por tanto, se
trabaja con intervalos en vez de trabajar con datos puntuales como
en el caso de las variables aleatorias discretas.
Si el rango de X es continuo, se dice que la variable aleatoria es
continua y puede tomar valores en cierto intervalo o colección de
intervalos sobre la recta real, este tipo de variable es la más frecuente
en hidrología. Por ejemplo, tenemos las descargas del río Queroco-
cha del cuadro N? 1,1.1., los valores que puede tener Q en escala
continua teóricamente es de cero hasta el infinito.
i. — Función de densidad de probabilidades
La ley de probabilidades de una variable aleatoria X continua
se explica de la siguiente manera: si el eje x se divide en interva-
los de longitud infinitesimal dx y si se define una función fo) de tal
manera que la probabilidad de que X esté en el intervalo x, x+ dx
sea fixdx. Donde fix) se le conoce con el nombre de función de
densidad de probabilidades (FDP) o función de densidad de X;
el área bajo la curva de fx) en un intervalo dx es la probabilidad
matemáticamente expresada por:

x2
P[x,<x]= [E G9ax (3.6.)
*H

Si la función de distribución de probabilidades de una variable 4


aleatoria continua X es cero, es porque la longitud del intervalo :
dx es cero; es decir, en caso de una variable aleatoria continua
la probabilidad de un punto es cero.
En la ecuación (3.6.) fix) posee las siguientes propiedades:
La función f6y no es una probabilidad, sólo indica la den-
sidad o intensidad de la probabilidad en un punto.
La función fix) en ciertas distribuciones de probabilidad
puede tener valores mayores a 1.

( 10020 ) (8.7)

o f _ £60dx =1 7 (3.8.)

| [t00ax =Pla<X <b) | 8.9)


ABELARDO M. Díaz SALAS

Ejemplo 3.5.
Suponga que la función de densidad de probabilidad de una
variable aleatoria continua está dada por la siguiente ecua-
ción:
nx?, =1<x<2
f0) =
0, en cualquier otro caso

a. Hallar el valor de n si f(x) es una función de densidad de


probabilidad.
b. Graficar la función de densidad de probabilidad f(x).
Verificar si f(x) es una función de densidad de X para el
valor hallado de n.
d. Encontrar P(0<X<1)
Solución
a. Sif(x) es una función de densidad de X, debe cumplir con
la condición indicada en la ecuación (3.8.)
3 2 E E
fo0ax = Fmdax = ns =n])—-— ==]
q 3 3

8 1 1
n+=¡=l>on=-
E , 3

Por tanto se tiene:


2
x
—, =1<x<2
0
O, en cualquier otro caso

b. La gráfica de f(x) para los límites indicados se muestra en


la siguiente figura N* 3.4.
c. — Si f(x) es una función de densidad de X, debe cumplir las
condiciones indicadas en las ecuaciones (3.7.) y (3.8.),
la condición en relación a la ecuación (3.7.) se muestra
en la figura N* 3.4. Desarrollando la ecuación (3.8.) se
tiene:

so aaa 2 y?
[Úto00x= [Tax === 4221
00 13 91, 99 9 9

Por tanto, f(x) es una función de densidad de probabilidad.


ESTADÍSTICA Y PROBABILIDAD EN La HiDROLOGÍA (Diseño HiDroLÓGICO)

d. Della ecuación (3.9.) se tiene:


42 ap $0 1
[La=ro<x<0=% ===>
03 91, 9 9 9

120 4

1.00 -

|
0.80 y
|
Ex]

| 0.50 4
|
|
|

0.40 4 E

20 4

6 5 A 3 2 «1 Ú 1 q 3 4 5 6 7 E
VARIABLE ALEATORIA X

Figura N? 3,4, Función densidad de probabilidades del ejemplo 3.5.

ii. Distribución acumulada continua

La definición es similar como en el caso de la variable aleatoria E


discreta, dada por la siguiente ecuación:

Fo0=P[x <x]=P [osx <x]= f"_fudu (3.10)

Donde u es usada como variable aparente de integración, para


evitar la confusión con el límite de integración x.
La ecuación (3.10.) representa el área bajo la curva f(x), entre
ciertos límites de x, conociendo la FDA se puede determinar
la función densidad de probabilidad f(x) mediante la siguiente
ecuación:

dF(x) d
z = [suda | 660 3.11)
ABELARDO M. Díaz SALAS

La función de distribución acumulada de una variable aleatoria


continua posee las siguientes propiedades:

( 0<FO<1 ) (3.12.)

( Feo) = ) (3.13.)

( F(oo) = 1 ] (3.14.)

( FO )-Flx) = Plx, < X<x,] = Plx, €X <x)) ) (3.15,

La distribución acumulada continua por muchos autores es de-


nominada también como la función de distribución acumulada
al igual que en el caso de variables aleatorias discretas.
Ejemplo 3.6.
Utilizando la función densidad de probabilidad del ejemplo 3.5.
encontrar F(x), hallar Pio < x<1] a partir de F(x) y graficar F(x).
Solución
a. Dela ecuación (3.10.) se tiene:
Fx) = [fdo

Para -1<x<2 se tiene:


3px 3
x xk E)
Fuá= [ult a] a

Por consiguiente F(x) en su forma convencional es:

0 x <-1
3
+1
Foy=42 A1<x<2
9
1 x22

b. Pro <X<1] se halla mediante la ecuación (3.15.) y del re-


sultado anterior:

Fr) =2, E 1m=*


9
9
Fa) =Pro<x<1]=2-1=!
99 9
E A
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HibroLócico)

c. La gráfica de F(x) se muestra en la figura N* 3.5.


329

100 4

B30 y

a50 |
Fl

Do 4

ATT
+1 D 1 2 3

Figura N9 3.5, Distribución acumulada continua del ejemplo 3.6.

3.3.Esperanza matemática
La definición de la esperanza matemática ha surgido de los juegos al
azar, como por ejemplo si se tiene 5000 boletos para rifar un televisor de
S/. 2000.00 (dos mil nuevos soles), entonces la esperanza matemática es
S/. 2000/5000 - S/. 0.4 (cuarenta céntimos) por boleto, esta cifra es la esperanza
matemática, que es el promedio, en estadística se acostumbra denomi-
narla esperanza matemática al promedio o a la media.
Si X es la variable aleatoria, la esperanza matemática, la media, o el valor
esperado son términos sinónimos, por consiguiente si queremos hallar la
esperanza matemática de una variable aleatoria en la práctica estamos
hallando el promedio de la variable aleatoria (en el eje x) y como la va-
riable aleatoria se describe mediante las distribuciones de probabilidad,
la esperanza matemática se halla o se estima a partir de las funciones de
distribución que son función masa discreta de probabilidades o función
de densidad de probabilidades, dependiendo del tipo de variable aleatoria
si es discreto o continuo.
Para interpretar el concepto de esperanza matemática, observemos un ejemplo
que tiene datos no hidrológicos; sin embargo, este ejemplo permite visualizar
el concepto de esperanza matemática o media de la variable aleatoria.
Ejemplo 3.7.
Realizar el experimento de lanzar 12 veces dos monedas. Hallar el número
promedio de caras (esperanza matemática) por lanzamiento de estas dos
monedas.
ABELARDO M. Díaz SALAS

Solución
En el experimento realizado se obtienen los siguientes resultados:
CC, CS, SC, CC, CS, SC, CS, SS, CC, SS, CS, CS.
Si X (variable aleatoria) es el número de caras que ocurre por lanza-
miento, entonces los valores de X pueden ser 0,1,2. Según el resultado
se tiene:

X = 0 (cero caras han sucedido 2 veces)


X = 1 (una cara ha sucedido 7 veces)
X = 2 (dos caras han sucedido 3 veces)
El número promedio de caras por lanzamiento de dos monedas es:
EDA 9a
12
Este valor es un valor promedio y no es necesariamente un posible re-
sultado del experimento (un dato observado). Por ejemplo, el promedio
de las notas de un alumno no coincide con la nota de un curso.
Otra manera de expresar el resultado anterior es:
x= (5) + (3) + a) = 1.08
12 12 12

Los números 2/12, 7/12 y 3/12 son las frecuencias relativas de los dife-
rentes valores de X, por tanto es posible calcular la media o el promedio
o la esperanza matemática de un conjunto de datos conociendo los
distintos valores de X (número de caras) que ocurren y sus frecuencias
relativas, sin conocer el número total de observaciones. El experimento
indica que 1/6 ó 2/12 de los lanzamientos tiene como resultado cero
caras, 7/12 de los lanzamientos tiene como resultado una cara y 3/12
ó 1/4 tienen como resultado dos caras, el número promedio de caras
será de 1.08, sin importar si el lanzamiento fue 12, 100, 500, 10 000,
etc.
Esta forma de hallar el promedio es similar al promedio hallado con la
ecuación (1.3.19.) donde, el promedio se halla empleando el método
de frecuencias relativas, en este caso no se usa la marca de clase sino
el valor de la variable aleatoria (0,1,2). Por consiguiente, si la variable
aleatoria es discreta la esperanza matemática o el valor esperado o la
media de cualquier variable aleatoria discreta se obtiene al multiplicar
cada uno de los valores de la variable aleatoria X por su correspondiente
probabilidad p(x) y luego se suman estos productos. En forma gráfica
esta distribución de la variable aleatoria se muestra en la figura N? 3.6.
ooo

ESTADÍSTICA Y PROBABILIDAD EN La HiDROLOGÍA (Diseño HIDROLÓGICO)

0.80 E

e 112

¿040
| E
| 118 .
E
E
0.20 Z 16

| ,
' l

0.00 + 6
0 1 2 k
NUMERO DE CARAS 09) E.

Figura 3.6. Frecuencia relativa del experimento del lanzamiento de E :


monedas del ejemplo 3.7. E

Nota: usted puede tomar dos monedas y hacer su propio experimento y


| puede comparar sus resultados con el ejemplo.
La esperanza matemática se simboliza por E(x) o u y representa la media A
' poblacional o media teórica de la variable aleatoria X. Como la esperan-
za matemática describe a la población viene a ser un parámetro (valor
desconocido sólo puede ser estimado).
Basado en el resultado del ejemplo, la media de la variable aleatoria
discreta X se calcula mediante la siguiente ecuación: Y

p =E(x) = Y xp(x) (3.16)

i La esperanza matemática es el promedio ponderado de los posibles va-


lores que puede tomar X, el peso es el número posible de veces que se
presenta X, la sumatoria de estos valores se divide entre el tamaño del E
espacio muestral.
Si la variable aleatoria X es continua, la media o la esperanza matemática |
se calcula mediante la siguiente ecuación:

u=E(0) = Po xf600ax (3.17, 3


Ro
ABELARDO M. Díaz SALas

La ecuación (3.17.) se obtiene con el mismo criterio usado en la obten-


ción de la ecuación (3.16.) usando la integral en vez de sumatoria y foodx
a cambio de p(x), la media o la esperanza matemática describe el lugar
donde se centra la función masa de probabilidad o la función de densidad
de probabilidad.
Según los conocimientos adquiridos en los cursos de matemáticas, está-
tica, resistencia de materiales, etc., el centro de gravedad de una figura
geométrica plana en el eje x se obtiene mediante la siguiente ecuación:

S fran fut codx 6.18,


A A

Donde:
x = centro de gravedad de la figura en el eje X
A= área de la figura
dA = f00dx = diferencial del área
Es importante indicar que en la estadística el área A representa el área
bajo la curva de la función densidad de probabilidades fwo, que en este
caso es 1 (ver ecuación 3.8.); por tanto, el denominador de la ecuación
en los modelos probabilísticos es 1, por lo que la ecuación (3.18.) es
equivalente a la ecuación (3.17.).

3.3.1. Propiedades de la esperanza matemática


Si X es una variable aleatoria con función de densidad de probabili-
dad f o con función discreta masa de probabilidad Po y si hty es otra
función de X, entonces la esperanza matemática o el valor esperado
O la media se definen mediante las siguientes ecuaciones:
Si X es una variable aleatoria discreta, se tiene:

E(A00) = OOO | (3.19,

Si X es una variable aleatoria continua, se tiene:

EH00)= [ACOF ddx | (3.20)


ESTADÍSTICA Y PROBABILIDAD En La HiDROLOGÍA (Diseño HiDROLÓGICO)

Si x es número real y si fx) o po) es diferente de cero, se tiene las


siguientes propiedades:
1. Si:

E h09 = C> EC) = C ] (3.21.)

Donde C es una constante. Esta propiedad se demuestra a


continuación:
a. SiXes variable aleatoria discreta de la ecuación (3.16.),
se tiene:
E (C) = Y Cp(x) = CY pix), de la ecuación (3.4.) se tiene: Y pa)=1,
Xx Xx Xi

por tanto se demuestra que: E(C) = C


b. Si X es una variable aleatoria continua de la ecuación
(3.17.), se tiene:
E(C)= for 9dx=C | £09dx , de la ecuación (3.8.) se tiene:

[[f60x =1 Por tanto se demuestra que: E(C) = C.


2. Sik es una constante, se tiene:

a E(k*h00) = kE(h00) ] (3.22,

3. Sim y n son constantes, se tiene:

E(m*h09 +n*h09)= mE(ha00) +nE(a00) ) (8:23.)

Ejemplo 3.8.
Si el experimento consiste en lanzar dos monedas una vez o dos
monedas a la vez, hallar el promedio de caras que se obtendrá.
Solución
El espacio muestral del experimento es: S=[CC,CS,SC,SS]
Donde:
C = cara
s = sello

y
EE
b:
ABELARDO M. Díaz SALAS

Las probabilidades son:

P(x = 0) = P(SS) == (cero caras)

P(x =1) =P(CS)


11
+P(SC)

blo
= (1 cara)
4 2

P(x =2) =P(CC) =7 (2 caras)

La esperanza matemática de este experimento se obtiene mediante


la ecuación (3.16.):

1 1 1
p =E(9=(0)
10.9) — + (1) ¡0—=
(3) +(2)]-=|=1
(3) 0)¡

Entonces al realizar el experimento de lanzar dos monedas el número


de promedio de caras que se obtendrá es 1. El valor esperado de X
es una media ponderada de los posibles valores que puede tomar
X, el peso es la probabilidad de que asuma cada valor de X; bajo
este principio la esperanza matemática del ejemplo se puede calcular
de la siguiente manera:

Donde 4 representa los puntos muestrales igualmente probables, los


resultados de las ecuaciones i y ii son iguales.
Ejemplo 3.9.
Del ejemplo 3.2. hallar el valor esperado (promedio) de la variable
aleatoria (datos con errores).
Solución
Al escoger dos datos al azar de un conjunto de ocho datos doride
existen 3 datos con errores y 5 datos correctos el número promedio
de datos con errores se encuentra mediante la ecuación (3.16.).

H=E(x) = Y xp(x)
ESTADÍSTICA Y PROBABILIDAD EN La HiproLoGíA (Diseño HibroLóGIco)

La función discreta masa de probabilidades es:

ro="Px=0=L
28

Pll=P=)=E
28

P(2)= Pax =2)=>2


28

Donde X es el número de datos con error en la muestra, reempla-


zando valores se tiene:
10.15 3 _ 15 6 21
p=E(x)=0
+1 242% = +=
28 28 28 28 28 28
Ejemplo 3.10.
Considerando la función densidad de probabilidades del ejemplo
3.5.:

O, en cualquier otro lugar

Hallar la esperanza matemática


Solución
De la ecuación (3.17.) se tiene:

=L 24 (29%)=1.25
, 2

La media o la esperanza matemática es 1.25, este valor se puede


ubicar en el eje de la abscisa de la figura N? 3.4.

3.4. Momentos de la distribución de una variable aleatoria


Son las esperanzas matemáticas de una variable aleatoria, las distribu-
ciones de la variable aleatoria representan ecuaciones o modelos que
relacionan la función de densidad de probabilidades fo o la función
discreta masa de probabilidades pt con la variable aleatoria, cualquie-
ra de estas ecuaciones o modelos o distribuciones de probabilidad es
graficada en un eje de coordenadas, trazando en el eje ordenadas f(x) O
poo y en el eje de abscisas el valor de la variable aleatoria (ver las figuras
N* 3.1., N23.2. y N? 3.4.).
ABeLArDO MI. Díaz Salas

Como el gráfico de la distribución está referido a un eje de coordenadas,


es posible hallar los momentos de las distribuciones con respecto al origen
de las coordenadas o con respecto a otro valor, en estadística es muy útil
hallar los momentos con respecto a la media. En los cursos de ingeniería
se acostumbra hallar los momentos de una figura plana, que permiten
encontrar por ejemplo el centro de gravedad en el eje X; el concepto de
momentos tiene validez en la estadística con algunas particularidades,
como por ejemplo el área bajo la curva que representa la función de
densidad de probabilidades es igual a 1 (ecuación 3.8.) o la sumatoria
de todas probabilidades de la variable aleatoria discreta es 1 (ecuación
3.4.).

3.4.1. Momentos de una distribución de probabilidades con res-


pecto al origen
Sea:

l h0) = x ) (3.24.)

Donde:
r= 1,2,3,..., se define como la esperanza matemática o el r-ésimo
momento de hX) = x, mediante las siguientes expresiones:
1. Para variable aleatoria X discreta:

py = E(h00) = Elx!) = Y px) 7 (3.25.

2. Para variable aleatoria X continua:

py= E(H00) =E(x')= [ax dax | (3.26,

Existen varias esperanzas matemáticas dependiendo del valor de


r, las que tienen especial importancia en los modelos probabilísti-
cos son los momentos de la distribución de una variable aleatoria
(función masa discreta de probabilidades o función de densidad de
probabilidades).
i. — Media de una distribución
Si r= 1 en las ecuaciones (3.25.) y (3.26.) se tiene el primer
momento con respecto al origen y obtenemos las ecuaciones

du
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)

(3.16.) ó (3.17.), el primer momento con respecto al origen es


la esperanza matemática.

3.4.2. Momentos con respecto a la media


En la estadística es usual hallar los momentos de la variable aleatoria
con respecto a la media, es decir el brazo de palanca es (x- , estos
momentos son importantes es estadística porque sirven para describir
la forma de la distribución de probabilidades (función discreta masa
de probabilidades o función de densidad de probabilidades).
El momento o la esperanza matemática (promedio) con respecto a
la media y es definida por:
Sea:

( 909 = (xp) ] (3.27.)

Donde:
r = 1,2,3,..., se define como el momento central r-ésimo o la espe-
ranza matemática r-ésimo de kx) = (x- y" mediante las siguientes
expresiones: É
1 Para variable aleatoria X discreta:

| a, =E(h)) =E (x-19)= Dx po) (3.28)

2 Para variable aleatoria X continua:

00
1, =E(N'00) =E (9) = | 00
(xD F00dx (3.29,

En las aplicaciones de la estadística tienen importancia los momentos


con respecto a la media de segundo, tercero y cuarto orden.
i. Varianza de una distribución
Si r= 2 en las ecuaciones (3.28.) ó (3.29.) se tiene el segundo momen-
to con respecto a la media y obtenemos las siguientes ecuaciones: y
ABELARDO M. Díaz SALAS

1. Para variable aleatoria X discreta:

1) = Ex 0)= poo ] (3.30,)

2. Para variable aleatoria X continua:

pa =E (xp?) = Po 2 bodx ] 3.31.)

Donde:
p = Ex media

(x- = desviación de una variable aleatoria con respecto a la media,


llamada error.
Las ecuaciones (3.30.) ó (3.31.) se denominan como la variancia
de una distribución representada por var (x) O o”, la varianza permite
describir la forma de la función masa discreta de probabilidades o de
la función de densidad de probabilidades según sea el caso variable
aleatoria discreta o continua, respectivamente.
Como se ha indicado, la esperanza matemática representa la media,
por tanto al hallar la esperanza matemática de la desviación elevado
al cuadrado íx - »? se halla el promedio de las desviaciones al cua-
drado, que viene a ser la varianza, por lo que el segundo momento
central es la varianza poblacional o la varianza teórica o? (parámetro)
representado por:

( 1, =0? =V(X) =El(x-1)>) ) (3.32,)

A la raíz cuadrada positiva de la varianza se le denomina desviación


estándar poblacional y se denota por « y se calcula mediante la
siguiente ecuación:

o =MVar(X) =/0? | (3.33)


ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HiDROLÓGICO)

La desviación estándar mide la desviación o error promedio de la


variable aleatoria X con respecto a la media ».
Ejemplo 3.11.
Si X es una variable aleatoria, demostrar que: o? = Elx? - 2
Solución:
De la ecuación (3.32.) se tiene:

[ o? = Elx 10? ] (

Desarrollando la ecuación (i) se tiene:

o? = Elx? — 2xu + 1?) ) (5)

Aplicando la ecuación (3.23.) a la ecuación (ii) se obtiene:

( 0? = Elx?) - EPux] + Elu?) ] (iii)

Aplicando la propiedad de esperanza matemática (ecuación 3.21.)


a la ecuación (iii) se tiene:

( 0? = Elx?) — 2uE[x] + p? (iv)

De la ecuaciones (3.16. 6 3.17.) aplicada a (iv) se obtiene:

( o? = Elx?) - 24? + q? ] (v)

Finalmente como y = E(x, se tiene:


0? = Elx?) 12 — Eb) - (E09?
ii. Sesgo de una distribución
Sir = 3 en las ecuaciones (3.28.) ó (3.29.) se tiene el tercer momento
con respecto a la media y obtenemos las siguientes ecuaciones:
1. Para variable aleatoria X discreta

y= E (10%) = Nx po) (3.34)


ABeELARDO MI. Díaz SALAS

2. Para variable aleatoria X continua

| py =E(x—py)= pr rodar ] (3.35,)

El tercer momento central sirve para medir la simetría o asimetría o el


sesgo de la distribución, el coeficiente de sesgo se obtiene mediante
la siguiente ecuación:

3
y 3 HB 6.36,
So cs

La simetría se mide sobre la base del valor de y de la siguiente manera:


1) Siy < 0 la distribución es sesgada a la izquierda.
2) Si y= 0 la distribución es simétrica con respecto a la media.
3) Siy > 0 la distribución es sesgada a la derecha.
ii. Puntiagudez o apuntamiento de una distribución
Sir = 4 en las ecuaciones (3.28.) ó (3.29.) se tiene el cuarto momento
con respecto a la media y obtenemos las siguientes ecuaciones:

i. Para variable aleatoria X discreta

ps Elx 199 = Y x-19%p00 (3.37)

ii Para variable aleatoria X continua

y =E(x-w*)= fo 0) boOdx (3.38,)

El cuarto momento central sirve para medir el grado de apuntamiento


de la distribución, el coeficiente de curtosis se obtiene mediante la
siguiente ecuación:
EsTapísTiCA Y PROBABILIDAD EN La HiproLocía (Diseño HIDROLÓGICO)

El apuntamiento se mide sobre la base del valor de k de la siguiente


manera:
1) Sik =3, la distribución es normal, se denomina distribución
mesocúrtica.
2) Sik > 3, la distribución es puntiaguda (pico alto), se denomina
distribución leptocúrtica.
3) Si k<83, la distribución es achatada (pico bajo) o aplanada,
se denomina distribución platicúrtica.
Ejemplo 3.12.
Si se tiene la siguiente función:

xe* x>0
f00 =
O para cualquier otro valor de x ' E

a. Probar si es una función de densidad de probabilidades y gra-


ficar f(x).
b. Hallar: media, varianza, mediana, moda, coeficiente de sesgo
y coeficiente de curtosis.
Solución
a.1. Si f(x) es una función de densidad de probabilidades, debe
cumplir con la ecuación (3.8.), es decir ff ooax =1; reempla-
zando f(x) se tiene:

| Dear [xo vax= 0+ [xe*ax= [xe*dx (11.1.)

Realizando cambio de variables e integrando por partes de la


ecuación (iii. 1.) se tienen:

( eXdx = dv >v =-e* ) (111,2)

( u=x> du = dx ] (111.3.)
ABELARDO MÍ. Díaz Satas

Reemplazando (iii.2.) y (iii.3.) en (iii.1.) se obtiene:

E xe*dx=x(-e*) ¿[ESdax = 0-[[e*dex) =


me
00
== *

0
=-le*- =40-13=1

Por tanto la ecuación:


-x
xe x>0
f0) =
O para cualquierotro valor de x

Es una función densidad de probabilidades.


a.Z. La gráfica de la función de densidad de probabilidades se
muestra en la figura N* 3.7.

N
| A a A
Lo A
¡E MINA
] |
5
pe
o
qn
o
=

rr

12
ba

es

Ea

pla]
ba

Lo

Lem)

pues
Do

an
o
!

—a
1

VARIABLE ALEATORIA

Figura N* 3.7. Función de densidad de probabilidades del ejemplo 3.12.

b.1. Cálculo de la media.


La media o la esperanza matemática es (ecuación 3.26.):

E(x) = fxto0ax= ¡E [xtooax=


(ii.5.)
0+ [xrogax= Puedx= [Pderax
«q
ESTADÍSTICA Y PROBABILIDAD EN LA HiproLoGÍA (Diseño HIDROLÓGICO)

h
Realizando cambio de variables e integrando por partes de la
ecuación (iii.5.) se tienen:

( u = x? => du = 2xdx ] (i11.6.)

Reemplazando (iii.2.) y (iii.6.) en (iii.5.) se obtiene:

[dea x Le *) a [Conxax=0+ [ax e*dx = a


A

0+ 2 [xo *dx

De ¡i¡.4. se tiene:

[eta =1 | (iii.8.)

Reemplazando (iii.8.) en (iii.5.) se obtiene:

| E(X)=1u = [¿deax =2 [xedx= 21) =2 | (iii.9)

Entonces la esperanza matemática o la media es: 2.


b.2. Cálculo de la varianza.
La varianza se calcula con la ecuación (3.31.).

vo00=0?= Ep [Po food [70d 2xu + pi oddx=


f 9d 2 L x£b9dx+ 11? f f0ddx= (iñi.10)
f E b9dx— Zu) +12) = Ed) - pu?

De la ecuación (iii.9.) se obtiene:

E 1? = (E00)? = 22 =4 ) (11,11.

Hallando £(x?):

Elx?) = Paroodx= [roma Por


(111.12.
0+ Pe ttoa= Parera = Porar
AseLarDO M. Díaz Salas

Realizando cambio de variables e integrando por partes


de la
ecuación (iii.12.) se tienen:

Reemplazando (iii.2.) y (iii.13.) en (iii.12.) se obtiene:

[Perra =e),— [SxLeddax=0 +3 [* dx (11.14,

Reemplazando (iii.9.) en (iii.14.) se tiene:

E(x?%)= 3 3(2) =6 (1i.15.)

Reemplazando (iiii.15.) y (ii.11.) en (11.10.) se obtien


e:

El(x — 19] =V6)=02=E(x?) — 12 = 6-4=2


(tii.16.)

Entonces la varianza de esta distribución es 2.


b.S. Cálculo de la mediana.
Como se sabe la mediana es una medida de tendencia
central y representa el valor de la variable aleatoria x,,
para
la probabilidad acumulada de 50% 6 0.5, es decir se
debe
cumplir:

[Orcos [toos [Prooi=0+ ("odas -


(111.17)
[ea =0.5

Integrando por partes la ecuación (iii.17.) y de las ecuaciones


(iii.1.), (111.2.) y (iii.4.) se obtiene:

Mo xy
Í xe “dx =x(-e lo pim =Í, km Leo dx _—=xLe xy
L mx
-e
Xm

oo áti.18,)
—[(x,
e m-—
¡ 0e"9)|- [em e = Xq
e Mm gm 41
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)

Reemplazando (1ii.18.) en (111.17.) se obtiene:

( —x E MM 0,53
xx 0 M4 67 = 0.5 (111.19,

La ecuación (iii.19.) se resuelve mediante métodos numéricos,


en el presente caso se va utilizar el método de Newton-Raphson.
Para tener el valor inicial de cálculo se debe graficar la función
A) =X 244 m-0.5, que se muestra en la figura y cuadro si-
guiente:

x 6% FUNCIÓN háam
e
0.200 | 0.482
0.500 | 0.410 DAD y
1.000 | 0.236 0% e
1.500 | 0.058
2.000 -0.094| 000
2.500 |-0.213 | Ép7p
0.20 3Y 1
3.000 | -0.301
3.500 10.364 | “040 7
4.000 | -0.408 -0.60
4.500 | -0.439 mn
5.000 | -0.460

El método de Newton-Raphson para encontrar la raíz de la


ecuación es:
h(xp)
Xi] Xi
(xj)

Para evitar complejidad en simbología se usa x,, = x, los resul-


tados se muestran en el siguiente cuadro: p

¡ Xx error
1 1.500000 100
2 1.672771 10.3284307
3 1.678342 0.33190806
4 1.678348 0.00037314
5 1.678348 6.53728-10
6 1.678348 0

Entonces la mediana es 1.678348. .


a E
ABELARDO M. Díaz SALAS

b.4. Cálculo de la moda.


La moda es el valor máximo de la curva de la función de den-
sidad de probabilidades, por lo que debe cumplirse:

| dx) _y | (a)

2
dif <0 b
dx?

De a se obtiene:

dix) dx _ de* _ dx
dx dx dx dx
(111.20.)
a *x Ax)
xl) a +e*=-xe *+e*=0

La ecuación (iii.20.) se resuelve aplicando el método de Newton-


Raphson, para lo cual es necesario hacer los cálculos y gráficos
siguientes:

A 070 FUNCION DE hímod)


0.25 [0.584 0.60 A
0.45 (0.351 ..
0.65 |0,183 040 7
0.85 /0.064 0.30 |
1.05 |-0.017 | go ?
1.25 |-0072 | 930 >
1.45 |-0,106 0.00 .
-0.10 4 0.5 LP 1
-0.20
X(mod)

Al igual que en el caso anterior del cálculo de la mediana, para


evitar la complejidad en la simbología se usa x,,,., = x, y a través
de la ecuación de Newton y Raphson se obtiene la moda en el
siguiente cuadro:
EsTADísTICA Y PROBABILIDAD EN LA HiDRoLOGÍA (Diseño HIDROLÓGICO)

¡ X error
1 0.8500 100.0000
2 0.9804 13.3038
3 0.9996 1.9197
4 1.0000 0.0375 ,
5 1.0000 0.0000
6 1.0000 0.0000

Por tanto la moda es para x=1. El valor de función de densidad


de probabilidad es fx = 0.37 (ver figura N* 3.7.).
Evaluación de la condición b:

d L dd e a $:
d2f(00)_dfd
Ios
q? dlEr co) orel xe ere)
4 ex) e (xe) + e (e , (111,21.)

Reemplazando (iii.20.) en (ii.21.) y desarrollando le se tiene:

2
df (x) = (e e 26 | (11.22.)

Reemplazando el valor de la moda x=1 en la ecuación (ii¡.22.)


se obtiene: A

Por lo tanto cumple con la condición b, es decir:

dif) 1
dx? E A

b.5. Cálculo del coeficiente de sesgo.


El coeficiente de sesgo se calcula con la ecuación (3.36.) que
É
es:

y a E)
y? o?
ABELARDO M. Díaz SaLas

Para encontrar el coeficiente de sesgo se calcula o? y y,


i. Cálculo de os
La desviación estándar se calcula de la ecuación (i1i.16.)

> o=lo? =./3 (iii.23,)

li, Cálculo de y,

113 =E((x — 10%) = EC?- 3x2 + 3xp2 - pa3) (iii.24.)


Po

My = Eb) - 3uEbÓ) + 34800) - p3 (íti.25.)

iii, Cálculo de Ex

E()= Pexeax = Ex dx + [dea =


NN

Ax Ax (111.26.)
04 [xetax= [xte dx

Realizando el cambio de variables e integrando por partes,


de la ecuación (iii.26.) se tienen:

Po u=x*> du = 4xdx (111.27.)

Reemplazando (iii.2.) y (iii.27.) en (iii.26.) se obtiene:

E(x)= [oa =x! (-e)| facina =


0 (iii.28,)
0+4 [e dx = 4 [ax

Reemplazando (iii.15.) en (iii.28.) se tiene:

ll E (3) = [ear = 4 [dedx =4(6) = 24


ESTADÍSTICA Y PROBABILIDAD EN La HinroLoGíA (Diseño HIDROLÓGICO)

Se sabe que:
u = Ex) = 2(ecuación iii.9.)
E02) = 6(ecuación iii.15.)
Reemplazando estos valores de la ecuación (iii.29.) en
(111.25.) se obtiene:

E 1, =24-3(21(6) + 3292)-2?=24-36 + 24-8 =4 ] (111.30.)

iv. Cálculo de y
Reemplazando las ecuaciones (iii.30.) y (iii.23.) en (3.36.)
se halla y.

pa E(X-p))_O 4

ww
=%=2

mia
Y == la (11.31)

Nn
o? o? (y »

Mn]
Es una distribución con sesgo hacia la derecha.
b.6. Cálculo del coeficiente de curtosis.
El coeficiente de curtosis se calcula con la ecuación (3.39.), que
es:
y Pa EX05)
o? o?

Para encontrar el coeficiente de curtosis se calcula o* y u,


i. Cálculo de o*
La desviación estándar es o =v0 ? = 4/2 (ecuación iii.23.)
ii. Cálculo de y,

O By =E(x Mm?) ] (111.32.)

Ml (x-19* = (x + En)! ) (111.33.)

La ecuación (iii.33.) es un binomio de Newton, lo cual s=


resuelve mediante la ecuación (2.36.). Ver ejemplo 2.
AseLarDO M. Díaz SALAS

| y e <p
(ili.34.)
0-9 = 4 + 6x2124xp0 + pu

Reemplazando (iii.34.) en (11.32.) se tiene:

( 1, = Elx 4x3 + 6x2 124


xp + 149) ] (111.35.

Aplicando las propiedades indicadas en (3.21.), (3.22.) y


(3.23.) se obtiene:

( uy =E0)-ApE0S) + 612E0)-44E00 + pu ] (i11.36.,)

Cálculo de Ex%

E(x%)= Poxetax= Poor [e dx=


(411,37.)
0+ [dear = Pa

Realizando cambio de variables e integrando por partes


de la ecuación (iii.37.) se tienen:

l u=x => du = 5x%dx | (111.38.)

Reemplazando (iii.2.) y (i1i.38.) en (iii.37.) se obtiene:

fe e*dx=x? fax te
(i11.39.)
af =apo e *dx

Reemplazando (i1i.29.) en (i11.39.) se tiene:

E (x a Pe e*dx= 5[xte e*dx=5(24) =120 ] (iii.40.)


ESTADÍSTICA Y PROBABILIDAD EN La HiDROLOGÍA (Diseño HIDROLÓGICO)

Se sabe que:
u = Eb) = 2 (ecuación iii.9.)
E0é) = 6 (ecuación jii.15.)
E09) = 24 (ecuación ¡i¡.29.)
Reemplazando estos valores y la ecuación (tii.40.) en
(111.36.) se obtiene:

1,120 — 4(2024) + 6(22(6) - 4(29)/(2) + 2%=


(111.41.)
120-192 + 14464 + 16=24

iii. Cálculo de k
Reemplazando las ecuaciones (iii.41.) y (11i.23.) en (3.39.)
se hallak.

y Ha E(x-wm% 24 24 24 E 42) ?
== SAA > 11.42. E
o 0 Aya

Es una distribución leptocúrtica (picuda).

EYel

4
CAPÍTULO

IV
Modelos probabilísticos aplicados en la hidrología

4.1.Modelos probabilísticos o distribuciones de probabilidades


El modelo probabilístico explica el comportamiento del espacio muestral
y a cada uno de los resultados (eventos) se asocia con una probabilidad
de ocurrencia, mediante el uso de funciones de probabilidad (función
masa de probabilidades o función de densidad de probabilidades). Existen
dos tipos de modelos de probabilidad: modelos probabilísticos discretos
y modelos probabilísticos continuos.

4.2.Modelos probabilísticos discretos


Estos modelos describen el comportamiento probabilístico de variables
aleatorias discretas, en un experimento aleatorio no es posible conocer
anticipadamente con certeza el resultado final, pero sin embargo es fac-
tible conocer todos los resultados posibles que puede tener la realización
del experimento de eventos mutuamente excluyentes y colectivamente
exhaustivos (resultados contables).
Los modelos probabilísticos discretos más usados en la hidrología son:
distribución Bernoulli, binomial, geométrica, binomial negativa y de
Poisson.

4.2.1. Distribución Bernoulli


El proceso o modelo probabilístico Bernoulli es un experimento que
tiene solamente dos resultados posibles llamados éxitos o fracasos,
la probabilidad de éxito se representa por:
Esrapística Y PROBABILIDAD En LA HioroLoGíA (Diseño HibroLóGIcO)

mn
( Px=0=p ) (4.2.1.)

RR
La probabilidad de fracaso se representa por:

cri
no P(x = 0) =1-p ] (4.2.2)

Donde:
X = variable aleatoria
p = probabilidad
Es decir, si X es éxito, la variable aleatoria toma un valor de 1; en-
tonces, el número de éxitos tiene una probabilidad p. El número de
fracasos tiene una probabilidad de (1-P), y X toma el valor de O. Como
se ha indicado, las palabras éxito y fracaso son términos definidos
arbitrariamente, por lo que un éxito no significa necesariamente lo
deseable.
Un experimento Bernoulli está basado en las siguientes suposicio-
nes:
1. Existe solamente dos posibles resultados en cada ensayo: éxito
y fracaso.
2. Laprobabilidad de éxito es la misma en cada ensayo.
3. Hay n ensayos donde n es constante.
4. Los n ensayos son independientes.
Una variable aleatoria X tiene una distribución Bernoulli, si sólo si
la función masa de probabilidad está dada por:
|
|
| f(x,P) = p(1—-p) 7% para x = 0,1 ] (4.2.3,

La función de distribución acumulada es:

Foo =p =p | (4.2.4,
|
Xx
|

La ecuación (4.2.3.) depende de p, que es el parámetro de la dis-


tribución de tipo Bernoulli.

|
AseLarDO M. Díaz SALAS

Ejemplo 4.2.1.
De los datos del cuadro N* 1.3.4., hallar la probabilidad de que el
caudal del río Querococha excede a 8 m/s.

Descargas máximas instantáneas anuales del río Querococha


ordenadas en forma ascendente (m3/s)
3.98 489 | 493 58 588 | 6.26 639 635 | 6,52 6.7 |
6.77 6.87 6.94 7.48 756 | 795 : 8 8.13 83 B9
8.96 897 | 91 1 94 94 98 3 10.2: 10.72 10.78

“Solución
Cuando el caudal máximo instantáneo anual del río Querococha
supera los 8 m*/s, se dice que es un éxito, por tanto X toma el valor
de 1. Cuando el caudal del río Querococha es menor o igual a 8 m/s,
es un fracaso, por tanto X toma el valor de O, del cuadro se estima
que el número de éxitos es 12 (escritas en tipo negrita en el cuadro
. ” ho: 12
anterior), entonces la probabilidad de tener éxitos es p = 7904. Este
mismo resultado se obtiene al reemplazar el valor de p y de X=1,
en la ecuación (4.2.3.) £1,p) = p = 0.41) y la probabilidad de fracaso
es 0.59.

4.2.2. Distribución binomial


Una variable aleatoria X tiene una distribución binomial si la función
masa de probabilidades está dada por la siguiente ecuación:

A 5 n=x
b(x;n, p) = p(1- p) * para x=0,1,2,...,n (4.2.5,)
Xx

La función de distribución acumulada es:

n n

Ef) Pl jpar = Y b(x,n,p) (4.2.6,


x=0 X x=0

La distribución binomial es la sucesión de experimentos simples de


Bernoulli, por ejemplo en el cuadro N* 1.1.1. se tiene una sucesión
de 29 años donde la ocurrencia de estos eventos o caudales son
independientes y la probabilidad p de ocurrencia en cualquier año
no cambia a través de los 29 años. Representa una sucesión de 29
pruebas Bernoulli.
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HIDROLÓGICO)

Si p es la probabilidad de éxito y (q - 1 - p) es la probabilidad de fracaso


en cada ensayo, entonces la probabilidad de obtener x éxitos y n- x
fracasos en algún orden es p*x1 - p)”-*, que es la probabilidad conjunta
de dos eventos independientes (ver la ecuación 2.22.). En este caso
existe un factor p para cada éxito (la probabilidad de éxito no cambia
en los diferentes ensayos) y un factor (1 - p) para cada fracaso. Los x
veces factores p y los n - x factores 1 - p son multiplicados todos a la
vez en virtud de la regla de multiplicación para dos o más eventos
independientes.
Para hallar la probabilidad de x éxitos y n- x fracasos (en cualquier
orden), se tiene que contar cuántos puntos de esta clase existen y
multiplicar entonces px(1 - p)-* por este número. El número de formas
de obtener x éxitos en n ensayos se calcula con la ecuación (2.25.)
que representa el número de combinaciones de x objetos seleccio-
nados de un conjunto de n objetos.
La ecuación (4.2.5.) lleva el nombre de distribución binomial porque
los valores de bix:n,p) para x = 0,1,2,....n son los términos sucesivos de la
expansión binomial (q + p)” dada por la ecuación (2.26.). Las canti-
dades combinatorias (7) son denominadas coeficientes binomiales.
La ecuación (4.2.5.) define una familia de distribuciones de pro-
babilidad donde cada miembro es caracterizado por los valores
específicos de los parámetros n y p. La distribución binomial se
representa generalmente mediante la anotación bín,p) para indicar la
distribución binomial con parámetros n y p. El número de resultados
posibles de una distribución binomial se halla mediante la técnica
de combinación (ver ejemplo 2.8.).
Ejemplo 4.2.2.
Calcular y graficar la función masa de probabilidades de bt4,0.1) y
b(4,0.5).
Solución
De la ecuación (4.2.5.) se tiene:
4 x Ax
a. b(40.=| 10.1%(1-0.1* para x=0,1,...4
x

4
b. b(4,0.5) | Josta=osi” para x =0,1,2,...,4
Xx

Los resultados se muestran en el cuadro N? 4.2.1. y en la figura


N* 4.2.1.
AseLarDO M. Díaz SALAS

Cuadro N* 4.2.1.
Función masa de probabilidades de la
distribución binomial del ejemplo 4.2.2.
Xx FMP b(4,0,0) EMP b(4,0.5)
0 0.6561 0.0625
1 0.2916 0.2500
2 0.0486 0.3750
3 0.0036 0.2500 *
4 0.0001 0.0625

0.7

05
05

oa a [ein
oa a
. D
¡Eos!
02
01.
+ o
o! 4 »
0 05 1 15 2 25 3 35 4 45
Xx

Figura N* 4.2.1, Función masa de probabilidades de


b(4,0.1) y b(4,0.5) del ejemplo 4.2.2.

Ejemplo 4.2.3.
Del ejemplo 2.4.1., hallar la probabilidad de que 2 caudales máxi-
mos instantáneos anuales mayores o iguales a 8 m/s exactamente
ocurran en 5 años.
Solución
En el ejemplo 4.2.1. se ha encontrado la probabilidad de éxito que
p = 12/29 = 0.41, la probabilidad de fracaso es q - 0.59 . La probabilidad
de que ocurran exactamente 2 caudales mayores a 8 m%/s en 5 años
se calcula mediante la ecuación (4.2.5.).
5 y
p(X =2)=b(2;5,0.41) = E 0.41*%0.59)* =10*0.41?*0.59? = 0,345

La ecuación (4.2.1.) contiene la combinación ( >) que permite con-


tabilizar el número de resultados posibles; es decir, el número de
caudales mayores a 8 m%/s que se presentan exactamente dos años
ESTADÍSTICA Y PROBABILIDAD En La HiDROLOGÍA (Diseño HIDROLÓGICO)

en 5 años que es igual a diez posibilidades, lo cual se ha esquema-


tizado en el ejemplo 2.8. La probabilidad de cada alternativa de
presentación es p?q?-? y aplicando la propiedad establecida en la
ecuación (2.11.), para eventos mutuamente excluyentes se halla la
probabilidad total de que ocurran dos caudales mayores a 8 m/s
durante cinco años.

4.2.3. Distribución geométrica


Una variable aleatoria X tiene una distribución geométrica si la fun-
ción masa de probabilidades está dada por la siguiente ecuación:

( g(x;p) = p(l — p*=1 para x = 1,2,... ] (4.2.7)

Esta distribución permite contestar la siguiente pregunta: ¿en qué


número de ensayos de tipo Bernoulli ocurrirá el primer éxito?, en
este caso como característica del ensayo Bernoulli existe la inde-
pendencia de las pruebas y un valor constante de p. El primer éxito
ocurrirá en la x-ésima prueba cuando:
1. Las primeras x-1 pruebas son fracasos que ocurren con una
probabilidad de (1 - p)*-! = q*-!.
2. Lax-ésima prueba es un éxito que ocurre con una probabilidad
de p.
Al multiplicar las dos probabilidades dadas se obtiene la ecua-
ción (4.2.7.), que permite hallar el primer éxito en el x-ésimo
ensayo. La distribución geométrica se representa generalmente
mediante la anotación gíp) para indicar la distribución geomé-
trica que depende de un solo parámetro p. Se denomina
distribución geométrica porque tiene la forma que presenta el
k-ésimo término de la progresión geométrica: p,pqpq?,....pax=?.
Ejemplo 4.2.4.
| Calcular y graficar la función masa de probabilidades de g(0.1)
y de gí0.3).
Solución
De la ecuación (4.2.7.) se tiene:
810.1) =0.110.9) y g(0.3) =0.3(0.7)7 para x =1,2,3,...
Los resultados se muestran en el cuadro N* 4.2.2. y figura
N? 4.2.2.
ABELARDO MI. Díaz SALAS

Cuadro N' 4.2.2.


Función masa de probabilidades de la
distribución geométrica del ejemplo 4.2.4.

1 0.100
2 0.090
3 0.081
4 0.073

5 0.066
6 0.059
7 0.053
8 0.048
9 0.043

10 0.039
1

0.350
03007 e
0.250 -
2 0200- lo 90.1)
E 0150 " ¡m90.3)
010] 0 9 , " .
0.050 - ña y 2. 0 0
0.000 "
n
0 e 4 6 8 10 12
x

Figura N* 4.2.2. Función masa de probabilidades de la distribución


geométrica del ejemplo 4.2.4. g(0.1) y g(0.3)

Ejemplo 4.2.5.
En el ejemplo 4.2.1. se observa que la probabilidad de que el caudal
sea mayor a 8 m/s es 0.41, se pregunta ¿Cuál es la probabilidad de
que este caudal ocurra 5 años después de terminado el proyecto?
Solución
Sustituyendo x = 5 y p = 0.41 en la ecuación (4.2.7.) se tiene:
8(5;0.41) = 0.41x(0.59)* = 0.05
Por tanto, la primera ocurrencia del caudal mayor a 8 m%/s durante
los 5 años próximos tiene una probabilidad de 0.05.

/
EstaDísTiCA Y PROBABILIDAD EN LA HiproLoGÍA (Diseño HiproLóGIco)

4.2.4. Distribución binomial negativa


Es llamada también distribución de Pascal. Esta distribución es
una extensión de la distribución geométrica; una variable aleatoria
X tiene una distribución binomial negativa si su función masa de
probabilidad está dada por la siguiente ecuación:

* x=1 k xk
b (x-1k-1, p)= hos p(1—p)J"* para x =k,k +1... (4.2.8.)

La distribución binomial negativa permite contestar la siguiente pre-


gunta: ¿En qué prueba ocurrirá el k-ésimo éxito en un experimento
repetitivo de Bernoulli?, la distribución binomial negativa se explica
considerando dos eventos independientes A y B.
El evento A representa k-1 aciertos (éxitos) en los primeros x-1
ensayos, entonces la probabilidad del evento A es::

|
-1
box tk-1,pp= 1 [pg (4.2.9,)
k-=1 |

El evento B representa un acierto (éxito) en x-ésimo ensayo, la pro-


babilidad del evento B (de lograr un éxito en el k-ésimo ensayo) es
igual a p.
Por tanto, la probabilidad de que el k-ésimo acierto ocurra en el
x-ésimo ensayo está dado por la siguiente ecuación:

(AN B)=P(A)-P(B) :x-12)


P(ANB)=P(A)-P(B)= P
k-1,
ap,
x=k
=
x1
pk _x=k

La distribución binomial negativa permite hallar el k-ésimo acier-


to en el x-ésimo ensayo, entonces ha ocurrido la intersección de
dos eventos independientes, esta ecuación es igual a la ecuación
(4.2.8.).
El término de binomial negativa se deduce que los valores de b*(x;x,p)
para x = kk+1k+2,., son los términos sucesivos de la expansión
1 1-PY
binomial de (5-22) dada por la ecuación (2.38.). y

Ejemplo 4.2.6.
Calcular y graficar la función masa de probabilidades de b*(x;5,0.1),
b*(x;5,0.4) Y b*(x;10,0.4) : | ml
ABELARDO M. Díaz SALAS

Solución
De la ecuación (4.2.9.) se tiene:
* x—1
1. b(x50.1) -( a Joros"* para x = 5,6,7,...

* x-—1 Sn 4x=5
2. b(x5,0.4)= 4 940.67 para x = 56,7...

* |

3. b(x:10,0.4)= e Josros> para x = 10,11,12,...

Los resultados se muestran en el cuadro N* 4.2.3. y figura N* 4.2.3.

Cuadro N* 4.2.3.
Función masa de probabilidades de la
distribución binomial! negativa del ejemplo 4.2.6.
a FPM EMP FEMP
bn(5,0.1) bn(5,0.4) bn(10,0.4)
5 0.000 0.010
6 0.000 0.031
7 0.000 0.055
8 0.000 0.077
9 0.000 0.093
10 0.001 0.100 0.000
11 0.001 0.100 0.001
12 0.002 0.095 0.002
13 0.002 0.085 0.005
14 0.003 0.074 0.010
E 0.003 0.062 0.016
16 0.004 0.051 0.024
17 0.005 0.041 0.034
18 0.006 0.032 0.043
19 0.007 0.025 0.051
20 0.008 0.019 0.059
21 0.009 0.014 0.064
EsTapísTICA Y PROBABILIDAD en La HiprotosíA (Diseño HIDROLÓGICO)

0.12

o bn(5,0.1)|
bn(5,04) :
109)

bn(10,0.4) |

Figura N* 4.2.3. Función masa de probabilidades de


distribución binomial negativa del ejemplo 4.2.6.

Ejemplo 4.2.7.
En el ejemplo 4.2.1. se observa que la probabilidad de que el caudal
sea mayor o igual a 8 m%/s es 0.41, se pregunta ¿Cuál es la proba-
bilidad de que la cuarta ocurrencia se presente en 15.* año?
Solución

Sustituyendo x = 15,k = 4yp - 0.41 en la ecuación (4.2.8.) se tiene:


+ Doa
b (14/3,0.419)=|, [0.41%(0.59) "0.031

4.2.5. Distribución de Poisson


Una variable aleatoria X tiene una distribución de Poisson si su fun-
ción masa de probabilidad está dada por la siguiente ecuación:

Ax
pOGA) = para x =0,1,2,... (4.2.10,)
xl

Cuando n es muy grande en la distribución binomial, el cálculo de


la probabilidad es muy tedioso. Por tanto, para casos en que n— oo,
p> 0 Y np = 4 se mantiene constante, la distribución binomial en el
límite se transforma en la ecuación (4.2.10.).
Ejemplo 4.2.8.
Calcular y graficar la función masa de probabilidades de P(2.5), P(0.7)
y P5). -
Solución
De la ecuación (4.2.10.) se tiene:
ABELARDO M. Díaz SALAS

-25 x
1. pas). para x = 0,1,2....
Xx!

07 x

2. pro7)= EL para x = 0,1,2,...


Xx

_ eds:
3. P(5) para x = 0,1,2
x!

Los resultados se muestran en el siguiente cuadro y gráfico:

Cuadro N? 4.2.4.
Función masa de probabilidades de la
distribución Poisson del ejemplo 4.2.8.

| X FPM PO.5) FPM P(0.7) FPM PG)


0 0.0821 0.4966 0.0067
1 0.2052 0.3476 0.0337
2 0.2565 0.1217 0.0842
3 0.2138 0.0284 0.1404
4 0.1336 0.0050 0.1755
5 0.0668 0.0007 0.1755
6 0.0278 0.0001 0.1462
7 0.0099 0.0000 0.1044
8 0.0031 0.0000 0.0653
9 0.0009 0.0000 0.0363
10 0.0002. 0.0000 0.0181

Figura N? 4.2.4. Función masa de probabilidades de la


distribución de Poisson del ejemplo 4.2.8.
ESTADÍSTICA Y PROBABILIDAD EN La HiDROLOGÍA (Diseño HIDROLÓGICO)

Ejemplo 4.2.9.
En el ejemplo 4.2.1. se observa que la probabilidad de que el caudal
sea mayor o igual a 8 m'/s es 0.41, se pregunta ¿Cuál es la proba-
bilidad de que se presente 2 veces en 5 años?
Solución
Se tiene:
n=5yp=041 > A=np=2.05;x
= 2

Sustituyendo estos valores en la ecuación (4.2.10.) se tiene:


-2.05 2
po=2) 2 220% 0.271
21
Este resultado es diferente con respecto al resultado hallado en el
ejemplo 4.2.3., porque el valor de n no es grande y el valor de p no
es pequeño.

4.3.Modelos probabilísticos continuos


Los modelos probabilísticos continuos comúnmente usados en la hidro-
logía son: normal, logarítmico normal, exponencial, Gamma, Pearson Ill
y Gumbel. La distribución teórica adecuada para un conjunto de datos
muestrales se define mediante los métodos indicados en el capítulo VI.

4.3.1. Distribución normal


La función densidad de la distribución normal está dada por la
siguiente ecuación:

Donde:
fc9 = función densidad de probabilidad
Xx variable aleatoria

o = desviación estándar de la población


y. = media de población
En la ecuación (4.3.1.) y y s son parámetros de K distribución nor-
mal si la variable aleatoria se distribuye normalmente, se representa
mediante la siguiente ecuación:

( X > Níu, 0?) ] (4.3.2,


ABELARDO M. Díaz SALAS

Esta ecuación se lee cómo la variable aleatoria X tiene distribución


normal con media y y variancia o?, en el cuadro N? 4.3.1. y en las
figuras N* 4.3.1. y 4.3.2. se muestran los valores y la forma que
tiene el modelo de distribución normal para varios valores de sus
parámetros.

Cuadro N* 4.3.1.
Función de densidad de la
distribución normal para diferentes valores de y o
Xx NCLD N(0,D Na,D NQ,0.5) N0,D N(0,2)
-4.0000 0.0044 0.0001 0.0000 0.0000 0.0001 0.0270
-3.5000 0.0175 0.0009 0.0000 0.0000 0.0009 0.0431
-3.0000 0.0540 0.0044 0.0001 0.0000 0.0044 0.0648
-2.5000 0.1295 0.0175 0.0009 0.0000 0.0175 0.0913
-2.0000 0.2420 0.0540 0.0044 0.0003 0.0540 0.1210
-1.5000 0.3521 0.1295 0.0175 0.0089 0.1295 0.1506
-1.0000 0.3989 0.2420 0.0540 0.1080 0.2420 0.1760
-0.5000 0.3521 0.3521 0.1295 0.4839 0.3521 0.1933
0.0000 0.2420 0.3989 0.2420 0.7979 0.3989 0.1995
0.5000 0.1295 0.3521 0.3521 0.4839 0.3521 0.1933
1.0000 0.0540 0.2420 0.3989 0.1080 0.2420 0.1760
1.5000 0.0175 0.1295 0.3521 0.0089 0.1295 0.1506
2.0000 0.0044 0.0540 0.2420 0.0003 0.0540 0.1210
2.5000 0.0009 0.0175 0.1295 0.0000 0.0175 0.0913
3.0000 0.0001 0.0044 0.0540 0.0000 0.0044 0.0648
3.5000 0.0000 0.0009 0.0175 0.0000 0.0009 0.0431
4.0000 0.0000 0.0001 0.0044 0.0000 0.0001 0.0270

0.50

0.40

0,30
to)

0.20

0.00 +

Figura N* 4.3.1. Función de densidad de la distribución normal


para igual sigma y diferentes medias
ESTADÍSTICA Y PROBABILIDAD EN LA HibRoLOGÍA (Diseño HIDROLÓGICO)

0.90
0.80
0.70
0.60
—+—N(0,0.5)
0.50
—o6—M(0,1)
fo)

0.40
——N(0,2)
0.30
0.20
0.10
0.00

Figura N? 4,3.2. Función de densidad de la distribución normal


para igual media y diferentes valores de sigma

La función acumulada de la distribución normal está dada por la


siguiente ecuación:

Fo9= [£o0dx (4.3.3,


Xx

La ecuación (4.3.3.) analíticamente no es integrable. Las ecuacio-


nes (4.3.1.) y (4.3.3.) se simplifican definiendo una nueva variable
llamada z que se expresa mediante la siguiente ecuación:

| Z=
x—u (4.3.4.
o

( dx = odz ) (4.3.5.)

Donde:

z = variable normal estándar


La variable z tiene media cero (u = 0), y la variancia uno (0? = 1),
entonces se representa por z >N(0,1). La función de densidad de Z
está dada por la siguiente ecuación:

| /)= 770
Ea
2 —=0<zZ<O0 (4.3.6.)
ABELARDO MI. Díaz SALAS

Donde:
FG) = función de densidad de la variable normal estándar
La ecuación (4.3.6.) depende sólo de z, los valores de /(2) para
diferentes valores z se muestra en el cuadro N* 4.3.2. y en la figura
N? 4.3.3.

Cuadro N? 4.3.2.
Función de densidad de la variable normal estándar z > (0,1)
Z í(2) z Ha) Z Les
-4.0000 0.0001 -1.2500 0.1826 1.5000 0.1295
-3.7500 0.0004 -1.0000 0,2420 1.7500 0.0863
-3.5000 0.0009 -0.7500 0.3011 2.0000 0.0540
-3,2500 0.0020 -0.5000 0.3521 2,2500 0.0317
-3.0000 0.0044 -0.2500 0.3867 2.5000 0.0175
-2.7500 0.0091 0.0000 0.3989 2.7500 0.0091
-2.5000 0.0175 0,2500 0.3867 3.0000 0.0044
-2,2500 0.0317 0.5000 0.3521 3.2500 0.0020
-2,0000 0.0540 0.7500 0.3011 3.5000 0.0009
-1.7500 0.0863 1.0000 0.2420 3.7500 0.0004
-1.5000 0.1295 1.2500 0.1826 4.0000 0.0001

0.50

0.40

0.30

0.20
>E

-4 -3 -2 -1 0 1 2 3 4
A

Figura N* 4.3.3. Función de densidad de la variable normal estándar

La función de distribución de probabilidades o la función de dis-


tribución acumulada de la variable aleatoria (normal estándar) se
obtiene integrando la ecuación (4.3.6.), que representa el área de la
figura N? 4.3.3. para los diferentes valores de z. Matemáticamente
se representa mediante la ecuación (4.3.7.):
ESTADÍSTICA Y PROBABILIDAD EN La HiprotoGía (Diseño HIDROLÓGICO)

P(2)= Lo e =[_/()d: (4.3.7)

La ecuación (4.3.7.) al igual que la ecuación (4.3.3.) no es integra-


ble analíticamente, los valores de la ecuación (4.3.7.) se obtienen
de tablas, o se pueden obtener mediante las técnicas de métodos
numéricos (integración numérica); o se pueden aproximar mediante
el polinomio de Abramowitz y Stugen dada por Chow et ál. [51 cuya
expresión matemática es:

B=, [1+0.196854|z|+ 0.115194|z|" +0.000344|z|' +0.019527 e] | (4.3.8)


| z
| ¿
| Donde: Í
| E

| z| = valor absoluto de z |

[ F(2)= B paraz<0 2) (4.3.9.)

Í F(2)=1-B paraz>0 ) (4.3.10.)

Chow et ál. 15] indica que la ecuación (4.3.8.) genera error de


0.00025.
Los valores de x, según el modelo probabilístico normal, se obtie-
nen reemplazando el valor de z obtenido con la ecuación (4.3.9.) ó
(4.3.10.) en la ecuación (4.3.4.):

( X=X +0, ] (4.3.11,)

Donde:
Xx valor ajustado a la distribución normal
Xx = promedio de la muestra
o, Xx = desviación estándar de la muestra
z corresponde a P(X <x)

Px<0= [ /004 (43.12, 4


ABELARDO M.. Díaz Salas

Para hallar los valores correspondientes para los diferentes valores


de la probabilidad acumulada F(z) o para los diferentes períodos de
retorno (T), previamente se calculan los valores de z. Los valores de
z| indicados en la ecuación (4.3.8.) se obtienen mediante las técnicas
de métodos numéricos, donde se busca la raíz de la ecuación de
cuarto grado, siendo la ecuación a resolver:

0.196854|2| +0.115194|2]" +0.000344|2” +0.019527|2]* -(28J9+1=0 (4.3.13,)

Ejemplo 4.3.1.
Suponiendo que los datos del cuadro N? 1.1.1. se ajustan a la distri-
bución normal, hallar los caudales para las probabilidades de 0.20,
0.4, 0.6, 0.8 y 0.9999 = 1, sin usar tablas de distribución normal
estándar.

Descargas máximas instantáneas anuales del río Querococha (m3/s)


Año Q Año 20 Año Q
1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72 ]
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
1962-1963 | 7.56 1972-1973 5.80 -

Solución
Para hallar los valores de ; mediante la ecuación (4.3.11.) es nece-
sario calcular los valores de z para las diferentes probabilidades. Los
valores de z para diferentes probabilidades se obtiene resolviendo
numéricamente la ecuación (4.3.13.). Para la probabilidad de 20%,
se encuentra el valor de z resolviendo la siguiente ecuación:

0.196854|2| +0.115194|2]? +0.000344]2]' +0.019527|4* -(2BJ"9+1=0 (i


ESTADÍSTICA Y PROBABILIDAD En La HibrROLOGÍA (Diseño HIDROLÓGICO) E

En este caso B = 0.2

Reemplazando el valor de B en (i) se tiene:


|
|
|
| 0.196854|2| + 0.115194|z/? + 0.000344 Z| > 4 0.019527|2]* (04)"9 +1=0 | (ii)

| Escribiendo la ecuación (ii) como h(z) se tiene:

| 0.196854|2| +0.115194|2]? +0.000344|z]”Z; +0.019527|7]* —2.2574 = h(z) | Gi

Para resolver la ecuación iii es recomendable graficar la ecuación iii,


los resultados se muestran en el cuadro N? 4.3.3. y figura N* 4.3.4.

| Cuadro N* 4.3.3.
| Valores de híz) y z del ejemplo 4.3.1.

7 E haa z O
-4.00 4.00 7.39 0.25 0.25 -0.20 ho
3.75 3.75 5.98 0.50 0.50 0.13
3.50 3.50 4.79 0.75 0.75 0.04
3.25 3.25 3.79 1.00 1.00 0.07
3.00 3.00 2.96 1.25 1.25 0.22 E
E 2.75 2.28 1.50 1.50 0.40 ;
-2.50 2.50 1.72 1.75 1.75 0.62
2.25 2.25 1.27 2.00 2.00 0.91
2.00 2.00 0.91 2.25 2.25 1.27 E
-1.75 1.75 0.62 2.50 2.50 1.72 E
-1.50 1.50 0.40 2.75 2.75 2.28 h
-1.25 1.25 0,22 3.00 3.00 2.96
-1.00 1.00 0.07 3.25 3.25 3.79
0.75 0.75 -0.04 3.50 3.50 4.79
| -0.50 0.50 0.13 3.75 3.75 5.98
| 0.25 0.25 -0.20 4.00 4.00 7.39
| 0.00 0.00 -0.26
|
ABELARDO M. Díaz SALAS

107

co
m
bu

izl

Figura N* 4,3.4. Valores de híz) para la probabilidad


de (B=0.2) del ejemplo 4.3.1.

La figura y el cuadro anterior permiten identificar la raíz aproximada


de la ecuación (iii), lo cual se visualiza cuando h(z) cambia de signo.
La raíz de la ecuación (iii) se encuentra cuando h(z)=0, la solución
numérica se encuentra tomando un valor inicial de |z| cuando h(z)
cambia de signo. Existen diferentes métodos para encontrar las raíces
de una ecuación; en el presente caso se va emplear el método de
Newton-Raphson, expresado mediante la siguiente ecuación:

z sel =12, = mí 7.)

Donde
i = iteración
h(lz|) = función de |z| (ecuación iii)
h'(z() = primera derivada de h(|[z|)
El resultado obtenido se muestra en el siguiente cuadro:
ESTADÍSTICA Y PROBABILIDAD EN La HiDroLOGíA (Diseño HIDROLÓGICO)

Cuadro N* 4.3.4,
Aplicación del método de Newton-Raphson para encontrar el valor de |zl
para probabilidad de 0.2 del ejemplo 4.3.1.

12, Error

hiuin|=]|0 mn.
1.00000 100
0.85291 17.24609
0.84204 1.29057
0.84199 0.00642
0.84199 0.00000

Para hallar el valor de x mediante la ecuación (4.3.11.) es necesario


estimar los parámetros de la distribución normal u y o (ver ecuación
4.3.1.) a partir de los datos muestrales. En el capítulo V se estudia
la forma de estimar los parámetros de una distribución de probabi-
lidades, se demuestra que los parámetros de la distribución normal
se estiman mediante las siguientes ecuaciones:

X= EX) =p ] (w

| s= (E(x-)2)95 | (vi)

Xx promedio aritmético de la muestra


1!

Ss desviación estándar de la muestra


o? = variancia de la muestra
En el cuadro N? 4.3.4. se observa que el valor de [z| = 0.84199 para
la probabilidad de P(X <x)=0.2, por lo tanto el valor de X,, es:
Zo, =X + sz =7.68+1.79*(-0.84199)=6.17 m%.
x=7.68 m (ver ejemplo 1.4.)
S

s =179% (ver ejemplo 1.7.)


s

Para las probabilidades mayores a 0.5 el valor z es positivo, por


tanto los valores de z se encuentran mediante la ecuación siguiente
obtenida de las ecuaciones (4.3.8.) y (4.3.10.).

| 0.196854|2] +0.115194|2)” +0.000344|2" +0.019527|2' -(2-28)"9+1=0 (vii)

E
ABELARDO M. Díaz SALAS

El resultado para las demás probabilidades pedidas en el ejemplo


se muestra en el siguiente cuadro.

Cuadro N* 4.3.5.
Valores de £ según la distribución normal
(caudales máximos instantáneos anuales del río Querococha)
P Z xml
0.2 -0.84199 6.17
0.4 -0.25342 7.23
0.6 0.25342 8.13
0.8 0.84199 9.19
0.9999 3.95995 14.77

4.3.2. Distribución logarítmico normal


Si X es una variable aleatoria con funciones de densidad de proba-
bilidad asimétricas (distribución no normal) y si se define una nueva
variable como Y = LnX, que presenta una distribución normal
(simétrica) con media y y variancia o”, entonces se afirma que la
variable X tiene una distribución logarítmico normal. Las ecuaciones
de esta distribución son:

q Y = LnX ) (4.3.14,)

La función de densidad de y es:

1( 97H,

re e a o, ) Dep za (4.3.15,)
210,

( Y > Níu,o?) ) (4.3.16.)

Donde:
F() = función de densidad de la distribución logarítmico normal.

( 1, = Lnx ) (4.3.17,)

l 0, =8 br (4.3.18.)

E
EstapísTicCA Y PROBABILIDAD EN La HiproLoGía (Diseño HiDROLÓGICO)

Por la propiedad de las distribuciones acumuladas se tiene:

[ Fúdy= f(x)ax ] (43.19)

F)= 10) 2 | (4.3.20)

De la ecuación (4.3.14.) se obtiene:

o Y =LInX a E | (4.3.21.)
dx x

Reemplazando la ecuación (4.3.21.) en (4.3.20.) se obtiene:

| Fx)= £0) | (4.3.22)

Reemplazando la ecuación (4.3.15.) en (4.3.22.) se obtiene la fun-


ción de densidad de probabilidad de x:

(su. Y

0, e a Se O<x<w (4.3.23,)
F()= .

Fl )=
e”
a
210,
en” O<x<o (4.3,24.,)

Donde:
X = ey

Si los logaritmos de la variable aleatoria X se distribuyen normal-


mente, entonces esta distribución se representa por:

x> logN(p,,0? ) | (4,3.25.)


ABELARDO M. Díaz Satas

En el cuadro N* 4.3.6. y en las figuras


N* 4.3.5, y 4.3.6. se muestran
los valores de la función de densidad
de probabilidades log-normal
y la forma que toma el modelo de distribución
para varios valores
de sus parámetros.

Cuadro NY 4.3.6.
Función de densidad de la distribuci
ón logarítmico normal
para diferentes valores de H yo
% Log Log Log
NG,0.5)
Log Log Log
NG.5,0.5) NQ.5,0.5 NG,0
0.0500 N(3,0.8) N(3,0.5)
0.0000 0.0000 0.0000 0.0000
0.5000 0.0000 0.0000
0.0000 0.0000 0.0000 0.0009
10.0000 0.0302 0.0000 0.0000
0.0045 0.0738 0.0313 0.0341
15.0000 0.0449 0.0152 0.0302
0.0488 0.0255 0.0311 0.0449
20.0000 0.0399 0.0240 0.0244 0.0199 0.0249 0.0399
25.0000 0.0290 0.0272 0.0114
30.0000 0.0156 0.0192 0.0290
0.0193 0.0261 0.0052 0.0123
35.0000 0.0147 0.0193
0.0123 0.0227 0.0025 0.0098
40.0000 0.0112 0.0123
0.0077 0.0186 0.0012 0.0079
45.0000 0.0048 0.0086 0.0077
0.0147 0.0006 0.0064 0.0067
50.0000 0.0030 0.0048
0.0114 0.0003 0.0053 0.0052
35.0000 0.0019 0.0030
0.0087 0.0002 0.0044 0.0041
60.0000 0.0012 0.0019
0.0066 0.0001 0.0037 0.0033
65.0000 0.0008 0.0012
0.0049 0.0000 0.0031 0.0026
70.0000 0.0005 0.0008
0.0037 0.0000 0.0026 0.0021
75.0000 0.0003 0.0005
0.0028 0.0000 0.0022 0.0017
80.0000 0.0002 0.0003
0.0021 0.0000 0.0019 0.0014 0.0002

La función distribución acumulada


está dada por la siguiente ecua-
ción:

(4.3.26.)

Donde:
F(») = función de distribución acu
mulada


_—_——_—————_
EsTapísTICA Y PROBABILIDAD En ta HibroLoGíA (Diseño HibroLóGIco)

0.08

0.07

0.00

| ¿
— 7 LO6N(30.8) =====-- LOGN(3.5,0.5) LOGN(25,0.5)

Figura N* 4.3.5. Función de densidad de la distribución logarítmico normal


para igual desviación estándar y diferentes valores de media

«ll

0.06 SS

0.04 4
IP
Z É, 5 .
Ez HNOS
Y Ns
002.4 ¿$ o,
be hn

A
h Qs
Y > TS
.
*
AA A
a
Tc a
0.00 : : , : :
0 10 20 30 40 50 60 70 80
x
mm — LOG, 1) rn LOGN(3, 0.8) LOGN(3,0.5) |

Figura N* 4.3.6. Función de densidad de la distribución logarítmico


para igual media y diferentes valores de desviación estándar

La ecuación (4.3.26.) analíticamente no es integrable, las ecuaciones


(4.3.23.) y (4.3.24.) se estandarizan definiendo una nueva variable z
(variable normal estándar) expresada mediante la siguiente ecuación:
ABELARDO M. Díaz SALAS

yJ.H,
2= | (4.3.27.)
o,

[ dy =0,dz | (4.3.28,)

Esta variable, como se ha indicado anteriormente, tiene media cero


(u= 0) y la variancia uno (0? = 1). De las ecuaciones (4.3.27.),
(4.3.28.) y (4.3.7.) se obtiene la siguiente ecuación:

F(z)= 7 f e? dz | (4.3.29,)

La ecuación (4.3.29.) es igual a la ecuación (4.3.7.), los valores de la


ecuación (4.3.29.) se obtienen con los mismos criterios establecidos
para el caso de distribución normal (ver cuadro N* 4.3.2. y figura
N? 4.3.3.).
Para hallar los valores de Y correspondientes para diferentes proba-
bilidades, se procede de igual manera que se ha explicado para el
caso de distribución normal, donde es necesario hallar los valores
de z mediante las ecuaciones (4.3.9.) ó (4.3.10.), la media de los
logaritmos y la desviación estándar de los logaritmos de la muestra.
Los valores de y se hallan mediante las siguientes ecuaciones:

( p=y+ 9, ] (4.3.30.)

Donde:
» = valor ajustado a la distribución normal
= promedio de los logaritmos (logaritmos de x) de la muestra
|

o, = desviación estándar de los logaritmos (logaritmos de x) de la


muestra

PES, SO | 43.31)
ESTADÍSTICA Y PROBABILIDAD EN LA HibroLoGíA (Diseño HibroLÓGICO)

Los valores de í según el modelo probabilístico logarítmico normal


son obtenidos a partir de la ecuación (4.3.14.).

7) (4.3.32,)

Dm ez
x>

Donde:
x= valor de la variable aleatoria ajustada a la distribución logarít-
mico normal.
Ejemplo 4.3.2.
Suponiendo que los datos del cuadro N* 1.1.1. se ajustan a la
distribución logarítmico normal, hallar los caudales para las pro-
babilidades de 0.20, 0.4, 0.6, 0.8 y 0.9999 = 1, sin usar tablas de
distribución.

Descargas máximas instantáneas anuales del río Querococha (m?/s)


Año Q Año Q Año Q
1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
1962-1963 7.56 1972-1973 5.80

Solución '
El procedimiento que se usa para hallar los valores de z para dife-
rentes probabilidades es igual al ejemplo 4.3.1., cuyos valores se
indican en el cuadro N* 4.3.5. Los valores de $ se obtienen con la
ecuación (4.3.30.), reemplazando el valor de z para una probabilidad
de 20% y con los valores de: y = 2.01, o, = 0.25, se obtienen:
$=)+0,2=2.01+0.25x(-0.84198) =1.80
3
i=e*=2.7182818: =605—
S

El resultado para las otras probabilidades pedidas en el ejemplo se


muestra en el siguiente cuadro.
ABELARDO M. Díaz SALAS

Cuadro N* 4.3.7.
Valores de x según la distribución logarítmico normal
(caudales máximos instantáneos anuales del río Querococha)

po. Z Y xls)
0.2 -0.84199 1.80 6.05
0.4 -0.25342 1.95 7.01
0.6 0.25342 207 | 795
08 | 084199 22 | 921
0.9999 | 3.95995 3.00 | 20.09
y

4.3.3. Distribución exponencial


La fimción densidad del madolo probabilístico exponencial está
dada por:

As de » x>0 (4.3.33,
MM ) l x<0

Donde:
A = parámetro de la distribución exponencial.
Si la variable aleatoria X se distribuye exponencialmente, entonces
esta distribución se representa por:

x > EQ) 2) (4,3.34,)

En el cuadro N? 4.3.8. y en la figura N* 4.3.7. se muestran los


valores y la forma que toma la función densidad de la distribución
exponencial para diferentes valores del parámetro ».

Cuadro N? 4.3.8.
Función de densidad de la distribución exponencial
para diferentes valores de 2
X E(0.5) E(0,25) ED
0.00 0.5000 0.2500 1.0000
0.50 0.3894 0.2206 0.6065
1.00 0.3033 0.1947 0.3679
1.50 0.2362 0.1718 0.2231
2.00 0.1839 0.1516 0.1353
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HIDROLÓGICO)

Xx E0.5) 40.25) ED
2.50 0.1433 0.1338 0.0821
3.00 0.1116 0.1181 0.0498
3.50 0.0869 0.1042 0.0302
4.00 0.0677 0.0920 0.0183
4.50 0.0527 0.0812 0.0111
5.00 0.0410 0.0716 0.0067

1.20

1.00 4

0.80 -

5 0.60 -
rr

0.404”

0.20 -

0.00
0 2 4 6 8 10
Xx
ac (0,5) = <= + =E(0.25) E(1)

Figura N* 4.3.7. Función de densidad de la distribución exponencial

La función de distribución acumulada está dada por la siguiente


ecuación:

P(X <%)= F()= Peras =1-e* | (4.3.35,)

El valor de x (valor ajustado a la distribución exponencial) se obtiene


a partir de la ecuación (4.3.35.).

=Infi-F(o)] (4.3.36,)
A
ABeLARDO M. Díaz SALAS

Mediante los métodos de estimación de parámetros (ver el capítulo


V) se demuestra que el parámetro 4 es igual a la siguiente ecuación:

(4.3.37.,)

RI—
Donde:
x = promedio aritmético de los datos de la muestra.
Reemplazando la ecuación (4.3.37.) en (4.3.36.) se obtiene:

NASA 4338)
Ejemplo 4.3.3.
Suponiendo que los datos del cuadro N* 1.1.1. se ajustan a la dis-
tribución exponencial, hallar los caudales para las probabilidades
de 0.20, 0.4, 0.6, 0.8 y 0.9999 = 1,

Descargas máximas instantáneas anuales del río Querococha (m/s)


Año Q Año Q Año Q
1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
1962-1963 7.56 1972-1973 5.80

Solución
Los valores de x (valores ajustados al modelo exponencial) se estiman
mediante la ecuación (4.3.38.) para diferentes probabilidades. Para
P(x<x) = 0.2 se tiene:
% = [-Ln(1 -P(X < x))]]x = [-Ln( -0.2)1*7.68=1.71
El resultado para las otras probabilidades pedidas en el ejemplo se
muestra en el siguiente cuadro.
EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)
Estapística Y PROBABILIDAD

Cuadro N* 4.3.9.
Valores de í según la distribución exponencial
(caudales máximos instantáneos anuales del río Querococha)

4.3.4. Distribución gamma


da por:
La distribución gamma tiene la función de densidad defini

(4.3.39,)

Donde:
O<x<ow

ap = parámetros positivos
a. = parámetro de forma
PB = parámetro de escala
T(a) = función gamma de a.
tura porque
El nombre de distribución gamma proviene de su estruc
contiene la función gamma.
i, Función gamma
La función gamma está definida por:

T(a) = [osa para a. >0 0

La ecuación i converge para a— 1>-10a>0.


les
Integrando por partes la ecuación (i) y cambiando variab
para ese fin se obtiene:
AseLarDO M.. Díaz SALAS

du = dx" (tii)

dv=e “dx (iv)

Se sabe que:

(
á
duy = udv+ vdu (vi)

r
udv = duv— vdu (vii)
Q

Reemplazando (ii) y (iv) en (i) se tiene:

T(a)= f udv (viti)

De las ecuaciones (vii) y (viii) se obtiene:

T(a)= [ du» - Pra

| T(a)= TUN - [ras

Reemplazando (ii) al (v) en (x) se obtiene:

x= A ;
T(a)= Le - f e dr
x=0

| Tlo)=0- [aro = Pera (xi1)


Estapística Y PROBABILIDAD EN LA HIDROLOGÍA (DISEÑO HIDROLÓGICO)

De la ecuación (iii) se tiene:

du = dx" = (9-1) dx | (xiii)

Reemplazando la ecuación (xiii) en (xii) se obtiene:

T(a)= [ear = [(M-Der dr = l-DfxTas (xiv)

De las ecuaciones (i) y (xiv) se obtiene:

[osa =F (a)

fe
-=x
x
0-2 de
dx = Ta -1)= (a:
loa _
2)[e -x_0-3
x "dx 601

IS = Tía. - 2)

De las ecuaciones (xiv) y (xv) se obtiene:

D T(0)= (a -1)F(a: —1) 2) bai)

o Tía +1)=aF (0) J (xvii)

si a. > 0, por iteración de la ecuación (xvi) se obtiene:

TO) ee a) bi)

Generalizando la ecuación (xviii) se tiene:

T(0.)= (a -1)F(a: -1) (xix)


F(a)= la: - 1)
AseLarbO M. Díaz SALAS

De la ecuación (xix) se obtiene:

[ Fa +1)=0.! ] bo)

Para a entero positivo.


Hallando r():
De la ecuación (i) para a = 1 se obtiene:

o
rá)= f erdi=-e* 0
= ales en Y 1 xd)

Hallando TQ):
De la ecuación (xix) y reemplazando a. = 2 se tiene:

( r(Q)= (-1)rQ-1)=1 ] (xxi)

En general para calcular r() se pueden utilizar los siguientes


criterios:
1. Para a < O la función r(a) se calcula transformando la
ecuación (xvii) a la siguiente ecuación:

ra) FED (xxi)

La función gamma establecida mediante la ecuación (i)


para x < O no converge, mediante la ecuación (xxiii) se
pueden calcular la función gamma para todos números
reales y complejos, excepto para a=-n, n=0,-1-2,, en
consecuencia la ecuación (xxili) es válida sólo cuando
QUA.

2. Para 0<a<1 la función T(a.+1) se calcula mediante la


aproximación polinomial de octavo grado. Villón [20].

( T(+1)=01=09 +a10.+ 070? +0305 +aq0* +a507 +a60% 4070? san) (xxiv)
EstapístTiCA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HioroLócico)

Donde:

a, = 1.00 = -0.897056937 a, = 0.482199394 UN


a, = -0.577191652 = 0.918206857 a, = -0.193527818
a, = 0.988205891 = -0.756704078 a, = 0.035868343

Los resultados se muestran en el cuadro N* 4.3.10. y figura


N? 4.3.8.

Cuadro N* 4.3.10.
Función gamma para 1 < a < 2.0) = [ertax

a Tio) a Tía) a Lío) a Ta) a Elo) |


100 |1o0000 | 1.21 10.91558 | 1.41 |0.88676 | 1.61 |0.89468| 1.81 |0.93408
101 logo9433 1 122 l091311 | 1.42 |0.88636 | 1.62 089592 | 1.82 |0.93685
102 looses4| 123 10.91076| 1.43 |0.88604 | 1.63 |0.89724| 1.83 | 0.93969
103 10.98355| 1.24 |0.90852| 1.44 |0.88580 | 1.64 |0.89864| 1.84 |0.94261
104 (097844 | 1.25 |0.90640 | 1.45 |0.88566 | 1.65 |0.90012 | 1.85 | 0.94361
1.05 1097350 | 126 |0.90440 1.46 |0.88560 | 1.66 |0.90167 | 1.86 | 0.94869
106 |o96874 | 1.27 |0.90250| 1.47 |0.88563 | 1.67 |0.90330| 1.87 |0.95184
107 096415 | 128 1090072 | 1.48 |0.88575 | 1.68 |0.90500| 1.88 |0.95507
108 |o95973| 129 |0.89904 | 1.49 |0.88595 | 1.69 |0.90678 | 1.89 |0.95838
109 |oos546 1 13 [089747 | 1.5 |0.88623| 1.7 |0.90864| 1.9 | 0.96177
11 loss1351 131 (089600 1.51 |0.88659 | 1.71 |0.91057| 1.91 |0.96523
m1 Tosa7a01 132 1089464 | 1.52 |0.88704| 1.72 |0.91258| 1.92 |0.96877
112 losga359| 133 1089338 | 1.53 |0.88757 | 1.73 |0.91467 | 1.93 |0.97240
113 (093993 | 134 |0.89222| 1.54 |0.88818 | 1.74 |0.91683| 1.94 |0.97610
114 1093642 | 1.35 |089115| 1.55 |0.88887 | 1.75 |0.91906| 1.95 | 0.97988
115 10933041 1.36 |0.89018 | 1.56 |0.88964 | 1.76 |0.92137| 1.96 |0.98374
116 losg2080, 1.37 |0.88931| 1.57 |0.89049| 1.77 |0.92376| 1.97 | 0.98768
117 los26701| 138 [088854 1.58 |0.89142 | 1.78 |0.92623| 1.98 |0.99171
16 og2373 | 139 |o88785 | 1.59 |0.89243| 1.79 |0.92877| 1.99 |0.99581
119 losgz089 14 1088726 1.6 |0.89352| 18 [093138 2.00 | 1.00000
|0.91817 |
1.2
ABELARDO MI. Díaz SALAS

1.00 l

TE ALFA
a
o
ó
GAMMA
o
o
S

0.85

0.50 1.09 1.50 2.00 2.50

ALFA

Figura N? 4,3.8. Función gamma para 1 <alfa<2

3. Parada > 1 la función (a + 1), se calcula mediante


la ecuación (xix) Fa) = (a — 1)F(a — 1) o mediante la
aplicación del ajuste polinomial por la serie asintótica de
Sterling:

T(a)=a*%e*
a ¡14 1 IAS
139 AA
571 (xv)
a lla 2889 518400” 24883200

4. Para valores de a grande y positiva, la función (a + 1) se


puede calcular con la aproximación factorial de Sterling:

| To +1)=0!= ./2r0. ate” | (xvi)

Ejemplo 4.3.4.
Hallar la función gamma de 3.5, 05y-0.5
Solución:
1. T(8.5):
e Aplicando la ecuación (xvi) se tiene:
T(B.5)=2.5xTP(2.5)=2.5x1.5xT(1.5)=2.5x1.5x 0.88623=3.32342
Nota: T'(1.5) se halla mediante la ecuación (xxiv) o de la
tabla (4.3.10.).
HiDRoLÓGICO)
(Diseño
ESTADÍSTICA Y PROBABILIDAD EN LA FNSOLOcA WWW 00
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA E
e Aplicando la ecuación (xxu) se tiene:
1 (3.5) = 3.32335371
2. T(0.5):
Aplicando la ecuación (xxiii) se tiene:

r(0.5)= r(0.5+1) = A pñS 1.77246


0.5 5

3. T(-0.5):
Aplicando la ecuación (xxiii) se tiene:
__, 54492
ros) = TE05+1) _ r(0.5)_ Tú+ 0.5) _ 0.8623
-0.5 05 -0.5*0.5 0.25

a es de gran
Velasco et ál. 119] indica que la función gamm
en la estadística, ya que inter viene no sólo en la
importancia
én en la distribución
distribución del mismo nombre, sino tambi
ón x”. Debido
t de Student, en la distribución F y en la distribuci (xiii)
iones (xx) y
ala propiedad establecida mediante las ecuac
considerado como
de la función gamma algunos autores han
de factorial, aplicado
una generalización natural del concepto
es discontinua,
a cualquier número real. La función gamma
números reales y la
los valores de la función gamma para los y en
o N* 4.3.11.
forma que adquiere se muestra en el cuadr
la figura N* 3.3.9,
Cuadro N* 4.3.11.
Valores de la función gamma
Po Tía)
ABELARDO M. Díaz SaLas

a /
, /
UN
3
Í
2
uy
Ss 4
s 1

S y
E $

2 A 0 4 23.4
ALFA
2

3
p

Figura N* 4.3.9. Gráfica de la función gamma

Si la variable aleatoria X se distribuye según la distribución


gamma, entonces ésta se representa por.

( X > Gla,P) ) (4.3.40,)

En el cuadro N? 4.3.12. y en la figura N? 4.3.10., se muestran


los valores y la forma que adquiere la función densidad de
probabilidades tipo gamma, para diferentes valores de los
parámetros a y PB. La función de densidad de la distribución
gamma está representada por la ecuación (4.3.39.).
ESTADÍSTICA Y PROBABILIDAD En La HiproLoGíA (Diseño Hibrotócico)

4.00

0.80

0.60
00

0.40

0.20

0 2 4 6 8 10 12 14

Figura N* 4.3.10. Función de densidad del modelo gamma


para beta = 1 y diferentes valores de alfa

Cuadro N* 4.3.12.
Valores de la función de densidad del modelo gamma (ecuación 4.3.39.)

B=1 4-4

. a a=1 ama A B=05 Be1 B=03


0.04756 0.00002 0.00030 0.00002 0.00218
0.05 0.95123

0.09048 0.00015 0.00218 0.00015 0.01474


o 0.10 0.90484

0.10375 0.00109 0.01430 ¡ 0.00109 0.08451


0.20 0.81873
0.22225 0.00333 0.03951 0.00333 0.20438
0.30 0.74082

0.26813 0.00715 0.07669 0.00715 0.34712


0.40 0.67032

0.30327 0.01264 0.12263 0.01264 0.48579


0.50 0.60653

0.32929 0.01976 0.17349 0.01976 0.60149


0.60 0.54881

0.34761 0.02839 0.22555 0.02839 0.68439


0.70 0.49659
0.35946 0.03834 0.27566 0.03834 0.73201
0.80 0.44933

0.36591 0.04940 0.32134 0.04940 0.74681


0.90 0.40657

0.36788 0.06131 0.36089 0.06131 0.73403


1.00 0.36788
0.12551 0.44808 0.12551 0.46791
1.50 0.22313 0.33470

0.27067 0.18045 0.39073 0.18045 0.20949


2.00 0.13534
0.20521 0.21376 0.28075 0.21376 0.07728
2.50 0.08209

0.14936 0.22404 0.17847 0.22404 0.02522


3.00 0.04979
0.21579 0.10426 0.21579 0.00756
! 3.50 0.03020 0.10569

0.07326 0.19537 0.05725 0.19537 0.00213


4.00 0.01832
0.04999 0.16872 0.02999 0.16872 0.00057
4.50 0.01111

0.03369 0.14037 0.01513 0.14037 0.00015


5.00 0.00674

0.02248 0.11332 0.00741 0.11332 0.00004


5.50 0.00409
ABELARDO MI. Díaz SALAS

B=1 a=4
X
a => 1 a -=2 a=4 | B=05 pa 1 f=03
6.00 0.00248 | 0.01487 | 0.08924 | 000354 | 008924 | 0.00001
6.50 0.00150 | 0:00977 | 0.06881 0.00166 | 0.0681 0.00000
7.00 0.00091 0.00638 | 0.05213 | 000076 | 0.05213 | 0.0000
7.50 0.00055 | 0.00415 | 0.0389 | 0.00034 | 003889 | 0.0000
8.00 0.00034 | 0.00268 | 0.02863 | 0.00015 | 002863 | 0.0000
8.50 0.0020 | o.00173 | 002083 | 000007 | 002083 | 0.0000
9.00 0.00012 | 0.0011 0.01499 | 0.00003 | 001499 | 0.0000
9.50 0.00007 | 0.0071 0.01070 | 0.0001 0.01070 | 0.0000
10.00 0.00005 | 0:00045 | 0.00757 | 0.0001 0.00757 | 0.0000
10.50 0.00003 | 0.00029 | 0.00531 0.00000 | 0.00531 0.0000
11.00 0.00002 | 0.0018 | 0.00370 | 0.0000 | 0.00370 | 0.0000
11.50 0.00001 0.00012 | 0.00257 | 0.0000 | 0.00257 | 0.0000
12.00 0.00001 0.00007 | 0:00177 | 0.00000 | 0.00177 | 0.0000
12.50 0.00000 | 0.0005 | 0.0121 0.00000 | 0:00121 0.0000
13.00 0.0000 | 0.0003 | 0.00083 | 0.0000 | 000083 | 0.0000

0.80

0.60
—e— BETA=0.5

$ 040 —a— BETA!


BETA=0.3
0,20

0.00
2.00 4.00 6.00 8.00 10.00 12.00

Figura N* 4,3.11. Función de densidad del modelo gamma


para alfa = 4 y diferentes valores de beta

La función de distribución acumulada del modelo gamma está


dada por la siguiente ecuación:

=x
al, B
P(X < x)= F(e,01)= as (43.41)
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HiproLóGIco)

La ecuación (4.3.41.) no es directamente integrable, sus valores


se calculan mediante las técnicas de integración numérica y
existen tablas de esta distribución denominadas “distribución
gamma incompleta”, llamada así porque los valores en tabla
son sólo para valores enteros positivos de a.
Sí a, es un número natural, la función de distribución acumulada
puede determinarse mediante la siguiente ecuación:

(0,x<0 >

pl q Z um Z o er; .>0 (43.42)


F(e)> l=
p 2alB) 3uB (a—-DHB

Haciendo un cambio de variable se tiene: 3

| y=%> dx=Bdy o (4.3.43,) :


B E

Reemplazando la ecuación (4.3.43.) en (4.3.41.) se obtiene:

G(»)= So MA (43.44,

Reemplazando la ecuación (4.3.43.) en la ecuación (4.3.42.),


se obtiene la distribución acumulada de gamma incompleta:

O O rr ÓN >0 (4.3.45.)

Los valores de la ecuación (4.3.45.) para diferentes valores de


a e Y se muestra en el cuadro N* 4.3.13.
Los valores de í ajustados a la distribución gamma correspon-
dientes a diferentes probabilidades se obtienen de la ecuación A
p (4.3.42.):
( 2) (4.3.46.)
uo
>
Ñ
<
ABELARDO MI. Díaz SALAS

Para hallar los valores de Y es necesario conocer las probabili-


dades acumuladas G(y) y el valor de a.. Los parámetros a. y f3 se
estiman a partir de los datos muestrales mediante los métodos
de estimación de parámetros que se estudia en el capítulo V.
Los parámetros estimados mediante el método de momentos
son:

al LE (4.3.47,)
Ss

B E (4.3.48,)
Xx

Donde:
x = promedio de la muestra
s = desviación estándar de la muestra

Cuadro N* 4,3.13.
a : pega?
Distribución gamma incompleta G(y)= => dy
F(o.)
Yi GN a Y. q a Y 600 a Y G00 a Y Gty
1106321 |2| 1) 02642 |3| 1 | 00803 |4| 1 | 0.0190 |5| 1 | 0.0037
2 108647 |21 2 | 0.590 |3| 2 | 0.3233 14 2 | 0.1429 |5| 2 | 0.0527
3 1 09502 12|3 | 08009 |3| 3 | 0.5768 14 | 3 | 0.3328 |5 | 3 | 0.1847
4 | 09817 |2 | 4 | 09084 |3| 4 | 0.7619 |41 4 | 0.5665 15] 4 | 0.3712
5109933 1215 | 095986 |3l| 5 | 0.8753 14 | 5] 0.7350 |5]| 5 | 0.5595
6 1099751216 | 09826 |3| 6 | 0.9380 |4 6 | 08488 |5| 6 | 0.7149
7 109991 1217 | 09927 |3| 7 | 0.9704 ¡4| 7 | 09182 |5| 7 | 0.8270
8 109997 1218 | 0.9970 |3|8 | 09862 |4| 8 | 0.9576 |5|8 | 0.9004
9 0999 12/91 09988 |3|9 | 09938 |4| 9 | 0.9788 |5¡9 | 0.9450
10 10000 12 |10 | 0.9995 13 10 | 09972 |4|10| 0.9897 |5|10 | 0.9707
2 111 | 0.9998 |3|11| 0.9988 |4|11 | 0.9951 |5|11| 0.9849
2112 | 09999 |3|12| 09995 |4|12 | 0.9977 |5|12| 0.9924
2113 | 10000 13 |13| 09998 |4|13| 0.9989 |5113]| 0.9963
2 3 |14| 09999 |4|14| 0.9993 |5 | 14] 0.9982
2 3115 | 1.0000 |4|15| 0.9998 |5 15] 0.9991
Estapística Y PROBABILIDAD EN La HiproLoGía (Diseño HiDROLÓGICO)

Ejemplo 4.3.5.

ra
ap
Suponiendo que los datos del cuadro N? 4.3.14. se ajustan a la
distribución gamma, hallar los caudales para las probabilidades
de 0.20, 0.4, 0.6, 0.8 y 0,9999 x= 1, sin usar tablas de distribución
gamma.

A
EA
Cuadro N? 4,3.14.
Descargas máximas instantáneas anuales del río Santa (m?/s). Estación: Recreta

IED
Año Q Año Q Año Q |
1953-1954 18.40 1963-1964 27.01 1973-1974 40.35
1954-1955 38.20 1964-1965 21.97 1974-1975 27.65
1955-1956 23.50 1965-1966 17.08 1975-1976 31.26
1956-1957 23.00 1966-1967 29.09 1976-1977 25.19
1957-1958 21.50 1967-1968 8.80 1977-1978 11.90
1958-1959 38.00 1968-1969 13.20 1978-1979 23.10
1959-1960 25.78 1969-1970 39.90 1979-1980 6.17
1960-1961 21.48 1970-1971 40.00 1980-1981 54.70
1961-1962 37.60 1971-1972 53.55 1981-1982 38.80
1962-1963 34.10 1972-1973 26.96

Solución
' Para hallar los valores de x mediante la ecuación (4.3.46.) es nece-
sario calcular los valores de y, a y B.
De los datos muestrales del cuadro N* 4.3.14. mediante las ecua-
ciones (4.3.47.) y (4.3.48.) se obtiene:

C 7 a
E a Js
Los valores de y para diferentes probabilidades se obtienen resol-
viendo numéricamente la ecuación (4.3.44.), para la probabilidad
de 20%, se encuentra el valor de y resolviendo la siguiente igualdad:

0) ndo = (Y) (ii


0) Ire)
ABELARDO M. Díaz SALAS

Para:

Gly)=0.2, a. =5.6 se tiene:

021-199 +30) +16) gor


4.61
10)
084 149970) +6) O =H(Y)
4.6!

Para resolver la ecuación (iv) es recomendable graficar la ecuación


cuyos resultados se muestran en el cuadro N* 4.3.15. y figura
N* 4.3.12.

Cuadro N* 4.3.15.
Valores de h(y) e y del ejemplo 4.3.5.

y : hi : Yo E(0
0.10 0.200 4.35 -0,250
0.35 0.200 4.60 -0.292
¡A
0.60 0.197 4.85 -0.332
0.85 0,192 5.10 -0.371
1.10 0.183 5.35 -0.408

e 1.35 0.169 5.60 -0,443 A]


1.60 0.150 5.85 0,477
1.85 0.126 6.10 -0.508
2.10 0.099 6.35 -0.538
2.35 0.068 6.60 -0.565
2.60 : 0.034 6.85 -0,590
2.85 -0,003 7.10 -0.613
3.10 -0.042 7.35 -0,634

+ 3.35 -0.082 7.60 -0.653

3.60 -0,124 7.85 -0,670


3.85 -0.166 8.10 -0.686
4.10 -0.208
HiproLóGIco)
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño

0.40

e
h(y)
ba
o
5

Figura NO 4,3.12. Gráfica de h(y) para la probabilidad


G(Y) =0.2 del ejemplo 4.3.5.

imada
La figura y el cuadro anterior permiten identificar la raíz aprox
de signo.
de la ecuación (iv), lo cual se visualiza cuando h(Y) cambia
la solución E
La raíz de la ecuación (iv) se encuentra cuando h(Y)=0,
un valor inicial de Y cuando h(Y) á
numérica se encuentra tomando
s para encont rar las raíces z
cambia de signo. Existen diferentes método
el método de
de una ecuación, en el presente caso se va emplear
te ecuaci ón (ver
Newton-Raphson, expresado mediante la siguien
ejemplo 4.3.1.).

Donde:
i = iteración
h(Y) = función de Y (ecuación iv)
h(Y) = primera derivada de h(Y)
El resultado obtenido se muestra en el siguiente cuadro:
ABELARDO M. Díaz SALAS

Cuadro N' 4.3.16.


Aplicación del método de Newton-Raphson para encontrar
el valor de y para probabilidad de 0.2 [G(Y) =0.2] del ejemplo 4.3.5.

1 Y Error
0 2.600 100.000
1 2.838 8.393
2 2.831 0.260

3 2.831 0.000

Como se observa, el valor de y es 2.831 para la probabilidad de


G(Y)=0.2, por tanto el valor de x se halla mediante la siguiente
ecuación, obtenida de la ecuación (4.3.46.):

x= yB | (vi)

Reemplazando los valores se tiene:


3

2 =yB =2.831x5.1=14.44%—Ss

Entonces para Pix< $ - 0.2 el valor de 2,, =14.44 =,

El resultado para las demás probabilidades que se pide en el ejemplo


se muestra en el siguiente cuadro:

Cuadro N* 4.3.17.
Valores de x según la distribución gamma
(caudales máximos instantáneos anuales del río Santa. Estación: Recreta)

Pp Y xls]
0.2 2.83086 14.44

0.4 4.05064 20.66


0.6 5.29679 27.01
0.8 6.95804 35.49
0.99 12,21352 62.29

4.3.5. Distribución Pearson lll


La función densidad de probabilidades de la distribución Pearson Tipo
IN está definida por la siguiente ecuación:
Estapística Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HIDROLÓGICO)

AX -%0)

)- (ox Je * (3.3.49)
10)
Para:
Xy £x<o;
—0<
Xx, <0o
0<PB<ow
0<a <o

La ecuación (4.3.49.) es conocida también como la distribución


gamma de tres parámetros. La función de distribución acumulada
está dada por la siguiente ecuación:

(xo)

(4.3.50,)
F(x)=P(X < x)= (E

Donde:
X = variable aleatoria
Xp = origen de la variable X, parámetro de posición (valor inicial)
PB = parámetro de escala
a = parámetro de forma
T(a) = función gamma
Si la variable aleatoria X se distribuye según la distribución Pearson
IIL, entonces se representa por:

A X > PII(x,,0.,B) >) (4.3.51,)

En el cuadro N? 4.3.18. y en las figuras N* 4.3.13. y N* 4.3.14. se


muestran los valores y la forma que presenta la distribución Pearson
III para x,=10 y diferentes valores de los parámetros al y B.
ABELARDO M. Díaz SALAS

Cuadro N* 4,3.18.
Valores de la función de densidad del modelo Pearson Ill
para x,=10 (ecuación 4.3.50.)

p=1 a=5
a=2 a=5 a=10 B=1 B=2 a=0.5
10 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000
11 0.36788 0.01533 0.00000 0.01533 0.00079 0.18045
12 0.27067 0.09022 0.00019 0.09022 0.00766 0.39073
13 0.14936 0.16803 0.00270 0.16803 0.02353 0.26771
14 0.07326 0.19537 0.01323 0.19537 0.04511 0.11450
15 0.03369 0.17547 0.03627 0.17547 0.06680 0.03783
16 0.01487 0.13385 0.06884 0.13385 0.08402 0.01062
17 0.00638 0.09123 0.10140 0.09123 0.09441 0.00266
18 0.00268 0.05725 0.12408 0.05725 0.09768 0.00061
19 0.0011 0.03374 0.13176 0.03374 0.09490 0.00013
20 0.00045 0.01892 0.1251 0.01892 0.08773 0.00003
21 0.00018 0.01019 0.10853 0.01019 0.07791 0.00001
22 0.00007 0.00531 0.08736 0.00531 0.06693 0.00000
23 0.00003 0.00269 0.06605 0.00269 0.05591 0.00000
24 0.00001 0.00133 0.04734 0.00133 0.04561 000000
25 0.00000 0.00065 0.03241 0.00065 0.03646 0.00000
26 0.00000 0.00031 0.02131 0.00031 0.02863 0.00000
27 0.00000 0.00014 0.01353 0.00014 0.02213 0.00000
28 0.00000 0.00007 0.00833 0.00007 0.01687 0.00000
29 0.00000 0.00003 0.00498 0.00003 0.01270 0.00000
30 0.00000 0.00001 0.00291 0.00001 0.00946 0.00000

Haciendo cambio de variable se tiene:

y= (6-1) (4.3.52.)
B

de ds (4.3.53.)

Reemplazando las ecuaciones (4.3.52.) y (4.3.53.) en (4.3.49.) se


obtiene:

(4.3.54.,)
EN LA HiproLoGíA (Diseño HIDROLÓGICO)
EsTADÍSTICA Y PROBABILIDAD

f00

0.10

o Pearson III para x= 10,


Figura N* 4.3.13. Función de densidad del model
beta = 1 y diferentes valore de alfa
s

5.60

0,40

0.20

0.00

modelo Person !lI


Figura N* 4.3,14. Función de densidad del
para alfa = 5, X¿=10 y difere ntes valore s de beta

50.) se obtiene la función


Reemplazando (4.3.53.) y (4.3.54.) en (4.3.
ente ecuación:
de distribución acumulada dada por la sigui

(4.3.55.)

a cuya variable tiene origen


La ecuación (4.3.55.) tiene parámetro
eny=00enx= Xq:
ción (4.3.44.), lo cual se
La ecuación (4.3.55.) es igual a la ecua
dos numéricos. La solución
resuelve usando tablas o mediante méto

A numérica de la ecuación (4.3.55.) perm


ite encontrar el valor de Y
ABELARDO MI. Díaz SALAS

para diferentes valores de F(y). Los estimadores de los parámetros


de la distribución Pearson Tipo ll estimados por el método de mo-
mentos son:

x = X, + Ba

( $? = Pa

2
|
C=g==+=
s g la

Donde:
x= promedio de la muestra
s? = variancia de la muestra
gq = coeficiente de sesgo de la muestra
Resolviendo las ecuaciones (4.3.56.), (4.3.57.) y (4.3.58.) se ob-
tiene:

| (4.3.59.)

] (4.3.60.)

| (4.3.61.)

Donde:
g = es obtenida mediante la ecuación (1.3.42.)
Es importante indicar que cuando q < O, f es negativo por lo tanto
no cumple con la condición de la ecuación (4.3.49.).
El valor de x ajustado al modelo de Pearson Tipo III para una
probabilidad determinada se halla mediante la siguiente ecuación
(ecuación obtenida de 4.3.52.):

f X= yB+X, ] (4.3.62.)
EsTapístiCA Y PROBABILIDAD EN LA HibroLOGÍA (Diseño HiDRoLóGico)

Ejemplo 4.3.6.

Bal ista:
Suponiendo que los datos del cuadro N* 3.3.19. se ajustan a la
distribución Pearson III, hallar los caudales para las probabilidades
de 0.20, 0.4, 0.6, 0.8 y 0.9999 = 1.

Cuadro N* 3.3.19.
Descargas máximas instantáneas anuales del río Santa Cruz (m?/s). Estación: Colcas

Año Q Año Q Año Q


1955-1956 18.40 1965-1966 18.70 1975-1976 19.00
1956-1957 14.00 1966-1967 28.50 1976-1977 26.00
1957-1958 13.67 1967-1968 18.70 1977-1978 30.00
1958-1959 14.72 1968-1969 27.20 1978-1979 24.04
1959-1960 14.20 1969-1970 26.40 1979-1980 11.62
1960-1961 22.74 1970-1971 1980-1981 23.53
1961-1962 27.40 1971-1972 1981-1982 13.76
1962-1963 23.40 1972-1973 22.67

Solución
Para hallar los valores de £ mediante la ecuación (4.3.62.) es nece-
sario calcular los valores de y, at, B, x, 9, $ Y Xp. En el presente caso
se asume como datos históricos todos los datos registrados, y no se
han tenido en cuenta los datos faltantes. De los datos muestrales
del cuadro N* 3.3.19. se estiman los siguientes parámetros:

Xx, =26 g = 0.730


LE
ES
xl

N
1

a=75 B=25
No]
E
mn
I

Los valores de y para diferentes probabilidades se obtienen resol-


viendo numéricamente la ecuación (4.3.45.). Para la probabilidad
de 20%, se encuentra el valor de y resolviendo la siguiente igualdad:

oreja
color
Donde:
Gly) = 0.2,0. = 7.5
4
ABELARDO M. Díaz SALAS

Reemplazando estos valores se tiene:

02-41 1ry+ 0) Hoyo +L6) ¿7


6.5!
m9)
(i)
08 rr OOO6.5!OF e 10)

Para resolver este tipo de problemas es recomendable graficar la


ecuación (ii), los resultados se muestran en el cuadro N* 4.3.20. y
figura N* 4.3.15. donde pueden identificar la raíz aproximada de
la ecuación (ii), lo cual se visualiza cuando h(Y) cambia de signo.
La raíz de la ecuación se encuentra cuando h(Y)=0, la solución
numérica se encuentra tomando un valor inicial de Y cuando h(Y)
cambia de signo. Existen diferentes métodos para encontrar las raíces
de una ecuación; en el presente caso se va emplear el método de
Newton-Raphson, expresado mediante la siguiente ecuación (iii):

Yo = Y, _ MY) (iii)

i = iteración

función de Y
2<

h'(Y) = primera derivada de h(Y;)


El resultado se muestra en el cuadro N* 4.3.21.

Cuadro N* 4.3.20,
Valores de h(Y) e y de la distribución Pearson III del ejemplo 4.3.6.
Y O y 100 y HY
0.10 0.200 2.85 0.133 5.60 -0.276
0.35 0.200 3.10 0.109 5.85 -0.318

0.60 0.200 3.35 0.081 6.10 -0.358


0.85 0.200 3.60 0.049 6.35 -0.396
1.10 0.199 3.85 0.014 6.60 -0.432
1.35 0.197 4.10 -0.024 6.85 -0.467
1.60 0.194 4.35 -0.064 7.10 -0.499
1.85 0.189 4.60 -0.105 7.35 -0.530
2.10 0.180 4.85 -0.148 7.60 -0.557
2.35 0.168 5.10 -0.191 7.85 -0.583
2.60 0.153 5.35 -0.234 8.10 -0.607 :
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)

0.30
;
4
A
e.
A :
0.10 4

405 6 7 8 Í
sn a 1 A 3 |
S
5 S A
¿
Al
£
a "
0.30 - A
d

A
-0.50 y -= d

]
-0.70
y |
Figura N? 4,3.15. Gráfica de h(y) para la probabilidad de G(y)=0.2
de la distribución Pearson III del ejemplo 4.3.6.

Cuadro N* 4.3.21.
Valores de X según la distribución Pearson |
para la probabilidad de 0.2 del ejemplo 4.3.6.
i Y, Error
0 3.850 100.000 :
3.948 2.480 ó
1
2 3.947 0.035
— 3 3.947 0.000

Como se observa, el valor de Y es 3.947 para la probabilidad de


G(Y)=0.2, por tanto el valor de x se halla mediante la siguiente
ecuación (ver ecuación 4.3.62.)

x=YB +% )) (iv)

pompa los valores se tiene:


= YB+x, =3.947*2.5+2.6= 12.47

El resultado para las demás probabilidades que se pide en el ejemplo


4.3.6. se muestra en siguiente cuadro:
ABELARDO MI. Díaz SALAS

. Cuadro N* 4.3.22,
Valores de X según la distribución Pearson l1l
(caudales máximos instantáneos anuales del río Santa Cruz. Estación: Colcas)

P Y Xt?/s)
0.2 3.94656 12.45
0.4 5.1541 15.47
0.6 6.37783 18.53
0.8 8.02543 22.66
0.99 13.35079 35.98

4.3.6. Distribución de Gumbel


El modelo para los valores extremos (máximos o mínimos) es de tres
tipos, según Chow et.al [5] ha sido desarrollado por Fisher y Tippett
(1928), quienes lo clasificaron en tres formas: distribución de valor
extremo llamadas tipo 1, II y III. Gumbel (1941) desarrolló con mayor
detalle las propiedades de la distribución de Valor Extremo Tipo l,
por esta razón este tipo de distribución lleva su nombre.
La distribución de Gumbel, como se ha indicado, es la distribución
de Valor Extremo Tipo 1. La función de densidad se expresa mate-
máticamente por:

r(x)= 1 ] (4.3.63,)

| 1)= Paro | (4.3.64,)

Donde:
x = Variable aleatoria

a,P = parámetro de la distribución de valores extremos Tipolo doble-


mente exponencial.
0 EX <00

O<a<ow = parámetro de escala


—o<pP<o = parámetro de posición, llamado como moda.
En el cuadro N* 4.3.23. y en las figuras N* 4.3.16. y N* 4.3.17. se
muestran los valores y la forma que presenta la distribución Gumbel
(ecuación 4.3.64.) para diferentes valores de los parámetros a y PB.
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HipRoLóGIcO)

Haciendo cambio de variable se tiene:

w= B (4.2.65,)
ol

P dx=adw ) (4.2.66.)

f(w)= Lo” (4.2.67,)


al

Cuadro N* 4.3.23.
Valores de la función de densidad del modelo Gumbel

P=3 d=2
x
a=25 a=15 P=3.: B=1L5 B=5
02
0.00183 0.00000 0.00003 0.00912 0.00000
-2.0 0.00003
0.00571 0.00000 0.00036 0.02536 0.00000
-1.5 0.00036
0.01399 0.00001 0.00228 0.05322 0.00003
-1.0 0.00228
0.02812 0.00023 0.00912 0.08969 0.00036
-0.5 0.00912
0.04801 0.00304 0.02536 0.12744 0.00228
0.0 0.02536
0.07175 0.01772 0.05322 0,15853 0.00912
0.5 0.05322
0,09616 0.05694 0.08969 0.17779 0.02536
1.0 0.08969
0.11785 0.11959 0.12744 0.18395 0.05322
1.5 0.12744
0.13425 0.18517 0.15853 0.17872 0.08969
20 0.15853
0.14404 0.23045 0.17779 0.16536 0.12744
2.3 0.17779
0.14716 0.24526 0.18395 0.14727 0.15853
3.0 0.18395
0.14443 0.23333 0.17872 0.12733 0.17779
3.5 0.17872
0.13716 0.20484 0.16536 0.10757 0.18395
4.0 -0.16536
0.12681 0,16977 0.14727 0.08926 0.17872
4.5 0.14727
0.11468 0,13502 0.12733 0.07303 0.16536
5.0 0.12733
0.10186 0.10425 0.10757 0.05911 0.14727
5.5 0.10757
0.07881 0.08926 0.04743 0.12733
6.0 0.08926 0.08915
0.07709 0.05868 0.07303 0.03781 0.10757
6.5 0.07303
0.06600 0.04322 0.05911 0.02999 0.08926
7.0 0.05911
0.03158 0.04743 0.02369 0.07303
7.3 0.04743 0.05605
0.04729 0.02295 0.03781 0.01865 0.05911
8.0 0.03781
0.01661 0.02999 0.01465 0.04743
8.5 0.02999 0.03968
0.03314 0.01199 0.02369 0.01149 0.03781
9.0 0.02369
0.02759 0.00864 0.01865 0.00899 0.02999
9.5 0.01865
0.00621 0.01465 0.00703 0.02369
10.0 0.01465 0.02289
0.01895 0.00446 0.01149 0.00549 0.01865
10.5 0.01149
0.01566 0.00320 0.00899 0.00429 0.01465
11.0 0.00899
0.00230 0.00703 0.00335 | 0.01 149
11.5 0.00703 0.01291
AbetLarDO MI. Díaz Satas

s B=3 a=2
a=2 a=25 a=1.5 B=3 B=1,5 B=5
12.0 0.00549 0.01064 0.00165 0.00549 0.00261 0.00899
12.5 0.00429 0.00875 0.00118 0.00429 0.00204 0.00703
13.0 0.00335 0.00719 0.00085 0.00335 0.00159 0.00549
13.5 0.00261 0.00591 0.00061 0.00261 0.00124 0.00429
14.0 0.00204 0.00485 0.00044 0.00204 0.00096 0.00335
14,5 0.00159 0.00398 0.00031 0.00159 0.00075 0.00003
15.0 0.001 24 0.00327 0.00022 0.00124 0.00058 0.00003

0,30 :

0.20 >
| —e—ALFA=2
E 0.15 7 | | —=—ALFA=25
0.10 | [—e—ALFA=1.5|

0.05 4
0.00 A
4 A 0 E 4 6 g 10 12 14 16

Xx

Figura N* 4.3.16. Función de densidad del modelo de Gumbel


para beta=3 y diferentes valores de alfa

0.20

0.15 -

—6—BETAS3
——BETA=1.5
0410 - —a—BETASS

0.05 +

0.00 sl
-4 14 16
x

Figura N? 4,3.17. Función de densidad del modelo de Gumbel


para alfa =2 y diferentes valores de beta
Estapística y ProsasiuDaD En La HibroLoGÍA (Diseño HIDROLÓGICO)

La función de distribución acumulada se obtiene integrando la


ecuación (4.3.67.)

Ñ F(w)=P(X <x)= [(Ua)e"Todw=f 2" dw i (4.3.68)

Hallando e" dw=e""e"dw

de” = “done eden) "e radw)=e e" dw | (4.3.69)

- De la ecuación (4.3.69.) se tiene:


.
|
| Eo de 7 (4.3.70.)
dw

Reemplazando (4.3.70.) en (4.3.68.) se tiene:

o F(w)=P(X <x)= [0 dw= f a o de dw= | a sen (4.3.71,)


s

Resolviendo (4.3.71.) se obtiene:

| F(w)=P(X < x)= fdo” =e " =e” (4.3.72.)

Los estimadores para los parámetros de la distribución de Gumbel


obtenidos mediante el método de momentos son:

B = Xx -0.450, (4.3.73.)

( a =-0,7806, (4.3.74,)

Donde:
z = promedio de la muestra
o, = desviación estándar de la muestra

188
'ABELARDO MI. Díaz SaLas

El valor de x ajustado al modelo de Gumbel para una probabilidad


determinada se halla mediante la siguiente ecuación (ecuación
obtenida de 4.3.65.):

=B+aw ) (4.3.75.)

>>
Ejemplo 4.3.7.
Suponiendo que los datos del cuadro N* 1.1.1. se ajustan a la dis-
tribución de Gumbel, hallar los caudales para las probabilidades de
0.20, 0.4, 0.6, 0.8 y 0.9999 = 1.

Descargas máximas instantáneas anuales del río Querococha (m?/s)

Año Q Año a... Aña Q


1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72

1955-1956 6.50 1965-1966 6.52 1975-1976 10.21


1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
1962-1963 7.56 1972-1973 5.80

Solución
Para hallar los valores de kx mediante la ecuación (4,3.75.) es n e-

cesario calcular los valores de w, a y fi, de los datos muestrales 08


cuadro N* 1.1. Se estiman los siguientes parámetros:

[=z68 | o, -179 | B=687 | a-=140|

Los valores de w para diferentes probabilidades se obtienen re-


solviendo la ecuación (4.3.75.). Para la probabilidad de 20% se
encuentra el valor de Y resolviendo la siguiente igualdad:

w=-Ln(- Ln(F(w)=-Ln(- Ln(0.2)=-0.47588 | (i


EstapísTica Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HIDROLÓGICO)
j

Como se observa, el valor de w es -0.47588 para la probabilidad


de Eíw)=0.2, por tanto el valor de ; se halla mediante la siguiente
ecuación (obtenida de 4.3.75.).

( x=P+aw 2) (1)

Reemplazando los valores se tiene:


621m"
q

£ =$ +00 =6.87+1.40x(-0.47588) = Ss

El resultado para las demás probabilidades del ejemplo se muestra


en siguiente cuadro:

Cuadro N* 4.3.24,
Gumbel
Valores de x según la distribución
(caudales máximos instantáneos anuales del río Querococha)
P W aa del
0.2 -0.47588 6.21
0.4 0.08742 7.00
0.6 | 0.67173 7.81
0.8 1.49994 8.97 E
0.999 6.90726 16.51
CAPÍTULO

V
Estimación de los parámetros de las distribuciones

5.1. Generalidades
Como se ha indicado en el capítulo IV, la interpretación del compor-
tamiento de las variables aleatorias se realiza mediante los modelos o
distribuciones de probabilidad. En la hidrología es necesario definir un
modelo probabilístico adecuado para un conjunto de datos (muestra)
y para definir el modelo adecuado se estiman el o los parámetros del
modelo (distribuciones). En el presente capítulo se estudia los métodos
de estimación de parámetros de las distribuciones de probabilidad y en
el capítulo VI se estudia los métodos que permiten definir el modelo o
modelos adecuados para un conjunto de datos.
Los parámetros caracterizan a la población, son valores únicos y ge-
neralmente éstos son desconocidos; es decir, no se pueden calcular
directamente. Por tanto, cualquier valor del estadístico (calculado desde
la muestra) es denominado un estimado o estimador de los paráme-
tros poblacionales. Para la estimación de los parámetros del modelo
probabilístico se requieren datos muestrales, de los cuales se hallan los
estadísticos; por ejemplo, si se desea probar si la distribución normal es
adecuada para un conjunto de datos, se deben estimar los parametros y
y e? con los estimadores x y s? de la muestra.
Los métodos para la estimación de parámetros de las distribuciones de
probabilidades son: método de momentos y el método de máxima ve-
rosimilitud.

5.2.Método de momentos
Este método está basado en la consideración de que los momentos de la
muestra (datos) son buenos estimadores de los momentos de la población.
Estabística Y PROBABILIDAD EN La HibroLoGÍA (Diseño HIDROLÓGICO)

Como se ha indicado, el comportamiento casuístico de la población se


explica mediante los modelos de probabilidad que son la función masa
de probabilidad o función de densidad de probabilidades. El cálculo de
los momentos de la muestra se ha tratado en el capítulo l y en el capítulo
III se ha tratado del cálculo de los momentos de una distribución (pobla-
ción). Las ecuaciones que permiten estimar los parámetros son:

+ Elprimer momento o la esperanza matemática con respecto al origen


de coordenadas tanto de la muestra como de la población deben
ser iguales; es decir, matemáticamente se tienen:
1. Para el caso de distribuciones discretas

x=, Dx == (o) | 5.1)

2. Para el caso de distribuciones continuas

(5.2)
1

=-Y'x, =4= [| xf(x)d


| E
+ Elsegundo momento o la esperanza matemática con respecto a la
media tanto de la muestra como de la población deben ser iguales;
es decir, matemáticamente se tienen:

1. Para el caso de distribuciones discretas

eE ll) | (65.3)

2. Para el caso de distribuciones continuas

e. E e ella) lA | (5.4)

* El coeficiente de asimetría de la muestra y de la población deben


ser iguales; es decir, matemáticamente se tienen:
1. Para el caso de distribuciones discretas

g=
Ai=l ==y=
O -
AS
poa
a - Da -2)s? o” o?
ABELARDO M.. Díaz SALas

2. Para el caso de distribuciones continuas

a - ElG-)] 6-1) r69ax 5.6,


a o o

+ El coeficiente de curtosis de la muestra y de la población deben ser


iguales; es decir, matemáticamente se tienen:

1. Para el caso de distribuciones discretas

2-1 ¿leo cd
C, = S _ (5.7,)
(Da - 2) 3)s* o o

2. Para el caso de distribuciones continuas

O - ve) E O AO: (5.8)


* (Do —2Xn —3)5* o? o*

El número de parámetros a estimar por el método de momentos depen-


de del número de parámetros del modelo probabilístico; es decir, para
estimar los parámetros se forma un sistema de ecuaciones igualando
los momentos del modelo probabilístico respectivo con los estimadores
calculados de la muestra. El número de ecuaciones es igual al número
de parámetros del modelo.
Ejemplo 5.1.
La función de densidad de la distribución exponencial está dada por la
siguiente ecuación (ver ecuación N* 4,3.33.)
de" x>0
F()=> l x<0

Estimar el parámetro A, mediante el método de momentos.


Solución
Como esta distribución tiene un solo parámetro A, se formará una sola
ecuación, que relaciona el primer momento de la muestra con el primer
momento de la distribución (población). El primer momento con respecto
al origen de coordenadas está dada por la ecuación (5.2.).

Y
HIDROLÓGICO)
Estapística Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño

u=X = E(x)= [pr6)Jax= [xro dx (m

x= [xhe "dx =- [re aErx) (0

integrar por partes


Haciendo cambio de variables en la ecuación (ii) para
se tiene:

dv=e*dlarx)o v=e* (iv)

Reemplazando (iii) y (iv) en (11) se tiene:

Resolviendo —uv y [ vdu se obtiene:

(vi)

e14 Las [e
EN ]-
Fvdu= [e peratr
(vil)
lbs LL Im 22
E + dz

Reemplazando (vi) y (vii) en (v) se tiene:

(viii)

5.3. Método de máxima verosimilitud


métodos para estimar
Según algunos autores, es uno de los mejores
el método de máxima
el parámetro puntual, por esta razón se le llama

EEE credibilidad o de máxima verosimilitud.


ABELARDO M. Díaz SALas

Caso de distribuciones continuas


La función de densidad de probabilidades como se ha indicado en
el capítulo IV se expresa en función de sus parámetros, como por
ejemplo en el caso de la distribución normal la función de densidad
de probabilidades se expresa como f(x) = fl u,o).
Para generalizar esta propiedad, se supone que el espacio muestral
se divide en intervalos de igual tamaño dx y del espacio muestral
se recopilan muestras independientes (evento independiente) e
idénticamente distribuidos y que dichas muestras sean: Xp Xo30,X,
(valores observados).
El valor de la función de densidad de probabilidades para cada X=
x, es f(x,), de manera general se tendrá:

F()=F(,0.B,Y....)
Fe2)= Hno, Bot...) (5.9)

tdsiabo.s

Para una variable aleatoria continua se tiene:

MN f(x, )=F(x,,0,B,7,...) 2) (5.10)

Donde:

a, PB, y,... = parámetros desconocidos del modelo probabilístico


La probabilidad de que cada variable aleatoria x, ocurra es el área
del elemento diferencial dx que está dada por:

o F(x,,a,B,...)= f(x,,a,P,...)dx o (5.11,)

Las variables hidrológicas son consideradas como variables alea-


torias independientes e idénticamente distribuidos; por tanto, la
probabilidad conjunta está dada por la ecuación (2.22.), es decir,
la probabilidad conjunta viene a ser:

f(x, ,0,f,... Jaxf(x,,a,P,... Jdx o] (5.12,


i=l

E
EstapísTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HibROLÓGICO)

Fisher al desarrollar el método de máxima verosimilitud indica que


el mejor valor de un parámetro de una distribución debería ser el
valor que maximice la probabilidad conjunta.
En la ecuación (5.12.) se observa que el tamaño de dx es constante,
al maximizar esta ecuación es equivalente a maximizar la siguiente
función:

L=]]£G,,0,B....) (5.13)
i=l

A L se le conoce con el nombre de función de verosimilitud.


En el capítulo IV se observa que las funciones de densidad de pro-
babilidades de las distribuciones continuas son exponenciales, por lo
tanto, es conveniente logaritmizar la función de verosimilitud, como E
se indica a continuación: h

| m0) [16 .0up...)) Eli. of. 614)

Los parámetros de la distribución de probabilidades se estiman


maximizando la ecuación (5.14.), el valor máximo de la función de
verosimilitud se obtiene tomando la derivada parcial de la ecuación
(5.14.) con respecto a cada parámetro e igualando a cero (porque
el valor máximo de la función de verosimilitud se halla cuando la
pendiente de la función es cero).
La derivada parcial de In(L) con respecto al parámetro es:

a (n(L)=0

gn) 615
oy (0

2. Caso de distribuciones discretas


Sean Xy,Xy:.»»X, lOS valores observados en una muestra aleatoria
de tamaño n, entonces la función masa de probabilidad para cada
x=x, es p(xx) por consiguiente, de manera general se tendrá: e
ABELARDO M. Díaz SALAS

px, )=p(K,,a,B,y,...)
p(x,)= p(x,,a,P,y,... )
(5.16,)

p(x,)= p(x,,0,B,Y,...)

Para una variable aleatoria discreta se tiene:

[ plx,)=plx,.0.8.1..) J um
Donde:
a, B, y,... = parámetros desconocidos del modelo probabilístico.
La probabilidad de que cada variable aleatoria x, ocurra es:

P(x,,0,B,... )= p(x =x,,0,P,... ) ) (5.18.)

Como en el caso de las variables aleatorias continuas la probabilidad


conjunta de la variable aleatoria discreta está dada por la ecuación
(2.22.), es decir la probabilidad conjunta está dada por la siguiente
ecuación:

9 a ts 6519)

Entonces la función de verosimilitud es:

| L=[To(.00f,..) | (5.20.)

Mediante el criterio de Fisher se debe maximizar la función de ve-


rosimilitud. Maximizar la ecuación (5.20.) es igual que maximizar el
logaritmo de L porque se simplifican las operaciones matemáticas;
por consiguiente, los parámetros de una distribución discreta se
estiman mediante la ecuación (5.15.) aplicada a la ecuación (5.20.).
ESTADÍSTICA Y PROBABILIDAD EN LA HiproLoGíA (Diseño HIDROLÓGICO)

Ejemplo 5.2.
La función de densidad de la distribución exponencial está dada
por la siguiente ecuación (ver ecuación N? 4.3.33.).

1x0
M)= l x<0

Estimar el parámetro 1 mediante el método máxima verosimilitud.


Solución
En este caso la función de densidad de probabilidad tiene un solo
parámetro que es A, según la ecuación (5.13.) la función de verosi-
militud es:

| L=[]16,2) 7 0

Según la ecuación (5.14.) se tiene:

In(L)= "(1 2e > ] = Y info” )


i=l i=l

n(1)- Y lima+ me?) = Y fimo. -2x, Ine]= Y lina 2]


i=l i=l is]

El valor máximo de la ecuación (iii) o el valor máximo del logaritmo


natural de la función de verosimilitud se halla mediante la ecuación
(5.15.), en este caso aplicando la derivada parcial con respecto al
único parámetro que es A se tiene.

2 n4)=22(En- »x, ))- 0


(iv)

ÓnL)> a (m2.-Ax, ) E Es 0
ABELARDO MI. Díaz SALAS

De la ecuación (iv) se tiene:

(vi)

Z x (vii)

Este valor de A es el mismo que se halló mediante el método de


momentos.
Ejemplo 5.3.
Suponiendo que los datos del cuadro N? 1.1.1. se ajustan a la dis-
tribución exponencial, hallar el parámetro A y graficar el logaritmo
natural de la función de máxima verosimilitud.

Descargas máximas instantáneas anuales del río Querococha (m/s)

Año Q Año Q Año Q


1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
1958-1959 6.26 "1968-1969 3.98 1978-1979 8.96
1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
1962-1963 7.56 1972-1973 5.80
EstabísTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)

Solución
Del capítulo 1 se tiene:
z = 7.68 m/s (ver ejemplo 1.4.), n=29. Por tanto, se tiene:
= 0.13 s/m' (ver la ecuación viii del ejemplo 5.1. o la ecua-
1
A = ——— —

7.68 m/s

ción vii del ejemplo 5.2.)


La función In(L) se obtiene de la ecuación (i11) del ejemplo 5.1.:

In(L)= Yin -1x,]= nin(A)- Ax

Reemplazando valores se obtiene:

Y xi =29*7.68 = 222.72 mís


i=1

Cuadro N* 5.1.
Logaritmo de la función de verosimilitud del ejemplo 5.3.

A Int)
0.01 -135.78
0.02 -116.71

0.03 -106.95

0.04 -100.83
0.05 -96.67 a]
0.07 -92.71
0.10 -89.05
0.13 -88.12
0.20 -90.99

0.29 -99.88
0.40 -115.66

0.50 -131.46
0.60 -148.45
0.70 -166.25
0.80 -184.65
AseLarDO M. Díaz SALAS

0
¿po 0.10 0.20 9.30 0.40 0.50 0.60 0.70 0.80 o.po

40
60 0,13, -89.12

80
InL)

-100
-120
140
-160
-180
-200
Landa (s/mB)

Figura N? 5,1. Logaritmo de la función de verosimilitud del ejemplo 5.3.

Reemplazando n=29 y ii en 1 se obtiene:

In(L) = 29InW) - 222.724 y (ii)

Los valores de In(L) y la gráfica respectiva se muestran en el cuadro


y figura nterior:
En el cuadro y en la figura anterior se muestra la función del logaritmo
de verosimilitud, según los diferentes valores de A, con un valor máxi-
mo de 2=0.13 s/m?. Este valor coincide con los resultados analíticos
encontrados, en los ejemplos 5.1. y 5.2.
Ejemplo N? 5.4.
La función masa de probabilidad de la distribución geométrica está
dada por la siguiente ecuación:
a(x,p) = p(1 - p) para x = 1,2,...
Estimar el parámetro p mediante el método de máxima verosimilitud.
Solución
La función masa de probabilidad tiene un solo parámetro p, siendo
la función de verosimilitud (ver ecuación 5.20.).

L=pÚ-p
y pú—p) 7. pp) =] Ip6=0)" =P pee 6)
EsTADÍSTICA Y PROBABILIDAD EN La HIDROLOGÍA (DISEÑO HibroLóGico)

Según la ecuación (5.14.) se tiene:

in(L)= wa TI p(- y = Bb (pee >| = Inf" )ená-p E

In(L)= n In(p)+ Y G, - 1iná a p)= n in(p)+ Y (, =- 1)inG - p)


i=1

In(L)=nin(p)+ (Ex -n Jue -p)

Aplicando los criterios de la ecuación (5.15.) a la ecuación (ii) se


tiene:

20) Ze mo) (E a) -») -0


00) =0 )Etnt=»)=0
100). Leto)

lie

(111)

Nota: el promedio o la esperanza de una distribución geométrica


es 1/p. Si p es la probabilidad de que un evento hidrológico sez
superado o igualado, la esperanza matemática de esta distribució-.
es T - x, que es el período de retorno, lo cual se estudia con más
detalle en el capítulo VII
CAPÍTULO

VI
Selección del modelo probabilístico adecuado

6.1.Generalidades
La aplicación de la estadística y de las leyes de las
distribuciones, es-
pecialmente en el caso de eventos extremos, consiste
en buscar el o los
modelos probabilísticos adecuados para un conjunto
de datos (muestra).
Para seleccionar el modelo o los modelos de distri
bución adecuado
para la muestra primeramente es necesario asumir cualqu
iera de las
distribuciones que se ha estudiado en el capítulo IV,
luego se estiman
los parámetros del modelo. Con los parámetros del
modelo se estiman
los valores de la variable aleatoria ajustados al model
o para una de-
terminada probabilidad. Los valores ajustados al
modelo sirven para
hacer la selección del modelo adecuado mediante los métod
os: gráficos
y estadísticos.

6.2.Método gráfico
En el ajuste gráfico se comparan las gráficas de las funcio
nes de densidad
de probabilidad o las gráficas de las funciones de probabilidad
acumu-
lada de la distribución y de los datos (muestra). Es decir,
se compara las
gráficas de curvas teóricas y las gráficas empíricas (obten
idas de datos).
En este caso la bondad de ajuste es visual.

6.2.1. Comparación gráfica de las funciones de densidad de


probabilidad
Consiste en comparar las gráficas de la función de densidad
empírica
obtenida mediante la ecuación (1.3.14.) y la función de
densidad
teórica proveniente de la distribución que se ha escogido para
probar
el ajuste.

E
EsTAbísTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HiDrRoLÓGICO)

Ejemplo 6.1.
Probar gráficamente si los datos del cuadro N? 1.3.5. se ajustan a
la distribución normal o a la distribución exponencial.

Tabla de frecuencias de las descargas máximas instantáneas anuales (m/s)


del río Querococha. Estación de Querococha

Intervalo Marca de | Frecuencia | Frecuencia a Relativa cin a


K
de clase clase absoluta relativa acumulada a
acumulada empírica
(m tm (5) mm
2) a) (6) a
4.661 3 0.103 3 0.103 0.076
1 3.980-5.341
6.022 7 0.241 10 0.345 0.177
Z 5.341-6.702
7.383 7 0.241 17 0.586 0.177
3 6.702-8.063
8.744 8 0.276 25 0.862 0.203
4 8.063-9,424
10.105 4 0.138 29 1.000 0.101
5 9.424-10.785
Total 29 1.00

Solución
La comprobación se efectuará graficando la función de densidad
empírica y la función de densidad de la distribución normal y de la
distribución exponencial.
a. Función de densidad empírica
La función de densidad empírica se muestra en la columna
8 del cuadro N* 1.3.5. y en la figura N* 1.3.7. La función de
densidad empírica se muestra en el cuadro N? 6.1. (columna
2) y en la figura N? 6.1.
b. Eunción de densidad de la distribución normal
Los valores de la función de densidad teórica de la distribución
normal se obtienen de la siguiente ecuación (ver ecuación 4.3.1.):

F()= e
al =0<x<00 ¡
(1)
210

Los parámetros u y o se obtienen mediante el método de


momentos o el método de máxima verosimilitud. Aplicando
cualquiera de los métodos se obtiene:

12 .
x=)x, =1=7.68 m's. (ver ejemplo 1.4.) (i)
n del
ABELARDO MI. Díaz SALAS

3 2
LS a =x) =0=1.79 m/s. (ver ejemplo 1.7.) (110
n-1%

Reemplazando (ii) y (iii) en (1) se obtiene:

1 pe :
e) AIR, 0 <X<oo (iv)

Los valores de f(x) de obtienen reemplazando los valores de x,


como por ejemplo para la marca de clase x=3.30 se tiene:
1 3.30--7.68

= —_—1 —e A
A > ) =0.011
7) 1.79x/2x3.1416

El valor de 3.30 tiene frecuencia relativa cero (frecuencia em-


pírica), según la metodología establecida en la construcción del
polígono de frecuencias, lo cual se pude verificar en la figura
N* 1.3.5.
Las demás densidades de probabilidad (teórica) de la distribu-
ción normal se obtienen siguiendo el mismo procedimiento, los
valores de la función de densidad empírica y de la función de
densidad normal de los datos (muestra) del río Querococha se
muestran en el cuadro N* 6.1. (columna 3) y figura N* 6.1.
La función de densidad de la distribución exponencial
Los valores de la función de densidad teórica de la distribución
exponencial se obtienen de la siguiente ecuación (ver ecuación
4.3.33.):

26,20
Ñ M)= ( x<0 7 de

El parámetro 4 se obtiene utilizando el método de momentos o


el método de máxima verosimilitud (ver ejemplos 5.1. 6 5.2.)
>
su valor es:
EsrabísTiCA Y PROBABILIDAD EN La HIDROLOGÍA (Diseño HiDroLósico)

Reemplazando (vi) en (v) se obtiene:

t(x)= 0,13e
—0.13x >
xXx20 (vid
0 ,x<0

Al igual que la distribución normal se calcula la función de den-


sidad de la distribución exponencial, para diferentes valores de
x, en este caso para el x=3.30 (marca de clase con frecuencia
cero).
De la ecuación (vii) se tiene:
F(x)=0.130%P* =0.13x2.718281 9% =0.085

Para el cálculo de las demás funciones de densidad de la dis-


tribución exponencial se sigue el mismo procedimiento.
Los valores de la función de densidad exponencial de los datos
(muestra) del río Querococha se muestran en el cuadro N* 6.1.
(columna 4) y figura N? 6.1.

Cuadro N'? 6.1.


Funciones de densidad: empírica, distribución normal y distribución exponencial
de las descargas máximas instantáneas anuales del río Querococha

Descargas máximas Función de Función de densidad | Función de densidad


instantáneas anuales densidad de la distribución dela distribución
del río Querococha empírica normal exponencial
9 (1) a) (3) 4)
3.30 0 0.011 0.085

0.076 0.054 0.071


4.66
0.177 0.145 0.059
6.02

7.38 0.177 0.220 0.050

8.74 0.203 0.187 0.042

10,10 0.101 0.089 0.035

0.000 0.024 0.029 A


11.46

la ecuación iv,
(1) Marca de clase, (2) Columna 8 del cuadro 1.3.5., (3) Obtenida con
(4) Obtenida con la ecuación vii
ABELARDO MI. Díaz SALAS

0.25

0.2 q
FUNCIONES DE DENSIDAD
=
a
a

—— (BEMPIRICO
—o—f(09 NORMAL
—2— 109 EXPONENCIAL
o

0.05

D 2 4 6 8 10 12
DESCARGA (M3/5)

Figura N9 6.1. Función de densidad: empírica, distribución normal


y distribución exponencial del río Querococha

Del gráfico N* 6.1. se concluye que el modelo adecuado es la


distribución normal.
Nota: para definir el modelo adecuado para el conjunto de
datos, se debe hacer la gráfica para varios modelos.

NS 6.2.2. Comparación gráfica de las funciones de probabilidad


acumulada
Se comparan las gráficas de la probabilidad acumulada empírica
y teórica, la probabilidad acumulada empírica se calcula mediante
la fórmula de Weibull y la probabilidad acumulada teórica se cal-
cula según el modelo escogido para realizar el ajuste. Es necesario
graficar varios modelos para poder tomar la decisión, las gráficas
se pueden hacer en papel aritmético (milimétrico) o con ayuda de
hojas de cálculo (Excel) o en papel de probabilidades. Usando el
papel de probabilidades se define como modelo adecuado cuando
los puntos ploteados (graficados) tienden a una recta, en caso de
usar el papel milimetrado se define como modelo adecuado aquel
modelo que se acerca más a la distribución acumulada empírica.
i. Gráfica de la probabilidad acumulada empírica
La probabilidad empírica acumulada se calcula mediante la
fórmula empírica de Wiebull, cuya expresión matemática es:

P(x2x)= =P) (6.1)

Mo”
ICO)
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HiproLÓG

Donde:
m= número de orden de los datos ordenados en forma des-
cendente
n = número total de datos de la muestra
En el eje de la abscisa se ubican los valores de la variable hidro-
lógica y en el eje de la ordenada la probabilidad empírica.
il Gráfica de la probabilidad acumulada teórica
a distri-
La probabilidad acumulada teórica de una determinad
sea iguala da o supera da
bución en que la variable hidrológica
se calcula mediante la siguiente ecuación:

P(x>x)=1-P(X <x)=1- [fax =1-F(x)= G(x) (6.2)

e
La probabilidad acumulada para cada valor de la variabl
de cada
aleatoria se obtiene resolviendo las ecuaciones de F(x)
distribución de probabilidad.
Ejemplo 6.2.
Probar gráficamente usando las probabilidades acumuladas
ución
si los datos del cuadro N* 1.3.4. se ajustan a la distrib
normal o a la distribución exponencial.

Descargas máximas instantáneas anuales del río Querococha


ordenadas en forma ascendente (m/s)
489 | 493 6.39
10.78 | |
897 | 91 | 98 [9 | 987 10.2

Solución
acu-
La comprobación se efectúa graficando la probabilidad
acumu lada teóric a de la
mulada empírica y la probabilidad
distribución normal y de la distribución exponencial.
a. Probabilidad acumulada empírica
La probabilidad acumulada empírica se obtiene mediante
la fórmula de Weibull (ecuación 6.1.).
y la figura
Los resultados se muestran en el cuadro N? 6.2.
N? 6.2. La probabilidad para 10.78 m'/s es:
ABELARDO M. Díaz SaLas

P(Q>10.78 m/s)= 6 = 0.033

Las otras probabilidades empíricas se obtienen con el


mismo criterio establecido en la ecuación (1).
b. Probabilidad acumulada teórica de la distribución nor-
mal
Los valores de la probabilidad acumulada de la distribución
normal se obtienen mediante las siguientes ecuaciones (ver
ecuaciones: 4.3.8., 4,3.9, y 4.3.10.):

B= > [ +0.196854|7] +0.115194/21? +0.000344[2]' + 0.019577/2* ]* (ii)

Fiz) = Bparaz< 0 (111)

F(Z) = 1-B paraz>0 iy)

Los valores de z se obtienen de la siguiente ecuación (ver


ecuación 4.3,4.):

Los parámetros 1 y o se obtienen utilizando el método de


momentos o el método de máxima verosimilitud, aplican-
do cualquiera de los métodos se obtiene:

X= eN Xx, =4=7.68 m/s (ver ejemplo 1.4.) (vi)


n=

m 2
s= LS - x) =0=1.79 m/s (ver ejemplo 1.7.) (vii)
n-1%
EsTApDísTICA Y PROBABILIDAD EN LA HiDROLOGÍA (DIseÑO HioroLóaico)

Reemplazando (vi) y (vii) en (v) se obtiene:

XX se
z= ] (vili)
Ss

Cuando z> 0

El valor de z para q=10.78 es:


10,787.68 =1.732
1.79
De la ecuación (ii) se obtiene:

1+0.196854/1.732] + 0.1 15194)1.732/' e (1x0)


Ñ a = 0.041
0.000344|1.732]* +0.019527/1.732|

c
De la ecuación (iv) se obtiene:

Fíz) = 1-B para (z = 1.732)20 ] 0)

Remplazando (ix) en (x) se obtiene:

( F(2)=1-B =P(Q<10.78 m/s) =1-B=1-0.041=0.959 ] (xi)

Entonces la probabilidad de ser igualado o superado


es:

G(x)=P(Q > 4)=1-P(Q<q)=1-B ] oxi)

Reemplazando valores de caudal y la ecuación (xi)


en (xii) se obtiene:
G(x)= P(Q>10.78 m/s) =1-P(Q<10.78 m'/s) =1-0.959 =0.041
Para las demás probabilidades, se debe seguir el
mismo procedimiento, para z > 0.
Cuando z < 0
El valor de z para q=3.98 m/s es:

3.98 — 7.68
qa A =-2.0676
1.79
AseLarDO M. Díaz SALAS

De la ecuación (ii) se obtiene:

1) 1+0.196854|- 2.0676) +0.115194|- 2.0676)" + 7 o


B=-= . a =0.981 (x111)
2| 0.000344|- 2.0676] + 0.019527|-2.0676|

( Fiz) =B para [z = -2.0676)<0 ] (xiv)

Remplazando (xiii) en (xiv) se obtiene:

[ F(2)=B = P(Q<3.98 m/s) =0.981 ] 0)

Entonces la probabilidad de ser igualado o superado es:

G(x)= P(Q > q)=1-P(Q<q)=1-B ] (xvi)

Reemplazando valores de caudal y la ecuación (xv)


en (xvi) se obtiene:
G(x)=P(Q> 3.98 m'/s )=1-P(Q<3.98 m'/s) =1 0.981 = 0.019
Para las demás probabilidades, se debe seguir el
mismo procedimiento, para z < O.
Los valores de la probabilidad acumulada teórica de
la distribución normal correspondientes a los datos
(muestra) del río Querococha se muestran en el cua-
dro N* 6.2. (columna 5) y figura N* 6.2.
c. Probabilidad acumulada de la distribución exponencial
Los valores de la probabilidad acumulada teórica de la
distribución exponencial se obtienen mediante la siguiente
ecuación (ver ecuación 4.3.35.):

P(X < x)=F(x)= [de “dx =1-e** | (xvii)

El parámetro A se obtiene utilizando el método de momen-


tos o el método de máxima verosimilitud (ver ejemplos
5.1. 6 5.2.) su valor es:

r=lXx 1
7.68 m/s
-0138/m Oi)
EsrapísticA Y PROBABILIDAD en La HioroLoGía (Diseño HibroLÓGICO)

Reemplazando (xviii) en (xvii) se obtiene:

P(X<x)=F(x)= [0.130 Pax =10 0% (xix)

De la ecuación (xix) para q = 10.78 m'/s se tiene:

| P(O<10.78 m/s.) =1-2.718281 09% = 0.754 ] boo)

Luego generalizando se tiene:

Ml G(x)=P(Q > q)=1-P(Q<q)=1-l-e” he” ]) (xxi)

Reemplazando los valores de caudal y A en (xxi) se tiene:


G(x)=P(Q>10.78 ms.) =1-PÍQ<10.78 m'/s) =2.71828195"0% = 0.246
Las demás probabilidades se han calculado siguiendo el
mismo procedimiento.
Los valores de la probabilidad acumulada de la distribución
exponencial para los datos (muestra) del río Querococha
se muestran en el cuadro N* 6.2. (columna 6) y figura
N? 6.2.
De la figura N? 6.2. se concluye que el modelo normal es
el modelo adecuado para los datos del río Querococha.

1.20

100 4
PROBABILIDAD MAYOR G(x)

— e FOJEMPIRICO:
0.80 4
MH G)NORMAL.

060 $ —¿—-6(9)
EXPONENCIAL

040 y

0.20 q

0.00 T 7 7 7 T

D 2 4 6 8 10 12
CAUDAL MAXIMO INSTANTANEO ANUAL (M3/5)

Figura N* 6,2. Probabilidad acumulada: empírica, normal


y exponencial del ejemplo 6.2.
ABELARDO MÍ. Díaz SALAS

Cuadro N* 6.2.
Probabilidades acumuladas: empíricas y teóricas de la distribución normal
y exponencial del ejemplo 6.2.

0 M PG Z Gto Normal 66) Exponen-


Mm 2 Empírico a teórico cial teórico
a 5) (6)
10.78 1 0.03 1.7334 0.041 0.246
10,72 2 0.07 1.6999 0.044 0.248
10.21 3 0.10 1.4148 0.079 0.265
9.80 4 0,13 1.1856 0.118 0,279
9.40 5 0.17 0.9620 0.168 0.294
940 6 0.20 0.9620 0.168 0.294
9.10 7 0.23 0.7943 0.214 0.306
8.97 8 0.27 0.7217 0.235 0.311
8.96 9 0.30 0.7161 0.237 0.311
8.90 10 0.33 0.6825 0.247 0.314
8.90 11 0.37 0.6825 0.247 0.314
8.13 12 0.40 0.2521 0.401 0.347

8.00 13 0.43 0,1795 0.429 0.353


7.95 14 0.47 0.1515 0.440 0.355
7.56 15 0.50 -0.0665 0.474 0.374
7.48 16 0.53 -0,1112 0.544 0.378
6.94 17 0.57 -0,4131 0.660 0.405
6.87 18 0.60 -0,4522 0.675 0.409
6.77 19 0.63 -0.5081 0.695 0.414

6.70 20 0.67 -0.5472 0.708 0.418

6.52 21 0.70 -0.6478 0.742 0.428


6.50 22 0.73 -0.6590 0.745 0.429
6.39 23 0.77 -0.7205 0.764 0.435
6.26 24 0.80 -0,7932 0.786 0.443
5.88 25 0.83 -1.0056 0.842 0.465
5.80 26 0.87 -1.0503 0.853 0.470

4.93 27 0.90 -1.5366 0.938 0.526

4.89 28 0.93 -1.5590 0.941 0.529


3.98 29 0.97 -2.0676 0.981 0.596
Esrapística Y ProasiLiDaD en La HibRoLoGÍA (Diseño HIDROLÓGICO)

6.3.Método estadístico
La manera objetiva de seleccionar un modelo probabilístico adecuado
para un conjunto de datos (muestra) es mediante las pruebas estadísticas;
estos métodos permiten cuantificar la bondad del ajuste. Existen dos
pruebas estadísticas: prueba de chi-cuadrado y la prueba de Kolmogorov-
Smirnov.

6.3.1. Prueba de chi-cuadrado


Antes de ver la aplicación de chi-cuadrado para probar la bondad
de ajuste, es importante recordar la teoría de la distribución de chi-
cuadrado.
i. Distribución chi-cuadrado (x*)
La distribución chi-cuadrado es un caso especial de la distri-
bución gamma, donde: a = 5 y B=2, reemplazando estos pará-
metros en la ecuación (4.3.39.) se obtiene:

ny
” LXx
(Jea 120
M)= 221 (1/2)
(6.3.)

0 X7<0

La distribución chi-cuadrado tiene un solo parámetro n, en el


cuadro N* 6.3. y en la figura N* 6.3. se muestran los diferentes
valores de la función de densidad de probabilidad de la distri-
bución (x2).
Otra manera de expresar la distribución de chi-cuadrado es:

EXA Xx = DOX (6.4,)


i=[

Donde:
x, = variables aleatorias independientes de distribución normal
estándar
grados de libertad de la distribución
ll
<
ABELARDO MI. Díaz SALAS

Cuadro N* 6.3.
Función de densidad de la distribución x? para diferentes grados de libertad

e n=4 n= 10 n=14
0 0.000000 0.000000 0.000000
2.5 0.179066 0.014572 0.000759
5 0.102606 0.066801 0.013917
7.5 0.044096 0.096890 0.045417
10 0.016845 0.087734 0.073112

12.5 0.006033 0.061368 0.079906


15 0.002074 0.036458 0.068359
123 0.000693 0.019352 0.049387
20 0.000227 0.009458 0.031528

22.9 0.000073 0.004341 0.018312

25 0.000023 0.001895 0.009872


27.5 0.000007 0.000795 0.005011
30 0.000002 0.000323 0.002420

——n=4
——n=10
f(xn2)

—1=14
0.08

0.06

0.04

ú.02

0.00

Figura N9 6.3. Función de densidad de la distribución X”2

La función de distribución acumulada de x2 se encuentra en


tablas, que dependen de los grados de libertad y del nivel de
la prueba.
Si el experimento es de tipo Bernoulli (dos resultados posibles
en cada experimento), como por ejemplo lanzar una moneda
al aire en este caso para evaluar si existe diferencia significativa
(estadísticamente) entre las frecuencias observadas y las fre-
cuencias esperadas, se puede realizar mediante la distribución
normal; sin embargo, en el caso de que existan varios resultados

EE
Estabística Y PROBABILIDAD EN LA HiprooGíA (Diseño HiDROLÓGICO)

posibles (más de 2) en un experimento, la distribución normal no


se puede aplicar para probar la diferencia significada (diferencia
estadística) entre las frecuencias observadas y las esperadas o
teóricas. Para estos casos la constante estadística está dada por:

K _ 2
y? ¿e e) (6.5,

Donde:
o = frecuencia observada
e = frecuencia esperada
K = número de intervalos de clase
Antes de visualizar la aplicación de chi-cuadrado a la hidrología,
veamos el siguiente ejemplo donde se visualiza el cálculo de
las frecuencias observadas y esperadas por cada intervalo de
clase.
Ejemplo 6.3.
Al lanzar al aire un dado 60 veces se ha obtenido los siguientes
resultados.

NO CARA 1 2 3 4 5
NO DE VECES 9 11 11 9 7 13

Si el dado no es sesgado, calcular el valor de x? con la ecuación


(6.5.).
Solución
Para calcular x2 es necesario calcular la frecuencia observada
y la frecuencia esperada:
a. Cálculo de la frecuencia observada Ñ
La frecuencia observada se obtiene contando el número
de veces que ha salido cada cara en el experimento, que
se muestra en la segunda fila del cuadro anterior.
b. Cálculo de la frecuencia esperada E
La frecuencia esperada se calcula de la siguiente manera,
en cada lanzamiento la probabilidad que aparezca cada
cara es 1/6; por tanto, en 60 lanzamientos del dado se es-
pera que cada cara aparezca 10 veces, matemáticamente
se expresa por:
ABELARDO MM. Díaz SALAS

e, =P, o E) | (6.7)

Donde:
K = número de intervalos de clase (6 resultados posibles)
P, = probabilidad de cada intervalo de clase
e, = frecuencia esperada de cada intervalo de clase
n = número de datos de la muestra (lanzamientos del dado)
i =12..k
Reemplazando los datos en la siguiente tabla se tiene:

Prueba de chi-cuadrado en el lanzamiento de dados del ejemplo 6.3.


Frecuencia: |. Frecuencia (o, -e, Y
Caras observada esperada (0,-e) (o, =eP Bd
o, 4 E, £ e
1 9 10 A 1 0.1
2 11 10 1 1 0.1 i
3 11 10 1 1 0.1
4 9 10 -1 1 0.1
5 7 10 3 9 0.9
6 13 10 3 9 0.9
Total 60 60 0 x*2 2.2

ii. Prueba de chi-cuadrado

La prueba de chi-cuadrado trata de comparar las frecuencias


observadas con las frecuencias esperadas. Como las variables
hidrológicas son de tipo continuo, es necesario hallar los límites
de clase de cada intervalo de clase.
Existen dos maneras de hacer la prueba de chi-cuadrado:
+ Estableciendo intervalos de clase de igual tamaño, en este
caso las frecuencias esperadas de cada intervalo de clase
serán diferentes.
» Estableciendo que cada intervalo de clase tenga la misma
frecuencia esperada, en este caso los intervalos de clase
tendrán tamaños diferentes.
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HiDROtLÓGICO)

Para evitar que se presenten valores ceros en un intervalo de


clase, se prefiere la segunda opción; es decir, los intervalos de
clase tengan la misma frecuencia esperada, por lo que se opta
seguir el siguiente procedimiento, para la prueba de bondad
de ajuste de chi-cuadrado:
1. Dividir la serie de datos en K intervalos de clase donde:

( k>5 ] (6.8.)

2. Calcular la probabilidad de cada intervalo de clase me-


diante la ecuación (6.6.).
Calcular la probabilidad acumulada de cada intervalo de
clase sumando las probabilidades de los intervalos de clase:

| dxcx)- $ i=1
| 158)

Calcular el valor de la variable aleatoria x, según el modelo


de probabilidades que se ha seleccionado a priori para la
prueba de chi-cuadrado, mediante la siguiente ecuación:

1(x < x) = fr £(xJax ] (6.10,

Donde:
f(x) = función de densidad de probabilidades del modelo
seleccionado a priori.
Por ejemplo, si se selecciona k = 5, los valores de las pro-
babilidades son:
P(X<Xo2) = 0.2
P(X<Xo.4) = 0.4
P(X<xX, 6) = 0.6
P(X<X.g) = 08
P(X<Xo090) = 0.999
Los valores de X son los límites de clase.
En el cuadro N? 4.3.5. se muestran los valores de los límites
de clase para las diferentes probabilidades acumuladas del
ejemplo 4.3.1. de la distribución normal.
ABELARDO M. Díaz SALAS

5. Calcular la frecuencia observada (o).


La frecuencia observada se obtiene por conteo de los datos
comprendidos entre los límites de clase calculados en 4.
6. Calcular la frecuencia esperada de cada intervalo de clase
mediante la ecuación (6.7.).
7. Calcular el chi-cuadrado calculado fx? ), mediante la ecua-
ción (6.5.).
8. Hallar el valor de chi-cuadrado tabular Co), con:
* (= 5 que es el nivel de significación que se usa co-
múnmente en hidrología.
+ Grados de libertad definida por la ecuación siguiente:

C v=K-h-1 (6.11.)

Donde:
v = grados de libertad
k = número de intervalos de clase
h = número de parámetros del modelo que se está
probando el ajuste. Por ejemplo para la distribución
exponencial h = 1.
Los valores de (x*) se hallan de tablas estadísticas.
9. Criterio de decisión:
Para decidir si el modelo es adecuado para un conjunto
de datos, se compara el chi-cuadro calculado (3) con el
chi-cuadrado tabular (x) de la siguiente manera:
e Six: <x:,se afirma que el modelo probabilístico en
prueba es adecuado para el conjunto de datos, al
nivel de significación asumido.
e Six.>x.,se afirma que el modelo probabilístico en
prueba no es adecuado para el conjunto de datos,
en este caso se deberá probar el ajuste con otros
modelos.
Ejemplo 6.4.
Probar mediante la prueba de chi-cuadrado si los datos del cua-
dro N? 1.1.1. se ajustan a la distribución: normal, exponencial
o Gumbel.
ESTADÍSTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HiproLóGIcO)

Descargas máximas instantáneas anuales del río Querococha (m?/s)

Año Q Año Q Año Q

1953-1954 6.94 1963-1964 5.88 1973-1974 7.48


1954-1955 7.95 1964-1965 9.10 1974-1975 10.72
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
| 1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
1962-1963 7.56 1972-1973 5.80

Solución
El procedimiento recomendado es el siguiente:
1. Calcular k mediante las ecuaciones: (1.3.3.) y (6.8.) y se
obtiene: K = 5
2. Calcular la probabilidad de cada intervalo de clase, me-
diante la ecuación (6.6.).
3. Calcular los límites de clase por cada probabilidad acumu-
lada, mediante la ecuación (6.10.). Los valores ajustados
z para las diferentes probabilidades se muestran en los
cuadros N* 4.3.5., N* 4.3.9. y N* 4.3.24. Estos valores se
convierten en límites de clase como se muestran en los
cuadros N? 6.4., N* 6.5. y N* 6.6.
4. Calcular las frecuencias observadas. Para contar las
frecuencias observadas, se ordenan los datos en forma
ascendente como lo indicado en el cuadro N* 1.3.4.

Descargas máximas instantáneas anuales del río Querococha


ordenadas en forma ascendente (m?s)

4.89 4.93 5.8 5.88 6.26 6.39 6.5 6.52 6.7


3.98
6.87 6.94 7.48 7.56 7.95 8 8.13 8.9 8.9
6.77
| 8.96 8.97 9.1 9.4 9.4 9.8 10.2 10.72 10.78

De los datos ordenados se obtienen por conteo las fre-


cuencias observadas para cada intervalo de clase, las
frecuencias observadas son el número de datos entre los
límites de clase encontrados en 3.
ASELARDO M. Díaz SALAS

5. Calcular la frecuencia esperada mediante la ecuación


(6.7.).
6. Calcular el chi-cuadrado calculado mediante la ecuación
(6.5.).
7. Calcular el chi-cuadrado tabular con los grados de liber-
tad:
v=5-2- 1 = 2 para la distribución normal y Gumbel
v=5-1-1=53 para la distribución exponencial
8. Los cálculos se muestran en los cuadros N* 6.4., N* 6.5.
y NS 6.6.

Cuadro N* 6.4.
Prueba de bondad de ajuste de la distribución normal de las
descargas máximas instantáneas anuales del río Querococha

P(X<x) z X o P, e Sé
0.2 -0.842 6.173 5 0.2 5.8 0.110
0.4 -0.253 2.226 8 0.2 5.8 0.834
0.6 0.253 8.134 5 0.2 5.8 0.110
0.8 0.842 9.187 5 0.2 5.8 0.110
0.9999 3.960 14.768 6 0.2 5.8 0.007
Total 29 1 29
Chi-cuadrado calculado: 1.172
Chi-cuadrado tabular 5.99145

Cuadro N?* 6.5.


Prueba de bondad de ajuste de la distribución exponencial de las
descargas máximas instantáneas anuales del río Querococha

P(X <x) X 9 P, e 8387,


$;
0.2 1.714 0 0.2 5.8 5.800
0.4 3.923 0 0.2 5.8 5.800
0.6 7.037 13 0.2 5.8 8.938
0.8 12.360 16 0.2 5.8 17.938
0.9999 53.052 0 0.2 5.8 5.800
Total 2944.276 1 29
Chi-cuadrado calculado: 44.276
Chi-cuadrado tabular 7.81473
EstapísTtiCA Y PROBABILIDAD En LA HiDRoLOGÍA (Diseño HIDROLÓGICO)

Cuadro N? 6.6.
Prueba de bondad de ajuste de la distribución Gumbel de las
descargas máximas instantáneas anuales del río Querococha

P(X<x) Z 9, P, e, En,

0.2 6.210 5 0.2 5.8 0.110


0.4 6.996 8 0.2 58 0.834 7
0.6 7.811 2 0.2 5.8 2.490
0.8 8.967 6 0.2 5.8 0.007
0.9999 16.512 8 0.2 5.8 0.834

Total 29 1 29
Chi-cuadrado calculado: 4.276
Chi-cuadrado tabular 5.99145

9. Delosresultados obtenidos de los valores de chi-cuadrado,


se concluye que la distribución normal y Gumbel es ade-
cuada para las descargas máximas instantáneas del río
Querococha, y la distribución exponencial no es adecuada
para las descargas máximas instantáneas anuales del río
Querococha.

6.3.2. Prueba de Kolmogorov-Smirnov


Es una prueba de ajuste aproximado, es decir, no es exacto. Es una
prueba estadística que compara la probabilidad acumulada empírica
con la probabilidad acumulada teórica de un determinado modelo
de distribución.
La probabilidad empírica se calcula mediante la ecuación (6.1.) y la
probabilidad acumulada teórica correspondiente a una determinada
distribución se calcula mediante la ecuación (6.2.).
La prueba de Kolmogorov-Smirnov es similar a la prueba gráfica de
las funciones de probabilidad acumulada tratado en 6.2.2.; como
en toda prueba estadística, es necesario ejecutar la prueba de hi-
pótesis que en este caso consiste en comparar el valor absoluto de
la diferencia A, que existe entre la probabilidad acumulada teórica
y la probabilidad acumulada empírica con el valor crítico de la di-
ferencia tabular A, dada en la tabla de prueba de bondad de ajuste
de Kolmogorov-Smirnov publicada en 1951.
El procedimiento recomendado para la prueba de ajuste de Kolmo-
gorov-Smirnov es:
1. Ordenar los datos de mayor a menor
ABELARDO M. Díaz SALAS

Calcular la probabilidad empírica de los datos ordenados,


mediante la ecuación (6.1.). r(x >x)= = Pt).
Calcular la probabilidad acumulada teórica, mediante la
ecuación (6.2) que calcula la probabilidad de que la variable
aleatoria sea igual o superior a un valor dado.
P(x>x)=1-P(X<x)=1- [f(xix =1-F(x)= G(x)

Para estimar los diferentes valores de G(x), es necesario estimar


los parámetros de la distribución.
De los cálculos determinar o seleccionar el valor absoluto de
la diferencia máxima que existe entre las ecuaciones (6.2.) y
(6.1.) expresada mediante la siguiente ecuación:

( A, = máx. [G(x)- P(x)| (6.12.)

Donde:
A. = diferencia máxima calculada
Obtener A, (diferencia tabular) de la tabla de Prueba de Bondad
de Ajuste de Kolmogorov-Smirnov. Para obtener A, se necesita el
nivel de significación de la prueba que generalmente es a=0.05
y el número de datos de la muestra (n).
A, es un estadístico de Smirnov-Kolmogorov.
Para tomar la decisión si el modelo en prueba es adecuado
para el conjunto de datos, se comparan los valores de A. y A;:
Si A. < A,, entonces el ajuste es bueno, al nivel de significación,
por lo que la distribución en prueba es adecuada para el con-
junto de datos.
Si A, > A,, entonces el ajuste no es bueno, al nivel de significa-
ción, por lo que la distribución en prueba no es adecuada para
el conjunto de datos. En este caso se debe realizar la prueba
con otras distribuciones.
Ejemplo 6.5.
Probar mediante la prueba de Kolmogorov-Smirnov si los
datos del cuadro N? 1.3.4. se ajustan a la distribución normal
o exponencial.
EsTADísTICA Y PROBABILIDAD En La HiproLoGÍA (Diseño HibroLóGICO)

Descargas máximas instantáneas anuales del río Querococha


ordenadas en forma ascendente (m?/s)
3.98 4.89 4.93 5.8 5.88 6.26 6.39 6.5 6.52 6.7
6.77 6.87 6.94 7.48 7.56 7.95 8 8.13 8.9 8.9
8.96 8.97 9.1 9.4 9.4 9.8 10.2 10.72 | 10.78

Solución
Los cálculos de las probabilidades acumuladas teóricas y
empíricas de la distribución normal se muestran en el cuadro
N? 6.2.
El cálculo de A. = máx/G(x)-P(x)| para la distribución normal se
muestra en el cuadro N? 6.7.
El cálculo de A.= máx/G(x)-P(x) para la distribución exponencial
se muestra en el cuadro N* 6.8.
El valor de A, para n=29 y a=0.05 es:
A, = 0.246
Por tanto se tiene:
+ Parala distribución normal
la, =máx/G(x)-PG9)|=0.119] < [A, =0.246]. Entonces el modelo
de distribución normal es adecuado para las descargas
máximas instantáneas anuales del río Querococha. Los
resultados se muestren en el cuadro N* 6.7.
. Parala distribución exponencial
[a, =máx/G(x)-P()|= 0.40435] >[4, = 0.246] Entonces el modelo
de distribución exponencial no es adecuado para las des-
cargas máximas instantáneas anuales del río Querococha.
Los resultados se muestran en el cuadro N* 6.8.
ABeLARDO M. Díaz SALAS

Cuadro N* 6.7.
Prueba de bondad de ajuste de Kolmogorov-Smirnov
(distribución normal) del ejemplo 6.5.

M Q PO9 Empírico Z a A, =|G(«)-P(x)


1 10.78 0.03 1.7334 0.041 0.0080
2 10.72 0.07 1.6999 0.044 0.0223
3 10,21 0.10 1.4148 0.079 0.0214
4 9.80 0.13 1.1856 0.118 0.0152
5 9.40 0.17 0.9620 0.168 0.0016
6 9.40 0.20 0.9620 0.168 0.0318
7 9.10 0.23 0.7943 0.214 0.0198
8 8.97 0.27 0.7217 0.235 0.0315
9 8.96 0.30 0.7161 0.237 0.0631
10 8.90 0.33 0.6825 0.247 0.0860
11 8.90 0.37 0.6825 0,247 0.1193
12 8.13 0.40 0.2521 0.401 0.0005
13 8.00 0.43 0.1795 0.429 0.0044
14 7.95 0.47 0,1515 0.440 0.0267
15 7.56 0.50 -0.0665 0.474 0.0263
16 7.A8 0.53 -0.1112 0.544 0.0107
17 6.94 0.57 -0.4131 0.660 0.0938
18 6.87 0.60 -0,4522 0.675 0.0747
19 6.77 0.63 -0.5081 0.695 0.0612
20 6.70 0.67 0.5472 0.708 0.0414
21 6.52 0.70 -0.6478 0.742 0.0416
22 6.50 0.73 -0.6590 0.745 0.0118
23 6.39 0.77 -0.7205 0.764 0.0022
24 6.26 0.80 -0.7932 0.786 0.0139
25 5.88 0.83 -1.0056 0.842 0.0091
26 5.80 0.87 -1.0503 0.853 0.0137
27 4.93 0.90 -1.5366 0.938 0,0379
28 4.89 0.93 -1.5590 0.941 0.0073
29 3.98 0.97 -2.0676 0.981 0.0141

A¿= máxG(x)- P(x)| 0.119

Los descargas son las máximas instantáneas anuales en m%/s.


ESTADÍSTICA Y PROBABILIDAD En La HiproLocía (Diseño HIDROLÓGICO)

Cuadro N?* 6.8.


Prueba de bondad de ajuste de Kolmogorov-Smirnov
(distribución exponencial) del ejemplo 6.5.

M Q PGd Empirico | 09 Exponencial_ | a. —[G(x)-P bs)


1 10.78 0.03 0.246 0.21232

2 10.72 0.07 0.248 0.18091

3 10.21 0.10 0,265 0.16458

4 9.80 0,13 0.279 0.14576

5 9.40 0.17 0.294 0.12735

6 9.40 0.20 0.294 0.09402

7 9.10 0.23 0.306 0.07240

8 8.97 0.27 0.311 0.04428

9 8.96 0.30 0.311 0.01135

10 8.90 0.33 0.314 0.01954

11 8.90 0.37 0.314 0.05287

12 8.13 0,40 0.347 0.05311

13 8.00 0,43 0.353 0.08052

14 7.95 0.47 0.355 0.11155

15 7.56 0.50 0.374 0.12638

16 7.48 0.53 0.378 0.15580

17 6.94 0.57 0.405 0.16163

18 6.87 0.60 0.409 0.19125

19 6.77 0.63 0.414 0.21923

20 6.70 0.67 0.418 0.24877

21 6.52 0.70 0.428 0.27219

22 6.50 0.73 0.429 0.30441

23 6.39 0.77 0,435 0.33155

24 6.26 0.80 0.443 0.35746

25 5.88 0.83 0.465 0.36834

26 5.80 0.87 0.470 0.39680

27 4.93 0.90 0.526 0.37377

28 4.89 0.93 0,529 0.40435

29 3.98 0.97 0.596 0.37113

Ac = máx G(x)- PG) 0.40435

Los descargas son las máximas instantáneas anuales en mi/s.


CAPÍTULO

VII j
Período de retorno

7.1.Generalidades
El período de retorno es el número de años en que en promedio se
presenta una variable hidrológica extrema (evento extremo) superior o
igual a cierto valor. El período de retorno se denomina también tiempo
de retorno, intervalo de recurrencia.
En este capítulo en la primera parte se explican con ejemplos el concepto
de período de retorno y en la segunda parte se estudia la formulación
matemática del período de retorno relacionando con las probabilidades
de exceso y con la probabilidad acumulada.

7.2.Período de retorno
Para entender el período de retorno, citemos un ejemplo de un aconteci-
miento que no es de hidrología, pero sirve para entender el concepto de
tiempo de retorno. Supongamos que un familiar ha viajado al exterior del
año 1980 hasta el año 2000 y que su visita de regreso lo ha realizado en
distintos años, con la condición de que se ha realizado un solo viaje de
visita por año y que se ha registrado de la manera indicada en el cuadro
N? 7.1.
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)

Cuadro N* 7.1.
Interpretación del tiempo de retorno
Intervalo de Número de
Número tiempo entre intervalos
Años Año de visita de visitas
visitas en años entre visitas
1980
1981 V 1
1982
1983 3 1

1984 V

min
1985

lo
a
<

1986 V 4 1 3

1987
1988
1989
1990
1991
1992 NA 5
1993
1994
1995 4 >
1996 V 6
1997
1998
1999 V 7
2000
Total de años entre la primera visita (1981) 18
y la última visita (1999)
Promedio en años de la visita

En el cuadro N? 7.1. se observa que han existido 7 viajes de visita de


regreso, con intervalos de tiempo entre visitas que van desde 1 año hasta 6
años, en estas 7 visitas han transcurrido 6 intervalos (períodos) de tiempo.
Entre la primera y última visita en total todos los períodos de vista suman
18 años, es decir, entre la última visita y la primera visita han transcurrido
18 años, entonces el promedio del intervalo de visitas (período) es = 3
años; por consiguiente, si el intervalo entre visitas hubiera sido cada 3
años, en 6 intervalos o períodos hubiera sumado 18 años. El tiempo de
tres años es lo que se conoce en hidrología con el nombre de período
de retorno, que en realidad es el tiempo promedio de los intervalos de
visitas en este caso del ejemplo.
Ejemplo 7.1.
Con los datos del cuadro N? 1.1.1. que son las descargas máximas ins-
tantáneas anuales del río Querococha, estimar el período de retorno de
los caudales que exceden a q = 7.5 m/s.
ABELARDO MI. Díaz SALAS

Descargas máximas instantáneas anuales del río Querococha (m/s)


Año Q Año 2 Q Año Q
1953-1954 6.94 1963-1964 5.88 1973-1974 7.48
1954-1955 7.95 1964-1965 9.10 1974-1975 10.72
1955-1956 6.50 1965-1966 6.52 1975-1976 10.21
1956-1957 6.77 1966-1967 9.80 1976-1977 8.97
1957-1958 6.39 1967-1968 4.93 1977-1978 8.13
1958-1959 6.26 1968-1969 3.98 1978-1979 8.96
1959-1960 8.90 1969-1970 6.87 1979-1980 4.89
1960-1961 8.00 1970-1971 6.70 1980-1981 9.40
1961-1962 9.40 1971-1972 8.90 1981-1982 10.78
1962-1963 7.56 1972-1973 5.80

Solución
Para hallar el tiempo de retorno, se organiza a las descargas como se
muestra en cuadro N* 7.2., donde se observa que los caudales que
exceden a 7.5 m9%/s han sucedido 15 años (15 veces), con intervalos de
recurrencia (intervalos de tiempo entre excedencias a 7.5 m3/s) que varían
desde un año hasta 5 años. El número de intervalos de tiempo entre las
15 excedencias es 14, es decir, existen 14 intervalos de recurrencia com-
prendidos entre la primera excedencia (1954-1955) y la última excedencia
(1981-1982) a 7.5 m?/s, este comportamiento se puede observar en el
cuadro N? 7.2. y figura N? 7.1. y
Estos intervalos de recurrencia han sucedido en un período de 27 años
(el número de años que ha transcurrido entre la última y la primera exce- MN
dencia), por tanto el período de retorno de un caudal máximo instantáneo
anual es el tiempo promedio de los intervalos de recurrencia 7 =27/14=1.9
años. En consecuencia, al período de retorno se define como el tiempo
promedio de los intervalos de recurrencia en años entre eventos que
igualan o exceden una magnitud dada.
HIDROLÓGICO)
Estapística Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño

Cuadro N? 7.2.
máxima s instant áneas anuales del río Querococha (m/s) - tiempo de retorno
Descargas
de intervá-
No Años Año Q Añode | N*de “Antervalo de tiempo | Número
exceso. | exceses | entre excesos (años) los entre excesos
i

ula
1953-1954

Nu

|
o (Y
Ala

.
es
nia

1954-1955 7.50 | 1954-1955 1

|
| Yun
| Qi

A OS
u
e os

ojojoa¡o
dio
Gdilijo

Lia

A ala
Pi4

xo
00

Duo
o|
qm

7-1958 | 6.3
olaa

A
Gdj
Le
o

1958-1959 | 6.26
mn

0 959-1960

ho
Gl
Mi

o
co
Ele


o
UI

o
2
o
o
_
2

1960-1961 | 8.00 | 7.50 | 1960-1961


9 [1961-1962 | 9.40 | 7.50 | 1961-1962
iu
ojo

10 |1962-1963| 7.56 | 7.50 | 1962-1963


Sl.
ai

11 |1963-1964 | 5.88
Gala lu
oojo

12 |1964-1965| 9.1
Y ||

1964-1965

A
a

O|N]|O

13 |1965-196

“e
So
o| ul
E

14 |1966-1967| 9. 7.50 | 1966-1967 7


15 1967-1968] 4.93
ajalu¡ailQ
ojojojo

[16 |1968-1969| 3.
o
o [0
MN |0

17 |1969-1970|_6.

2.
o

18 [1970-1971] 6.707.
o

19 |1971-1972| 8.90 | 7.50 1971-1972

20 |1972-1973| 5.80
o
aaa
NN

21 1973-1974 1 7.48 E
.
E
o

22 1974-1975 | 10.72 | 7.50 | 1974-1975


1975-1976 10
23 1975-1976 | 10.21 | 7.50 |
E

| 8.97 50 | 1976-1977 11
24 1976-1977
Qi
N

1977-197 .50 | 1977-1978 12


Ed

25
¡Ql
uu


00
=
o ¡0

Na

1978-1979 | 8.96 .50 | 1978-1979 13


26
pu
a

27 1979-1980 | 4.89 :
YI
o

ue
_
-
q

1980-1981 | 9.40 50 | 1980-1981 14


28
NM]

1981-1982 15
1981-1982 | 10.78 | 7.50 |
_

29
Total de años entre el primer exceso (1954-1955)
hh
A

y el último exceso (1981-1982)


Promedio en años de la ocurrencia del exceso
AseLarDO M. Díaz SALAS

. PANA o e
DESCARGA (M3/5)3

Gr

0 , r 1 1 7 1
0 5 10 15 20 25 30
TIEMPO (AÑOS)

Figura N* 7,1. Caudales máximos instantáneos anuales del río Querococha

7.3.Relación entre el período de retorno y la probabilidad


Sea X una variable aleatoria, la probabilidad de igualar o exceder a un
valor determinado x se puede expresar matemáticamente mediante la
siguiente ecuación:

[ P(X>x)=p ] (7.1,

Para cada observación o experimento existen dos posibilidades (proceso


Bernoulli).
e —X>x (éxito), su probabilidad es p
e —X<x (falla), su probabilidad es 1-p
Este proceso cumple con las 4 suposiciones indicadas para el proceso
Bernoulli en el capítulo IV, donde p es la probabilidad de éxito y q =
1 - p es la probabilidad de fracaso en cada ensayo. Entonces el primer
éxito ocurrirá en t-ésima intervalo de recurrencia si:
+ Lasprimeras t-1 intervalos de recurrencias son fracasos que ocurre
con un probabilidad de (1 — p)-?.
EsTtapísticA Y ProBABILIDAD En ta HibroLoGíA (Diseño HIDROLÓGICO)

+ Y lat-ésima intervalo de recurrencia es un éxito que ocurre con una


probabilidad de p.
Al multiplicar las dos probabilidades de dos eventos independientes se
| obtiene la ecuación (4.2.7.), que es la función masa de probabilidad de
| la distribución geométrica, por tanto la probabilidad de un intervalo de
| recurrencia de duración t de obtener el primer éxito es:
|
( ftp) = (1-pHp parat = 1,2... ] (7.2)

En el cuadro N* 7.3. y en la figura N? 7.2. se muestra los valores y la


forma de la función masa de probabilidad de la distribución geométrica
para diferentes valores de p, donde p es el parámetro de la distribución.
Como se ha indicado, el tiempo de retorno es el tiempo promedio de los
intervalos de recurrencia de eventos que igualan o exceden a un valor
determinado, esta definición estadísticamente es igual al valor esperado
(media). El valor esperado de la ecuación (7.2.) es (ver ecuación 3.16.):

u=T=E(t)= 6 pp o (7.3.)

Al desarrollar la ecuación (7.3.) se obtiene:

EY) = p+2(1 - p)p+3(1 - p*p+... ] (7.4)

P E() = p[1+2(1 - p)+3(1 — p)?+4(1 - pr +...] ] (7.5)


AS
ABeLARDO MI. Díaz Satas

Cuadro N* 7.3.
Función de densidad del período de retorno
; Ms1-pp
p=0.02 p=0.05 p=0.08
1 0.02000 0.05000 0.08000 p
5 0.01845 0.04073 0.05731
10 0.01667 0.03151 0.03777
15 0.01507 0.02438 0.02490
20 0.01362 0.01887 0.01641
25 0.01232 0.01460 0.01081
30 0.01113 0.01130 0.00713
35 0.01006 0.00874 0.00470
40 0.00910 0.00676 0.00310
45 0.00822 0.00523 0.00204
50 0.00743 0.00405 0.00134
55 0.00672 0.00313 0.00089
60 0.00607 0.00242 0.00058
65 0.00549 0.00188 0.00039
70 0.00496 0.00145 0.00025
75 0.00448 0.00112 0.00017
80 0.00405 0.00087 0.0001
85 0.00366 0.00067 0.00007
90 0.00331 0.00052 0.00005
95 0.00299 0.00040 0.00003
100 0.00271 0.00031 0.00002

009
008
007
006
lO p=0.02|
005 lmp=0.05
= 004 LA P=0.08
003
002
0.0
000
0 20 40 50) 80 DO PO
t

Figura N? 7.2, Función de densidad del período de retorno


EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)
Esrapística Y PROBABILIDAD

es igual a la
La expresión dentro de los corchetes de la ecuación (7.5.)
con
ecuación (2.411.) que representa el desarrollo del binomio de Newton
exponente negativo, n=-2 por consiguiente se tiene:

+ d-11-p1?=p2=101+201p)+3(1p?+4(1-p) +... (7.6,)

Reemplazando (7.6.) en (7.5.) se tiene:

1 (7.7)
E(t)=T=pp* = >

Donde:
T = tiempo en años
p = probabilidad de una variable hidrológica de ser igualado o excedido
a una magnitud determinada.
geométrica
Nota: cuando se estima el parámetro p de la distribución
la cual
como se ha demostrado en el ejemplo 5.4. se encuentra t=T=>,
es igual a la ecuación (7.7.).
masa de
Por tanto, el tiempo de retorno es el valor esperado de la función
probabilidades de la distribución geométrica descrito matemáticamente
mediante la ecuación (7.7.).
de una
La ecuación (7.7.) significa que la probabilidad de ocurrencia
a un valor determinado
variable hidrológica en ser igualado o excedido
se re-
es el inverso de su período de retorno, lo cual matemáticamente
presenta mediante la siguiente ecuación:

(7.8.)

de distri-
7.4.Relación entre el período de retorno y la función
bución acumulada
F(x) se repre-
Las ecuaciones de la función de distribución acumulada
sentan mediante la siguiente ecuación (ver ecuación 3.10.):

F(x)= P(X< x)= f. £(Jdx


AseLarbO M. Díaz SALAS

La ecuación (7.9.) expresa una probabilidad de que el suceso no ocurra,


en este caso el período de retorno (T) se calcula mediante la siguiente
expresión:

pat 1 1 010)
P(x>x,) 1-P(X<x) 1-F(x) ca

Pl) | 7.11)

Ejemplo 7.2.
Con los datos del cuadro N? 7.2. calcular la probabilidad de que el caudal
del río Querococha sea superior o igual a 7.5 m*/s.
Solución
La probabilidad de que la descarga máxima del río Querococha sea igual
o superior a 7.5 m/s en cualquier año es igual a:
P(Q>7.5 ms) ==11 "0526
Esta probabilidad de exceso se puede hallar aplicando directamente la
ley de probabilidades (ver ecuación 2.6. y cuadro N? 1.3.4.).
P(Q>7.5 m'/s)= Z =0.517 20.526

Nota: usualmente para los diseños hidrológicos se estiman previamente


el período de retorno y luego la probabilidad. Con la probabilidad se
estima la magnitud del evento hidrológico. Los métodos para estimar el
período de retorno se estudian en el capítulo VII.
o
CAPÍTULO

VIII 0
Diseño hidrológico

8.1. Generalidades
Una de las aplicaciones de la estadística y de la probabilidad en la hidrolo-
gía es estimar el flujo de agua a través de un sistema, a éste se denomina
flujo de diseño; sin embargo, para el diseño de obras que permitan el
buen manejo de los recursos hidráulicos, a parte de la hidrología, se debe
considerar otros factores como: la seguridad, la economía, los aspectos
legales, la estética, la geotecnia, la geología y aspectos estructurales.
El manejo de los recursos hidráulicos se puede clasificar en dos clases:
1. Uso del agua. El diseño para el uso del agua está relacionado con
el análisis de los eventos hidrológicos medios, como por ejemplo
las descargas medias mensuales. -
2. Control del agua. El diseño para control del agua está relacionado
con eventos extremos (máximos), y estos eventos se caracterizan
por ser de corta duración como por ejemplo: los caudales máximos
instantáneos anuales, precipitaciones máximas diarias anuales,
etc.
En las obras para el control del agua, se debe determinar los valores de
diseño (por ejemplo el caudal de diseño). Por tanto, es permisible afirmar
que en la ingeniería los diseños se hacen para controlar los eventos extre-
mos (máximos); es decir, un determinado evento no debe ser superado
ni igualado en un período de retorno determinado.
Los valores de diseño se estiman para un período de retorno y el valor
del tiempo de retorno se determina de tres maneras: por aproximación
empírica, mediante el análisis de riesgo y mediante el análisis económico.

l>>7
EsTabísTICA Y PROBABILIDAD EN LA HiDROLOGÍA (Diseño HIDROLÓGICO)

8.2. Aproximación empírica


La fijación del período de retorno se hace teniendo en cuenca las reco-
mendaciones hechas en los libros, como por ejemplo las recomendaciones
de Chow et ál [51, página 430.

8.3.Análisis de riesgo
Otra forma de determinar el tiempo de retorno es fijando un riesgo de
falla de la obra. La estructura puede fallar (colapsar) si la magnitud del
evento hidrológico para el período de retorno T de diseño es superada
o igualada durante la vida útil de la estructura. El riesgo de falla está re-
lacionado con la vida útil del proyecto y con el período de retorno. Las
ecuaciones que relacionan el riesgo hidrológico, el período de retorno y
la vida útil de la obra son:
De la ecuación (7.10.) se tiene:

1
Pa
P(X=x) | (8.1.)

De principio de probabilidades se tiene:

( PX <x) =1-P(X>x) ] (8.2.)

La ecuación (8.2.) representa la no ocurrencia del evento, es decir re-


presenta la probabilidad de que el evento no sea igualado ni superado,
entonces para eventos independientes se tiene:
+ Enlañola probabilidad de no ocurrencia del evento es: P(X<x)
+ En2años consecutivos la probabilidad de no ocurrencia del evento
es: [PX<x)1?
+ —En3años consecutivos la probabilidad de no ocurrencia del evento
es: [PX<x)p
+ —Ennaños consecutivos la probabilidad de no ocurrencia del evento
es:

) (8.3.)
ABeLarDO M. Díaz SALAS

Por tanto, la probabilidad de que si ocurre el evento una vez en n años


de la vida útil de la obra denominada riesgo hidrológico, se expresa
matemáticamente por:

( R=1-)=1-[P(X<x]” (8.4)

En los diseños se asume el riesgo que si ocurre un evento igual o superior


a una magnitud dada la obra fallará, por la ley de probabilidad se sabe
que la suma de la probabilidad de la ocurrencia y la no ocurrencia del
evento es igual a 1, es decir, se cumple la ecuación (8.4.).
Reemplazando (8.2.) en (8.4.) se tiene:

Í R=1-J=1-[1-PX=x90]P ] (8.5.)

Reemplazando (8.1.) en (8.5.) se obtiene:

A
De la ecuación (8.6.) se obtiene:

1
| T= a" | (8.7.)

La ecuación (8.7.) permite calcular el tiempo de retorno T para una vida


útil de la obra de n años, fijando un riesgo permisible R, que indica la
probabilidad de ocurrencia del evento una vez durante la vida útil del
proyecto. En la figura N? 8.1. y cuadro N? 8.1. se observa la relación que
existe entre el período de retorno T y el riesgo R para una vida esperada
del proyecto en n años.
ESTADÍSTICA Y PROBABILIDAD EN LA HIDROLOGÍA (Diseño HIDROLÓGICO)

Cuadro N* 8.1.
Períodos de retorno para el riesgo permisible durante la vida esperada de la obra
Riesgo Vida útil de la obra en años
permisible 10 2 3 4 5 10 25 50 75 100
0.1 95 19 29 38 48 95 238 | 475 | 712 | 950
9.2 45 9 14 18 23 45 113 | 225 | 337 | 449
0.3 29 6 9 12 15 29 71 141 211 281
0.4 20 4 6 8 10 20 49 98 147 | 19
0.5 15 3 5 6 8 15 37 73 109 | 145
0.6 11 3 4 5 6 11 28 55 82 110
0.7 9 2 3 4 5 9 21 42 63 84

1900

R=01
— — —R:02
oro R=Ba
o RDA
— + — Res
—A— 08
2 R=7
AH R=OA
AN 03
— 2— -R=i 95

1 10 100 1000
VIDA UTIL DE LA OBRA n(AÑOS)

Figura N? 8.1. Riesgo de ocurrencia de una vez del evento hidrológico


durante la vida útil de la obra

Ejemplo 8.1.
Si se desea construir un puente en un río, hallar el período de retorno si
se asume un riesgo de 10% de que puede ocurrir la descarga máxima
una vez durante la vida útil del puente que es de 10 años.
Solución

El período de retorno se halla mediante la ecuación (8.7.) o de la figura


N? 8.1. o del cuadro N* 8.1. Datos del problema: n=10, R=0.1.
ABELARDO MI. Díaz SALAS

T= l A A
==
1-(-RY" 1-(-0.1)%

Ejemplo 8.2.
En el ejemplo 6.4. se ha definido que la distribución de probabilidades
adecuada para los datos de las descargas máximas instantáneas anuales
del río Querococha es la distribución Gumbel, usando esta distribución
hallar el caudal de diseño para el período de retorno encontrado en el
ejemplo 8.1.
Solución
El caudal de diseño se obtiene mediante el siguiente procedimiento:
1. Cálculo de la probabilidad de que el evento no sea igualado ni su-
perado en el período de retorno de 95 años. Esta probabilidad se
calcula mediante la ecuación (7.11.).

[ F(x)= P(Q < q)=1-1/T=1-1/95= 0.9895 ) 6

2. Según la distribución Gumbel se tiene:

w= 2-p (ver ecuación 4.3.65) | (ii)

F(w)= P(x < x)= e“ (ver ecuación 4.3.72) (iii)


Cs

Vo

w=-LaCLa(r(w) ] 7
EN

Reemplazando i en iv se obtiene:

[ w==Ln(= Ln(F(0.9895))= 4.551 ) (v)

Para los datos del río Querococha, se tiene: x=7.68, o, = 1.79

( P=X - 0.45 0, =6.87 — (ver ecuación 4.3.73.) ] (vi)

( a=0.78 0, =1.40 (ver ecuación 4.3.74.) ] (vii)


EsTabísTiCA Y PROBABILIDAD EN La HibroLOGÍA (Diseño HioroLóGico)

De la ecuación ii se tiene:

Ml x=P=+0aw ) (viii)

3. Calcular el caudal de diseño correspondiente a un período de retor-


no de 95 años que ocurrirá una vez en 10 años (vida útil) con un
riesgo de 10%. Reemplazando v, vi y vii en viii se obtiene el caudal
de diseño:
2=6.87+1.40*4.551=q =13.24 m/s

8.4.Criterios económicos
Otra alternativa de estimar el período de retorno para calcular los valores
de diseño es mediante criterios económicos, que consiste en comparar
los costos anuales de las obras con los costos de los daños producidos
por la ocurrencia del evento hidrológico.
En el análisis económico sucede lo siguiente: a medida que aumenta el
período de retorno aumenta los costos de la estructura, sin embargo los
daños producidos disminuyen, sumando los costos de los daños y el costo
de la obra se obtiene el costo total y el período de retorno de diseño se
obtiene para el costo total mínimo.

8.4.1. Evaluación de los costos de la obra


Para cuantificar los costos de la obra para diferentes períodos de
retorno del evento hidrológico, es importante definir el modelo pro-
babilístico adecuado para un conjunto de datos, luego se estiman los
valores del evento hidrológico para diferentes períodos de retorno;
finalmente, se cuantifica el costo de la obra. La obra no debe fallar
ante la ocurrencia del evento hidrológico.
Ejemplo 8.3.
Para los datos del ejemplo 6.4., hallar los caudales máximos instan-
táneos para diferentes períodos de retorno. Graficar los resultados.
Solución
Siendo la distribución de Gumbel adecuada para los datos de Que-
rococha. Para calcular los caudales se recomienda seguir el siguiente
procedimiento:
1. Laprobabilidad de que el evento sea igualado o superado en
un período de retorno T está dada por la ecuación (7.8.)
ABELARDO M. Díaz SALAS

xx )=l | 0
T

Cálculo de la probabilidad de que el evento no sea superado ni


igualado en el período de retorno T (años). Esta probabilidad
se calcula con la ecuación siguiente:

4
j
P(X<x,)=1 (ver ecuación 7.11) | (ii) E

La ecuación (ii) indica que la obra evitará todos los daños (no
fallará) cuando no ocurre el evento X,.
Cálculo de las magnitudes de x,
Los valores de x, que son caudales máximos instantáneos anua-
les correspondientes para cada período de retorno se calculan
con la ecuación siguiente:

( x, = B+ aw ] (iii)

Para los datos del río Querococha a partir de las ecuaciones vi


y vii del ejemplo 8.2. se tiene:
P =6.87, a=1.40
Reemplazando estos valores en la ecuación (iii) se tiene:

( x,=6.87 + 1.40w | (iv)

De la ecuación ¡ii del ejemplo 8.2. se obtiene:

P(X<xp)=0e ] y

El valor de la variable reducida (w) se obtiene de v:

[ w=-Lm(-Ln(PAX< xp) ] (vi)

Los caudales obtenidos con la ecuación iv para el período de


retorno se muestra en el cuadro N? 8.2. y en la figura N* 8.2.
EstapísticCA Y PROBABILIDAD en LA HiproLoGÍA (Diseño HIDROLÓGICO)

Cuadro N? 8.2.
Descargas (m*/s) para diferentes períodos de retorno del ejemplo 8.3.

(0 wm 15) 4 5
Período de a
x (m/s)
retorno T (años)
>
pX=x) p(X<x) w
1 1.0000 0.000 -2.220 3.78

2 0.5000 0.500 0.367 7.39


5 0.2000 0.800 1.500 8.97
10 0.1000 0.900 2.250 10.01

15 0.0667 0.933 2.674 10.60

20 0.0500 0.950 2.970 11.02


25 0.0400 0.960 3.199 11.34

50 0.0200 0.980 3.902 12432


100 0.0100 0.990 4.600 13.29
200 0.0050 0.995 5.296 14.26

16.00

E 14.00 - a
e
E pm
£ 12.00 pa
E
Z 1000 Y e”
E ¿
2
<= 3005]
Ez ,

E2 5.00 z
XI

É 400 4
S
Sa 2.00

0.00 - + e
0 50 100 150 200 250
PERIODO DE RETORNO (AÑOS)

Figura N? 8.2. Descarga para diferentes períodos de retorno del ejemplo 8.2.

8.4.2. Evaluación de los costos de los daños


Cuando ocurre el evento hidrológico extremo o son superados, es
decir si se tiene X > x, , fallará la obra y causará daños.
En la evaluación de costos de los daños que causaría la ocurrencia
de un evento hidrológico extremo, es necesario determinar el valor
ABELARDO M. Díaz SALAS

del evento extremo (máximos), los daños económicos y los daños


sociales que son difíciles de cuantificar. Para la evaluación de los
daños económicos, es necesario determinar: costo de los daños, valor
esperado (promedio) del costo de los daños y el costo de riesgo de
los daños.
i, Costo de los daños
Por ejemplo, en el caso de las descargas máximas para la eva-
luación de los daños causados se debe determinar la duración
y extensión de la inundación para diferentes valores de la des-
carga máxima correspondientes a los diferentes períodos de
retorno (ver ejemplo 8.3.) y con la simulación de la inundación
se determina los costos de los daños.
ii. Valor esperado del costo de los daños (S/. año)
Para hallar el valor esperado o el promedio del costo de los
|
daños en S/. año ocasionados por la ocurrencia del evento E
hidrológico extremo, es necesario conocer la función densidad lhl
¿
de probabilidades del evento hidrológico y los costos de los
daños para diferentes períodos de retorno. Cuando ocurren
|
eventos hidrológicos mayores o iguales a un cierto valor, es
decir si se tiene: X > x, , fallará la estructura. Para entender
el promedio del costo de los daños, es recomendable graficar
en el eje de la abscisa el evento hidrológico, o el período de
retorno o las probabilidades mayores o iguales y en el eje de
la ordenada la función densidad de probabilidad del modelo
probabilístico adecuado. Como los daños causados dependen
de la ocurrencia del evento hidrológico y como se ha indicado
este evento depende de la probabilidad mayor o igual y esta
probabilidad está relacionada con el período de retorno, en el
eje de la abscisa se puede graficar los daños y en el eje de la
ordenada la función densidad de probabilidad. Conociendo
los daños económicos para diferentes períodos de retorno y la
función de densidad de probabilidad, el valor esperado (pro-
medio) se halla mediante las ecuación (3.17.). En las siguientes
figuras se ilustran estos conceptos.
EsTapística Y PROBABILIDAD EN La HibroLoGíA (Diseño HibroLÓGICO)

= 7 4
AS
2 A
7
D 7 ;A
X
Ll
9 Y
E É ha

zBl ¿
Ea Ea
z ¿/
ra ..
É A
É A
' r VARIABLE ALEATORIA (X)
Xi X; Xi

Figura N* 8,3. Relación entre la función de densidad y el evento hidrológico

7
a
“lo
E
EE
po
a —
3 D(X)
E
ds
=
=>
e

T T T T T T T
(LOS AÑOS
Dix AE ) Dix, i
) DÍX;4 )

Figura N? 8.4. Relación entre la función de densidad y el costo de los daños

A partir de la figura N* 8.4. se puede estimar el promedio del


daño estimado por año, empleando las propiedades de la es-
peranza matemática definida mediante la ecuación (3.17.). El
costo anual de daños esperado o el costo promedio por año
se encuentra como la esperanza matemática (promedio) de la
distribución.
De las figuras N* 8.3. y N* 8.4. se obtiene la esperanza mate-
mática representado por:

| E(D(X))= D, = [ DGOFG ix (8.8)


ABELARDO M.. Díaz SALAS

En la ecuación (8.8.) f(x)dx es la probabilidad de que el evento


hidrológico de magnitud x ocurra en un año y D(x) es el daño
que causaría el evento x; por consiguiente, el costo del daño
que ocasionaría se encuentra mediante la integración para
X 2 x, Por tanto, se tiene P(X > x,) = f(x)dx, reemplazando
esta ecuación en (8.8.) y en forma gráfica se muestra en la
figura N* 8.5.

COSTO DE DAÑOS (s/)


p(X
2 x,)

2.2000 1.0009 02000 (0.6000 0.4000 0.2000 0.0000


PROBABILIDAD DE EXCEDENCIA ANUAL

Figura N? 8.5. Costo de daños para diferentes probabilidades

En la figura N? 8.5. se observa que a mayor período de retorno


que la probabilidad de excedencia P(X > x) disminuye y el costo
de los daños son altos.
La ecuación se evalúa al dividir el rango de X > x, (ver figura
N? 8.3. y N” 8.4.) en intervalos, y para este intervalo se puede
calcular el costo anual de daños esperado para cada intervalo
(ver figura N? 8.5.). Para el intervalo x, | <x,<X,, ,, se tiene:

AD, = [ : DCOFG ix ] (8.9)


ESTADÍSTICA Y PROBABILIDAD EN La HioroLoGíA (Diseño HiDroLÓGICO)

La ecuación (8.9.) se puede aproximar mediante la siguiente


ecuación:

| AD, i = Pee E f(x) dx | (8.10)

Se sabe que P f(xJax es la probabilidad, por lo tanto reempla-


zando sus valores en el intervalo considerado se tiene:

| (8.11,
E E(xix = [P(X < x,)-P(X<x,,, )]

Reemplazando (8.11.) y (8.10.) en (3.9.) se obtiene:

AD, i [PA a sx) X<x,,)] (8.12,

Por la ley de probabilidades se tiene:

[ P(X<x,)=1-P(X2 x,) ) (8.13,)

Po P(X<x,,)=1-PX>x,,) ) (8.14,

Reemplazando (8.13.) y (8.14.) en (3.12.) se obtiene:

AD, = ES >x,,)-P(X2x,)] (8.15,)


2

La ecuación (8.15.) representa el costo de daños correspon-


dientes a (costo del daño incremental esperado) dentro de dos
períodos de retorno, en unidades de S/. año.
Entonces el costo anual de daños esperado (promedio) para
una estructura con un período de retorno T, se obtiene reem-
| plazando (8.15.) en (8.8.) y aplicando las propiedades de la
| esperanza matemática (ecuación 3.16.):
ABELARDO MI. Díaz SALAS

O i=l 2
SÓ | 016)
La ecuación (8.16.) permite hallar los daños anuales esperados
(promedio). El costo anual de daños esperado en S/. año se
obtiene sumando los costos de daños incrementales.
iii Costo de riesgo del daño (S/. año)
Si se construye una obra para un período de retorno T, la estruc-
tura no fallará y los daños serán menores a que si no se construye
ninguna obra. Para los intervalos tiempo de retorno, el costo de
riesgo del daño se calcula mediante la siguiente ecuación:

CRD, =D, -AD,


CRD, =CRD, -AD, (8.17.)

Conociendo los eventos extremos para diferentes períodos de


retorno, se pueden estimar los costos de la obra, lógicamente
para eventos altos los costos serán altos porque se diseñan obras
seguras (evitan la falla) para el período de retorno correspon-
diente al evento de diseño.

8.4.3. Evaluación del costo total


Para determinar el costo total de la obra, es necesario cuantificar el
costo de la obra en S/. año. A mayor período de retorno, el costo
de la obra es mayor, pero como se ha indicado, el costo de riesgo
de daños disminuye. El costo total es la suma de costo de la obra y
del costo de riesgo de daño para cada período de retorno.

8.4.4. Período de retorno óptimo


El período de retorno óptimo es la que corresponde al costo total
mínimo.
Ejemplo N? 8.4.
En el cuadro siguiente se tiene los caudales máximos instantáneos
anuales del río Querococha, el período de retorno (ver ejemplo 8.3.),
el costo de la obra y el costo de los daños. Se pide hallar el período
de retorno óptimo, el caudal de diseño. Los costos son hipotéticos.
Estapística Y PROBABILIDAD En LA HipRoLOGÍA (Diseño HIDROLÓGICO)

Cuadro N* 8.3.
Costo de la obra y costo de los daños del río Querococha
Periodo de . Costo de Costo de
retorno año T] PO po) ars, daño (S/) obra (S/)
1 1.0000 0.000 3.78 0 0
2 0.5000 0.500 7.39 24000 3600
5 0.2000 0.800. 8.97 72000 16800
10 0.1000 0.900: 10.01 168000 27600
15 0.0667 0.933 10.60 212400 30000
20 0.0500 0.950 11.02 255600 32400 i
25 0.0400 0.960 11.34 300000 34800 j
50 0.0200 0.980 12.32 360000 48000 ¡
100 0.0100 0.990 13.29 480000 72000 :
200 0.0050 0.995 14.26 600000 96000

Solución ¿
E
El período de retorno óptimo se obtiene mediante el siguiente pro-
cedimiento:
1. Cálculo de la probabilidad de que las descargas máximas instan-
táneas anuales sean superadas o igualadas. Esta probabilidad
se muestra en la columna 2 del cuadro N* 8.2.
2. Cálculo del costo del daño incremental esperado (S/. año) para
cada intervalo de tiempo de retorno. Este costo se calcula con
la ecuación (8.15.). Los resultados se muestran en el cuadro
N? 8.4. en la columna 6.
Para el primer intervalo se tiene:
Para i=1, y para T=1 año y T=2 años, se tiene:

Dx) Dl, ) 0+24000 o


AD, =| 21 [P(X > x, )- P(X > x, )]= A [1 -0.5|= 5 /.6000/año

Para los demás intervalos se sigue el mismo procedimiento.


3. Cálculo del costo anual de daños esperados
Este costo se calcula mediante la ecuación (8.16.), cuyo valor en
este caso es de S/. 58918/año. Este costo es el costo promedio
de daños cuando no se construye ninguna estructura. Este costo
se muestra en la primera línea del cuadro N? 8.4. columna 7.
4. Cálculo del costo de riesgo de daño
El costo de riesgo de daño se calcula mediante la ecuación
(8.17.), en el caso del ejemplo para T=2 años, el costo de
riesgo de daño es:

Ñ j
AgeLarDO M. Díaz SALAS

CRD, = 58918 AD, = 58918-6000= 5/.52918/año. Es decir, si se constru-


ye una obra para un período de retorno de 2 años, la estructura
no fallará y los daños serán menores a que si no se construye
ninguna obra. Para los siguientes cálculos se sigue el mismo
procedimiento. Los resultados se muestran en la columna 7 del
cuadro N* 3.4.
Bb. Cálculo del costo total
El costo total es la suma del costo de la obra y del costo de
riesgo de daño para cada período de retorno. Los resultados
se muestran en cuadro N* 8.4. (columna 9).
El costo de la obra, el costo de riesgo de los daños y el costo
total para diferentes períodos de retorno se muestra en la figura
N? 8.6.
6. Cálculo del período de retorno óptimo
El período de retorno óptimo es aquel que corresponde al costo
mínimo, que en este caso es T=25 años que corresponde a un
costo total mínimo de S/. 48300. Estos resultados se obtienen
a partir del cuadro N* 8.4. y de la figura N* 8.6. En este caso
el período de retorno de diseño es de T=25 años y, por tanto,
el caudal de diseño es 11.34 m'/s.

Cuadro N* 8.4.
Análisis económico del ejemplo 8.4.
1 2 3 4 5 6 7 3 29

ierenen-| Prado
todel lomo | PR=xY | (més | Daño S/. a
esperado des a o a la obra total
subindice T (Años) (S/. Año) | (S/. Año) (S/.:Año) + (8/..Año)
0 1 1.0000 |3.78 0 0 58918 0 58918
1 2 0.5000 |7.39 24000 6000 52918 3600 56518
2 5 0.2000 8.97 72000 | 14400 | 38518 | 16800 | 55318
3 10 0.1000 | 10.01. | 168000 | 12000 | 26518 | 27600 | 54118
4 15 0.0667 10.60 | 212400 | 6340 | 20178 | 30000 | 50178
5 20 0.0500 | 11.02 | 255600 | 3900 16278 | 32400 | 48678
6 25 0.0400 | 11.34 | 300000 | 2778 13500 | 34800 | 48300
7 50 0.0200 | 12.32 | 360000 | 6600 6900 | 48000 | 54900
8 100 0.0100 | 13.29 | 480000 | 4200 2700 72000 | 74700
9 200 0.0050 | 14.26 | 600000 | 2700 0 96000 | 96000
Costos anuales de daños esperados (S/.) 58918
ESTADÍSTICA Y PROBABILIDAD EN La HibroLoGíA (Diseño HiDroLÓGICO)

120000

100000

0000
(SOLES)

60000
COSTO

40000
e « COSTO TOTAL MINIMO

A
2.0000 eS e
po — a

pl T
o E La

10 100 1000
PERIODO DE RETORNO DE DISEÑO AÑOS. (M)

[—— costo DERIESGO ——E— COSTO DE OBRA ——2—LDOSTO TOTAL |

Figura N* 8.6. Análisis económico del ejemplo 8.4.


BIBLIOGRAFÍA

[1] APARICIO, Francisco. Fundamentos de Hidrología de Superficie. Limusa.


México. 1994.
[2] BENJAMÍN, Jack y CORNELL, Allin. Probabilidad y estadística en inge-
niería civil. McGraw Hill. Bogotá 1981.
[3] CALZADA, José. Estadística general. Jurídica. Lima. 1981.
[4] CHAPRA, Steven y CANALE, Raymond. Métodos numéricos para inge-
nieros. McGraw Hill. México. 1998.
[5]. CHOW, Ven Te. MAIDMENT, David y WAYS, Larry. Hidrología aplicada,
McGraw Hill. Bogotá. 1994.
[6] EMPRESA PÚBLICA DE ELECTRICIDAD DEL PERÚ. HIDROSERVICE.
Estudio Integral para el Aprovechamiento Integral de la Cuenca del Río
Santa. 1984.

[7] GARCÍA, Celestino. Estadística y probabilidad. Universidad Nacional de


Ingeniería. Facultad de Ciencias. Lima.
[8] GARCÍA, Celestino. Distribuciones y estadística inferencial. Universidad
Nacional de Ingeniería. Facultad de Ciencias. Lima.
[9] GARCÍA, Celestino. Distribuciones y estadística inferencial. CONCYTEC.
Lima. 1997.
[10] MEJÍA, Abel y DE PIÉROLA, Nicolás. Estadística aplicada a la hidrología.
Universidad Nacional Agraria La Molina. Lima.1985.
[11] MEJÍA, Abel. Métodos estadísticos en hidrología. Universidad Nacional
Agraria La Molina. Lima. 1991.
[12] MILLER, Irwin, FREUND, John y JOHNSON, Richard. Probabilidad y
estadística para ingenieros. Prentice-Hall Hispanoamericana.México 1992.
[13] MONSALVE, Germán. Hidrología en la ingeniería. Escuela Colombiana
de Ingeniería. Santafé de Bogotá. 1995.
[14] MONTGOMERY, Douglas y RUNGER, George. Probabilidad y estadística
aplicada a la ingeniería. Limusa Wiley. México. 2002.
[15] PONCE, Miguel. Engineering Hydrology Principies and Practices. Princite
Hall. New Jersey. 1989,

a
ESTADÍSTICA Y PROBABILIDAD EN La HiproLoGíA (Diseño HibroLÓGICO)

[16] SHELDON, Ross. Probabilidad y estadística para ingenieros. McGraw


Hill, México 2000.
[17] VARAS, Eduardo. "Fundamentos de Probabilidad y estadística para
hidrología". Universidad Nacional Agraria La Molina. Publidrat N* 104.
Lima 1982.
[18] VARAS, Eduardo. Hidrología probabilística. Universidad Católica de
Chile. 1998.
[19] VELASCO, Gabriel y WISNIEWSKI, Piotr. Probabilidad y estadística para
ingeniería y ciencias. Thomson Learninig México. 2001.
[20] VILLON, Máximo. Hidrología estadística. Instituto Tecnológico de Costa
Rica. Cártago. 2001.
[21] WALPOLE, Ronald, MYERS, Raymond y MYERS, Sharon. Probabilidad
y estadística para ingenieros. Pearson Educación. México. 1998.
[22] YEVJEVICH, Vujica. Probability and Stastistics in Hydrology. Water
Resources Publications. Colorado Usa. 1972.
Este libro se terminó de imprimir
en los Talleres Gráficos del
Instituto Pacífico S.A.C.
Jr. Castrovirreyna N* 224 - Breña
Teléfono: 332-5766
LIMA - PERÚ

También podría gustarte