Está en la página 1de 19

UNIVERSIDAD DE ORIENTE

NUCLEO BOLÍVAR
ESCUELA DE CIENCIAS DE LA TIERRA
DEPARTAMENTO DE INGENIERÍA CIVIL
CÁTEDRA: HIDROLOGIA BASICA

ESTADÍSTICAS HIDROLÓGICAS

Profesora: Zulimar Gámez


Fecha: Enero 2019
RESUMEN

1. ESTADÍSTICA

Estudia los métodos científicos para recoger, organizar, resumir y analizar datos así
como para sacar conclusiones válidas y tomar decisiones razonables basada en el
análisis.

Los fines del estudio estadístico son:

 Recolección, clasificación y descripción de observaciones de sucesos


 Análisis de datos obtenidos, enunciado las palabras comunes a todas las
observaciones
 Deducción de las leyes por las que se rigen los sucesos, a partir del estudio
restringidos de los mismos.

De acuerdo a lo anterior, nace una primera clasificación de la estadística, Así:

 Estadística Descriptiva o Deductiva: es aquella que se encarga de describir y


analizar las características de un grupo de observaciones o muestra, sin sacar
conclusiones o inferencias acerca del grupo mayor o población.

 Estadística Analítica o Inductiva: se encarga de analizar la muestra y sacar


conclusiones, es decir, inferir la interpretación de los datos analizados

2. TERMINOS BASICOS Y PARAMETROS ESTADISTICOS

La estadística es necesaria en los más variados campos de todas las ciencias e


imprescindible en el estudio de los fenómenos en que interviene al azar.

Cuando un investigador formula una hipótesis, por la aplicación de métodos estadísticos


contrasta el grado con que se ajusta a la realidad del fenómeno. Por medio de la
estadística matemática se calculan complicados procesos físicos, químicos, etc.

Los siguientes parámetros son parte de la estadística:


2.1 Población: es el conjunto de elementos, individuos, observaciones con
características similares que se encuentran en un sitio y tiempo determinados, es decir,
están delimitados en espacio y tiempo. Generalmente se le identifica como N.

Las poblaciones pueden ser finitas o infinitas. Una población es finita cuando tiene un
número determinado de individuos, por ejemplo el conjunto de panes que produce una
panadería en un día. Mientras que una población es infinita cuando no tiene un límite
definido, por ejemplo el número de hojas que pueden caer de los árboles de un bosque
tropical.

2.2 Muestra: es el conjunto de observaciones que se toman de una población y que se


supone representa todas las características generales de la población de estudio.
Generalmente se le identifica como n.

Por Ejemplo: El resultado de lanzar diez veces un dado es un muestra correspondiente al


universo que constituye los infinitos lanzamientos posibles del dado; el resultado de una
muestra realizada sobre el comercio de cien negocios de la ciudad, Para conocer el
precio de un determinado artículo, es una muestra que corresponde a la población
‘’Precio’’ de dicho artículo en todos los comercios.

Generalmente no es posible o es impráctico observar o estudiar todo el conjunto de


individuos u objetos, es decir, toda la población o universo, porque es muy costoso,
toma mucho tiempo, es muy difícil, etc. En ese caso se estudia solamente una parte que
se llama muestra.

Si una muestra es representativa de una población, es posible inferir importantes


conclusiones sobre la población a partir del análisis de la muestra. La fase de la
estadística que trata con las condiciones bajo las cuales tal diferencia es válida se llama
ESTADÍSTICA INDUCTIVAS o INFERENCIA ESTADISTICAS. Ya que dicha
indiferencia no es del todo exacta, el lenguaje de las probabilidades aparecerá al
establecer nuestras conclusiones.

Muestra Aleatoria: Muestra elegida independientemente de todas las demás, con la


misma probabilidad que cualquier otra y cuyos elementos están elegidos
independientemente unos de otros y con la misma probabilidad.

Métodos gráficos de representación de muestras: El método grafico más frecuente es el


histograma, que puede adoptar distintas formas.

2.3 Variables: se entiende a una característica, cualidad, fenómeno, etc. que varía, se
modifica o cambia, es decir, que puede tomar cualquiera de los valores de un grupo
determinado.

Es un símbolo, tal como X, Y, H, X o B, que puede tomar un conjunto de prefijado de


valores, llamado dominio de esa variable. Si la variable puede tomar un solo valor, se
llama constante.

La variable se subdividen en CONTINUA Y DISCRETA, según sea o no susceptible


de fraccionarse.
Una variable que puede tener cualquier valor entre dos valores dados se denomina
variable continua. Por ejemplo, la estatura de una persona puede ser 168 cm, 168.5 cm,
168.53 cm, 168.53749 cm, 168.53749062 cm y así hasta el infinito.

Una variable que solo puede tener valores fijos entre dos valores dados se denomina
variable discreta. Por ejemplo, el número de hijos en una familia puede ser 0, 1, 2, 3,
4, etc., pero no puede ser 2.5 ni 4.67, ni 5.873, etc., es decir, no puede ser la fracción de
la unidad.

Otro ejemplo: El numero N de hijos de una familia pueden ser 0, 1, 2, 3… Pero no 1.5 o
2.679. Es una variable discreta. Pero la Altura H de una persona, Que Puede ser 68
pulgadas, 65.5 pulgadas o 62.7648 pulgadas, dependiendo de la presión de la medida,
en una variable continua.

2.4 Frecuencia: Número de veces en que se repite una característica o las


características de una variable discreta. Generalmente se acompaña del porcentaje
relacionado a esa frecuencia. Por ejemplo, en un plantel educativo las edades de los
alumnos y sus frecuencias son: 10 años 20 alumnos, 11 años 14 alumnos, 12 años 18
alumnos, etc. Las frecuencias serán los números de alumnos que se repiten en cada
edad. Generalmente, se llama clase a cada grupo de valores repetidos, así para la edad
11 años, esa será la clase, y luego serán la clase 14 años, 12 años, etc.

3. PRINCIPIOS DE HIDROLOGÍA ESTADÍSTICA

Muchos de los procesos hidrológicos son tan complejos que una forma de interpretarlos
y analizarlos es por métodos probabilístico. Los eventos hidrológicos parecieran ser
incertidumbre de la naturaleza y son el resultado de un conjunto de eventos al azar
estocásticos. Las ciencias físicas que normalmente se estudian consideran proceso
determinísticos es decir que si se repite el experimento η veces se obtendrán un mismo
resultado. Pero en la realidad, si se consideran todos los parámetros se observan los
procesos físicos son estocásticos. La hidrología por sus innumerables posibles
situaciones puede estudiada desde este punto de vista.

Actualmente no solo es importante no solo es importante conocer los valores típicos


medios, máximos y mínimos de algún fenómeno hidrológico si no que probabilidad de
su ocurrencia. El análisis d frecuencia es utilizado en diseño de obres grandes y
pequeñas, tales como represas alcantarillas sistemas de drenaje pluvial canales de
navegación etc.

En este resumen se revisaran las distribuciones de frecuencia más utilizadas para la


precipitación y la escorrentía, así como sus aplicaciones.

4. PROBABILIDAD

Es una medida de la verosimilitud de la ocurrencia de un suceso aleatorio.

En el análisis probabilístico en hidrología, se asume que la información disponible de


una variable hidrológica representa una muestra tomada de una población cuyas
características se desconocen. En el análisis probabilístico se analizan posibles leyes de
probabilidad que pueden describir el comportamiento de las variables de la población.
Por ejemplo, cuando se calcula una media con observaciones disponibles, se está
infiriendo que la media calculada es la media de la población, lo cual no necesariamente
es verdad, pues esto dependerá de la calidad de la información, del número de
observaciones y otros aspectos.

Los objetivos básicos de la estadística y/o probabilidad en la hidrología son entre otros:

 Interpretación de las observaciones


 Análisis de la calidad de la información
 Inferencia sobre el comportamiento de la variable
 Extracción del máximo de información de los registros
 Presentación de la información en gráficas, tablas, ecuaciones, que básicamente
ayudan a la toma de decisiones en el planeamiento de los recursos hídricos.

4.1 Probabilidades de Excedencia y No Excedencia

Se definen como:

Probabilidad de Excedencia (P): Probabilidad de que un evento de una magnitud dada


será igualada o excedida dentro de un intervalo de tiempo específico.

La Probabilidad de no Excedencia seria a que no llegaría a tal magnitud en un lapso


de tiempo.

Las probabilidades de excedencia son una medida probabilística basada en datos de una
serie histórica, que permite distinguir las características hidrológicas de una cuenca. Es
decir, es el valor que indica en el porcentaje en el que los datos históricos registrados
son iguales o mayores al que corresponde a dicho valor.

Esta probabilidad se utiliza con frecuencia en el cálculo del comportamiento de los


cuerpos de agua. La razón de esto es que ayuda a predecir la probabilidad de que las
inundaciones puedan ocurrir y por lo tanto, ayuda en los diseños de puentes, diques y
alcantarillas. Por ejemplo, si un caudal de 8098 m3/s es excedido en promedio una vez
cada 10000 años, entonces su período de retorno, Tr, es de 10000 años.

La probabilidad de ocurrencia de un fenómeno en hidrología puede citarse de varias


Formas:

 El evento hidrológico posee una probabilidad de ocurrencia del 2%.


 El evento hidrológico se presenta una vez cada 10 años.

Existe una relación entre probabilidad de ocurrencia de un evento hidrológico y tiempo


de recurrencia el fenómeno. Por ejemplo:

 Si un suceso hidrológico se presenta (en promedio) una vez cada 10 años, su


probabilidad de ocurrencia será 0.1 (10%).
 Si la probabilidad de ocurrencia de un determinado fenómeno hidrológico es de
0.04 (4%), significa que dicho fenómeno se presentará (en promedio) 4 veces en
100 años, es decir, una vez cada 25 años.

5. PERIODO DE RETORNO (T)

Se define como el tiempo o lapso promedio entre la ocurrencia de un evento igual o


mayor a una magnitud dada, dicho de otra forma, es el intervalo de recurrencia
promedio para un cierto evento. Estadísticamente el Periodo de Retorno es la inversa de
la probabilidad de excedencia, es decir:

O también puede ser representada por la probabilidad de no excedencia como se


muestra a continuación:

Otra forma de definir Periodo de Retorno T es como sigue:

En varias áreas de la ingeniería, el período de retorno es el tiempo esperado o tiempo


medio entre dos sucesos de baja probabilidad. Por ejemplo, en ingeniería hidráulica es
el tiempo medio entre dos avenidas con caudales iguales o superiores a uno
determinado, mientras que en ingeniería sísmica es el tiempo medio entre dos
terremotos de magnitud mayor que un cierto valor.
También llamado período de recurrencia, el período de retorno es un
concepto estadístico que intenta proporcionar una idea de hasta qué punto un suceso
puede considerarse raro. Suele calcularse mediante distribuciones
de variables extremales, sobre la base de series de valores extremos registrados dentro
de periodos iguales y consecutivos; por ejemplo, en hidrología, se realiza el estudio a
partir de tablas con la precipitación máxima recogida en 24 horas en un año, durante una
serie de años consecutivos; en ingeniería marítima, tablas con los valores de la mayor
altura de ola alcanzada en un año, igualmente a lo largo de una serie de años
consecutivos. El ajuste de los datos y la predicción de valores extremos suele realizarse
mediante las distribuciones de Gumbel, Log-Pearson, y otras.
El periodo de retorno suele ser un requisito fundamental para el diseño de obras de
ingeniería, ya que permite establecer el valor mínimo de un determinado parámetro
(precipitación de lluvia, altura de ola, velocidad del viento, intensidad de un sismo, etc.)
que debe ser soportado por la obra para considerar que es suficientemente segura. Al
mismo tiempo que se diseña para ese valor mínimo, se evita el diseño para valores
superiores, evitando así un sobredimensionamiento excesivo. No obstante, algunos
especialistas consideran que ciertos periodos de retorno son excesivamente
conservadores, y que deberían rebajarse por dar lugar a obras demasiado costosas y
seguras; se trata de una lucha entre la seguridad y la economía.
El periodo de retorno a adoptar para el diseño de una estructura hidráulica debería ser el
resultado del análisis costo-beneficio. A mayor periodo de retorno mayor la obra y en
consecuencia más cara y el beneficio también podría ser más grande. Sin embargo la
evaluación de los beneficios es frecuentemente muy difícil de utilizar, por lo que en la
práctica se adoptaran periodos de retorno en base a la práctica usual.

En la siguiente Tabla, se muestra periodos de retorno recomendados para el cálculo de


caudales de diseño de estructuras menores.

También se puede entender el periodo de retorno como un coeficiente de seguridad que


se asigna a las distintas estructuras, a raíz de la falta de información y conocimiento del
comportamiento de las variables hidrológicas (Precipitación, Caudales), siendo una
medida de seguridad ante cualquier eventualidad.

Se dan a conocer otras tablas presentando periodos de retornos recomendados para


diferentes tipos de estructuras civiles: La Tabla 10.2 es de carácter general e incluye
diversas obras, la Tabla 10.3 es exclusivo para obras hidráulicas en carreteras, la Tabla
10.4 está en función al tipo de área a proteger y la Tabla 10.5 en para el diseño de
vertederos de embalses.
6. CARACTERÍSTICAS DE LAS DISTRIBUCIONES DE PROBABILIDADES

Las características de distribución de probabilidades describen por ciertos parámetros


que vienen expresados en término de los momentos. Las principales características son
la tendencia central, variabilidad con respeto a un valor central o dispersión de los
valores el sesgo o grado de asimetría con respecto a un valor central. En estadística son
el primero, segundo y tercero de la distribución. Por otra parte están las medidas de
tendencia central y las medidas de dispersión.

6.1 Medidas de tendencia central

Dentro de un grupo de datos hay, generalmente, valores que representan al grupo total.
Esos valores están hacia el centro del grupo de datos por lo que se les denomina
medidas de tendencia central. Las medidas de tendencia central más comunes son la
media aritmética, la mediana y la moda. Aunque hay varias medias (media aritmética,
media geométrica, media harmónica, media ponderada, etc.) nos referiremos solo a la
media aritmética que es la más común y por tanto la más usada. Hay otras medidas de
tendencia central que no trataremos por ser, generalmente, más especializadas, tal como
la media cuadrática, los cuartiles, deciles y percentiles (en su conjunto llamados
cuantiles). Los percentiles también se les llaman porcientos o porcentajes.
6.1.1 Promedio aritmético o media aritmética (μ): es el primer momento alrededor
del origen. También llamada promedio y en inglés “average”, se simboliza por medio de
una x con una barra arriba. Se calcula dividiendo los valores de todos los elementos o
individuos, generalmente llamados en estadística, “observaciones”, entre el número de
dichas observaciones. Se calcula mediante la expresión:

Dónde:
xi es valor observado de la variable.
N es el número de observaciones.

6.1.2 Mediana (M): es el valor de la variable que deja con igual probabilidad de
ocurrencia (0.50) los valores abajo y arriba de ella, por lo tanto, la mediana resulta
atractiva, en el caso de series que se apartan de la normal.

La mediana, en grupo de datos numéricos ordenados de acuerdo con su magnitud


(ascendente o descendente) es el valor medio, es decir el valor que divide en dos partes
iguales el grupo. Cuando es un número impar de datos u observaciones, será el valor
que deja a cada lado igual número de datos. Cuando el número de datos es par será la
media aritmética de los dos valores medios. Ejemplos:

a) Número de datos impar: 4, 7, 8, 9, 11, 14, 18, 23, 31. La mediana es 11 porque
siendo 9 datos el quinto dato (11) es el que deja igual número de observaciones a
cada lado.

b) Número de datos par: 2, 5, 6, 8, 9, 12, 15, 19, 22, 34. la mediana es 10.5, es decir
la media aritmética de los dos valores medios (9 + 12 = 21, entre 2 = 10.5).

Cuando se trata de un histograma de frecuencias, la mediana es el valor de x (en el eje


de las abscisas) correspondiente a la línea vertical que separa al histograma en dos
partes de igual área.

6.1.3 Moda: La moda de un grupo de datos numéricos es el valor que ocurre con mayor
frecuencia, es decir, el valor que más se repite, puede que un grupo de datos numéricos
no tenga moda, es decir, cuando no hay un valor que se repite más que los otros. Se le
llama amodal. Si tiene una moda se le denomina unimodal Por otra parte, puede haber
un grupo de datos numéricos que tenga más de una moda, en este caso de le llama
bimodal si son dos las modas como ocurre con la precipitación pluvial anual de muchos
países tropicales o con la insolación diaria en la ciudad de Mérida, Venezuela. Si tiene
más de dos modas se les denomina, genéricamente, polimodales, porque tienen muchas
modas (los llamados “picos”), como serían la tensión arterial (sistólica o diastólica), la
precipitación pluvial mes por mes de alguna región húmeda, la representación gráfica de
un sismógrafo o de un electrocardiograma, etc. Ejemplos son:
Amodal: 1, 3, 4, 7, 9, 11, 14, 17, 20, 25, 37, 43. No tiene moda.
Unimodal: 2, 4, 6, 7, 9, 12, 12, 12, 16, 22, 35. 66. La moda es 12.
Bimodal: 3, 6, 8, 9, 12, 14, 14, 14, 16, 19, 22, 26, 28, 28, 28, 28, 39, 43. Las modas son
14 y 28.
Polimodal: 3, 6, 8, 9, 11, 11, 11, 15, 15, 15, 15, 18, 23, 26, 29, 29, 29, 31. En esta caso
tiene tres modas que son 11, 15 y 29.
En una distribución normal, simétrica, hay solo una moda, no hay sesgo y la curva tiene
forma de campana simétrica. En esta curva la media, la moda y la mediana coinciden en
el mismo punto o valor central.

Los tres parámetros (la media aritmética, la mediana y la moda) son iguales para
distribuciones simétricas. Para series pequeñas, se justifica el uso de la mediana, porque
el promedio se afecta en ellas mucho más por los valores extremos y es además más
robusta. En la práctica hidrológica en series que se apartan de la distribución normal es
común usar los logaritmos de la variable. En hidrología se tienen frecuentemente
muestras de distintos tamaños N1, N2, N3 ... NR y se necesita obtener el promedio

ponderado de todas ellas, así:

6.2 Medidas de dispersión

Las medidas de dispersión miden como los valores de una variable se dispersan
alrededor del valor central o media aritmética de la serie, es decir, representan una
distribución alrededor de un valor medio. El grado en el cual los datos numéricos
tienden a esparcirse alrededor de un valor general se denomina variación o dispersión de
los datos. Hay varias formas de medir esa variación o dispersión. Entre las más
comúnmente usadas están el rango, la desviación media, el rango semi-intercuartil, el
rango del percentil 10-90, el coeficiente de variación, la varianza y la desviación
standard. Dentro de estos nos referiremos a los más usados en las publicaciones sobre
investigación científica:

6.2.1 Rango: Es el intervalo o diferencia de valores entre el valor máximo y el valor


mínimo. Rango = Valor máximo – valor mínimo. Por ejemplo: el rango de edades de
una muestra o población entre 45 años y 15 años será: 45 – 15 = 30 años.

El rango de un grupo de datos es la diferencia que existe entre el valor mayor y el valor
menor de dichos datos. Por ejemplo, en un grupo de notas de un examen el valor mayor
fue 19 puntos y el valor menor fue 5 puntos , entonces el rango de las notas es: 19 – 5 =
14 puntos.

El rango de un grupo de datos numéricos, como ya se ha dicho, es la diferencia entre el


valor máximo y el valor mínimo. Por ejemplo, el rango de 2, 5, 8, 10, 13, 16, 22, 27, es
27 – 2 = 25. Algunas veces el rango se indica citando los valores mínimo y máximo. En
este caso el rango se citaría como 2 a 27 ó 2 – 27.
6.2.2 Varianza, variancia o variación

La varianza es la medida de mayor utilidad en todos los análisis estadísticos. Aunque la


varianza misma no es de utilidad directa, ella es la base de todos los cálculos en
estadística, es decir, nos sirve para calcular la desviación standard, el error standard, el
coeficiente de regresión, el coeficiente de correlación y, por supuesto, para hacer el
análisis de varianza, entre otros. La varianza también es llamada media cuadrática,
media cuadrada o cuadrado de la media (en inglés Variance y Mean Square) es una
medida de la dispersión de los valores alrededor de la media.

Es el cuadrado de la desviación estándar y es el segundo momento alrededor de la


media. Sus unidades son el cuadrado de las unidades de la variable. En general, es un
indicador que señala cuan cerca de la media está el valor de la variable. Mientras más
dispersos los valores, mayor será la varianza y por el contrario cuando los valores son
muy similares, es decir, no varían mucho, la varianza será muy pequeña hasta llegar a
cero cuando todos los valores son exactamente iguales.

La varianza, que se simboliza por sigma minúscula al cuadrado, σ2, para la población y
s2 para la muestra, de varias formas

 x
 x  n
2
2

s2 
n 1

Como un ejemplo sencillo, vamos a calcular la varianza de las notas de algunos


estudiantes:
x1 = 15, x2 = 7, x3 = 12, x4 = 10, x5 = 17, x6 = 13, x7 = 10, x8 = 20, x9 = 14, x10
= 15, x11 = 11, x12 = 5. Primero re-agruparemos los valores en orden ascendente, así
que ahora serán:
X1 = 5, x2 = 7, x3 = 10, x4 = 10, x5 = 11, x6 = 12, x7 = 13, x8 = 14, x9 = 15, x10
= 15, x11 = 17, x12 = 20.
Luego calculamos su media: en este caso es de 12.4166 que redondearemos a 12.42.
Ahora elevamos al cuadrado cada valor y los sumamos, lo cual será:
Σx2 = 25+49+100+100+121+144+169+196+225+225+289+400
Σx2 = 2043
Ahora calculamos el factor de corrección (FC) que es la suma de los valores originales
(149) elevada al cuadrado 1492 y dividida entre el número de valores n (en este caso
12), lo cual será: FC = 22201/12, FC = 1850.08. Importante: Este valor nunca puede ser
mayor que la suma anterior o de los valores al cuadrado (2043). Puede ser igual, cuando
no hay variación entre los valores, es decir, son exactamente iguales, pero no mayor,
pues daría un valor negativo de la varianza y sabemos que cualquier número al cuadrado
es positivo, NO (nunca) negativo. Así que este paso nos indica si nuestros cálculos hasta
ahora han sido bien hechos. Si este valor da negativo, debemos rehacer todos los
cálculos y corregir el error.

Ahora, a la suma de los valores cuadrados (2043) le restamos el factor de corrección:


2043 – 1850.08 = 192.9166 que promediamos, es decir, dividimos entre el número de
observaciones (n) aunque para muestras de iguales o menores a 30 observaciones es
mejor dividir entre el número de grados de libertad (n – 1), en este caso 12 – 1 = 11, lo
que nos da: 192.9166 ÷ 11 = 17.901509 que redondearemos a 17.90. Como vemos es un
valor positivo. Este es el valor de la varianza (redondeada en este caso para facilitar la
comprensión del lector), pero que en la realidad debe ser calculada al valor más exacto
posible).
Otro método fácil de calcular la varianza de un grupo de datos numéricos es sumando
las diferencias entre cada valor y la media de la muestra y luego dividiendo esa suma
entre el número de observaciones:
2
 
  x  x 
s2 =
n 1

En el ejemplo anterior, tenemos como media 12.42 al cual le restaremos cada uno de los
valores (por ejemplo: 15 – 12.42 = 2.58; 7 – 12.42 = -5.42 y así sucesivamente hasta
llegar a los 12 datos), luego cada uno de esos valores se eleva al cuadrado (por ejemplo:
2.582 = 6.6564; -5.422 = 29.3764 y así sucesivamente), luego se suman todos estos
valores cuadrados y la suma (en este caso 192.9166) se divide entre el número de grados
de libertad (11) que resulta en 17.901509 que redondeamos a 17.90. Lógicamente es el
mismo resultado que por método anterior. Existen otros métodos para calcular la
varianza, pero estos son los más comúnmente usados.

6.2.3 Desviación Standard (o Estándar) (σ): este es el componente estadístico y el


parámetro de dispersión más usado en todos los experimentos e investigaciones
científicas y es una medida de la media de las variaciones de los valores. La desviación
standard es la variación o dispersión verdadera y absoluta de los valores estudiados. Se
simboliza con sigma minúscula, σ, para la población y con s para la muestra. Su cálculo
es muy sencillo una vez que se tiene la varianza, pues es solo la raíz cuadrada de dicha
varianza y por ser el producto de una raíz cuadrada, su valor es positivo y negativo y se
le prepone el símbolo ±.

 x
 x  n
2
2

s= s2 s=
n 1

En nuestro caso será la raíz cuadrada de 17.90, es decir, s = 17.90 es ±4.2308392 que
redondearemos a ±4.23. Es importante destacar que las unidades de medición de la
desviación standard son, lógicamente, las mismas que las unidades de los datos
originales, es decir, si estamos midiendo las edades en años, las unidades de la
desviación standard estarán expresadas en años. En las publicaciones, informes,
reportes, etc., generalmente, se expresan los valores de la media y las desviaciones
standard como sigue: la media ± la desviación standard y las unidades de medición, por
ejemplo, x ± s, en el caso de las edades en años sería: 12.42 ± 4.23 años
En una población o muestra con distribución normal cuya curva tiene forma de campana
simétrica, el 68.27% de los valores caen dentro de la media más o menos una desviación
standard, es decir que si en nuestro caso la distribución fuese normal, 68.27% de los
valores estarían entre 12.42±4.23, o sea entre 8.19 y 16.65. Esta operación nos indica
que las notas de los estudiantes están muy dispersas y que no siguen la distribución
normal.

6.2.4 Desviación media (σM): Es la media aritmética del valor absoluto de los errores.
Se calcula con la siguiente expresión.

6.2.5 Coeficiente de variación: La desviación standard es una medida de la variación o


dispersión absoluta de los valores de un grupo de datos numéricos, pero a veces se
necesita conocer cuán importante es la variación o dispersión en relación con el
conjunto de datos que se analiza, es decir, la relación que hay entre la desviación
standard y el promedio de dichos datos. A esta relación se le denomina variación o
dispersión relativa, pero es mejor conocida por coeficiente de variación y se simboliza
por V o por CV. Se calcula dividiendo la desviación standard entre la media:

s
CV =
x

Aun cuando el coeficiente de variación es una fracción o parte de la unidad, por


ejemplo, en el caso de las edades será 4.23 entre 12.42 = 0.3405797 o redondeando a
0.3406, esta fracción se transforma a porcentaje (1 = 100%), por lo tanto en el ejemplo
será 34.06%. Se describe como un grupo de datos (edades) con una variación de
34.06%. Es de notar que el coeficiente de variación es independiente de las unidades
usadas. Por esta razón, el coeficiente de variación es especialmente útil para comparar
grupos da datos de diferentes unidades, por ejemplo si se quisiera comparar las edades
del ejemplo anterior con las notas (unidad: puntos) que obtuvieron los estudiantes o con
sus estaturas (unidad: centímetros), etc. Sin embargo, la principal desventaja del
coeficiente de variación es que pierde su utilidad cuando la media es cercana a cero,
pues cualquier cifra de la desviación standard dará por resultado un muy alto coeficiente
de dispersión (porcentaje de variación), .lo cual puede ser no cierto.

6.2.6 Variabilidad: la variabilidad puede ser presentada por el rango de los valores o
por el promedio de las desviaciones con respecto al promedio .sin embargo, el
parámetro de importancia estadística es el promedio del cuadrado de las desviaciones
con respecto al promedio. a este término se le llama varianza y se define como
𝑁

ơ2 = ∑(𝑋𝑖 − µ)2
𝑖=1
Si el promedio de la población µ no es conocida se puede utilizar el promedio de la
muestra 𝑥⃗ , así
𝑁
2
1
𝑆 = ∑(𝑋𝑖 − 𝑥̅ )2
𝑁−1
𝑖−1

El mejor estimado de ơ2 es el valor de 𝑠 2 cuando se usa N-1 en lugar de N. la prueba de


esto puede encontrarse en textos de estadística aplicada.
La raíz cuadrada de varianza se conoce como la desviación típica o desviación estándar,
donde la variabilidad se mide en las mismas unidades que el promedio. El coeficiente de
variación 𝐶𝑉` definido como ơ⁄µ o 𝑆⁄𝑋 es una expresión útil cuando están comparando
variabilidad relativa.

6.2.7 Sesgo: Se denomina sesgo al grado de asimetría que tiene la curva de una
distribución de datos numéricos. Una distribución simétrica muestra la propiedad de que
los momentos impares con cero. Una distribución sesgada, por el contrario presenta u
exceso de peso hacia unos de los lado del centro. El tercer momento de la distribución
es utilizado para el sesgo.

𝑁
1
𝛼 = ∑(𝑥𝑖 − µ)3
𝑁
𝑖−1

El mejor estimado del sesgo de la población

𝑁
𝑁
a= ∑(𝑥𝑖 − 𝑥̅ )3
(𝑁 − 1) (𝑁 − 2)
𝑖−1

Un coeficiente de sesgo c se representa por 𝛼/ơ3 o por 𝑎/𝑠 3 para distribución simétrica
el tercer momento es cero y 𝐶𝑠 = 0. Para la derecha 𝐶𝑠 > 0 y para sesgo ala izquierda
𝐶𝑠 < 0.

7. DISTRIBUCION DE PROBABILIDAD

Existen varias distribuciones de probabilidad que se usan en el diseño hidrológico.


Teniendo en cuenta que en hidrología los registros disponibles son una pequeña muestra
de la población, resulta lógico probar diferentes distribuciones para obtener aquella que
mejor se ajuste. Se debe tener presente que una determinada distribución de
probabilidad no necesariamente se aplica por igual a diferentes ríos (en el caso de
análisis de caudales) o en diferentes tipos de lluvias (en el caso de análisis de
precipitaciones).

Prácticamente todas las distribuciones de variables aleatorias en hidrología son de


naturaleza empírica, obtenidas de un número limitado de datos. Las funciones de
distribución de probabilidad, tienen parámetros que deben ser estimados a partir de la
muestra. Desde el punto de vista matemático si una función tiene más parámetros, es
más flexible para ajustar a una distribución empírica.
7.1 Tipo de distribución de probabilidades

Muchas distribuciones de probabilidades teóricas bien definidas han sido utilizadas para
describir ciertos procesos hidrológicos y las más comunes han sido aplicadas con éxito a
cierto grupo de fenómenos hidrológicos. A continuación se presentan las más utilizadas.

7.1.1 Distribución Binomial: es utilizada para aproximar otras distribuciones o para


analizar fenómenos que tienen dos posibilidades: éxito o falla. Si se desea
estudiar la posibilidad de que llueva en un día determinado las posibles
respuestas son si o no. La posibilidad de éxito se expresa como P

N!
P(X) = P X (1 − P)N−X
X! (X − X)!

7.1.2 Distribución Poisson: esta distribución de un solo parámetro ‫ ﮑ‬y es utilizada en


ambos arribos y teoría de colas. La distribución se define como

7.1.3 Distribución Normal: La distribución normal (Gaussiana) surge del teorema del
límite del valor central, el cual establece que una variable aleatoria x está
normalmente distribuida con el promedio μ y la desviación estándar σ. La función
de distribución de probabilidad (frecuencia acumulada) proporciona la
probabilidad de que X sea menor o igual a x así:

7.1.4 Distribución Gamma: Tiene gran aplicación en estadística matemática y se ha


estado aplicando en hidrología cada vez más, ahora que se encentran con
computadores que facilitan los cálculos. Un tipo especial de la distribución
Gamma es la distribución Pearson Tipo III. Esta es utilizada en los estudios de
crecidas de ríos y cañadas en la forma de logaritmos, donde la transformación y =
log 𝑥 se utiliza para disminuir el riesgo esta distribución se define como
𝑥
𝑥𝛼 𝑒𝛽
𝐹(𝑥) = 𝑎+1
𝛽 𝛤(𝛼 + 1)

Donde 0 ≤ 𝑥 < ∞; µ = 𝛽(𝛼 + 1) y ơ2 = 𝛽 2 (𝛼 + 1)

7.1.5 Distribución Gama de 3 Parámetros o Pearson Tipo III: Es la distribución


Pearson III, pero usada con los logaritmos de los valores de la muestra. Es una
distribución muy usada en Estados Unidos y recomendada por el USWRC (1976).
A diferencia de las ecuaciones de log normal que usan logaritmos naturales (ln),
esta distribución usan los logaritmos en base 10 (log).
El USWRC (1976) recomienda esta distribución para definir series anuales de crecidas.
Últimamente ha sido bastante cuestionada esta metodología, aunque conviene tenerla
presente en el diseño hidrológico. Para calcular el coeficiente de frecuencia, k, de la
distribución Log-Pearson III (para caudales máximos anuales), la ecuación
recomendada (USWRC, 1976) es:

Para la distribución Pearson tipo III, se deberá calcular la media, la desviación estándar
y el coeficiente de asimetría:

Para determinar el factor de frecuencia, es necesaria la utilización de siguiente Tabla,


para lo cual es necesario calcular el coeficiente de asimetría y la probabilidad o período
de retorno respectivo para la variable analizada. En el caso de la distribución log-
Pearson tipo III, el procedimiento es el mismo, lo único que cambia es que se deberá
trabajar con los logaritmos de las variables, y se utilizará la misma tabla para determinar
el factor de frecuencia.

Aplicaciones en Hidrología

La distribución pearson tipo III es de gran utilidad en hidrología, siendo algunas de sus
principales aplicaciones:
 Como referencia para comparar varias distribuciones teóricas de ajuste con una
distribución empírica.
 Análisis de errores aleatorios en las observaciones o mediciones hidrológicas.
 Para aplicar inferencia estadística
 Para realizar ajustes de distribución empírica de variables hidrológicas de
precipitación, caudales, temperatura, etc., tales como valores anuales, mensuales
o valores acumulados anuales, mensuales.

7.2 Análisis de valores extremos

El análisis de valores extremos, especialmente en valores máximos de escorrentía,


puede ser aplicado a la precipitación, para las elevaciones del nivel de un rio tanto para
inundaciones como para sequias
Las series de valores extremos incluyen los máximos o mínimos valores, cada uno ha
sido seleccionado de un intervalo de tiempo igual en el record hidrológico. Por ejemplo
para una serie de valores de crecida de un rio, se selecciona el valor máximo ocurrido en
cada año. si se tiene una serie de 2 años se puede tomar los máximos de cada año o los
veintes valores mayores del riesgo .

El análisis de frecuencia de valores extremos referido a caudales, es decir el análisis a


que son sometidos los caudales máximos anuales. El objeto es calcular el caudal de
diseño de estructuras como los aliviaderos de las presas de embalse.

Existen dos distribuciones probabilísticas que son la más utilizadas para estos estudios:
la distribución de Gumbel y la de log Pearson tipo III :

7.2.1 Distribución Gumbel o de valores extremos tipo I: Esta distribución, se debe


aplicar sólo a valores extremos de caudales. La función es de interés práctico
importante, no obstante las múltiples objeciones que se le hacen, en el sentido de
aplicar una función sin límites a series de caudales, donde sus valores no pueden
ser menores de cero. Para calcular el coeficiente de frecuencia, k, de la
distribución Gumbel tipo I (valores extremos), partiendo de la ecuación de
densidad de probabilidad de Gumbel, (Chow, 1964) lo expresa como:

Aplicaciones en hidrología

La distribución Gumbel o ley de valores extremos tipo I, se utiliza generalmente para:

 Realizar ajustes de distribución empíricas de variables hidrológicas tales como


valores de caudales máximos anuales, mensuales o precipitaciones máximas
anuales, entre otros.
 Como referencia para comparar varias distribuciones teóricas de ajuste con una
distribución empírica.
 Para efectuar inferencias estadísticas
7.2.2 Distribución Log Gamma o LogPearson Tipo III

Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución Pearson


tipo III, se dice que la variable aleatoria X se ajusta a una distribución Log Pearson Tipo
III. Esta distribución es ampliamente usada en el mundo para el análisis de frecuencia
de Caudales máximos. Esta se trabaja igual que para la Pearson Tipo III pero con Xy y
Sy como la media y desviación estándar de los logaritmos de la variable original X.

3.5.1 Función de densidad:

donde,

y0  y <  para  > 0


  y  y0 para  < 0

 y  son los parámetros de escala y forma, respectivamente , y y0 es el parámetro de


localización.

También podría gustarte