Está en la página 1de 12

ESTADISTICA

En el campo de la investigación científica, es común la inquietud por intentar expresar, la


evolución de un determinado fenómeno, mediante una serie de medidas, que la traduzcan al
lenguaje de los números.
La estadística se constituye entonces, en una herramienta indispensable para efectuar
este tratamiento, a fin de obtener la máxima utilidad, en las aplicaciones prácticas, a
partir de los registros de diversos tipos de que se disponen, (en especial caudales y
precipitaciones).
Podemos distinguir dos ramas que han evolucionado en forma separada en el campo de la
estadística:
 estadística descriptiva: es la que intenta obtener toda la información posible de
los datos recogidos, mediante su adecuado ordenamiento. son producto de ella, las
clasificaciones de datos en forma de tablas, procesamiento y archivo mediante
programas de computación, etc.
 estadística matemática: pretende ir más lejos, basándose en comparaciones del
fenómeno con modelos probabilísticos teóricos, a fin de obtener una información,
que no resulta evidente con el simple ordenamiento de los datos. En este campo
se ha desarrollado una teoría matemática, a veces muy compleja, basada en la
teoría de probabilidades, de la que la estadística matemática puede considerarse
como una aplicación práctica.
Los dos conceptos expuestos en el apartado anterior son de importante aplicación en el
campo de la hidrología, sobre todo la de superficie, por corresponder a ella los ciclos más
rápidos de circulación del agua.
La mayoría de las causas que actúan en los ciclos hidrológicos superficiales son de
carácter meteorológico y la propia meteorología se desarrolla fundamentalmente a través
de la estadística, ya que es muy difícil llegar a un estudio matemático y preciso de los
problemas físicos que condicionan los fenómenos hidrológicos.
Sin embargo como los caudales de los ríos y sus cauces constituyen un complejo, menos
complicado y amplio, que la atmósfera, es que es más fácil y viable estudiar
estadísticamente los ríos a través de sus estaciones de aforo, al menos en los cursos
principales.
Por tanto, la meteorología y su estadística aplicada se utilizan para extrapolar donde no
se pueden alcanzar datos de aforos, por tratarse de ríos pequeños para los que no
puede pretenderse que cada uno tenga su propia estación de aforo, o para ampliar la
extensión de las series, puesto que normalmente es más antigua la estadística
meteorológica que la de aforos.
La recopilación de datos hidrológicos y su ordenamiento estadístico, tiene como fin
práctico su aplicación para dimensionar, con el mayor acierto posible, las obras que han de

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
utilizar los recursos hídricos, (embalses, presas, captaciones, obras de conducción,
centrales hidroeléctricas, etc.) y prever el régimen de explotación, de manera que se
obtenga el mayor beneficio posible de las instalaciones construidas.
Se supone siempre que en el futuro, el régimen hidrológico de un río, tendrá cierta
relación con el pasado, y se procura obtener, del conocimiento de la estadística de
caudales, referencias para prever dentro de ciertos márgenes de seguridad, el régimen de
caudales que pueda presentarse en el futuro.

Correlación y regresión: En la mayor parte de los estudios estadísticos se presenta el


problema de predecir los valores que puede tomar una determinada variable. El planteo del
método de solución puede realizarse de varias formas.
En ocasiones se trata de completar, o de ampliar, una serie de datos de la "variable
problema" a partir de series de datos de una, o más, variables que estén relacionadas con
aquélla de alguna manera.
En otras palabras, se trata simplemente de conseguir un cierto conocimiento sobre los
factores que influyen en el valor de la “variable problema”, con el fin de poder realizar
hipótesis adecuadas sobres sus valores desconocidos.
Estos dos aspectos son tratados por la correlación y la regresión respectivamente.
Es importante destacar el hecho de que la aplicación de ambos métodos no proporciona
por sí misma ninguna información del tipo causa-efecto, ya que los resultados expresan
únicamente relaciones numéricas entre las variables estudiadas.
La diferencia entre regresión y correlación puede aclararse mediante las siguientes
consideraciones:
 un problema de regresión considera la distribución de frecuencias de una variable
(dependiente) cuando ésta u otras variables (independientes) se suponen conocidas.
 un problema de correlación, por su parte, considera la variación conjunta de dos
variables sin que se apliquen restricciones a ninguna de ellas.
Por tanto, la correlación obtiene el grado de afinidad entre dos variables, representada
numéricamente por el coeficiente de correlación "", mientras que la regresión obtiene una
ecuación y=f(x), que permite calcular valores de la variable dependiente "y" a partir de la
independiente "x".

Regresión y correlación lineal: Es la teoría que estudia la relación que existe entre dos
variables, despreciando toda posible influencia de otras variables distintas.
Dado un conjunto de pares de valores correspondientes a dos variables “x” e “y”, la ley
más sencilla de regresión o correlación entre ambas es la lineal.

y  a  m* x (1)

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
La recta debe ser tal, que el momento de segundo orden de la masa de puntos del plano
“xy”, con respecto a la misma, sea mínimo, es decir que debe serlo la suma de los
cuadrados de las distancias de tales puntos a la recta.
Esta condición permitirá determinar los parámetros “m” y “n”, de la ecuación de la recta,
con sólo obtener las derivadas parciales de dicha suma respecto a ambos parámetros e
igualarlas a cero.
Ahora bien pueden considerarse tres casos:
1) que se midan las distancias de los puntos a la recta paralelamente al eje de las
“y” (regresión lineal de y sobre x).
2) paralelamente al eje de las “x” (regresión lineal de x sobre y).
3) o perpendicularmente a la propia recta (regresión ortogonal).

Con el objeto de desarrollar el presente práctico vamos a utilizar el tercer caso, donde
los parámetros a utilizar son:
Valor medio: el valor medio o esperanza matemática de una variable aleatoria, que es el
centro de gravedad de la masa de distribución. En la correlación lineal los valores medios
de las variables “x” e “y”, están dadas por:

n n

 xi y i
x i 1
(2) y i 1
(3)
n n

Varianza y covarianza: la varianza se define como el momento de inercia de la masa de


distribución, siendo la covarianza el momento centrifugo.
La varianza en “x” e “y” será:

n n

 ( xi  x ) 2 ( y i  y)2
x  i 1
(4) y  i 1
(5)
n n

Y la covarianza:
n

 ( x  x) * ( y  y)
i i
 xy  i 1
(6)
n
Donde:
 n= número de años o de datos registrados del río en estudio.
 xi= datos de los caudales correspondientes al río B (Qbi).
 yi= datos de los caudales correspondientes al río A (Qai).

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
 x  caudal medio río B.
 y  caudal medio río A.

Regresión y correlación ortogonal: Para obtener la ecuación de la recta respecto a la


cual la suma de las distancias de cada punto de coordenadas xi e yi sea mínima, se aplica
el método de los mínimos cuadrados, llegándose a una ecuación de segundo grado, la que
permite obtener dos raíces que verifican la relación:

2  1  0 (7) Siendo: 2   x2   y2 *    x2 *  y2   xy2   0 (8)

Por lo tanto:
 2
  
  y2  2
  y2 
2

 4 *  x2 *  y2   xy2 
1, 2 
x x
(9)
2

Para determinar el coeficiente angular de la recta se aplica:

 xy
m (10)
2   y2

Por lo tanto, para calcular los valores de datos necesarios, para completar una serie, se
determina, según ecuación (1).

A
Qcal  m * (QiB  x )  y (11)

Análisis de frecuencia: Los sistemas hidrológicos son afectados en ocasiones por eventos
extremos tales como tormentas, crecidas y sequías. La magnitud de un evento extremo
esta inversamente relacionada con su frecuencia de ocurrencia, es decir, eventos muy
severos ocurren con menor frecuencia, que eventos más moderados.
El objetivo del análisis de frecuencia de información hidrológica, es relacionar la magnitud
de los elementos extremos, con su frecuencia de ocurrencia, mediante el uso de funciones
de distribución de probabilidad.

Los requisitos que debe cumplir la información hidrológica (eventos extremos), es que:
 Debe ser independiente.
 Estar idénticamente distribuida (por ejemplo, precipitación diaria máxima anual).
 El sistema hidrológico que la produce (por ejemplo, un sistema de tormenta), sea
aleatorio, independiente del espacio y del tiempo.

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
La información hidrológica empleada, debe ser, seleccionada cuidadosamente, de manera tal
que se satisfaga las suposiciones de independencia y de distribución idéntica.
Los resultados del análisis de frecuencia de los caudales de crecidas pueden utilizarse
para muchos propósitos en ingeniería: diseño de presas, puentes, cauces evacuadotes,
estructuras de control de crecidas, determinar el beneficio económico de proyectos de
atenuación de crecidas, delimitar planicies de inundación, etc.

Series de información hidrológica: La información hidrológica se puede organizar en series


de diferentes características. Las series más utilizadas, en este caso son:
 serie de duración completa, que está compuesta por la totalidad de la información
disponible de un determinado parámetro.
 serie de duración parcial, que es una serie de datos seleccionados de manera tal
que la magnitud de cada uno de ellos sea mayor que un valor base predefinido.
 serie de excedencia anual, constituida por una serie de duración parcial, en la que
el valor base se selecciona de forma tal, que el número de valores de la serie sea
igual al número de años de registro disponible.
 serie de valores extremos, que es aquella, que se constituye con los valores
máximos o mínimos producidos en cada uno de los intervalos de tiempo, de igual
longitud, que se halla dividido el registro.
 serie anual, es una serie de valores extremos, en la que la longitud del intervalo
de tiempo considerada, es de 1 año. Es la serie de valores extremos, más
frecuentemente utilizada, y puede ser a su vez: serie anual máxima, cuando está
conformada por los valores máximos anuales, y serie anual mínima, cuando se
seleccionan para constituirla los valores mínimos anuales.

Curva de frecuencia acumulada de caudales: Hazen propuso la siguiente ecuación (12), con
el objeto de establecer la probabilidad de que un valor “x”, cualquiera, supere al valor
“xi”, correspondientes a una serie de registros, siendo:
 N= numero total de valores que van a ser graficados.
 n= la posición de un valor en la lista ordenada por magnitud descendente.

2 * n 1
P x xi   (12)
2* N

La frecuencia acumulada de caudales correspondientes a los registros del río A, se


obtiene de acuerdo a la siguiente formula:

F x   1  P x xi  (13)

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
Métodos estadísticos para estimar valores extremos: Estos métodos consisten, en
estimar los valores de las crecidas máximas, que pueden producirse en un río, a partir de
una serie de caudales máximos conocidos, extrapolando en dicha serie, mediante el empleo
de una curva de frecuencias para diferentes probabilidades.
El problema se centra en utilizar al máximo los registros de caudales de que se disponen
en la estación, para la cual se busca evaluar la más fuerte crecida a temer, habrá
necesidad así, de emplear principalmente las técnicas estadísticas de análisis de crecidas,
las que permitirán resolver el problema que representa, calcular la probabilidad de que un
caudal superior a un valor dado, sobrevenga al menos una vez, durante un determinado
periodo de tiempo.
El estudio estadístico de crecidas puede orientarse de dos maneras:
 si se desea conocer, sólo la posibilidad, de que se alcance un cierto caudal en un
periodo de tiempo dado.
 si interesa también, la duración de los caudales de crecidas que sobrepasen uno
determinado.
Los datos disponibles de crecidas para ajustar una ley de distribución de caudales
máximos anuales, son en general relativamente escasos, y muchas veces significativamente
menor, debiéndose en base a los mismos, en algunos estudios como por ejemplo la
determinación de la capacidad de un vertedero, estimar caudales de crecidas probables
para periodos muchos más largos en ocasiones hasta 1000 o 10000 años.
En estos casos, en que se extrapola la ley de distribución, a lapsos de tiempo mucho más
extensos que aquél para el cual se dispone de datos, pueden resultar errores
considerable en uno u otro sentido, lo que se confirma observando que por lo general los
datos extremos de que se tiene noticia, presentan muy frecuentemente, una gran
dispersión alejándose de la curva de distribución que se intenta ajustar.
Debe tenerse siempre presente que la extrapolación de los valores de las crecidas para
elevados tiempos de recurrencia a partir de datos de 25 a 50 años, no tiene ningún
fundamento científico sino sólo matemático, por lo que los valores estimados para tales
casos deben tomarse con grandes reservas, y si es posible comprobar por medio de
investigaciones históricas, si las crecidas ocurridas en tiempos lejanos fueron del mismo
orden de magnitud que las obtenidas por extrapolación con las leyes de frecuencia
empleadas.

Leyes de distribución de valores extremos: Los valores extremos son valores máximos o
mínimos seleccionados de conjuntos de datos, por ejemplo el caudal máximo anual en un
lugar dado, es el mayor caudal registrado durante un año hidrológico, y todos los valores
contenidos en el registro histórico conforman un conjunto de valores extremos que se
pueden analizar estadísticamente.

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
Se ha demostrado, que las distribuciones de valores extremos seleccionados de conjuntos
de muestras, de cualquier distribución de probabilidad, cuando el número de valores
extremos seleccionados es grande convergen en una de las tres formas que toman las
distribuciones de valores extremos denominadas tipo I, II y III.

Distribución de Gumbel - Tipo I: Expresa que la probabilidad de ocurrencia de un valor


“X” menor que un valor dado “x”, está dada por la siguiente expresión:

b
P( X  x)  F( x )  e  e (14)

Para que la ecuación (12), represente a los valores de los caudales máximos medios diarios
del río B, se deben calcular los parámetros que la definen, los que son:

xu
b (15) ; u  x  0,5772* (16)

x (x  x) i
2

 (17) ; x  i 1
(18)
1,2825 n 1

x i
Siendo: x i 1
(2)
n

Tiempo de recurrencia o periodo de retorno: Se dice que la variable aleatoria “x” es un


evento extremo, cuando es mayor o igual a un cierto valor umbral “xT”.
El intervalo de recurrencia “t” es el tiempo entre ocurrencia de eventos x>xT.
El periodo de retorno “Tr” de un evento x>xT, es el valor que iguala o excede, una
magnitud especificada (x>xT).

En el caso de utilizar la ley de distribución de valores extremos de Gumbel, para poder


calcular los caudales correspondientes a distintos periodos de recurrencia (Tr), se utiliza
la curva según la ecuación (12), por lo tanto la relación entre la probabilidad, será:

1
p  P( x xT )  (19)
Tr

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
1
Entonces de (17), se deduce que, según (12): F( x )  1  p  1  (20)
Tr

Por lo tanto, si se fija un valor de tiempo de recurrencia, se puede verificar el valor xT,
que verifica la propiedad:

1 b xT  u
F( xT )  1   e e (21) ; siendo: b (22)
Tr 

b
e e  F( xT )   e b  ln( F( xT ) )  e b   ln( F( xT ) )   b  ln  ln( F( xT ) )   (23)

Entonces, igualando (15) y (23):  


b   ln  ln( F( xT ) ) 
xT  u

(24)

Entonces, de (24), queda:  


xT   ln  ln( F( xT ) ) *  u (25)

  1 
Reemplazando (20) en (25), queda: xT  u  ln  ln1   *  (26)
  Tr 

Mediante la ecuación (26), podemos determinar distintos valores extremos de caudales,


para periodos de recurrencia “Tr”.

En el caso de utilizar la ley de distribución de valores extremos de Log Pearson III, la


misma se basa en convertir los valores “xi”, de la serie de registros, a logaritmos, de
esta manera, para poder calcular los caudales correspondientes a distintos periodos de
recurrencia (Tr), se aplica:

logxT   logx   kT * log x  (27)

Donde: xT= representa el caudal correspondiente a un tiempo de recurrencia determinado.


Xi= representa los caudales correspondientes a los registros del río A.
Tr= tiempo de recurrencia.

Para resolver la ecuación (27), debemos determinar los siguientes parámetros:

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
n n 2

 log( x ) i  log(x )  log(x )


i
log x   i 1
(28) ;  log x   i 1
(29)
n n 1


kT  z  z 2  1 * k   z 3
 6* z   
* k 2  z 2 1 * k 3  z * k 4 
k5
(30)
3 3

2,515517 0,802853* w  0,010328* w2


z  w (31)
1  1,432788* w  0,189269* w2  0,001308* w3

 1  1 Cs
w  ln 2  (32) ; p (33) ; k (34)
p  Tr 6

n
n *  logxi   logx 
3

Cs  i 1

n  1* n  2*  log x  3


(35)

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
Ejercicio Nº 1:
a) Determinar los siguientes parámetros correspondientes a la correlación ortogonal
y lineal de “y” sobre “x”, para los datos de caudales máximos medios diarios en
m3/s, de los ríos A y B que se adjuntan:
 valor medio x (caudales río B).
 valor medio y (caudales río A).
 varianza en “x” (x).
 varianza en “y” (y).
 covarianza (xy).
 coeficiente angular de la recta (m).

Río B Río A
Años
X (Qb) Y (Qa)
1909 123
1910 187
1911 185
1912 193
1913 154
1914 489
1915 209
1916 370
1917 101
1918 187
1919 509
1920 187
1921 246
1922 232
1923 196
1924 142
1925 125
1926 104
1927 95
1928 104
1929 130
1930 270
1931 231
1932 160
1933 150
1934 380
1935 220
1936 130

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
1937 272
1938 114
1939 81
1940 135
1941 387
1942 223
1943 159
1944 158
1945 106
1946 120
1947 148
1948 160
1949 108
1950 88
1951 113
1952 133
1953 262
1954 167
1955 110
1956 90 84
1957 115 111
1958 84 100
1959 113 149
1960 114 120
1961 127 138
1962 72 86
1963 214 262
1964 62 65
1965 157 165
1966 100 125
1967 81 97
1968 100 91
1969 129 165
1970 52 54
1971 96 105
1972 225 232
1973 126 167
1974 148 165
1975 106 124
1976 72 87
1977 184 199
1978 218 285
1979 130 124

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:
1980 182 184
1981 115 134
1982 398 512
1983 195 189
1984 338 339
1985 129 121
1986 243 278
1987 402 245
1988 137 112
1989 112 103
1990 144
1991 201
1992 117
1993 127

b) Completar la serie del río A entre los AÑOS 1990 Y 1993.

Ejercicio Nº 2:

c) Graficar la curva de frecuencia acumulada de caudales, correspondientes a los


registros del río A, en el periodo de 1909 a 1993, según la formula propuesta por
Hanzen.

Ejercicio Nº 3:

d) Graficar la ecuación de la ley de distribución de Gumbel (14), en un grafico de


frecuencias acumuladas, del río A, en el periodo de 1909 a 1993.
e) Calcular mediante la ley de distribución de Gumbel, los caudales de recurrencia de
5, 10, 25, 50 100, 200 y 1000 años.

Ejercicio Nº 4:

f) Calcular los parámetros característicos de Log Pearson III, del río A, en el


periodo de 1909 a 1993.
g) Graficar la ecuación de la ley de distribución de Log Pearson III (27), en un grafico
de frecuencias acumuladas, del río A, en el periodo de 1909 a 1993.
h) Calcular mediante la ley de distribución de Log Pearson III, los caudales para los
tiempos de recurrencia de 5, 10, 25, 50, 100, 200 y 1000 años.

Asignatura:

HIDROLOGÍA Y OBRAS HIDRÁULICAS


Alumno:
Universidad Tecnológica PROF.: Ing. LISENO F.
Nacional J.T.P.: Ing. MEDINA P.
Tema:
Facultad Regional San Rafael

T.P.Nº:
ESTADISTICA Fecha:
5 HIDROLOGICA Hoja Nº:

También podría gustarte