Está en la página 1de 75

“Año del buen servicio al ciudadano”

UNIVERSIDAD NACIONAL
SANTIAGO ANTÚNEZ DE MAYOLO

Facultad de Ciencias Agrarias


Escuela Profesional de Ingeniería Agrícola

ANÁLISIS ESTADÍSTICO Y PROBABILIDADES DE


DATOS HIDROLÓGICOS

Curso: Estadística Aplicada a la Ingeniería Agrícola


Docente: Dr. Asnate Salazar Edwin Johny
Semestre: 2018 - I
Presentado por:
 Rodríguez Salazar Marco Manuel
 Diestra Vidal Jean Carlos
 Lugo Chavez Luis Nestor
 Carhuachin Minaya Kenyi Vladimiro
 Romero Cerna Severino Frans

Huaraz – 2018
ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

I. INTRODUCCIÓN

El presente trabajo es de vital importancia puesto que nos permite tener idea del
comportamiento de los fenómenos naturales como las descargas, los gastos su
comportamiento en las diversas estaciones del año puesto que permite tomar las
debidas precauciones, ya que su omisión nos ocasionaría pérdidas económicas.

Y es por eso que se aplicó la estadística a la hidrología con sus diversos métodos
dé probabilidad tales como las distribuciones continuas discretas, etc. Cada una
de estas con sus ventajas y desventajas para cada caso.

También es muy importante para el diseño en la ingeniería como canales, presas,


hidroeléctricas, puentes etc., puesto que solo por este detalle nuestros diseños
no cumplirían a cabalidad su rol para el cual fueron diseñados y no garantizarían
la vida útil a la que han sido diseñados. Para esto la naturaleza en base a estudios
estadísticos.

El análisis de la prueba de Chi-cuadrado nos servirá para ver si los datos se


ajustan a las distribuciones Normal y Gumbel, y una vez comprobado se podrá
calcular el caudal para un periodo de retorno dado, también como la
probabilidad de que el caudal sea mayor al considerado.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

1.1. OBJETIVOS:

Objetivo general:

 Realizar la distribución de frecuencias de los datos del caudal medio


anual y calcular las medidas de distribuciones.
 Realizar la prueba de bondad de ajuste Chi-cuadrado, y ver si los datos
se ajustan a la distribución Normal y distribución Gumbel.

Objetivos secundarios:

 Aprender los procedimientos de la tabulación de datos hidrológicos


mediante los conceptos de probabilidades y estadística.

 Aprender a estimar los parámetros mediante los métodos gráficos,


mínimos cuadrados.

 Desarrollar la prueba de bondad de ajuste dentro de las cuales se


completan al ajuste gráfico, Chi-cuadrado, etc.

1.2. ANTECEDENTES:

Se realizará los estudios de los datos registrados de las estaciones de


LLanganuco, Colcas.

Se cuenta con las tablas de registros de caudales medios mensuales (m3/s),


previamente corregidos y completados.

1.3. JUSTIFICACIÓN:

El trabajo es importante por la interpretación de los conceptos de probabilidades


y estadística aplicada a la hidrología con el fin de poder estimar parámetros
hidrológicos que nos servirán para conocer los caudales registrados en cierta
región de una cuenca, y de esta manera hacer un buen estudio hidrológico
calculando las probabilidades de que un caudal exceda al establecido, como el
caudal que se registrara para un periodo de retorno dado.

II. REVICION BIBLIOGRAFICA.

2.1. POBLACIÓN:

Es el conjunto de mayor de datos individuales, personas o cosas cuyo


estudio nos interesa obtener información. Los datos individuales de una
población se llama unidades elementales u observaciones.

Una población estadística es un conjunto de observaciones medibles o


descritas para cada uno de sus unidades elementales.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

2.2. MUESTRA.

Es una información proporcionada por una parte finita de la población.


También es considerado como un sub-conjunto propio – finito de la
población.

2.3. HISTOGRAMA Y POLÍGONOS DE FRECUENCIA

Son dos representaciones gráficas de las distribuciones de frecuencia.

A. Un histograma o histograma de frecuencias, consiste en una serie de


rectángulos que tienen:

-) Sus bases sobre un eje horizontal (el eje X) con centros en las marcas
de clase y longitud igual al tamaño de los intervalos de clase.

-) Superficies proporcionales a las frecuencias de clase.

B. Un polígono de frecuencias, es un gráfico de línea trazado sobre las


marcas de clase. Puede obtenerse uniendo los puntos medios de los
techos de los rectángulos en el histograma1.

2.4. MEDIA

La media de un conjunto N de datos numéricos X1, X2, ..., XN está


representada por y definida por:

Que es el momento de orden 1.

La mediana de un conjunto N de números ordenados en orden de grandeza,


corresponde al valor del punto central (N es un número impar) o la media
aritmética de los dos valores centrales (en el caso que N sea par)2.
n

 Xini
X i 1
n

2.5. MEDIANA

Es el valor de la serie de datos que se sitúa justamente en el centro de la


muestra (un 50% de valores son inferiores y otro 50% son superiores).

1
Ing. MAXIMO VILLON BEJAR Pág. 73
2
Ing. MAXIMO VILLON BEJAR Pág. 48.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

No presentan el problema de estar influido por los valores extremos, pero


en cambio no utiliza en su cálculo toda la información de la serie de datos
(no pondera cada valor por el número de veces que se ha repetido).

n 
  N i 1 
M e  Yi 1  Ci  2 
 ni 
 

2.6. MODA

Localiza el dato de mayor frecuencia. Es el valor del dato cuya frecuencia


es máxima.

• Si la distribución de frecuencias tiene un solo máximo (máximo


absoluto), la moda es el valor del dato de mayor frecuencia, y se dice
que la distribución de frecuencias es uni- modal.

• Si la distribución de frecuencias tiene más de un máximo (máximo


relativos), se dice que la distribución de frecuencia es multimodal:
Bimodal, Trimodal, etc.

• Si todas las frecuencias son iguales se dice que la distribución no tiene


moda y se trata de una distribución uniforme.

• Para Datos Clasificados La moda es la marca de la clase modal. Para


una mejor aproximación se puede usar la siguiente formula

Momentos muestrales, medidas de asimetría y curtosis:

Existen varias clases de descriptores aritméticos, siendo los momentos el método


adecuado para calcular los estadígrafos, es decir con el cálculo de momentos se
determina los estadígrafos o estadísticos Como en los cursos de estática, resistencia de
materiales, física, matemáticas, etc. se calculan los momentos de órdenes primero,
segundo, etc. generalizando se tiene: momento con respecto al origen de coordenadas
y momentos con respecto a la media

2.7. DESVIACIÓN MEDIA

Es la media aritmética de los valores absolutos de las desviaciones de los


datos con respecto a una medida de tendencia central.
N

 Xi  estadi gra fo  de  posicion


DM  I 1
n

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Si el estadígrafo es la media, se tiene:


N

 Xi  x
DM  I 1
n ; Para datos no clasificados
N

 Xi  x ni
DM  I 1
n ; Para datos clasificados

La desviación media es una medida de dispersión fácil de calcular y se ve


afectada en menor medida por los valores extremos que la desviación
estándar y se una a menudo cuando se dispone de muestras pequeñas que
incluye valores extremos o cuando la distribución es muy asimétrica3

2.8. Desviación Estándar y Variancia

Miden el grado de dispersión de los datos numéricos en torno de un valor


medio.

La Desviación Estándar de un conjunto de datos X1, ..., Xn está definida


por:

La Variancia es el cuadrado de la desviación estándar:

La fórmula de la varianza será:


n

 X  X  ni
2
i
V( x )  i 1
n

2.9. COVARIANZA

El valor de covarianza entre dos conjuntos de datos numéricos a y b, con


N puntos es definido por:

3
Ing. MAXIMO VILLON BEJAR Pág. 105

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Este valor indica el grado de similitud entre los conjuntos a y b, o sea, como
los datos están correlacionados entre sí. Cuanto mayor es la covarianza,
mayor es el grado de correlación entre los datos.

2.10.COEFICIENTE DE CORRELACIÓN

El coeficiente de correlación mide la similitud entre dos conjuntos de datos


numéricos sobre una escala absoluta de [-1, 1]. Este coeficiente es

Calculado a través de la división del valor de covariancia entre la raíz


cuadrada del producto de las desviaciones estándar de los conjuntos de
datos a y b:

2.11.COEFICIENTE DE VARIACIÓN

El efecto de la variación o dispersión con relación a la media puede ser


medido por la dispersión relativa, definida por:

Dispersión Relativa = Dispersión Absoluta/Media

Si la dispersión absoluta corresponde a la desviación estándar, la dispersión


relativa es denominada coeficiente de variación v:4

El coeficiente de variación deja de ser útil cuando la media es próxima de


cero. Su fórmula está representada por

Sx
C.V .( x )  *100%
X

2.12.COEFICIENTE DE MOMENTO DE ASIMETRÍA

La asimetría de una muestra se mide mediante el coeficiente de asimetría,


para el cálculo del coeficiente de asimetría se emplea el tercer momento
con respecto a la media y para que este coeficiente no tenga dimensiones
el tercer momento se divide entre la desviación estándar elevado a la
potencia 3.

Es el grado de desvío o alejamiento del eje de simetría de una distribución.


Para distribuciones asimétricas, la media tiende a situarse del lado de la
cola más larga de la distribución. Este coeficiente puede ser definido
usando el 3 momento centrado en la media y la desviación estándar:5

4
Ing. MAXIMO VILLON BEJAR Pág. 107.
5
Ing. MAXIMO VILLON BEJAR Pág. 105

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

n 2 m3 n
g  Cs 
n  1n  2S 3 m3 
1
n
∑ x - x  i
3

i 1

 Sí g=0 es una distribución simétrica

 Sí g>0 es una distribución sesgada a la derecha (polígono de


frecuencias con cola más larga a la derecha)

 Sí g<0 es una distribución sesgada a la izquierda (polígono de


frecuencias con cola más larga hacia la izquierda).

• El sesgo del polígono de frecuencias se aprecia trazando una vertical por la


moda donde se diferencia la cola del polígono de frecuencias.

• Es importante indicar que los tres números son suficientes para tener una idea
de la forma del histograma.

2.13.COEFICIENTE DE KURTOSIS

El grado apuntamiento del polígono de frecuencias (forma puntiaguda del


polígono de frecuencias) se mide mediante el coeficiente de curtosis. Para el
cálculo del coeficiente de curtosis se emplea el cuarto momento con respecto a
la media y para que este coeficiente no tenga dimensiones el cuarto momento
se divide entre la desviación estándar elevado a la potencia 4

Mide el grado de achatamiento de una distribución de datos y puede ser


definido por la división del momento de grado 4 centrado en la media entre la
variancia elevada al cuadrado. O sea:
n
n3 M 4
CK   x  x  4

n  1n  2n  3S 4


i
i 1
M4 
n
Es una medida estadística que describe el apuntamiento o achatamiento de una
cierta distribución con respecto a una distribución normal. La kurtosis positiva
indica una distribución relativamente apuntada, y la negativa indica una
distribución relativamente achatada. En una distribución normal la kurtosis es
igual a 3, a los valores mayores a 3 se los llama kurtosis excesiva. El caso de
kurtosis excesiva indica que hay una mayor probabilidad de que los retornos
observados estén más alejados de la media que en una distribución normal.
Leptokurtosis se denomina al atributo de una distribución con muy altos índices
de kurtosis.

El valor del coeficiente de curtosis es costumbre comparar con Ck=3 que es


coeficiente de apuntamiento de una curva continua de forma de una campana
(curva normal).

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

 Sí Ck>3 es una distribución leptocúrtica, picuda o puntiaguda.

 Sí Ck=3 es una distribución mesocúrtica o moderada (curva normal)

 Sí Ck<3 es una distribución platicúrtica, achatada o plana.

2.14.DESVIACIÓN ESTÁNDAR MUESTRAL.

La varianza muestral está medida en el cuadrado de las unidades


observadas al hacer las mediciones contenidas en la muestra. Para
devolverse a una estadística que use las mismas unidades que las
observaciones, es necesario calcular su raíz cuadrada.

Lo anterior conduce a la definición de la estadística denominada


'desviación estándar muestral', que no es otra cosa que la raíz cuadrada de
la varianza

Para una muestra de tamaño n, x1, ..., xn, se tiene que:

El uso de esta estadística es recomendado en aquellos conjuntos de datos


que ofrecen cierto grado de simetría respecto de su centro. En estos casos,
habitualmente tiene sentido medir discrepancias de un valor con el centro
de los datos usando múltiplos de la desviación estándar.

A modo de ejemplo, se puede decir que un valor está bastante alejado del
centro de los datos si su distancia de él supera dos desviaciones estándar.

Apoyándose en la idea anterior, la desviación estándar puede ser usada


para determinar valores que se encuentran 'cerca' del centro. Este uso va
más allá de la simple descripción, en otros ámbitos de Estadística es usada
para tomar decisiones respecto de la población de la que fue extraída la
muestra.6

2.15.SESGO

Según el diccionario un sesgo es "una inclinación parcial de la mente". En


nuestro ámbito, la palabra sesgo sirve para definir la tendencia sistemática
de ciertos diseños de ensayos clínicos para producir de forma consistente
resultados mejores o peores que otros diseños.

Skewness o sesgo: Medida estadística que describe la simetría de la


distribución alrededor de un promedio. Si el sesgo es igual a cero, la
distribución es simétrica; si el sesgo es positivo la distribución una tendrá

6
Ing. MAXIMO VILLON BEJAR Pág. 93

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

una cola asimétrica extendida hacia los valores positivos. Un sesgo


negativo indica una distribución con una cola asimétrica extendida hacia
los valores negativos7.

AJUSTE DE UNA DISTRIBUCION DE PROBABILIDADES

La distribución de Probabilidades es una función que representa la probabilidad de


ocurrencia de una variable aleatoria.

Ajustando una distribución a un conjunto de datos hidrológicos, una gran cantidad de


información de la muestra se resume en la distribución y sus parámetros.

Se tiene como objetivo del Ajuste de una Distribución, Obtener los parámetros: y
2

METODO DE MOMENTOS

Las propiedades de las distribuciones pueden ser definidas completamente en términos


de los momentos. Los momentos en estadística son similares a los momentos en física
(rotación respecto al origen).8

METODO DE MAXIMA VEROSIMILITUD

N
L   f ( x, ,  ,  ,....)
i 1

La función de Verosimilitud de la Muestra, como:

Para un calculo más simple se puede usar de la siguiente forma:


N
Ln L =  f ( x, ,  ,  ,....)
i 1

Derivando parcialmente respecto a cada parámetro se tiene el Conjunto de Ecuaciones


de Máxima verosimilitud:

LnL LnL LnL


0 0 0
  

Los Parámetros se hallan resolviendo el Conjunto de Ecuaciones de Máxima


verosimilitud.

7
Ing. MAXIMO VILLON BEJAR Pág. 94
8
Ing. MAXIMO VILLON BEJAR Pág. 41

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGÍA

El comportamiento de las variables aleatorias discretas o continuas se describe con la


ayuda de Distribuciones de Probabilidad. La variable se designa por mayúscula y un
valor específico de ella por minúscula.

Por P(x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente


P(a  x  b) denota la probabilidad de que un evento se encuentre en el intervalo (a,b).
Si conocemos la probabilidad P(a  x  b) para todos los valores de a y b, se dice que
conocemos la Distribución de Probabilidades de la variable x.

Si x es un número dado y consideramos la probabilidad P(X  x):

F(x)= P(X  x):

Llamamos F(x) la función de distribución acumulada.

3 DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES


CONTINUAS

3.1 DISTRIBUCION NORMAL

La distribución normal es una distribución simétrica en forma de campana,


también conocida como Campana de Gauss. Aunque muchas veces no se
ajusta a los datos hidrológicos tiene amplia aplicación por ejemplo a los datos
transformados que siguen la distribución normal9.

3.1.1 FUNCIÓN DE DENSIDAD:

La función de densidad está dada por

Los dos parámetros de la distribución son la media  y desviación estándar 


para los cuales (media) y s (desviación estándar) son derivados de los datos.

3.1.2 ESTIMACIÓN DE PARÁMETROS:

9
Ing. MAXIMO VILLON BEJAR Pág. 169.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

3.1.3 FACTOR DE FRECUENCIA:

1. 1. Si se trabaja con los X sin transformar el K se calcula como

Este factor es el mismo de la variable normal estándar

3.1.4 LIMITES DE CONFIANZA:

Donde  es el nivel de probabilidad es el cuartil de la distribución normal


estandarizada para una probabilidad acumulada de 1- y Se es el error
estándar10

3.2 DISTRIBUCIÓN LOGNORMAL DE DOS PARÁMETROS

Si los logaritmos Y de una variable aleatoria X se distribuyen normalmente se


dice que X se distribuye normalmente.

Esta distribución es muy usada para el cálculo de valores extremos por ejemplo
Qmax, Qmínimos, Pmax, Pmínima (excelentes resultados en Antioquia).
Tiene la ventaja que X>0 y que la transformación Log tiende a reducir la
asimetría positiva ya que al sacar logaritmos se reducen en mayor proporción
los datos mayores que los menores.

Limitaciones: tiene solamente dos parámetros, y requiere que los logaritmos


de las variables estén centrados en la media11

3.2.1 FUNCIÓN DE DENSIDAD:

y = ln x

10
Ing. MAXIMO VILLON BEJAR Pág. 170.
11
Ing. MAXIMO VILLON BEJAR Pág. 179

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Donde,
y: media de los logaritmos de la población (parámetro escalar), estimado

y: Desviación estándar de los logaritmos de la población, estimado sy.12

3.2.2 ESTIMACIÓN DE PARÁMETROS:

3.2.3 FACTOR DE FRECUENCIA:

Puede trabajarse en el campo original y en el campo transformado.

2. 2. Campo transformado: Si se trabaja en el campo transformado


se trabaja con la media y la desviación estándar de los logaritmos, así:

Ln(XTr) = xTr+KSy

de donde,

XTr = eln (xTr)

Con K con variable normal estandarizada para el Tr dado, xy media de


los logaritmos y Sy es la desviación estándar de los logaritmos.

3. Campo original: Si se trabaja con los X sin transformar el K se


calcula como

K es la variable normal estandarizada para el Tr dado, es el coeficiente de


variación, x media de los datos originales y s desviación estándar de los datos
originales.

12
Ing. MAXIMO VILLON BEJAR Pág. 181

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

3.2.4 LIMITES DE CONFIANZA:

En el campo transformado.

en donde, n número de datos, Se error estándar, KT variable normal


estandarizada.

3.3 DISTRIBUCION GUMBEL

Una familia importante de distribuciones usadas en el análisis de frecuencia


hidrológico es la distribución general de valores extremos, la cual ha sido
ampliamente utilizada para representar el comportamiento de crecientes y
sequías (máximos y mínimos)13.

3.3.1 FUNCIÓN DE DENSIDAD:

En donde  y  son los parámetros de la distribución.

3.3.2 ESTIMACIÓN DE PARÁMETROS

Donde son la media y la desviación estándar estimadas con la muestra.

3.3.3 FACTOR DE FRECUENCIA:

13
Ing. MAXIMO VILLON BEJAR Pág. 210.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Donde Tr es el periodo de retorno. Para la distribución Gumbel se tiene que


el caudal para un período de retorno de 2.33 años es igual a la media de los
caudales máximos.

3.3.4 LIMITES DE CONFIANZA

Xt  t(1-) Se

KT es el factor de frecuencia y t(1-) es la variable normal estandarizada para


una probabilidad de no excedencia de 1-.

3.4 DISTRIBUCION GAMMA DE TRES PARÁMETROS O PEARSON


TIPO 3

Esta distribución ha sido una de las más utilizadas en hidrología. Como la


mayoría de las variables hidrológicas son sesgadas, la función Gamma se utiliza
para ajustar la distribución de frecuencia de variables tales como crecientes
máximos anuales, Caudales mínimos, Volúmenes de flujo anuales y
estacionales, valores de precipitaciones extremas y volúmenes de lluvia de corta
duración. La función de distribución Gamma tiene dos o tres parámetros.14

3.4.1 FUNCIÓN DE DENSIDAD:

Donde,

x0  x   para   0

  x  x0 para   0

 y  son los parámetros de escala y forma, respectivamente , y x 0 es el


parámetro de localización.

14
Ing. MAXIMO VILLON BEJAR Pág. 226.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

3.4.2 ESTIMACIÓN DE PARÁMETROS:

Cs es el coeficiente de asimetría, son la media y la desviación


estándar de la muestra respectivamente

3.4.3 FACTOR DE FRECUENCIA:

Donde z es la variable normal estandarizada

Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con


la muestra.

3.4.4 INTERVALOS DE CONFIANZA:

Xt  t(1-) Se

Donde S es la desviación estándar de la muestra, n es el número de datos y 


se encuentra tabulado en función de Cs y Tr.

Intervalos de confianza

Xt  t(1-) Se

3.5 DISTRIBUCIÓN LOG LOGPEARSON DE 3 PARÁMETROS

Si los logaritmos Y de una variable aleatoria X se ajustan a una distribución


Pearson tipo III, se dice que la variable aleatoria X se ajusta a una distribución
Log Pearson Tipo III. Esta distribución es ampliamente usada en el mundo
para el análisis de frecuencia de Caudales máximos. Esta se trabaja igual que
para la Pearson Tipo III pero con Xy y Sy como la media y desviación estándar
de los logaritmos de la variable original X15.

15
Ing. MAXIMO VILLON BEJAR Pág. 208.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

3.5.1 FUNCIÓN DE DENSIDAD:

Donde,

y0  y   para   0

  y  y0 para   0

 y  son los parámetros de escala y forma, respectivamente , y y0 es el


parámetro de localización.

3.5.2 ESTIMACIÓN DE PARÁMETROS:

Cs es el coeficiente de asimetría, son la media y la desviación


estándar de los logaritmos de la muestra respectivamente.

3.5.3 FACTOR DE FRECUENCIA:

Donde z es la variable normal estandarizada

Este valor de K se encuentra tabulado de acuerdo al valor de Cs calculado con


la muestra.

3.5.4 INTERVALOS DE CONFIANZA:

Xt  t(1-) Se

Donde Sy es la desviación estándar de los logaritmos de la muestra, n es el


número de datos y  se encuentra tabulado en función de Cs y Tr.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

4 AJUSTE DE DISTRIBUCIONES

Para la modelación de caudales máximos se utilizan, entre otras, las


distribuciones Log - Normal, Gumbel y Log-Gumbel principalmente. Para
seleccionar la distribución de probabilidades de la serie histórica se deben tener
en cuenta algunas consideraciones.

Cuando en la serie histórica se observan “outliers [1]” es necesario verificar la


sensibilidad del ajuste debido a la presencia de estos, (Ashkar, et al. 1994) 16

 Para el ajuste a las distribuciones Log-Normal, Log-Gumbel y Log-Pearson se


requiere transformar la variable al campo logarítmico para modelarla, con lo
que se disminuye la varianza muestral, pero también se filtran las variaciones
reales de los datos.

Las distribuciones de dos parámetros fijan el valor del coeficiente de asimetría,


lo que en algunos casos puede no ser recomendable. La distribución Log -
Normal de dos parámetros sólo es recomendable sí el coeficiente de asimetría
es cercano a cero. Las distribuciones Gumbel y Log - Gumbel son
recomendables si el coeficiente de asimetría de los eventos registrados es
cercano a 1.13

Para ajustar distribuciones de tres parámetros (Log Normal III, Log Pearson)
se requiere estimar el coeficiente de asimetría de la distribución; para ello es
necesario disponer de una serie con longitud de registros larga, mayor de 50
años, (Kite, 1988). Las distribuciones de dos parámetros son usualmente
preferidas cuando se dispone de pocos datos, porque reducen la varianza de la
muestra, (Ashkar, et al. 1994).

 Para seleccionar la distribución de probabilidades adecuada se debe tratar de


utilizar información adicional del proceso hidrológico que permita identificar
la forma en que se distribuye la variable. Usualmente es muy difícil determinar
las propiedades físicas de los procesos hidrológicos para identificar el tipo de
distribución de probabilidad que es aplicable.

 Kite (1988) y Mamdouh (1993) afirman que no existe consistencia sobre cuál
es la distribución que mejor se ajusta a los caudales máximos y recomiendan
seleccionar el mejor ajuste a criterio del modelador con la prueba de ajuste
gráfico o basado en el comportamiento de las pruebas estadísticas de bondad
del ajuste (por ejemplo, Chi Cuadrado, Smirnov-Kolmogorov, Cramer-Von
Mises) en las que se calcula un estimador y se compara con un valor tabulado
para determinar si el ajuste es adecuado o no. En la prueba de ajuste gráfica se
dibujan los valores registrados en la serie contra la distribución teórica de
probabilidades y de manera visual (subjetiva) se determina si el ajuste es
adecuado o no.

16 Ing. MAXIMO VILLON BEJAR Pág. 242.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Cuando la información es adecuada el análisis de frecuencia es la metodología


más recomendable para la evaluación de eventos extremos, ya que la
estimación depende solamente de los caudales máximos anuales que han
ocurrido en la cuenca y no da cuenta de los procesos de transformación de la
precipitación en escorrentía. Obviamente tiene algunas limitaciones
relacionadas con el comportamiento de la serie histórica y con el tamaño y
calidad de los datos de la muestra.

Cuando se presenten cambios o tendencias en la serie histórica se deben


utilizar técnicas estadísticas que permitan removerlos para poder realizar el
análisis de frecuencias (Kite, 1988; Mamdouh, 1993; Ashkar, et al. 1994).

 La selección inadecuada de la distribución de probabilidades de la serie


histórica arrojará resultados de confiabilidad dudosa, (Ashkar, et al. 1994).

El tamaño de la muestra influye directamente en la confiabilidad de los


resultados, así a mayor período de retorno del estimativo mayor longitud de
registros necesaria para mejor confiabilidad en los resultados.

4.2 PRUEBAS DE AJUSTE

Para la evaluación de probabilidades se han propuesto una serie de pruebas


estadísticas que determinan si es adecuado el ajuste. Estos son análisis
estadísticos y como tal se deben entender, es decir, no se puede ignorar el
significado físico de los ajustes.

Tipos de pruebas de ajuste de bondad

 Ajuste gráfico
 Ajuste Estadístico
 Ji-Cuadrado
 Sirnov-Kolmogorov.

4.2.1 PRUEBA SMIRNOV KOLMOGOROV

El estadístico Smirnov Kolmogorov D considera la desviación de la función


de distribución de probabilidades de la muestra P(x) de la función de
probabilidades teórica, escogida Po(x) tal que .

La prueba requiere que el valor Dn calculado con la expresión anterior sea


menor que el valor tabulado Dn para un nivel de probabilidad requerido.

Esta prueba es fácil de realizar y comprende las siguientes etapas:

 El estadístico Dn es la máxima diferencia entre la función de distribución


acumulada de la muestra y la función de distribución acumulada teórica
escogida.

 Se fija el nivel de probabilidad, valores de 0.05 y 0.01 son los más usuales.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

 El valor crítico D de la prueba debe ser obtenido de tablas en función de  y


n.

 Si el valor calculado Dn es mayor que el D, la distribución escogida se debe


rechazar.17

4.2.2 PRUEBA CHI CUADRADO

Una medida de la discrepancia entre las frecuencias observadas (fo) y las


frecuencias calculadas (fc) por medio de una distribución teórica esta dada por
el estadístico χ²

Donde

si el estadístico χ²=0 significa que las distribuciones teórica y empírica ajustan


exactamente, mientras que si el estadístico χ²>0, ellas difieren. La distribución
del estadístico χ² se puede asimilar a una distribución Chi-cuadrado con (k-n-
1) grados de libertad, donde k es el número de intervalos y n es el número de
los parámetros de la distribución teórica. La función χ² se encuentra tabulada.
Supóngase que una hipótesis Ho es aceptar que una distribución empírica se
ajusta a una distribución Normal. Si el valor calculado de χ² por la ecuación
anterior es mayor que algún valor crítico de χ², con niveles de significancia 
de 0.05 y 0.01 (el nivel de confianza es 1-) se puede decir que las frecuencias
observadas difieren significativamente de las frecuencias esperadas (o
calculadas) y entonces la hipótesis Ho se rechaza, si ocurre lo contrario
entonces se acepta.

[1] Aunque no existe una definición generalmente aceptada, se puede


entender como valores extremos, muy superiores a los demás registrados
(Ashkar, et al. 1994).18
Se basa en el cálculo de frecuencias tanto los valores observados como los valores
esperados para un número determinado de intervalos. Esta prueba es comúnmente
usada para verificar la bondad de ajuste de la distribución empírica a una
distribución teórica conocida (Propuesta por Karl Pearson 1900)

k
 i  ei 
2

 
2
c ......................(1)
i 1 ei

17
Ing. MAXIMO VILLON BEJAR Pág. 151.
18
Ing. MAXIMO VILLON BEJAR Pág. 151.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Dónde:
k k

   e
i 1
i
i 1
i N

Para lo cual:
 c2  Valor calculado de Ji-Cuadrado

 i  Número de valores observados en el intervalo de clase i


ei  Número de valores esperados en el intervalo de clase i.
K= Número de intervalos de clase.

Asignando probabilidades a la ecuación es decir asignando igual probabilidades a


la ecuación (1) es decir asignando igual probabilidad de ocurrencia a cada intervalo
de clase se tiene:

 
2
k
N i  NPi  2
c ..........................(2)
i 1 NPi

Dónde:
Ni: Número de observaciones que caen dentro de los límites de clases ajustadas
del intervalo i
N: Tamaño muestral
Pi: Probabilidad igual para todos los intervalos de clases.

1
Pi  ó ei  Pi N
k
Simplificando la ecuación (2) se obtiene la fórmula computacional desarrollada
por Markovic.

K
K
 c2 
N
Ni 1
i
2
 N ......................(3)

El valor de  c2 obtenido por la ecuación (3) se compara con el  t2 donde ese se


determina con:

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Nivel de Significación   0,05 ó   0,01


Grados de libertad g.l.  k  1  h

Dónde.: h= Número de parámetros a estimarse.


h=2, Para la distribución Normal.
h=3, Para la distribución Log- Normal de 3 parámetros.
Criterios de Decisión:
Se fundamenta en la comparación del valor calculado de Ji-Cuadrado con el valor
tabular encontrado, esto es:

A) Si la Ji-Cuadrado calculado es menor o igual que el valor tabular, es decir:


 c2   t2
Entonces, se acepta la hipótesis que el ajuste es bueno al nivel de significación
seleccionado.
B) Si el Ji-Cuadrado calculado es mayor que el valor tabular, es decir:
 c2   t2
Entonces el ajuste es malo y se rechaza la hipótesis siendo necesario probar con
otra distribución teórica.
Ventajas y Limitaciones:
1.- Es aplicable sólo para ajustes a la distribución normal, puesto que ha sido
desarrollado con base en los datos normales e independientes.
2.- Se realiza en la función densidad de datos agrupados en intervalos de clases.
3.- Requiere u conocimiento a priori, de la función de distribución teórica utilizada
en el ajuste.
4.- En la práctica se usa para cualquier modelo de ajuste, pero estrictamente es
válido par ala normal.
5.- Es de fácil aplicación.

IV. MATERIALES

Para el desarrollo del presente trabajo empleamos los siguientes materiales:


 Registro de caudales medios anuales de las cuencas:

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

 Estación LLanganuco
 Estación Rio Colcas
 Uso de computadora
 Software’s Como: Excel, Word.
 Calculadora HP

V. METODOLOGÍA

PROCEDIMIENTO A SEGUIR

Para la distribución de frecuencias:


 Obtención de los limites como son el máximo y el mínimo y acomodarlos en
forma ascendente.
 Obtuvimos un rango de variación: R=Ls-Li
 Calculo del número de intervalos de clase, según la siguiente fórmula:
K= 1+3.3Log(n), y aproximándolo a un número entero.
 Calculo del intervalo de clase:
A=K/m-1
 Calculo de la distribución de incremento:=R’-R
 Procedemos a llenar el cuadro de distribución de frecuencias que detallamos en
la parte de cálculos.
 Calculamos las medidas descriptivas, utilizando las siguientes formulas

Tendencia central
n

X n
i 1
i i
Media aritmética: X 
n
n 
 2  Fm 1 
Mediana: X m  Lm  Am  
 fm 
 
 1 
Moda M o  L i  Ai  
 1   2 

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Medidas de dispersión
n

 Xi  X
i 1
Desviación DM 
n

 Xi  X 
n
2

i 1
Varianza V( X ) 
`n

Desviación estándar Sx  Vx

SX
C.V( X )  * 100%
Coeficiente de variación X

Medidas de asimetría

Coeficiente de Asimetría

n 2 m3 n
g  Cs 
n  1n  2S 3 m3 
1
n
∑ x - x  i
3

i 1

Índice de Apuntamiento o Curtosis :

n
n3 M 4
CK   x  x  4

n  1n  2n  3S 4


i
i 1
M4 
n

 Con los datos de cada una de las estaciones elegidas (promedios anuales) se hace
un proceso estadístico para determinar, las medidas de distribución tales como la
media aritmética, la mediana, la moda, la desviación estándar y varianza.

 Luego hacemos una aproximación a las distribuciones teóricas más utilizadas en


hidrológica tales como la normal, Gumbel, En este proceso determinamos si el
ajuste es bueno con la prueba de bondad de ajuste, en caso de ser bueno, se puede
utilizar la distribución elegida, una vez encontrada la ley de distribución que rige a
las variables aleatorias, además se podrá predecir con determinada probabilidad, la
ocurrencia de una determinada magnitud de un fenómeno hidrometeorológico.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

A partir de las distribuciones encontradas satisfactorias o que el ajuste de bondad de


ajuste a resultado satisfactorio se puede proyectar para valores que no están en el
intervalo de la muestra, y con la ley de distribución que rige cada una de las series de
datos se hace más fácil el análisis estadístico de las probabilidades para determinados
periodos de retorno, para hallar la probabilidad de excedencia de un determinado
caudal para proyectar los proyectos de ingeniería garantizado de esta manera unas vida
útil acorde con las necesidades

1. GRAFICAS.

En las siguientes páginas se encuentran: las gráficas de:

Histograma de Frecuencias

Se gráfica el Intervalo de Clase en el eje X vs. La Frecuencia Absoluta Simple en


el eje Y.

Polígono de Frecuencia

Se gráfica La Marca de Clase en el eje X vs. La Frecuencia Absoluta Simple en el


eje Y.

Histograma de Frecuencias Acumulativas u Ojiva

Se gráfica el Limite Superior del Intervalo de Clase en el eje X vs. La Frecuencia


Absoluta Acumulada en el eje Y.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

VI. CÁLCULOS Y RESULTADOS.


6.1. CÁLCULOS ESTADÍSTICOS DEL CAUDAL MEDIO ANUAL
DEL RIO LLANGANUCO – ESTACIÓN LLANGANUCO.
Media Anual Media Anual
Año N°
(m3/seg) (m3/seg)
1953-54 3,27 1 3,96
1954-55 2,57 2 3,61
1955-56 2,23 3 3,58
1956-57 3,16 4 3,51
1957-58 3,44 5 3,48
1958-59 3,13 6 3,44
1959-60 3,02 7 3,42
1960-61 2,57 8 3,37
1961-62 2,54 9 3,27
1962-63 2,60 10 3,27
1963-64 2,73 11 3,23
1964-65 2,22 12 3,23
1965-66 3,14 13 3,20
1966-67 2,75 14 3,16
1967-68 2,36 15 3,15
1968-69 2,92 16 3,14
1969-70 3,27 17 3,13
1970-71 2,86 18 3,13
1971-72 2,92 19 3,11
1972-73 3,37 20 3,06
1973-74 2,74 21 3,04
1974-75 2,64 22 3,02
1975-76 2,49 23 3,00
1976-77 3,23 24 2,97
1977-78 3,13 25 2,92
1978-79 3,23 26 2,92
1979-80 3,42 27 2,86
1980-81 3,48 28 2,85
1981-82 3,20 29 2,77
1982-83 3,96 30 2,75
1983-84 3,61 31 2,75
1984-85 2,64 32 2,74
1985-86 3,06 33 2,73
1986-87 3,51 34 2,64
1987-88 3,58 35 2,64
1988-89 2,75 36 2,60
1989-90 2,85 37 2,57
1990-91 3,11 38 2,57
1991-92 2,77 39 2,56
1992-93 2,97 40 2,54
1993-94 3,04 41 2,49
1994-95 3,00 42 2,36
1995-96 3,15 43 2,23
1996-97 2,56 44 2,22

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

DISTRIBUCIÓN DE FRECUENCIAS

1. OBTENCIÓN DE LOS LIMITES

Límite inferior = 2.22

Límite superior = 3.96

2. CALCULO DE RANGO DE VARIACIÓN

R = Ls – Li

R = 3.96 – 2.22

R = 1.74

3. CALCULO DEL NUMERO DE INTERVALOS DE CLASE

Regla de Sturges:

m = 1 + 1.33 ln(n)

Donde: n = 44

m = 6.03297  6

4. OBTENCIÓN DEL TAMAÑO DE LOS INTERVALOS DE CLASE

R
C
m 1

1.74
C
6 1

C = 0.348

5. DISTRIBUCIÓN DEL INCREMENTO


L1 = Xmin - ( C/2)

L1 = 2.22-0.348/2 =2.046

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

6. CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS


Frecuencia Frecuencia Frecuencia Frecuencia FUNCION
Intervalo de Marca de DENSIDAD
Nº Absoluta Absoluta Relativa Relativa
clase [Yi-1 - Yi> Clase (Xi) EMPÍRICA
(ni) Acum. (Ni) (hi) Acum. (Hi)
1 2,046 - 2,394 2,22 3 3 0,07 0,07 0,196
2 2,394 - 2,742 2,57 10 13 0,23 0,30 0,653
3 2,742 - 3,090 2,92 12 25 0,27 0,57 0,784
4 3,090 - 3,438 3,26 12 37 0,27 0,84 0,784
5 3,438 - 3,786 3,61 6 43 0,14 0,98 0,392
6 3,786 - 4,134 3,96 1 44 0,02 1,00 0,065
44 1,00

Xi ni Xi*ni Xi  X X i  X ni X i  X 2 X i  X 2 * ni X i  X 3 * ni X i  X 4 * ni
n n

2,22 3 6,66 0,78 2,35 0,61 1,84 -0,03 0,03


2,57 10 25,68 0,44 4,35 0,19 1,89 -0,02 0,01
2,92 12 34,99 0,09 1,04 0,01 0,09 0,00 0,00
3,26 12 39,17 0,26 3,13 0,07 0,82 0,00 0,00
3,61 6 21,67 0,61 3,65 0,37 2,23 0,03 0,02
3,96 1 3,96 0,96 0,96 0,92 0,92 0,02 0,02
Suma: 44 132,13 3,13 15,49 2,16 7,78 0,004 0,07

A. MEDIDAS DE TENDENCIA CENTRAL

Media Aritmética: n

 Xini
X i 1
n
132.13
X 
44

X  2.98 m3/Seg

La Mediana:

n 
  N i 1 
M e  Yi 1  Ci  2 
 ni 
 
 

Me = 3.02 m3/Seg

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Moda:

 i 
M o  Y 'i 1 Ci  

 1   2 

 12  10 
M o  2.742  0.348  
 (12  10 )  (12  12 ) 

Mo = 3.09 m3/Seg

B. MEDIDAS DE DISPERSIÓN.

Desviación Media:
n

XI 1
i X
D.M . 
n

D.M. = 0.387

Varianza:

 X  X  ni
n
2
i
V( x )  i 1

n
V(x) = 0,181

Desviación Standar:

Sx = V (x)

Sx = 1.10
Sx = 0,425

Coeficiente de Variación:

Sx
C.V .( x )  *100%
X

0.425
C.V .( x)  *100 %
3.00

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

C.V. (x) = 14, 17

C. MEDIDAS ASIMETRÍA.

Coeficiente de Asimetría:

 X 
N

n 2 M 3 
3
i  X ni
M .3  I 1 Cs 
n n  1n  2S 3
C.A. (x) = 0.129

D. MEDIDAS DE APUNTAMIENTO.

Coeficiente de Kurtosis “S”:


4

 X 
n

i  X ni
i 1
M4 
Sx4

n3 M 4 
Ck 
n  1n  2n  3S 4

Ck = 2,560

7. GRAFICAS.

En las siguientes páginas se encuentran: las gráficas de:

Histograma de Frecuencias

Polígono de Frecuencia

Histograma de Frecuencias Acumulativas

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Grafico del histograma:

Histograma
Estación LLanganuco
0.30

0.25

0.20
Frecuencia Relativa

0.15

0.10

0.05

0.00
2.046 2.394 2.742 3.090 3.438 3.786

Intervalo de Clase

Polígono de frecuencia:

Polígono de Frecuencia
Estacion LLanganuco
0.30

0.25
Frecuencia Relativa

0.20

0.15

0.10

0.05

0.00
1.87 2.22 2.57 2.92 3.26 3.61 3.96 4.31
Marca de Clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

DISTRIBUCION FRECUENCIA RELATIVA ACUMULADA


Estación LLanganuco
1.2

1
Frecuencia Relativa Acumulada (Hi)

97.7% 100%

0.8 84.1%

0.6 56.8%

0.4
29.5%

0.2
6.8%
0,
0
2.05 2.39 2.74 3.09 3.44 3.79 4.13
Intervalo de Clase ([Yi-1'-Yi'>)

Polígono de Frecuencia Absoluta


Estacion LLanganuco
14.00

12.00

10.00
Frecuencia Relativa

8.00

6.00

4.00

2.00

0.00
1.87 2.22 2.57 2.92 3.26 3.61 3.96 4.13
Marca de Clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

DISTRIBUCION FRECUENCIA ABSOLUTA


ACUMULADA
50
Estación LLanganuco 100%
45 97.7%
Frecuencia Relativa Acumulada (Hi)

40
84.1%
35
30
56.8%
25
20
15
29.5%
10
5
6.8%
0,
0
2.05 2.39 2.74 3.09 3.44 3.79 4.13
Intervalo de Clase ([Yi-1'-Yi'>)

DISTRIBUCION DE FRECUENCIA ACUMULADA


Estacion LLanganuco
50
100%
45
Frecuencia Absluta Acumulada (Ni)

93.2%
40
35
70.5%
30
25
20 43.2%

15
10
15.9%
5
2.3%
0,
0
2.05 2.39 2.74 3.09 3.44 3.79 4.13
Intervalo de Clase ([Yi-1'-Yi'>)

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Función densidad Empírica:

Funcion Densidad Empirica


1.2

1.0
F(x)
0.8
Frecuenci
fi

0.6 a relativa
Funcion
0.4 densidad

0.2

0.0
1 2 2 3 3 4 4 5
Marca de clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

6.2. CÁLCULOS ESTADÍSTICOS DEL CAUDAL MEDIO ANUAL


DEL RIO COLCAS – ESTACIÓN COLCAS.
Media Media
Nº Año Anual Nº Anual
(m3/seg) (m3/seg)
1 1953-54 5,40 1 7,80
2 1954-55 5,29 2 7,41
3 1955-56 5,57 3 7,07
4 1956-57 5,33 4 7,06
5 1957-58 5,97 5 6,88
6 1958-59 6,50 6 6,84
7 1959-60 4,91 7 6,77
8 1960-61 6,25 8 6,60
9 1961-62 5,76 9 6,50
10 1962-63 5,42 10 6,47
11 1963-64 5,68 11 6,40
12 1964-65 4,66 12 6,35
13 1965-66 5,95 13 6,29
14 1966-67 6,13 14 6,25
15 1967-68 4,58 15 6,13
16 1968-69 5,16 16 5,97
17 1969-70 5,66 17 5,96
18 1970-71 6,35 18 5,95
19 1971-72 6,29 19 5,80
20 1972-73 6,84 20 5,79
21 1973-74 6,88 21 5,76
22 1974-75 5,80 22 5,68
23 1975-76 4,69 23 5,66
24 1976-77 6,47 24 5,57
25 1977-78 5,79 25 5,49
26 1978-79 7,07 26 5,42
27 1979-80 6,77 27 5,40
28 1980-81 7,80 28 5,36
29 1981-82 6,60 29 5,33
30 1982-83 7,41 30 5,29
31 1983-84 5,96 31 5,28
32 1984-85 3,72 32 5,23
33 1985-86 5,23 33 5,16
34 1986-87 7,06 34 4,98
35 1987-88 5,28 35 4,97
36 1988-89 3,25 36 4,91
37 1989-90 4,98 37 4,71
38 1990-91 5,36 38 4,69
39 1991-92 4,97 39 4,66
40 1992-93 6,40 40 4,58
41 1993-94 5,49 41 3,74
42 1994-95 4,71 42 3,72
43 1995-96 3,74 43 3,50
44 1996-97 3,50 44 3,25

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

DISTRIBUCIÓN DE FRECUENCIAS

8. OBTENCIÓN DE LOS LIMITES

Límite inferior = 3.25

Límite superior = 7.80

9. CALCULO DE RANGO DE VARIACIÓN

R = Ls – Li

R = 7.80 – 3.25

R = 4.55

10. CALCULO DEL NUMERO DE INTERVALOS DE CLASE

Regla de Sturges:

m = 1 + 1.33 ln(n)

Dónde: n = 44

m = 6.03297  6

11. OBTENCIÓN DEL TAMAÑO DE LOS INTERVALOS DE CLASE

R
C
m 1

4.55
C
6 1

C = 0.910

12. DISTRIBUCIÓN DEL INCREMENTO:

L1 = Xmin - ( C/2)

L1 = 3.25-0.91/2 =2.793

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

13. CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS


Frecuencia Frecuencia Frecuencia Frecuencia FUNCION
Intervalo de Marca de DENSIDAD
Nº Absoluta absoluta Relativa Relativa
clase [Yi-1 - Yi> Clase (Yi) EMPÍRICA
(ni) Acum. (Ni) (hi) Acum. (Hi)
1 2,79 - 3,70 3 2 2 0,045 0,045 0,05
2 3,70 - 4,61 4 3 5 0,068 0,114 0,07
3 4,61 - 5,52 5 15 20 0,341 0,455 0,37
4 5,52 - 6,43 6 14 34 0,318 0,773 0,35
5 6,43 - 7,34 7 8 42 0,182 0,955 0,20
6 7,34 - 8,25 8 2 44 0,045 1 0,05
44 1

Cálculos previos para los cálculos de tendencia:

Xi ni Xi*ni Xi  X X i  X ni X i  X 2 X i  X 2 * ni X i  X 3 * ni X i  X 4 * ni
n n

3 2 6,50 2,42 4,84 5,86 11,71 -0,98 2,37


4 3 12,47 1,51 4,53 2,28 6,84 -0,36 0,54
5 15 76,03 0,60 9,00 0,36 5,40 -0,11 0,07
6 14 83,70 0,31 4,34 0,10 1,35 0,01 0,00
7 8 55,11 1,22 9,76 1,49 11,92 0,50 0,61
8 2 15,60 2,13 4,26 4,54 9,08 0,67 1,42
SUMA 44 249,41 8,19 36,74 14,62 46,30 -0,263 5,01

A. MEDIDAS DE TENDENCIA CENTRAL

Media Aritmética: n

 Xini
X i 1
n
249.21
X 
44

X  5.67 m3/Seg

La Mediana:

n 
  N i 1 
M e  Yi 1  Ci  2 
 ni 
 
 

Me = 5.77 m3/Seg

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Moda:

 i 
M o  Y 'i 1 Ci  
 1   2 

 12  3 
M o  4.61  0.91 
 (12  3)  (12  14 ) 

Mo = 5.45 m3/Seg

B. MEDIDAS DE DISPERSIÓN.

Desviación Media:
n

XI 1
i X
D.M . 
n

D.M. = 1.27

Varianza:

 X  X  ni
n
2
i
V( x )  i 1

n
V(x) = 1.65

Desviación Standar:

Sx = V (x)

Sx = 1.65
Sx = 1.29

Coeficiente de Variación:

Sx
C.V .( x )  *100%
X

1.29
C.V .( x)  *100 %
5.67

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

C.V. (x) = 22,69

C. MEDIDAS ASIMETRÍA.

Coeficiente de Asimetría:

 X 
N

n 2 M 3 
3
i  X ni
M .3  I 1 Cs 
n n  1n  2S 3
C.A. (x) = -0.132

D. MEDIDAS DE APUNTAMIENTO.

Coeficiente de Kurtosis “S”:


4

 X 
n

i  X ni
i 1
M4 
Sx4

n3 M 4 
Ck 
n  1n  2n  3S 4

Ck = 2,108

14. GRAFICAS.

En las siguientes páginas se encuentran: las graficas de:

Histograma de Frecuencias

Polígono de Frecuencia

Histograma de Frecuencias Acumulativas

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Grafico del histograma:

Histograma
Estación Colcas
0.40

0.35

0.30

0.25
Frecuencia

0.20

0.15

0.10

0.05

0.00
2.79 3.70 4.61 5.52 6.43 7.34

Intervalo de Clase

Polígono de frecuencia:

Polígono de Frecuencia
Estación Colcas
0.40

0.35

0.30

0.25
Frecuencia

0.20

0.15

0.10

0.05

0.00
2.34 3.25 4.16 5.07 5.98 6.89 7.80 8.71
Marca de Clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Distribución de la frecuencia relativa acumulada:

DISTRIBUCION FRECUENCIA RELATIVA ACUMULADA


Estación Colcas
1.2
Frecuencia Relativa Acumulada (Hi)

100%
1
95%

0.8
77%

0.6
45%

0.4

0.2
11%
5%
0%
0
2.79 3.70 4.61 5.52 6.43 7.34 8.25
Intervalo de Clase ([Yi-1'-Yi'>)

DISTRIBUCION FRECUENCIA ACUMULADA


Estación Colcas
50
Frecuencia Absoluta Acumulada (Ni)

45 100%
97%
40 93%
35
30
25 69%
20
15
34%
10
5 14%
0%
0
2.79 3.70 4.61 5.52 6.43 7.34 8.25
Intervalo de Clase ([Yi-1'-Yi'>)

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Función densidad Empírica:

Funcion Densidad Empirica


0.5

0.4

0.4
F(x)
0.3
Frecuenci
fi

0.3
a relativa
0.2 Funcion
densidad
0.2

0.1

0.1

0.0
1 3 5 7 9 11
Marca de clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

PRUEBA DE BONDAD DE AJUSTE.


MÉTODOS ESTADISTICOS:
REGISTROS DE PRECIPITACIONES MEDIAS ANUALES
ESTACIÓN LLANGANUCO (mm.)
Año Prec. Anual
1953-54 3,27
1954-55 2,57
1955-56 2,23
1956-57 3,16
1957-58 3,44
1958-59 3,13
1959-60 3,02
1960-61 2,57
1961-62 2,54
1962-63 2,60
1963-64 2,73
1964-65 2,22
1965-66 3,14
1966-67 2,75
1967-68 2,36
1968-69 2,92
1969-70 3,27
1970-71 2,86
1971-72 2,92
1972-73 3,37
1973-74 2,74
1974-75 2,64
1975-76 2,49
1976-77 3,23
1977-78 3,13
1978-79 3,23
1979-80 3,42
1980-81 3,48
1981-82 3,20
1982-83 3,96
1983-84 3,61
1984-85 2,64
1985-86 3,06
1986-87 3,51
1987-88 3,58
1988-89 2,75
1989-90 2,85
1990-91 3,11
1991-92 2,77
1992-93 2,97
1993-94 3,04
1994-95 3,00
1995-96 3,15
1996-97 2,56
X

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

PROM.= 2,98
DESV= 0,39
VAR.= 0,15
ASIM.= 0,12

OBTENCION DE LA PRUEBA CHI - CUADRADO TABULAR

Gráfico de la Distribución Normal y Gumbel


1.45

1.25

1.05

0.85
f(x)

Normal
0.65
Gumbel
0.45
FDE
0.25

0.05
2.00 2.50 3.00 3.50 4.00 4.50
x

PRUEBA DE AJUSTE A UNA DIST. NORMAL

o i  ei 2
m PX  x̂  Z X ajust. Oi ei
ei
1 0,167 -0,967 2,607 9 7,33 0,379
2 0,333 -0,431 2,815 7 7,33 0,015
3 0,500 0,000 2,982 5 7,33 0,742
4 0,667 0,431 3,149 9 7,33 0,379
5 0,833 0,967 3,356 7 7,33 0,015
6 0,999 3,159 4,206 7 7,33 0,015
suma 44 1,545

para la distribución Gumbel


Chi-cuadrado tabular con los grados de libertad: ν=6-2-1=3
X tabular 7,815
X tabular > X calculado
X Calc. 1,545

Por lo tanto, se ajusta a una distribución Normal. Con un nivel de significación de 0,05
Es adecuada para de las descargas medias del río LLanganuco

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

PRUEBA DE AJUSTE A UNA DISTRIBUCION GUMBEL

X  eY

 e W
F (x)  e

W   ln( ln(FX ))

Xajust.    *W

  X  0 .45 *  X

  0 . 78 *  X

MEDIA 2,982
DESV. 0,388
 0,302
 2,807

o i  e i 2
m PX  x̂  W X ajust. Oi ei ei
1 0,17 -0,583 2,631 9 7,33 0,379
2 0,33 -0,094 2,779 7 7,33 0,015
3 0,50 0,367 2,918 3 7,33 2,561
4 0,67 0,903 3,080 6 7,33 0,242
5 0,83 1,702 3,322 11 7,33 1,833
6 0,999 6,907 4,895 8 7,33 0,061
suma 44 5,091

Para la distribución Gumbel


Chi-cuadrado tabular con los grados de libertad: ν=6-2-1=3

ALFA= 0,05
X tabular 7,81 PROB.= 0,95
X tabular > X calculado
X calculado 5,091

Por lo tanto se ajusta a una distribución Gumbel. Con un nivel de significación de 0,05

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Es adecuada para de las descargas medias del río LLanganuco.

Distribución Gumbel
1.400

1.200

1.000

0.800 Gumbel
f(x)

E D Empir.
0.600

0.400

0.200

-
2 2.5 3 3.5 4 4.5
x

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

MÉTODOS ESTADISTICOS:

REGISTROS DE PRECIPITACIONES ANUALES


ESTACIÓN RIO COLCAS (mm.)
Año Prec. Anual
1953-54 5,40
1954-55 5,29
1955-56 5,57
1956-57 5,33
1957-58 5,97
1958-59 6,50
1959-60 4,91
1960-61 6,25
1961-62 5,76
1962-63 5,42
1963-64 5,68
1964-65 4,66
1965-66 5,95
1966-67 6,13
1967-68 4,58
1968-69 5,16
1969-70 5,66
1970-71 6,35
1971-72 6,29
1972-73 6,84
1973-74 6,88
1974-75 5,80
1975-76 4,69
1976-77 6,47
1977-78 5,79
1978-79 7,07
1979-80 6,77
1980-81 7,80
1981-82 6,60
1982-83 7,41
1983-84 5,96
1984-85 3,72
1985-86 5,23
1986-87 7,06
1987-88 5,28
1988-89 3,25
1989-90 4,98
1990-91 5,36
1991-92 4,97
1992-93 6,40
1993-94 5,49
1994-95 4,71
1995-96 3,74
1996-97 3,50

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

X
PROM.= 5,65
DESV= 1,02
VAR.= 1,04
ASIM.= -0,31

OBTENCION DE LA PRUEBA CHI - CUADRADO TABULAR

Gráfico de la Distribución Normal y Gumbel


0.44
0.39
0.34
0.29
f(x)

0.24 Normal
0.19 Gumbel

0.14 EDE

0.09
0.04
2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00
x

PRUEBA DE AJUSTE A UNA DIST. NORMAL

o i  ei 2
M PX  x̂  Z X ajust. Oi ei ei
1 0,167 -0,967 4,664 6 7,33 0,242
2 0,333 -0,431 5,211 6 7,33 0,242
3 0,500 0,000 5,650 9 7,33 0,379
4 0,667 0,431 6,090 8 7,33 0,061
5 0,833 0,967 6,636 8 7,33 0,061
6 0,999 3,159 8,872 7 7,33 0,015
suma 44 1,000

X tabular 7,815
X tabular > X calculado
X calculado 1,000

Por lo tanto, se ajusta a una distribución Normal. Con un nivel de significación de 0,05

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Es adecuada para de las descargas medias del río Colcas

PRUEBA DE AJUSTE A UNA DISTRIBUCION GUMBEL

X  eY

 e W
F (x)  e
W   ln( ln(FX ))

Xajust.    *W

  X  0 .45 *  X

  0 . 78 *  X

MEDIA= 5,65
DESV.= 1,0199
 0,795
 5,191

PX  x̂  o i  e i 2
M W X ajust. Oi ei ei
1 0,167 -0,583 4,727 8 7,33 0,061
2 0,333 -0,094 5,116 3 7,33 2,561
3 0,500 0,367 5,483 8 7,33 0,061
4 0,667 0,903 5,909 7 7,33 0,015
5 0,833 1,702 6,545 10 7,33 0,970
6 0,999 6,907 10,686 8 7,33 0,061
suma 44 3,727

Para la distribución Gumbel


Chi-cuadrado tabular con los grados de libertad: ν=6-2-1=3

ALFA= 0,05
X tabular 7,8147 PROB.= 0,95
X tabular > X calculado
X calculado 3,727

Por lo tanto se ajusta a una distribución Gumbel. Con un nivel de significación de 0,05

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Es adecuada para de las descargas medias del río Colcas

Distribución Gumbel
0.45
0.40
0.35
0.30
0.25
f(x)

0.20 Gumbel
0.15 F D Empir.
0.10
0.05
-
2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00
x

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

 COMO LAS DESCARGAS SE AJUSTAN A LAS DISTRIBUCIONES


NORMAL Y GUMBEL PARA LA ESTACIÓN LLANGANUCO:

Calculamos la probabilidad de que el caudal sea menor que 3.15 mm/seg. De


acuerdo a la distribución normal.

Hallamos Z= (Q-Qprom.)/SQ

Z= (3.15-2.98)/0.388 =0.4381

B=1/2(1+0.196854(0.4281)+0.115194(0.4351)2 + 0.000344 (0.4351)3 +


0.019527 (0.4381)4)-4

B = 0.33

Por tabla =0 .33

P (Q < 3.15) = 0.33

 CON LOS DATOS DE LA ESTACION LLANGANUCO HALLAR EL


CAUDAL PARA UN PERIODO DE RETORNO DE 50 AÑOS, CON LA
DISTRIBUCIÓN NORMAL.

𝟏 𝟏
𝑻= =
𝑷 (𝑸 ≥ 𝒒) 𝟏 − 𝑷(𝑸 ≤ 𝒒)

𝑻−𝟏
𝑷(𝑸 ≤ 𝒒) =
𝑻

𝑻 − 𝟏 𝟓𝟎 − 𝟏
𝑷(𝒁 ≤ 𝒛) = = = 𝟎. 𝟗𝟖
𝑻 𝟓𝟎

Para un B = 0.98 como es mayor que 0 se calcula para un valor de 1-B = 1-0.98
= 0.02

𝑄−𝑄𝑝𝑟𝑜𝑚. 𝑄−2.98
Para este valor Z es igual a 2.06 = = por lo que el valor
𝑆𝑄 0.388

de Q es de 3.7793 mm/seg.

El caudal para un periodo de retorno de 50 años es de 3.779 mm/seg.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

 COMO LAS DESCARGAS SE AJUSTAN A LAS DISTRIBUCIONES


NORMAL Y GUMBEL PARA LA ESTACION COLCAS:

Calculamos la probabilidad de que el caudal sea menor que 6.25 mm/seg. De


acuerdo a la distribución normal.

Hallamos Z= (Q-Qprom.)/SQ

Z= (6.25-5.65)/1.02 =0.588

B=1/2(1+0.196854(0.588)+0.115194(0.588)2 + 0.000344 (0.588)3 + 0.019527


(0.588)4)-4

B = 0.278

Por tabla =0 .28

P (Q < 3.15) = 0.28

 CON LOS DATOS DE LA ESTACION COLCAS HALLAR EL


CAUDAL PARA UN PERIODO DE RETORNO DE 50 AÑOS, CON LA
DISTRIBUCIÓN NORMAL.

𝟏 𝟏
𝑻= =
𝑷 (𝑸 ≥ 𝒒) 𝟏 − 𝑷(𝑸 ≤ 𝒒)

𝑻−𝟏
𝑷(𝑸 ≤ 𝒒) =
𝑻

𝑻 − 𝟏 𝟓𝟎 − 𝟏
𝑷(𝒁 ≤ 𝒛) = = = 𝟎. 𝟗𝟖
𝑻 𝟓𝟎

Para un B = 0.98 como es mayor que 0 se calcula para un valor de 1-B = 1-0.98
= 0.02

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

𝑄−𝑄𝑝𝑟𝑜𝑚. 𝑄−5.65
Para este valor Z es igual a 2.06 = = por lo que el valor
𝑆𝑄 1.02

de Q es de 7.7512 mm/seg.

El caudal para un periodo de retorno de 50 años es de 7.7512 mm/seg.

 COMO LAS DESCARGAS SE AJUSTAN A LAS DISTRIBUCIONES


NORMAL Y GUMBEL PARA LA ESTACIÓN LLANGANUCO:

Calculamos la probabilidad de que el caudal sea menor que 3.15 mm/seg. De


acuerdo a la distribución Gumbel.

Hallamos W= (X -β)/α

𝛽 = 𝑋 − 0.45 𝑆

𝛼 = 0.78𝑆

β = 2.98 – 0.45*0.388

β = 2.81

α = 3.026

ω = (3.15 – 2.81)/3.026

P (Q < 3.15) = 0.409

 CON LOS DATOS DE LA ESTACION LLANGANUCO HALLAR EL


CAUDAL PARA UN PERIODO DE RETORNO DE 50 AÑOS, CON LA
DISTRIBUCIÓN GUMBEL.

𝟏 𝟏
𝑻= =
𝑷 (𝑸 ≥ 𝒒) 𝟏 − 𝑷(𝑸 ≤ 𝒒)

𝑻−𝟏
𝑷(𝑸 ≤ 𝒒) =
𝑻

𝑻 − 𝟏 𝟓𝟎 − 𝟏
𝑷(𝒁 ≤ 𝒛) = = = 𝟎. 𝟗𝟖
𝑻 𝟓𝟎

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Para un Valor de 0.98 nos da un 𝜔 = −𝐿𝑛(−𝐿𝑛 0.989) = 3.902

𝑄−𝛽
𝑌= = 3.902
𝛼

𝑚𝑚
𝑄 = 𝛽 + 3.9019 ∗ 𝛼 = 2.81 + 3.9019 ∗ 3.026 = 14.62
𝑠𝑒𝑔.

El caudal para un periodo de retorno de 50 años es de 14.62 mm/seg.

 COMO LAS DESCARGAS SE AJUSTAN A LAS DISTRIBUCIONES


NORMAL Y GUMBEL PARA LA ESTACIÓN RIO COLCAS:

Calculamos la probabilidad de que el caudal sea menor que 6.25 mm/seg. De


acuerdo a la distribución Gumbel.

Hallamos W= (X -β)/α

𝛽 = 𝑋 − 0.45 𝑆

𝛼 = 0.78𝑆

β = 5.65 – 0.45*1.02

β = 5.191

α = 0.7956

ω = (6.25 – 5.191)/0.7956

P (Q < 6.25) = 1.33

 CON LOS DATOS DE LA ESTACION LLANGANUCO HALLAR EL


CAUDAL PARA UN PERIODO DE RETORNO DE 50 AÑOS, CON LA
DISTRIBUCIÓN GUMBEL.

𝟏 𝟏
𝑻= =
𝑷 (𝑸 ≥ 𝒒) 𝟏 − 𝑷(𝑸 ≤ 𝒒)

𝑻−𝟏
𝑷(𝑸 ≤ 𝒒) =
𝑻

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

𝑻 − 𝟏 𝟓𝟎 − 𝟏
𝑷(𝒁 ≤ 𝒛) = = = 𝟎. 𝟗𝟖
𝑻 𝟓𝟎

Para un Valor de 0.98 nos da un 𝜔 = −𝐿𝑛(−𝐿𝑛 0.989) = 3.902

𝑄−𝛽
𝑌= = 3.902
𝛼

𝑚𝑚
𝑄 = 𝛽 + 3.9019 ∗ 𝛼 = 5.191 + 3.9019 ∗ 0.7956 = 8.29
𝑠𝑒𝑔.

El caudal para un periodo de retorno de 50 años es de 8.295 mm/seg.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

VII. DISCUSIÓN E INTERPRETACIÓN

7.1. DISCUSIÓN E INTERPRETACIÓN DEL CAUDAL MEDIO


ANUAL DEL RIO LLANGANUCO.

A. MEDIDAS DE TENDENCIA CENTRAL

Ẋ = 3,00
Me = 3,02
Mo = 3,09
D.M. = 0,352
V(x) = 0,181
D.S. (x) = 0,425
C.V.(x) = 14,17
Cs = 0,129
K = 2,560

Los resultados con datos sin agrupar son los siguientes:

Media Aritmética:

X  2.98 m3/Seg

La Mediana:

Me = 3.01 m3/Seg

Moda:

Mo = 3.07 m3/Seg

B. MEDIDAS DE DISPERSIÓN.

Desviación Media:

D.M. = 0.315

Varianza:

V(x) = 0.15

Desviación Standar:

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Sx =0.388

Coeficiente de Variación:

C.V.(x) = 14.15

C. MEDIDAS ASIMETRÍA.

Coeficiente de Asimetría:

C.A. (x) = - 0.12

D. MEDIDAS DE APUNTAMIENTO.

Coeficiente de Kurtosis “S”:

K = 2.52

COMPARACION ENTRE LA MEDIA, MEDIANA Y LA MODA:

Como se observa estos datos tienes un cierto sesgo hacia la derecha puesto que la
media y la mediana son menores que la moda.

MEDIDA DE ASIMETRIA:

El sesgo del polígono de frecuencias se aprecia trazando una vertical por la moda
donde se diferencia la cola del polígono de frecuencias.

Como g=0.189, g>0es una distribución sesgada a la derecha (polígono de


frecuencias con cola más larga hacia la izquierda).

MEDIDA DE APUNTAMIENTO:

El valor del coeficiente de curtosis es costumbre comparar con Ck=3 que es


coeficiente de apuntamiento de una curva continua de forma de una campana
(curva normal).

Como Ck=2.560 , Ck<3 es una distribución platicúrtica, achatada o plana.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

PRUEBA DE CHI CUADRADO

PARA LA DISTRIBUCION NORMAL:

X tabular 7,815

Xcalculado 1,545

Como X (Calculado) es menor que el X (Tabular) entonces se ajusta a la


distribución normal con un nivel de significación de 0.05, se concluye que es
adecuada para aplicarla.

PARA LA DISTRIBUCION GUMBEL:

X tabular 7,81

Xcalculado 5,091

Como X (Calculado) es menor que el X (Tabular) entonces se ajusta a la


distribución Gumbel con un nivel de significación de 0.05, se concluye que es
adecuada para aplicarla.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

7.2. DISCUSIÓN E INTERPRETACIÓN DEL CAUDAL MEDIO ANUAL DEL


RIO COLCAS.

E. MEDIDAS DE TENDENCIA CENTRAL

Ẋ = 5,67
Me = 5,77
Mo = 5,45
D.M. = 1,27
V(x) = 1,65
D.S. (x) = 1,29
C.V.(x) = 22,69
Cs = -0,132
K = 2,108

Los resultados con datos sin agrupar son los siguientes:

Media Aritmética:

X  5.65 m3/Seg

La Mediana:

Me = 5.67 m3/Seg

Moda:

Mo = 5.40 m3/Seg

F. MEDIDAS DE DISPERSIÓN.

Desviación Media:

D.M. = 1.24

Varianza:

V(x) = 1.63

Desviación Standar:

Sx = 1.34

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Coeficiente de Variación:

C.V.(x) = 21.46

G. MEDIDAS ASIMETRÍA.

Coeficiente de Asimetría:

C.A. (x) = - 0.31

H. MEDIDAS DE APUNTAMIENTO.

Coeficiente de Kurtosis “S”:

K = 2.09

COMPARACION ENTRE LA MEDIA, MEDIANA Y LA MODA:

Como se observa estos datos tienes un cierto sesgo hacia la izquierda puesto que
la media y la mediana son menores que la moda.

MEDIDA DE ASIMETRIA:

El sesgo del polígono de frecuencias se aprecia trazando una vertical


por la moda donde se diferencia la cola del polígono de frecuencias.

Como g= -0.132, g<0 es una distribución sesgada a la izquierda (polígono de


frecuencias con cola más larga hacia la izquierda).

MEDIDA DE APUNTAMIENTO:

El valor del coeficiente de curtosis es costumbre comparar con Ck=3 que es


coeficiente de apuntamiento de una curva continua de forma de una campana
(curva normal).

Como Ck=2.108, Ck<3 es una distribución platicúrtica, achatada o plana.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

PRUEBA DE CHI CUADRADO PARA LOS CAUDALES MEDIOS DEL


RIO COLCAS:

PARA LA DISTRIBUCION NORMAL:

X tabular 7,815
X calculado 1,00

Como X (Calculado) es menor que el X (Tabular) entonces se ajusta a la


distribución normal con un nivel de significación de 0.05, se concluye que es
adecuada para aplicarla.

PARA LA DISTRIBUCION GUMBEL:

X 7,81
tabular
X
calculado 3,727

Como X (Calculado) es menor que el X (Tabular) entonces se ajusta a la


distribución Gumbel con un nivel de significación de 0.05, se concluye que es
adecuada para aplicarla.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

VIII. CONCLUSIONES Y RECOMENDACONES.


 CONCLUCIONES:
1. Los valores de medidas de tendencia central y medidas de distribución del la
Estación LLanganuco son:
Ẋ = 3,00
Me = 3,02
Mo = 3,09
D.M. = 0,352
V(x) = 0,181
D.S. (x) = 0,425
C.V.(x) = 14,17
Cs = 0,129
K = 2,560

2. Los valores de medidas de tendencia central y medidas de distribución del la


Estación LLanganuco son:
Ẋ = 5,67
Me = 5,77
Mo = 5,45
D.M. = 1,27
V(x) = 1,65
D.S. (x) = 1,29
C.V.(x) = 22,69
Cs = -0,132
K = 2,108

3. Los datos de los caudales medios de la estación LLanganuco se ajusta a una


distribución normal ya que:

X tabular 7,815

X calculado 1,545

Entonces se puede utilizar la distribución normal para calcular valores que no


estén en el rango de la distribución.
Los datos de los caudales medios de la estación LLanganuco se ajusta a una
distribución Gumbel ya que:

X tabular 7,81

X calculado 5,091

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Entonces se puede utilizar la distribución Gumbel para calcular valores que no


estén en el rango de la distribución.

4. Los datos de los caudales medios de la estación Rio Colcas se ajusta a una
distribución normal ya que:

X tabular 7,815

X calculado 1,545

Entonces se puede utilizar la distribución normal para calcular valores que no


estén en el rango de la distribución.
Los datos de los caudales medios de la estación Rio Colcas se ajusta a una
distribución Gumbel ya que:

X tabular 7,81

X calculado 5,091

Entonces se puede utilizar la distribución Gumbel para calcular valores que no


estén en el rango de la distribución.

5. Entonces se puede utilizar la distribución normal y Gumbel para calcular


valores que no estén en el rango de la distribución
6. Se concluye que el uso de la estadística Inferencial, es una alternativa
razonablemente viable para realizar el análisis, procesamiento e interpretación
de los registros en las estaciones de algunos parámetros Hidrológicos como
alternativa más accesible frente a un análisis de series de tiempo que la mayoría
de ingenieros no tienen mayor conocimiento al respecto.

7. El uso de nuevas tecnologías como es el uso de programas informáticos nos


permite realizar un análisis mucho más exacto y el tiempo de procesamiento
de la información es mucho menor por la gran versatilidad con que se nos
presentan éstos.

8. Pudimos observar que, las distribución normal para su análisis toma valores ó

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

parámetros como la media y la desviación estándar dé los datos los cuales nos
dan una idea dé como está la muestra.

9. Con la distribución teórica encontrada podemos prever los futuros caudales a


los que llegaran los ríos de una determinada cuenca en el caso que se quiera
diseñar un puente, una bocatoma, una presa, et. Y de esta manera con la
seguridad y/o la importancia que se trata el proyecto podemos hacer un diseño
que garantice la buena fucionabilidad y duración ante los efectos naturales
propios de la naturaleza, pues el comportamiento de la naturaleza es
impredecible y por lo tanto debemos estar preparados para afrontar situaciones
riesgosas.

 RECOMENDACIONES:

Que se firmen convenios con Instituciones públicas y privadas que tengan


relación en los cursos que se llevan, por ejemplo en la rama de Hidrología con
instituciones que hagan estudios de las cuencas de nuestro país. para aportar en
la formación práctica y profesional de los alumnos.

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

IX. BIBLIOGRAFÍA.

9.1. REYES CARRASCO, LUIS V. “HIDROLOGIA BÁSICA”,


Editorial del CONCYTEC, Lima-Perú, 1992.

9.2. VILLON BEJAR, MÁXIMO. “HIDROLOGIA ESTADISTIA”,


Publicaciones del Instituto Tecnológico de Costa Rica, 2º Edición, 2002.

9.3. Microsoft ® Encarta ® Biblioteca de Consulta 2003. © 1993-2002


Microsoft Corporation. Reservados todos los derechos.

9.4. VEN TE CHOW. Hidrología Aplicada 3Ra. Edición Editorial:


Mc. Gill

9.5. MONSALVE SAENZ, Germán. Hidrología Aplicada a la


Ingeniería

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

ANEXO

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

ESTACION LLANGANUCO

Histograma
Estación LLanganuco
0.30

0.25
Frecuencia Relativa

0.20

0.15

0.10

0.05

0.00
2.046 2.394 2.742 3.090 3.438 3.786

Intervalo de Clase

Polígono de Frecuencia
Estacion LLanganuco
0.30

0.25

0.20
Frecuencia Relativa

0.15

0.10

0.05

0.00
1.87 2.22 2.57 2.92 3.26 3.61 3.96 4.31
Marca de Clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

DISTRIBUCION FRECUENCIA RELATIVA


ACUMULADA
1.2
Estación LLanganuco
1
Frecuencia Relativa Acumulada (Hi)

97.7% 100%

0.8 84.1%

0.6 56.8%

0.4
29.5%

0.2
6.8%
0,
0
2.05 2.39 2.74 3.09 3.44 3.79 4.13
Intervalo de Clase ([Yi-1'-Yi'>)

Polígono de Frecuencia Absoluta


Estacion LLanganuco
14.00

12.00

10.00
Frecuencia Relativa

8.00

6.00

4.00

2.00

0.00
1.87 2.22 2.57 2.92 3.26 3.61 3.96 4.13
Marca de Clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

DISTRIBUCION FRECUENCIA ABSOLUTA ACUMULADA


Estación LLanganuco
50
45 100%
97.7%
Frecuencia Relativa Acumulada (Hi)

40
84.1%
35
30
56.8%
25
20
15
29.5%
10
5
6.8%
0,
0
2.05 2.39 2.74 3.09 3.44 3.79 4.13
Intervalo de Clase ([Yi-1'-Yi'>)

Funcion Densidad Empirica


1.2

1.0
F(x)
0.8
Frecuenci
fi

0.6 a relativa
Funcion
0.4 densidad

0.2

0.0
1 2 2 3 3 4 4 5
Marca de clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Función Densidad Empirica


Estación LLanganuco
1
0.9
0.8
0.7
0.6
0.5
fi

0.4
0.3
0.2
0.1
0
1.50 2.00 2.50 3.00 3.50 4.00 4.50
Marca de Clase

Función Densidad Acumulada


Estación LLanganuco
1.2

0.8

0.6
Fi

0.4

0.2

0
1.50 2.00 2.50 3.00 3.50 4.00 4.50
Marca de Clase

Distribución Normal y Gumbel: Estación LLanganuco

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Gráfico de la Distribución Normal y


Gumbel
1.45
1.25
1.05
0.85
f(x)

Normal
0.65
Gumbel
0.45
FDE
0.25
0.05
2.00 2.50 3.00 3.50 4.00 4.50
x

Distribución Gumbel
1.400

1.200

1.000

0.800 Gumbel
f(x)

0.600

0.400

0.200

-
2 2.5 3 3.5 4 4.5
x

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

ESTACION COLCAS

Histograma
Estación Colcas
0.40

0.35

0.30

0.25
Frecuencia

0.20

0.15

0.10

0.05

0.00
2.79 3.70 4.61 5.52 6.43 7.34

Intervalo de Clase

Polígono de Frecuencia
0.40
Estación Colcas
0.35

0.30

0.25
Frecuencia

0.20

0.15

0.10

0.05

0.00
2.34 3.25 4.16 5.07 5.98 6.89 7.80 8.71
Marca de Clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Funcion Densidad Empirica


0.5

0.4

0.4
F(x)
0.3
fi

0.3
Frecuenc
0.2 ia
relativa
0.2

0.1

0.1

0.0
1 3 5 7 9 11
Marca de clase

Función Densidad Empirica


Estación Rio Colcas
0.7

0.6

0.5

0.4
fi

0.3

0.2

0.1

0
1.00 2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00
Marca de Clase

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Función Densidad Acumulada


Estación Rio Colcas
1.2

0.8
Fi

0.6

0.4

0.2

0
1.50 2.00 2.50 3.00 3.50 4.00 4.50
Marca de Clase

Distribución Normal y Gumbel: Estación Colcas

UNASAM – FCA – EPIA


ESTADISTICA APLICADA A LA INGENIERIA AGRICOLA

Gráfico de la Distribución Normal y


Gumbel
0.44
0.39
0.34
0.29 Normal
f(x)

0.24 Gumbel

0.19 EDE

0.14
0.09
0.04
2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00
x

Distribución Gumbel
0.45
0.40
0.35
0.30
Gumbel
0.25
F D Empir.
f(x)

0.20
0.15
0.10
0.05
-
2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00
x

UNASAM – FCA – EPIA

También podría gustarte