Está en la página 1de 14

i. Distribucin Gumbel.

La distribucin de valores Tipo I conocida como distribucin


Gumbel o Doble Exponencial, tiene como funcin de distribucin
de probabilidades la siguiente expresin:
(x)

F ( x )=ee

Utilizando el mtodo de momentos, se obtienen las siguientes


relaciones:
=0.45

1.2825

Donde:

: Parmetro de concentracin.

: Parmetro de localizacin.

Es tambin conocida con el nombre de distribucin de valores


extremos Tipo I. Este modelo representa la distribucin lmite
del mayor valor de n valores independientes e idnticamente
distribuidos con una distribucin tipo exponencial a medida que n
crece indefinidamente
a. Pruebas de bondad de ajuste.
Las pruebas de bondad de ajuste son pruebas de hiptesis que se
usan para evaluar si un conjunto de datos es una muestra
independiente de la distribucin elegida.
En la teora elegida estadstica, las pruebas de bondad de ajuste ms
conocida es la Kolmogorov Smirnov.
- Prueba Kolmogorov- Smirnov.
La prueba de bondad de ajuste estadstico Kolmogorov- Smirnov
considera la desviacin de la funcin de distribucin de
probabilidades de la muestra P(x) de la funcin de probabilidades
terica, escogida Po(x) tal que:

Dn=max [ P ( x ) P 0 ( x ) ]

La prueba requiere que el valor D calculado con la expresin


anterior sea menor que el valor tabulado

d crit .

para un nivel de

probabilidad (significancia) requerido. Esta prueba es fcil de


realizar y comprende las siguientes etapas:
El valor estadstico D es la mxima diferencia entre la funcin de
distribucin acumulada de la muestra y la funcin de distribucin
acumulada terica escogida. Se fija el nivel de probabilidad (nivel
de significancia) a, valores de 0.05 y 0.01 son los ms usuales.
d crit .

El valor critico

de la prueba debe ser obtenido de la Tabla


y n , pues depende del nivel de

N1, el cual est en funcin de

significancia y del nmero de datos.


Si el valor calculado D es menor que el

d crit .

, la distribucin

escogida se debe aceptar. Por el contrario, si el valor calculado D es


mayor que el

d crit .

, la distribucin escogida se debe rechazar.

Tabla N 1. Valores crticos

d crit .

para la prueba Smirnov

Kolmogorov de Bondad de ajuste.


Tamao de la

= 0.10

= 0.05

= 0.01

muestra
5
10
15
20
25
30
40

0.51
0.37
0.3
0.26
0.24
0.22
0.19

0.56
0.41
0.34
0.29
0.26
0.24
0.21

0.67
0.49
0.40
0.35
0.32
0.29
0.25

n grande
1.22/(n)^1/2
Fuente: Aparicio, 2001

I.

1.36/(n)^1/2

REVICION BIBLIOGRAFICA.
I.1. POBLACIN:

Es el conjunto de mayor de datos individuales, personas o cosas cuyo estudio


nos interesa obtener informacin. Los datos individuales de una poblacin se
llama unidades elementales u observaciones.
Una poblacin estadstica es un conjunto de observaciones
medibles o descritas para cada uno de sus unidades elementales.
I.2. MUESTRA.
Es una informacin proporcionada por una parte finita de la
poblacin. Tambin es considerado como un sub-conjunto propio
finito de la poblacin.
I.3. HISTOGRAMA Y POLGONOS DE FRECUENCIA
Son dos representaciones grficas de las distribuciones de
frecuencia.
A. Un histograma o histograma de frecuencias, consiste en una
serie de rectngulos que tienen:
-) Sus bases sobre un eje horizontal (el eje X) con centros en
las marcas de clase y longitud igual al tamao de los
intervalos de clase.
-) Superficies proporcionales a las frecuencias de clase.

B.

C.

Un polgono de frecuencias, es un grfico de lnea trazado sobre las


marcas de clase. Puede obtenerse uniendo los puntos medios de los
techos de los rectngulos en el histograma1.

MEDIA
La media de un conjunto N de datos numricos X 1, X2, ..., XN est
representada por y definida por:

,
1 Ing. MAXIMO VILLON BEJAR Pg. 73

1.63/(n)^1/2

Que es el momento de orden 1.


La mediana de un conjunto N de nmeros ordenados en orden de
grandeza, corresponde al valor del punto central (N es un nmero
impar) o la media aritmtica de los dos valores centrales (en el
caso que N sea par)2.
n

Xini
i 1

I.4. MEDIANA
Es el valor de la serie de datos que se sita justamente en el
centro de la muestra (un 50% de valores son inferiores y otro 50%
son superiores).
No presentan el problema de estar influido por los valores
extremos, pero en cambio no utiliza en su clculo toda la
informacin de la serie de datos (no pondera cada valor por el
nmero de veces que se ha repetido).

N i 1

M e Yi 1 Ci 2
ni

I.1. MODA
Localiza el dato de mayor frecuencia. Es el valor del dato cuya
frecuencia es mxima.
Si la distribucin de frecuencias tienen un solo mximo (mximo
absoluto), la moda es el valor del dato de mayor frecuencia, y
se dice que la distribucin de frecuencias es uni- modal.

Si la distribucin de frecuencias tiene mas de un mximo


(mximo relativos), se dice que la distribucin de frecuencia es
multimodal: Bimodal, Trimodal, etc.

Si todas las frecuencias son iguales se dice que la distribucin


no tiene moda y se trata de una distribucin uniforme.

Para Datos Clasificados La moda es la marca de la clase modal.


Para una mejor
2 Ing. MAXIMO VILLON BEJAR Pg. 48.

aproximacin se puede usar la siguiente formula

Momentos muestrales, medidas de asimetra y curtosis:


Existen varias clases de descriptores aritmticos, siendo los momentos el
mtodo adecuado para calcular los estadgrafos, es decir con el clculo de
momentos se determina los estadgrafos o estadsticos Como en los cursos
de esttica, resistencia de materiales, fsica, matemticas, etc. se calculan
los momentos de rdenes primero, segundo, etc. generalizando se tiene:
momento con respecto al origen de coordenadas y momentos con respecto
a la media

I.1. DESVIACIN MEDIA


Es la media aritmtica de los valores absolutos de las desviaciones
de los datos con respecto a una medida de tendencia central.
N

DM

Xi estadi gra fo de posicion


I 1

Si el estadgrafo es la media, se tiene:


N

DM

Xi x
I 1

Para datos no clasificados

DM

Xi x ni
I 1

Para datos clasificados

I.5. Desviacin Estndar y Variancia


Miden el grado de dispersin de los datos numricos en torno de
un valor medio.

La Desviacin Estndar de un conjunto de datos X1, ..., Xn est


definida por:

La Variancia es el cuadrado de la desviacin estndar:

La frmula de la varianza ser:


n

V( x )

X
i 1

X ni
2

I.6. COVARIANZA
El valor de covarianza entre dos conjuntos de datos numricos a y
b, con N puntos es definido por:

Este valor indica el grado de similitud entre los conjuntos a y b, o


sea, como los datos estn correlacionados entre s. Cuanto mayor
es la covarianza, mayor es el grado de correlacin entre los datos.
I.7. COEFICIENTE DE CORRELACIN
El coeficiente de correlacin mide la similitud entre dos conjuntos
de datos numricos sobre una escala absoluta de [-1, 1]. Este
coeficiente es

Calculado a travs de la divisin del valor de covariancia entre la


raz cuadrada del producto de las desviaciones estndar de los
conjuntos de datos a y b:

I.8.

COEFICIENTE DE VARIACIN

El efecto de la variacin o dispersin con relacin a la media


puede ser medido por la dispersin relativa, definida por:
Dispersin Relativa = Dispersin Absoluta/Media
Si la dispersin absoluta corresponde a la desviacin estndar, la
dispersin relativa es denominada coeficiente de variacin v:3
El coeficiente de variacin deja de ser til cuando la media es
prxima de cero. Su formula esta representada por

C.V .( x )

Sx
*100%
X

I.9. COEFICIENTE DE MOMENTO DE ASIMETRA


La asimetra de una muestra se mide mediante el coeficiente de
asimetra, para el clculo del coeficiente de asimetra se emplea el
tercer momento con respecto a la media y para que este
coeficiente no tenga dimensiones el tercer momento se divide
entre la desviacin estndar elevado a la potencia 3.
Es el grado de desvo o alejamiento del eje de simetra de una
distribucin. Para distribuciones asimtricas, la media tiende a
situarse del lado de la cola ms larga de la distribucin. Este
coeficiente puede ser definido usando el 3 momento centrado en
la media y la desviacin estndar:4

1
m3
n

x - x
i

i 1

g Cs

n 2 m3

n 1 n 2 S 3

S g=0 es una distribucin simtrica


S g>0 es una distribucin sesgada a la derecha (polgono de
frecuencias con cola ms larga a la derecha)
S g<0 es una distribucin sesgada a la izquierda (polgono de
frecuencias con cola ms larga hacia la izquierda).

El sesgo del polgono de frecuencias se aprecia trazando una vertical


por la moda donde se diferencia la cola del polgono de frecuencias.

3 Ing. MAXIMO VILLON BEJAR Pg. 107.


4 Ing. MAXIMO VILLON BEJAR Pg. 105

Es importante indicar que los tres nmeros son suficientes para tener
una idea de la forma del histograma.

I.10.

COEFICIENTE DE KURTOSIS

El grado apuntamiento del polgono de frecuencias (forma puntiaguda


del polgono de frecuencias) se mide mediante el coeficiente de
curtosis. Para el clculo del coeficiente de curtosis se emplea el
cuarto momento con respecto a la media y para que este coeficiente
no tenga dimensiones el cuarto momento se divide entre la
desviacin estndar elevado a la potencia 4
n

x x
i

M4

i 1

CK

n3M 4

n 1 n 2 n 3 S 4

Mide
el
grado
de
achatamiento de una distribucin de datos y puede ser definido por la
divisin del momento de grado 4 centrado en la media entre la
variancia elevada al cuadrado. O sea:

Es una medida estadstica que describe el apuntamiento o


achatamiento de una cierta distribucin con respecto a una
distribucin normal. La kurtosis positiva indica una distribucin
relativamente apuntada, y la negativa indica una distribucin
relativamente achatada. En una distribucin normal la kurtosis es
igual a 3, a los valores mayores a 3 se los llama kurtosis excesiva. El
caso de kurtosis excesiva indica que hay una mayor probabilidad de
que los retornos observados estn ms alejados de la media que en
una distribucin normal. Leptokurtosis se denomina al atributo de una
distribucin con muy altos ndices de kurtosis.
El valor del coeficiente de curtosis es costumbre comparar con Ck=3
que es coeficiente de apuntamiento de una curva continua de forma
de una campana (curva normal).
S Ck>3 es una distribucin leptocrtica, picuda o puntiaguda.
S Ck=3 es una distribucin mesocrtica o moderada (curva
normal)
S Ck<3 es una distribucin platicrtica, achatada o plana.
1.2.o.- DESVIACIN ESTNDAR MUESTRAL.

La varianza muestral est medida en el cuadrado de las unidades


observadas al hacer las mediciones contenidas en la muestra. Para

devolverse a una estadstica que use las mismas unidades que las
observaciones, es necesario calcular su raz cuadrada.
Lo anterior conduce a la definicin de la estadstica denominada
'desviacin estndar muestral', que no es otra cosa que la raz
cuadrada de la varianza

Para una muestra de tamao n, x1, ..., xn, se tiene que:

El uso de esta estadstica es recomendado en aquellos conjuntos de datos


que ofrecen cierto grado de simetra respecto de su centro. En estos casos,
habitualmente tiene sentido medir discrepancias de un valor con el centro
de los datos usando mltiplos de la desviacin estndar.
A modo de ejemplo, se puede decir que un valor est bastante
alejado del centro de los datos si su distancia de l supera dos
desviaciones estndar.
Apoyndose en la idea anterior, la desviacin estndar puede ser
usada para determinar valores que se encuentran 'cerca' del
centro. Este uso va ms all de la simple descripcin, en otros
mbitos de Estadstica es usada para tomar decisiones respecto
de la poblacin de la que fue extrada la muestra.5

I.11. SESGO

Segn el diccionario un sesgo es "una inclinacin parcial de la mente". En


nuestro mbito, la palabra sesgo sirve para definir la tendencia sistemtica
de ciertos diseos de ensayos clnicos para producir de forma consistente
resultados mejores o peores que otros diseos.
Skewness o sesgo: Medida estadstica que describe la simetra de
la distribucin alrededor de un promedio. Si el sesgo es igual a
cero, la distribucin es simtrica; si el sesgo es positivo la
distribucin una tendr una cola asimtrica extendida hacia los
valores positivos. Un sesgo negativo indica una distribucin con
una cola asimtrica extendida hacia los valores negativos 6.
5 Ing. MAXIMO VILLON BEJAR Pg. 93
6 Ing. MAXIMO VILLON BEJAR Pg. 94

AJUSTE DE UNA DISTRIBUCION DE PROBABILIDADES


La distribucin de Probabilidades es una funcin que representa la
probabilidad de ocurrencia de una variable aleatoria.
Ajustando una distribucin a un conjunto de datos hidrolgicos, una gran
cantidad de informacin de la muestra se resume en la distribucin y sus
parmetros.

DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGA


El comportamiento de las variables aleatorias discretas o continuas se
describe con la ayuda de Distribuciones de Probabilidad. La variable se
designa por mayscula y un valor especfico de ella por minscula.
Por P(x = a) se denota la probabilidad de que un evento asuma el valor a;
similarmente P(a x b) denota la probabilidad de que un evento se
encuentre en el intervalo (a,b). Si conocemos la probabilidad P(a x b)
para todos los valores de a y b, se dice que conocemos la Distribucin de
Probabilidades de la variable x.
Si x es un nmero dado y consideramos la probabilidad P(X x):
F(x)= P(X x):
Llamamos F(x) la funcin de distribucin acumulada.

3.-

DISTRIBUCIONES
CONTINUAS
3.1

DE

PROBABILIDAD

PARA

VARIABLES

DISTRIBUCION NORMAL
La distribucin normal es una distribucin simtrica en forma de
campana, tambin conocida como Campana de Gauss. Aunque
muchas veces no se ajusta a los datos hidrolgicos tiene amplia
aplicacin por ejemplo a los datos transformados que siguen la
distribucin normal7.
3.1.1

FUNCIN DE DENSIDAD:

La funcin de densidad est dada por

Los dos parmetros de la distribucin son la media y desviacin


estndar para los cuales
derivados de los datos.
7 Ing. MAXIMO VILLON BEJAR Pg. 169.

(media) y s (desviacin estndar) son

3.1.2

ESTIMACIN DE PARMETROS:

3.1.3

FACTOR DE FRECUENCIA:

1 1.

Si se trabaja con los X sin transformar el K se calcula como

Este factor es el mismo de la variable normal estndar

3.1.4

LIMITES DE CONFIANZA:

Donde es el nivel de probabilidad


es el cuartil de la distribucin
normal estandarizada para una probabilidad acumulada de 1- y Se es
el error estndar8

3.2

DISTRIBUCIN LOGNORMAL DE DOS PARMETROS


Si los logaritmos Y de una variable aleatoria X se distribuyen
normalmente se dice que X se distribuye normalmente.
Esta distribucin es muy usada para el clculo de valores extremos
por ejemplo Qmax, Qmnimos, Pmax, Pmnima (excelentes resultados
en Antioquia). Tiene la ventaja que X>0 y que la transformacin Log
tiende a reducir la asimetra positiva ya que al sacar logaritmos se
reducen en mayor proporcin los datos mayores que los menores.
Limitaciones: tiene solamente dos parmetros, y requiere que los
logaritmos de las variables estn centrados en la media 9

8 Ing. MAXIMO VILLON BEJAR Pg. 170.

3.2.1

FUNCIN DE DENSIDAD:

y = ln x
Donde,
y: media de los logaritmos

de la poblacin (parmetro escalar),

estimado
y: Desviacin estndar de los logaritmos de la poblacin, estimado

sy.10
3.2.2

ESTIMACIN DE PARMETROS:

3.2.3

FACTOR DE FRECUENCIA:
Puede trabajarse en el campo original y en el campo
transformado.

2.
Campo transformado: Si se trabaja en el campo
transformado se trabaja con la media y la desviacin estndar
de los logaritmos, as:
Ln(XTr) = xTr+KSy
de donde,
XTr =

ln (x

Tr

Con K con variable normal estandarizada para el Tr dado, x y


media de los logaritmos y S y es la desviacin estndar de los
logaritmos.
2.-3. Campo original: Si se trabaja con los X sin transformar
el K se calcula como
9 Ing. MAXIMO VILLON BEJAR Pg. 179
10 Ing. MAXIMO VILLON BEJAR Pg. 181

K es la variable normal estandarizada para el Tr dado,


es el
coeficiente de variacin, x media de los datos originales y s desviacin
estndar de los datos originales.
3.2.4

LIMITES DE CONFIANZA:

En el campo transformado.

en donde, n numero de datos, Se error estndar, K T variable normal


estandarizada.

3.3

DISTRIBUCION GUMBEL
Una familia importante de distribuciones usadas en el anlisis de
frecuencia hidrolgico es la distribucin general de valores extremos,
la cual ha sido ampliamente utilizada para representar el
comportamiento de crecientes y sequas (mximos y mnimos) 11.
3.3.1

FUNCIN DE DENSIDAD:

En donde y son los parmetros de la distribucin.

3.3.2

ESTIMACIN DE PARMETROS

11 Ing. MAXIMO VILLON BEJAR Pg. 210.

Donde
muestra.

3.3.3

son la media y la desviacin estndar estimadas con la

FACTOR DE FRECUENCIA:

Donde Tr es el periodo de retorno. Para la distribucin Gumbel se


tiene que el caudal para un perodo de retorno de 2.33 aos es igual a
la media de los caudales mximos.
3.3.4

LIMITES DE CONFIANZA

Xt t(1-) Se

KT es el factor de frecuencia y t (1-) es la variable normal estandarizada


para una probabilidad de no excedencia de 1-.

Ejemplo de Aplicacin.-

Calcular el rango o la amplitud de la muestra

También podría gustarte