Documentos de Académico
Documentos de Profesional
Documentos de Cultura
GEOESTADISTICA Total
GEOESTADISTICA Total
CONCEPTOS BASICOS
informacin
sobre
una
ms
caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y
continuas:
Discretas: slo pueden tomar valores enteros (1, 2, 8, 4, etc.). Por ejemplo:
nmero de hermanos (puede ser 1, 2, 3......etc, pero, por ejemplo, nunca podr
ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por
ejemplo, la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los
siguientes conceptos:
Individuo: cualquier elemento que porte informacin sobre el fenmeno que se
estudia. As, si estudiamos la altura de los nios de una clase, cada alumno es
un individuo; si estudiamos el precio de la vivienda, cada vivienda es un
individuo.
Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.)
que porten informacin sobre el fenmeno que se estudia. Por ejemplo, si
estudiamos el precio de la vivienda en una ciudad, la poblacin ser el total de
las viviendas de dicha ciudad.
dada por:
P ( A )=
NA
NS
.. (1)
Ejemplos:
1. El arrojar una moneda, la probabilidad de que salga sello, es:
1
P= 2
2. Al arrojar un dado, hay seis casos igualmente posibles, la
probabilidad de que salga un nmero igual o mayor que 3 es:
4
2
P= 6 = 3
3. Al arrojar dos dados, hay 36 casos igualmente posibles, la
probabilidad de que la suma de los resultado sea 7, es:
6
1
P = 36 = 6
4. En una serie de dos bolas rojas y ocho bolas negras, hallar la
probabilidad que al extraer una bola, esta sea de color rojo.
De los 10 casos igualmente probables, en 2 casos suceder el
evento que se considera, por lo que se tendr:
2
1
P = 10 = 5
En el concepto clsico
experimentos en los
igualmente posibles.
problemas prcticos no
P(A)
2. P(S) = 1
A1
3. Si
,
1 , para todo A
A2
, ,
AN
excluyentes, entonces:
A
A2
A3
AN
A
A
P( 1 U
U
U.U
) = P ( 1 ) + P ( 2 ) + + P (
AN
) = 1 P(A), donde
AC
es el complemento de A.
P ( A B )=P ( A ) + P ( B )P ( A B )( 2)
PROBABILIDAD CONDICIONAL
Si A y B son dos eventos en los cuales
P ( A ) 0 , entonces, la probabilidad
P ( B/ A )=
P( A B)
.(3)
P( A)
Nmero
de das
Meses
Caudal Q
31
Curva B
Curva A
Curva C
2. Medidas de dispersin
Se refiere a la forma como se encuentran esparcidas las observaciones. En la
fig. 2, se observa que la curva B tiene una mayor separacin o dispersin que
la curva A.
Curva B
Curva A
Las curvas asimtricas o sesgadas, como las que se muestran en la fig. 4 son
aquellas en las cuales la distribucin de frecuencia se concentra en el extremo
inferior o superior de la escala de medida sobre el eje horizontal. Los valores
no se distribuye igualmente, por lo que pueden ser sesgadas a la derecha
(curva A) i sesgadas a la izquierda (curva B).
Curva A
Curva B
hecho que una es ms puntiaguda que la otra,, por lo que tienen diferente
grado de curtosis.
Curva A
Curva B
Curva B (Leptocrtica)
Curva A (Mesocrtica)
Curva C (Platicrtica)
X .
xi
= i=1
n
(1)
xi
X = i=1
n
(2)
Donde:
: media poblacional
X : media muestral
Xi: valor i-simo de la muestra
n: nmero de datos de la muestra o poblacin
Media aritmtica de datos agrupados
Para el caso de datos agrupados, la frmula es:
k
fi . xi
X = i=1
(3)
Donde:
fi: frecuencia absoluta (nmero de observaciones) en el intercalo i
xi: marca de clase del intercalo i
k: nmero de intervalos de clase
n: nmero de observaciones de la muestra
fi . xi
X p = i=1n
fi
..(4)
i=1
Donde:
x p : Media ponderada
xi: valor i-simo de la muestra
fi: valor del factor de ponderacin del i-simo valor de la muestra
n: nmero de observaciones de la muestra
La media ponderada, se utiliza por ejemplo para el clculo de la notas
promedio de un alumno, donde para cada valor de notas, el factor de
ponderacin es el credito, as:
n
Pi . Ai
P= i=1 n
Ai
i=1
Dnde:
P
: Notas promedio
Pi: valor de las notas promedio del alumno i
Ai: Numero de crditos del alumno i
n: nmero de estaciones
2.2.3 Media geomtrica
Dada la muestra compuesta de n datos, X 1, X2, X3,Xn, la media
geomtrica se define como la raz n-sima, de la productoria de los datos, es
decir:
1/ n
x G=( xi)
(5)
i=1
Donde:
x G : media geomtrica
n
xi
i=1
, n impar
(6)
Mcd=
X n / 2+ X n/ 2+1
, n par
2
(7)
n+1
(F +1)
2
Mcd=
W + Lm
fm
(8)
Donde:
Med: mediana muestral
n: nmero total de elementos de la muestra
F: suma de todas las frecuencias hasta la clase de la mediana pero sin
incluirla
fm: frecuencia nicamente de la clase de la media
w: amplitud del intervalo de clase
Lm: lmite inferior
En general la clase donde se encuentra la mediana es aquella que tiene al
elemento situado en la porcin (n+1)/2
2.2.5 Moda
Es aquel valor que se repite ms frecuentemente en un conjunto de datos, se
denota por Mo.
Para datos agrupados en intervalos de clase, la moda, una vez determinada la
clase modal se calcula con la siguiente ecuacin:
Mo=Lm+
d1
w
d 1+ d 2
(9)
Donde:
di: diferencia entre la frecuencia de la clase modal y la premodal (clase
anterior)
d2: diferencia entre la frecuencia de la clase modal y la postmodal (clase
siguiente)
w: amplitud del intervalo de clase
Lm: limite inferior de la clase modal
En general la clase modal es aquella que tiene la mxima frecuencia
2.2.6 comparacin entre la media, la mediana y la moda
(a)
moda
mediana
Media
(c)
mediana
moda
Media
(c)
Figura 7. Localizacion de la media, mediana y moda
(10)
Donde:
R: rango
Xmax: valor mximo de los datos
Xmin: valor mnimo de los datos
El rango o la amplitud es una manera conveniente de describir la dispersin,
sin embargo, no da medida alguna de la dispersin ente los datos con respecto
al valor central.
2.3.2 Varianza
Datos no agrupados:
La varianza poblacional (2), se define como la suma de cuadrados de las
desviaciones, de los datos con respecto a la media, dividida entre el nmero
total de datos, es decir:
n
( xi)2
2= i=1
(11)
( xix )2
S 2= i=1
n1
(12)
(13)
xi=n
xi =n x
(14)
( xi x )2= xi2 2 x ( xi )+ n x 2
( xi x )2= xi2 n x2
(15)
1
2= ( xi 2n x 2 ) (16)
n i=1
Y en (12) resulta:
2
S=
1
2
2
( xi n x )
n1 i=1
(17)
Donde:
S2: varianza muestral
2= varianza poblacional
xi: valor i-simo de la muestra
(xi)2 . fi
2= i=1
(18)
( xix )2 . fi
S 2= i=1
(19)
n1
Donde:
xi: valor de la i-sima marca de clase
x =: media
fi: valor de la i-sima frecuencia absoluta, es decir, nmero de datos en el
intervalo i
k: nmero de intervalos de clase
n: nmero total de datos
Para el clculo computacional, las ecuaciones (18) y (19), se pueden expresar:
2
xi . fin
(20)
i=1
1
=
n
2
xi 2 . fin x 2
k
i=1
1
S=
n1
(21)
= 2 (poblacional)
S= S2
(muestral)
xi n
k
i=1
n
=
(22)
xi 2n x 2
k
i=1
n1
S=
(23)
Siendo:
n
1
x == xi
n i=1
(24)
xi . fin
i=1
n
=
2
xi . fin x
(25)
i=1
n1
S=
Siendo:
(26)
x ==
1
xi . fi
n i=1
(27)
x= :media
fi: valor de la i-sima frecuencia absoluta, es decir nmero de datos en el
intervalo i
k: nmero de intervalos de clase
n: nmero total de datos
2.3.4 COEFICIENTE DE VARIACION
Es una medida relativa de dispersin, que relaciona la desviacin estndar y la
media, es decir:
CV =
S
x2
(28)
(29)
Donde:
n
( xi)3
3= i=1
(30)
(xi)
k
i=1
n
=
n
1
xi
n i=1
Cs=
n2 M 3
( n1 )( n2 ) S 3
(31)
Donde:
k
( xi x )2
M 3= i=1
S=
(32)
1
(xi x )2
n1 i=1
k
1
x = xi
n i=1
Datos agrupados:
El sesgo ( ) para datos poblacionales, se obtiene con la siguiente ecuacin:
=
3
3
Donde:
( xi)3 fi
3 i=1
. (33)
1
2
= ( xi) fi
n i=1
k
1
fi xi
n i=1
xi
n2 M 3
( n1 ) ( n2 ) s3
Cs =
(34)
(xix )3 fi
M3 =
S=
i=1
(35)
1
(xi x )2 fi
n1 i=1
k
1
fi xi
n i=1
xi
K=
.. (36)
(xi)4 fi
3 =
i=1
. (37)
1
=
( xix )2 fi
n1 i=1
k
1
xi
n i=1
Ck =
. (38)
(xix )4
M3 =
S=
i=1
1
(xi x )2 fi
n1 i=1
k
(39)
1
fi xi
n i=1
Datos agrupados
El coeficiente de curtosis (k) para datos poblacionales se define
mediante la siguiente ecuacin
4
4
K=
Donde
k
(xi)3 fi
3 i=1
........ (40)
1
= ( xi)2 fi
n i=1
k
1
fi xi
n i=1
xi
Ck =
n M4
( n1 ) ( n2 )( n3)S 4
. (41)
Donde
k
M4 =
(xix )3 fi
i=1
(42)
S=
1
(xi x )2 fi
n1 i=1
k
1
fi xi
n i=1
PRECIPITACIO
N (mm)
1418.60
1527.30
1108.60
1084.20
1509.10
1394.90
1334.40
AO
1981
1982
1983
1984
1985
1986
PRECIPITACIO
N (mm)
1441.50
1133.20
891.00
1429.80
1141.50
1312.60
Solucin:
Los resultados que se obtienen, son los que se muestran:
SERIE
1418.60 1527.30 1108.60 1084.20 1509.10 1394.90 1334.40
1441.50 1133.20 891.00 1429.80 1141.50 1312.60
Numero de datos = 13
RESULTADOS
Media
Varianza
Desviacin estndar
Coeficiente variacin
Coeficiente sesgo
Coeficiente curtosis
DATOS
PROBLACIONALES
1286,67
35214.73
187.66
0.15
-0.55
2.20
DATOS
MUESTRALES
1286.67
38149.29
195.32
0.15
0.63
3.12
Q m3/seg
3.99
2.96
1.79
1.55
2.48
2.61
2.27
1.86
2.07
2.70
AO
1981
1982
1983
1984
1985
1986
1987
1988
1989
Q m3/seg
5.52
3.09
5.00
6.03
2.73
3.13
4.18
3.26
4.03
MARCA DE
CLASE
1.5
2.5
3.5
4.5
5.5
6.5
1
150
2915
2
300
2563
3
187
3241
4
600
4017
5
550
5321
6
145
4621
7
278
5002
8
110
4932
f (t)
tx
. ( 1)
Procedimiento
1. Ordenar la muestra en forma creciente o decreciente puede
hacerse uso del programa en Exel.
Por ejemplo, ordenando en forma creciente, se tiene:
Xmin, X2,X3.. Xmax
Donde
Xmin = X1 es el valor minimo de los datos
Xmax = XN es el valor mximo de los datos
2. Calcular el rango R de la muestra.
R = Xmax Xmin ( 2)
3. Seleccionar el nmero de intervalos de clase NC, este depende del
tamao de la muestra N en aplicaciones de hidrologa el numero
de intervalos de clase puede estar entre 6 y 25.
Yevjevich sugiere para seleccionar NC, las siguientes relaciones
empricas:
(i)
NC : 1.33 ln N +1 (3)
(ii)
Si N < 30 .. NC < 5
Si 30 < N < 75 8 NC 10
Si N > 75 . 10 < NC 30
Donde
N : tamao de la muestra
Ln N logaritmo natural o neperiano del tamao muestral.
X maxXmin
NC 1
R
NC 1
. ( 4)
LCII + LCSI
2
(7)
fri =
Fab i
N
. ( 9 )
j=1
j=1
frj=
nj
N
1
nj
N j=1
. ( 10 )
Donde
Fri: frecuencia relativa acumulada hasta el intervalo i
J: 1,2,.. i acumulacin de los intervalos hasta i
10.
Calcular la funcin de distribucin acumulada o empirica Fi
para cada intervalo. Esta funcin segn Yevjevich, se calcula
usando la formula:
Fi =
lim
x 0
fri
x
fri
x
N x
.. (11)
11.
Calcular la funcin de distribucin acumulada o emprica
usando la formula:
i
Fi =
x fj
j=1
(12)
AO
1911
1912
1913
1914
1915
1916
1917
1918
1919
1920
1921
1922
1923
1924
1925
1926
1927
1928
1929
1930
1931
1932
1933
1934
CAUDAL
M3/S
7.91
8.01
13.27
16.39
80.83
60.08
21.55
27.71
28.63
30.27
33.43
35.16
27.21
15.58
64.81
51.26
33.48
25.79
25.80
18.93
16.15
38.30
54.54
59.40
AO
1935
1936
1937
1938
1939
1940
1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
CAUDAL
M3/S
24.58
28.49
10.05
28.01
34.92
31.36
42.74
12.94
41.16
35.90
33.76
29.28
19.17
29.37
30.06
9.67
10.42
23.99
42.17
16.00
22.78
32.69
34.28
20.24
AO
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
19970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
CAUDAL
M3/S
22.88
17.57
14.60
31.14
18.20
24.69
22.99
11.78
32.26
4.76
12.70
16.19
30.14
30.57
45.38
18.91
34.99
21.49
29.26
4.58
12.46
3.14
f ( x )=
1
e1 /2[( x)/ ]
2
Donde:
= parmetro de localizacin
2 = parmetro de escala
Para la funcin f(x), quede definida, debe calcularse para los parmetros
y
xi
^= x^ = i=1
n
(x ix )2
^ =S 2= i=1
Donde:
^
Es el estimador de la
Es el estimador de
Sesgado si
E(a)=
Insesgado
E(a)= + v ()
Dnde: v () = E(a)
Eficiente si:
Consistente
Grafico
Mnimo cuadrado
Momentos
Mxima verosimilitud
es un estimador de
S= e = ( y iab x i )
i =1
2
i
i=1
S
=2 ( y iab x i )=0
b
i=1
(1)
S
=2 x i ( y iab x i ) =0
b
i=1
(2)
xi
x ix
x
2i
xy
x i y i in i
b=
a= y b x =
y i xi b
n
(3)
=f 3 ( k , k +1, )
centrales de la poblacin.
Como los momentos son estimados a partir de los momentos de la
muestra como estimadores sesgados o insesgados, el resultado k se
obtiene ser a, b, c, o
a^ , b^ , c^ ,
2
2
1/
1
f ( x )=
e
2
1 , 2 ,
Solucin:
Sabemos que:
1) la media poblacional es igual al 1er momento respecto al origen, es
decir:
=E ( x )=1 = xf ( x ) dx
2) la varianza
decir:
(4)
(5)
V (x)= = 2=
2
1/
1
x
e
2 2
( x1) / 2
2
1/
x e
1
=
2 2
(6)
Haciendo:
x1
=y
2
Lmites: si
x=1 +2 y
x -
x +
dx= 2+ d y
y -
y +
1
=
( + y)e y /2 2 dy
2 2 1 2
2
1 2
( 2)
e y /2 dy+
e y / 2 dy
2
2
2
y /2
e
2
dy +
e y / 2 dy
2 2
Calculo de:
A= e
y /2
dy = e
Siendo
y /2
dy + ey /2 dy
0
(9)
1/2
f ( y )=e
1/2
f ( y )=e
e1/ 2 y
= f(y)
Dado que f(-y) =f(y), f(y) es una funcin par, por lo cual se tiene:
0
f ( y ) dy
f ( y ) dy
0
A= e1 /2 y dy+ e1 /2 y dy
0
A=2 e1/ 2 y dy
(10)
Haciendo
2
y =t
y=t
1/ 2
dy=
2 ydy=dt
dt
dt
= 1/2
2 y 2t
Limites:
Para y = 0
t =0
A=2 e1/ 2
0
dt
1 /2
2t
A= t 1 /2 e1 /2 t dt
0
(1/2)
Pero
1
r( )
2
=
1
+1
(1/2)1 /2
2
1
+1)
2
( 12 )=
A=
1
2
A= 2
. (11)
Calculo de B
B= ye1 /2 y dy
B= ye
1 /2 y
. (12)
Donde
dy+ ye 1 /2 y dy
f ( y )= y e
f ( y ) =( y ) e
1 2
y
2
1
( y )2
2
=(y ) e
1 2
y
2
=f ( y )
B= ye1 /2 y dy + ye1 /2 y dy
0
B=0
(13)
2 +
(0)
=1
)
1=
1
X = X
N i
2
1/
1
(x)
e
2 2
2= 2=
Como =
( x1 )/ 2
2
1/
x1 2 e
1
2
=2=
2 2
es igual a la media
Haciendo:
x1
=y
2
x=1 +2 y
dx= 2 d y
Limites:
Lmites: si
y -
luego
2=
1
22 y 2 e1/ 2 y 2 dy
2=
22 2 1 /2 y
y e dy
2 2
2 1 /2 y
Siendo f(Y) y e
f ( y ) dy=2 f ( y ) dy
Luego:
22 2 1/ 2 y
=
y e dy
2 0
2
Haciendo:
y 2=t
dy=
y=t 1/ 2
dt
2 t 1 /2
Limites.
Para y = 0
t =0
Se tiene:
2 22 1/ 2 dt
=
t e 2t 1/ 2
2 0
2
22 1 /2 1 /2
=
t e dt
2 0
2
2
2= 2 .
2 (1/2)3 /2
1
1/2 r ( )
2
2
2= 2 .
3/ 2
2 (1 /2)
Pero: r(1/2) =
2=
2 2
. 1/ 2
2
(1/2)
luego:
2=
2
. 2
2
2= 22
( el parmetro
2= 22=
2=
es igual
1
)2
( X i X
N 1
1
(X i X )2
N1
Para x= 0, 1, 2,
f(x)
0
En otro caso
= x
x=0
x e
x
e
x=0 ( x 1)
0 e
x e
+
(1) x=1 (x1)
Pero:
e
e
e
=
=
=0
(1) r (0)
Luego:
x e
x=1 (x1)
=e .
+ + +
0 1 2
= e . 1+
+ +
1 2
Pero:
2 3
1+ + + =e
1 2
Entonces:
=e e
Falta 88 y 89
i =1
i=1
L= f ( x i , a ,b ,c , ) lnL= ln f ( x i , a , b , c , )
lnL
lnL
lnL
=0 ;
=0;
=0 ;
a
b
c
El mismo que tiene tantas ecuaciones como incgnitas.
Las propiedades de los estimadores calculados por el mtodo de mxima verosimilitud,
son:
Usualmente insesgado.
Si la eficiencia de estimadores existe para los parmetros , , g,, el mtodo
puede producirlos.
Ejemplos:
1. Dada la funcin densidad de la distribucin exponencial:
x
f ( x )= e para x >0, > 0
0 en otros casos
L= f ( x i , )
i =1
f ( x i , )=
Siendo:
ex
Luego:
N
L= ex
i =1
lnL= ln ( e
i=1
lnL= ln ( ln+ ln ex )
i=1
lnL= ln ( ln x i )
i=1
lnL
=lnL=
i=1
ln ( ln x i ) =0
( 1 x i)=0
i=1
1
x i=0
i=1
n
i=1
n1
= x i
i=1
n
1 1
= x
n i=1 i
1
n
1
x
n i=1 i
f ( x )=
1
[ x1 /2 ]
2
para< a<
Solucin:
1. La funcin de verosimilitud es:
N
L=
i =1
1
[ x1/ 2]
2
2. Tomando ln:
lnL= ln (
i=1
)e
1
[ x1 /2 ]
2
1 x
ln ( 2 2) ( i 1 )
2 2
lnL=
i=1
1 2
lnL= ln ( 2 1ln 2 ) ( )
2
i=1
Derivando con respecto a
1 , 2 , resulta:
n
x 1
lnL
1
=
2( i 1 )(
) =0
i=1 2
2
2
a)
n
i=1
x i1
=0
2
n
1
( x i1 )=0
22 i=1
n
i=1
i=1
i=1
i=1
x i 1=0
x i= 1
n
x i=n 1
i=1
xi =
n
1=
n i=1
x i 1
1 1
=0
2 2
n
lnL
=
i=1
b)
x i1
2
1
+ =0
2
i=1
x i1
2
1+=0
n
1
2 i=1
x i 1
(1)+
i=1
i=1
x i 1
n
1
22 i=1
xi 1
n
1
n i=1
x i 1
n
1
2
2 =
n i=1
4.3 PROBLEMAS PROPUESTOS
1. dada la funcin densidad de la distribucin uniforme:
f ( x )=
1
para x
Estimar su parmetro
e
f ( x )= x !
para x =0,1, 2,
0 en otros casos
Calcular el parmetro
(x)
f ( x )= e
Ajuste grafico
Ajuste estadistico
chicuadrado
{SmirnovKolmogorov
CUADRADO
cuadrado es la
ms
comnmente
usada
para
verificar
la
i ei
2/i
(1)
X c =
i=1
Donde:
k
i=1
i=1
i = e i=N
X c 2 =Valor calculado de chi-cuadrado, a partir de los datos.
i
ei
N iN Pi
X c 2=
i=1
Donde:
N = Tamao muestral
. (3)
k
X c = N i2N ( 4)
N i=1
2
El valor
X t 2 obtenido de
X c 2 X t2 ,
Entonces se acepta la hiptesis de que el ajuste es bueno al nivel de
significacin seleccionado.
Si el chi-cuadrado calculado es mayor que el valor tabular, es decir:
2
Xc > Xt
o
(6)
Tambin:
P( < o) = 1
(7)
5.4 PROCEDIMIENTO.
El procedimiento para efectuar el ajuste con Smirnov-Kolmogorov, es:
1. Calcular la probabilidad empica o experimental P(x) de los datos, para
M
N +1 .(8)
Dnde:
M = Nmero de orden.
N = Nmero de datos
Existen varias frmulas para calcular la probabilidad experimental, la misma
que se muestra en la tabla 1, siendo la ms utilizada la frmula de Weibull.
2. Calcular la probabilidad terica F(x).
2.1.
2.2.
Probabilidad experimental
P
m
n
Hazen
m-1/2
n
Weibull
m
n+1
Chegadayev
m - 0.3
n + 0.4
Bom
m-3/8
n+
Tukey
3m 1
3n + 4
Gringorten
ma
n + 1 2a
Dnde:
10
0.448
60
0.440
20
0.443
70
0.440
Valor
30
0.442
80
0.440
40
0.441
90
0.439
50
0.440
100
0.439
Probabilidad %
X
X + S
X
-S
50
84.13
15.87
TAMAO
MUESTRAL
N
0.20
0.10
0.05
0.01
0.45
0-51
0.56
0.67
10
0.32
0.37
0.41
0.49
15
0.27
0.30
0.34
0.40
20
0.23
0.26
0.29
0.36
25
0.21
0.24
0.27
0.32
30
0.19
0.22
0.24
0.29
35
0.18
0.20
0.23
0.27
40
0.17
0.19
O.21
0.25
45
0.16
0-18
0.20
0.24
50
0.15
0.17
0.19
0.23
N >50
NIVESLES SIGNIFICACION
1.07
1.22
1.36
1.63
VI
El
DISTRIBUCIONES TEORICAS
hidrlogo
generalmente
tendr
disponible
un
registro
de
datos
Distribucin normal
Distribucin log-normal de 2 o 3 parmetros
Distribucin de gamma de 2 o 3 parmetros
Distribucin Gumbel
1
f ( x )=
e
2 S
1 X X
2
S
1 X X
2
S
..(1)
(2)
seleccion de
una
distribucin
REGISTRO DE
DATOS
ELEGIR UNA
DISTRIBUCIO
N TEORICA
ESTIMACION
DE
PARAMETROS
PRUEBA DE
BONDAD DE
AJUSTE
AJUSTE
BUENO
UTILIZAR
DISTRIBUCION
TEORICA
ELEGIDA
FIN
Donde:
F(x) es la funcin de distribucin de la distribucin para la variable original x,
segn la ecuacin (6), o tambin para la variable estandarizada Z, segn la ec.
(8), es decir F(x) = F(Z).
Esta funcin de distribucin tiene las siguientes funciones:
F( ) = 0
F( X ) = 0.5
F( + ) = 1
..(10)
Donde:
F(Z) = es la funcin de distribucin acumulada
f(Z) = es la funcin densidad de la variable estandarizada
V
..(11)
b)
por la IBM (1968). Esta aproximacin con un error menor que 7.5 x 10 -8 , es:
F(Z)
..(12)
Donde:
W es definido para Z 0, como:
W=
1+0.2316419Z
1
(13)
b4 = -0.356563782
b2 = 1.781477937
b5 = - 1.821255978
b3 = 1.330274429
En ambas aproximaciones la F.D.A. es 1- F(Z), si Z<0
4. ESTIMACION DE PARAMETROS
1
X
N i=1 i
S = = [
Xi
N 1 i=1
)2]1/2
..(14)
Donde:
X
posicin.
S=
escala.
5. APLICACIONES EN HIDROLOGIA
L a distribucin normal tiene gran utilidad en hidrologa, siendo alguna de sus
principales aplicaciones:
hidrolgicas.
Como referencia para comparar varias distribuciones tericas de ajuste en una
distribucin emprica.
Para hacer procesos de inferencia estadstica.
6. AJUSTE
El ajuste puede realizarse grficamente utilizando papel probabilstico normal o
analticamente, mediante los estadsticos chi-cuadrado o Smirnov Kolmogorov.
DISTRIBUCIONES LOGARITMICAS
Las distribuciones logartmicas ms conocidas son la Log-normal,
6.2.
Y =lnX , tiene
Gumbel. Es
posible una
X0
ln ( X X 0 ) .
y varianza
2 y .
X0
no aparece.
1
f ( y )=
e
2 y
1 y y
(
)
2
y
.... (15)
y N ( y , y )
para < y<
dy
dx
Donde:
dy 1
=
dx x
y=ln x
1
x y2
1 lnX y
2
y
(16)
x logN ( y , 2 y)
2. FUNCION DE LA DISTRIBUCION ACUMULADA
y
1
F ( y )=
e
2 y
Si
Z=
y y
y
1 y y
2
y
) dy
. (17)
1
F ( Z)=
e
2
Z
2
dZ ... (18)
Z N (0,1)
=E ( x )=exp ( y +
2 y
)
2
Varianza:
2 y
S=exp ( y +
)(exp( 2 y)1) 2
2
Desv. Est :
Coeficiente de variacin:
CV =
S
=
(exp( y )1)
1
2
De donde:
2
1+C V
2
y=ln )
y=
. (19)
1 2
y + ln X
2
1
2
y = ln ( 2 )
2
C V +1
Coeficiente de sesgo:
. (20)
3
Cs= g =
3
2
(e
2 y
1)
1
2
2 y
y
( e +2 )
. (21)
. (22)
2 .
y=ln ( x X 0 ) y N ( y , y )
La funcin de distribucin de probabilidad de x es:
f ( x )=
1
e
(x X 0) y 2
para x 0 x <
1 ln ( x X0 ) y
(
)
2
y
. (23)
Media:
=E ( x )=x 0 +e
y +
y
2
. (24)
2
Varianza:
. (25)
Coeficiente de sesgo:
3
Cs= g =
3
2
y
(e y 1) 2 ( e +2 )
2
C s=g=0.52+ 4.85 2 y
. (26)
. (27)
Donde:
N2 M3
( N1)(N2) S 3
. (28)
M 3=
( x i )3
S=
. (29)
(x i )2
. (30)
N 1
xi
. (31)
Luego:
De (27):
De (25):
y=
Cs0.52
4.85
. (32)
2
1
S
2
y = ( ln y
y)
2
e 1
2
. (33)
De (24):
x 0= e
y+
y
2
. (34)
6.2.2 EJEMPLO
3
m
seg .
98.13
105.81
110.77
123.22
134.10
153.64
162.29
182.53
193.88
217.52
100.18
106.40
114.31
124.31
136.22
153.97
164.35
183.11
197.58
239.07
101.66
107.43
116.40
127.82
144.22
154.80
169.18
183.49
207.78
256.62
101.76
107.62
119.52
128.15
145.79
156.80
169.64
184.98
208.18
266.54
que
0=0.1923
1
T
1
75
F ( Q=q )=0.9866666=F ( Z )
interpolacin:
Z= 2.215
Pero para una distribucin log-normal de 2 parmetros, la variable
estandarizada es:
lnQ y
Z=
. (1)
y
El programa del listado 7, permite calcular tambin los parmetros
y
y
y
, siendo los valores obtenidos:
y =4.9861
y =0.2808
Sustituyendo valores en la ec. (1), se tiene:
lnQ4.9861
=2.215
0.2808
De donde:
2.2150.2808+4.9861
Q=e
Q=272.618
6.3.
m3
s
DISTRIBUCIN GAMMA
1. FUNCIN DENSIDAD
Se dice que una variable aleatoria X, tiene una distribucin gamma de 2
parmetros si su funcin densidad de probabilidad es:
1 x/
f ( x )=
x e
( )
para:
0x
0
0
siendo:
+
= parmetro de forma
+
= parmetro de escala
( )=funcin gamma completa , definidacomo :
( )= x 1 ex / dx
0
que converge si
>0
Si
>0
( )=( 1 ) !
( + 1 )= x ( )
( 1 )= ( 2 )=1
( 1/2 )=
( 0 )=
para
para
( )
=1, 2,3,
>0
2
1
1
1
1
1+
+
F ( x )=
0
1 x/
x e
dx
( )
(44)
x=
si
2x
v =2
(45)
F ( x )=1ex/
n
x j
/ j!
()
(46)
Y 1 eY
( )
(47)
Y 1 eY
G ( Y )=
dY
()
0
(48)
=2
=5
0.10
0.20
0.30
0.40
0.50
0.60
0.105
0.223
0.357
0.511
0.693
0.916
0.532
0.824
1.097
1.376
1.678
2.022
2.433
3.090
3.634
4.148
4.671
5.237
0.70
1.204
2.439
5.890
0.80
1.609
2.994
6.721
0.90
2.303
3.890
7.994
0.95
2.996
4.744
9.154
0.99
4.605
6.638
11.60
5
G(Y )
=10
=20
6.221
7.289
8.133
8.904
9.669
10.47
6
11.38
7
12.51
9
14.20
6
15.70
5
18.78
3
14.53
16.17
17.44
18.57
19.67
20.81
22.08
23.63
25.90
27.88
31.85
X =E ( x ) =
(49)
varianza:
S 2= 2
(50)
coeficiente de sesgo:
C S=g=
2
1 /2
(51)
X 2
S2
(52)
S2
2
X
(53)
. Para
para:
(54)
y para:
=
8.898919+9.05995 y +0.9775373 y 2
y ( 17.79728+11.968477 y + y 2 )
(55)
donde:
lnX
y=ln X
(56)
siendo:
=
(57)
f ( x )=
( xx o )
e
( )
(58)
para:
x o x<
x o<
0 <
0<
2. FUNCIN ACUMULADA
La funcin de distribucin acumulada de la distribucin gamma de 3
parmetros es:
x
F ( x )=
( xx o )
xo
1 (xx o)/
( )
dx
(59)
en la cual:
x : variable aleatoria gamma de 3 parmetros o Pearson
tipo III
xo
: parmetro de escala
: parmetro de forma
xx o
(60)
G ( Y )=
xo
1 Y
e
dY
( )
(61)
Y =0
x=x o
X =x o+
varianza:
S =
(62)
(63)
C S=g=
sesgo:
(64)
de donde:
=
4
C2S
(65)
=C S S /2
(66)
x o= X 2 S /CS
(67)
4. APLICACIN EN HIDROLOGA
Su uso en hidrologa est casi tan difundido como el uso de la
distribucin log-normal de 3 parmetros, con la desventaja de la mayor
complicacin al estimar sus parmetros y calcular los valores de la
funcin de distribucin acumulada.
La prctica ha demostrado que los resultados entre la distribucin lognormal y la distribucin Pearson III, para el ajuste de series de
precipitaciones anuales, mdulos anuales, precipitaciones mensuales,
etc. no difieren.
Las razones que convalidan la utilizacin de esta distribucin de
probabilidad son las mismas que lo hacen en la distribucin log-normal.
6.3.3.
EJEMPLO
64.0
0
155.
80
120.
169.
90
199.
00
250.
162.
70
22.8
0
231.
102.
10
76.0
0
207.
50
50
50
70
00
234. 189. 196. 96.9 91.6
00
00
00
0
0
65.4 123. 119. 200. 380.
0
00
00
00
00
Determinar el caudal de diseo para un periodo de retorno de 50 aos.
Usar la distribucin gamma de 2 parmetros.
SOLUCIN:
1. Ajuste de los datos de la serie a la distribucin gamma de dos
parmetros.
1.1. Para crear el archivo con la serie de datos, se usa el
programa del listado 6.
1.2. Para realizar la prueba de bonda de ajuste, se utiliza el
programa del listado 8. Este programa calcula adems los
parmetros de la serie y los parmetros de la distribucin,
algunos clculos parciales que se obtienen, es como se
muestra:
-
X =157.05
ln x=4.90
2
S =6450.21
S=80.31
es decir:
157.05
=45.8133
3.4280
6.4DISTRIBUCION GUNBEL
La distribucin Gumbel, una de la distribuciones de valor extremo, es
llamada tambin valor extremo Tipo I, Fisher Tippett tipo I o distribucin
doble exponencial.
1. FUNCION ACUMULADA
La funcin de distribucin acumulada de la distribucin Gunbel, tienes
la forma.
F(x) = EXP (-EXP (-(x-u)/))
(68)
(x )
F(x) =
ee
Para:
-< x <
................................................................... (69)
Dnde:
0 < < , es el parmetro de escala.
-< < , es el parmetro de posicin, llamado tambin valor
central o moda.
2. FUNCION DENCIDAD
dF(x )
dx
1 (x)/ e
e
( x)/
f(x) =
.. (71)
Para:
-< x <
La variable aleatoria reducida de Gunbel, se define como:
Y=
...................................... (7)
................................................................ (73)
y la funcin acumulada reducida Gunbel, es:
Y
ee
.. (74)
Los valores correspondientes x e Y, estn relacionados por:
F(x) = G (Y)
Y la relacin es:
Y=
x = + Y
.. (75)
3. ESTIMACION DE PARMETROS, MTODO DE MOMENTOS
Utilizando el mtodo de momentos, se obtiene las siguientes relaciones:
-Moda
xmoda =
-Media
E(x) =
= +C
lim
n
C =
1 1
1
1+ + ++ ln n
2 3
n
C = 0.5772156649
Por lo tanto:
X
= +0.57721 .
(76)
De donde se obtiene:
2 2
6
(77)
S = 0.78 S
..
(78)
- 0.57721 =
- 0.45 S.
. (79)
4. APLICACIN EN HIDROLOGIA
La ley de Gunbel o ley de valores extremos, sed utiliza generalmente
para ajustar, a una expresin matemtica, las distribuciones empricas
de frecuencia de caudales mximos anuales, precipitaciones mximas,
etc.
Es importante verificar antes de aplicar esta distribucin de
probabilidad que los coeficientes de asimetra y curtosis de la
distribucin emprica sean del mismo orden que los valores
poblacionales.
Uno de los inconvenientes del uso de esta distribucin , es que en una
distribucin doble exponencial , la variable puede tomar cualquier
valor, por lo que se puede asignar probabilidades a valores negativos
de la aleatorio, cuestin que resta significacin fsica a la aplicacin,
debido a que las variables hidrolgicas toman solamente valores
positivos o cero.
5. EJEMPLO
Se tiene el registro de caudales mximos de 29 aos, para la estacin 93 Angostura, como se muestra en la tabla.
En este rio se desea construir una presa de almacenamiento, calcular el
caudal de diseo para el vertedor de demasas, con un periodo de
retorno de 50 aos. Usar la distribucin Gunbel.
1660
618
876
563
824
557
917
683
740
520
824
818
3800
934
1120
360
1230
1030
1410
779
610
367
522
418
2280
921
1150
658
581
SOLUCION:
1. Ajuste de los datos de la serie a la distribucin Gunbel.
1.1Para crear el archivo con la serie de datos, se usa el programa del
listado 6.
1.2Para realizar la prueba de bondad de ajuste, se utiliza el programa
del listado 9. Este programa calcula adems los parmetros de la serie
y los parmetros de la distribucin, algunos clculos parciales que se
obtienen, es como se muestra:
-Clculo de los parmetros de la serie de caudales:
X
Media:
Desviacin estndar:
= 957.59
S = 682.72
= 523.3182
Parmetro de posicin
=650.3237
Decisin
Siendo:
F(Q = q) = 1 -
1
T
1
50
F(y) =
y
- e
e y
ee
= 0.98
= ln0.98
= 0.020202707
-y = ln(0.020202707)
Y= 3.9019
Pero de la ec. (72)
y=
= 3.9019
Q = + 3.9019 x
Q = 650.3237 + (3.9019) (523.3182)
Q =2,727.38 m3/s.