Está en la página 1de 10

UNA FAMILIA DE DISTRIBUCIONES BIVARIADAS Y

SUS APLICACIONES EN HIDROLOGA


A FAMILY OF BIVARIATE DISTRIBUTIONS AND ITS APPLICATIONS IN HYDROLOGY
R. Antonio Salazar-Gmez1 e I. Roberto Cruz-Medina2
1

Instituto Tecnolgico del Valle del Yaqui. Block 611 Valle del Yaqui, Bcum Sonora
(rasalazarg@hotmaillcom) 2Instituto Tecnolgico de Sonora, Cinco de Febrero 818 Obregn, Sonora. 85000 (rcruz@itson.mx)

RESUMEN

ABSTRACT

Los anlisis estadsticos con una sola variable tienen la limitacin de proveer conocimientos parciales no suficientes para caracterizar fenmenos multivariados complejos como las precipitaciones, tormentas, escorrentas e inundaciones. Para el entendimiento integral de estos fenmenos se requiere estudiar la densidad conjunta de las variables correlacionadas que los caracterizan. En hidrologa se ha supuesto que las variables de inters
siguen una distribucin gamma, por lo que la distribucin gamma
bivariada es la ms utilizada en esta disciplina. En este trabajo
se presenta la generalizacin de una distribucin gamma bivariada
a una familia de distribuciones bivariadas. Esta familia (que da
la posibilidad de utilizar cualquier distribucin continua como
marginal, por ejemplo, la lognormal, inversa de Gauss o logstica), aunada a las familias existentes, puede ser til para modelar
los fenmenos hidrolgicos. Una ventaja de esta familia es que su
distribucin conjunta tiene una expresin explcita simple que
permite su utilizacin con paquetes matemticos como
Mathematica o Matlab.

Statistical analyses with a single variable have the limitation of


providing partial knowledge that is insufficient for characterizing
complex multivariate phenomena such as precipitations, storms,
run-offs and floods. For the integral understanding of these
phenomena, it is necessary to study the joint density of the
correlated variables that characterize them. In hydrology, it has
been assumed that the variables of interest follow a gamma
distribution, therefore, the bivariate gamma distribution is the
most widely used distribution in this discipline. In this paper a
generalization of a bivariate gamma to a family of bivariate
distributions is presented. This family (which provides the
possibility of using any continuous distribution as marginal, for
example, the lognormal, inverse Gaussian or logistic), added to
the existing families, can be useful for modeling hydrological
phenomena. One advantage of this family is that its joint
distribution has a simple explicit expression that permits its use
with mathematical packages such as Mathematica or Matlab.
Key words: Bivariate distribution, gamma distribution, inverse
Gaussian distribution, marginal distributions, multivariate families.

Palabras clave: Distribucin bivariada, distribucin gamma, distribucin inversa de Gauss, distribuciones marginales, familias
multivariadas.

INTRODUCTION

INTRODUCCIN

ue et al. (2001) revised some bivariate


distributions proposed for hydrological
applications and mentioned that their
mathematical complication is the principal obstacle for
their use. The bivariate generalization of a univariate
distribution is generally not unique, as in the case of
the normal distribution; for the gamma distribution,
for example, any bivariate distribution with gamma
marginals can be considered a bivariate gamma
distribution. Plackett (1965) cites Frchet, who,
considering two random variables X and Y, with joint
distribution H(x, y) and marginal distributions F(x) and
G(y), obtained the following inequalities known as the
Frchet bounds (Kotz et al., 2000).

ue et al. (2001) revisaron algunas distribuciones bivariadas propuestas para las aplicaciones hidrolgicas y mencionan que su complicacin matemtica es el principal obstculo para su
uso. La generalizacin bivariada de una distribucin
univariada generalmente no es nica como en el caso
de la distribucin normal; para la distribucin gamma,
por ejemplo, cualquier distribucin bivariada con marginales gamma puede considerarse una distribucin
gamma bivariada. Plackett (1965), cita a Frchet, quien
considerando dos variables aleatorias X y Y, con distribucin conjunta H(x, y) y distribuciones marginales
F(x) y G(y), obtuvo las siguientes desigualdades conocidas como cotas de Frchet (Kotz et al., 2000).
Recibido: Octubre, 2006. Aprobado: Septiembre, 2007.
Publicado como ENSAYO en Agrociencia 41: 903-912. 2007.

903

H(x, y) min [F(x), G(y)]

(1)

H (x, y) min F(x) + G(y)1

(2)

AGROCIENCIA, 16 de noviembre - 31 de diciembre, 2007

H(x, y) min [F(x), G(y)]

(1)

H(x, y) min F(x) + G(y)1

(2)

Morgenstern, citado por Deste (1981) propuso la distribucin bivariada con distribuciones marginales F(x)
y F(y):

a f

a fm

a fr

H x, y = F ( x )G y 1 + 1 F ( x ) 1 G y

a f

a fl

(3)

(4)

donde las funciones A(F) y B(G) son funciones acotadas, con sus primeras diferenciales tambin acotadas,
es un parmetro de asociacin y si se acepta, sin
prdida de generalidad, que las cotas superiores de
A(F) y B(G) son iguales a uno, la expresin
para la funcin bivariada (4) es nica. La familia (4)
de distribuciones bivariadas se conoce como las distribuciones Farlie-Gumbel-Morgenstern. Deste (1981)
puntualiza que la distribucin gamma bivariada derivada de la ecuacin (3) de Morgenstern tiene una cota
superior de 1/=0.3183 para el coeficiente de correlacin y concluye que esta distribucin gamma bivariada
slo es til para variables con correlacin dbil.
El mtodo de Plackett (1965) para la construccin
de una distribucin conjunta H(x,y), satisface la ecuacin (5) y depende del parmetro 0 donde:

H (1 F G + H )
( F H )(G H )

(5)

Karian y Dudewics (2000) proporcionan una descripcin completa del mtodo, cuando =1 las variables son independientes y se alcanzan las cotas de
Frchet; la funcin de densidad conjunta, denominada
familia lambda generalizada (FLG), tiene la expresin:

a f

h x, y =

af
cS 4( 1)FG h

f ( x )g y 1 + ( 1)( F + G 2 FG )
2

3/2

(6)

donde, S=1+(F+G)(1); f(x) y g(y) representan las


funciones de densidad de las distribuciones F(x) y G(y).
Koehler y Symanowsky (1995) presentan una familia multivariada con funciones de distribucin y de
densidad en forma explcita que se denotar como FKS.

904

VOLUMEN 41, NMERO 8

a f

a fm

a fr

H x, y = F ( x )G y 1 + 1 F ( x ) 1 G y

(3)

and Farlie (1960), generalized it with the expression:

y Farlie (1960), la generaliz con la expresin:


H x, y = F ( x )G y 1 + A( F ) B(G )

Morgenstern, cited by Deste (1981), proposed the


bivariate distribution with marginal distributions F(x)
and F(y):

a f

a fl

H x, y = F ( x )G y 1 + A( F ) B(G )

(4)

where functions A(F) and B(G) are bounded functions,


with first differentials also bounded, is an association
parameter, and if it is accepted, without loss of
generality, that the upper bounds of |A(F)| and |B(G)|
are equal to one, the expression for the bivariate function
(4) is unique. The family (4) of bivariate distributions
is known as the Farlie-Gumbel-Morgenstern
distributions. Deste (1981) points out that the bivariate
gamma distribution derived from equation (3) of
Morgenstern has an upper bound of 1/=0.3183 for
the correlation coefficient and concludes that this
bivariate gamma distribution is only useful for variables
with weak correlation.
The Plackett method (1965) for the construction of a
joint distribution H(x,y), satisfies equation (5) and
depends on the parameter 0 where:

H (1 F G + H )
( F H )(G H )

(5)

Karian and Dudewics (2000) provide a complete


description of the method, when = 1 the variables
are independent and the Frchet bounds are attained;
the joint density function, known as the generalized
lambda family (GLF), has the following expression:

a f

h x, y =

af
cS 4( 1)FG h

f ( x )g y 1 + ( 1)( F + G 2 FG )
2

3/2

(6)

where, S=1+(F+G)(1); f(x) and g(y) represent the


density functions of the distributions F(x) and G(y).
Koehler and Symanowsky (1995) present a
multivariate family with explicit distribution and density
functions that will be denoted as FKS. To generate this
family the authors define a group of exponential
variables and a group of independent gamma variables,
define various transformations to the p-dimensional
hypercube with uniform margins (0, 1) to obtain p

UNA FAMILIA DE DISTRIBUCIONES BIVARIADAS Y SUS APLICACIONES EN HIDROLOGA

Para generar esta familia los autores definen un conjunto de variables exponenciales y un conjunto de variables gamma independientes, definen varias transformaciones al hipercubo p-dimensional con mrgenes
uniformes (0, 1) para obtener p variables uniformes
Ui, y se reemplazan las variables Ui por las funciones
de distribucin Fi(xi). Para dos variables, la funcin de
densidad contiene tres parmetros de asociacin (11,
12 y 22), sin embargo, la funcin puede simplificarse
de forma que contenga nicamente al parmetro 12,
(11=22=0) y si este parmetro se denota por , la
densidad bivariada es:

a f

af

h x, y = f ( x )g y F ( x )

FGC
H

( +2 )
12

1/

af
IJ
K

G y

1 +2
+ C12

a f

af

h x, y = f ( x )g y F ( x )

FGC
H

( +2 )
12

1/

af
IJ
K

G y

1 +2
C12

1/

(7)

where:

1/

(7)

donde:
C12=C21=F(x)1/1++G(y)1/2+F(x)1/1+G(y)1/2+ (8)
Johnson y Tenenbein (1981), generaron una familia de distribuciones bivariadas por el mtodo de la
combinaciones lineales ponderadas (CLP), el cual se
inicia con dos variables independientes e idnticamente
distribuidas (iid) U y V con funcin de densidad w(t),
para definir las variables U y V:
U=U y
V=cU+(1c)V

uniform variables Ui, and the Ui variables are replaced


by the distribution functions Fi(xi). For two variables,
the density function contains three association
parameters (11, 12, 22), however, the function can
be simplified in such a way that it contains only the
parameter 12, (11=22=0), and if this parameter is
denoted by , the bivariate density is:

(9.a)
(9.b)

donde, c(0,1) es una constante que afecta la dependencia entre las variables; w(t) una funcin de densidad que se puede utilizar para evaluar la sensibilidad
de la distribucin conjunta H(x,y). Los autores utilizan
como distribucin w (t) a las distribuciones uniforme,
normal, exponencial y doble exponencial, pero no proporcionan la expresin explcita de la funcin de densidad conjunta h(x, y) generada por estas distribuciones.
Las familias de distribuciones presentadas no se
aplican frecuentemente debido a la complejidad de sus
funciones de densidad. El objetivo del presente trabajo
fue obtener una familia de distribuciones bivariadas de
menor complejidad. La hiptesis que se plantea es que
el procedimiento de Moran (1969), descrito en la siguiente seccin para obtener una distribucin gamma
bivariada, se puede generalizar para cumplir el objetivo buscado.

C12=C21=F(x)1/1++G(y)1/2+F(x)1/1+G(y)1/2+ (8)
Johnson and Tenenbein (1981) generated a family
of bivariate distributions by the weighted linear
combination method (WLC), which starts with two
independent variables that are identically distributed
(iid) U and V with density function w(t), to define the
variables U and V:
U=U and
V=cU+(1c)V

(9.a)
(9.b)

where, c(0,1) is a constant that affects the dependence


among the variables; w(t) is a density function that can
be used to evaluate the sensitivity of the joint distribution
H(x,y). These authors use the uniform, normal,
exponential and double exponential distribution as w(t),
but do not provide the explicit expression of the joint
density function h(x, y) generated by these distributions.
The families of distributions presented in this section
are not frequently applied due to the complexity of
their density functions. The objective of the present
study was to obtain a family of bivariate distributions
of lower complexity. The hypothesis proposed in this
paper is that the procedure of Moran (1969), described
in the following section to obtain a bivariate gamma
distribution, can be generalized to comply with the
objective.

MATERIALS

AND

METHODS

Moran (1969), starting from a bivariate normal distribution with


correlation coefficient , obtained one of the first generalizations of
the bivariate gamma distribution using the following results:
1) Dependence among variables with a bivariate normal distribution
is completely specified by the correlation coefficient; this property

SALAZAR-GMEZ y CRUZ-MEDINA

905

AGROCIENCIA, 16 de noviembre - 31 de diciembre, 2007

MATERIALES

MTODOS

Moran (1969), partiendo de una distribucin normal bivariada


con coeficiente de correlacin , obtuvo una de las primeras generalizaciones de la distribucin gamma bivariada utilizando los siguientes resultados:
1) La dependencia entre variables con una distribucin normal
bivariada est completamente especificada por el coeficiente de
correlacin; esta propiedad de la distribucin normal bivariada
la hace ideal para expresar la dependencia lineal entre variables.
2) La funcin acumulativa de probabilidad o funcin de distribucin (FD) de cualquier variable univariada continua tiene distribucin uniforme U(0,1), en el intervalo (0, 1).
3) El teorema de cambio de variable que permite la obtencin de la
funcin de densidad de una funcin de una variable aleatoria
con cierta distribucin especfica (Casella y Berger 1990).
Moran (1969) supone dos variables aleatorias W y Z, con distribucin normal bivariada, cuya densidad es:

f w, z

R| 1
a w, z f =
exp S
dw
2 d1 i
T| 2d1 i
1

2 1/2

U|
2 wz + z iV
W|

y define a las variables aleatorias U y V como las distribuciones


acumulativas de W y Z, por medio de las expresiones:

V=

1
2

w t
e 2

dt

(11.a)

2 1/2

2 1

R| 1
S| 2d1 i dw
T

exp

2 wz + z 2

U
i|V|
W
(10)

and defines the random variables (U and V) as the cumulative


distributions of W and Z, by means of the expressions:

V=

1
2

w t
e 2

U = (W ) =

dt

and

(11.a)

z t
e 2

dt = ( Z )

(11.b)

These random variables (U and V) inherit the dependence of


variables W and Z and have a uniform distribution (result 2 above) in
the interval (0, 1). Then the variables X and Y are defined implicitly
as:

U = F X , 1 =

dt = ( Z )

a f

(12.a)

a f

(12.b)

f s, 1 ds

(11.b)

Estas variables aleatorias (U y V) heredan la dependencia de las


variables W y Z y tienen una distribucin uniforme (resultado 2
anterior) en el intervalo (0, 1). Luego define a las variables X y Y en
forma implcita como:

a f

f w , z w, z =

z t
e 2

Moran (1969) assumes two random variables W and Z, with


bivariate normal distribution, whose density is:

(10)

U = (W ) =

of the bivariate normal distribution makes it ideal for expressing


linear dependence among variables.
2) The cumulative distribution function (CDF) of any continuous
univariate variable has uniform distribution U(0, 1) in the interval
(0, 1).
3) The change of variable theorem which allows to obtain the density
function of a function of a random variable with a specific
distribution (Casella and Berger, 1990).

U = F X , 1 =

a f

f s, 1 ds

(12.a)

V = G Y , 2 =

g s, 2 ds

According to Moran (1969), f(x,1) and g (y,2) are the density


functions of two gamma variables, and F and G are their distribution
functions. With the theorem of change of variable, the joint density
function of a bivariate gamma distribution is obtained.
Generalization of the Moran bivariate distribution

V = G Y , 2 =

a f

g s, 2 ds

(12.b)

Segn Moran (1969), f (x,1) y g (y,2) son las funciones de


densidad de dos variables gamma, y F y G son sus funciones de

906

VOLUMEN 41, NMERO 8

To generalize the Moran (1969) bivariate distribution, the


principal result of this work, note that variables X and Y in the
expressions (12.a and 12.b) may have diverse continuous distributions.
Using the transformations (13.a) and (13.b) with inverse
transformations (14.a) and (14.b):

UNA FAMILIA DE DISTRIBUCIONES BIVARIADAS Y SUS APLICACIONES EN HIDROLOGA

distribucin. Por medio del teorema de cambio de variable se obtiene la funcin de densidad conjunta de una distribucin gamma
bivariada.

X=F1[U]=F1[(W)] y

(13.a)

Y=G1[V]=G1[(W)]

(13.b)

Generalizacin de la distribucin bivariada de Moran

W=1[F(X)] y

(14.a)

Para generalizar la distribucin bivariada de Moran (1969), resultado principal de este trabajo, ntese que las variables X y Y en
las expresiones (12.a y 12.b) pueden tener diversas distribuciones
continuas. Utilizando las transformaciones (13.a) y (13.b) con transformaciones inversas (14.a) y (14.b):

Z=1[G(Y)] y

(14.b)

The change of variable theorem makes it possible to express the


joint density function as:

X=F1[U]=F1[(W)] y

(13.a)

h(x,y)=fw,z (1[F(X)], 1[G(Y)]) 9J

Y=G1[V]=G1[(W)]

(13.b)

W=1[F(X)] y

(14.a)

Z= [G(Y)] y

(14.b)

where the Jacobian of the inverse transformation | J | is:

w
x
J=
z
y

El teorema de cambio de variable permite expresar la funcin


de densidad conjunta como:
h(x,y)=fw,z ( [F(X)], [G(Y)]) 9J
1

w
w z
x
x
=
z
x y
y

(15)

b a fg =

1 F x
w
=
x
x

(16)

b a fg =

a f = a2 f
d b a fgi
f x; 1

1/2

f z 1 F x

c a fh =

1 G y
z
=
x
y

c a fh =

f = a2 f
f d c F a y fh i
g y; 2

1/2

sa f

exp 1 / 2 w 2 f x; 1

sa

exp 1 / 2 z 2 g x; 2

(17.b)
fz representa la funcin de densidad de la distribucin normal
estndar y las variables W y Z estn definidas por las ecuaciones
(14.a) y (14.b), as:

a f = a2 f
d b a fgi
f x; 1

1/2

f z 1 F x

sa f

exp 1 / 2 w 2 f x; 1

f = a2 f
f d c F a y fh i
g y; 2

1/2

sa

exp 1 / 2 z 2 g x; 2

(17.b)
fz represents the density function of the standard normal
distribution and variables W and Z are defined by the equations
(14.a) and (14.b), as follows:

a f { d

J = 2 exp 1 / 2 w 2 + z 2

(17.a)
1 G y
z
=
x
y

(16)

(17.a)

La expresin del lado derecho es vlida porque la variable W


slo depende de la variable X y la variable Z slo depende de Y.
Moran (1969) proporciona las derivadas de la expresin (16) para
distribuciones gamma, las expresiones, para cualquier distribucin
derivable, se obtienen por medio de las frmulas de la derivada de
una composicin de funciones y la derivada de la inversa de una
funcin.

1 F x
w
=
x
x

w
w z
x
x
=
z
x y
y

The expression on the right side is valid because variable W


depends only on variable X and variable Z depends only on Y. Moran
(1969) provides the derivates of the expression (16) for gamma
distributions, the expressions, for any derivable distribution, are
obtained by means of the formulas of the derivate of a composition
of functions and the derivate of the inverse of a function.

donde el Jacobiano de la transformacin inversa J es:

w
x
J=
z
y

(15)

i} f a x; fga y; f
1

(18)

Substituting equation (18) in expression (15), the joint density


function of variables X and Y with marginal densities f(x,1) and g
(y,2) is obtained. These functions represent the densities of any
continuous variable, where 1 and 2 may be parameters of one
dimension or vectors. Developing expression (15), a density function
that will be called the generalized bivariate family of Moran (GFM)
is obtained:

SALAZAR-GMEZ y CRUZ-MEDINA

907

AGROCIENCIA, 16 de noviembre - 31 de diciembre, 2007

a f { d

J = 2 exp 1 / 2 w 2 + z 2

i} f a x; fga y; f
1

(18)
h( x, y) =

Sustituyendo la ecuacin (18) en la expresin (15) se obtiene la


funcin de densidad conjunta de las variables X y Y con densidades
marginales f (x,1) y g (y,2). Estas funciones representan las densidades de cualquier variable continua, donde 1 y 2 pueden ser
parmetros de una dimensin o vectoriales. Desarrollando la expresin (15) se obtiene una funcin de densidad que se denominar aqu
familia bivariada generalizada de Moran (FGM):

h( x, y) =

d1 i
2

1/2

R| 1 L
S| 2d1 i NMa w f
T
x f a x; f ga y; f

exp

U
a f OPQ|V
|W

2 wz + z

(19)
Ajuste de las distribuciones bivariadas
Para estimar el parmetro en la familia FLG Plackett (1965)
sugiere dividir la distribucin conjunta en cuatro cuadrantes, utilizando las lneas x=x1 y y=y1 para algunas constantes x1 y y1, contar
el nmero de puntos (x, y) en cada cuadrante. Los conteos proporcionan los valores a, b, c y d:
a=n(xx1, yy1); b=n(xx1, y>y1),
b=n(x>x1, yy1) y d=n(x>x1, y>y1)
donde, n(A) es el nmero de elementos del evento A. El estimador
propuesto es: +=ad/bc, que tiene una distribucin asintticamente
normal con varianza:
V(+)=(+)2[1/a+1/b+1/c+1/d]

(20)

Mardia, citado por Karian y Dudewics (2000) muestra que la


varianza se minimiza si x1 y y1 se seleccionan como las medianas de
las respectivas distribuciones. Karian y Dudewics (2000) proporcionan un algoritmo para aproximar una distribucin conjunta f (x, y),
por medio de la distribucin h(x, y) de la familia FLG. Este algoritmo, con pequeas modificaciones, se puede utilizar para ajustar una
distribucin h(x, y) de la familia FLG, cuando se desconoce la distribucin verdadera.
1) Seleccionar las distribuciones marginales f (x,1) y g (y,2) y por
medio de algn criterio (Kolmogorov-Smirnov, Anderson-Darling,
2-cuadrada).
2) Ajustar las distribuciones marginales con algn mtodo (mxima verosimilitud, mtodo de momentos o de percentiles si los
momentos no existen).
3) Graficar las distribuciones marginales para verificar la calidad
del ajuste univariado.
4) Seleccionar el valor de (como el valor +) propuesto por
Plackett.

908

VOLUMEN 41, NMERO 8

d1 i
2

1/2

R| 1 L
S| 2d1 i MNa w f
T
x f a x; f ga y; f

exp

U
a f OPQ|V
|W

2 wz + z

(19)
Fit of the bivariate distributions
To estimate the parameter in the family FLG, Plackett (1965)
suggests dividing the joint distribution into four quadrants, using the
lines x=x1 and y=y1 for some constants x1 and y1, counting the
number of points (x, y) in each quadrant. The counts provide the
values a, b, c and d:
a=n(xx1, yy1); b=n(xx1, y>y1),
b=n(x>x1, yy1) y d=n(x>x1, y>y1)
where, n(A) is the number of elements of event A. The proposed
estimator is: +=ad/bc, which has an asymptotically normal
distribution with variance:
V(+)=(+)2[1/a+1/b+1/c+1/d]

(20)

Mardia, cited by Karian and Dudewics (2000) shows that the


variance is minimized if x1 and y1 are selected as the medians of the
respective distributions. Karian and Dudewics (2000) provide an
algorithm to approximate a joint distribution f(x,y) by means of the
distribution h(x,y) of the family FLG. This algorithm, with small
modifications, can be used to fit a distribution h(x,y) of the family
FLG, when the true distribution is unknown.
1) Select the marginal distributions f(x,1) and g (y,2) by means of
some criterion (Kolmogorov-Smirnov, Anderson-Darling, 2squared).
2) Fit the marginal distributions with some method (maximum
likelihood, method of moments or percentiles if the moments do
not exist).
3) Graph the marginal distributions to verify the quality of the
univariate fit.
4) Select the value of (such as the value +) proposed by Plackett.
For fitting the FGM family, an algorithm similar to the above will
be used, substituting the last indication with: 4) estimate the value of ,
by 0, the correlation coefficient of the normalized values, that is:
n

w i zi

0 =

i=1
n

i=1

i=1

w i2 zi2

(21)

Koehler and Symanowsky (1995) used the maximum likelihood


method, with the computational complications inherent to this

UNA FAMILIA DE DISTRIBUCIONES BIVARIADAS Y SUS APLICACIONES EN HIDROLOGA

Para el ajuste de la familia FGM se utilizar un algoritmo similar al anterior, sustituyendo la ltima indicacin por: 4) estimar el
valor de , por 0, el coeficiente de correlacin de las variables
normalizadas, esto es,

procedure (which can also be used for the fit of the distributions of
the two previous families). These authors mention that high values
of 11, 12 and 22 induce a weak association between variables X
and Y; this information is useful for selecting the initial values of the
parameter.
Comparison of the bivariate families

w i zi

i=1

0 =

i=1

i=1

w i2 zi2

(21)

Koehler y Symanowsky (1995) utilizaron el mtodo de mxima


verosimilitud, con las complicaciones computacionales propias de
este procedimiento (que se puede utilizar tambin para el ajuste de
las distribuciones de las dos familias anteriores). Estos autores mencionan que valores grandes de 11, 12 y 22 inducen una asociacin
dbil entre las variables X y Y; esta informacin es til para seleccionar los valores iniciales del parmetro.
Comparacin de las familias bivariadas
Las familias bivariadas FLG (6) y FGM (19) tienen slo un
parmetro para modelar la dependencia, para la familia FLG y el
coeficiente de correlacin para la familia FGM. La familia FKS
tiene tres parmetros; sin embargo, para comparar el ajuste de estas
familias con igual nmero de parmetros, se utilizar la versin
simplificada (7).
Las comparaciones se efectuarn modelando las escorrentas del
Ro Yaqui, en el estado de Sonora, Mxico. La modelacin de las
escorrentas en las regiones ridas y semiridas de Mxico es importante para planificar el uso de los escasos recursos hdricos de estas
regiones. En el caso del Ro Yaqui, que irriga al valle del mismo
nombre en el sur de Sonora, las escorrentas de diciembre a junio
(DJ), que se desea modelar, tienen correlaciones significativas, pero
no estn correlacionadas con las escorrentas de julio a septiembre
ocasionadas por las precipitaciones del periodo de lluvias de verano
asociadas al monzn mexicano. Las autocorrelaciones de las
escorrentas DJ no fueron significativas, pero su correlacin con el
promedio del ndice de oscilacin del sur SOI (Ropelewsky y Jones,
1987) de octubre y noviembre es igual a 0.475, un valor significativo (p0.001). Para modelar y predecir las escorrentas DJ por
medio del ndice SOI, se ajustaron distribuciones bivariadas para las
escorrentas acumuladas de diciembre-junio y el promedio del ndice SOI de octubre y noviembre.

RESULTADOS

DISCUSIN

Se dispuso de 47 registros (1956-2002) de las


escorrentas del periodo diciembre-junio (Cuadro 1),
con un mnimo, mximo, mediana, media y desviacin estndar de 287.5, 4393.5, 632.05, 1102.3 y
978.23 Hm3. Las distribuciones con mejor ajuste fueron: gamma desfasada, log logistic, lognormal y la

The bivariate FLG (6) and FGM (19) families have only one
parameter for modeling the dependence, for the FLG family and
the correlation coefficient for the family FGM. The family FKS
has three parameters; however, to compare the goodness of fit of
these families with equal number of parameters, the simplified version
(7) will be used.
Comparisons will be made by modeling the runoffs of the Yaqui
River, in the State of Sonora, Mxico. The modeling of the runoffs
in the arid and semi-arid regions of Mxico is important for planning
the use of the limited water resources of these regions. It is the case
of the Yaqui River, which irrigates the valley of the same name in
the south of Sonora. The runoffs from December to June (DJ), which
will be modeled, have significant correlations, but are not correlated
with the runoffs from July to September caused by the summer
rainfalls associated with the Mexican monsoon. The autocorrelations
of the DJ runoffs were not significant, but their correlation with the
average of the southern oscillation index SOI (Ropelewsky and Jones,
1987) from October to November is equal to 0.475, a significant
value (p0.001). To model and predict the DJ runoffs with the SOI
index, bivariate distributions were adjusted for the accumulated runoffs
from December-June and the average of the SOI index of October
and November.

RESULTS

AND

DISCUSSION

There are 47 runoff available records (1956-2002)


of the period December-June (Table 1), with a
minimum, maximum, median, mean and standard
deviation of 287.5, 4393.5, 632.05, 1102.3 and 978.23
Hm3. The distributions with best fit were: defased
gamma, log logistic, lognormal and the inverse Gaussian
distribution; the defased gamma distribution was selected
because it had the best fit with the Kolmogorov-Smirnov
criterion. The location, scale and form parameters are
=287.48, =1146.31 and =0.7108. The average
SOI index of October and November (Table 1) has a
minimum, maximum, median, mean and standard
deviation of 2.725, 1.850, 0.292, 0.109 and 0.981.
The distributions with the best fit were the logistic and
normal; the normal distribution was selected because
Ropelewsky and Jones (1987) modified this index
precisely so that it would have a standard normal
distribution.
If the runoff distribution and the SOI index were
independent, the contour graph of the joint density
function would be like that presented in Figure 1.

SALAZAR-GMEZ y CRUZ-MEDINA

909

AGROCIENCIA, 16 de noviembre - 31 de diciembre, 2007

Cuadro 1. Escurrimientos y promedios del ndice SOI (por columnas) para el periodo 1956-2002.
Table 1. Runoffs and averages of the SOI index (by columns) for the period 1956-2002.
Escurrimientos
295
427
996
381
1936
583
1193
509
487
576
1256
437

3679
712
644
425
679
2279
480
576
635
503
1138
2425

Dic-Jun

(Hm3)

465
1267
4370
3315
1009
4393
792
1175
566
612
628
2128

2831
2762
792
2190
365
433
1326
287
453
600
400

distribucin inversa de Gauss; se seleccion la distribucin gamma desfasada por tener el mejor ajuste con
el criterio de Kolmogorov-Smirnov. Los parmetros
de localizacin, escala y forma son =287.48,
=1146.31 y =0.7108. El ndice SOI promedio de
octubre y noviembre (Cuadro 1) tiene como mnimo,
mximo, mediana, media y desviacin estndar a
2.725, 1.850, 0.292, 0.109 y 0.981. Las distribuciones con mejor ajuste fueron la logstica y la normal; de ellas se seleccion la normal porque Ropelewsky
y Jones (1987) modificaron este ndice precisamente
para que tuviera una distribucin normal estndar.
Si las distribuciones de las escorrentas y del ndice
SOI fueran independientes, la grfica de contornos de
la funcin de densidad conjunta sera como la presentada en la Figura 1.

Media del ndice


1.445
1.015
0.660
0.585
0.620
0.200
0.025
0.610
1.195
0.600
1.540
0.265

SOI

Oct-Nov

0.370

0.490

1.160

0.395

0.405

1.435

0.765

0.320

0.850

1.295
1.150
0.755
1.850
0.150
1.460
0.445
1.475
0.520

2.725

1.195

0.110
0.245
0.555
0.515
0.380
1.635
0.115
0.425

0.180

0.025
1.500

1.010
1.085
1.445
0.130

Generalized family of Moran


Figure 2 shows the contour graph of the fitted
bivariate density function with a correlation of 0.475
among the normalized variables. An advantage of this
family is that the conditional distributions have an
explicit form. The conditional distribution of the runoffs,
with respect to the SOI index is:
h( y / x ) =

c1 h
R| 1
Exp S
( pw )
|T 2c1 h
ga y; f
2 1/ 2

2 wz + ( pz) 2

U|
V|
W

(22)

The mean of this conditional distribution can be


obtained by numerical integration. The graph of the
conditional means, which are the runoff least squares
estimators and generalize the regression equation, when
the value of the SOI index is known, is shown in Figure
3, which also shows the regression line. For a value of
the SOI index equal to 2.5, the linear regression provides
a negative run-off, whereas the conditional mean is
294 Hm3. The fit of the distributions and the numerical
calculations were carried out by means of Mathematica
(Wolfram, 1998).

SOI

1
0
1

500

1000

1500 2000

2500

3000

3500 4000

Plackett generalized lambda family

Escurrimiento Hm

Figura 1. Grfica de contornos de la densidad bivariada si las


escorrentas (X) y el ndice SOI (Y) fueran independientes.
Figure 1. Contour graph of the bivariate density if the runoffs
(X) and the SOI index (Y) were independent.

910

VOLUMEN 41, NMERO 8

Using the estimator proposed by Plackett for the


Lamda parameter it is obtained: +=1/9, however,
the contour graph of the fit density function is similar
to the one presented in Figure 1, even when the
correlation coefficient is 0.475.

UNA FAMILIA DE DISTRIBUCIONES BIVARIADAS Y SUS APLICACIONES EN HIDROLOGA

Familia generalizada de Moran

En la Figura 2 se presenta la grfica de contornos


de la funcin de densidad bivariada ajustada que tiene
una correlacin de 0.475 entre las variables normalizadas. Una ventaja de esta familia es que permite obtener en forma explcita las distribuciones condicionales. La distribucin condicional de las escorrentas,
con respecto al ndice SOI, es:

SOI

0
1

c1 h
R| 1
Exp S
( pw )
|T 2c1 h
ga y; f
2 1/ 2

2 wz + ( pz) 2

U|
V|
W

(22)
La media de esta distribucin condicional se puede
obtener por integracin numrica. La grfica de las
medias condicionales, que generalizan a la ecuacin de
regresin y son los estimadores de mnimos cuadrados
de las escorrentas cuando se conoce el valor del ndice
SOI, se presenta en la Figura 3, en la cual se muestra
tambin la recta de regresin. Para un valor del ndice
SOI igual a 2.5, la recta de regresin proporciona una
escorrenta negativa, mientras que la media condicional es 294 Hm3. El ajuste de las distribuciones y los
clculos numricos se efectuaron por medio de Matemtica (Wolfram, 1998).

1000

3000

2000

Figura 2. Grfica de contornos de la densidad bivariada de las


escorrentas (X) y el ndice SOI (Y) con correlacin
negativa.
Figure 2. Contour graph of the bivariate density of the runoffs
(X) and the SOI index (Y) with negative correlation.

4000

3000

2000

xx

xx
x

1000

xx
xx x x

Familia lambda generalizada de Plackett


2

Utilizando el estimador propuesto por Plackett para


el parmetro Lambda, se obtiene: +=1/9, sin embargo, la grfica de contornos de la funcin de densidad ajustada es similar a la presentada en la Figura 1
aun cuando el coeficiente de correlacin es 0.475.
Esta familia bivariada tiene el problema que para
valores grandes de puede proporcionar densidades
no vlidas. Plackett (1965) y Karian y Dudewicz (2000)
al obtener la raz de la ecuacin que produce, argumentan, la funcin de densidad vlida (7), no consideraron la posibilidad de que el argumento del denominador S24(1)FG resulte negativo. El denominador es positivo si <1, pero resultar negativo para
algn valor >1; en el caso analizado resulta negativo para valores de >1.35. Este ejemplo muestra
que la familia lambda generalizada no est bien definida porque puede generar una funcin de densidad no

4000
3

Escurrimiento Hm

Escurrimientos

h( y / x ) =

x
2

ndice SOI

Figure 3. Medias de las distribuciones condicionales y recta de


regresin para escorrentas cuando se conoce el ndice
SOI.
Figure 3. Means of the conditional distributions and regression
line for runoffs when the SOI index is known.

This bivariate family has the problem that for large


values of , it can provide invalid densities. Plackett
(1965) and Karian and Dudewicz (2000), when
obtaining the square root of the equation, argue that
the density function (7) is valid, but they did not consider
the possibility that the argument of the denominator
S24(1)FG results negative. The denominator is
positive if <1, but will be negative for some value
>1; in this case it is negative for values of >1.35.

SALAZAR-GMEZ y CRUZ-MEDINA

911

AGROCIENCIA, 16 de noviembre - 31 de diciembre, 2007

vlida. Para la utilizacin de esta familia es necesario


analizar, en cada caso particular, si la funcin conjunta de la ecuacin (6) es vlida.
Familia de Koehler y Symanowsky
En la expresin simplificada de Koehler y
Symanowsky (7) se observa que para valores grandes
de la funcin de densidad conjunta tiende al producto de las funciones de densidad marginales (independencia entre las variables). Para un valor de =10, la
grfica de contornos de la densidad bivariada es similar a la Figura 1. Adems, valores pequeos generan
correlaciones positivas, sto es, el parmetro slo
permite la modelacin de correlaciones positivas. Revisando la derivacin de esta familia, se puede observar que slo permite la modelacin de correlaciones
positivas, a menos que en el ltimo cambio de variable
algunas de las variables Ui se sustituyan por 1Fi(xi)
en lugar de Fi(xi).

CONCLUSIONES
La familia generalizada de Moran desarrollada en
este trabajo es una alternativa para la modelacin de
variables bivariadas. En el ejemplo analizado modela
en forma adecuada la dependencia entre las escorrentas
del Ro Yaqui y el ndice SOI. La familia bivariada de
Plackett, conocida como familia lambda generalizada,
no est bien definida para valores grandes del parmetro
, sto es, en cada caso particular es necesario analizar si la funcin conjunta de la ecuacin (6) es vlida.
Para la familia de Koehler y Symanowsky, la expresin proporcionada por los autores slo permite la
modelacin de correlaciones positivas.

LITERATURA CITADA
Casella, G., and R. L. Berger 1990. Statistical Inference. Duxbury
Press. Belmont USA. 650 p.
Deste, G. M. 1981. A Morgenstern-type bivariate gamma
distribution. Biometrika 68: 339-340.
Farlie D. J. G. 1960. The performance of some correlations
coefficients for a general bivariate distribution. Biometrika 47:
307-323.
Johnson, M. E., and A Tenenbein. 1981. A bivariate distribution
family with specified marginals, J. Amer. Stat. Assoc. 76: 198201.
Karian Z. A., and E. J. Dudewics. 2000. Fitting Statistical
Distributions: The Generalized Lambda Distribution and
Generalized Bootstrap Methods. Chapman & Hall/CRC. Boca
Ratn Fl. USA. 456 p.
Koehler, K. J, and J. T. Symanowski. 1995. Constructing multivariate
distributions with specific marginal distributions. J. Multivariate
Anal. 55: 261-282.

912

VOLUMEN 41, NMERO 8

This example shows that the generalized lambda family


is not well defined because it can generate an invalid
density function. For the use of this family, it is
necessary to analyze, in each particular case, whether
the joint function of the equation (6) is valid.
Family of Koehler and Symanowsky
In the simplified expression of Koehler and
Symanowsky (7), it is observed that for large values of
, the joint density function tends toward the product
of the marginal density functions (independence among
the variables). For a value of =10, the contour graph
of the bivariate density is similar to Figure 1.
Furthermore, small values generate positive
correlations, that is, the parameter only allows the
modeling of positive correlations. Revising the
derivation of this family, it can be observed that it only
allows the modeling of positive correlations, unless
that in the last change of variable some of the variables
Ui are substituted by 1Fi(xi) instead of Fi(xi).

CONCLUSIONS
The generalized Moran family developed in the
present study is an alternative for the modeling of
bivariate variables. In the example analyzed it
adequately models the dependence among the runoffs
of the Yaqui River and the SOI index. The Plackett
bivariate family, known as generalized lambda family,
is not well defined for large values of the parameter
, that is, in each particular case it is necessary to
analyze whether the joint density function of equation
(6) is valid. For the family of Koehler and Symanowsky,
the expression provided by the authors only allows the
modeling of positive correlations.
End of the English version


Kotz S., N. Balakrishnan, and N. L. Johnson. 2000. Continuous
Multivariate Distributions Vol 1: Models and Applications. 2nd
Ed. John Wiley & Sons. N. Y. USA. 752 p.
Moran, P. A. P. 1969. Statistical inference with bivariate gamma
distributions. Biometrika 56: 627-634.
Plackett, R. L. 1965. A class of bivariate distributions. J. Am. Stat.
Assoc. 60: 516-522.
Ropelewski, C. F., and P. D. Jones. 1987. An extension of the
Tahiti-Darwin southern oscillation index. Monthly Weather Rev.
115: 2161-2165.
Wolfram, S. 1998. The Mathematica Book. Fourth ed. Cambridge
University Press. Cambridge U. K. 1470 p.
Yue S., T. B. M. J. Quarda, and B. Bobe. 2001. A review of
bivariate gamma distributions for hydrological applications. J.
Hydrology 246: 1-18.

También podría gustarte