Está en la página 1de 16

4.

3 Covarianza y Correlacion
Covarianza = medida de asociacion entre dos
vvaa (o de variacion conjunta)
Denicion: Si X e Y son vvaa con valores
esperados
X
y
Y
resp., la covarianza entre
X e Y es,
Cov(X, Y ) = E((X
X
)(Y
Y
))
Interpretacion:
Cov(X, Y ) > 0 indica que cuando X tiende
a tomar un valor mayor que
X
, Y tambien
tiende a tener un valor mayor que
Y
y vicever-
sa, cuando X tiende a tomar un valor menor que

X
, Y tambien tiende a tener un valor menor
que
Y
.
Similarmente, Cov(X, Y ) < 0, indica que cuan-
do X tiende a tomar un valor mayor que
X
,
Y tiende a a tomar un valor menor que
Y
.
1
Expresion alternativa
Cov(X, Y )
= E((X
X
)(Y
Y
))
= E(XY X
Y
Y
X
+
X

Y
)
= E(XY ) E(X
Y
) E(Y
X
) +
X

Y
= E(XY )
Y
E(X)
X
E(Y ) +
X

Y
= E(XY )
Y

Y
+
X

Y
= E(XY )
Y

X
= E(XY ) E(X)E(Y ).
En particular, si X e Y son independientes
entonces,
a) E(XY ) = E(X)E(Y ), y
b) Cov(X, Y ) = 0
(La proposicion inversa no es cierta)
2
Ejemplo:
Sean X, Y vvaa con
f
X,Y
(x, y) =
_
4xy, 0 < x < 1, 0 < y < 1
0 e.o.c.
Si 0 < x < 1,
f
X
(x) =
_
1
0
4xy dy = 4x
1
2
y
2

1
0
= 2x.
Por simetra,
f
Y
(y) = 2y. Luego,
E(Y ) = E(X) =
_
1
0
x 2x dx
= 2
1
3
x
3

1
0
=
2
3
.
3
E(XY ) =
_
1
0
_
1
0
xyf
X,Y
(x, y)dxdy
= 4
_
1
0
y
2
{
_
1
0
x
2
dx}dy
= 4
_
1
0
y
2
dy
1
3
x
3

1
0
= 4
_
1
0
y
2
dy
1
3
= 4
1
3
1
3
=
4
9
.
Cov(X, Y ) = E(XY ) E(X)E(Y )
=
4
9

2
3

2
3
= 0
Nota: Puesto que f
X,Y
(x, y) = f
X
(x)f
Y
(y),
X e Y son independientes. Luego,
Cov(X, Y ) = 0.
4
Propiedades
1. Cov(a + X, Y ) = Cov(X, Y )
2. Cov(aX, Y ) = aCov(X, Y )
3. Cov(X, Y ) = Cov(Y, X) (simetra)
4. Cov(aX, bY ) = abCov(X, Y ) (por 2 y 3)
5. Cov(X, Y + Z) = Cov(X, Y ) + Cov(X, Z)
6. Cov(a
1
X
1
+ a
2
X
2
, b
1
Y
1
+ b
2
Y
2
)
= a
1
b
1
Cov(X
1
, Y
1
) + a
1
b
2
Cov(X
1
, Y
2
)
+a
2
b
1
Cov(X
2
, Y
1
) + a
2
b
2
Cov(X
2
, Y
2
)
(Propiedad Bilineal)
5
Teorema A
U = a +
n

i=1
b
i
X
i
V = b +
m

j=1
d
j
Y
j
Entonces:
Cov(U, V ) =
n

i=1
m

j=1
b
i
d
j
Cov(X
i
, Y
j
).
Caso particular importante:
Var(X + Y ) = Cov(X + Y, X + Y )
= Var(X) + Var(Y )
+2Cov(X, Y )
6
Corolario A
Var(
n

i=1
b
i
X
i
) =
n

i=1
n

j=1
b
i
b
j
Cov(X
i
, X
j
).
Si Cov(X
i
, X
j
) = 0, tenemos el:
Corolario B
Var(
n

i=1
X
i
) =
n

i=1
Var(X
i
)
7
varianza binomial
Ejemplo B: (pagina 125)
Si X
1
, . . . , X
n
, son vvaa independientes,
X
i
Bernoulli (p), e.d.,
X
i
=
_
1 c/p p
0 c/p 1 p
Si Y = X
1
+ . . . + X
n
entonces,
Y Binomial (n, p)
Var(Y ) = ?
= Var(X
1
+ . . . + X
n
)
= Var(X
1
) + . . . + Var(X
n
)
por indep. y el corolario B.
Var(X
i
) = E(X
2
i
) E(X
i
)
2
Pero E(X
2
i
) = 1 p y E(X
i
) = p,
Var(X
i
) = p p
2
= p(1 p), i = 1, . . . , n
Finalmente, Var(Y ) = np(1 p).
8
Ejemplo C
Suponga que una moneda honesta se lanza n
veces.
Sean X = proporcion de caras en los
n lanzamientos.
Y = n umero de caras en los
n lanzamientos.
Luego, Y = X/n. Del Ejemplo B y del
Teorema A, Sec. 4.2,
Var(X) = 1/4n.
Note que Var(X) tiende a cero cuando n crece.
En el captulo 5 veremos que esto implica que
X se .
a
cerca.
a
E(X) = 1/2 cuando n crece.
9
Denicion: Si X e Y son vvaa tales que
Var(X) = 0 y Var(Y ) = 0, entonces el coe-
ciente de correlacion entre X e Y es:
(X, Y ) = =
Cov(X, Y )
_
Var(X)Var(Y )
Notas:
1. no tiene dimensiones
2. Por propiedades de varianza y covarianza, si
X e Y se transforman va
U = aX + b y V = cY + d, entonces la
correlacion no cambia, e.d.:
(U, V ) = (X, Y )
Notacion

XY
=

XY

Y
10
Ejemplo D
(Leer Ejemplo A de la Sec. 3.3)
Considere la distribucion de la familia Farlie-
Morgenstern con = 1. Sean X e Y vvaa
con densidad conjunta,
f
X,Y
(x, y) =
_
_
_
(2x + 2y 4xy) 0 < x < 1,
0 < y < 1
0 e.o.c.
Esta densidad tiene la propiedad que
X U(0, 1), Y U(0, 1).
Luego, E(X) = E(Y ) = 1/2, y,
Var(X) = Var(Y ) = 1/12.
11
Tambien,
E(XY ) =
_
1
0
_
1
0
xy(2x+2y 4xy)dxdy =
2
9
As,
Cov(X, Y ) =
2
9
(
1
2
)
2
=
1
36
Esta covarianza (negativa) indica una asociacion
entre X e Y.
Mas a un,
=
1
36
12 =
1
3
En el caso = 1, la covarianza es 1/36, luego
la correlacion es 1/3.
12
Teorema B
1 1.
Ademas,
= 1
si y solo si
P(Y = a + bX) = 1,
para ciertas constantes a y b.
Demostracion: Leerla (p. 126.)
13
Ejemplo E Distribucion normal bivariada.
_
X
Y
_
N
2
__

Y
_
,
_

2
X

X

Y

2
Y
__
Este ejemplo muestra que la covarianza
XY
es

Y
.
Cov(X, Y )
=
_
+

_
+

(x
X
)(y
Y
)f(x, y) dx dy,
donde f(x, y) es la densidad de (X, Y )
t
.
Con el cambio de variable
u =
x
X

X
, v =
y
Y

Y
;
Cov(X, Y )
=

X

Y
2
_
1
2

_
+

_
+

uv
exp{
1
2(1
2
)
(u
2
+ v
2
2uv)} du dv.
14
Usando la tecnica de completar el cuadrado
Cov(X, Y )
=

X

Y
2
_
1
2

_
+

v exp{
v
2
2
}
[
_
+

uexp[
1
2(1
2
)
(u v)
2
]du
. .
()
]dv
() = valor esperado de la densidad
N(v, (1
2
)), sin el factor

X

Y
2

1
2
.
Cov(X, Y ) =

X

2
_
+

ve
v
2
/2
dv
=
X

Y
15
El coeciente de correlacion lineal mide el gra-
do de asociacion lineal entre X y Y. La Figura
4.5 muestra gracos de dispersion de 100 pares
de n umeros pseudo-aleatorios con una distribu-
cion normal bivariada para varios valores del
coeciente de correlacion. Note que las nubes
de puntos tienen una forma aproximadamente
elptica.
Figura 4.5. Gracos 100 pares de n umeros aleatorios independientes
con (a) = 0, (b) = 0, 3, (c) = 0, 6, (d) = 0, 9.
16

También podría gustarte