Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3 Normalidad multivariante
Tema 3
1. Distribuciones de probabilidad multivariantes
Normalidad multivariante 2. La distribución normal multivariante
3. Distribuciones relacionadas con la distribución normal
multivariante
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 3 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 4
Distribuciones marginales
3.1 Distribuciones de probabilidad multivariantes Dado el vector aleatorio X = (X1 , X2 , . . . , Xp )′ , la función de
densidad marginal de la variable aleatoria Xj , para j = 1, . . . , p, se
Funciones de distribución y de densidad conjuntas obtiene integrando la densidad conjunta:
Sea X = (X1 , X2 , . . . , Xp )′ un vector aleatorio p × 1.
Z
fXj (xj ) = f (t1 , t2 , . . . , tp )dt1 . . . dtj−1 dtj+1 . . . dtp .
Se define la función de distribución conjunta de X (o función de Rp−1
R
probabilidad acumulada) en el punto x = (x1 , x2 , . . . , xp )′ ∈ Rp como La función fXj : R → [0, +∞) y cumple que R
fXj (t)dt = 1.
Z x1 Z x2 Z xp
F (x) = ... f (t)dt1 dt2 . . . dtp , De forma más general, dada una partición del vector X = (X′1 , X′2 )′ ,
−∞ −∞ −∞ donde X1 = (X1 , . . . , Xp1 )′ y X2 = (Xp1 +1 , . . . , Xp )′ , la función de
donde t = (t1 , t2 , . . . , tp ) ∈ Rp . densidad marginal de X1 se obtiene:
Z
La función f (t) se denomina función de densidad conjunta de X fX1 (x1 , . . . , xp1 ) = f (t1 , t2 , . . . , tp )dtp1 +1 . . . dtp , donde p2 = p−p1 .
y verifica que: Rp2
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 7 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 8
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 11 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 12
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 15 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 16
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 19 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 20
′
c) Distribución de X3 condicionada a (X1 , X2 ) = (x01 , x02 )′ .
X1 −1 µ1
X = X2 ∼ N3 (µ, Σ), donde µ = 1 = µ2 y
X3 0 µ3
y varianza:
1 0 1
à !
Σ(12)(12) Σ(12)3
var(X3 |(X1 , X2 )′ = (x01 , x02 )′ ) = Σ33 − Σ3(12) Σ−1
0 3 1
Σ= = (12)(12) Σ(12)3
Σ3(12) Σ33
1 1 2 Ã !−1 µ ¶ Ã !µ ¶
1 0 1 1 0 1
= 2 − (1, 1) = 2 − (1, 1)
La distribución de X3 condicionada a (X1 , X2 )′ = (x01 , x02 )′ será 0 3 1 0 1/3 1
normal univariante, de esperanza µ ¶
1
µ
1
¶
2
µ 0 = 2 − (1, 1/3) =2− 1+ = .
1 3 3
¶
′ 0 0 ′ −1 x1 − µ1
E(X3 |(X1 , X2 ) = (x1 , x2 ) ) = µ3 + Σ3(12) Σ(12)(12)
x02 − µ2
à !−1 µ à !
x01 + 1
¶ µ 0 ¶
x1 + 1 Resumiendo, X3 |(X1 , X2 )′ = (x01 , x02 )′ ∼ N x01 + 31 x02 + 23 , 32 .
¡ ¢
= 0 + (1, 1) 1 0 = (1, 1) 1 0
0 3 x02 − 1 0 1/3 x02 − 1
µ 0 ¶
x1 + 1 1 1 1 2
= (1, 1/3) 0 = x01 + 1 + x02 − = x01 + x02 + ,
x2 − 1 3 3 3 3
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 21 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 22
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 23 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 24
¿Cómo influye el valor de ρ en la densidad de Y?
Puesto queÃσ12 = σ1 σ2 ρ, la
! matriz Σ puede escribirse en función de ρ
√
b) Puesto que E(~0), la función de densidad de Y = (Y1 , Y2 )′ en el como Σ = √1 2ρ .
2ρ 2
punto y = (y1 , y2 )′ ∈ R2 es
( ¶−1 ) En el Tema 2 vimos dos medidas 3
| 14 Σ|−1/2
µ
1 ′ 1 de dispersión global:
f (y) = exp − y Σ y 2
(2π)2/2 2 4
• La variación total
1 tr(Σ) = 3, que no depende de ρ.
1
exp 2 y′ Σ−1 y , y ∈ R2 .
© ª
= 1/2
π|Σ| 0
• La varianza generalizada
det(Σ) = 2(1 − ρ2 ).
à !
−1
c) La matriz de covarianzas de Y es Σ = 1 0.1 . Por tanto, el
0.1 2 ρ2 = 0 ⇒ det(Σ) = 2 ρ=0.071
−2
ρ=0.4
σ12 √0.1
ρ2 = 1 ⇒ det(Σ) = 0.
coeficiente de correlación será ρ = corr(Y1 , Y2 ) = σ1 σ2 = 1·2
≈ 0.071. ρ=0.8
−3
A medida que ρ aumenta, la −1.5 −1 −0.5 0 0.5 1 1.5
0.5 0.8
En esta sección consideraremos distribuciones asociadas a una
0.4
muestra de tamaño n de una vector aleatorio normal p-variante.
0.6
0.3 Paralelismos entre el caso univariante y el multivariante:
0.4
0.2
0.2
Caso univariante Caso multivariante
0.1 2 2
0 1 0 1
N (µ, σ 2 ) Np (µ, Σ)
2 2
1 0 1 0 χ2n Wp (Σ, n)
0 −1 0 −1
−1 −1 F (m, n) Λ(p, a, b)
−2 −2 y1 −2 −2 y1
y y
2 2
t T2
(a) ρ = 0.071 (b) ρ = 0.8
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 27 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 28
La ley Wishart
Dada una muestra aleatoria simple de tamaño n de una ley Np (~0, Σ) La ley Lambda de Wilks
(es decir, X1 , . . . , Xn sucesión de vectores aleatorios iid∼ Np (~0, Σ)), La distribución Lambda de Wilks es la ley del cociente de
se define la distribución de Wishart como la ley de la matriz determinantes
|A|
aleatoria, p × p, n Λ= ∼ Λ(p, a, b),
X |A + B|
Q= Xi X′i ∼ Wp (Σ, n)
i=1 donde A ∼ Wp (Σ, a), B ∼ Wp (Σ, b), independientes, siendo Σ no
Propiedades:
singular y a ≥ p.
1. Q1 ∼ Wp (Σ, n1 ), Q2 ∼ Wp (Σ, n2 ) independientes, entonces
Q1 + Q2 ∼ Wp (Σ, n1 + n2 ). Propiedades:
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 31 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 32
distribuciones normales multivariantes independientes: B= ni (xi − x))(xi − x))′ , (dispersión entre grupos)
i=1
g X g
muestra tamaño media covarianza ley de X X
matriz (muestral) (muestral) probabilidad W= (xik − xi )(xik − xi )′ = ni Si , (dispersión dentro de los grupos)
i=1 k=1 i=1
X1 n1 × p x1 S1 Np (µ1 , Σ)
T = B + W, (dispersión total).
X2 n2 × p x2 S2 Np (µ2 , Σ)
.. .. .. .. ..
. . . . . Si H0 es cierta, B ∼ Wp (Σ, g − 1), W ∼ Wp (Σ, n − g) son
Xg ng × p xg Sg Np (µg , Σ) independientes y T ∼ Wp (Σ, n − 1). Para resolver este contraste
utilizaremos el estadı́stico:
La estimación muestral del vector de medias global y la matriz de |W|
Λ= ∼ Λ(p, n − g, g − 1),
covarianzas común son |W + B|
g g g que se aproxima a una ley F de Fisher mediante la aproximación
1X 1 X X
x= ni xi , S= ni Si , siendo n = ni . asintótica de Rao:
n i=1 n − g i=1 i=1 1 − Λ1/β α β − 2γ
Si Λ ∼ Λ(p, a, b), entonces ∼ F (p b, α β − 2γ),
Λ1/β pb
Queremos contraste de hipótesis H0 : µ1 = µ2 = . . . = µg . donde α = a + b − (p + b + 1)/2, β = (p b − 4)/(p + b2 − 5),
2 2 2 2
γ = (pb − 2)/4.
Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 35 Aurea Grané. Máster en Estadı́stica. Universidade Pedagógica. 36