Está en la página 1de 37

Distribución Normal

Bivariada
Tema 1: Variable aleatoria bidimensional
discreta
Estadística para Economistas 2
Mgtr. Randy Fernández
Ciencias Económicas y
Empresariales
Distribución Normal Bivariada

Una variable aleatoria bidimensional 𝑋, 𝑌 ~𝑁 𝜇𝑋 , 𝜎𝑋2 , 𝜇𝑌 , 𝜎𝑌2 , 𝜌 tiene una distribución


normal bivariada si tiene como función de densidad :
1 𝑥−𝜇X 2 𝑥−𝜇X 𝑦−𝜇Y 𝑦−𝜇Y 2
1 −
2(1−𝜌2 )
( 𝜎X ) −2𝜌( 𝜎X )( 𝜎Y )+( 𝜎Y )
𝑓(𝑥, 𝑦) = 𝑒
2𝜋 𝜎𝑋 𝜎𝑌 1 − 𝜌2

para −∞<𝑥 <∞ 𝑦 −∞<𝑦 <∞


donde X , Y , X , Y ,  son constantes reales tales que:
- < X <  ,
- < Y <  ,
X >0 , Y >0 ,
-1<  <1. Ir a Python
Distribución Normal Bivariada

El gráfico de una distribución normal bivariada es:

f(x ,y )

X
Distribución Normal Bivariada

𝜌 = 0, 1 − 1 2 2
𝑓(𝑥, 𝑦) = 𝑒 2 𝑥 +𝑦
𝜎X = 1, 2𝜋
𝜇X = 0,
𝜎Y = 1, para −∞<𝑥 <∞ 𝑦 −∞<𝑦 <∞
𝜇Y = 0
Distribución Normal Bivariada
𝑥2 𝑥2
− (0.5333) −(0.0833)𝑥𝑦+
𝜌 = 0.25, 4 9
𝑓(𝑥, 𝑦) = (0.027396)𝑒
𝜎X = 2,
𝜇X = 0, para −∞<𝑥 <∞ 𝑦 −∞<𝑦 <∞
𝜎Y = 3,
𝜇Y = 0
Distribución Normal Bivariada

𝜌 = 0.25, 𝑥2 𝑥2
− (0.5333) 4 −(0.05)𝑥𝑦+25
𝜎X = 2, 𝑓(𝑥, 𝑦) = (0.0164375)𝑒
𝜇X = 0,
𝜎Y = 5, para −∞<𝑥 <∞ 𝑦 −∞<𝑦 <∞
𝜇Y = 0
Distribución Normal Bivariada
𝑥2 𝑥2
𝜌 = 0.25, − (0.5333) 4 −(0.05)𝑥𝑦+25
𝑓(𝑥, 𝑦) = (0.0164375)𝑒
𝜎X = 2,
𝜇X = 2, para −∞<𝑥 <∞ 𝑦 −∞<𝑦 <∞
𝜎Y = 5,
𝜇Y = 3
Distribución Normal Bivariada. Densidad en forma matricial

Considerando:
𝑥 𝜇𝑥 𝑥 − 𝜇𝑥
𝑋= 𝑦 𝜇Ԧ = 𝜇 𝑋 − 𝜇Ԧ = 𝑥 − 𝜇
𝑦 2 2

Se tiene:

𝑥 − 𝜇𝑥
𝑋 − 𝜇Ԧ 𝑋 − 𝜇Ԧ ′ = 𝑦 − 𝜇 𝑥 − 𝜇𝑥 𝑦 − 𝜇𝑦
𝑦
(𝑥 − 𝜇𝑥 )2 (𝑥 − 𝜇𝑥 )(𝑦 − 𝜇𝑦 )
=
(𝑥 − 𝜇𝑥 )(𝑦 − 𝜇𝑦 ) (𝑦 − 𝜇𝑦 )2
Distribución Normal Bivariada. Densidad en forma matricial

Con lo cual:
𝑡 (𝑥 − 𝜇𝑥 )2 (𝑥 − 𝜇𝑥 )(𝑦 − 𝜇𝑦 )
E 𝑋 − 𝜇Ԧ 𝑋 − 𝜇Ԧ =E
(𝑥 − 𝜇𝑥 )(𝑦 − 𝜇𝑦 ) (𝑦 − 𝜇𝑦 )2
E(𝑥 − 𝜇𝑥 )2 E (𝑥 − 𝜇𝑥 )(𝑦 − 𝜇𝑦 )
=
E (𝑥 − 𝜇𝑥 )(𝑦 − 𝜇𝑦 ) E(𝑦 − 𝜇𝑦 )2
𝜎𝑥2 𝜎𝑥𝑦
= 2 =Σ
𝜎𝑥𝑦 𝜎𝑦
Esta matriz de valores esperados es llamada matriz variancia-covariancia de las
variables X, Y .
Distribución Normal Bivariada. Densidad en forma matricial

Por otro lado, considerando:


𝜎𝑥𝑦
𝜌= ⇒ 𝜎𝑥𝑦 = 𝜌 𝜎𝑥 𝜎𝑦
𝜎𝑥 𝜎𝑦

Se deduce:
𝜎𝑥2 𝜎𝑥𝑦
Σ=
𝜎𝑥𝑦 𝜎𝑦2

⇒ Σ = 𝜎𝑥2 𝜎𝑦2 − 𝜎𝑥𝑦


2 = 𝜎 2 𝜎 2 − 𝜌2 𝜎 2 𝜎 2 = 𝜎 2 𝜎 2 1 − 𝜌2
𝑥 𝑦 𝑥 𝑦 𝑥 𝑦

1ൗ
y, Σ 2 = 𝜎𝑥2 𝜎𝑦2 1 − 𝜌2 = 𝜎𝑥 𝜎𝑦 1 − 𝜌2
Distribución Normal Bivariada. Densidad en forma matricial

Σ = 𝜎𝑥2 𝜎𝑦2 − 𝜎𝑥𝑦


2
= 𝜎𝑥2 𝜎𝑦2 1 − 𝜌2 𝜎𝑥𝑦 = 𝜌 𝜎𝑥 𝜎𝑦

La inversa de la matriz de variancia-covariancia es:


−1
−1
𝜎𝑥2 𝜎𝑥𝑦 1 𝜎𝑦
2
−𝜎𝑥𝑦
Σ = 2 =
𝜎𝑥𝑦 𝜎𝑦 Σ −𝜎𝑥𝑦 𝜎𝑥2
1 𝜎𝑦2 −𝜎𝑥𝑦
= 2 2
𝜎𝑥 𝜎𝑦 (1 − 𝜌2 ) −𝜎𝑥𝑦 𝜎𝑥2
1 𝜌
2 −
2
𝜎𝑥 (1 − 𝜌 ) 𝜎𝑥 𝜎𝑦 (1 − 𝜌2 )
=
𝜌 1

𝜎𝑥 𝜎𝑦 (1 − 𝜌2 ) 𝜎𝑦2 (1 − 𝜌2 )
Distribución Normal Bivariada. Densidad en forma matricial

Al definir la forma cuadrática:

2 2
𝑡
Q = 𝑋 − 𝜇Ԧ Σ −1 𝑋 − 𝜇Ԧ = ෍ ෍ (𝑥i − 𝜇i )(𝑥j − 𝜇j ) rij
i=1 j=1
2 2
1 𝑥 − 𝜇𝑥 𝑥 − 𝜇𝑥 𝑦 − 𝜇𝑦 𝑦 − 𝜇𝑦
= 2
− 2𝜌 +
1−𝜌 𝜎𝑥 𝜎𝑥 𝜎𝑦 𝜎𝑦
2 2
𝑥 − 𝜇𝑥 2𝜌 𝑦 − 𝜇𝑦
= 2 − 𝑥 − 𝜇𝑥 𝑦 − 𝜇 𝑦 +
2
𝜎𝑥 (1 − 𝜌 ) 2
𝜎𝑥 𝜎𝑦 (1 − 𝜌 ) 𝜎𝑦2 (1 − 𝜌2 )
Distribución Normal Bivariada. Densidad en forma matricial
1 𝜌

𝜎𝑥2 (1 − 𝜌2 ) 𝜎𝑥 𝜎𝑦 (1 − 𝜌2 )
Σ −1 =
𝜌 1

𝜎𝑥 𝜎𝑦 (1 − 𝜌2 ) 𝜎𝑦2 (1 − 𝜌2 )

y
𝑡
Q = 𝑋 − 𝜇Ԧ Σ −1 𝑋 − 𝜇Ԧ
1 2
2𝜌 1 2
= 2 2
𝑥 − 𝜇1 − 2
𝑥 − 𝜇𝑥 𝑦 − 𝜇𝑦 + 2 2
𝑦 − 𝜇𝑦
𝜎𝑥 (1 − 𝜌 ) 𝜎𝑥 𝜎𝑦 (1 − 𝜌 ) 𝜎𝑦 (1 − 𝜌 )
Distribución Normal Bivariada. Densidad en forma matricial
La función densidad de la distribución normal bivariada, expresada en forma
matricial es:
1 1 𝑡
− 𝑋−𝜇 Σ−1 𝑋−𝜇
𝑓 𝑋 = 1 𝑒
2
2𝜋 Σ 2
Donde Σ es la matriz variancia-covariancia, y

𝑡
Q = 𝑋 − 𝜇Ԧ Σ −1 𝑋 − 𝜇Ԧ

es la forma cuadrática de la normal bivariada.


Distribución Normal Bivariada. Densidad en forma matricial.
Ejemplo

Sean X, Y dos variables que tiene una distribución normal bivariada con una
forma cuadrática:
1
Q= 6(𝑥 − 10)2 + 12(𝑥 − 10)(𝑦 + 5) + 18(𝑦 + 5)2
120

Halle la matriz variancia-covariancia y el valor del coeficiente de correlación de


dichas variables.
Distribución Normal Bivariada. Densidad en forma matricial.
Ejemplo

1
Q= 6(𝑥 − 10)2 + 12(𝑥 − 10)(𝑦 + 5) + 18(𝑦 + 5)2
120

Para este este ejemplo, la matriz Σ −1 es:

6 12ൗ 1 1
2
Σ −1 = 120 120 = 20 20
12ൗ 18 1 3
2
120 120 20 20

−1
1 3 1 1 1
Σ = − =
20 20 20 20 200
Distribución Normal Bivariada. Densidad en forma matricial.
Ejemplo

Luego,
3 1
1 − 𝜎 2 𝜎𝑥,𝑦
20 20 = 30 −10 𝑥
Σ= Σ −1 −1 = =
(1/200) 1 1 −10 10 𝜎𝑥,𝑦 𝜎𝑦2

20 20

𝜎𝑥2 = 30, 𝜎𝑦2 = 10, 𝜎𝑥,𝑦 = −10

𝜎𝑥,𝑦 −10
𝜌= = = − 1/3 = − 0.57735
𝜎𝑥 𝜎𝑦 30 10
Distribución Normal Bivariada. Teoremas

• Si X, Y son dos variables aleatorias que tienen una distribución normal bivariada;
luego, la distribución marginal de X es normal con media x y variancia 𝜎𝑥2 , y la
distribución marginal de Y es normal con media y y variancia 𝜎𝑦2
• Si X, Y son dos variables aleatorias que tienen una distribución normal bivariada
y el xy=0 entonces X, Y son independientes.
• Si X, Y son dos variables aleatorias que tienen una distribución normal bivariada;
luego, cualquier combinación lineal de dichas variables tendrá también una
distribución normal.
Distribución Normal Bivariada. Función de probabilidad
marginal

1 𝑥−𝜇X 2 𝑥−𝜇X 𝑦−𝜇Y 𝑦−𝜇Y 2


1 −
2(1−𝜌2 )
( 𝜎X ) −2𝜌( 𝜎X )( 𝜎Y )+( 𝜎Y )
𝑓(𝑥, 𝑦) = 𝑒
2𝜋 𝜎𝑋 𝜎𝑌 1− 𝜌2


1 1 𝑥−𝜇
−2 ( 𝜎 X )2
𝑓X 𝑥 = න 𝑓 𝑥, 𝑦 𝑑𝑦 = 𝑒 X
2𝜋𝜎𝑋
−∞

1 𝑦−𝜇
∞ 1 −2 ( 𝜎 Y )2
𝑓Y 𝑦 = ‫׬‬− ∞ 𝑓 𝑥, 𝑦 𝑑𝑥 ) = 𝑒 Y
2𝜋𝜎𝑌
Distribución Normal Bivariada. Teoremas

Si X , Y son dos variables aleatorias que tienen una distribución normal


bivariada; luego,

1) La distribución condicional de X, dado Y = y , es normal con media y variancia:

𝜎𝑋
𝜇𝑋•𝑦 = 𝜇𝑋 + 𝜌 (𝑦 − 𝜇𝑦 )
𝜎𝑌

2
𝜎𝑋•𝑦 = 𝜎𝑋2 1 − 𝜌2

𝜎𝑋
Donde 𝜌 es el coeficiente de regresión.
𝜎𝑌
Distribución Normal Bivariada. Función de densidad condicional
1 𝑥−𝜇X 2 𝑥−𝜇X 𝑦−𝜇Y 𝑦−𝜇Y 2
1 − ( ) −2𝜌( )( )+( 𝜎Y )
𝑓(𝑥, 𝑦) = 𝑒 2(1−𝜌2 ) 𝜎X 𝜎X 𝜎Y
2𝜋 𝜎𝑋 𝜎𝑌 1 − 𝜌2
1 1 𝑥−𝜇
−2 ( 𝜎 X )2
𝑓X 𝑥 = 𝑒 X
2𝜋𝜎𝑋
1 𝑥−𝜇X 2 𝑥−𝜇X 𝑦−𝜇Y 𝑦−𝜇Y 2
1 −
2(1−𝜌 2) ( 𝜎 ) −2𝜌( 𝜎 )( 𝜎 )+( 𝜎 )
𝑒 X X Y Y
𝑓 𝑥, 𝑦 2𝜋 𝜎𝑋 𝜎𝑌 1 − 𝜌2
𝑓 𝑥 Τ𝑦 = = 1 𝑦−𝜇
𝑓Y 𝑦 1 −2 ( 𝜎 Y )2
𝑒 Y
2𝜋𝜎𝑌
2
𝜎 𝜌 𝑦−𝜇Y
1 𝑥− 𝜇X + 𝑋 𝜎
1 − 𝑌
𝑓 𝑥 Τ𝑦 = 𝑒 2(1−𝜌2 ) 𝜎𝑋
2𝜋𝜎𝑋 1 − 𝜌2

𝜎𝑋 𝜌 𝑦 − 𝜇Y
𝑓 𝑥/𝑦 ~𝑁 𝜇X + , 𝜎𝑋2 1 − 𝜌2
𝜎𝑌
Distribución Normal Bivariada. Teoremas

Si X, Y son dos variables aleatorias que tienen una distribución normal bivariada;
luego,

2) La distribución condicional de Y, dado X = x , es normal con media y variancia:

𝜎𝑌
𝜇𝑌•𝑥 = 𝜇𝑌 + 𝜌 (𝑥 − 𝜇𝑥 )
𝜎𝑋
2
𝜎𝑌•𝑥 = 𝜎𝑌2 (1 − 𝜌2 )

𝜎𝑌
Donde 𝜌 𝜎 es el coeficiente de regresión.
𝑋
Distribución Normal Bivariada. Función de densidad condicional
1 𝑥−𝜇X 2 𝑥−𝜇X 𝑦−𝜇Y 𝑦−𝜇Y 2
1 −
2(1−𝜌 2 )
(
𝜎
) −2𝜌(
𝜎
)(
𝜎
)+(
𝜎
)
𝑓(𝑥, 𝑦) = 𝑒 X X Y Y
2𝜋 𝜎𝑋 𝜎𝑌 1 − 𝜌2
1 1 𝑦−𝜇
−2 ( 𝜎 Y )2
𝑓Y 𝑦 = 𝑒 Y
2𝜋𝜎𝑌
1 𝑥−𝜇X 2 𝑥−𝜇X 𝑦−𝜇Y 𝑦−𝜇Y 2
1 −
2(1−𝜌 2) (
𝜎
) −2𝜌(
𝜎
)(
𝜎
)+(
𝜎
)
𝑒 X X Y Y
𝑓 𝑥, 𝑦 2𝜋 𝜎𝑋 𝜎𝑌 1 − 𝜌2
𝑓 𝑦Τ𝑥 = = 1 𝑥−𝜇
𝑓X 𝑥 1 −2 ( 𝜎 X )2
𝑒 X
2𝜋𝜎𝑋
2
𝜎 𝜌 𝑥−𝜇X
𝑥− 𝜇Y + 𝑌
1 𝜎𝑋
1 −
𝑓 𝑦Τ𝑥 = 𝑒 2(1−𝜌2 ) 𝜎𝑌
2𝜋𝜎𝑌 1 − 𝜌2

𝜎𝑌 𝜌 𝑥 − 𝜇X
𝑓 𝑦/𝑥 ~𝑁 𝜇Y + , 𝜎𝑌2 1 − 𝜌2
𝜎𝑋
Distribución Normal Bivariada. Teoremas. Ejemplo

Sean X, Y las cantidades demandadas de dos artículos que tiene una distribución
normal bivariada con una forma cuadrática:
1
Q= 6(𝑥 − 10)2 + 12(𝑥 − 10)(𝑦 + 5) + 18(𝑦 + 5)2
120

Halle la ecuación de regresión de la demanda de X, sobre la demanda de Y.


Distribución Normal Bivariada. Teoremas. Ejemplo

1
Q= 6(𝑥 − 10)2 + 12(𝑥 − 10)(𝑦 + 5) + 18(𝑦 + 5)2
120

Halle la ecuación de regresión de la demanda de X, sobre la demanda de Y.

𝜎𝑥2 = 30, 𝜎𝑦2 = 10, 𝜎𝑥,𝑦 = −10, 𝜌 = − 1/3

𝜎X
𝜇X•𝑦 = 𝜇X + 𝜌 (𝑦 − 𝜇Y )
𝜎Y
1 30
= 10 + − 𝑦 − (−5)
3 10

𝜇X•𝑦 = 5 − 𝑦
Distribución Normal Bivariada. Función generatriz de momentos

𝜇𝑥 𝜎𝑥2 𝜎𝑥𝑦
Sea 𝑋, 𝑌 ~𝑁 𝜇𝑦 , 𝜎
𝑥𝑦 𝜎𝑦2
Entonces la función generatriz de momentos para la distribución normal bivariada
queda expresa como:

1
𝑡Ԧ 𝑇 𝜇+ 𝑡Ԧ 𝑇 Σ𝑡Ԧ 𝑡𝑥
𝑀𝑋𝑌 𝑡Ԧ = 𝑒 2 , donde 𝑡Ԧ = 𝑡
𝑦

1
𝑡𝑥 𝜇𝑥 +𝑡𝑦 𝜇𝑦 + 𝑡𝑥2 𝜎𝑥2 +2𝑡𝑥 𝑡𝑦 𝜎𝑥𝑦 +𝑡𝑦
2 𝜎2
𝑦
2
𝑀𝑋𝑌 𝑡Ԧ = 𝑒
Distribución Normal Bivariada. Ejemplo

Suponga que el costo variable de producción semanal (X, en centenas de dólares) y la producción
semanal de fideos (Y, en toneladas), se distribuyen conjuntamente según la normal bivariada con
la siguiente información:
𝜇𝑥 = 25, 𝜇𝑦 = 20, 𝜎𝑥 = 5, 𝜎𝑦 = 7, 𝜎𝑥𝑦 = 24
a) Establezca la ecuación de regresión del costo variable de producción semanal sobre la
producción semanal de fideos. Interprete coeficientes.
b) Halle el percentil 90% de la distribución de costos variables para producciones semanales de
fideos de 22 toneladas. Interprete.
Distribución Normal Bivariada. Ejemplo

El vector aleatorio (P, Q) representa el precio semanal (en u.m) y la cantidad (en número de
barriles) de la cerveza India HopMeister, vendida en el mercado del noroeste pacífico. Asumiendo
(P, Q) tiene una distribución bivariada, con los siguientes datos:
𝜇𝑃 = 125, 𝜇𝑄 = 500, 𝜎𝑃 = 10, 𝜎𝑄 = 20, 𝜎𝑃,𝑄 = −100
a) ¿Cuál es la probabilidad que la cantidad de cerveza vendida por semana sea superior a 450
barriles?
b) ¿Cuál es el precio semanal esperado de la cerveza HopMeister si se vendiera 350 barriles de
cerveza por semana?
c) ¿Cuál es la cantidad esperada vendida de la cerveza HopMeister por semana si el precio de
cada barril es de 100 u.m?
d) ¿Cuál es la correlación entre el precio y cantidad vendida por semana de la cerveza
HopMeister? Interprete su resultado.
e) ¿Cuál es la venta semanal esperada de dólares de la cerveza HopMeister?
Distribución Normal Multivariada

Un vector aleatorio continuo k-dimensional 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑘 𝑇 , tiene una


distribución normal multivariada con vector de medias 𝜇Ԧ = 𝜇1 , 𝜇2 , … , 𝜇𝑘 𝑇 y matriz
de varianza-covarianza:
𝜎12 𝜎12 … 𝜎1𝑘
𝜎21 𝜎22 … 𝜎2𝑘
Σ=
⋮ ⋱ ⋮
𝜎𝑘1 𝜎𝑘2 … 𝜎𝑘2

Lo cual denotamos por 𝑋~𝑁𝑘 𝜇,


Ԧ Σ , si su función de densidad conjunta viene dada
por:
1 1 𝑇
−2 𝑋−𝜇 Σ−1 𝑋−𝜇
𝑓 𝑋 = 𝑘 1 𝑒
2𝜋 2 Σ 2

Donde Σ es el determinante de la matriz variancia-covariancia Σ.


Distribución Normal Multivariada. Propiedades
Si 𝑋~𝑁𝑘 𝜇,
Ԧ Σ , entonces:
1. Σ es una matriz simétrica.
2. det Σ > 0.
3. Σ es una matriz definida positiva.

4. Los componentes del vector 𝑋 son independientes si y solo sí Σ es una matriz


diagonal o si la correlación de Pearson entre cualquiera de las componentes distintas
de ese vector son nulas.
1
−2
5. Si 𝑍Ԧ = Σ Ԧ 2 0, 𝐼
𝑋 − 𝜇Ԧ , entonces 𝑍~𝑁
1
𝑡Ԧ 𝑇 𝜇+2𝑡Ԧ 𝑇 Σ𝑡Ԧ
6. La función generatriz de momentos de 𝑋Ԧ viene dado por 𝑀𝑋 𝑡Ԧ = 𝑒

7. Si A es una matriz de 𝑚 × 𝑘 y 𝑏 un vector de 𝑚 × 1, entonces Y = A𝑋 + 𝑏~𝑁𝑚 ቀ𝐴𝜇Ԧ +


𝑏, 𝐴Σ𝐴𝑇 ቁ
Distribución Normal Multivariada. Propiedades
Si 𝑋~𝑁𝑘 𝜇,
Ԧ Σ , entonces:
8. Toda distribución marginal y condicional (de cualquier dimensión) tiene distribución
normal multivariada. Esto es, si el vector 𝑋Ԧ se particiona como:
𝑇
𝑇 Σ11 Σ12
𝑋 = 𝑋1 : 𝑋2 ~𝑁𝑘 𝜇Ԧ = 𝜇Ԧ1 : 𝜇Ԧ2 , Σ =
Σ21 Σ22

Donde 𝑋1 es de orden 𝑝 × 1 y 𝑋2 es de orden 𝑘 − 𝑝 × 1, entonces:

• 𝑋1 ~𝑁𝑝 𝜇Ԧ1 , Σ11 y 𝑋2 ~𝑁𝑘−𝑝 𝜇Ԧ2 , Σ22


−1 −1
• 𝑋2 |𝑋1 = 𝑥Ԧ1 ~𝑁𝑘−𝑝 𝜇Ԧ2 + Σ21 Σ11 𝑥Ԧ1 − 𝜇Ԧ1 , Σ22 − Σ21 Σ11 Σ12
Distribución Normal Multivariada. Distancia de Mahalanobis
Si 𝑋 = 𝑋1 , 𝑋2 , … , 𝑋𝑘 𝑇 , es un vector que tiene una distribución normal multivariada con
vector de medias 𝜇Ԧ = 𝜇1 , 𝜇2 , … , 𝜇𝑘 𝑇 y matriz de varianza-covarianza:
𝜎12 𝜎12 … 𝜎1𝑘
𝜎21 𝜎22 … 𝜎2𝑘
Σ=
⋮ ⋱ ⋮
𝜎𝑘1 𝜎𝑘2 … 𝜎𝑘2
La distancia de Mahalanobis de 𝑋 a 𝜇Ԧ es:
𝑇
𝑑𝑀 𝑋, 𝜇Ԧ = 𝑋 − 𝜇Ԧ Σ −1 𝑋 − 𝜇Ԧ
La Distancia de Mahalanobis (dM) presenta las siguientes propiedades:
1. Coincide con la distancia euclídea entre los datos estandarizados de forma multivariante.
2. Es adimensional
3. Tiene en cuenta las diferentes variabilidades (varianzas) de las variables.
4. Tiene en cuenta las correlaciones entre las variables.
5. Bajo normalidad, su cuadrado se distribuye como una 𝜒𝑘2
Distribución Normal Multivariada. Distancia de Mahalanobis.

6. Para verificar normalidad bivariada, se espera que aproximadamente el 50% de las


observaciones de la muestra grande (≥30) se encuentren en la elipse.

𝑥 − 𝑥ҧ
𝑥 − 𝑥ҧ 𝑦 − 𝑦ത 𝑆 −1 ≤ 𝜒 22,0.5 =1.386
𝑦 − 𝑦ത
Distribución Normal Multivariada. Distancia de Mahalanobis.
Ejemplo

1 0 1 0 1 0
Σ= Σ −1 = 𝑅=
0 1 0 1 0 1

2 𝑇
𝑑𝑀 = 𝑋 − 𝜇Ԧ Σ −1 𝑋 − 𝜇Ԧ

𝑑𝐸 𝐴, 𝑂 = 𝑑𝐸 𝐵, 𝑂

𝑑𝑀 𝐴, 𝑂 > 𝑑𝑀 𝐵, 𝑂

𝑑𝑀 incluye la correlación

Tener en cuenta: Cuando 𝜌 = 0 (como en este caso), pero 𝜎1 = 𝜎2 , entonces los


contornos de densidad de probabilidad son círculos y la función de densidad conjunta se
denomina distribución normal circular.
Distribución Normal Multivariada. Distancia de Mahalanobis.
Ejemplo
10 0 0.1 0 1 0
Σ= Σ −1 = 𝑅=
0 2.5 0 0.4 0 1

2 𝑇
𝑑𝑀 = 𝑋 − 𝜇Ԧ Σ −1 𝑋 − 𝜇Ԧ

𝑑𝐸 𝐴, 𝑂 = 𝑑𝐸 𝐵, 𝑂

𝑑𝑀 𝐴, 𝑂 > 𝑑𝑀 𝐵, 𝑂

𝑑𝑀 incluye la correlación
Distribución Normal Multivariada. Distancia de Mahalanobis.
Ejemplo

6 4 0.3 −0.2 1 −1
Σ= Σ −1 = 𝑅=
4 6 −0.2 0.3 1 1

2 𝑇
𝑑𝑀 = 𝑋 − 𝜇Ԧ Σ −1 𝑋 − 𝜇Ԧ

𝑑𝐸 𝐴, 𝑂 = 𝑑𝐸 𝐵, 𝑂

𝑑𝑀 𝐴, 𝑂 > 𝑑𝑀 𝐵, 𝑂

𝑑𝑀 incluye la correlación
Distribución Normal Multivariada. Distancia de Mahalanobis.
Ejemplo
Relaciona cada matriz con su conjunto de datos

1 0
Σ1 =
0 1
1 −0.7
Σ2 =
−0.7 1

1 0.5
Σ3 =
0.5 1
5 0
Σ4 =
0 1

También podría gustarte