Está en la página 1de 4

EXAMEN ESTADÍSTICA MULTIVARIANTE: CONTROL MAYO 2015.

1) Definición de componentes principales. Enunciado y demostración del teorema que permite


el cálculo de las componentes principales a partir de una matriz de covarianza definida positiva.

2) Enunciar y demostrar el teorema que permite obtener la función lineal discriminante de Fisher
y demostrar el criterio de clasificación para esta función.

3) Dado un vector aleatorio (X1 , . . . , Xk ) con matriz de covarianzas V = (σi,j ), se pide:


3.1) Demostrar que si σi,j ≥ 0 para todo i, j, entonces existe una primera componente principal
Y1 con todos sus coeficientes no negativos.
3.2) ¿Cómo se puede interpretar Y1 si Xi representa la nota de un alumno en la asignatura i?
¿Existirá otra componente principal con todos sus coeficientes positivos? (razona la respuesta).
3.3) Calcular Y1 para µ ¶
1 1
V = .
1 2
¿Cuánta información tiene Y1 ?

4) Dadas tres poblaciones bidimensionales con medias µ1 = (1, 0)0 , µ2 = (2, 0)0 y µ3 = (3, 0)0 y
matriz de covarianzas común µ ¶
1 1
V = ,
1 2
se pide:
4.1) Calcular la funciones discriminates lineales de cada grupo.
4.2) Clasificar al punto z = (2, 2)0 .
4.3) Dibujar las regiones de clasificación para cada grupo.
4.4) Calcular la función discriminate de Fisher para distinguir entre los grupos 1 y 3. Dar el
criterio de clasificación y usarlo para clasificar a z = (2, −1)0 .

Todas las preguntas puntúan igual.


SOLUCIONES
Las cuestiones 1-2 son preguntas de teoría (ver apuntes)
3) Dado un vector aleatorio (X1 , . . . , Xk ) con matriz de covarianzas V = (σi,j ), se pide:
3.1) Demostrar que si σi,j ≥ 0 para todo i, j, entonces existe una primera componente principal
Y1 con todos sus coeficientes no negativos.
Sol. Sea t1 , . . . , tk una base de vectores propios de V ortonormales unitarios tales que V ti = λi ti
con λ1 ≥ · · · ≥ λk > 0 (existe por ser V simétrica y definida positiva). Sea v el vector que se obtiene
de t1 haciendo que todas sus coordenadas sean positivas. Entonces, como σi,j ≥ 0, se tendrá:

v 0 V v ≥ t01 V t1 = λ1 t01 t1 = λ1 .
Pk
Sea c = (c , . . . , ck )0 las coordenadas de v en la base de vectores propios. Entonces v = i=1 ci ti y
Pk 2 1
i=1 ci = 1. Además:

Xk Xk Xk Xk k
X k
X
0 0 0 0
v Vv =( ci ti )V ( cj tj ) = ( ci ti )( cj V tj ) = ( λj cj ci ti tj ) = λi c2i ,
i=1 j=1 i=1 j=1 i,j=1 i=1

ya que t0i tj = 0 si i 6= j y t0i tj = 1 si i = j. Entonces


k
X k
X
0
v Vv = λi c2i ≤ λ1 c2i = λ1
i=1 i=1

y se tiene
k
X
0
v Vv = λi c2i = λ1 .
i=1

Esto implica que ci = 0 para todo i tal que λi < λ1 (si no la desigualdad anterior sería estricta)
y v será una combinación lineal de vectores propios de un mismo valor propio λ1 y, por lo tanto,
también será vector propio de ese valor propio (el mayor).
3.2) ¿Cómo se puede interpretar Y1 si Xi representa la nota de un alumno en la asignatura i?
¿Existirá otra componente principal con todos sus coeficientes positivos? (razona la respuesta).
Sol. Si tomamos como t1 a ese vector propio con todos los coeficientes positivos, todas las
variables Xi influirán de forma positiva (en mayor o menor medida) en Y1 , por lo que Y1 nos
indicará lo bueno que es el alumno en general.
No, ya que el resto de vectores propios deben ser perpendiculares a t1 y, por lo tanto, el producto
escalar t01 ti debe ser cero. Esto es imposible si todos los coeficientes de ambos vectores son positivos.
La única opción sería que los coeficientes fuesen no negativos (por ejemplo (1, 0) y (0, 1)).
3.3) Calcular Y1 para µ ¶
1 1
V = .
1 2
¿Cuánta información tiene Y1 ?
Sol.: La ecuación característica es:
¯ ¯
¯ 1 1 ¯
¯ ¯ 2
¯ 1 2 ¯ = λ − 3λ + 1 = 0.
√ √
Las soluciones son λ1 = 3
2 + 1
2 5∼
= 2.618 y λ2 = 5∼ 3
2 − 1
= 0.382. Para calcular Y1 resolvemos el
2
sistema: µ ¶µ ¶ √ µ ¶
1 1 x 3+ 5 x
=
1 2 y 2 y

2

1+ 5
cuya solución general es y = 2 x. Por lo tanto una Y1 es:

2X1 + (1 + 5)X2 ∼
Y1 = p √ = 0.525X1 + 0.850X2
10 + 2 5
3

+ 12 5
y su información será I1 = 2
3 = 0.8726.

4) Dadas tres poblaciones bidimensionales con medias µ1 = (1, 0)0 , µ2 = (2, 0)0 y µ3 = (3, 0)0 y
matriz de covarianzas común µ ¶
1 1
V = ,
1 2
se pide:

4.1) Calcular la funciones discriminates lineales de cada grupo.


Sol.:
En primer lugar calculamos su inversa
µ ¶
−1 2 −1
V = .
−1 1

Entonces las funciones discriminantes lineales son:


µ ¶µ ¶ µ ¶µ ¶
¡ ¢ 2 −1 x 1¡ ¢ 2 −1 1
L1 (x, y) = 1 0 − 1 0 = 2x − y − 1,
−1 1 y 2 −1 1 0
µ ¶µ ¶ µ ¶µ ¶
¡ ¢ 2 −1 x 1¡ ¢ 2 −1 2
L2 (x, y) = 2 0 − 2 0 = 4x − 2y − 4
−1 1 y 2 −1 1 0
y
µ ¶µ ¶ µ ¶µ ¶
¡ ¢ 2 −1 x 1¡ ¢ 2 −1 3
L3 (x, y) = 3 0 − 3 0 = 6x − 3y − 9.
−1 1 y 2 −1 1 0

4.2) Clasificar al punto z = (2, 2)0 .


Sol.: Calculamos
L1 (2, 2) = 1,
L2 (2, 2) = 0
y
L3 (2, 2) = −3
y z se clasifica en 1 (dónde la función lineal es máxima).

4.3) Dibujar las regiones de clasificación para cada grupo.


La recta que sirve para distinguir entra la población 1 y la 2 es: 4x − 2y − 4 = 2x − y − 1, es
decir y = 2x − 3 (ver Figura 1, negra).
La recta que sirve para distinguir entra la población 1 y la 3 es: 6x − 3y − 9 = 2x − y − 1, es
decir y = 2x − 4 (ver Figura 1, azul).
La recta que sirve para distinguir entra la población 2 y la 3 es: 4x − 2y − 4 = 6x − 3y − 9, es
decir y = 2x − 5 (ver Figura 1, roja).
Las regiones de clasificación quedan delimitadas por las rectas negra y roja (la azul no se tiene
en cuenta).

3
6
z
2

mu1 mu2 mu3


y
−2
−6

−2 −1 0 1 2 3 4 5
x

Figura 1: Regiones de clasificación: 1 izquierda (negra), 2 centro (entre la negra y la roja), 3 derecha
(roja).

4.4) Calcular la función discriminate de Fisher para distinguir entre los grupos 1 y 3. Dar el
criterio de clasificación y usarlo para clasificar a z = (2, −1)0 .
Sol.:
Hacemos
L1 − L3 = 2x − y − 1 − (6x − 3y − 9) = −4x + 2y + 8
y obtenemos que L(x, y) = −4x + 2y y K = −8.
El criterio de clasificación es: z se clasifica en 1 (3) si

L(x, y) = −4x + 2y > K = −8 (<).

Para clasificar a z = (2, −1)0 hacemos

L(2, −1) = −4 · 2 + 2(−1) = −10 < K = −8

por lo que se clasifica en 3.

También podría gustarte