Está en la página 1de 9

Ejercicios del Captulo 3

3. Sea uk un eje principal del A.C.P. de la nube N = (X, M, D) con valor propio k . Si se dene vk = Muk pruebe que entonces vk es vector propiode MV asociado al mismo valor propio k . Se llama a vk un factor principal. Prueba adem s que los factores principales son ortogonales a respecto de los productos internos denidos por las m tricas V y M 1 en el dual (R p ) . e Soluci n: o Al ser uk vector propio de V M, asociado al valor propio k , se tiene V Muk = k uk . Multiplicando por M: MV Muk = Mk uk (MV)(Muk ) = k (Muk ) por lo que Muk es vector propio de MV asociado a k .

Por otra parte, los vectores propios de V M (ejes principales), uk , forman una base M-ortonormal de R p , es decir uk , u j
M

= 0, k

j. Como M es matriz sim trica, se tiene que M T = M. e j, vk , v j


M 1

Hay que demostrar que para todo k de producto interno se tiene:

= 0 y vk , v j

= 0. A partir de la denici n o

vk , v j

M 1

= vT M 1 v j k = (Muk )T M 1 Mu j = (Muk )T u j = uT M T u j k = uT Mu j k = uk , u j
M

= 0.

Y adem s, a vk , v j
V

= vT Vv j k = (Muk )T V Mu j = (Muk )T j u j = uT M T j u j k = j uT M T u j k = j uT Mu j k = j uk , u j = 0.
p M

4. Pruebe que la matriz de datos X se puede expresar como X =


j=1

c j utj , donde c j son las compo-

nentes principales y u j los ejes principales del ACP general de N = (X, M, D). Esta expresi n o es conocida como f rmula de reconstituci n de los datos. o o (Sugerencia: en vista de que los u j forman una base ortonormal de R p , el i- simo individuo e
p

puede expresarse como xi =


j=1

ci j u j )

Soluci n: o En primer lugar note que:


p

c j utj = c1 ut + c2 ut + . . . + c p utp 1 2
j=1

Al desarrollar esta expresi n se obtiene: o c1p c11 2p 21 p c c j t . u11 u12 . . . u1p + + . u p1 u p2 . . . u pp c uj = . . . . j=1 np n1 c c De forma que:

p c11 u11 + . . . + c1p u p1 . . . c11 u1p + . . . + c1p u pp c1 j u j1 . . . j=1 21 p c u + . . . + c2p u 21 u + . . . + c2p u . . . c 1p 11 p1 pp . j t = . c uj = . . . p . j=1 n1 nj c u + . . . + cnp u . . . cn1 u1p + . . . + cnp u pp c u j1 . . . 11 p1
j=1 p

j=1

c u jp j=1 p nj c u jp
1j

Vemos que la primera la de la matriz anterior se puede escribir como


j=1

c1 j u j , donde

u11 21 u uj = . . . . p1 u
p

En general, la la i- sima es e i j, donde i = 1, 2, . . . , n. 1 , . . . , p tales que


j=1

ci j u j . Comprobemos que cada ci j es la componente principal

Como los vectores u1 , . . . , u p forman una base del espacio de inviduos R p , entonces existen
p

xi =
j=1

i j utj .
M

En efecto, por el teorema de Parseval, los i j = xi , u j i sima componente del componente principal j. e

= xt M u j = (c j )i . Donde (c j )i es la i

5. Sea X una tabla de datos asociada a p variables cuantitativas centradas y den tese W = XMX t , o con M la M la m trica sobre los individuos. Pruebe que las componentes principales ck son e vectores propios de WD asociados a los valores propios k . Soluci n: o Sean {uk } vectores propios de V M y {k } sus valores propios asociados, es decir, V Muk = k uk . Adem s los componentes principales vienen dados por ck = XMuk . a

Luego se tiene que WDck = WDXMuk = XMX t DXMuk = XMV Muk = XMk uk = k XMuk = k c k . Por lo tanto WDck = k ck . 6. Sea la nube N = (X, M, D) con W = XMX t , matriz nn de entradas wi j . Pruebe que la distancia entre dos individuos xi , x j se puede escribir

d2 (xi , x j ) = xi x j Soluci n: o

= wii + w j j 2wi j

Sea la matriz X, de n individuos por p variables, dada por: x11 x 21 X= . . . x n1 x12 x1p x22 x2p . .. . . . . . . xn2 xnp

np

La m trica sobre el espacio de individuos es una matriz sim trica, sin embargo la denotamos e e como: m11 m12 m1p m 21 m22 m2p M= . . . . .. . . . . . . m m p2 m pp p1

pp

Entonces la matriz de productos internos, W = XMX t , una matriz sim trica de tama o n n y e n entradas wi j , est dada por: a

p k=1 p W = k=1 p

x1l mlk x1k


l=1 p k=1 l=1 p p

x1l mlk x2k


k=1 l=1 p p

x2l mlk x1k


l=1 p

x2l mlk x2k


k=1 l=1 p p

. . . xnl mlk x1k

. . .

..

k=1 l=1

.
p p

xnl mlk x2k


k=1 l=1 k=1 l=1 p p

k=1 l=1

x1l mlk xnk x2l mlk xnk . . . xnl mlk xnk

De lo anterior se obtiene que para 1 i n y 1 j n, wi j =


k=1 l=1

xil mlk x jk .

Ahora bien, dados los individuos xi y x j , con: xi1 x i2 xi = . , . . x ip x j1 x j2 xj = . . . x jp

Se tiene que el cuadrado de su distancia, medida con la m trica M, est dada por: e a

d2 (xi , x j ) = xi x j Es decir

2 M

= (xi x j )t M(xi x j )

d2 (xi , x j ) = xi1 x j1

xi2 x j2 xip x jp

m11 m12 m1p xi1 x j1 x x m 21 m22 m2p i2 j2 . . . . . .. . . . . . . . . x x m ip jp p1 m p2 m pp

Note que el resultado del producto anterior es de tama o 1 1, adem s, al desarrollarlo se n a obtiene:

d2 (x

i, x j) =

(xil x jl )ml1
l=1 l=1

(xil x jl )ml2

xi1 x j1 p x x i2 j2 (xil x jl )mlp . . . l=1 x x ip jp

=
l=1 p

xil ml1 (xi1 x j1 )


l=1 p

x jl ml1 (xi1 x j1 ) x jl ml2 (xi2 x j2 )


l=1 p

+ . . . +
l=1 p l=1 p

xil ml2 (xi2 x j2 )

xil mlp (xip x jp )


p p l=1 p

x jl mlp (xip x jp )
p p p p

=
k=1 l=1

xil mlk xik


k=1 l=1

xil mlk x jk
k=1 l=1

x jl mlk xik +
k=1 l=1

x jl mlk x jk

Dada la forma de cada wi j , se tiene que d2 (xi , x j ) = wii wi j w ji + w j j , sin embargo, como W es sim trica, d2 (xi , x j ) = wii 2wi j + w j j . e 7. Consid rese que se ha observado el crecimiento de 20 novillos, midi ndose el peso al nacimiene e to (x), a los 50 das (y) y a los 100 das (z), obteni ndose la matriz de covarianzas V (para pesos e iguales de los individuos): 17,56 31,09 47,69 31,09 91,29 140,39 47,69 140,39 267,08 i) Determine la matriz de correlaciones R. Suponga que se hace un An lisis en Componentes a Principales Normado. Soluci n: o Para este caso la matriz diagonal de los inversos de las varianzas es la siguiente: 0,23863698 0 0 D1 = 0 0,10466185 0 0 0 0,06118984

Por denici n, la matriz de correlaciones R se puede expresar como R = D 1 V D 1 , por lo o


que para este caso en particular la matriz de correlaciones sera:

0,23863698 R= 0 0

0 0,10466185 0

17,56 31,09 47,69 0,23863698 0 0 31,09 91,29 140,39 0 0,10466185 0 0 0 0 0,06118984 0,06118984 47,69 140,39 267,08 0

Es decir, 1 0,77650966 0,69637694 0,77650966 R= 1 0,89909149 0,69637694 0,89909149 1 0,8160328 0,5495858 yv = 0,2360196 son vectores propios de la ii) Probar que los vectores v1 = 0,5995437 2 0,5276223 0,5818100 matriz a diagonalizar en el A.C.P. y determine los valores propios a los que est n asociados. a Cu nto vale el tercer valor propio? a Soluci n: o En el caso del vector propio v1 note que 1 0,77650966 0,69637694 0,5495858 0,5995437 0,77650966 = 1 0,89909149 0,5818100 0,69637694 0,89909149 1 1,420296 1,549403 = 1,503573 0,5495858 = 2,584303 0,5995437 0,5818100 = 1 v1 Por lo que se deduce que v1 es un vector propio asociado al valor propio 1 = 2,584303. En el caso del segundo valor propio v2 , se observa que

R v1

R v2

1 0,77650966 0,69637694 0,8160328 0,77650966 0,2360196 = 1 0,89909149 0,69637694 0,89909149 1 0,5276223 0,2653373 0,0767430 = 0,1715591 0,8160328 = 0,3251552 0,2360196 0,5276223 = 2 v2

De lo anterior se inere que v2 es un vector propio asociado al valor propio 2 = 0,3251552. El polinomio caracterstico de la matriz R es:

P(R) = det (x I R) = x3 + 3 x2 1,10372639612196 x + 3,07608201 Por lo que al utilizar un m todo num rico de aproximaci n de races en este polinomio, en el e e o software Mathematica, se obtiene 3 = 0,09054154. iii) Mostrar que v1 y v2 son ortogonales, y que son de norma 1. Soluci n: o Para vericar que son ortogonales, se debe hacer el producto interno entre ambos, tomando en cuenta que la m trica en este caso es M = I: e

v1 , v2

= 0,5495858 0,8160328 + 0,5995437 0,2360196 + 0,5818100 0,5276223 = 1,914972 1016 0.

La norma de los vectores v1 y v2 es, respectivamente: v1 , v1 = 0,54958582 + 0,59954372 + 0,58181002 v1 = v2 =

1 2

=1
1 2

v2 , v2 = 0,81603282 + (0,2360196)2 + (0,5276223)2

=1

iv) Calcule la inercia de la nube de puntos; calcule el porcentaje de inercia explicada por el primer eje factorial, y el porcentaje de inercia explicada por el segundo eje factorial.

Soluci n: o La inercia corresponde a la suma de los valores propios de la matriz R, por lo que en este caso sera,

I(N) = 1 + 2 + 3 = 2,584303 + 0,3251552 + 0,09054154 = 3. El porcentaje de inercia que explica el primer eje factorial es explica
2 I(N) 1 I(N)

2,584303 3

= 0,8614344, es

decir, aproximadamente un 86,14 % de la inercia global. Mientras que el segundo eje factorial =
0,3251552 3

= 0,1083851, dicho de otra forma, un 10,84 % de la inercia global,

aproximadamente. v) Las correlaciones entre las variables originales y las dos primeras componentes principales son: c1 x y z 0.751 0.949 0.997 c2 0.438 0.309 0.115

Dibuje el crculo de correlaciones y represente en el a las tres variables originales. Soluci n: o

Se observa un efecto talla entre las variables. Adem s, existe una alta correlaci n positiva entre a o las mismas y la primera componente principal.

También podría gustarte