Documentos de Académico
Documentos de Profesional
Documentos de Cultura
3. Sea uk un eje principal del A.C.P. de la nube N = (X, M, D) con valor propio k . Si se dene vk = Muk pruebe que entonces vk es vector propiode MV asociado al mismo valor propio k . Se llama a vk un factor principal. Prueba adem s que los factores principales son ortogonales a respecto de los productos internos denidos por las m tricas V y M 1 en el dual (R p ) . e Soluci n: o Al ser uk vector propio de V M, asociado al valor propio k , se tiene V Muk = k uk . Multiplicando por M: MV Muk = Mk uk (MV)(Muk ) = k (Muk ) por lo que Muk es vector propio de MV asociado a k .
Por otra parte, los vectores propios de V M (ejes principales), uk , forman una base M-ortonormal de R p , es decir uk , u j
M
= 0, k
= 0 y vk , v j
= 0. A partir de la denici n o
vk , v j
M 1
= vT M 1 v j k = (Muk )T M 1 Mu j = (Muk )T u j = uT M T u j k = uT Mu j k = uk , u j
M
= 0.
Y adem s, a vk , v j
V
= vT Vv j k = (Muk )T V Mu j = (Muk )T j u j = uT M T j u j k = j uT M T u j k = j uT Mu j k = j uk , u j = 0.
p M
nentes principales y u j los ejes principales del ACP general de N = (X, M, D). Esta expresi n o es conocida como f rmula de reconstituci n de los datos. o o (Sugerencia: en vista de que los u j forman una base ortonormal de R p , el i- simo individuo e
p
ci j u j )
c j utj = c1 ut + c2 ut + . . . + c p utp 1 2
j=1
Al desarrollar esta expresi n se obtiene: o c1p c11 2p 21 p c c j t . u11 u12 . . . u1p + + . u p1 u p2 . . . u pp c uj = . . . . j=1 np n1 c c De forma que:
p c11 u11 + . . . + c1p u p1 . . . c11 u1p + . . . + c1p u pp c1 j u j1 . . . j=1 21 p c u + . . . + c2p u 21 u + . . . + c2p u . . . c 1p 11 p1 pp . j t = . c uj = . . . p . j=1 n1 nj c u + . . . + cnp u . . . cn1 u1p + . . . + cnp u pp c u j1 . . . 11 p1
j=1 p
j=1
c u jp j=1 p nj c u jp
1j
c1 j u j , donde
u11 21 u uj = . . . . p1 u
p
Como los vectores u1 , . . . , u p forman una base del espacio de inviduos R p , entonces existen
p
xi =
j=1
i j utj .
M
En efecto, por el teorema de Parseval, los i j = xi , u j i sima componente del componente principal j. e
= xt M u j = (c j )i . Donde (c j )i es la i
5. Sea X una tabla de datos asociada a p variables cuantitativas centradas y den tese W = XMX t , o con M la M la m trica sobre los individuos. Pruebe que las componentes principales ck son e vectores propios de WD asociados a los valores propios k . Soluci n: o Sean {uk } vectores propios de V M y {k } sus valores propios asociados, es decir, V Muk = k uk . Adem s los componentes principales vienen dados por ck = XMuk . a
Luego se tiene que WDck = WDXMuk = XMX t DXMuk = XMV Muk = XMk uk = k XMuk = k c k . Por lo tanto WDck = k ck . 6. Sea la nube N = (X, M, D) con W = XMX t , matriz nn de entradas wi j . Pruebe que la distancia entre dos individuos xi , x j se puede escribir
d2 (xi , x j ) = xi x j Soluci n: o
= wii + w j j 2wi j
Sea la matriz X, de n individuos por p variables, dada por: x11 x 21 X= . . . x n1 x12 x1p x22 x2p . .. . . . . . . xn2 xnp
np
La m trica sobre el espacio de individuos es una matriz sim trica, sin embargo la denotamos e e como: m11 m12 m1p m 21 m22 m2p M= . . . . .. . . . . . . m m p2 m pp p1
pp
Entonces la matriz de productos internos, W = XMX t , una matriz sim trica de tama o n n y e n entradas wi j , est dada por: a
p k=1 p W = k=1 p
. . .
..
k=1 l=1
.
p p
k=1 l=1
xil mlk x jk .
Se tiene que el cuadrado de su distancia, medida con la m trica M, est dada por: e a
d2 (xi , x j ) = xi x j Es decir
2 M
= (xi x j )t M(xi x j )
d2 (xi , x j ) = xi1 x j1
xi2 x j2 xip x jp
Note que el resultado del producto anterior es de tama o 1 1, adem s, al desarrollarlo se n a obtiene:
d2 (x
i, x j) =
(xil x jl )ml1
l=1 l=1
(xil x jl )ml2
=
l=1 p
+ . . . +
l=1 p l=1 p
x jl mlp (xip x jp )
p p p p
=
k=1 l=1
xil mlk x jk
k=1 l=1
x jl mlk xik +
k=1 l=1
x jl mlk x jk
Dada la forma de cada wi j , se tiene que d2 (xi , x j ) = wii wi j w ji + w j j , sin embargo, como W es sim trica, d2 (xi , x j ) = wii 2wi j + w j j . e 7. Consid rese que se ha observado el crecimiento de 20 novillos, midi ndose el peso al nacimiene e to (x), a los 50 das (y) y a los 100 das (z), obteni ndose la matriz de covarianzas V (para pesos e iguales de los individuos): 17,56 31,09 47,69 31,09 91,29 140,39 47,69 140,39 267,08 i) Determine la matriz de correlaciones R. Suponga que se hace un An lisis en Componentes a Principales Normado. Soluci n: o Para este caso la matriz diagonal de los inversos de las varianzas es la siguiente: 0,23863698 0 0 D1 = 0 0,10466185 0 0 0 0,06118984
0,23863698 R= 0 0
0 0,10466185 0
17,56 31,09 47,69 0,23863698 0 0 31,09 91,29 140,39 0 0,10466185 0 0 0 0 0,06118984 0,06118984 47,69 140,39 267,08 0
Es decir, 1 0,77650966 0,69637694 0,77650966 R= 1 0,89909149 0,69637694 0,89909149 1 0,8160328 0,5495858 yv = 0,2360196 son vectores propios de la ii) Probar que los vectores v1 = 0,5995437 2 0,5276223 0,5818100 matriz a diagonalizar en el A.C.P. y determine los valores propios a los que est n asociados. a Cu nto vale el tercer valor propio? a Soluci n: o En el caso del vector propio v1 note que 1 0,77650966 0,69637694 0,5495858 0,5995437 0,77650966 = 1 0,89909149 0,5818100 0,69637694 0,89909149 1 1,420296 1,549403 = 1,503573 0,5495858 = 2,584303 0,5995437 0,5818100 = 1 v1 Por lo que se deduce que v1 es un vector propio asociado al valor propio 1 = 2,584303. En el caso del segundo valor propio v2 , se observa que
R v1
R v2
1 0,77650966 0,69637694 0,8160328 0,77650966 0,2360196 = 1 0,89909149 0,69637694 0,89909149 1 0,5276223 0,2653373 0,0767430 = 0,1715591 0,8160328 = 0,3251552 0,2360196 0,5276223 = 2 v2
De lo anterior se inere que v2 es un vector propio asociado al valor propio 2 = 0,3251552. El polinomio caracterstico de la matriz R es:
P(R) = det (x I R) = x3 + 3 x2 1,10372639612196 x + 3,07608201 Por lo que al utilizar un m todo num rico de aproximaci n de races en este polinomio, en el e e o software Mathematica, se obtiene 3 = 0,09054154. iii) Mostrar que v1 y v2 son ortogonales, y que son de norma 1. Soluci n: o Para vericar que son ortogonales, se debe hacer el producto interno entre ambos, tomando en cuenta que la m trica en este caso es M = I: e
v1 , v2
1 2
=1
1 2
=1
iv) Calcule la inercia de la nube de puntos; calcule el porcentaje de inercia explicada por el primer eje factorial, y el porcentaje de inercia explicada por el segundo eje factorial.
Soluci n: o La inercia corresponde a la suma de los valores propios de la matriz R, por lo que en este caso sera,
I(N) = 1 + 2 + 3 = 2,584303 + 0,3251552 + 0,09054154 = 3. El porcentaje de inercia que explica el primer eje factorial es explica
2 I(N) 1 I(N)
2,584303 3
= 0,8614344, es
decir, aproximadamente un 86,14 % de la inercia global. Mientras que el segundo eje factorial =
0,3251552 3
aproximadamente. v) Las correlaciones entre las variables originales y las dos primeras componentes principales son: c1 x y z 0.751 0.949 0.997 c2 0.438 0.309 0.115
Se observa un efecto talla entre las variables. Adem s, existe una alta correlaci n positiva entre a o las mismas y la primera componente principal.