Documentos de Académico
Documentos de Profesional
Documentos de Cultura
principales
MET. ROSA ISELA
HERNÁNDEZ ZAMORA
Componentes Principales
90
X2
80
70
60
50
40
40 60 80 100 120 140 X1 160
Ilustración gráfica.
El algoritmo que se aplica es el siguiente.
hasta q p.
Resolvemos el paso 1.
Supongamos que se tiene una muestra
aleatoria del vector X p con matriz de
covarianzas Σ. Se quiere :
max var(cX ) cΣc
p
s.a. cc 1 i 1
ci
2
.
El lagrangiano es,
L(c) cΣc (cc 1) cΣc (cIc 1)
d
L(c) 2 Σc 2Ic 0
dc
Σc c de donde (c, ) deben ser el
eigen vector y su correspondiente
eigenvalor de Σ.
Sea e1 y 1 un eigenvector y su
correspondiente eigenvalor de Σ.
Entonces, var(e1 X ) e1 Σe1 e1 (1e1 )
var(e1 X ) 1e1e1 1 (1) 1.
Entonces para maximizar var(e1 X )
se tiene que 1 debe ser el mayor
eigenvalor de Σ.
De manera similar se puede probar
que (e 2 , 2 ) es la solución de
max cΣc s.a. cc 1 y c e1
donde 2 es el segundo eigenvalor
mayor, etc.
El i - ésimo componente principal es
Yi ei X p ei1 xi ei 2 x2 eip x p .
Ahora, la varianza total de las X ´s
2 2 2
es Var T 1 2 p
es decir en la traza de Σ,
luego, Var T Tr ( Σ).
Pero Σ PΛP, donde P es la matriz
cuyas columnas son los eigenvectores
y Λ es la matriz diagonal cuyos elementos
son los eigenvalores.
Entonces,
Var T tr ( Σ) tr (PΛP) tr ( ΛPP )
p
Var T tr ( ΛI ) tr ( Λ ) i 1 i .
Luego, la proporción de la varianza
total que tiene el componente ppal i
i
está dado por p
.
i1 i
x1 x2 x3 x4 x5 x6
84.382 -56.062 1458.060 963.242 -148.181 3.656
-10.873 -69.034 1305.460 913.603 -50.791 -132.867
144.774 -319.350 1326.110 895.760 -230.398 -487.729
63.542 104.477 616.300 874.947 67.845 -23.531
Ejemplo. 81.999
6.863
84.940 1202.560
6.778 1014.240
902.133
883.390
169.140
6.745
199.378
38.784
15.180 15.891 1329.520 901.544 -48.663 127.133
-35.908 37.971 872.060 905.490 -11.199 -73.262
33.364 -98.488 1232.280 913.914 6.776 -183.936
78.043 10.883 1223.170 922.645 53.476 44.834
-93.775 -51.779 732.940 876.964 -256.938 -144.118
22.416 -98.666 810.750 832.410 -123.568 2.052
1.416 132.388 378.140 824.000 63.173 225.744
129.971 -95.307 1271.320 910.957 -19.296 -144.014
100.313 -1.844 1393.110 930.208 -59.459 179.095
54.674 134.101 1528.450 918.996 229.928 368.150
70.757 -130.367 1086.440 892.253 8.039 -254.489
95.466 -126.657 1250.430 917.406 -5.297 -299.965
-108.091 -63.782 1122.410 904.053 -312.849 169.856
76.369 95.470 532.170 911.938 10.938 -65.787
Resultado en R del Análisis de Componentes Principales de las variables: x1, x2,
x3, x4 y x6
Análisis de los valores propios de la Matriz de Covarianza
PC1 PC2 PC3 PC4 PC5 PC6
Standard deviation 328.5356 233.6110 124.67700 47.55939 36.39006 9.5385
Proportion of Variance 0.5939 0.3003 0.08553 0.01245 0.00729 0.0005
Cumulative Proportion 0.5939 0.8942 0.97977 0.99221 0.99950 1.0000
4
Eigenvalue
3
1 2 3 4 5 6 7 8
Component Number
PL PA PR TF TFF A RPM PL
143 122 140 10.5 9.5 40.3 42 9.5
e1 e2 e3
0.420491 -0.05723 -0.05804 Y1 = -1.07452
0.420529 0.093728 -0.06597
0.417104 0.113073 -0.07589 Y2 = -1.835
0.407483 -0.10995 0.219007
0.309469 -0.35763 0.490856 Y3 = 2.385854
0.28459 0.35138 -0.64779
0.228629 0.639002 0.450741
0.278013 -0.5508 -0.27353
3.0
2.5
Eigenvalue
2.0
1.5
1.0
0.5
0.0
1 2 3 4 5 6 7
Component Number
PG PV PH PR PM PI PP
490 62 55 58 47 60 88
e1 e2 e3
0.546895 -0.08063 0.033144 Y1 = 0.088881
0.380687 -0.0221 0.199904
0.390753 -0.15752 -0.26815 Y2 = 0.325724
0.274851 0.445248 0.674621
0.388846 -0.33177 -0.34125 Y3 = 0.262069
0.390075 -0.01578 0.112242
0.156183 0.812178 -0.55033
5.347 5.347
IC del 95% para 1 : 1 ,
1 1.96 2 / 29 1 1.96 2 / 29
3.53 1 11 .02.
1
1
Sea ρ 0
1 p p
Luego H 0 : ρ ρ 0 vs H1 : ρ ρ 0 .
2 rij
i j
r (promedio de elementos fuera de la diagonal)
p ( p 1)
( p 1) 2 [1 (1 r ) 2 ]
ˆ
p ( p 2)(1 r ) 2
Estadístico de prueba,
p
(n 1) 2
T 2
(1 r ) i k
( rik r ) 2
ˆ ( rk r )
k 1
ejemplo