Está en la página 1de 27

Captulo VIII

8. Anlisis factorial
Si se tiene un nmero de observaciones en un conjunto grande de variables cuantitativas, el
anlisis factorial es una tcnica que permite representar dichas variables en un espacio de
menor dimensin, denominado espacio vectorial, de tal forma que permita con comodidad,
interpretar las relaciones entre ellas. Dicho espacio debe permitir, de la misma manera,
analizar las similitudes discrepancias entre los elementos de la muestra respecto a su
comportamiento en el conjunto de las variables. Si adems, es posible determinar
subconjuntos claramente diferenciados de variables en los que, por un lado, dentro de cada
subconjunto las variables estn relacionadas entre s! , por otro, las variables de los diferentes
subconjuntos no muestren relacin alguna, el conjunto de variables podr ser simplificado a
un nuevo grupo de variables, denominados factores, de tal manera que cada factor represente
la informacin comn de las variables pertenecientes a un mismo subconjunto.
8.1. Anlisis en Componentes Principales (ACP)
"s un mtodo que permite e#traer del espacio vectorial, a partir de una matriz de n individuos
por p variables $n % p&, un nuevo espacio p dimensional de tal forma que'
"l ()simo factor *( , ( + ,,-, ..., p, ser aquel tal que, de todas las posibles proecciones de
la nube de puntos en un espacio ( dimensional generado por los ejes *., *,, ..., *(). un ()
simo eje perpendicular a todos los (). anteriores, la m!nima deformacin sea la obtenida en
*(.
"ste tipo de anlisis se utiliza con frecuencia, en la reduccin de datos, identificando un
peque/o nmero de factores que e#plique la maor!a de la varianza observada en un
nmero maor de variables.
"n estos ltimos tiempos es frecuente leer en los anlisis geoqu!micos de rocas, suelos o
sedimentos interpretaciones genticas de correlaciones utilizando esta herramienta
0obinson 1illanueva rvillanueva2rnma.com.pe
34
8.1.1. PRESENACI!N "E# $%&"&
Dos variables # , pueden representarse fcilmente en el plano cartesiano, donde cada
muestra ei representa un punto de coordenadas $#i,i& .5bservando la nube de puntos
podemos establecer a groso modo, la relacin que e#iste entre estas variables clasificar
los individuos o grupo de individuos que presentan caracter!sticas similares.
'uerte correlaci(n )rupos *omo+,neos Correlaci(n nula
Del mismo modo, si tenemos tres variables, el estudio visual geomtrico en un sistema
tridimensional an es posible.
6ero, si el nmero p de variables es superior o igual a 7, la visualizacin del fenmeno en
un diagrama de dispersin $7 o ms ejes perpendiculares& a no es posible.
En la tabla Leyes en Mineral, cada muestra representa a un individuo caracterizado
por 18 variables. Si estos 69 puntos (muestras) lo quisiramos representar en un plano a
18 dimensiones, la nube de puntos sera indescirable. Supon!amos, que queremos
representar, a nuestras 69 muestras en una !r"ica, tal como se muestra en el !raico
si!uiente, lo que observamos es una representaci#n deormada de la coni!uraci#n e$acta%
a 18 dimensiones, la distancia entre los 69 puntos sobre el plano, & a &, no son i!uales, sin
duda que, las distorsiones ' los errores ser"n !randes ' por tanto el ob(etivo es tratar de
minimizarlos.
8eomtricamente, nuestro grfico se obtendr proectando los puntos individuos e., e,,..,en
sobre un plano $*ig. 9...&.
"videntemente, se escoger el plano de proeccin, sobre el cual las distancias, sern en
promedio las ms e#actas. 6or la propiedad de proeccin recursiva, se verifica que'

d $fi : fj & ; d$ei : ej&, fijndose como criterio de m#imo rendimiento el promedio del
cuadrado de las distancias entre las proecciones f., f,,...., fn.
6ara determinar este plano, llamado 6<=>5 60?>@?6=<, ser suficiente ubicar dos rectas
A. A,.
0obinson 1illanueva rvillanueva2rnma.com.pe
33
e
i

ej
A,

Bi fi
Bj fj
Ci Cj A.
'i+ura 8.1.
Si A. A, son perpendiculares entonces'
d
,
$fi: fj & + d
,
$Ci : Cj & D d
,
$Bi : Bj &
Donde Ci Bi son las proecciones de ei fi sobre A. A, respectivamente.
"l promedio del cuadrado de las distancias entre los fi , es entonces igual al promedio del
cuadrado de las distancias de Ci ms el promedio del cuadrado de las distancias de Bi.
"l mtodo consiste entonces, primero, en buscar A. que es el rendimiento m#imo del
promedio de d
,
$Ci: Cj& siendo perpendicular a A,, que es el rendimiento m#imo del
promedio de d
,
$Bi : Bj&.
E as! sucesivamente se podr determinar A-, A7, ...., Ap perpendiculares entre ellos. <os Ai
son los ejes principales del diagrama de dispersin.
6roectando los puntos ei de coordenadas iniciales $#
.
i, #
,
i, ....., #
p
i& sobre los ejes
principales, se obtiene las nuevas coordenadas $c
.
i, c
,
i,....,c
p
i& llamadas componentes
principales ' cada componente c
(
que no es ms que la lista coordenada de los n individuos
sobre el eje A(, es una combinacin lineal de los caracteres iniciales'
c
(
+ F
(
. #
.
D F
(
, #
,
DG. D F
(
p #
p
<os coeficientes $F
(
. , F
(
, ,G. , F
(
p forman el ()simo factor principal F
(
.
<a mejor representacin del promedio de datos, de los - caracteres solamente $q H p& se
obtiene tomando los - primeros componentes principales.
0obinson 1illanueva rvillanueva2rnma.com.pe
39
"n s!ntesis, este es el esquema del =nlisis en @omponentes 6rincipales $=@6&, que es un
mtodo de reduccin de variables, esto permite la representacin geomtrica de individuos
variables. Ial reduccin es posible si las p variables iniciales son dependientes con
coeficientes de correlacin no nulos.
el =@6 es un m,to.o factorial puesto que, intenta identificar variables subacentes o
factores , que e#pliquen la configuracin de correlaciones dentro de un conjunto de
variables observadas, la reduccin del nmero de variables no se realiza por simple
seleccin de unos con respecto a los otros, sino que las nuevas variables sintticas se
obtienen combinando los caracteres iniciales en trmino de factores. <a particularidad de
este mtodo con respecto a los otros mtodos factoriales $cannico, discriminante,....&
radica en el hecho de que trata e#clusivamente con caracteres numricos que juegan todos
ellos el mismo rol, mientras que el anlisis de correspondencia las variables son cualitativas
en el anlisis cannico discriminante los caracteres son repartidos en grupos bien
diferenciados.
"l =@6 es un mtodo lineal puesto que trata de combinaciones lineales entre las variables
analizadas. <as nociones de combinacin lineal, de distancias, de proeccin nos conducen
a razonar que los individuos las variables numricas son elementos de espacios
vectoriales euclidianos a p n dimensiones respectivamente. <as herramientas matemticas
a utilizar sern entonces las mismas que la del lgebra lineal del clculo matricial.
En nuestro e(emplo, a partir de una poblaci#n de 69 observaciones de las 18 variables%
)u (ppb), )! (ppm), ...,Sc (ppm).
Se trata de e$traer 18 actores, combinaciones lineales de los 18 elementos del an"lisis
!eoqumico, que estn no correlacionados entre s. ) partir de estos 18 actores se
determinar" un subcon(unto ormado por * de ellos de tal manera que, por un lado, * sea
peque+o ', por otro, al representar las distintas medidas del an"lisis !eoqumico en el
subespacio *,dimensional !enerado por los * actores, se pierda el mnimo posible de
inormaci#n relativa a las relaciones entre las variables.
Este an"lisis se solicita en el S-SS de la si!uiente manera%
)nal'ze .ata /eduction 0actor
1ariable% au, a!, 2., sc (18 variables)
.escription
Statistics univariate description
3nitial Solution
4orrelation matri$ 4oeicients
4ontinue
56
0obinson 1illanueva rvillanueva2rnma.com.pe
3J
'i+ura 8./. 'actor Anal0sis
Descriptive Statistics
25.19 28.45 69
9.84 15.58 69
1262.80 990.50 69
1427.84 1606.91 69
3083.32 5689.94 69
56.87 57.67 69
6.01 3.71 69
163.70 172.12 69
14.55 16.43 69
7.17 2.61 69
4525.42 4768.14 69
298.38 436.83 69
112.36 48.83 69
4.58 2.18 69
58.94 71.93 69
14.88 7.36 69
98.96 123.10 69
7.00 2.86 69
AU
AG
CU
PB
ZN
NI
BI
AS
SB
FE
MN
BA
CR
AL
SR
GA
NB
SC
Mean
Std.
e!"at"#n Ana$%&"& N
0obinson 1illanueva rvillanueva2rnma.com.pe
9K
Correlation Matrix
1.000 .697 .011 .445 (.158 (.221 .454 .338 .384 .167 (.241 (.280 .166 (.288 (.335 .198 .177 (.261
.697 1.000 .079 .642 (.155 (.269 .720 .303 .676 .173 (.267 (.251 .124 (.345 (.340 .159 .002 (.265
.011 .079 1.000 .321 .582 .184 (.043 .064 .061 .394 .554 (.272 (.298 (.326 (.221 (.165 (.084 (.268
.445 .642 .321 1.000 (.062 (.230 .404 .372 .336 .234 (.094 (.193 (.066 (.259 (.327 .126 (.100 (.182
(.158 (.155 .582 (.062 1.000 .340 (.024 (.106 (.091 .098 .577 (.161 (.250 (.245 (.096 (.257 (.127 (.161
(.221 (.269 .184 (.230 .340 1.000 (.167 (.128 (.233 .476 .357 (.330 .347 (.235 (.198 .299 .476 (.329
.454 .720 (.043 .404 (.024 (.167 1.000 .110 .414 .058 (.104 (.164 .118 (.245 (.182 .063 (.006 (.159
.338 .303 .064 .372 (.106 (.128 .110 1.000 .413 .086 (.220 (.229 .232 (.247 (.330 .110 .025 (.277
.384 .676 .061 .336 (.091 (.233 .414 .413 1.000 (.046 (.182 (.080 .111 (.118 (.219 (.075 (.125 (.120
.167 .173 .394 .234 .098 .476 .058 .086 (.046 1.000 .151 (.615 .302 (.612 (.589 .499 .432 (.631
(.241 (.267 .554 (.094 .577 .357 (.104 (.220 (.182 .151 1.000 (.229 (.265 (.238 (.149 (.339 (.159 (.216
(.280 (.251 (.272 (.193 (.161 (.330 (.164 (.229 (.080 (.615 (.229 1.000 (.389 .806 .907 (.239 (.241 .838
.166 .124 (.298 (.066 (.250 .347 .118 .232 .111 .302 (.265 (.389 1.000 (.400 (.392 .554 .664 (.462
(.288 (.345 (.326 (.259 (.245 (.235 (.245 (.247 (.118 (.612 (.238 .806 (.400 1.000 .800 (.227 (.278 .917
(.335 (.340 (.221 (.327 (.096 (.198 (.182 (.330 (.219 (.589 (.149 .907 (.392 .800 1.000 (.238 (.217 .819
.198 .159 (.165 .126 (.257 .299 .063 .110 (.075 .499 (.339 (.239 .554 (.227 (.238 1.000 .693 (.183
.177 .002 (.084 (.100 (.127 .476 (.006 .025 (.125 .432 (.159 (.241 .664 (.278 (.217 .693 1.000 (.263
(.261 (.265 (.268 (.182 (.161 (.329 (.159 (.277 (.120 (.631 (.216 .838 (.462 .917 .819 (.183 (.263 1.000
AU
AG
CU
PB
ZN
NI
BI
AS
SB
FE
MN
BA
CR
AL
SR
GA
NB
SC
C#))e$at"#n
AU AG CU PB ZN NI BI AS SB FE MN BA CR AL SR GA NB SC
Communalities
1.000 .602
1.000 .897
1.000 .752
1.000 .631
1.000 .643
1.000 .679
1.000 .535
1.000 .403
1.000 .527
1.000 .719
1.000 .724
1.000 .861
1.000 .748
1.000 .853
1.000 .869
1.000 .796
1.000 .800
1.000 .901
AU
AG
CU
PB
ZN
NI
BI
AS
SB
FE
MN
BA
CR
AL
SR
GA
NB
SC
In"t"a$ E*t)a+t"#n
E*t)a+t"#n Met,#d- P)"n+".a$ C#/.#nent Ana$%&"&.
Total Variance Explained
5.510 30.610 30.610 5.510 30.610 30.610
3.439 19.103 49.713 3.439 19.103 49.713
2.796 15.531 65.244 2.796 15.531 65.244
1.196 6.644 71.888 1.196 6.644 71.888
.993 5.519 77.407
.881 4.895 82.301
.567 3.148 85.449
.498 2.767 88.216
.414 2.300 90.516
.378 2.101 92.617
.322 1.788 94.405
.292 1.621 96.026
.217 1.206 97.232
.173 .961 98.193
.151 .840 99.032
7.640E(02 .424 99.457
5.246E(02 .291 99.748
4.530E(02 .252 100.000
C#/.#nent
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
0#ta$
1 #2
3a)"an+e
C4/4$at"!
e 1 0#ta$
1 #2
3a)"an+e
C4/4$at"!
e 1
In"t"a$ E"5en!a$4e&
E*t)a+t"#n S4/& #2 S64a)ed
L#ad"n5&
E*t)a+t"#n Met,#d- P)"n+".a$ C#/.#nent Ana$%&"&.
0obinson 1illanueva rvillanueva2rnma.com.pe
9.
Component Matrix
a
.505 .566 5.705E(02 .155
.540 .708 .225 .231
.291 (.358 .650 .340
.434 .478 .357 .295
8.451E(02 (.531 .556 .210
.307 (.678 (.247 .255
.370 .531 .193 .281
.399 .375 5.507E(02 (.318
.300 .605 .259 (6.06E(02
.729 (.333 (9.43E(02 .261
6.578E(02 (.641 .551 6.921E(02
(.850 .249 (8.43E(02 .264
.543 (2.15E(03 (.656 (.151
(.871 .202 (.143 .180
(.869 9.902E(02 (.103 .305
.447 2.036E(02 (.676 .373
.436 (.194 (.685 .322
(.864 .243 (7.74E(02 .300
AU
AG
CU
PB
ZN
NI
BI
AS
SB
FE
MN
BA
CR
AL
SR
GA
NB
SC
1 2 3 4
C#/.#nent
E*t)a+t"#n Met,#d- P)"n+".a$ C#/.#nent Ana$%&"&.
4 +#/.#nent& e*t)a+ted.
a.
8.1./. )E&$ER1A "E #&S "A&S 2 "E #AS VARIA3#ES
A) Clculos num,ricos.4 "n primer lugar, se calcula separadamente, para cada una de las
- variables numricas #
j
la media aritmtica $m
j
& la desviacin t!pica $sj&. "l individuo en
general ficticio, tendr!a como valores las medias aritmticas respectivas L centro de
gravedad de la nube de puntos MgN ), es decir ' g + $m
.
: m
,
, ..., m
p
&.
En nuestro e(emplo 78e'es en 9ineral:, ! sera el valor promedio de los valores que se
encuentran en la columna -romedio de la tabla 7Estadstica Descriptiva:; as mismo, se
encuentran los valores de las desviaciones tpicas de las 18 variables ' donde los pesos
ponderados son todos i!uales a 1<69.
<as relaciones entre las p variables , a , son e#plicadas por sus covarianzas Sj( , o ms bien
por sus coeficientes de correlacin rj(, siendo p$p).&O, el coeficiente a calcular.
<as varianzas covarianzas se agrupan en matrices llamadas MPatrices 1arianzas L
@ovarianzasN, denotada por 1, el trmino ubicado en la interseccin de la j)sima fila ()
sima columna es la covarianza sj( : donde los trminos de la diagonal principal son las
varianzas s
,
j de las p variables.
0obinson 1illanueva rvillanueva2rnma.com.pe
9,

s
,
. s., .........s.p
.
s
,
,
1 +

s
,
p
De la misma manera los coeficientes de correlacin pueden agruparse en una matri5 .e
correlaci(n R, cuos elementos de la diagonal principal valen . , a que ' r $ #
j
: #
j
& + .
. r., .........r.p
0 + .

.
0 1 son matrices cuadradas, simtricas de orden p, a que '
sj( + s(j rj( + r(j . "n consecuencia, en una tabla resumen ser suficiente escribir la mitad
de los resultados.
Si denotamos por D.Os a la matriz diagonal siguiente '
.Os K
D.Os + .Os,

K .Osp
se obtiene la siguiente relacin matricial ' 0 + D.Os 1 D.Os
.e los resultados de la matriz de correlaci#n de nuestro e(emplo (ver 0i!ura 8.&.) podemos
comprobar que, por e(emplo, entre las variables )l ' Sc la asociaci#n lineal es mu' uerte (
coeiciente de correlaci#n, =.91>), en tanto, que la asociaci#n de una de ellas respecto a
una tercera variable cualquiera es evidentemente m"s dbil. En dic?a tabla e$isten 1@A
coeicientes de correlaci#n, dierentes que deben analizarse, el estudio completo de estas
relaciones & a & es un traba(o tedioso, el )4-, en este sentido, acilita la interpretaci#n de
la inormaci#n contenida en esta matriz.
<a matriz de varianza 1, es fcilmente e#plicable cuando la media aritmtica de las
variables es nula. Si este no es el caso se transformar cada variable #
j
en una variable
0obinson 1illanueva rvillanueva2rnma.com.pe
9-
centrada de la forma siguiente #
j
L m
j
. "sta transformacin permite desplazar el origen de
los ejes de la nube al centro de gravedad g.
En consecuencia las nuevas coordenadas centradas ser"n %
=,6=&; =,89>; =,>@&; =,6A1; =,6BA; =,6>9; =,@A@; =,B=A; =,@&>; =,>19; =,>&B; =,861; =,>B8;
=,8@A; =,869; =,>96; =,8==; =,9=1.
Si Q es una matriz de MnN l!neas MpN columnas, de datos centrados, se verifica la siguiente
relacin matricial '
1 + Q
t
DQ , donde Q
t
es la transpuesta de Q D la matriz diagonal de orden n pesos.
p. K
D + p,
K pn
= partir de este instante todas las variables las trataremos como variables centradas.
3) El campo .e los in.i6i.uos.4 @ada individuo definido por un punto de coordenadas p,
es considerado como un vector en el espacio vectorial 0
p
, a p dimensiones, llamado campo
de los individuos.
ei representa a un individuo ei es el vector de componentes. $#
.
i, #
,
i,......, #
p
i& .
3.1) Importancia .e la m,trica
R@mo medir la distancia entre dos individuosS. "sta pregunta fundamental debe ser
resuelta satisfactoriamente antes de todo estudio estad!stico, a que los resultados dependen
en gran medida de como se solucione esta interrogante.
"n f!sica, la distancia entre dos puntos se resuelve sin problemas aplicando el teorema de
6itgoras, donde las variables tienen las mismas unidades.
d
,
+ $ #
(
. ) #
(
, &
,
D $ #
j
. ) #
j
, &
,
"je j
0obinson 1illanueva rvillanueva2rnma.com.pe
97

#
j
. e.
#
j
, e,
#
(
. #
(
, "je (
"n estad!stica, no se procede de la misma manera, a que cada variable se e#presa en su
respectiva unidad, entonces Rcmo calcular la distancia entre los individuos, descrito por
tres parmetros como la edad, salario nmero de hijos o lees en =u $ppb&, @u $T& >i
$ppm&, por ejemploS
"n ambos casos, la frmula de 6itgoras es arbitraria. Si se quisiera e#presar cada variable
en su propia unidad, podr!amos aplicar la frmula'
d
,
+ a. $ #
.
. ) #
.
, &
,
D a, $ #
,
. ) #
,
, &
,
D.......D ap $ #
p
. ) #
p
, &
,

UU
Se ha multiplicado cada variable por Vaj $siendo aj positivo&, adems la frmula de
6itgoras es vlida slo si los ejes son perpendiculares.
"n estad!stica, slo por convencin, se representan las variables en ejes perpendiculares, no
e#iste impedimento alguno de representar dichas variables en ejes oblicuos, formando un
ngulo W, por ejemplo '
"je j
#
j
. e.

#
j
, e,
W
"je (
#
(
. #
(
,
<a frmula que permitir calcular la distancia entre dos individuos ser
d
,
+ $ #
(
. ) #
(
, &
,
D $ #
j
. ) #
j
, &
,
) , $ #
(
. ) #
(
, &

$ #
j
. ) #
j
, &

cosW
De manera general la distancia d, entre dos individuos se puede escribir como'
p p
d
,
$ e. : e, &

+ X % X m(j $ #
(
. ) #
(
, &

$ #
j
. ) #
j
, &



# j
Si P es la matriz de elementos m(j, entonces '
0obinson 1illanueva rvillanueva2rnma.com.pe
9Y
d
,
$e. : e, & + $e. ) e, &
t
P $e. ) e, &
Siendo P una matriz simtrica positiva.
=l aplicar la formula de 6itgoras la matriz P puede e#presarse como una matriz idntica
?. De esta manera el producto escalar de dos vectores e1 e/, se e#presa por '
e1.e/ + e
t
1 P e/
De esta forma el campo de individuos se e#presa como una estructura "uclidiana. <a matriz
P se conoce como la mtrica espacial.
"l producto escalar del vector e1 consigo mismo se denota por' 77e177
/
$ 77e177 $, que
representa la longitud del vector e1, se denomina norma $ .e e1.
<as mtricas ms usadas en el =@6 son las mtricas diagonales, que son los ponderadores
de las variables, en particular se utiliza la mtrica'
.Os
,
. K
P + D.Os
,
+ .Os
,
,
K .Os
,
p
@ada elemento de la diagonal ha sido dividido por su desviacin t!pica' una representacin
de este tipo, entre dos individuos, entre otra de sus ventajas es que las muestras no
dependen ms de las unidades iniciales, a que el cociente #
j
O sj es adimensional . 6or
ejemplo, si #
j
representa la edad de un individuo, se puede tambin utilizar como unidad el
mes o el a/o, si #
j
se multiplica por 4 o por .,, segn el caso, sj quedar multiplicado por
el mismo valor por tanto el cociente permanecer constante.
Este proceso da a cada variable el mismo valor, cualquiera sea la dispersi#n. En el
e(emplo 78e'es en 9ineral:, donde se constatan !randes dierencias entre las
desviaciones tpicas% =,=AC para la variable Sc ' @6,9C para el Dn, al usar 9 E 3
privile!iamos a los valores de la variable Dn, 'a que la dierencia entre estos individuos es
muc?o ma'or.
<a mtrica D .Os
,
, entonces restablece el equilibrio entre las variables, a todos les da como
valor de varianza la unidad.
"s conveniente utilizar una mtrica de la forma'
0obinson 1illanueva rvillanueva2rnma.com.pe
94
a. K
.
Da + a,
.
K an
@ada variable se multiplica por i
a
se utiliza luego la igualdad P + ?. "ste resultado
puede generalizarse a una mtrica P cualquiera de la manera siguiente' es demostrable que
para toda matriz simtrica, positiva P, e#iste una matriz I $en realidad son infinitas& tal que
P + I
t
I. "l producto escalar e1.e/ + e
t
1 P e/ puede escribirse como
e
t
1 I
t
I e/ 8$Ie1&
t
$I e/ & + Ie1 I e/ 9 esto no se ms que una transformacin de datos de la
matriz I, utilizando el producto escalar. "sto permite remplazar la tabla de datos Q por
E + Q
t
I a utilizar como mtrica la matriz unitaria ?.
3./) :C(mo calcular las coor.ena.as .e los in.i6i.uos so;re un nue6o e<e=
@onsiderando el sistema de ejes ortogonales que representan a las variables iniciales #
.
: #
,
,
..., #
p
. 6roectando los individuos sobre una recta A se crea una nueva variable c9 con
valores c., c,,..., cn que son las medidas algebraicas de las proecciones de los puntos ei
sobre esta recta.
Sea a el vector unitario de >9 de norma .. "l valor c. de la proeccin del individuo e1, es
igual al producto escalar de e1 a.
c. + e1
t
P a 8 (P a)
t
e1 , como P es simtrica u + Pa podemos escribir que'

p
c. + Zuj#
j
. "s decir, los valores de las n coordenadas de c se obtienen a travs de la

j+.
formula' c + Qu
c es la combinacin lineal de las p variables iniciales de los promedios del factor u.
#
,



e. # A

c.
a
#
.
c,
# e,
Si P + ?, entonces el factor u el vector unitario a son iguales.
0obinson 1illanueva rvillanueva2rnma.com.pe
93
Si el eje pasa por el origen, es decir, se confunde con el centro de gravedad de la nube de
puntos, en este caso c, es una variable centrada.
3.?) Inercia
?nercia de una nube de puntos, es el promedio del cuadrado de las distancias de n puntos al
centro de gravedad, es decir al origen'
@ + Z pi OO ei OO
,
P + Z pi e
t
i P ei

i i
"ste valor caracter!stico de la nube, mide en cierta forma, la distancia de los puntos al
centro de gravedad, es decir la dispersin normal de la nube. [na inercia nula o pr#ima a
cero, significa que todos los individuos son idnticos que se confunden con el centro de
gravedad g. Se puede demostrar que @, es igual al promedio de los cuadrados de las
n$n).&O, distancias diferentes entre los puntos de la nube.De esta manera el plano principal
es el plano de m#imo rendimiento inercial, del conjunto de los n puntos proectados sobre
l.
<a inercia con respecto al punto h diferente del centro de gravedad se define como '
@ h + Z pi d
,
$ei9 h&
Donde, de acuerdo a la frmula de \ughens' @ h + @ A d
,
$g9 h&
@ h es siempre superior a @9 el valor m!nimo se obtiene cuando h + g.
6odemos decir entonces, que buscar un plano de m#imo rendimiento inercial, equivale a
buscar un plano que pasando por la nube, el promedio de los cuadrados de las distancias de
esos puntos al plano sea m!nimo.
Sea h la proeccin de g sobre el plano, que es ahora el centro de gravedad de la
proeccin de los puntos de la nube. "n el tringulo ei : fi : h, recto en fi . Se verifica que'
d
,
$ei:fi& + d
,
$ei:h& L d
,
$fi:h& Z pi d
,
$ei9 fi& + @ h ) Z pi d
,
$ei9 fi&
g
# ei
fi h
0obinson 1illanueva rvillanueva2rnma.com.pe
99
@omo @ h + @ A d
,
$g9 h& , el rendimiento m!nimo del promedio del cuadrado de las
distancias entre ei fi, se da cuando g + h, cuando la inercia de la nube proectada
Z pi d
,
$fi:*& sea m#ima.
"n lo sucesivo, supondremos que el plano principal fundamentalmente los ejes
principales pasan por g. Se demuestra que @ se e#presa como'
@ 8 ra5a ($V)
Donde la traza, designa la suma de los elementos diagonales de una matriz. Se deduce que '
) Si P + ? , la inercia es igual a la suma de las varianzas, de las p variables.
) Si P + D .Os
,
'
Iraza P1 + Iraza $D.Os
,
1& + traza $D.Os 1D.Os& + traza 0 + p
<a inercia es igual entonces al nmero de variables:
) Si P es una matriz cualquiera, podemos decir que la inercia es igual a la suma de
las varianzas de las variables transformadas de la matriz I, donde P + I
t
I. "n
efecto '
Iraza P1 + Iraza I
t
IQ
t
DQ + Iraza IQ
t
DQI
t
+ Iraza E
t
DE
Sabemos que, al aplicar el criterio de e$tracci#n de actores, la nube de puntos pro'ectada
sobre el primer actor sure menor deormaci#n. Es decir, el primer factor es aquel en que
mejor se proyecta la variabilidad de la muestra. .e i!ual manera el se!undo me(or es el
se!undo ' as sucesivamente ?asta lle!ar al Fltimo. 8a variabilidad total e$plicada por un
actor viene dada por el autovalor o 7valor propio: correspondiente (7ei!envalue:). 8a
suma de todos los valores propios coincide con el nFmero de variables observadas
(@.@1GA.BA9G&.>96G1.196G ... G =.=B@A E 18). 8a raz#n radica en que el an"lisis se
realiza sobre una transormaci#n de las p variables, de tal orma que la variabilidad total
de la nube, considerando los valores transormados es p.
4omo el ei!envalue asociado al primer actor es @,@1, el porcenta(e de variabilidad total
de la muestra e$plicado por dic?o actor (7C o 1ariance:) es%
1==H(@,@1<18) E A=,61C
.e la misma manera el porcenta(e correspondiente al se!undo actor es 19,1=AC, por
tanto el porcenta(e de variabilidad total de la muestra e$plicado por los dos primeros
actores (4umulative C) es B9,>1AC.
.e esta manera la variabilidad total de la muestra estar" perectamente e$plicada
(4umulative C E 1==) ' tambin lo estar" la variabilidad de cada variable en particular.
En la tabla communalities la columna que corresponde a la inormaci#n relativa a cada
variable en la soluci#n inicial todas son i!uales a 1, esto se debe a que el con(unto de
0obinson 1illanueva rvillanueva2rnma.com.pe
9J
variables coincide con el de todos los posibles ' donde la variabilidad de todas ' cada una
de las variables est" totalmente e$plicada.
La comunalidad, es la proporci#n de variabilidad de una variable e$plicada por el
con(unto de los * primeros actores.
El si!uiente ob(etivo es determinar el valor * de tal manera que, al pro'ectar la nube de
puntos en el subespacio correspondiente, permita interpretar las relaciones entre las
variables. El inconveniente que sur!e en la elecci#n de * es que cuan menor sea su valor la
calidad de la representaci#n disminu'e, es decir, si * es peque+o la soluci#n ser" "cil de
analizar pero ser" poco coniable, en cambio si es !rande suceder" lo contrario.
8o ideal sera que los ei!envalues correspondientes a los * primeros actores, con *
peque+o, ueran mu' !randes. .ic?a situaci#n se dar" cuando las variables est"n
uertemente correlacionadas.
Se suele usar el criterio de Kaiser para determinar el valor de *, se!Fn el cual se
conservan aquellos actores cu'o valor propio sea superior a la unidad.
.e acuerdo al criterio de 6aiser, en nuestro e(emplo, conservaremos los * E B primeros
actores (7E$traction Sums o Squared 8oadin!s:). 5bservemos que, al reducir el espacio
actorial a un subespacio de B dimensiones, la calidad de representaci#n de toda la
muestra se reduce a >1,88C). Este valor !lobal se traduce en que, aunque la calidad de
representaci#n de al!una variable es mu' buena, para otras no lo es tanto.. -or e(emplo,
tanto para el Sc, Sr, )l, )s, Ia ' )! la comunalidad es superior a =,8, mientras que para el
)s es =,B=A. Ia(o estas condiciones, si represent"ramos el con(unto de variables sobre el
subespacio !enerado por los B primeros actores, la ubicaci#n del Sc, Sr, )l, )s, Ia ' )!
sera correcta ' por tanto posible de interpretar la relaci#n e$istente entre ellas. Sin
embar!o, para poder interpretar las relaciones con las restantes variables, o las de estas
entre s, sera conveniente recurrir a un quinto actor.
8a soluci#n de los @ primeros actores se solicita en el cuadro de di"lo!o si!uiente%
)nal'ze .ata /eduction 0actor
1ariable% au, a!, 2., sc (18 variables)
E$traction Jumber o actors% @ 4ontinue
/otation 9et?od%1arima$ 9arcar% /otated solution K 8oadin! plot(s) 4ontinue
5ptions 4oeicient% .ispla' 0ormat marcar% Sorted b' size Suppress absolute
values less t?an% =,& 4ontinue
Scores Save as variables 4ontinue
56
'i+ura 8.?. 'actor Anal0sis
0obinson 1illanueva rvillanueva2rnma.com.pe
JK
Communalities
1.000 .603
1.000 .925
1.000 .851
1.000 .763
1.000 .661
1.000 .692
1.000 .820
1.000 .654
1.000 .537
1.000 .763
1.000 .749
1.000 .865
1.000 .776
1.000 .863
1.000 .869
1.000 .833
1.000 .800
1.000 .908
AU
AG
CU
PB
ZN
NI
BI
AS
SB
FE
MN
BA
CR
AL
SR
GA
NB
SC
In"t"a$ E*t)a+t"#n
E*t)a+t"#n Met,#d- P)"n+".a$ C#/.#nent Ana$%&"&.

Total Variance Explained
5.510 30.610 30.610 5.510 30.610 30.610 4.098 22.769 22.769
3.439 19.103 49.713 3.439 19.103 49.713 3.161 17.563 40.332
2.796 15.531 65.244 2.796 15.531 65.244 2.647 14.708 55.040
1.196 6.644 71.888 1.196 6.644 71.888 2.599 14.441 69.481
.993 5.519 77.407 .993 5.519 77.407 1.427 7.926 77.407
.881 4.895 82.301
.567 3.148 85.449
.498 2.767 88.216
.414 2.300 90.516
.378 2.101 92.617
.322 1.788 94.405
.292 1.621 96.026
.217 1.206 97.232
.173 .961 98.193
.151 .840 99.032
7.640E(02 .424 99.457
5.246E(02 .291 99.748
4.530E(02 .252 100.000
C#/.#nent
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
0#ta$
1 #2
3a)"an+e
C4/4$at"!
e 1 0#ta$
1 #2
3a)"an+e
C4/4$at"!
e 1 0#ta$
1 #2
3a)"an+e
C4/4$at"!
e 1
In"t"a$ E"5en!a$4e&
E*t)a+t"#n S4/& #2 S64a)ed
L#ad"n5& R#tat"#n S4/& #2 S64a)ed L#ad"n5&
E*t)a+t"#n Met,#d- P)"n+".a$ C#/.#nent Ana$%&"&.
0obinson 1illanueva rvillanueva2rnma.com.pe
J.
Component Matrix
a
(.871 .202
(.869 .305
(.864 .243 .300
(.850 .249 .264
.729 (.333 .261 .210
.540 .708 .225 .231
.307 (.678 (.247 .255
(.641 .551
.300 .605 .259
.505 .566
.434 .478 .357 .295 .363
.436 (.685 .322
.447 (.676 .373
.543 (.656
.291 (.358 .650 .340 .315
(.531 .556 .210
.370 .531 .281 (.533
.399 .375 (.318 .501
AL
SR
SC
BA
FE
AG
NI
MN
SB
AU
PB
NB
GA
CR
CU
ZN
BI
AS
1 2 3 4 5
C#/.#nent
E*t)a+t"#n Met,#d- P)"n+".a$ C#/.#nent Ana$%&"&.
5 +#/.#nent& e*t)a+ted.
a.
)l considerar el quinto actor, la calidad de representaci#n de la muestra (4umulative C)
en la tabla 7Lotal 1ariance E$plained: aumenta ?asta >>,B=>C, lo que implica un
incremento de @,@C, este incremento !lobal se lee en un incremento !eneralizado en
la calidad de representaci#n de las variables, e$cepto en el caso de las variables% )u,
)!, Dn, Ji, Ii, )s, Sb, 9n, Ia, 4r, )l, Sr, Ia, Jb ' Sc para los cuales el incremento es
nulo o insi!niicante ' que estaban bien representadas en la soluci#n anterior. En
particular las peores representadas en la soluci#n anterior, en ese orden, son el Ii,
)s ' 4u, por e(emplo el bismuto ?a e$perimentado un incremento de &8,@C (de =,@A@
a =,8&).
8as pro'ecciones de cada una de las p variables sobre los * primeros actores
denominadas saturaciones, se presentan en la matriz de componentes (74omponent
9atriz:). 4abe mencionar que dos variables que presentan sus saturaciones parecidas en
todos los actores, estar"n correlacionadas entre s, siempre ' cuando estn bien
representadas. Se veriica que la suma de los cuadrados de las saturaciones en un mismo
actor coincide con el valor propio (ei!envalue) correspondiente. -or e(emplo para el
primer actor%
(,=.8>1)& G (,=.869)& G ... G (=.A99)& E @,@1.
.el mismo modo, la suma de los cuadrados de las saturaciones sobre los cinco primeros
actores de una misma variable coincide con la comunalidad correspondiente, por e(emplo
para la variable )s%
0obinson 1illanueva rvillanueva2rnma.com.pe
J,
(=.A99)
&
G (=.A>@)
&
G (,=.A18)
&
G (=.@=1)
&
E =,6@
Si *Ep, !eneralizando lo anterior, la suma de los cuadrados de las saturaciones a lo lar!o
de todos los posibles actores seria la unidad. Se puede deducir entonces que, el cuadrado
de la saturaci#n sobre un actor puede ser considerado como una medida de la calidad de
la representaci#n de la variable sobre dic?o actor. En el caso del )4-, la saturaci#n de
una variable sobre un actor toma valores entre G1 ' M1 ' su valor coincide con la
correlaci#n entre la variable ' el actor.
8.1.?. E# CA$P& "E #AS VARIA3#ES
@ada variable #
j
, es una lista de n valores numricos' #
j
es considerado como un vector a n
dimensiones, llamado campo de variables, denotado por 0
n
.
A) #a $,trica.4 6ara estudiar la pro#imidad entre las variables se escoge como solucin, la
matriz diagonal de pesos D por las siguientes razones '
"l producto escalar de dos variables #
j
#
(
no es ms que la covarianza sj( a que las
variables son centradas. <a norma de una variable es la varianza OOB
<
OO
,
D + s
,
j
"n otras palabras la longitud de una variable es igual a la desviacin t!pica .
"n el espacio euclidiano, el ngulo W definido entre dos vectores por sus cosenos, es igual al
cociente del producto escalar por el producto de sus normas respectivas
* (
(*
* (
* (
(*
s s
s
$ $
$ $
= =
.
cos
El coseno .el n+ulo entre .os 6aria;les centra.as9 no es ms -ue su coeficiente .e
correlaci(n lineal.
3) Varia;les +enera.as por la ta;la .e .atos .4 Si #
.
, #
,
,......, #
p
son los caracteres
medidos sobre n individuos se pueden reducir nuevas variables por combinacin
lineal del tipo ' c + u. #
.
D u,#
,
D .... D up #
p
=nteriormente, hemos visto que esto conduce a escoger un nuevo eje en el campo de los
individuos. "l conjunto de todas las variables que uno puede construir, segn tal
procedimiento, nos conduce a formar un sub)espacio vectorial ] en el campo de las
variables. Si no e#iste ninguna relacin lineal entre las variables #
j
, este sub)espacio tendr
dimensin p, en caso contrario es de dimensin inferior.
=nteriormente, se ha dicho que todo carcter c, es una combinacin lineal de las variables
iniciales, pudindose obtener c de acuerdo a la frmula c + Qu, donde u es el factor
asociado a c.
<a varianza se deduce, entonces fcilmente de acuerdo a ' s
,
c + c
t
Dc + u
t
#
t
D#u
s
,
c + u
t
1u .
0obinson 1illanueva rvillanueva2rnma.com.pe
J-
8.1.C. 3DSEFE"A "E EGES C&$P&NENES 2 'AC&RES PRINCIPA#ES
"l primer eje principal A. , se ha definido como el promedio de los cuadrados de las
distancias entre las proecciones de los puntos de la nube.
# e.
c.
c,
a
o A.
# e-
# e,
"sto equivale al rendimiento m#imo inercial de las proecciones cuo valor es Z pi c
,
i ,
donde ci son los valores de las proecciones ei sobre A , a que se ha hecho pasar A por el
centro de gravedad de la nube.
A. , es el eje de alargamiento de la nube en el sentido que sobre este eje, ci, son los ms
dispersos posibles, con relacin a los otros '
c es una combinacin lineal de los #
j
de m#ima varianza.
6ara encontrar e#pl!citamente factores componentes principales demostrarlos, siempre
es posible volver al caso que P + ? , razonando en la tabla transformada E + Q
t
I con P
+ I
t
I . "n efecto, la primera componente principal de E ser la misma que la de Q, a que
las combinaciones lineales de
j
son las mismas que las de #
j
' la combinacin de los
j
de
m#ima varianza, definirn automticamente la combinacin de los #
j
de varianza m#ima.
Si c se e#presa bajo la forma de c + Ev, a que E+Q
t
I , entonces c + Qu , con u+ I
t
1 .
Sea 1 la matriz de varianzas, asociada a la tabla E, que es igual a IQ
t
DQI
t
+ I1
t
I , donde
1 es la matriz de las varianzas de Q. <a componente principal c tiene por varianza v
t
1v
el vector 6 es entonces igual a un vector unitario del eje principal. "s necesario entonces
encontrar v de norma . tal que v
t
1v sea m#imo. "n tal sentido el cociente v
t
1v O v
t
v
ser m#imo. =l valor se llega cuando las derivadas, con respecto a cada una de las
componentes, son nulas. "l conjunto de las derivadas de v
t
1v con respecto a las
componentes v., v,,..., vp forman un vector igual a ,1v.
Despus de las frmulas de derivacin usuales, la derivada del cociente es nula si '
, $v
t
v&1v L , $v
t
1v&v + K, siendo' 1v + $v
t
1v&v + ^v
Donde v es un vector propio de 1, su valor propio ^ debe ser lo suficientemente grande,
puesto que representa la cantidad a ma#imizar. <a varianza de c vale entonces ^ puesto que
v es de norma .. @omo una matriz de varianza es simtrica semi)definida positiva, ella
posee p vectores propios ortogonales, , a ,, siendo sus valores propios todos positivos o
nulos.
0obinson 1illanueva rvillanueva2rnma.com.pe
J7
<os ejes factores principales v., v,, ...., vp, cuando P + ? son los vectores propios ^., ^,,
^-.....^n , escritos en orden decreciente.
=l realizar el cambio de ejes, la matriz varianza de los componentes principales, 1c, ser
igual a'

^. K
1c + ^,
K ^p
<as componentes principales, son no correlacionadas dos a dos.
"l =@6, reemplaza a los p caracteres iniciales, por las variables no correlacionadas de
varianza m#ima en orden decreciente.
6ara encontrar directamente, ejes factores componentes en funcin de #, ser suficiente
escribir que ' 1v + ^v + I1I
t
v multiplicar a la izquierda por I
t
, de donde '
I
t
I1I
t
v + ^I
t
v, siendo P1u + ^u. "l eje a es tal que u + Pa , donde P1Pa + ^Pa,
puesto que P es regular.
<os ejes principales son los vectores propios de 1P, factores principales de P1.
"n cuanto a los componentes principales que se obtienen por c + Qu se remarca que
P1 + PQ
t
DQ: PQ
t
DQu + ^u, multiplicando a la izquierda por Q, se demuestra que c es
un vector propio de QPQ
t
D.
<a suma de los valores propios ^.D ^,D.........D^p , es una constante igual a la traza de 1
de P1' es la inercia total @ .
"l cociente ^(O@ se denomina Mparte de inerciaN $o de varianza& e#plicada por el eje n
K
(.
$^.D ^,& O@ 9 a parte de la inercia acumulada de los dos primeros ejes, mide el aplastamiento
de la nube sobre el plano principal. @uanto ms grande sea el valor de este cociente, mejor
es la representacin de la nube sobre el plano. "l nmero de valores propios no nulos, da la
dimensin del espacio, en los cuales las observaciones son reales. [n valor propio nulo,
muestra que e#iste una relacin lineal entre las variables iniciales.
@on P + D.Os
,
, las componentes principales tienen las variables ms ligadas a los #
j
, en
p
el sentido que Z r
,
$c: #
j
& es m#imo.

j+.
8a rotaci#n varima$ es un tipo de rotaci#n orto!onal de los actores, que trata de
minimizar el nFmero de variables con saturaciones altas en un actor. El ob(etivo de la
rotaci#n de los actores ori!inales es obtener una soluci#n me(or interpretable, en el
sentido que las variables uertemente correlacionadas entre s presenten saturaciones altas
(en valor absoluto) sobre un mismo actor ' ba(as en el resto. Si dos o m"s variables
presentan saturaciones altas, cercanas a uno en valor absoluto, sobre un mismo actor
0obinson 1illanueva rvillanueva2rnma.com.pe
JY
entonces estar"n correlacionadas entre s (positivamente si tienen si!no positivo '
ne!ativamente si tienen si!no ne!ativo), en cambio si las saturaciones altas se presentan
en dos actores distintos, estar"n no correlacionadas.
En nuestro e(emplo el Sc, Ia, Sr ' )l est"n correlacionados entre s positivamente en el
actor 1, en cambio en el mismo actor est"n correlacionados ne!ativamente el 9n ' )s.
Rotated Component Matrix
a
.926
.895
.883
.865 (.209
.930
.865 (.253
.697 .228
.641 (.226
.601 .233 .584
.863 (.233
.849
(.499 .607 .330
(.290 (.307 .559 .318 (.316
(.491 .528 (.488
.864 .283
.754 (.223
(.243 (.214 .734 (.271
(.322 (.211 .688
SC
BA
SR
AL
AG
BI
AU
SB
PB
GA
NB
FE
NI
CR
CU
ZN
MN
AS
1 2 3 4 5
C#/.#nent
E*t)a+t"#n Met,#d- P)"n+".a$ C#/.#nent Ana$%&"&.
R#tat"#n Met,#d- 3a)"/a* 7"t, 8a"&e) N#)/a$"9at"#n.
R#tat"#n +#n!e)5ed "n 9 "te)at"#n&.
a.
Component Transformation Matrix
(.797 .400 .398 .108 .185
.265 .727 (.208 (.508 .317
(.065 .267 (.649 .697 .133
.522 .359 .596 .484 (.094
.132 (.334 .147 .102 .916
C#/.#nent
1
2
3
4
5
1 2 3 4 5
E*t)a+t"#n Met,#d- P)"n+".a$ C#/.#nent Ana$%&"&.
R#tat"#n Met,#d- 3a)"/a* 7"t, 8a"&e) N#)/a$"9at"#n.
=nalizando el grfico podemos observar que las variables de un mismo subconjunto estn
pr#imas entre s! $ver interpretaciones de los resultados&
0obinson 1illanueva rvillanueva2rnma.com.pe
J4
'i+ura 8.C. Soluci(n so;re H factores
8.1.H. PFNFACI&NES 'AC&RIA#ES
"l aplicar el =@6 al conjunto de las .9 variables, =u, =g, ...,Sc , observadas en 4J
muestras, se ha pasado a un conjunto de cuatro nuevas variables, no directamente
observables, llamadas puntuaciones factoriales, *ac.U., *ac,U., *ac-U. *ac7U., de tal
manera que'
<a variabilidad total de la muestra est representada al 33,7K3T.
@ada variable est representada proporcionalmente a la comunalidad sobre el
conjunto de los cuatro factores.
"l primer factor, *acU., representa informacin de las variables Sc, _a, Sr =l.
"l factor, *ac.U., representa informacin de las variables =g, _i =u.
"l *ac.U,, representa informacin del >b 8a
"l *ac.U-, representa informacin del @u, `n Pn.
<a informacin del =l est representada en los factores *acU. *ac.U., el Sb en los
factores *ac.U. *ac.U, el 6b en *ac.U, *ac.U-..
<a informacin del >i est representado en todos los factores.
0obinson 1illanueva rvillanueva2rnma.com.pe
J3
C#/.#nent P$#t "n R#tated S.a+e
&)
&+
a$
:a
5a
n:
C#/.#nent 2
1.0 1.0
n"
(.5
2e
0.0
+)
.5 .5
.5
+4
.:
9n
a4
1.0
/n
:"
a&
a5
C#/.#nent 3 C#/.#nent 1
0.0 0.0
&:
(.5 (.5
<as puntuaciones factoriales permiten analizar las similitudes entre los individuos respecto
a sus puntuaciones en el conjunto de variables observadas.
<a representacin grfica de las 4J muestras en el espacio tridimensional generado por las
nuevas varibles o factores *ac., *ac.U., *ac.U, *ac.U- se solicitan de acuerdo al
dilogo'
Nrap?s Scatter
.einir A.
.eine )$is O % 0ac&P1
)$is Q % 0ac1P1
)$is D . 0acAP1
56
4 3
REGR 2a+t#) &+#)e 2 2#) ana$%&"& 1
(2
3
0
2
2
2
4
1
6
1
REGR 2a+t#) &+#)e 3 2#) ana$%&"& 1 REGR 2a+t#) &+#)e 1 2#) ana$%&"& 1
0 0
(1
(1
(2
(2 (3
'i+ura 8.H.Representaci(n .e los casos so;re la soluci(n con factores
Si comparamos las *iguras 9,7 9,Y , en ambos grafos las nubes de puntos forman un
tringulo. "n la primera, los vrtices corresponden a cada uno de los subconjuntos de
variables asociados con cada uno de los factores, si esto ocurre quiere decir que las
muestras que se encuentren ubicadas en los vrtices del segundo grfico sern tales que sus
puntuaciones en el conjunto de las variables en el vrtice correspondiente en el primero
sern altas.
0obinson 1illanueva rvillanueva2rnma.com.pe
J9
=l homogenizar superponer los dos grficos , una muestra cua posicin fuera pr#ima a
la de una variable se caracterizar!a por presentar una puntuacin alta en dicha variable, si se
encontrara en el e#tremo opuesto del eje, se caracterizar!a por presentar una puntuacin
baja si se encontrara en cualquier otra posicin, no se caracterizar!a por presentar un valor
e#tremo en dicha variable. "n otras palabras, a travs de las puntuaciones adems de
determinar las semejanzas entre las muestras entre s! respecto al resultado geoqu!mico
podemos decir el sentido en que estas semejanzas lo son.
8./. #&S RESF#A"&S 2 SF INERPREACI!N
Iomando el ejemplo M<ees en PineralN daremos algunos principios generales de la
interpretacin de los resultados numricos grficos del =@6.
"n el anlisis de nuestro ejemplo se ha utilizado la mtrica D.OS reduciendo centrando las
.9 variables. "n la a;la Iotal Variance EBplaine.J4p+ina ::=, en la columna MIotalN
correspondiente a los valores propios iniciales de la varianza total e#plicada, la suma de
estos valores es igual al nmero de variables puesto que P + D.OS, en este caso .9,
verificndose que el ltimo valor propio tiende a ser K $K.K7Y-&, es lo esperado debido a que
las variables estn ligadas por una relacin lineal $ la suma de todos ellos es igual a .KK&.
<os cuatro primeros valores propios representan apro#imadamente 3,T de la inercia $T de
la varianza&, en este caso podr!amos resumir los datos a travs de estos valores)
componentes principales.
"s dif!cil responder a la interrogante R a partir de que porcentaje se pueden eliminar las
componentes principales restantesS: esto depender' en primer lugar, del nmero de
variables' un primer factor e#plicando el 7YT de la MinerciaN con l9 variables es ms
interesante si el valor fuera de YT .
<os resultados de la *igura 9.4 audan a definir el nmero de componentes principales o
factores a estudiar.
Si 0 contiene trminos que difieren mu poco de K, los valores de los valores propios no
sern altos.
<a reduccin eficaz del nmero de ejes principales se manifiesta cuando las variables se
encuentran bien correlacionadas.
"l clculo de componentes principales de nuestro ejemplo se ha determinado rotando los
ejes usando el mtodo 1arima# con la normalizacin de aaiser, esta rotacin ha
convergido en 4 iteraciones, estos resultados se leen en la Iabla I $atri5 .e componentes
rota.asJ.
?nterpretando estos resultados los grficos respectivos $*iguras' 9.3, 9.9 9.J& es
evidente observar Y grupos bien diferenciados'
0obinson 1illanueva rvillanueva2rnma.com.pe
JJ
En el 'actor 1'
...................................................................................................................................................
..........................

'actor /'
...................................................................................................................................................
..................
En el 'actor ? K
...................................................................................................................................................
........................
*inalmente, en el 'actor C K ......................................

S+)ee P$#t
C#/.#nent N4/:e)
18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1
E
"
5
e
n
!
a
$
4
e
6
5
4
3
2
1
0
'i+ura 8.L. 0elacin entre los valores propios el nmero de componentes

0obinson 1illanueva rvillanueva2rnma.com.pe
.KK

C#/.#nent P$#t "n R#tated S.a+e
C#/.#nent 1
1.0 .8 .6 .4 .2 (.0 (.2 (.4 (.6
C
#
/
.
#
n
e
n
t

2
1.0
.8
.6
.4
.2
0.0
(.2
(.4
&+
n:
5a
&)
a$
+)
:a
/n
2 e
&:
a&
:"
n"
9n
.:
+4
a5
a4
'i+ura 8.M. "l grupo del Sc es opuesto al grupo del =s viceversa

C#/.#nent P$#t "n R#tated S.a+e
C#/.#nent 3
1.0 .8 .6 .4 .2 0.0 (.2 (.4
C
#
/
.
#
n
e
n
t

4
1.0
.8
.6
.4
.2
(.0
(.2
(.4
(.6
&+ n:
5a
&)
a$
+)
:a
/n
2e
&:
a&
:"
n"
9n
.:
+4
a5
a4
'i+ura 8.8. <a componente - agrupa al >b, 8a relacionado con el >i *e
en la componente 7 el @u, `n Pn se opone al @r.
0obinson 1illanueva rvillanueva2rnma.com.pe
.K.

C#/.#nent P$#t "n R#tated S.a+e
&)
&+
n:
:a
a$
5a
n"
C
#
/
.
#
n
e
n
t

2
1.0 1.0
(.5
+)
0.0
2e
.5 .5
9n
.5
/n
:"
+4
1.0
a4
.:
a5
C#/.#nent 3 C#/.#nent 1
0.0 0.0
&:
a&
(.5 (.5
'i+ura 8.N.8rfico tridimensional mostrando las relaciones
de las componentes .,, -
[n estudio detallado de los aspectos geolgicos mineralgicos permitir interpretar de
manera ptima los grupos de elementos asociados, producto de este anlisis.
0obinson 1illanueva rvillanueva2rnma.com.pe
.K,