Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Factorialec PDF
Factorialec PDF
ANLISIS FACTORIAL
Presentacin:
El Anlisis Factorial es el nombre genrico que se da a una
clase de mtodos estadsticos multivariantes cuyo propsito
principal es sacar a la luz la estructura subyacente en una matriz de
datos. Analiza la estructura de las interrelaciones entre un gran
nmero de variables no exigiendo ninguna distincin entre variables
dependientes e independientes. Utilizando esta informacin calcula
un conjunto de dimensiones latentes, conocidas como FACTORES,
que buscan explicar dichas interrelaciones. Es, por lo tanto, una
tcnica de reduccin de datos dado que si se cumplen sus hiptesis,
la informacin contenida en la matriz de datos puede expresarse, sin
mucha
distorsin,
en
un
nmero
menor
de
dimensiones
Introduccin
TIENEN
EN
COMN
TODOS
ESTOS
Objetivos
1) Definir qu es el Anlisis Factorial y cules son sus objetivos.
2) Indicar cules son las etapas a seguir en la realizacin de un
Anlisis Factorial.
3) Formular el modelo del Anlisis Factorial e interpretar el
significado de sus parmetros
4) Analizar el grado de deseabilidad de un Anlisis Factorial sobre
un conjunto de datos a partir del anlisis de la matriz de
correlacin de las variables observadas.
5) Seleccionar el mtodo apropiado para la extraccin de los
factores.
6) Determinar el nmero de factores a extraer.
7) Aprender a interpretar el significado de un factor.
8) Conocer distintos mtodos de rotacin de factores
9) Conocer distintos mtodos de clculo de las puntuaciones
factoriales y cmo usarlas para interpretar los resultados
obtenidos
10) Validar el modelo resultante de un Anlisis Factorial
Apartados
1) Qu es un Anlisis Factorial?
2) Cmo realizar un Anlisis Factorial?
3) Formulacin del Problema.
4) Anlisis de la Matriz de Correlacin.
5) Extraccin de Factores.
6) Determinacin del Nmero de Factores.
7) Interpretacin de Factores.
8) Rotacin de Factores
9) Clculo de Puntuaciones Factoriales.
10) Validacin del Modelo
Contenidos
1.- QU ES UN ANLISIS FACTORIAL?
El Anlisis Factorial es una tcnica estadstica multivariante
cuyo principal propsito es sintetizar las interrelaciones observadas
entre un conjunto de variables en una forma concisa y segura como
una ayuda a la construccin de nuevos conceptos y teoras. Para ello
utiliza un conjunto de variables aleatorias inobservables, que
llamaremos factores comunes, de forma que todas las covarianzas o
correlaciones son explicadas por dichos factores y cualquier porcin
de la varianza inexplicada por los factores comunes se asigna a
trminos de error residuales que llamaremos factores nicos o
especficos.
El Anlisis Factorial puede ser exploratorio o confirmatorio.
El anlisis exploratorio se caracteriza porque no se conocen a
priori el nmero de factores y es en la aplicacin emprica donde se
determina este nmero. Por el contrario, en el anlisis de tipo
confirmatorio los factores estn fijados a priori, utilizndose
contrastes de hiptesis para su corroboracin.
En esta leccin nos centraremos en el Anlisis Factorial
Exploratorio dado que el Anlisis Factorial Confirmatorio se suele
estudiar como un caso particular de los Modelos de Ecuaciones
Estructurales. Remitimos al lector interesado en ste ltimo al libro
de Kline (1998) en el que se hace una buena exposicin de dicho
tipo de modelos.
EXTRACCIN DE FACTORES
ROTACIN DE FACTORES
INTERPRETACIN DE FACTORES
CLCULO DE PUNTUACIONES
FACTORIALES
SELECCIN DE LAS
VARIABLES REPRESENTATIVAS
Sujetos
1
2
Variables
X1 X2
x11
x21
x12
x22
Xp
x1p
x2p
..
xn1
xn2
xnp
X2
,f=
donde x =
...
X
p
F1
F2
... , u =
Fk
(1)
u1
u2
... , X es la matriz de datos,
u
p
a 11 a 12 ...a 1k
a 21 a 22 ...a 2k
es la matriz de cargas factoriales y
A =
..................
a a ...a
p1 p2 pk
f11 f12 ...f1k
f
f
...f
21 22 2k
F =
es la matriz de puntuaciones factoriales
..................
f f ...f
p1 p2 pk
a
k
Var (Xi) =
2
ij
+ i = h i2 + i; i=1,,p
j=1
puede
descomponerse
en
dos
partes:
una,
la
a a
k
ij
j=1
lj
il
por lo que son los factores comunes los que explican las relaciones
existentes entre las variables del problema. Es por esta razn que los
factores que tienen inters y son susceptibles de interpretacin
experimental son los factores comunes. Los factores nicos se
incluyen en el modelo dada la imposibilidad de expresar, en general,
p variables en funcin de un nmero ms reducido k de factores.
Se tiene que:
Var[Mat]= 1 = Var[0.8F1+0.2F2+uMat] =
= 0.82Var[F1]+0.22Var[F2]+Var[uMat]+2x0.8x0.2 Cov(F1,F2)+
+2x0.8 Cov(F1,uMat) + 2x0.2 Cov(F2,uMat) = 0.68+Mat
Se sigue, por lo tanto, que la comunalidad del resultado en
matemticas es h 2Mat = 0.68 y su especificidad es Mat = 0.36
Siguiendo el mismo razonamiento se tiene que:
0.8 0.2
0.7 0.3
0.6 0.3
0.15 0.82
0.25 0.85
0.62
1
0.51
0
.
38
0
.
351
0
.
43
0.54 0.51
1
0.36 0.336 0.405
0
.
32
0
.
38
0
.
36
1
0.686
0.73
Frmula
Ratio1
Activo Total
AT
=
Recursos Propios RP
Beneficios antes de Impuestos BAIT
=
Recursos Propios
RP
Beneficios Netos BN
=
Recursos Propios RP
Cash Flow
CF
=
Deuda a Largo Plazo DLP
Cash Flow
CF
=
Recursos Propios RP
Deuda a Largo Plazo DLP
=
Activo Total
AT
Deuda a Largo Plazo DLP
=
Capital Propio
CP
Deuda Total
DT
=
Recursos Propios RP
Pasivo Circulante PC
=
Deuda Total
RP
Ratio2
Ratio3
Ratio4
Ratio5
Ratio6
Ratio7
Ratio8
Ratio9
Abreviatura
Austria
AUT
Blgica
BEL
Dinamarca
DNK
Finlandia
FIN
Francia
FRA
Alemania
GER
Italia
ITA
Holanda
NLD
Portugal
POR
Espaa
SPA
Suecia
SWE
log
j=1
( )
j
rij
ji i j
KMO =
2
2
rij + rij
ji i j
ji i j ( p)
donde rij(p) es el coeficiente de correlacin parcial entre las variables
Xi y Xj eliminando la influencia del resto de las variables.
KMO es un ndice que toma valores entre 0 y 1 y que se utiliza
para comparar las magnitudes de los coeficientes de correlacin
observados con las magnitudes de los coeficientes de correlacin
parcial de forma que, cuanto ms pequeo sea su valor, mayor es el
rij
i j
; i=1,...,p
MSA i =
2
2
r + r
i j ij i j ij ( p)
Un valor bajo de MSAi indica que las hiptesis hechas por el
modelo del Anlisis Factorial son poco compatibles para el caso de
la variable Xi. De esta forma si el KMO es bajo es posible localizar
las variables responsables de dichos valores y, si el Anlisis
Factorial resultara poco exitoso, dichas variables podran ser
eliminadas del anlisis siempre y cuando su importancia terica no
lo desaconsejara.
Nuestra experiencia prctica con estos ndices nos indican que
es peligroso tomarlos como nicas medidas de adecuacin de la
muestra a las hiptesis del modelo del Anlisis Factorial, sobre todo
si el nmero de variables consideradas es pequeo. Conviene
complementar dicha informacin con otras fuentes como pueden ser
AT/RP
BAIT/RP
BN/RP
CF/DLP
CF/RP
DLP/AT
DLP/KP
DT/RP
PC/DT
AT/RP
1.000
.096
-.358
-.285
-.093
.356
.521
.921
-.180
BAIT/RP
.096
1.000
.711
.162
.553
-.047
-.006
.087
.085
BN/RP
-.358
.711
1.000
.323
.762
-.202
-.260
-.343
.141
CF/DLP
-.285
.162
.323
1.000
.440
-.669
-.717
-.511
.642
CF/RP
-.093
.553
.762
.440
1.000
-.217
-.203
-.108
.227
DLP/AT
.356
-.047
-.202
-.669
-.217
1.000
.940
.550
-.956
DLP/KP
.521
-.006
-.260
-.717
-.203
.940
1.000
.748
-.821
DT/RP
.921
.087
-.343
-.511
-.108
.550
.748
1.000
-.343
PC/DT
-.180
.085
.141
.642
.227
-.956
-.821
-.343
1.000
Significacin (Unilateral)
AT/RP
AT/RP
BAIT/RP
BN/RP
CF/DLP
CF/RP
DLP/AT
DLP/KP
DT/RP
PC/DT
.106
.000
.000
.113
.000
.000
.000
.009
BAIT/RP
.106
.000
.017
.000
.270
.469
.130
.134
BN/RP
.000
.000
.000
.000
.004
.000
.000
.033
CF/DLP
.000
.017
.000
CF/RP
.113
.000
.000
.000
.000
.000
.000
.000
.000
.002
.004
.081
.001
DLP/AT
.000
.270
.004
.000
.002
.000
.000
.000
DLP/KP
.000
.469
.000
.000
.004
.000
.000
.000
Chi-cuadrado
aproximado
gl
Sig.
.585
2346.465
36
.000
DT/RP
.000
.130
.000
.000
.081
.000
.000
.000
PC/DT
.009
.134
.033
.000
.001
.000
.000
.000
Matrices anti-imagen
Covarianza
anti-imagen
Correlacin
anti-imagen
AT/RP
AT/RP
2.896E-02
BAIT/RP -1.59E-02
BN/RP
6.740E-03
CF/DLP -4.22E-02
CF/RP
2.208E-02
DLP/AT 1.547E-03
DLP/KP 1.276E-02
DT/RP
-1.79E-02
PC/DT
1.082E-02
AT/RP
.434a
BAIT/RP
-.163
BN/RP
9.971E-02
CF/DLP
-.571
CF/RP
.257
DLP/AT 9.599E-02
DLP/KP
.603
DT/RP
-.963
PC/DT
.485
BAIT/RP
-1.59E-02
.329
-.161
-9.22E-03
5.360E-02
6.412E-04
-7.52E-03
3.453E-03
-4.94E-03
-.163
.597a
-.708
-3.71E-02
.185
1.181E-02
-.105
5.524E-02
-6.57E-02
BN/RP
6.740E-03
-.161
.158
2.620E-02
-.132
-1.49E-03
3.604E-03
1.415E-03
7.549E-04
9.971E-02
-.708
.616a
.152
-.657
-3.96E-02
7.301E-02
3.269E-02
1.450E-02
CF/DLP
-4.22E-02
-9.22E-03
2.620E-02
.188
-.110
-1.83E-02
-1.46E-03
2.800E-02
-3.53E-02
-.571
-3.71E-02
.152
.570a
-.502
-.446
-2.71E-02
.592
-.620
CF/RP
2.208E-02
5.360E-02
-.132
-.110
.255
7.256E-03
4.092E-03
-1.84E-02
1.462E-02
.257
.185
-.657
-.502
.561a
.152
6.518E-02
-.333
.221
DLP/AT
1.547E-03
6.412E-04
-1.49E-03
-1.83E-02
7.256E-03
8.967E-03
-7.04E-03
-1.15E-03
1.058E-02
9.599E-02
1.181E-02
-3.96E-02
-.446
.152
.675a
-.599
-.111
.852
DLP/KP
1.276E-02
-7.52E-03
3.604E-03
-1.46E-03
4.092E-03
-7.04E-03
1.544E-02
-8.93E-03
-1.87E-03
.603
-.105
7.301E-02
-2.71E-02
6.518E-02
-.599
.716a
-.659
-.115
DT/RP
-1.79E-02
3.453E-03
1.415E-03
2.800E-02
-1.84E-02
-1.15E-03
-8.93E-03
1.189E-02
-7.67E-03
-.963
5.524E-02
3.269E-02
.592
-.333
-.111
-.659
.511a
-.537
PC/DT
1.082E-02
-4.94E-03
7.549E-04
-3.53E-02
1.462E-02
1.058E-02
-1.87E-03
-7.67E-03
1.718E-02
.485
-6.57E-02
1.450E-02
-.620
.221
.852
-.115
-.537
.567a
Factorial:
R = AA +
(2)
F1' =
1
2
F1+
1
2
F2 y F2' = -
1
2
F1+
1
2
F2
se tiene que
Mat = 0.71 F1' - 0.42 F2' + uMat
verificndose, adems, que Cov( F1' , F2' ) = 0 por lo que las nuevas
cargas factoriales sern las correlaciones de los nuevos factores con
las variables originales. Las comunalidades, especificidades y
matrices de correlacin permanecen idnticas.
En este caso, la matriz ortogonal T viene dada por:
1/ 2 1/ 2
T =
1/ 2 1/ 2
las
puntuaciones
tipificadas
de
las
primeras
correlaciones
componentes.
de
las
variables
originales
con
dichas
(3)
(4)
en
simulaciones
que,
generalmente,
tiende
a Cov(F , F )
k
Corr(Xi,Fl) = Cov(Xi,Fl) =
ij
j=1
i=1,,p; l=1,,k
Factor
1
2
3
4
5
6
7
8
9
Autovalores iniciales
% de la
varianza
Total
% acumulado
4.416
49.066
49.066
2.149
23.879
72.945
1.395
15.496
88.440
.496
5.510
93.950
.330
3.670
97.620
.114
1.272
98.892
8.809E-02
.979
99.871
6.178E-03 6.865E-02
99.939
5.454E-03 6.060E-02
100.000
Grfico de sedimentacin
5
Autovalor
0
1
Nmero de factor
DLP/KP
DLP/AT
DT/RP
PC/DT
CF/DLP
BN/RP
BAIT/RP
CF/RP
AT/RP
1
.937
.897
.788
-.785
-.731
-.518
Factor
2
.583
.511
.833
.731
.676
.607
.685
Comunalidadesa
AT/RP
BAIT/RP
BN/RP
CF/DLP
CF/RP
DLP/AT
DLP/KP
DT/RP
PC/DT
Inicial
.971
.671
.842
.812
.745
.991
.985
.988
.983
Extraccin
.862
.586
.999
.565
.638
.985
.955
.999
.913
Tabla 6
Matriz de correlaciones reproducidas y residuos
Correlaciones reproducidas
Correlacin reproducida
Residual a
AT/RP
BAIT/RP
BN/RP
CF/DLP
CF/RP
DLP/AT
DLP/KP
DT/RP
PC/DT
AT/RP
BAIT/RP
BN/RP
CF/DLP
CF/RP
DLP/AT
DLP/KP
DT/RP
PC/DT
AT/RP
.862b
8.282E-02
-.341
-.321
-9.06E-02
.342
.539
.914
-.156
1.317E-02
-1.70E-02
3.657E-02
-2.48E-03
1.320E-02
-1.82E-02
6.662E-03
-2.47E-02
BAIT/RP
BN/RP
8.282E-02
-.341
.586b
.679
.679
1.000b
.190
.375
.584
.760
-3.69E-02
-.184
-3.13E-03
-.249
9.273E-02
-.347
7.512E-02
.134
1.317E-02 -1.70E-02
3.176E-02
3.176E-02
-2.76E-02 -5.18E-02
-3.08E-02 1.903E-03
-1.02E-02 -1.77E-02
-2.79E-03 -1.07E-02
-6.11E-03 3.721E-03
1.016E-02 6.967E-03
CF/DLP
-.321
.190
.375
.565b
.347
-.705
-.692
-.467
.653
3.657E-02
-2.76E-02
-5.18E-02
9.326E-02
3.637E-02
-2.45E-02
-4.32E-02
-1.14E-02
CF/RP
-9.06E-02
.584
.760
.347
.638b
-.240
-.226
-.122
.243
-2.48E-03
-3.08E-02
1.903E-03
9.326E-02
2.218E-02
2.242E-02
1.435E-02
-1.61E-02
DLP/AT
.342
-3.69E-02
-.184
-.705
-.240
.985b
.938
.559
-.928
1.320E-02
-1.02E-02
-1.77E-02
3.637E-02
2.218E-02
1.560E-03
-8.89E-03
-2.84E-02
DLP/KP
.539
-3.13E-03
-.249
-.692
-.226
.938
.955b
.738
-.836
-1.82E-02
-2.79E-03
-1.07E-02
-2.45E-02
2.242E-02
1.560E-03
9.124E-03
1.549E-02
DT/RP
.914
9.273E-02
-.347
-.467
-.122
.559
.738
1.000b
-.364
6.662E-03
-6.11E-03
3.721E-03
-4.32E-02
1.435E-02
-8.89E-03
9.124E-03
PC/DT
-.156
7.512E-02
.134
.653
.243
-.928
-.836
-.364
.913b
-2.47E-02
1.016E-02
6.967E-03
-1.14E-02
-1.61E-02
-2.84E-02
1.549E-02
2.090E-02
2.090E-02
de
cargas
factoriales
debe
reunir
las
siguientes
caractersticas:
1) cada factor debe tener unos pocos pesos altos y los otros
prximos a cero;
2) cada variable no debe estar saturada ms que en un factor;
3) no deben existir factores con la misma distribucin, es decir,
dos
factores
distintos
deben
presentar
distribuciones
1
2
1
2
2 y la
1
0.71 0.42
0.71 0.28
0.64 0.21
0.69 0.47
0.78 0.42
k
b ij
p b ij2
V = p 2
i =1 j=1
i =1
hj
j=1 h j
k
(b
p
S=
i =1
2
ij
j=1
bi
2 2
1 k 2
donde bi = b ij
k j=1
2
de
los
factores
obtenidos
ha
mejorado
(DLP/AT y DLP/KP) e
Es,
por
lo
tanto,
un
factor
que
refleja
el
Tabla 7
Matriz de cargas factoriales rotada y matriz de rotacin
Matriz de factores rotadosa
DLP/AT
PC/DT
DLP/KP
CF/DLP
BN/RP
CF/RP
BAIT/RP
DT/RP
AT/RP
1
.967
-.953
.867
-.662
Factor
2
.956
.774
.753
.939
.916
1
.792
.264
-.550
2
-.319
.948
-.005
3
.520
.179
.835
Si definimos
F1" =
1
4
F2
F1 +
17
17
F2" =
4
1
F2
F1 +
17
17
8
= 0.47 0 por lo que los nuevos factores
17
T=
17
15
17
15
17
15
0.82
0.69
0.58
por B =
0.00
0.06
0.04
de configuracin.
0.00
0.14
0.17
. Dicha matriz recibe el nombre de matriz
0.82
0.86
0.87
0.82
0.76
8 / 17 0.66
1
=
B
1 0.39
8 / 17
0.34
0.45
0.39
0.46
0.44
0.82
0.83
0.89
is iq
is
s
is
s
s < q =1
i =1
i =1
p
donde:
k
b b
2
is
iq
(b
s < q =1 i =1
k
2
is
s < q =1 i =1
factores
Para un valor = 1 se alcanza el mximo grado de oblicuidad
y cuanto ms cerca de 0 toma sus valores, ms ortogonales son los
factores.
Como se ha visto en la seccin anterior, en la rotacin oblicua
las cargas factoriales no coinciden con las correlaciones entre el
factor y la variable, puesto que los factores estn correlacionados
entre s.
Por eso, los paquetes estadsticos calculan dos matrices: la
Tabla 8
Resultados obtenidos al realizar una rotacin oblcua
Matriz de configuracin.a
PC/DT
DLP/AT
DLP/KP
CF/DLP
BN/RP
BAIT/RP
CF/RP
AT/RP
DT/RP
1
-1.012
.986
.830
-.635
Factor
2
.958
.766
.766
.941
.923
Matriz de estructura
DLP/AT
PC/DT
DLP/KP
CF/DLP
BN/RP
CF/RP
BAIT/RP
DT/RP
AT/RP
1
.991
-.941
.935
-.717
Factor
2
.610
.969
.790
.745
.533
.992
.928
1
1.000
-.207
.375
2
-.207
1.000
-.103
3
.375
-.103
1.000
F = ()-1X
9.1.2. Mtodo de Barlett
F = ( -1 )-1-1X
9.1.3 Mtodo de Anderson-Rubin
F = ( -1R-1)-1-1X
9.1.4. Comparacin de los tres mtodos
Ejemplo 2 (continuacin)
AUT
BEL
DNK
FIN
1
FRA
GER
ITA
-1
NLD
POR
-2
SPA
-3
SWE
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000
AO
AUT
BEL
Rentabilidad
DNK
FIN
FRA
GER
-2
ITA
NLD
-4
POR
SPA
-6
SWE
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000
AO
AUT
3
BEL
Recursos ajenos
DNK
2
FIN
FRA
GER
ITA
NLD
POR
-1
SPA
-2
SWE
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000
AO
4
SWE
3
SPA
Recursos Ajenos
POR
2
NLD
ITA
GER
FRA
0
FIN
DNK
-1
BEL
-2
AUT
-2
-1
casos
sustancialmente,
cuando
se
refiere
esos
se
debera
plantear
un
Anlisis
Factorial
Resumen
Bibliografa