Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Factorialec PDF
Factorialec PDF
ANLISIS FACTORIAL
Presentacin:
Introduccin
Qu factores tiene en cuenta una persona cundo va a
comprarse un coche?
Qu caractersticas distinguen unas marcas de pastas de
dientes de otras ?
Qu tipos de aptitudes hay que tener en cuenta para evaluar la
labor de un vendedor? Cmo se pueden medir?
Cules son los determinantes de la resistencia de los
individuos a innovaciones tecnolgicas?
Cmo medir el grado de inteligencia de una persona? Existe
un nico tipo de inteligencia o hay varios? Si existen varios cmo
medirlos?
Qu factores conforman la personalidad de una persona?
Cmo medirlos?
Cmo medir el nivel de desarrollo de un pas?
Qu ratios financieros deben tenerse en cuenta a la hora de
evaluar la labor desarrollada por una empresa?
QU TIENEN EN COMN TODOS ESTOS
PROBLEMAS? CMO RESOLVERLOS?
En esta leccin trataremos de responder a estas cuestiones.
Objetivos
1) Definir qu es el Anlisis Factorial y cules son sus objetivos.
2) Indicar cules son las etapas a seguir en la realizacin de un
Anlisis Factorial.
3) Formular el modelo del Anlisis Factorial e interpretar el
significado de sus parmetros
4) Analizar el grado de deseabilidad de un Anlisis Factorial sobre
un conjunto de datos a partir del anlisis de la matriz de
correlacin de las variables observadas.
5) Seleccionar el mtodo apropiado para la extraccin de los
factores.
6) Determinar el nmero de factores a extraer.
7) Aprender a interpretar el significado de un factor.
8) Conocer distintos mtodos de rotacin de factores
9) Conocer distintos mtodos de clculo de las puntuaciones
factoriales y cmo usarlas para interpretar los resultados
obtenidos
10) Validar el modelo resultante de un Anlisis Factorial
Apartados
1) Qu es un Anlisis Factorial?
2) Cmo realizar un Anlisis Factorial?
3) Formulacin del Problema.
4) Anlisis de la Matriz de Correlacin.
5) Extraccin de Factores.
6) Determinacin del Nmero de Factores.
7) Interpretacin de Factores.
8) Rotacin de Factores
9) Clculo de Puntuaciones Factoriales.
10) Validacin del Modelo
Contenidos
1.- QU ES UN ANLISIS FACTORIAL?
EXTRACCIN DE FACTORES
ROTACIN DE FACTORES
INTERPRETACIN DE FACTORES
X1 F1 u1
X2 F2 u2
donde x = ,f= ... , u = ... , X es la matriz de datos,
...
X u
p Fk p
a 11 a 12 ...a 1k
a 21 a 22 ...a 2k
A = es la matriz de cargas factoriales y
..................
a a ...a
p1 p2 pk
f11 f12 ...f1k
21 22 2k
f f ...f
F = es la matriz de puntuaciones factoriales
..................
f f ...f
p1 p2 pk
a
k
Var (Xi) = 2
ij
+ i = h i2 + i; i=1,,p
j=1
k
donde h i = Var a ij Fj y i = Var(ui) reciben los nombres de
2
j=1
comunalidad y especificidad de la variable Xi, respectivamente.
Por lo tanto, la varianza de cada una de las variables
analizadas puede descomponerse en dos partes: una, la
comunalidad h i2 que representa la varianza explicada por los
factores comunes y otra la especificidad i que representa la parte
de la varianza especfica de cada variable. Adems se tiene que
k k
Cov (Xi, Xl) = Cov a ij Fj , a lj Fj = a a
k
il
j=1
ij lj
j=1 j=1
por lo que son los factores comunes los que explican las relaciones
existentes entre las variables del problema. Es por esta razn que los
factores que tienen inters y son susceptibles de interpretacin
experimental son los factores comunes. Los factores nicos se
incluyen en el modelo dada la imposibilidad de expresar, en general,
p variables en funcin de un nmero ms reducido k de factores.
Ejemplo 1( Resultados de un test de inteligencia)
A un conjunto de estudiantes se les somete a diversos tests en
varias materias con el fin de medir sus aptitudes intelectuales
Como consecuencia de dichas pruebas se obtienen una serie de
puntuaciones estandarizadas en Matemticas (Mat), Fsica (Fca),
Qumica (Qca), Ingls (Ing), Historia (His) y Francs (Fra).
El modelo factorial finalmente estimado viene dado por las
ecuaciones
Mat = 0.8F1+0.2F2+uMat Ing = 0.2F1 + 0.8F2 + uIng
Fca = 0.7F1 + 0.3F2 + uFca His = 0.15F1 + 0.82F2 +uHis
Qca = 0.6F1 + 0.3F2 + uQca Fra = 0.25F1 + 0.85F2 + uFra
con E[Fi] = E[uj] = 0 i=1,2; j{Mat,Fca,Qca,Ing,His,Fra}
Var[Fi] = 1; i=1,2; Cov(F1,F2) = 0
Cov(ui,Fj) = 0; i=1,2; j{Mat,Fca,Qca,Ing,His,Fra}
Cov(ui,uj) = 0; ij{Mat,Fca,Qca,Ing,His,Fra}
Se tiene que:
Var[Mat]= 1 = Var[0.8F1+0.2F2+uMat] =
= 0.82Var[F1]+0.22Var[F2]+Var[uMat]+2x0.8x0.2 Cov(F1,F2)+
+2x0.8 Cov(F1,uMat) + 2x0.2 Cov(F2,uMat) = 0.68+Mat
Se sigue, por lo tanto, que la comunalidad del resultado en
matemticas es h 2Mat = 0.68 y su especificidad es Mat = 0.36
Siguiendo el mismo razonamiento se tiene que:
h 2Fca = 0.58, Fca =0.42
2
h Qca = 0.45, Qca =0.55
0.8 0.2
0.7 0.3
0.6 0.3
La matriz de cargas factoriales es A =
0 . 2 0 . 80
0.15 0.82
0.25 0.85
As mismo, se tiene que, por ejemplo
Cov(Mat,Fca) = Cov(0.8F1+ 0.2F2+ uMat, 0.7F1 + 0.3F2 + uFca) =
= 0.8x0.7Var(F1) + 0.2x0.3Var(F2) +
+ (0.8x0.3+0.2x0.7) Cov(F1,F2) + 0.7 Cov(uMat,F1) +
+ 0.3 Cov(uMat,F2) + 0.8 Cov(F1,uFca) + 0.2 Cov(F2,uFca) +
+ Cov(uMat,uFca) = 0.56 + 0.06 + 0 = 0.62
Razonando de esta manera la matriz de varianzas y
covarianzas que, al estar las puntuaciones estandarizadas coincide
con la matriz de correlaciones, vendr dada por:
1 0.62 0.54 0.32 0.284 0.37
0.62 1 0.51 0 . 38 0. 351 0 . 43
0.54 0.51 1 0.36 0.336 0.405
0 . 32 0 . 38 0. 36 1 0.686 0.73
0.284 0.351 0.336 0.686 1 0.7345
0.37 0.43 0.405 0.73 0.7345 1
Se observa, en particular, que las calificaciones en las
asignaturas del bloque de Ciencias (Mat, Fca y Qca) y las del bloque
de Letras (Ing, His y Fra) estn ms correlacionadas entre s que con
las asignaturas del otro bloque.
Ejemplo 2 (Anlisis de un conjunto de ratios financieros)
Como ejemplo ilustrativo de cmo llevar a cabo un Anlisis
Factorial estudiaremos el comportamiento de un conjunto de ratios
financieros listados en la Tabla 1 y medidos sobre una muestra de
empresas del sector del transporte de algunos pases europeos
participantes en el proyecto BACH listados en la Tabla 2.
Tabla 1: Ratios Analizados
Ratio Frmula
Ratio1 Activo Total AT
=
Recursos Propios RP
Beneficios antes de Impuestos BAIT
Ratio2 =
Recursos Propios RP
Beneficios Netos BN
Ratio3 =
Recursos Propios RP
Cash Flow CF
Ratio4 =
Deuda a Largo Plazo DLP
Cash Flow CF
Ratio5 =
Recursos Propios RP
Deuda a Largo Plazo DLP
Ratio6 =
Activo Total AT
Deuda a Largo Plazo DLP
Ratio7 =
Capital Propio CP
Deuda Total DT
Ratio8 =
Recursos Propios RP
Pasivo Circulante PC
Ratio9 =
Deuda Total RP
Tabla 2: Pases participantes en el proyecto BACH
Pais Abreviatura
Austria AUT
Blgica BEL
Dinamarca DNK
Finlandia FIN
Francia FRA
Alemania GER
Italia ITA
Holanda NLD
Portugal POR
Espaa SPA
Suecia SWE
Significacin (Unilateral)
se tiene que
Mat = 0.71 F1' - 0.42 F2' + uMat Ing = 0.71 F1' + 0.42 F2' + uIng
Fca = 0.71 F1' - 0.28 F2' + uFca His = 0.69 F1' + 0.47 F2' + uHis
Qca = 0.64 F1' - 0.21 F2' + uQca Fra = 0.78 F1' + 0.42 F2' + uFra
verificndose, adems, que Cov( F1' , F2' ) = 0 por lo que las nuevas
cargas factoriales sern las correlaciones de los nuevos factores con
las variables originales. Las comunalidades, especificidades y
matrices de correlacin permanecen idnticas.
En este caso, la matriz ortogonal T viene dada por:
1/ 2 1/ 2
T =
1/ 2 1/ 2
5.1 Mtodos de extraccin de factores
Existen muchos mtodos para obtener los factores comunes.
En esta leccin daremos una breve referencia de algunos de ellos;
ms concretamente de los implementados en SPSS.
5.1.1.- Mtodo de las Componentes Principales
El mtodo consiste en estimar las puntuaciones factoriales
mediante las puntuaciones tipificadas de las k primeras
componentes principales y la matriz de cargas factoriales mediante
las correlaciones de las variables originales con dichas
componentes. Este mtodo tiene la ventaja de que siempre
proporciona una solucin. Tiene el inconveniente, sin embargo, de
que al no estar basado en el modelo de Anlisis Factorial puede
llevar a estimadores muy sesgados de la matriz de cargas factoriales,
particularmente, si existen variables con comunalidades bajas.
5.1.2.- Mtodo de los Ejes Principales
Este mtodo est basado en la identidad fundamental del
Anlisis Factorial (2) sustituyendo la matriz de correlaciones
poblacionales R por la de correlaciones muestrales R. Se sigue de
(2) que
R* = R- = AA (3)
El mtodo es iterativo y consiste en alternar una estimacin de la
matriz de especificidades , con una estimacin de la matriz de
cargas factoriales A respetando la identidad (3). Se parte de una
estimacin inicial de la matriz , (0) y en el paso i-simo del
algoritmo se verifica que:
R-(i) = A(i)A(i) (4)
La estimacin A(i) se obtiene aplicando el mtodo de
componentes principales a la matriz R-(i-1). Posteriormente se
calcula (i) a partir de la identidad (4) y se itera hasta que los valores
de dichas estimaciones apenas cambien. Este mtodo tiene la
ventaja de estar basado en el modelo del Anlisis Factorial por lo
que suele proporcionar mejores estimaciones que el mtodo anterior.
Sin embargo, no est garantizada su convergencia, sobre todo en
muestras pequeas.
5.1.3.- Mtodo de la Mxima Verosimilitud
Este mtodo est basado en el modelo (1) adoptando, adems,
la hiptesis de normalidad multivariante y consiste en aplicar el
mtodo de la mxima verosimilitud. El mtodo tiene la ventaja
sobre los dos anteriores de que las estimaciones obtenidas no
dependen de la escala de medida de las variables. Adems, al estar
basado en el mtodo de la mxima verosimilitud, tiene todas las
propiedades estadsticas de ste y, en particular, es asintticamente
insesgada, eficiente y normal si las hiptesis del modelo factorial
son ciertas. Permite, adems, seleccionar el nmero de factores
mediante contrastes de hiptesis. Este mtodo tambin se puede
utilizar en el Anlisis Factorial Confirmatorio, donde el investigador
puede plantear hiptesis como que algunas cargas factoriales son
nulas, que algunos factores estn correlacionados con determinados
factores, etc. y aplicar tests estadsticos para determinar si los datos
confirman las restricciones asumidas. Su principal inconveniente
radica en que, al realizarse la optimizacin de la funcin de
verosimilitud por mtodos iterativos, si las variables originales no
son normales, puede haber problemas de convergencia sobre todo en
muestras finitas.
5.1.4.- Otros mtodos de extraccin
1) Cuando las comunalidades son altas (mayores que 0.6) todos los
procedimientos tienden a dar la misma solucin.
a Cov(F , F )
k
Corr(Xi,Fl) = Cov(Xi,Fl) = ij j l
i=1,,p; l=1,,k
j=1
Grfico de sedimentacin
5
3
Autovalor
0
1 2 3 4 5 6 7 8 9
Nmero de factor
Factor
1 2 3
DLP/KP .937
DLP/AT .897
DT/RP .788 .583
PC/DT -.785 .511
CF/DLP -.731
BN/RP -.518 .833
BAIT/RP .731
CF/RP .676
AT/RP .607 .685
Mtodo de extraccin: Mnimos cuadrados no ponderados.
a. 3 factores extrados. Requeridas 7 iteraciones.
Comunalidadesa
Inicial Extraccin
AT/RP .971 .862
BAIT/RP .671 .586
BN/RP .842 .999
CF/DLP .812 .565
CF/RP .745 .638
DLP/AT .991 .985
DLP/KP .985 .955
DT/RP .988 .999
PC/DT .983 .913
Mtodo de extraccin: Mnimos cuadrados no ponderados.
a. Se han encontrado una o ms estimaciones de la
comunalidad mayores que 1,0 durante las
iteraciones. La solucin resultante debe
interpretarse con precaucin.
Tabla 6
Matriz de correlaciones reproducidas y residuos
Correlaciones reproducidas
i =1 j=1 k j=1
Con ello, se logra que cada variable concentre su pertenencia
en un determinado factor, es decir, presente una carga factorial alta
mientras que, en los dems factores, sus cargas factoriales tiendan a
ser bajas. La interpretacin as gana en claridad por cuanto la
comunalidad total de cada variable permanece constante, quedando
ms evidente de este modo hacia qu factor se inclina con ms
fuerza cada variable. El mtodo es tanto ms clarificador cuanto
mayor nmero de factores se hayan calculado.
Este mtodo tiende a producir un primer factor general que se
le suele dar el nombre de tamao y el resto de factores presentan
ponderaciones menores que las dadas por el mtodo Varimax.
8.1.3.- Mtodo Equamax
Este mtodo busca maximizar la media de los criterios
anteriores. Suele tener un comportamiento similar a uno de lo dos
mtodos anteriores.
Ejemplo 2 (continuacin)
En la Tabla 7 se muestran los resultados de aplicar una
rotacin Varimax (los resultados obtenidos al aplicar los otros dos
mtodos son similares y no se muestran por brevedad).
En primer lugar, se muestra la matriz B de cargas factoriales
rotadas y, a continuacin, la matriz de rotacin T. Se observa que la
interpretabilidad de los factores obtenidos ha mejorado
sustancialmente debido a que, en este caso, cada variable tiende a
relacionarse con un solo factor.
Se observa que el factor 1 rotado est muy relacionado con los
ratios que reflejan el nivel de endeudamiento a largo plazo de la
empresa estando relacionado directamente con aquellos ratios que
tienen dicha partida en el numerador (DLP/AT y DLP/KP) e
inversamente con los que la tienen en el denomiador (PC/DT y
CF/DLP). Es, por lo tanto, un factor que refleja el
ENDEUDAMIENTO A LARGO PLAZO.
El factor 2 por su parte, est relacionado directamente con
ratios que reflejan el nivel de beneficios de la empresa (BN/RP,
CF/RP y BAIT/RP) por lo que puede interpretarse como un factor
de RENTABILIDAD.
Finalmente, el factor 3 est relacionado con ratios que reflejan
el peso de los recursos ajenos en la gestin de las empresas (DT/RP
y AT/RP) por lo que podra interpretarse como un factor de
RECURSOS AJENOS.
Tabla 7
Matriz de cargas factoriales rotada y matriz de rotacin
Matriz de factores rotadosa
Factor
1 2 3
DLP/AT .967
PC/DT -.953
DLP/KP .867
CF/DLP -.662
BN/RP .956
CF/RP .774
BAIT/RP .753
DT/RP .939
AT/RP .916
Mtodo de extraccin: Mnimos cuadrados no ponderados.
Factor 1 2 3
1 .792 -.319 .520
2 .264 .948 .179
3 -.550 -.005 .835
Mtodo de extraccin: Mnimos cuadrados no ponderados.
s < q =1 i =1
is iq
i =1
is s is s
donde:
p
b b
k
2 2
is iq
controla la interpretabilidad de los factores
s < q =1 i =1
factores
Para un valor = 1 se alcanza el mximo grado de oblicuidad
y cuanto ms cerca de 0 toma sus valores, ms ortogonales son los
factores.
Como se ha visto en la seccin anterior, en la rotacin oblicua
las cargas factoriales no coinciden con las correlaciones entre el
factor y la variable, puesto que los factores estn correlacionados
entre s.
Por eso, los paquetes estadsticos calculan dos matrices: la
matriz de cargas factoriales que muestra la contribucin nica de
cada variable al factor y la matriz de estructura factorial que
muestra las correlaciones entre los factores y las variables y que
contiene informacin acerca de la contribucin nica y de las
correlaciones entre factores. Adems de estas dos matrices, es
interesante analizar tambin la matriz de correlaciones entre
factores. Si las correlaciones entre los factores son muy pequeas es
ms robusto aplicar rotaciones ortogonales; por otro lado si dos
factores estn muy correlacionados puede ser seal de que estn
midiendo el mismo concepto y que, en consecuencia, haya que
reducir el nmero de factores.
8.2.2. Mtodo Promax
Consiste en alterar los resultados de una rotacin ortogonal
hasta crear una solucin con cargas factoriales lo ms prximas a la
estructura ideal. Dicha estructura se supone que se obtiene elevando
las cargas factoriales obtenidas en una rotacin ortogonal, a una
potencia que suele estar entre 2 y 4. Cuanto mayor es esta potencia
ms oblicua es la solucin obtenida.
Si H es la matriz de cargas buscada el mtodo promax busca
una matriz T tal que AT = H. Multipiplicando ambos miembros por
la matriz (AA)-1 A ' se tiene que T = (AA)-1 A ' H.
Ejemplo 2 (continuacin)
Con el fin de analizar hasta qu punto los factores extrados
con el mtodo Varimax son ortogonales realizamos, a continuacin,
una rotacin oblicua. En la Tabla 8 se muestran los resultados
obtenidos al aplicar el mtodo oblimin con = 1 que es el que
permite el mayor grado de oblicuidad (los resultados obtenidos con
el mtodo promax son similares y no se muestran por brevedad)
En este caso se muestra la matriz de cargas factoriales rotada B
que recibe el nombre de matriz de configuracin as como la matriz
de estructura, que contiene las correlaciones entre los factores y las
variables originales. Finalmente, tambin se muestra la matriz de
correlaciones entre factores.
Se observa que la interpretacin dada a los factores se
mantiene en lineas generales pero que dichos factores no son
ortogonales, existiendo una correlacin significativa positiva entre
el factor de Endeudamiento y el de Recursos Ajenos igual a 0.375.
Dicha correlacin se debe a la presencia de una relacin directa de
los ratios DLP/KP y DT/RP con ambos factores.
Tabla 8
Resultados obtenidos al realizar una rotacin oblcua
Matriz de configuracin.a
Factor
1 2 3
PC/DT -1.012
DLP/AT .986
DLP/KP .830
CF/DLP -.635
BN/RP .958
BAIT/RP .766
CF/RP .766
AT/RP .941
DT/RP .923
Mtodo de extraccin: Mnimos cuadrados no ponderados.
Matriz de estructura
Factor
1 2 3
DLP/AT .991
PC/DT -.941
DLP/KP .935 .610
CF/DLP -.717
BN/RP .969
CF/RP .790
BAIT/RP .745
DT/RP .533 .992
AT/RP .928
Mtodo de extraccin: Mnimos cuadrados no ponderados.
Factor 1 2 3
1 1.000 -.207 .375
2 -.207 1.000 -.103
3 .375 -.103 1.000
Mtodo de extraccin: Mnimos cuadrados no ponderados.
AUT
3
2 DNK
FIN
1
FRA
GER
0
ITA
-1 NLD
POR
-2
SPA
-3 SWE
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000
AO
AUT
2 BEL
DNK
Rentabilidad
FIN
0
FRA
GER
-2
ITA
NLD
-4 POR
SPA
-6 SWE
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000
AO
AUT
3
BEL
DNK
2
Recursos ajenos
FIN
FRA
1
GER
ITA
0
NLD
POR
-1
SPA
-2 SWE
1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000
AO
SWE
3 SPA
POR
2
Recursos Ajenos
NLD
ITA
1
GER
FRA
0
FIN
DNK
-1
BEL
-2 AUT
-2 -1 0 1 2 3 4