Documentos de Académico
Documentos de Profesional
Documentos de Cultura
T30 Main FA
T30 Main FA
• El análisis factorial es una técnica de reducción de datos que sirve para encontrar
grupos homogéneos de variables a partir de un conjunto numeroso de variables.
• Los grupos homogéneos se forman con las variables que correlacionan mucho
entre sí y procurando, inicialmente, que unos grupos sean independientes de
otros.
• Se pretende responder a:
• ¿Por qué unas variables se relacionan más entre sí y menos con otras?.
Hipotéticamente es porque existen otras variables, otras dimensiones o
factores que explican por qué unos ítems se relacionan más con unos que
con otros.
Sean unos ítems de una escala de actitudes, donde la puntuación de cada sujeto
encuestado es la suma de las respuestas a todos los ítems, según la clave de
corrección diseñada:
La matriz de correlaciones
Extracción de factores
Análisis Factorial
Rotación de factores
• Sea 𝑋 = (𝑋$ , … 𝑋' )′ una variable aleatoria multivariante con vector de medias 𝜇+ y
matriz de covarianzas Σ+ .
• Sin embargo, en uno de los métodos de estimación que veremos mas adelante
asumiremos que X es Gaussiana.
El modelo FA
𝑋 = µ. + L f + u
donde:
• Se supone que las perturbaciones son incorreladas con los factores, es decir,
Cov f, u = E f u’ = 0 7.' y Cov u, f = E uf A = 0 BC9
El modelo FA
A
Σ+ = 𝐶𝑜𝑣 𝑋 = 𝐸 𝑋 − 𝜇+ 𝑋 − 𝜇+ = 𝐿𝐿A + Σ:
J
• 𝜎.,I = 𝐿IA 𝐿I + 𝜎K,I
J J
= 𝜏II + 𝜎K,I con j=1,…p
• Observa que:
𝐶𝑜𝑣 𝑋, 𝑓 = 𝐸 𝑋 − 𝜇+ 𝑓′ = 𝐸 𝐿𝑓 + 𝑢 𝑓′ = 𝐿
Por lo que son los factores comunes los que explican las relaciones existentes
entre las variables.
Por este motivo, los factores comunes tienen interés y son susceptibles de
interpretación experimental. Los factores únicos se incluyen en el modelo dada
la imposibilidad de expresar, en general, p variables en función de un número
más reducido r de factores.
Ejemplo
• Unos estudiantes son sometidos a diversos test en distintas materias para medir
sus actitudes intelectuales. Como consecuencia, se obtienen una serie de
puntuaciones estandarizadas en Matemáticas (Ma), Física (Fi), Química (Qu),
Inglés (In), Historia (Hi) y Dibujo (Di).
Ejemplo
• Unos estudiantes son sometidos a diversos test en distintas materias para medir
sus actitudes intelectuales. Como consecuencia, se obtienen una serie de
puntuaciones estandarizadas en Matemáticas (Ma), Física (Fi), Química (Qu),
Inglés (In), Historia (Hi) y Dibujo (Di).
Ejemplo
• Unos estudiantes son sometidos a diversos test en distintas materias para medir
sus actitudes intelectuales. Como consecuencia, se obtienen una serie de
puntuaciones estandarizadas en Matemáticas (Ma), Física (Fi), Química (Qu),
Inglés (In), Historia (Hi) y Dibujo (Di).
Puntuaciones estandarizadas
Matriz de correlaciones
Análisis de la matriz de correlaciones
• También se espera que las variables que tengan correlación muy alta entre sí
la tengan con el mismo factor o factores.
• En consecuencia, si las correlaciones entre todas las variables son bajas, tal
vez no sea apropiado el Análisis Factorial.
Test de esfericidad de Barlett
Bajo la hipótesis nula, el estadístico se distribuye asintóticamente según una 𝜒'J ']$ /J
Test de esfericidad de Barlett
Si la hipótesis nula es cierta, los valores propios valdrán uno, o su logaritmo será
nulo y, por tanto, el estadístico del test valdría cero.
𝑋 = µ. + L f + u = µ. +L H H’ f + u= µ. + L∗ f ∗ + u
donde L∗ = 𝐿 𝐻 y f ∗ = 𝐻 A 𝑓.
Como consecuencia, en el mejor de los casos, la matriz de carga y los factores son
únicos salvo por una transformación ortogonal porque una transformación ortogonal
de los factores conduce a otros factores, y se mantienen relaciones similares para la
matriz de cargas factoriales.
A
𝑋 = 𝑋$ , 𝑋J
𝑋$ 𝐿 𝑢$
𝑋= = $$ 𝑓 + 𝑢
𝑋J 𝐿J$ J
J
1.25 0.5 𝐿$$ 𝜎:$$ 0
Σ+ = = 𝐿$$ 𝐿J$ + =
0.5 0.5 𝐿J$ 0 J
𝜎:JJ
𝐿J$$ 𝐿$$ 𝐿J$ J
𝜎:$$ 0
=
𝐿$$ 𝐿J$ 𝐿JJ$ 0 J
𝜎:JJ
Por consiguiente:
𝐿J$$ + 𝜎:$$
J
= 1.25
𝐿$$ 𝐿J$ = 0.5
𝐿JJ$ + 𝜎:JJ
J
= 0.5
• Consideremos
• Como vemos, sería algo similar a una varianza muestral con la diferencia que
J
lo aplicamos a las entradas 𝐿IM de L.
$ $ $ $
] ] ] ]
𝜌+ = Δ+ 𝐿𝐿 Δ+J
J
A J
+ Δ+ Σ: Δ+ J
El modelo FA
Por tanto, el modelo factorial para Y es similar al modelo factorial para X con
las siguientes consideraciones:
f
]
g
• Matriz de carga factorial 𝑀 = Δ+ L
• Un conjunto de factores f (los mismos factores)
f
]
• Un conjunto de errores 𝜀 = Δ+g u con matriz de covarianzas diagonal
f f
] ]
Σm = Δ+g Σ: Δ+g
y trabajar con 𝜌+ tiene la ventaja de que sus entradas diagonales son 1 y por
tanto la suma de comunalidades y especificidades son 1 y sus
interpretaciones son mas sencillas.
Estimación de la matriz de cargas y puntuaciones factoriales
• Ahora como L tiene dimensión p x r, 𝐿𝐿A es una matriz con rango r<p.
donde
• De aquí se deduce que Σ+ − Σ: = 𝐿𝐿A , tiene que ser una matriz con rango
r<p porque L tiene dimensión p x r.
• Entonces, del modelo factorial, el vector p x 1 𝑋Q. para i=1,…,n viene dado
por 𝑋Q. = 𝜇+ + 𝐿 𝑓Q . +𝑈Q .
fvQ. = 𝐿A Σw]$ 𝐿 ]$ 𝐿A Σ ]$
w (xy . −𝜇+ )
• Observa que 𝐿{ y 𝑀
v son reemplazados por 𝐿v∗ y 𝑀
u∗ si hemos utilizado el
método de rotación Varimax.
Ejemplo estimación puntuaciones factoriales
Ejemplo estimación puntuaciones factoriales
Ejemplo estimación puntuaciones factoriales
Ejemplo estimación puntuaciones factoriales
Estimación de la matriz de cargas y puntuaciones factoriales
𝑛𝑝 𝑛 𝑛−1
„ =−
𝑙 Σ+ 𝑋, 𝜇…+ = 𝑋) log 2𝜋 − log Σ+ − 𝑇𝑟 [ Σ+]$ 𝑆+ ]
2 2 2
𝑛𝑝 𝑛 𝑛−1
„ =−
𝑙 𝐿, Σw 𝑋, 𝜇…+ = 𝑋) log 2𝜋 − log LLA + Σw − 𝑇𝑟 [ 𝐿𝐿A + Σw ]$ 𝑆 ]
+
2 2 2
Estimación de la matriz de cargas y puntuaciones factoriales
• HU : el número de factores es r
• H$ : el número de factores no es r
|𝐿{ 𝐿u
A|
]$
𝜆 = 𝑛 log( ) − np + n − 1 Tr ( 𝐿{ 𝐿vA + Σuw 𝑆+ )
|Σu+ |
• Por tanto, existe una valor máximo de r que puede ser utilizado bajo el
método de MLE.
Estimación de la matriz de cargas y puntuaciones factoriales
• Este método asume que los factores son variables aleatorias, y busca un
predictor lineal que minimice el error cuadrático medio de la predicción.
• Por tanto, es posible mostrar que el predictor lineal que minimiza el error
cuadrático medio de la predicción es:
𝐸[𝑓Q .A 𝑋Q .A = 𝐼7 + 𝐿A Σw]$ 𝐿 ]$ A ]$
𝐿 Σw (𝑋Q. − 𝜇+ )
• Cuando las comunalidades son altas ( > 0,6) todos los procedimientos
tienen a dar la misma solución.
1. Cada factor debe tener unos pocos pesos altos y los demás próximos a
cero.
3. No deben existir factores con la misma distribución, esto es, dos factores
distintos deben presentar distribuciones diferentes de cargas altas y bajas.
• De esta manera, dado que hay más variables que factores comunes, cada
factor tendrá una correlación alta con un grupo de variables y baja con el
resto de las variables.
Otros métodos de rotación FA
• Para evitar que las variables con mayores comunalidades tengan más peso
en la solución final, se efectúa la normalización de Kaiser (dividiendo cada
carga factorial al cuadrado por la comunalidad de la variable
correspondiente).
Otros métodos de rotación FA
• De esta manera, los factores rotados no tienen por qué ser ortogonales y
tener, por tanto, correlaciones distintas de cero entre sí.
• En cada caso habrá que estudiar qué factores de los calculados son
corroborados en los distintos análisis llevados a cabo.