Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Anlisis de Datos
ANLISIS FACTORIAL
Gua de Exposicin
Ramon Maha
Noviembre 2002
ANLISIS FACTORIAL
IDEA CONCEPTUAL BSICA
- (1) Parte de un conjunto amplio de variables que presentan
interrelaciones importantes.. (2) se asume que las relaciones
existen porque las variables son manifestaciones comunes de
factores no "observables" de forma directa...y (3) se pretende
llegar a un clculo de esos factores: (a)- resumiendo informacin
(b)- clarificando las relaciones entre ellas y (c) sin prdida
excesiva de informacin.
DEFINICIN
- (1) Proporciona la estructura interna, las dimensiones
subyacentes, el transformado de un conjunto amplio de variables,
elaborando una estructura ms simple, con menos dimensiones,
que proporcione la misma informacin y permita globalizar as el
entendimiento del fenmeno.
- (2) Simplifica la modelizacin convirtiendo, por eliminacin de
redundancias expresadas en altas correlaciones entre variables,
un amplio conjunto de variables en factores "estructurales".
DIFERENCIAS CON OTRAS TCNICAS
- No es una tcnica de dependencia (no hay seleccin a priori de
dependiente y exgenas), es una Tcnica de Interdependencia
- No es una tcnica de agrupacin: Aunque puede aplicarse con
fines de agrupacin sobre matrices de correlaciones entre
objetos/sujetos (Factorial Q), lo habitual es su aplicacin sobre
matrices de correlaciones entre variables (Factorial R).
MODELO FACTORIAL EXPLORATORIO (Un ejemplo):
ANLISIS FACTORIAL
Se desea extrapolar de la provincia al municipio, un modelo de regresin
explicativo del nivel de renta disponible funcin de una serie de
manifestaciones de esa renta. Para ello, se parte de un amplio conjunto de
variables provinciales y para los 8.000 municipios espaoles.
ANLISIS FACTORIAL
MODELO FACTORIAL CONFIRMATORIO (ejemplo):
Se desea medir la capacidad de abstraccin, analtica y memoria de los
alumnos.
Se observaron 10 notas de cada alumno de un determinado grupo de
estudiantes universitarios. Entre estas notas, o al menos entre algunas de ellas,
se observan correlaciones elevadas que, en cierta medida, provienen de
aptitudes globales del alumno que no se observan directamente:
Nota en lgebra
Nota en clculo
Nota en estadstica
Nota en derecho mercantil
Nota en derecho laboral
Nota en contabilidad financiera y de sociedades
Nota en anlisis de costes
Nota en comunicacin comercial
Nota en actuariales
Nota en econometra
Un anlisis factorial permiti que la informacin relativa a estas variables
se resumiese en tres nicos factores de fondo, sin prdida excesiva de
informacin y logrando, de nuevo, una incorrelacin muy conveniente. Cada
uno de estos tres factores se interpret como:
F2 - Factor de CAPACIDAD DE ABSTRACCIN
F3 - Factor de MEMORIA
F4 - Factor de CAPACIDAD ANLTICA
Independientemente de estos tres factores relacionados con grupos de
variables (notas) se identific, claro est, una factor comn que podramos
llamar inteligencia en general y un factor especfico para cada asignatura (su
propia dificultad y componentes de tipos aleatorio relativos a las distintas
formas de evaluacin).
ANLISIS FACTORIAL
Xij = ai1 F1j + ai2 F2j + ai3 F3j + + diUij
Xij = Valor normalizado de la variable i para el sujeto j
Nota en Matemticas (i) del alumno (j)
ai1 =
ai2 =
ANLISIS FACTORIAL
MSA SOBRE EL MODELO TERICO I
Si los factores estn normalizados (esperanza nla y varianza
unitaria) y son independientes los unos de los otros pueden
obtenerse los siguientes resultados:
1.- aik
ij
kj
- Cargas
factoriales:
Coeficientes
bsicos
para
determinacin contenido conceptual de los factores en
anlisis exploratorio.
- Matriz de cargas: Se denomina as a la matriz que recoge
las cargas entre todas las variables originales y la seleccin
final de factores.
ANLISIS FACTORIAL
MS SOBRE EL MODELO TERICO II
2.-
Var ( X i ) aik2 d i2
k 1
ANLISIS FACTORIAL
PASOS A COMPLETAR (I)
1.- SELECCIN DE VARIABLES
Dimensin conceptual: Variables en relacin con el
fenmeno de anlisis. An en el caso de un anlisis
exploratorio, tener claro el modelo factorial terico ayuda a la
seleccin conceptual de las mismas. "Basura dentro - Basura
Fuera"
Dimensin tcnica:
(1)
(2)
(3)
ANLISIS FACTORIAL
PASOS A COMPLETAR (II)
2.- SELECCIN DE LA MUESTRA
Amplitud: Cuanto mayor ratio observaciones/variables,
mejor. (receta: N observaciones 5 veces mayor que el de
variables). Una ratio reducida aumenta las posibilidades de
encontrar correlaciones espurias, propias de la muestra, no de
la poblacin general.
Heterogeneidad: Evidente pero a veces se olvida: una
muestra de objetos/sujetos homognea no contiene
informacin.
3.- EXTRACCIN DE FACTORES:
Nos referimos al clculo analtico de los factores a partir
de las variables originales.
La extraccin implicar:
(1)
ANLISIS FACTORIAL
(2)
(3)
ANLISIS FACTORIAL
PASOS A COMPLETAR (III)
3.- INTERPRETACIN Y ROTACIN:
La matriz de cargas, factorial o de componentes
relacionarn factores y variables para aproximarnos a su
significado. (Matriz de estructura: Matriz que contiene los
coeficientes de correlacin entre factores y variables
originales. Para factores ortogonales coincide con la de
cargas).
- A la hora de valorar si una carga expresa relacin o no
(es suficientemente elevada), deberemos ser tanto ms
exigentes cuanto:
- Menor sea el tamao muestral
- Menos variables se incluyan en el factorial
- El factor analizado sea de los ltimos extrados
Si esta misin es difcil,
ambigedades, ayudando a hacerlo:
la
rotacin
elimina
- Rotaciones
ortogonales
(Varimax,
Equamax,
Cuartimax): Es conceptualmente menos realista, pero
maximiza la varianza "explicada" y, en ocasiones, la
ortogonalidad resulta til.
- Rotaciones oblicuas (Oblimin): Es ms realista (es
difcil suponer ortogonalidad conceptualmente), suele
ofrecer resultados ms claros y adems aporta
informacin sobre la relacin entre factores.
DETALLE TCNICO I:
ANLISIS FACTORIAL
ALGO MS SOBRE EL ANLISIS DE CORRELACIONES
Triple condicin de anlisis:
ANLISIS FACTORIAL
DETALLE TCNICO II:
ALGO MS SOBRE LA EXTRACCIN POR
COMPONENTES PRINCIPALES (MARCO GENERAL)
"P" variables iniciales:
X = [X1, X2 ........Xp
Construiremos p componentes principales guiados por: (1) funcin
lineal de las variables originales, (2) que absorban el mximo de
variacin de las variables X y (3) que estn incorrelacionados.
Yij = i 1 X 1 j i 2 X 2 j ......... ip X pj ;
2, ....., n
Yi = X i
X 11 X 21 ....... X p1
Y i1
Y i 2
Yi .
.
Y
in
i1
X 12 X 22 ....... X p 2
X .............................
..............................
.......
X 1n X 2n X pn
i 2
i .
.
ip
j = 1,
ANLISIS FACTORIAL
Yi Yi iS i
donde S = XX
ANLISIS FACTORIAL
DETALLE TCNICO III:
DETALLE OBTENCIN 1ER Y 2 COMPONENTES
PRINCIPALES
El primer componente es:
Y1 X1
Y1Y1 1S 1
que sustituida en
( S I ) 1 0
1
ANLISIS FACTORIAL
DETALLE TCNICO III:
DETALLE OBTENCIN 1ER Y 2 COMPONENTES
PRINCIPALES (Continuacin)
El segundo componente es: Y 2 X 2
..... y de nuevo debemos procurar maximizar: Y ' 2 Y 2 ' 2 S 2
.... sujeto de nuevo a la ' 2 2 1 a la que ahora aadimos la
ausencia de correlacin con el primer componente: Y2Y1=0....o lo
que es igual ' 2 S 1 0 que puede escribirse tambin como
' 2 1 0
Por tanto, la funcin a maximizar queda:
Max Z ' S ( '
2
1) ( '
1
)
1
S 2 2 2 0 o sea ..... ( S 2 I ) 2 0
que se resuelve como para el 1er componente.