Está en la página 1de 54

El análisis factorial en el contexto del análisis

multivariado Análisis multivariado

Discriminante (Evaluar
Contraste (prueba de Descriptivo (Según el
Correlación pertenencia a un Modelos de Ajuste Otras Técnicas
hipótesis) sentido del análisis)
grupo)

Mas de una Variable


Mas de Una Variable Una Variable Una variable Sincrónico (coindencia Diacrónico (sucesión en Autocorrelación
Dependiente Reducción de Variables Clasificación
Dependiente dependiente Dependiente en tiempo) el tiempo) espacial
(Correlación Canónica)

Dos Muestras Una Variable


Dos muestras (T Continuas (Modelos
(Comparación de Independiente (R de Continuo Discreto Análisis Cluster Series de Tiempo Metanálisis
cuadrado de Hotteling) Causales)
Medias) Pearson)

Mas de una variable Análisis de


Mas de Dos Muestras Mas de dos muestras Análisis de
Independiente Componentes Discretas (log-lineal) Supervivencia
(Manova) (Anova) Correspondencias
(Regresión Múltiple) Principales

Análisis de estructura
Análisis Factorial
latente

Análisis de
Coordenadas
Principales
Análisis Factorial
Propósitos (Técnica de reducción estructural
asume interdependencia entre las variables)

Reducción de Dimensionalidad
(Ítems – variables)
De variable original a variable
1. Resumir Supuesto 1: intervalo – razón
que resume: Información
Componentes como mecanismo
de representación (Características)

3. Revisa homogeneidad al interior


2. Formar del conjunto de ítems
Transformar
Grupos de Supuesto 2: variables simultáneas
Variables
Variables
Creación de datos para las en Factores
nuevas variables: posteriores Identificación de variables
análisis más robustos. latentes
Concepto de factor
• Sinónimos: dimensiones, componentes, características y atributos.
• Es: combinación lineal de las variables originales
𝐹𝑖 = 𝐴1 𝑋1 + 𝐴2 𝑋2 + … + 𝐴𝑘 𝑋𝑘

𝐹 : factor del componente 𝑖 para las 𝑘 observaciones


𝐴 : “importancia” de la variable respecto al factor encontrado
𝑋 : variable original
𝑖 : número de factor
𝑘: número de variables
Supuesto 3: variables estandarizadas
Supuestos Generales del Análisis Factorial
1. Distribución Normal
2. Varianza constante (homocedasticidad)
3. Variables lineales
4. Variables independientes pero relacionadas entre sí
Adicionales
1. Las variables deben ser métricas (mayoría escala intervalo – razón menor
proporción)
2. Permite dummy (dicotómicas), pero deben ser menos que las de razón
3. Tamaños
• Ideal: 𝑛 > 100
• Mínimo: 𝑛 > 50 // Mínimo 4 × 𝑘 < 𝑛
Procedimiento I
1. Tener presenten objetivo:
• Resumir Datos
• Reducir Información
• Encontrar nuevas variables
2. Comprobación de supuestos y requerimientos previos
Procedimiento II

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Comprobación de supuestos y requerimientos
previos I
• Normalidad
Asimetría cercana a cero: indica posible normalidad
Curtosis

n<50
n>50

Sig. > 0,05


Normalidad // Sig. < 0,05 NO
¿qué hacer cuando los datos no son
normales?
1. Evaluación de Multinormalidad (Mardia)
2. Revisar resultados de análisis factorial posteriores (determinante,
adecuación individual, adecuación general, etc.); sí y sólo si se
cuenta un tamaños muestrales grandes.
• ¿a partir de qué valor puedo considerar una muestra grande?
Multinormalidad (Coeficiente Mardia)
• 𝑘𝑝2 = [𝑧 𝐺1,𝑝 ]2 + [𝑧 𝐺2,𝑝 ]2
• Donde 𝑧 𝐺1,𝑝 es Estadístico de Asimetría sobre Error Estándar de
Asimetría; 𝑧 𝐺2,𝑝 es Estadístico de Curtosis sobre Error Estándar de
Curtosis.
• Si 𝑘𝑝2 < 70 en este indicador, es posible asumir distribución semejante
a la normal
• Calcular para la base de datos
N Asimetría Error Curtosis Error
estándar de estándar de
Válido Perdidos asimetría curtosis G_(1,p) G_(2,p) Kp^2
G1 490 0 ,186 ,110 -,915 ,220 1,68609018 -4,1558039 20,113606
G2 490 0 -1,055 ,110 ,292 ,220 -9,5606112 1,32599219 93,1635422
G3 490 0 ,359 ,110 -1,043 ,220 3,25105253 -4,7357328 32,9965079
G4 490 0 -,625 ,110 -,854 ,220 -5,6620956 -3,8801688 47,1150365
G5 490 0 -1,264 ,110 ,716 ,220 -11,458139 3,25357988 141,874739
D1 490 0 -1,719 ,110 1,942 ,220 -15,58423 8,8204973 320,669398
D2 490 0 ,315 ,110 -1,085 ,220 2,85200989 -4,9295186 32,434114
D3 490 0 -,382 ,110 -,952 ,220 -3,4638413 -4,3224708 30,6819502
D4 490 0 -3,405 ,110 12,679 ,220 -30,865964 57,5789359 4268,04157
D5 490 0 2,184 ,110 5,005 ,220 19,7986176 22,728769 908,5822
R1 490 0 2,129 ,110 4,963 ,220 19,3017905 22,5394179 880,584477
R2 490 0 -1,063 ,110 ,335 ,220 -9,6338177 1,52002028 95,120906
R3 490 0 -2,505 ,110 7,318 ,220 -22,707279 33,2336352 1620,09502
R4 490 0 -1,451 ,110 1,979 ,220 -13,150785 8,98943789 253,75314
R5 490 0 -1,644 ,110 2,531 ,220 -14,902051 11,4921583 354,140821
R6 490 0 -1,274 ,110 1,223 ,220 -11,543813 5,55223351 164,086904
R7 490 0 -,819 ,110 -,371 ,220 -7,4193739 -1,685826 57,8891191
R8 490 0 -1,200 ,110 ,783 ,220 -10,876499 3,55477679 130,934679
F1 490 0 -,242 ,110 -1,133 ,220 -2,195873 -5,1433258 31,2756582
F2 490 0 -2,135 ,110 4,909 ,220 -19,354493 22,2957814 871,698277
Comprobación de supuestos y requerimientos
previos II
• Homocedasticidad
Sig. < 0,05
Varianzas no
Homogéneas

Probar con otras


Variables ordinales
Para verificar si se
Sigue presentando
Procedimiento II Debe existir correlación entre variables
Sirve para cuando las variables se identifican con más de un factor

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Procedimiento II 0<|R|<1: cercano a cero es conveniente realizar AF
R: determinante de la matriz de correlación

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
• Matriz de correlacionesa
• a. Determinante = ,003

Sin embargo, ¿qué es y qué no es cercano a cero?, ¿cuál es el límite?


Procedimiento II 0<|R|<1: cercano a cero es conveniente realizar AF
R: determinante de la matriz de correlación

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Prueba de contraste de esfericidad de Barlett
• Cierto grado de multicolinealidad entre las variables
• Búsqueda de interrelaciones
• Contraste de si la matriz de correlación es una matriz identidad
Ho: |R| = I; no realizar AF para resumir información
Ha: |R| ≠ I; si realizar AF
Donde:
R matriz de correlación
I matriz identidad
La prueba obtiene un valor Chi-cuadrado tal que:
1
𝑋𝑐 2 = 𝑛 − 1 − 2𝑚 + 5 ln |𝑅|
6

Donde:
m: número de variables
n: número de datos
|R|: determinante de la matriz de correlación

𝑋𝑐 2 > 𝑋𝑡 2 se rechaza Ho (matriz de correlación es matriz identidad); en SPSS si Sig.<0,05 se rechaza Ho


Procedimiento II Suficiencia general o adecuación al muestreo general:
Kaiser-Meyer-Olkin

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Sumatoria de coeficientes de correlación
parcial de variables
Sólo se puede interpretar cuando Barlett rechazó Ho
KMO: es una medida global que indica qué tan sólida (“fuerte”)es la posible solución a encontrar

Valor KMO Evaluación


De 0,90 en adelante Excelente
KMO > 0,50, pero cercano
De 0,80 a 0,90 Bueno ¿alguna variable no debe
De 0,70 a 0,80 Aceptable integrar la solución?
Verificar
De 0,60 a 0,70 Regular
1. Comunalidades
De 0,50 a 0,60 Bajo 2. Residuos
Menor que 0,50 Inaceptable – no se debe considerar 3. Interpretación de factores
Procedimiento II
Matriz anti-imagen

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Matriz anti-imagen de la matriz de
correlaciones (MASi)
• Es el valor negativo de la correlación parcial y la diagonal de dicha
matriz
• Sirve para revisar la adecuación individual de cada variable
• Fuera de la diagonal de esta matriz no deben existir valores
(absolutos) grandes; los de la diagonal deben ser grandes
• Si KMO (adecuación general) MASg > 0,5; si MASi < 0,5 se debe
“considerar” eliminar la variable (y volver al inicio)
Procedimiento II
de factores

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Selección del modelo de factores

Confirmatorio
Comprobación de Teoría Componentes Principales
(h)

Exploratorio
Búsqueda de Estructuras Factor Común
Latentes (factores
comunes)
Modelo de Factores

Centroide

Otros Máxima Verosimilitud

Ejes principales
Procedimiento II

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Selección de criterio para determinar qué
características deben estar presente en los factores
ORTOGONAL OBLÍCUO
• Relación entre factores igual a • Ejes en cualquier posición,
cero: características relación entre ejes
independientes (dependientes)
• Extracción: 90° • Extracción: distinta de 90°
F1
F1 F2

F2
Procedimiento II

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Conceptos previos
• Matriz de factores no rotada: descomposición espectral que muestra
• Eigenvectores: conjunto de cargas de un factor
• Elementos Individuales: Carga de Factor (relación de cada variable con factor)
• Útil para determinar el número de factores (tentativo) porque las cargas
resultan altas
• Primer factor: mayor cantidad de información
• Eigenvalor: cantidad de información que cada uno de los factores logra captar
de c/u de las variables
• Porcentaje de variación explicada: relación entre la variación explicada por el
factor con respecto a la variación total del conjunto de variables
• Comunalidad: variación explicada por el conjunto de valores para cada
variable.
Criterios para la determinación del número
de factores (solución inicial)
• Matriz no rotada
• Aquella solución que agrupe a los factores de manera lógica será la
definitiva
• Criterio a priori
• Criterio de raíz latente
• Criterio de porcentaje de variación explicada
• Criterio scree test
Criterio a priori
• Probar teoría o hipótesis
• De antemano conocer número de factores
• Se recomienda para análisis confirmatorio
Raíz característica

Mayor que 1
Toda vez que:
Los eigenvalores representan
las varianzas (datos
estandarizados = 1)
Mayor información captada>1

Se recomienda en análisis
factorial exploratorio
Criterio de % de variación explicada
• 60 – 95%
Criterio Scree Test
Procedimiento II

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Procedimiento II

Matriz de Barlett // KMO


Estandarización Determinante
Correlación (AG)

Matriz de
Adecuación
Modelo Características Factores no
Individual
rotada

Matriz de Puntajes de
Solución inicial
factores rotada factores
Matriz de factores rotada
• Cargas definitivas
• Solución final lógica
• Ajusta coordenadas:
• mayor valor teórico
• identificación con un solo factor
Criterios para la rotación de factores
• Ortogonal
• Varimax: maximización de la varianza
• Quartimax: identificar cada variable con al menos un factor, cargas tan bajas
como se pueda
• Equamax: simplificación
• Oblícua
• Oblimin directo: simplificación de pesos factoriales sobre factores primarios y
no ejes de referencia
• Promax: relación entre factores (criterios de varimax)
• Quartimin: cercano a cero con demás factores, menos al que corresponde
(factores altamente relacionados)
Identificación de cargas significativas
• n entre 50 y 100
• 0,5 en adelante (prioridad 1)
• 0,4 a 0,5 (prioridad 2)
• 0,3 a 0,4 (prioridad 3)
• n entre 100 y 200
• 0,19 en adelante
• n entre 200 y 300
• 0,14 en adelante
• n>300
• 0,11 en adelante
Componente
1 2 3 4 5
G1 -,009 -,004 ,027 ,875 ,088 ,875 -,009
G2 ,134 ,033 ,116 ,204 ,692 ,692 ,033
G3 -,052 -,161 -,630 -,081 ,016 ,016 -,630
G4 ,211 -,037 ,711 ,134 -,012 ,711 -,037
G5 ,124 ,087 ,315 -,023 ,692 ,692 -,023
D1 ,431 ,061 ,455 ,009 ,161 ,455 ,009
D2 -,054 ,102 ,158 ,848 ,072 ,848 -,054
D3 ,041 ,067 ,665 -,028 ,351 ,665 -,028
D4 ,755 ,175 ,074 -,038 ,250 ,755 -,038
D5 -,779 -,092 -,075 -,056 -,013 -,013 -,779
R1 -,707 -,227 -,081 ,101 -,155 ,101 -,707
R2 ,292 ,046 -,125 ,016 ,505 ,505 -,125
R3 ,664 ,162 ,067 -,068 ,252 ,664 -,068
R4 ,640 ,199 ,125 -,088 ,099 ,640 -,088
R5 ,769 -,047 ,162 ,134 ,022 ,769 -,047
R6 ,240 ,711 ,125 -,064 ,162 ,711 -,064
R7 ,073 ,823 ,077 ,075 ,121 ,823 ,073
R8 ,225 ,759 ,030 ,091 -,103 ,759 -,103

También podría gustarte