Está en la página 1de 15

Análisis de Datos 2

Análisis Factorial

Ingrid Acevedo Bohorquez

Universidad EAFIT

13 de abril de 2023
Introducción I

El análisis factorial es una técnica estadística multivariada que


busca identificar una estructura subyacente de un número mínimo
de factores que expliquen la máxima cantidad de información
contenida en las variables analizadas, con base en la variabilidad
común que hay entre ellas.
El Análisis Factorial pretende expresar p variables observables como
una combinación lineal de m variables hipotéticas o latentes,
denominadas factores
Pasos para desarrollar Análisis Factorial I

1 Plantear el Problema de Investigación: Es un análisis


Exploratorio o Confirmatorio
Seleccionar Objetivos:
Identificar la estructura entre los datos
Reducir la dimensionalidad de los datos
2 Selección del Tipo de Análisis Factorial:
Se agruparan las variables
o los casos
Diseño del Proceso
Que variables se incluyen
Como se miden las variables
Tamaño de la muestra deseada
3 Supuestos
Consideraciones estadísticas de normalidad, linealidad y
homoscedasticidad
Homogeneidad de la muestra
Pasos para desarrollar Análisis Factorial II

Vinculos conceptuales
4 Derivar los factores y evaluación del ajuste general
Selección del método de factorización: Se analizará la varianza
total o solo la varianza comun
Especificar la Matriz de Factores, determinar el número de
factores a conservar
5 Interpretación de los Factores
Estimar la Matriz de Factores
Seleccionar un método de rotación
Interpretar los factores y reespecificar
6 Validación de los resultados
Uso de la replica o una perspectiva confirmatoria
Evaluación de la estabilidad de la estructura del Factor
Detectar Observaciones influyentes
7 Reducción de los datos - Usos adicionales de los resultados del
Análisis Factorial Exploratorio
Ejemplo Ilustrativo I

Para desarrollar el ejemplo utilizaremos la misma base de datos que


se utilizo para la Correlación Canónica, pero se denominó como
HBATAF, la encontrarán en los Archivos del curso en Teams
Primer Paso: Objetivos del Análisis Factorial
En la base de datos analizada se tienen las variables X6 a X18
que corresponden a las percepciones de los clientes con
respecto a la empresa. Los objetivos que se persiguen en este
proceso son
1 Comprender si las percepciones de los clientes pueden ser
agrupadas.
2 Reducir las 13 variables a un número menor de variables. Al
reducir el número de variables, otras técnicas multivariadas
pueden ser utilizadas con más facilidad.
Ejemplo Ilustrativo II

Segundo Paso: Diseño del Análisis Factorial:


Reglas para el Diseño del Análisis Factorial
El análisis factorial se realiza sólo con variables métricas.
Se deben tener por lo menos 5 variables para
Para el tamaño de la muestra
La muestra debe tener más observaciones que variables.
El tamaño mínimo absoluto de la muestra debe ser de 50
observaciones.
Aumentar el tamaño de la muestra a medida que aumente la
complejidad del análisis factorial.
Maximizar el número de observaciones por variable con una
proporción de al menos cinco observaciones por variable.

En este caso el análisis factorial se hará entre Variables y no


entre observaciones.
Ejemplo Ilustrativo III

Las variables a considerar son métricas y son apropiadas para


el análisis factorial.
En este caso el tamaño de la muestra tiene una proporción de
8:1 ocho observaciones por variable lo cual es aceptable para el
análisis.
También el tamaño de 100 observaciones proporciona una base
adecuada para los cálculos necesarios.
Tercer Paso: Supuestos en el Análisis Factorial
Los supuestos estadísticos subyacentes influyen en el análisis
factoriales en la medida en que afecta el resultado de las
correlaciones. Las desviaciones de la normalidad casticidad la
linealidad pueden disminuir la correlación entre las variables.
Ejemplo Ilustrativo IV

Examen de las Correlaciones: al construir la matriz de


correlaciones vemos que 27 de las 78 (35 %) correlaciones son
significativas con un nivel de significancia de 0,01, lo cual
proporciona una base adecuada para proceder al análisis
factorial. Vemos que hay una variable X15 que tiene cero
correlaciones significativas y la X17 tiene nueve correlaciones
significativas. Las variables que no tienen correlación con
ninguna otra no pertenecerán a ningún factor y los que tienen
muchas correlaciones podrían pertenecer a varios factores.
Prueba de Bartlett y valores MSA: La prueba de esfericidad de
Bartlett sirve para evaluar la importancia general de la matriz
de correlación. Proporciona la significancia estadística que
indica que la matriz de correlacion tiene correlaciones
significativas entre al menos algunas de las variables. Un nivel
de significancia menor de 0.50 indica que existe suficiente
correlación entre las variables.
Ejemplo Ilustrativo V

La medida de la adecuación del muestreo (MSA) cuantifica el


grado de intercorrelaciones entre las variables y la idoneidad
del Análisis Factorial. Estos valores deben ser superiores a 0.50
tanto para la prueba general como para cada variable
individual. Las variables con valores inferiores a 0.50 deben
omitirse del Análisis Factorial. Deben omitirse de una en una
cada vez.
En el ejemplo la prueba de Bartlett son significativas, con un
nivel de significancia cercano a cero. En cuanto a la medida de
adecuación del muestreo la general cae por encima de 0.50 con
un valor de 0.61. Sin embargo el análisis de las variables
individualmente, muestra que las variables X11, X15 y X17
tienen valores por debajo de 0.50. Eliminamos la variable X15
cuyo valor es el más bajo.
Al calcular nuevamente las medidas de adecuación del
muestreo vemos que aun la variable X17, tiene un valor por
Ejemplo Ilustrativo VI

debajo de 0.50, por lo cual procedemos a eliminarla. Ahora


todos los valores son superiores a 0.50
Cuarto paso: Derivación de los factores y valoración del ajuste
global
Seleccionar el número de factores que se van a considerar.
Primero se deben calcular los valores propios (eigenvalues)
para todas las variables a incluir en el análisis y determinar el
porcentaje de varianza para cada componente y el porcentaje
de varianza acumulada. Hay varios criterios:
Criterio de raiz latente: Consiste en tomar los componentes
cuyos valores propios sean mayores a 1. En el ejemplo serían 4
Criterio de caida: Al observar la gráfica, se identifica el punto
donde hay un cambio sustancial de pendiente, en el ejemplo
serían 5 factores
Ejemplo Ilustrativo VII

Criterio de Porcentaje de Varianza: Escoger un porcentaje


de varianza explicada. En el ejemplo Si escogieramos 80 %
tendríamos 4 factores.
Interpretación de los factores
Estimar la matriz de factores
Ejemplo Ilustrativo VIII

Elegir el método de rotación: Puede ser rotación ortogonal o


rotación oblicua
Ejemplo Ilustrativo IX

Método QUARTIMAX rota los factores iniciales para que


una variable cargue un valor alto sobre un factor y un valor
bajo sobre los otros factores
Ejemplo Ilustrativo X

Método VARIMAX maximiza la suma de las varianzas de las


cargas requeridas, simplificando las columnas
Quinto Paso: Interpretación de la matriz de factores:
1 cada variable debe tener una carga alta solo en un factor y
cargas bajas en todos los demás factores
2 Las cargas cruzadas de una variable (carga sobre dos factores)
se pueden evaluar como problematicas si la relación entre las
cargas al cuadrado están entre 1.0 y 1.5. Potenciales si la
relación está entre 1.5 y 2.0. Ignorables si la relación es mayor
a 2.0.
3 Las variables deben tener comunalidades (proporción de la
variable con la que contribuye cada variable a la solución
final), superiores a 0.50
Ejemplo Ilustrativo XI

4 Reespecificar el analisis factorial, lo cual puede incluir:


Eliminar variables, Cambiar los metodos de rotación,
incrementar o reducir el numero de factores
En el ejemplo al observar las cargas cruzadas de la variable
X11, se decidió eliminarla y volver a calcular la matriz de
factores
Etiquetar los Factores: De acuerdo con las cargas factoriales de
cada variable sobre cada factor se puede etiquetar cada factor.
En el ejemplo prodríamos decir que :
Factor 1: Servicio de servicio al cliente, variables X9, X18, X16
Factor 2: Mercadeo, variables X12, X7 y X10
Factor 3: Soporte Técnico, variables X8 y X14
Factor 4: Valor del producto, Variables X6 y X13

También podría gustarte