Analisis de Factores II

Análisis Económico Multivariante
EC-3010
Análisis de Factores; Extracción de Factores

Método: Componentes Principales
Etapa 4: Extracción de Factores
Hay dos principales caminos para proceder nuestra solución a

un problema de análisis de factores, ya dentro de la etapa 4.
El camino seleccionado dependerá de los objetivos del
problema planteado. Los dos caminos son:
1. Análisis de Componentes Principales.
2. Análisis de Factor Común.

Extracción de Factores vía Componentes
Principales
Para poder seleccionar un método de extracción de los factores

el usuario de la técnica debe de comprender lo siguiente:
La diferencia que existe entre los diversos tipos de varianza

total. Para los propósitos de análisis de factores hay tres
tipos de varianza que se necesita entender:
1. Común
2. Específica o Única
3. Error
Tipos de varianza total:
Común: es la varianza en una variable que es

compartida con el resto de las variables del análisis
correspondiente.
Específica: es la varianza en una variable que solo se

le asocia a otra variable en particular.
Error: es la varianza que se debe a errores en la

captura de información, errores de medición, o un
componente aleatorio en el fenómeno que se esta
analizando.
Las tres varianzas anteriores componen un total de

varianza disponible de extraer del data set.
Componentes Principales y las varianzas
El método de extracción de factores componentes

principales utiliza (extrae) los tres tipos de varianza
del data set para la conformación de los factores,
esta es la principal diferencia con otros métodos de
extracción de factores (factor común por ejemplo).
Es así como los factores extraídos contienen varianza

común, específica y del tipo de error en cada uno de
los factores procesados.
Común Específica & error
Varianza Total
Componentes Principales
Los factores derivados por componentes principales

contienen pequeñas proporciones de varianza única y
de error, sin embargo se estima que los primeros
factores no contienen suficiente varianza específica o
de error para distorsionar la estructura total de
factores extraídos.
¿Cuando utilizar Componentes Principales?

¿Cuándo utilizar el método de extracción de
factores componentes principales?
Cuando uno de los principales objetivos es la

reducción de la información original (varianza) en un
número mínimo de factores para usos posteriores con
otras técnicas para predicción (construcción de
variables dependientes o independientes).
La idea es retener la mayor cantidad de información

original en el menor número de factores.
Cuando el conocimiento sugiere que las varianzas

específicas y de error representan una porción
relativamente baja del total de varianza.
Criterios para determinar el NÚMERO de factores a
extraer-retener
Un método cuantitativo y exacto - único para

determinar el número de factores a extraer no ha sido
desarrollado, los siguientes mecanismos son utilizados
de manera frecuente para este propósito:
Raíz Latente (eigenvalues - autovalores)
A priorí (número de factores preestablecido)
% de varianza explicado (análisis acumulativo)
Scree Test – Gráfico de Sedimentación

(mecanismo de corte visual )
Raíz latente (eigenvalues): este criterio es el mas
común de usar. Se aplica tanto en componentes
principales como en factor común.
La racionalidad de este criterio parte de que cualquier factor

individual debe de contabilizar la varianza de cuando menos una
variable si se desea retener el factor para su interpretación. Lo
anterior se cumple si el factor tiene una raíz latente o
eigenvalue mayor a 1. De lo anterior deriva que se conservarán
solo aquellos factores con eigenvalues > 1.
Eigenvalue= también referida como raíz latente, es la sumatoria

de los factors loadings al cuadrado. Representa la cantidad de
varianza total que el factor explica. Los eigenvalues se procesan
a partir de la matriz no rotada.
Se establece que este criterio es más confiable si el
número de variables es entre 20 y 50. Este criterio
cuando hay menos de 20 variables se dice que tiene
una tendencia a extraer pocos factores y si hay más
de 50 variables involucradas se extraerían un
número alto de factores.
A priori: como lo dice su nombre, se establece por

alguna razón un número predeterminado de factores
a extraer. ¿Porque pudiera ser el caso?
% de varianza explicado: retener un número

determinado de factores hasta que se cumpla con un
criterio de % de varianza acumulada explicada. No
hay un % fijo o generalmente aceptado.
Como una analogía, seleccionar el número de factores
a extraer e interpretar, es algo así como ajustar un
microscopio o la lente de una cámara, poco ajuste o
mucho ajuste puede volver “obscura” la estructura
latente que se esta tratando de identificar.
Al seleccionar el número final de factores a extraer no

hay que olvidar que hay consecuencias negativas de
tener muchos como pocos factores .....
Con pocos factores se pueden perder dimensiones

relevantes al ser omitidas.
Con muchos factores la interpretación de las

dimensiones se puede volver compleja.
Etapa 5. Interpretación de los Factores
En esta etapa de la solución de un problema de

análisis de factores se deben de realizar las siguientes
tres actividades para finalmente obtener una solución
considerada como final:
A partir de la matriz de factores No rotada se debe

seleccionar el número de factores a extraer según el
criterio seleccionado.
Rotar la matriz de factores para mejorar las

condiciones de interpretación.
Reespecificar el modelo de factores en caso de ser

necesario.
Rotación de Factores
La matriz de factores contiene factor loadings para

cada una de las variables en cada uno de los factores.
El primer factor extraído es la mejor combinación

lineal de variables exhibidos por el data set.
El segundo factor extraído es la segunda mejor

combinación lineal de variables, esto sujeto a que este
factor sea ortogonal del primer factor.
Ortogonal= ser ortogonal significa que el factor

siguiente deriva de la varianza residual una vez
extraído el anterior factor.
Rotación de la Matriz de Factores
La matriz de factores NO rotada, el resultado inicial de

un análisis de factores, cumple el objetivo de
reducción de información una vez que por algún
criterio se extrae cierto número de factores.
Sin embargo en la mayoría de las ocasiones la anterior

matriz no se encuentra en el “mejor formato” para la
interpretación de la estructura de las variables
involucradas.
Lo anterior conduce a que se debe de realizar un

procedimiento de rotación de la matriz de
factores.
Una importante herramienta en la interpretación de

cada uno de los factores es la rotación de factores.
¿Porqué? = la idea es redistribuir la varianza de los

primeros factores hacia los últimos factores, esto
ayuda en la agrupación de variables de manera
significativa en los diversos factores extraídos y ayuda
en el análisis de la estructura del data set.
Hay dos algoritmos o procedimientos de rotación de la

matriz de factores:
Rotación ortogonal
Rotación oblicua
Esta es otra situación en la cual el usuario de

análisis de factores debe de tomar una decisión
de que algoritmo seleccionar para la rotación.
En la práctica el objetivo de todos los algoritmos de

rotación es el de simplificar los renglones y columnas
de la matriz de factores para con ello facilitar su
interpretación. Es decir asociar con mayor claridad las
variables a los diferentes factores vía una
“reorganización” de los factors loadings.
Simplificar renglones y columnas = intensificar los

valores de los factors loadings, es decir, volver
mínimos o tendiendo a CERO la mayor cantidad de
ellos en paralelo a que se resalte un valor ya sea por
columna (factor) o renglón (loadings) para que se
vuelva lo más elevado posible.
Métodos de rotación ortogonal
Quartimax (simplificación de renglones)

Varimax (simplificación de columnas)
Equimax (simplificación tanto de renglones como
columnas)
El método más utilizado y generalmente aceptado

como útil para lograr una matriz rotada que pueda
facilitar la interpretación de los factores es el método
de Varimax.
Métodos de rotación oblicua
Son similares a los ortogonales, con la diferencia de

que la rotación oblicua permite la correlación entre
factores en lugar de mantener independencia entre
ellos como los métodos ortogonales. En nuestro
paquete el OBLIMIN es la opción disponible.
Los resultados son comparables a los ortogonales, sin

embargo si se opta por rotación oblicua se debe de
tener especial atención en su validación.
Criterios para evaluar la significancia de los
factors loadings de una matriz de factores
rotada
Asegurar una significancia práctica: una “regla de

dedo” es identificar si los factors loadings son mayores
a .3 (con signo + o -). Si lo anterior es cierto, se
estaría estableciendo que el factor loading cumple
minimamente para con la significancia práctica. Factor
loadings de .8 o mayores son muy raros o atípicos de
encontrar, esto cuando tenemos observaciones > 100.
Como el factor loading es la correlación de la variable

con el factor, lo anterior al cuadrado es el % de
varianza explicada por la variable …. .3 = 10%.
rotada
Asegurar una significancia estadística: investigación

previa ha demostrado que los factors loadings tienen
errores estándar considerablemente más altos que las
típicas correlaciones, por consiguiente se requiere ser
más estrictos a la hora de evaluar su significancia
estadística.
La cantidad de observaciones en el data set esta

relacionada inversamente con la magnitud del factor
loading para ser considerado significativo a cierto nivel
de significancia.
rotada
Sin embargo ninguno de los anteriores acercamientos

toma en cuenta de que factor estamos hablando, es el
primero? Es el segundo? Tampoco se ha considerado
el número de variables involucradas.
Se estima que para evaluar la significancia estadística

de una variable del segundo factor o los siguientes, se
debe de elevar el grado de exigencia.
Si el número de variables aumenta la exigencia

disminuye.
rotada
En resumen:
Mas grande el número de observaciones disponibles,

menor el factor loading para ser considerado
significativo.
Mayor número de variables en el análisis, menor el

factor loading para ser considerado significativo.
Mayor número de factores extraídos, se requiere que

en el segundo en adelante que los factor loadings
sean mayores.
Interpretación de una matriz de factores rotada
La interpretación incluye principalmente:
La identificación del factor loading más elevado

por variable, es decir una lectura y análisis de la
matriz rotada de izq. a der. partiendo de la parte
superior izquierda de la matriz ....
Como procedimiento ve subrayando lo anterior si el

factor loading es significativo para cada una de las
variables del análisis.
Ahora habrá que identificar para cada variable y en

cada factor cuando su factor loading sea significativo.
La interpretación incluye principalmente:
En ocasiones la interpretación y análisis no es tan simple,

puede ser que nos alejemos del escenario ideal, es decir
….. Que cada una de las variables tenga solo un factor
loading alto y significativo en uno solo de los factores … el
no tener lo anterior complica las cosas cuando se nos
presenta por ejemplo el que una variable registre factor
loadings altos o medianamente altos y significativos todos
en varios factores. Una variable así puede ser candidata a
salir del análisis, sobre todo si estamos sumarizando y
entendiendo la estructura subyacente de la matriz y que
luego tendremos que ponerle nombre a los factores.
La interpretación incluye también:
Evaluar las comunalidades (communalities) de las

variables .... Una vez realizado lo de la filmina anterior
(identificar el factor loading mas alto y significativo por
variable y los factors loadings significativos), se debe de
identificar si hay una o varias variables que no han sido
subrayadas y por ende no son significativas en ningún
factor (no cargaron en ningún factor).
La comunalidad para cada variable es proveída por el

paquete estadístico y representa la cantidad de varianza
que una variable original comparte con el resto de las
variables incluidas en el análisis, un mínimo sería ……
Observar si las comunalidades de las variables

sobre pasan o no el .5 (revelando con ello que la
varianza que comparte cada variable con el resto de las
variables es cuando menos del 50%). Variables con
comunalidades menores a .5 se dice que no tienen
suficiente poder de explicación en la solución de factores
correspondiente.
Si hay variables que no cargan en ningún factor o que su

comunalidad es considerada baja, hay dos grandes
caminos que la interpretación de la matriz de factores
rotada nos puede conducir .....
1. Interpretar la solución así y simplemente ignorar esas

variables o
2. Evaluar individualmente la posibilidad de eliminar esas

variables.
Ignorar las variables puede ser apropiado si el objetivo es

solamente reducción de información, aunque no hay
que olvidar que esas variables están pobremente
representadas en la solución de factores.
Considerar la posibilidad de eliminar variables implica

observar las siguientes cuestiones relevantes ……
Eliminando variables
Hay que evaluar la contribución de cada variable en

términos conceptuales no solamente, en su
comunalidad. Si se trata de una variable de corte
secundario (no prioritaria conceptualmente) y además
con una pobre comunalidad (debajo de .5), se nos
facilita la decisión de eliminarla y reespecificar así el
modelo de factores para poder estimarlo de nuevo y
obtener una solución de factores acorde al nuevo set
de variables.
Un último uso, y que es una parte importante del

objetivo de sumarización de datos y análisis de
estructuras subyacentes viene siendo:
“Ponerle Nombre a los Factores”
La variable con el más alto factor loading y

obviamente significativo lleva mano en el esfuerzo por
identificar con alguna frase o característica al factor.
Después entrarían en juego el conjunto de variables
en segundo o tercer lugar en tamaño de factor
loadings.
“Ponerle Nombre a los Factores”
Catalogar los factores es un trabajo del usuario de la

técnica, esto no es proveído por el paquete, aquí se
eleva la importancia de estar “bien empapado” del
problema o del asunto relevante, detrás de un análisis
de factores en particular.
En ocasiones no se le puede poner nombre a un

factor, este se encuentra indefinido en términos
conceptuales mas no estadísticos y fue valida su
extracción también. ¿Entonces que hacer?
Etapa 6: Validación
Esta etapa se trabaja cuando se esta desarrollando un

análisis de factores confirmatorio, que no es común de
encontrar en la literatura y controversial.
Etapa 7: Usos adicionales del Análisis de

Factores
Esta etapa se presentará en la siguiente sesión - pptx.

Analisis de Factores II

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Analisis de Factores II

Cargado por

Copyright:

Formatos disponibles

Análisis Económico Multivariante

Análisis de Factores; Extracción de Factores

Hay dos principales caminos para proceder nuestra solución a

1. Análisis de Componentes Principales.

2. Análisis de Factor Común.

Para poder seleccionar un método de extracción de los factores

La diferencia que existe entre los diversos tipos de varianza

Común: es la varianza en una variable que es

Específica: es la varianza en una variable que solo se

Error: es la varianza que se debe a errores en la

Las tres varianzas anteriores componen un total de

El método de extracción de factores componentes

Es así como los factores extraídos contienen varianza

Común Específica & error

Los factores derivados por componentes principales

¿Cuando utilizar Componentes Principales?

Cuando uno de los principales objetivos es la

La idea es retener la mayor cantidad de información

Cuando el conocimiento sugiere que las varianzas

Un método cuantitativo y exacto - único para

Raíz Latente (eigenvalues - autovalores)

A priorí (número de factores preestablecido)

% de varianza explicado (análisis acumulativo)

Scree Test – Gráfico de Sedimentación

La racionalidad de este criterio parte de que cualquier factor

Eigenvalue= también referida como raíz latente, es la sumatoria

A priori: como lo dice su nombre, se establece por

% de varianza explicado: retener un número

Al seleccionar el número final de factores a extraer no

Con pocos factores se pueden perder dimensiones

Con muchos factores la interpretación de las

En esta etapa de la solución de un problema de

A partir de la matriz de factores No rotada se debe

Rotar la matriz de factores para mejorar las

Reespecificar el modelo de factores en caso de ser

La matriz de factores contiene factor loadings para

El primer factor extraído es la mejor combinación

El segundo factor extraído es la segunda mejor

Ortogonal= ser ortogonal significa que el factor

La matriz de factores NO rotada, el resultado inicial de

Sin embargo en la mayoría de las ocasiones la anterior

Lo anterior conduce a que se debe de realizar un

Una importante herramienta en la interpretación de

¿Porqué? = la idea es redistribuir la varianza de los

Hay dos algoritmos o procedimientos de rotación de la

Esta es otra situación en la cual el usuario de

En la práctica el objetivo de todos los algoritmos de

Simplificar renglones y columnas = intensificar los

Métodos de rotación ortogonal

Quartimax (simplificación de renglones)

El método más utilizado y generalmente aceptado

Métodos de rotación oblicua

Son similares a los ortogonales, con la diferencia de

Los resultados son comparables a los ortogonales, sin

Asegurar una significancia práctica: una “regla de

Como el factor loading es la correlación de la variable

Asegurar una significancia estadística: investigación

La cantidad de observaciones en el data set esta

Sin embargo ninguno de los anteriores acercamientos

Se estima que para evaluar la significancia estadística

Si el número de variables aumenta la exigencia

Mas grande el número de observaciones disponibles,

Mayor número de variables en el análisis, menor el

Mayor número de factores extraídos, se requiere que