Está en la página 1de 37

Análisis Económico Multivariante

EC-3010

Análisis de Factores; Extracción de Factores


Método: Componentes Principales
Etapa 4: Extracción de Factores

Hay dos principales caminos para proceder nuestra solución a


un problema de análisis de factores, ya dentro de la etapa 4.
El camino seleccionado dependerá de los objetivos del
problema planteado. Los dos caminos son:

1. Análisis de Componentes Principales.

2. Análisis de Factor Común.


Extracción de Factores vía Componentes
Principales

Para poder seleccionar un método de extracción de los factores


el usuario de la técnica debe de comprender lo siguiente:

La diferencia que existe entre los diversos tipos de varianza


total. Para los propósitos de análisis de factores hay tres
tipos de varianza que se necesita entender:

1. Común

2. Específica o Única

3. Error
Tipos de varianza total:

Común: es la varianza en una variable que es


compartida con el resto de las variables del análisis
correspondiente.

Específica: es la varianza en una variable que solo se


le asocia a otra variable en particular.

Error: es la varianza que se debe a errores en la


captura de información, errores de medición, o un
componente aleatorio en el fenómeno que se esta
analizando.

Las tres varianzas anteriores componen un total de


varianza disponible de extraer del data set.
Componentes Principales y las varianzas

El método de extracción de factores componentes


principales utiliza (extrae) los tres tipos de varianza
del data set para la conformación de los factores,
esta es la principal diferencia con otros métodos de
extracción de factores (factor común por ejemplo).

Es así como los factores extraídos contienen varianza


común, específica y del tipo de error en cada uno de
los factores procesados.

Común Específica & error

Varianza Total
Componentes Principales

Los factores derivados por componentes principales


contienen pequeñas proporciones de varianza única y
de error, sin embargo se estima que los primeros
factores no contienen suficiente varianza específica o
de error para distorsionar la estructura total de
factores extraídos.

¿Cuando utilizar Componentes Principales?


¿Cuándo utilizar el método de extracción de
factores componentes principales?

Cuando uno de los principales objetivos es la


reducción de la información original (varianza) en un
número mínimo de factores para usos posteriores con
otras técnicas para predicción (construcción de
variables dependientes o independientes).

La idea es retener la mayor cantidad de información


original en el menor número de factores.

Cuando el conocimiento sugiere que las varianzas


específicas y de error representan una porción
relativamente baja del total de varianza.
Criterios para determinar el NÚMERO de factores a
extraer-retener

Un método cuantitativo y exacto - único para


determinar el número de factores a extraer no ha sido
desarrollado, los siguientes mecanismos son utilizados
de manera frecuente para este propósito:

Raíz Latente (eigenvalues - autovalores)

A priorí (número de factores preestablecido)

% de varianza explicado (análisis acumulativo)

Scree Test – Gráfico de Sedimentación


(mecanismo de corte visual )
Raíz latente (eigenvalues): este criterio es el mas
común de usar. Se aplica tanto en componentes
principales como en factor común.

La racionalidad de este criterio parte de que cualquier factor


individual debe de contabilizar la varianza de cuando menos una
variable si se desea retener el factor para su interpretación. Lo
anterior se cumple si el factor tiene una raíz latente o
eigenvalue mayor a 1. De lo anterior deriva que se conservarán
solo aquellos factores con eigenvalues > 1.

Eigenvalue= también referida como raíz latente, es la sumatoria


de los factors loadings al cuadrado. Representa la cantidad de
varianza total que el factor explica. Los eigenvalues se procesan
a partir de la matriz no rotada.
Se establece que este criterio es más confiable si el
número de variables es entre 20 y 50. Este criterio
cuando hay menos de 20 variables se dice que tiene
una tendencia a extraer pocos factores y si hay más
de 50 variables involucradas se extraerían un
número alto de factores.

A priori: como lo dice su nombre, se establece por


alguna razón un número predeterminado de factores
a extraer. ¿Porque pudiera ser el caso?

% de varianza explicado: retener un número


determinado de factores hasta que se cumpla con un
criterio de % de varianza acumulada explicada. No
hay un % fijo o generalmente aceptado.
Como una analogía, seleccionar el número de factores
a extraer e interpretar, es algo así como ajustar un
microscopio o la lente de una cámara, poco ajuste o
mucho ajuste puede volver “obscura” la estructura
latente que se esta tratando de identificar.

Al seleccionar el número final de factores a extraer no


hay que olvidar que hay consecuencias negativas de
tener muchos como pocos factores .....

Con pocos factores se pueden perder dimensiones


relevantes al ser omitidas.

Con muchos factores la interpretación de las


dimensiones se puede volver compleja.
Etapa 5. Interpretación de los Factores

En esta etapa de la solución de un problema de


análisis de factores se deben de realizar las siguientes
tres actividades para finalmente obtener una solución
considerada como final:

A partir de la matriz de factores No rotada se debe


seleccionar el número de factores a extraer según el
criterio seleccionado.

Rotar la matriz de factores para mejorar las


condiciones de interpretación.

Reespecificar el modelo de factores en caso de ser


necesario.
Rotación de Factores

La matriz de factores contiene factor loadings para


cada una de las variables en cada uno de los factores.

El primer factor extraído es la mejor combinación


lineal de variables exhibidos por el data set.

El segundo factor extraído es la segunda mejor


combinación lineal de variables, esto sujeto a que este
factor sea ortogonal del primer factor.

Ortogonal= ser ortogonal significa que el factor


siguiente deriva de la varianza residual una vez
extraído el anterior factor.
Rotación de la Matriz de Factores

La matriz de factores NO rotada, el resultado inicial de


un análisis de factores, cumple el objetivo de
reducción de información una vez que por algún
criterio se extrae cierto número de factores.

Sin embargo en la mayoría de las ocasiones la anterior


matriz no se encuentra en el “mejor formato” para la
interpretación de la estructura de las variables
involucradas.

Lo anterior conduce a que se debe de realizar un


procedimiento de rotación de la matriz de
factores.
Rotación de la Matriz de Factores

Una importante herramienta en la interpretación de


cada uno de los factores es la rotación de factores.

¿Porqué? = la idea es redistribuir la varianza de los


primeros factores hacia los últimos factores, esto
ayuda en la agrupación de variables de manera
significativa en los diversos factores extraídos y ayuda
en el análisis de la estructura del data set.
Rotación de la Matriz de Factores

Hay dos algoritmos o procedimientos de rotación de la


matriz de factores:

Rotación ortogonal

Rotación oblicua

Esta es otra situación en la cual el usuario de


análisis de factores debe de tomar una decisión
de que algoritmo seleccionar para la rotación.
Rotación de la Matriz de Factores

En la práctica el objetivo de todos los algoritmos de


rotación es el de simplificar los renglones y columnas
de la matriz de factores para con ello facilitar su
interpretación. Es decir asociar con mayor claridad las
variables a los diferentes factores vía una
“reorganización” de los factors loadings.

Simplificar renglones y columnas = intensificar los


valores de los factors loadings, es decir, volver
mínimos o tendiendo a CERO la mayor cantidad de
ellos en paralelo a que se resalte un valor ya sea por
columna (factor) o renglón (loadings) para que se
vuelva lo más elevado posible.
Rotación de la Matriz de Factores

Métodos de rotación ortogonal

Quartimax (simplificación de renglones)


Varimax (simplificación de columnas)
Equimax (simplificación tanto de renglones como
columnas)

El método más utilizado y generalmente aceptado


como útil para lograr una matriz rotada que pueda
facilitar la interpretación de los factores es el método
de Varimax.
Rotación de la Matriz de Factores

Métodos de rotación oblicua

Son similares a los ortogonales, con la diferencia de


que la rotación oblicua permite la correlación entre
factores en lugar de mantener independencia entre
ellos como los métodos ortogonales. En nuestro
paquete el OBLIMIN es la opción disponible.

Los resultados son comparables a los ortogonales, sin


embargo si se opta por rotación oblicua se debe de
tener especial atención en su validación.
Criterios para evaluar la significancia de los
factors loadings de una matriz de factores
rotada

Asegurar una significancia práctica: una “regla de


dedo” es identificar si los factors loadings son mayores
a .3 (con signo + o -). Si lo anterior es cierto, se
estaría estableciendo que el factor loading cumple
minimamente para con la significancia práctica. Factor
loadings de .8 o mayores son muy raros o atípicos de
encontrar, esto cuando tenemos observaciones > 100.

Como el factor loading es la correlación de la variable


con el factor, lo anterior al cuadrado es el % de
varianza explicada por la variable …. .3 = 10%.
Criterios para evaluar la significancia de los
factors loadings de una matriz de factores
rotada

Asegurar una significancia estadística: investigación


previa ha demostrado que los factors loadings tienen
errores estándar considerablemente más altos que las
típicas correlaciones, por consiguiente se requiere ser
más estrictos a la hora de evaluar su significancia
estadística.

La cantidad de observaciones en el data set esta


relacionada inversamente con la magnitud del factor
loading para ser considerado significativo a cierto nivel
de significancia.
Criterios para evaluar la significancia de los
factors loadings de una matriz de factores
rotada

Sin embargo ninguno de los anteriores acercamientos


toma en cuenta de que factor estamos hablando, es el
primero? Es el segundo? Tampoco se ha considerado
el número de variables involucradas.

Se estima que para evaluar la significancia estadística


de una variable del segundo factor o los siguientes, se
debe de elevar el grado de exigencia.

Si el número de variables aumenta la exigencia


disminuye.
Criterios para evaluar la significancia de los
factors loadings de una matriz de factores
rotada

En resumen:

Mas grande el número de observaciones disponibles,


menor el factor loading para ser considerado
significativo.

Mayor número de variables en el análisis, menor el


factor loading para ser considerado significativo.

Mayor número de factores extraídos, se requiere que


en el segundo en adelante que los factor loadings
sean mayores.
Interpretación de una matriz de factores rotada

La interpretación incluye principalmente:

La identificación del factor loading más elevado


por variable, es decir una lectura y análisis de la
matriz rotada de izq. a der. partiendo de la parte
superior izquierda de la matriz ....

Como procedimiento ve subrayando lo anterior si el


factor loading es significativo para cada una de las
variables del análisis.

Ahora habrá que identificar para cada variable y en


cada factor cuando su factor loading sea significativo.
Interpretación de una matriz de factores rotada

La interpretación incluye principalmente:

En ocasiones la interpretación y análisis no es tan simple,


puede ser que nos alejemos del escenario ideal, es decir
….. Que cada una de las variables tenga solo un factor
loading alto y significativo en uno solo de los factores … el
no tener lo anterior complica las cosas cuando se nos
presenta por ejemplo el que una variable registre factor
loadings altos o medianamente altos y significativos todos
en varios factores. Una variable así puede ser candidata a
salir del análisis, sobre todo si estamos sumarizando y
entendiendo la estructura subyacente de la matriz y que
luego tendremos que ponerle nombre a los factores.
Interpretación de una matriz de factores rotada

La interpretación incluye también:

Evaluar las comunalidades (communalities) de las


variables .... Una vez realizado lo de la filmina anterior
(identificar el factor loading mas alto y significativo por
variable y los factors loadings significativos), se debe de
identificar si hay una o varias variables que no han sido
subrayadas y por ende no son significativas en ningún
factor (no cargaron en ningún factor).

La comunalidad para cada variable es proveída por el


paquete estadístico y representa la cantidad de varianza
que una variable original comparte con el resto de las
variables incluidas en el análisis, un mínimo sería ……
Interpretación de una matriz de factores rotada

Observar si las comunalidades de las variables


sobre pasan o no el .5 (revelando con ello que la
varianza que comparte cada variable con el resto de las
variables es cuando menos del 50%). Variables con
comunalidades menores a .5 se dice que no tienen
suficiente poder de explicación en la solución de factores
correspondiente.

Si hay variables que no cargan en ningún factor o que su


comunalidad es considerada baja, hay dos grandes
caminos que la interpretación de la matriz de factores
rotada nos puede conducir .....
Interpretación de una matriz de factores rotada

1. Interpretar la solución así y simplemente ignorar esas


variables o

2. Evaluar individualmente la posibilidad de eliminar esas


variables.

Ignorar las variables puede ser apropiado si el objetivo es


solamente reducción de información, aunque no hay
que olvidar que esas variables están pobremente
representadas en la solución de factores.

Considerar la posibilidad de eliminar variables implica


observar las siguientes cuestiones relevantes ……
Interpretación de una matriz de factores rotada

Eliminando variables

Hay que evaluar la contribución de cada variable en


términos conceptuales no solamente, en su
comunalidad. Si se trata de una variable de corte
secundario (no prioritaria conceptualmente) y además
con una pobre comunalidad (debajo de .5), se nos
facilita la decisión de eliminarla y reespecificar así el
modelo de factores para poder estimarlo de nuevo y
obtener una solución de factores acorde al nuevo set
de variables.
Interpretación de una matriz de factores rotada

Un último uso, y que es una parte importante del


objetivo de sumarización de datos y análisis de
estructuras subyacentes viene siendo:

“Ponerle Nombre a los Factores”

La variable con el más alto factor loading y


obviamente significativo lleva mano en el esfuerzo por
identificar con alguna frase o característica al factor.
Después entrarían en juego el conjunto de variables
en segundo o tercer lugar en tamaño de factor
loadings.
Interpretación de una matriz de factores rotada

“Ponerle Nombre a los Factores”

Catalogar los factores es un trabajo del usuario de la


técnica, esto no es proveído por el paquete, aquí se
eleva la importancia de estar “bien empapado” del
problema o del asunto relevante, detrás de un análisis
de factores en particular.

En ocasiones no se le puede poner nombre a un


factor, este se encuentra indefinido en términos
conceptuales mas no estadísticos y fue valida su
extracción también. ¿Entonces que hacer?
Etapa 6: Validación

Esta etapa se trabaja cuando se esta desarrollando un


análisis de factores confirmatorio, que no es común de
encontrar en la literatura y controversial.

Etapa 7: Usos adicionales del Análisis de


Factores

Esta etapa se presentará en la siguiente sesión - pptx.

También podría gustarte