Está en la página 1de 45

Anlisis de componentes principales

Componentes principales. Anlisis factorial


La obtencin de un factor de solucin a travs del anlisis de componentes principales es un proceso iterativo que por lo general requiere de repetir el procedimiento de anlisis factorial en SPSS varias veces para llegar a una solucin satisfactoria Comenzamos por identificar un grupo de variables cuya varianza creemos puede ser representado ms parsimoniosamente por un conjunto ms pequeo de factores o componentes. El resultado final del anlisis de componentes principales nos dir qu variables pueden ser representadas por cuales componentes y qu variables se deben conservar como variables individuales debido a que el factor de solucin no representa adecuadamente su informacin.

Estrategia para resolver los problemas (1)


Un anlisis factorial de componentes principales requiere:
Las variables incluidas deben estar a nivel del sistema mtrico o dicotmica (codificado dummy) nivel nominal El tamao de la muestra debe ser superior a 50 (preferiblemente 100) El ratio de caso por variable debe ser de 5 a 1 o superior La matriz de correlacin para las variables deben contener 2 o ms correlaciones de 0,30 o mayores Las variables con las medidas de adecuacin muestral inferior a 0,50 se deben retirar La medida global de adecuacin muestral es de 0,50 o superior La prueba de esfericidad de Bartlett es estadsticamente significativa

La primera fase de un anlisis de componentes principales se dedica a verificar que cumplen con estos requisitos. Si no cumplimos con estos requisitos, el anlisis factorial no es apropiado

Estrategia para resolver los problemas (2)


La segunda fase de un anlisis factorial de componentes principales se centra en obtener un modelo de factores, o patrn de relaciones entre variables y componentes que satisfaga los siguientes requisitos:
Los componentes derivados explican 50% o ms de la varianza en cada una de las variables, es decir, tienen una comunalidad mayor que 0,50 Ninguna de las variables tienen cargas o correlaciones, de 0,40 o superior para ms de un componente, es decir, no tienen una estructura compleja Ninguno de los componentes tiene slo una variable en l

Para cumplir estos requisitos, eliminamos las variables problemticas del anlisis y repetimos el anlisis de componentes principales.

Estrategia para resolver los problemas (3)


Si, en la conclusin de este proceso, tenemos componentes que tienen ms de una carga variable en ellos, tienen componentes que explican al menos el 50% de la varianza en las variables incluidas, y tienen componentes que, en conjunto explican ms de 60% de la variacin en el conjunto de variables, podemos sustituir los componentes para las variables en los anlisis adicionales Las variables que se han eliminado en el anlisis deben ser incluidos individualmente en nuevos anlisis La sustitucin de componentes para las variables individuales se lleva a cabo mediante el uso de slo la variable de carga ms alta, o mediante la combinacin de las variables de la carga a cada componente para crear una nueva variable.

Notas - 1
Para evaluar las medidas de adecuacin muestral, comunalidades, o factor de cargas, ignoramos el signo del valor numrico y basamos nuestra decisin sobre el tamao o la magnitud del valor. El signo del nmero indica la direccin de la relacin. Una carga de -0.813 es tan fuerte como una carga de 0.813. El signo menos indica una relacin negativa o inversa, la ausencia de un signo pretende implicar un signo ms indica una relacin directa o positiva.

Notas - 2
Si hay dos o ms componentes en la matriz de componentes, el patrn de cargas se basa en la Matriz de componentes rotados de SPSS. Si slo hay un componente en la solucin, la Matriz de componentes rotados no se calcula, y el patrn de cargas se basa en la matriz de componentes. Es posible que el anlisis se descomponga (fracase) y tendremos muy pocas variables en el anlisis para apoyar el uso de anlisis de componentes principales.

Problema 1
En el conjunto de datos GSS2000.sav, es la siguiente enunciacin verdadera, falso, o una aplicacin incorrecta de una estadstica? Responde a la pregunta sobre la base de los resultados de un anlisis de componentes principales antes de la prueba para los valores atpicos, la validacin de muestras separadas, y una prueba de fiabilidad. Supongamos que no hay un patrn problemtico de los datos que faltan. Utilice un nivel de significacin de 0,05. Con base en los resultados de un anlisis de componentes principales de las 8 variables afirmaciones sobre las amenazas ambientales son exageradas" [grnexagg], "peligro para el medio ambiente de los genes modificadores en los cultivos" [genegen], "Estados Unidos hace lo suficiente para proteger el medio ambiente" [amprogrn ], "debe haber acuerdos internacionales sobre problemas del medio ambiente" [grnintl], de los pases ms pobres se debe esperar que hagan menos por el medio ambiente" [ldcgrn], "el progreso econmico en los Estados Unidos se ralentizar, sin mayor preocupacin por el medio ambiente" [econgrn], "probabilidad de que la central nuclear dae el medio ambiente en los prximos 5 aos" [nukeacc], y "ndice socioeconmico del entrevistado" [sei], la informacin de estas variables se puede representar con 2 componentes y 4 variables individuales. El componente 1 incluye las variables "peligro para el medio ambiente de la modificacin de los genes en los cultivos" [genegen] y "probabilidad de que la central nuclear dae el medio ambiente en los prximos 5 aos" [nukeacc]. El componente 2 incluye las variables "las afirmaciones sobre las amenazas ambientales son exageradas" [grnexagg] y "los pases ms pobres se debe esperar a hacer menos por el medio ambiente" [ldcgrn]. Las variables "ndice socioeconmico del entrevistado" [sei], "el progreso econmico en los Estados Unidos se ralentizar, sin mayor preocupacin por el medio ambiente" [econgrn], "debe haber acuerdos internacionales sobre problemas del medio ambiente" [grnintl], y "Estados Unidos hace lo suficiente para proteger el medio ambiente "[amprogrn] no fueron incluidos en los componentes y se mantienen como variables individuales. 1. 2. 3. 4. Verdadero Verdadero con precaucin Falso Inapropiado aplicacin de una estadstica

Clculo un anlisis de componentes principales en SPSS

Para calcular un anlisis de components principals en SPSS, seleccione la Reduccin de dimensiones/Factor comando en el men Analizar

Agregue las variables para el anlisis

Segundo, click sobre el botn Descriptivos para especificar estadsticas a incluir en la salida.

Primero, mueve las variables citadas en el problema al cuadro de lista variables

Complete el cuadro de dilogo Descriptivos


Segundo, mantener la casilla Solucin inicial para obtener las estadsticas necesarias para determiner el nmero de factores a extraer Primero, marque la casilla de verificacin Descriptivos univariados para obtener un recuento de casos validos.

Tercero, marque la casilla de verificacin Coeficientes para obtener una matriz de correlacin, una de las salidas necesarias para evaluar la conveniencia del anlisis factorial para las variables Sexto, click sobre el botn Continuar

Quinto, marque la casilla de verificacin Anti-imagen para obtener ms salidas que se utilizan para evaluar la conveniencia del anlisi factorial de las variables.

Cuarto, marcar la casilla KMO y prueba de esfericidad de Bartlett para obtener ms salidas que se utilizan para evaluar la conveniencia del anlisi factorial para las variables.

Seleccionar el mtodo de extraccin

Primero, click sobre el botn extraccin para especificar estadsticas a incluir en la salida

El mtodo de extraccin se refiere al mtodo matemtico que SPSS usa para calcular los factores o componentes

Complete el cuadro de dilogo de extraccin


Primero, retener el mtodo de los Componentes principals que est por defecto.

Segundo, click sobre el botn Continuar

Seleccionar el mtodo de rotacin

Primero, click sobre el botn Rotacin para especificar estadsticos que se incluirn en la salida.

El mtodo de rotacin se refiere al mtodo matemtico con el que SPSS rota los ejes en el espacion geomtrico. Esto hace que sea ms fcil determinar que variables estan cargadas sobre qu componentes

Complete el cuadro de dilogo de rotacin

Primero, marque el mtodo Varimax como el tipo de rotacin que a usar en el anlisis

Segundo, click sobre el botn Continuar

Complete la solicitud para el anlisis

Primero, click sobre el botn Aceptar para pedir la salida de SPSS

Nivel de medicin requerido


La respuesta a ndice socioeconmico" [sei] es una variable de nivel de intervalo, que satisfacen el nivel de los requisitos de medicin para un anlisis de componentes principales "Las afirmaciones sobre las amenazas ambientales son exageradas" [grnexagg], "peligro para el medio ambiente de la modificacin de los genes en los cultivos" [genegen], "Estados Unidos hace lo suficiente para proteger el medio ambiente" [amprogrn], "debe haber acuerdos internacionales sobre problemas del medio ambiente" [grnintl ], de los pases ms pobres se debe esperar que hagan menos por el medio ambiente" [ldcgrn], "el progreso econmico en los Estados Unidos se ralentizar, sin mayor preocupacin por el medio ambiente" [econgrn], y probabilidad de que la central nuclear dae el medio ambiente en los prximos 5 aos "[nukeacc] son variables de nivel ordinal. Si seguimos la convencin de tratamiento de las variables de nivel ordinales como variables mtricas, el nivel de exigencia de la medicin para el anlisis de componentes principales se satisface. Debido a que algunos analistas de datos no estn de acuerdo con esta Convencin, una nota de cautela debe ser incluido en nuestra interpretacin.

Requisito de tamao de la muestra: Nmero mnimo de casos

El nmero de casos vlidos para este conjunto de variables es 67 Si bien el anlisis de componentes principales se realiz sobre una muestra que cuenta con menos de 100 casos, pero ms de 50 casos, debemos ser cautelosos acerca de su interpretacin

Requisito de tamao de la muestra: Proporcin de casos a variables

La proporcin de casos de variables en un anlisis de componentes principales debe ser al menos de 5 a 1. Con 67 y 8 las variables, la proporcin de los casos a las variables es de 8,4 a 1, que excede el requisito de la relacin de los casos a las variables.

Adecuacin del anlisis factorial: Presencia de correlaciones sustanciales


Anlisis de componentes principales requiere que haya algunas correlaciones superiores a 0,30 entre las variables incluidas en el anlisis. Para este conjunto de variables, hay 10 correlaciones en la matriz superior a 0,30, que satisfacen esta exigencia. Las correlaciones superiores a 0,30 se resaltan en amarillo.

Adecuacin del anlisis factorial: Adecuacin muestral de las variables individuales


El anlisis de componentes principales requiere que la medida de Kaiser-MeyerOlkin de adecuacin muestral sea superior a 0.50 para cada variable individual, as como el conjunto de variables. La medida de adecuacin muestral (MSA) se describe como maravillosa si es 0.90 o mayor, meritoria si se encuentra en los 0.80, regular si en los 0.70, mediocre, si en el de los 0.60, miserable si en los 0.50, e inaceptable si est por debajo de 0.50

Hay dos matrices antiimagen: la matriz de covarianza anti-imagen y la matriz de correlaciones antiimagen. Estamos interesados en la matriz de correlaciones anti-imagen.

Adecuacin del anlisis factorial: Adecuacin muestral de las variables individuales


SPSS ubica las medidas de adecuacin de muestreo que estn en la diagonal de la matriz de correlaciones antiimagen, resaltadas en amarillo.

En la iteracin 1, la MSA para la variable "ndice socioeconmico del entrevistado" [sei] fue 0.410, que era inferior a 0,50, por lo que se elimin del anlisis.

Excluyendo una variable del anlisis factorial

Para remover la variable ndice socioeconmico del encuestado [sei] del anlisis, click sobre el botn de la herramienta Recuperar los cuadros de dilogos recientes para accede al menu desplegable.

Repitiendo el anlisis factorial

En el menu desplegable, seleccionar Anlisis Factorial para reabrir el cuadro de dilogo del Anlisis Factorial

Removiendo la variable de la lista de variables

First, resaltar (clic) la variable sei.

Segundo, haga clic en el botn de flecha izquierda para eliminar la variable de la lista Variables.

Replicando el anlisis factorial

El comando Recuperar los cuadros de dilogos recientes abre el cuadro de dilogo con todas las opciones que habamos seleccionado la ltima vez que se utiliz el anlisis factorial. Para replicar el anlisis sin la variable que hemos eliminado, haga clic en el botn Aceptar.

Adecuacin del anlisis factorial: adecuacin de la muestra para el anlisis factorial revisado
En el anlisis factorial con la variable sei eliminada, se observa que las medidas de adecuacin muestral de las variables restantes son todas superiores a 0,50.

En la iteracin 2, el MSA para todas las variables individuales todava incluidas en el anlisis fue mayor que 0,5, el apoyo a su retencin en el anlisis.

Adecuacin del anlisis factorial: adecuacin de la muestra para el grupo de variables

Los siete variables restantes en el anlisis cumplen los criterios de idoneidad del anlisis factorial.

Adems, la MSA en conjunto para el conjunto de variables incluidas en el anlisis fue de 0,734, que excede el requisito mnimo de 0,50 para la MSA general.

Adecuacin del anlisis factorial: test de esfericidad de Bartlett

El anlisis de componentes principales requiere que la probabilidad asociada a la prueba de esfericidad de Bartlett sea menor que el nivel de significancia. La probabilidad asociada con la prueba de Bartlett es <0,001, que satisface este requisito. El siguiente paso es determinar el nmero de factores que deben ser incluidos en el factor solucin.

Nmero de factores a extraer: Criterio de la raz latente

También podría gustarte