Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tema 3
Tema 3
examen de la matriz de correlaciones 3.5. matriz factorial. autovalores. comunalidades. 3. . numero de factores a conservar 3.!. rotaciones factoriales 3.". interpretacin de los factores
Anlisis Factorial #l anlisis factorial es una t$cnica %ue consiste en resumir la informacin contenida en una matriz de datos de m varia&les ' X1 , X2 , ... X m ). (ara ello se identifican un reducido n)mero de factores* menor %ue el n)mero de varia&les. +os factores representarn a las varia&les* con una p$rdida m,nima de informacin. -i concretamos a un modelo de 5 varia&les o&servadas de las %ue lle.amos a 2 factores su&/acentes* la expresin al.e&raica / .rfica del modelo ser,a0 X1= X2= X3= X4= X5= a11 a21 a31 a41 a51 F1 F1 F1 F1 F1 + a12 + a22 + a32 + a42 + a52 F2 F2 F2 F2 F2 + + + + + d 1V1 d 2V2 d 3V3 d 4V4 d 5V5
-iendo X i j la puntuacin del individuo i en la varia&le 1 F $ el 23esimo factor com)n a j k puntuaciones factoriales es el peso de la re.resin del factor 2 en la varia&le 1. Tam&i$n se las llama car.as factoriales o saturacin de la varia&le 1 en el factor 2 V j es el factor )nico de cada varia&le d j es la discrepancia existente entre la puntuacin o&servada / el valor %ue dar,a la relacin funcional exacta -e asume %ue los factores )nicos no estn correlacionados entre s, ni con los factores comunes. -e puede distin.uir entre Anlisis Factorial e" loratorio * donde no se conocen los factores 4a priori4* %ue se calculan mediante el anlisis Factorial / anlisis Factorial %onfirmatorio donde se propone 4a priori4 un modelo* se.)n el cual ha/ unos factores %ue representan a las varia&les ori.inales* siempre ha/ mas varia&les %ue factores / se somete a compro&acin el modelo. (ara %ue el anlisis factorial ten.a sentido hacen falta dos condiciones0 &arsimonia e inter reta'ilidad. -e.)n el principio de parsimonia los fenmenos de&en explicarse con el 1
menor n)mero de elementos posi&les* por lo %ue cuanto menos factores ten.amos me1or. (ero adems estos factores de&en poder ser interpretados mediante teor,a sustantiva. 5na &uena solucin factorial es siempre sencilla e interpreta&le. Antecedentes (ist)ricos. +os antecedentes del Anlisis Factorial se encuentran en las t$cnicas de re.resin lineal* iniciadas por Galton. 5n continuador su/o fue K. Pearson '16718* %ue present la primera propuesta del 4m$todo de componentes principales4* primer paso para el clculo del Anlisis Factorial. #l ori.en del Anlisis Factorial suele atri&uirse a Spearman '16748* en su clsico tra&a1o so&re inteli.encia* donde distin.ue un factor .eneral 'factor 98 / cierto n)mero de factores espec,ficos. Hotelling '16338* desarroll un m$todo de extraccin de factores so&re la t$cnica de 4componentes principales4. Thurstone '164!8* expres la relacin entre las correlaciones / las saturaciones de las varia&les en los factores. :ntrodu1o el concepto de estructura simple. Tam&i$n desarroll la teor,a / m$todo de las rotaciones factoriales para o&tener la estructura factorial ms sencilla. #n un principio las rotaciones eran .rficas. Kaiser '165"8 desarroll el m$todo ;arimax para realizar rotaciones orto.onales mediante procedimientos matemticos. A lo lar.o del desarrollo histrico del Anlisis Factorial se han planteado al.unos ro'lemas de fondo %ue han dado lu.ar a distintas propuestas de solucin. +os aspectos ms pol$micos han sido0 a3 +a estimacin de las comunalidades. *com!nalidad *( 2)# proporcin de la varianza total explicada por los factores comunes en una varia&le8 &3 +os m$todos de extraccin de factores. c3 #l n)mero de factores a extraer. d3 +os m$todos de rotacin de factores. -e han propuesto m)ltiples m$todos para la extraccin de factores* compro&ndose %ue ha&,a distintas soluciones al mismo pro&lema* se.)n el m$todo %ue se adoptase. <on esto se plantea el dilema de %u$ m$todo ele.ir. +as respuestas han sido distintas se.)n las diversas tendencias. #l m$todo de %om onentes &rinci ales suele ser el ms utilizado. A+A,-.-. FA%/01-A, 2s %03&0+E+/E. &1-+%-&A,E.. #l Anlisis Factorial / el Anlisis de <omponentes (rincipales estn mu/ relacionados. Al.unos autores consideran el se.undo como una etapa del primero / otros los consideran como t$cnicas diferentes. #l Anlisis de %om onentes &rinci ales trata de hallar componentes 'factores8 %ue sucesivamente expli%uen la ma/or parte de la 2arian4a total. (or su parte el Anlisis Factorial &usca factores %ue expli%uen la ma/or parte de la 2arian4a com5n. #n el Anlisis Factorial se distin.ue entre varianza com)n / varianza )nica. +a 2arian4a com5n es la parte de la variacin de la varia&le %ue es compartida con las otras varia&les. +a 2arian4a 5nica es la parte de la variacin de la varia&le %ue es propia de esa varia&le. #l Anlisis de <omponentes (rincipales no hace esa distincin entre los dos tipos de varianza* se centra en la varianza total. =ientras %ue el Anlisis de %om onentes &rinci ales &usca hallar com&inaciones lineales de las varia&les ori.inales %ue expli%uen la ma/or parte de la 2ariaci)n total* el Anlisis Factorial pretende hallar un nuevo con1unto de varia&les 'factores8* menor en n)mero %ue las varia&les ori.inales* %ue exprese lo %ue es com)n a esas varia&les. #l Anlisis Factorial supone %ue existe un factor com)n su&/acente a todas las varia&les* el Anlisis de <omponentes (rincipales no hace tal asuncin. 2
#n el Anlisis de %om onentes &rinci ales * el primer factor o componente ser,a a%uel %ue explica una ma/or parte de la varianza total* el se.undo factor ser,a a%uel %ue explica la ma/or parte de la varianza restante* es decir* de la %ue no explica&a el primero / as, sucesivamente. >e este modo ser,a posi&le o&tener tantos componentes como varia&les ori.inales aun%ue esto en la prctica no tiene sentido. ?a/ pues dos .randes tendencias0 a. Anlisis de <omponentes (rincipales. &. Anlisis factorial* dentro del cual existen diferentes m$todos. Ante la variedad de m$todos %ue existen dentro del Anlisis Factorial. @im / =ueller '16!"8 recomiendan utilizar el de mxima verosimilitud o el de m,nimos cuadrados. &A.0. E+ E, A+A,-.-. FA%/01-A, Tras compro&ar %ue se cumplen los supuestos del Anlisis factorial* 'los datos de&er,an ser intevalares o de razn / provenir de distri&uciones multinormales8 los pasos a se.uir son0 13 <alcular la matriz de correlaciones ' A 8 entre todas las varia&les / examinarla. 23 #xtraccin de los factores necesarios para representar los datos. 33 Aotacin de los factores con o&1eto de facilitar su interpretacin. Aepresentacin .rfica. 43 <alcular las puntuaciones factoriales de cada individuo. #n realidad slo los dos primeros pasos son indispensa&les* el 3B / 4B son un complemento. EXA3E+ 6E ,A 3A/1-7 6E %011E,A%-0+E. #l primer paso en el Anlisis Factorial ser calcular la matriz de correlaciones entre todas las varia&les %ue entran en el anlisis. >e tal forma %ue tendremos una matriz del tipo 0
X1 X1 X2 X3 X4 X5 X6 X2 X3 X4 X5 0.45 0.73 0.84 0.76 1 0.59 X6 0.63 0.40 0.68 0.92 0.59 1 1 0.50 0.65 0.70 0.5 1 0.30 0.82 0.65 0.30 1 0.38 0.70 0.82 0.38 1 0.45 0.73 0.84 0.76 0.63 0.49 0.68 0.92
5na vez %ue se dispone de esta matriz ha/ %ue examinarla para compro&ar si sus caracter,sticas son adecuadas para realizar un Anlisis Factorial. 8no de los re9!isitos 9!e de'en c!m lirse ara 9!e el Anlisis Factorial tenga sentido es 9!e las 2aria'les est:n altamente correlacionadas. ?a/ varios m$todos para compro&ar el .rado de asociacin entre las varia&les0 3 El determinante de la matriz de correlaciones 0 un determinante mu/ &a1o indicar altas intercorrelaciones entre las varia&les* pero no de&e ser cero 'matriz no sin.ular8* pues esto indicar,a %ue al.unas de las varia&les son linealmente dependientes / no se podr,an realizar ciertos clculos necesarios en el Anlisis Factorial. 3 Test de Esfericidad de Bartlett0 <omprue&a %ue la matriz de correlaciones se a1uste a la matriz identidad ( I ), es decir ausencia de correlacin si.nificativa entre las varia&les. #sto si.nifica %ue la nu&e de puntos se a1usta a una esfera perfecta* expresando la hiptesis nula por0 ?o0 1 C I es decir* %ue el determinante de la matriz de correlaciones es 1. ?o0 D 1D C 1 +a formula correspondiente asume la si.uiente expresin0 3
v Cn)mero de varia&les.
A Cmatriz de correlaciones .
si se acepta la hiptesis nula 'pK7.758 si.nifica %ue las varia&les no estn intercorrelacionadas / por tanto no tiene mucho sentido llevar a ca&o un Anlisis Factorial. #s mu/ )til cuando el tamaJo muestral es pe%ueJo. ; Indice KMO de Kaiser-Meyer-Olkin#
L
@=N C
L r 2 i1 L r 2 i1 H L L a 2 i1
iM1
iM1 33333333333333333333333333333333333333333333333333333333333333
L
iM1
donde
;alores &a1os del ,ndice @=N desaconse1an la utilizacin de Anlisis Factorial. <omo &aremo para interpretar el ,ndice @=N podr,a tomarse se.)n @aiser0
1 0.9 0.8 0.7 0.6 >= >= >= >= >= KMO KMO KMO KMO KMO KMO >= >= >= >= > <= 0.9 0.8 0.7 0.6 0.5 0.5 muy bueno bueno mediano mediocre bajo muy bajo
Correlacin Anti-imagen0 %ue es el ne.ativo del coeficiente de correlacin parcial* de&er ha&er pocos coeficientes altos para %ue sea razona&le aplicar el Anlisis Factorial. Medida de Adecuacin de la Muestra (M A! #valores &a1os de este ,ndice desaconse1an el uso del Anlisis Factorial. Correlacin M"lti#le* %ue de&er ser alta. #l anlisis factorial* por defecto* toma los valores de la correlacin m)ltiple al cuadrado como los valores iniciales de comunalidad.
3A/1-7 FA%/01-A, A partir de la matriz de correlaciones* el Anlisis Factorial extrae otra matriz* la matri4 factorial* %ue reproduce la primera de forma ms sencilla / tiene la forma si.uiente0 1 2
1 2 3 4 5 6 P11 P12 P13 P14 P15 P16 P21 P22 P23 P24 P25 P26
<ada columna es un factor / ha/ tantas filas como varia&les ori.inales. +os elementos ( i1 pueden interpretarse como ,ndices de correlacin entre el factor i / la varia&le 1* aun%ue estrictamente slo son correlaciones cuando los factores no estn correlacionados entre s,* es decir* son orto.onales. #stos coeficientes reci&en el nom&re de pesos* car.as* ponderaciones o saturaciones factoriales. +os pesos factoriales indican el peso de cada varia&le en cada factor. +o ideal es %ue cada varia&le car.ue alto en un factor / &a1o en los dems. A8/0VA,01E. *VA,01E. &10&-0.) #l cuadrado de una car.a o peso factorial indica la proporcin de la varianza explicada por un factor en una varia&le particular. +a suma de los cuadrados de los pesos de cual%uier columna de la matriz factorial son los autovalores ' O 28* indica la cantidad total de varianza %ue explica ese factor para las varia&les consideradas como .rupo. +as car.as factoriales pueden tener como valor mximo 1* por tanto el valor mximo %ue puede alcanzar el autovalor 'valor propio8 es i.ual al n)mero de varia&les. -i dividimos el autovalor entre el n)mero de varia&les nos indica la proporcin 'tanto por ciento si multiplicamos por 1778 de la varianza de las varia&les %ue explica el factor.
1 2 3 4 5 6 P11 P12 P13 P14 P15 P16 + + P21 P22 P23 P24 P25 P26
O1 O2
P1j 2 P2j 2
; ( O1
F n 8 C varianza explicada por el primer factor n 8 C varianza explicada por el se.undo factor
; ( O2 F
%038+A,-6A6E. -e denomina 4com!nalidad4 a la proporcin de la varianza explicada por los factores comunes en una varia&le. ,a com!nalidad *(2) es la s!ma de los esos factoriales al c!adrado en cada !na de las filas. +a matriz %ue reco.e los pesos factoriales 'saturaciones8* las comunalidades 'en la dia.onal8 / los autovalores se denomina matriz de patrones factoriales / coincide con la matriz de estructura factorial cuando los factores son orto.onales. <omo la comunalidad no se puede sa&er hasta %ue se conocen los factores* $ste resulta ser uno de los pro&lemas del Anlisis Factorial. #n el Anlisis de <omponentes (rincipales no suponemos la existencia de nin.)n factor com)n* por lo %ue la comunalidad toma como valor inicial 1. #n los otros m$todos se utilizan diferentes modos de estimar la comunalidad inicial0 - #stimando la comunalidad por la ma/or correlacin en la fila i3$sima de la matriz de correlaciones. 3 #stimando la comunalidad por el cuadrado del coeficiente de correlacin m)ltiple entre x / las dems varia&les. '#s el %ue da el ordenador -(-- por defecto8. 3 #l promedio de los coeficientes de correlacin de una varia&le con todas las dems. +a comunalidad final de cada varia&le viene dada por0 ( = & 1< 2+ & 2< 2+ ... + &$< 2 5
+83E10 6E FA%/01E. A %0+.E1VA1 +a matriz factorial puede presentar un n)mero de factores superior al necesario para explicar la estructura de los datos ori.inales. 9eneralmente ha/ un con1unto reducido de factores* los primeros* %ue son los %ue explican la ma/or parte de la varia&ilidad total. +os otros factores suelen contri&uir relativamente poco. 5no de los pro&lemas %ue se plantean* por tanto* consiste en determinar el n)mero de factores %ue de&emos conservar* de manera %ue se cumpla el principio de parsimonia. -e han dado diversos criterios para determinar el n)mero de factores a conservar. 5no de los ms conocidos / utilizados es el criterio o regla de Kaiser '16 78 %ue indicar,a lo si.uiente0 4conser2ar solamente a9!ellos factores c!=os a!to2alores son ma=ores a la !nidad 4. #ste criterio es el %ue suelen utilizar los pro.ramas estad,sticos por defecto. (ero este criterio es .eneralmente inadecuado /a %ue tiende a so&restimar el n)mero de factores. Ntros criterios propuestos han sido por e1emplo* el Scree-test de Cattell '16 8 consistente en representar en un sistema de e1es los valores %ue toman los autovalores 'ordenadas8 / el n)mero de factor 'a&cisas8. >onde la pendiente de esta l,nea poli.onal disminu/e nos indica el n)mero de factores a retener. Velicer '16! 8 propone el m$todo =A( '=inimum Avera.e (artial8* %ue implica calcular el promedio de las correlaciones parciales al cuadrado despu$s de %ue cada uno de los componentes ha sido parcializado de las varia&les ori.inales. <uando el promedio de las correlaciones parciales al cuadrado alcanza un m,nimo no se extraen ms componentes. #ste m,nimo se alcanza cuando la matriz residual se acerca ms a una matriz identidad. 5n re%uisito para utilizar esta re.la es %ue cada uno de los componentes retenidos de&en tener al menos dos varia&les con pesos altos en ellos. Bartlett '1657* 16518 propone una prue&a estad,stica para contrastar la hiptesis nula de %ue los restantes p3m autovalores son i.uales 'siendo p el n)mero ori.inal de varia&les / m el n)mero de factores o componentes retenidos8. <ada autovalor es excluido de manera secuencial hasta %ue no puede ser rechazada la hiptesis nula a trav$s de una prue&a de Pi3 cuadrado. #l Anlisis &aralelo fue su.erido por Horn '16 58 %uien seJala %ue a nivel po&lacional los autovalores de una matriz de correlaciones para varia&les no correlacionadas tomar,an valor 1. <uando se .eneran matrices muestrales &asadas en esa matriz po&lacional por fluctuaciones de&idas al azar los autovalores excedern levemente de 1 / los )ltimos estarn li.eramente por de&a1o de 1. ?orn propone contrastar los autovalores encontrados emp,ricamente en los datos reales con los o&tenidos a partir de una matriz de varia&les no correlacionadas &asada en el mismo n)mero de varia&les %ue los datos emp,ricos / en el mismo tamaJo de muestra. +os componentes emp,ricos con autovalores superiores a los de la matriz son retenidos. #l m$todo de Aazn de ;erosimilitud* introducido por Lawley '16478* se trata de un criterio de &ondad de a1uste pensado para la utilizacin del m$todo de extraccin de mxima verosimilitud* %ue se distri&u/e se.)n Pi3cuadrado. +a l.ica de este procedimiento es compro&ar si el n)mero de factores extra,do es suficiente para explicar los coeficientes de correlacin o&servados. >e todos estos criterios los %ue parecen ha&er demostrado un me1or
funcionamiento son el =A( / el Anlisis (aralelo* sin em&ar.o tienen la desventa1a de %ue no son mu/ accesi&les en la prctica.
10/A%-0+E. FA%/01-A,E. +a matriz factorial indica* como sa&emos* la relacin entre los factores / las varia&les. -in em&ar.o* a partir de la matriz factorial muchas veces resulta dif,cil la interpretacin de los factores.
!. 1 " # % 0.6 0.5 0." $0.# !. 0.7 0.5 $0.5 0.6
<omo se ve esta matriz factorial resulta dif,cil de interpretar pues no %ueda claro en %ue factor satura cada varia&le. (ara facilitar la interpretacin se realizan lo %ue se denominan rotaciones factoriales. +a rotacin factorial pretende seleccionar la solucin ms sencilla e interpreta&le. #n s,ntesis consiste en hacer .irar los e1es de coordenadas* %ue representan a los factores* hasta conse.uir %ue se aproximen al mximo a las varia&les en %ue estn saturados. +a saturacin de factores transforma la matriz factorial inicial en otra denominada matriz factorial rotada* de ms fcil interpretacin. +a matriz factorial rotada es una com&inacin lineal de la primera / explica la misma cantidad de varianza inicial.
!. 0.91" 0.70" 0.""6 0."16 !. 0.0"6 $0.018 $0.%8# 0.6#9
<omo hemos dicho el o&1etivo de la rotacin es o&tener una solucin ms interpreta&le* una forma de conse.uirlo es intentando aproximarla al principio de estructura simple 'Thurstone* 16358. -e.)n este principio* la matriz factorial de&e reunir las si.uientes caracter,sticas0 13 <ada factor de&e tener unos pocos pesos altos / los otros prximos a 7. 23 <ada varia&le no de&e estar saturada ms %ue en un factor. 33 Qo de&en existir factores con la misma distri&ucin* es decir* los factores distintos de&en presentar distri&uciones de car.as altas / &a1as distintas. #stos tres principios en la prctica no suelen lo.rarse* lo %ue se trata es de alcanzar una solucin lo ms aproximada posi&le a ello. <on la rotacin factorial aun%ue cam&ie la matriz factorial las comunalidades no se alteran* sin em&ar.o* cam&ia la varianza explicada por cada factor. #xisten varios m$todos de rotacin %ue podemos a.rupar en dos .randes tipos0 orto.onales / o&licuos. +a correlacin entre las varia&les puede representarse como el n.ulo entre dos vectores / espec,ficamente vendr,a dada como el coseno del n.ulo entre dos vectores. As, tendremos una rotacin orto.onal cuando la correlacin entre factores sea nula o lo %ue es lo mismo* !
tienen un n.ulo de 67 .rados entre factoresR / ha&laremos de rotacin o&licua cuando la correlacin entre factores no sea nula / por tanto el n.ulo distinto de 67 .rados. +o ms recomenda&le es la rotacin orto.onal* aun%ue en el caso de %ue existan razones para pensar %ue los factores estn correlacionados entonces utilizaremos la rotacin o&licua. >e entre las rotaciones orto.onales la ms utilizada es la 2arima" 'minimiza el n)mero de varia&les %ue tienen saturaciones altas en un factor8 se.uida por la >!artima" 'minimiza el n)mero de factores necesarios para explicar una varia&le / la E9!ama" %ue es una mezcla de las dos anteriores* mientras en %ue las o&licuas es la o'limin. #n la rotacin o&licua las ponderaciones factoriales no coinciden con las correlaciones entre el factor / la varia&le* puesto %ue los factores estn correlacionados entre s,. (or eso cuando hacemos rotacin o&licua la matriz factorial no rotada se convierte en dos matrices diferentes0 la matriz de ponderaciones '%ue es la %ue se utiliza en la interpretacin8 / la matriz de correlaciones entre factores / varia&les. Tam&i$n o&tendremos otra matriz de correlaciones entre factores. -+/E1&1E/A%-0+ 6E FA%/01E. #n la fase de interpretacin 1ue.a un papel preponderante la teor,a / el conocimiento sustantivo. A efectos prcticos se su.ieren dos pasos en el proceso de interpretacin0 13 #studiar la composicin de las saturaciones factoriales si.nificativas de cada factor. 23 :ntentar dar nom&re a los factores. Qom&re %ue se de&e dar de acuerdo con la estructura de sus saturaciones* es decir* conociendo su contenido. >os cuestiones %ue pueden a/udar a la interpretacin son0 - Nrdenar la matriz rotada de forma %ue las varia&les con saturaciones altas en un factor aparezcan 1untas. 3 +a eliminacin de las car.as factoriales &a1as '.eneralmente a%uellas %ue van por de&a1o de 7*258. +lamaremos varia&le comple1a a a%uella %ue satura altamente en ms de un factor / %ue no de&e ser utilizada para dar nom&re a los factores. Factores &ipolares* son a%uellos factores en los %ue unas varia&les car.an positivamente / otras tienen car.a ne.ativa.
&8+/8A%-0+E. FA%/01-A,E. 5na vez %ue se tienen los factores puede interesar conocer %ue puntuacin o&tendr,an los su1etos en estos factores. (ara contestar a esto ha/ %ue calcular lo %ue se conoce como puntuaciones factoriales de cada individuo. #l clculo de las puntuaciones factoriales se realiza a partir de la matriz factorial rotada / se &asa en el modelo de la re.resin m)ltiple* de acuerdo con la frmula0 "
17