Está en la página 1de 10

Tema 3. Anlisis Factorial 3.1. Antecedentes histricos. 3.2.analisis factorial vs componentes principales 3.3.pasos en el analisis factorial 3.4.

examen de la matriz de correlaciones 3.5. matriz factorial. autovalores. comunalidades. 3. . numero de factores a conservar 3.!. rotaciones factoriales 3.". interpretacin de los factores

Anlisis Factorial #l anlisis factorial es una t$cnica %ue consiste en resumir la informacin contenida en una matriz de datos de m varia&les ' X1 , X2 , ... X m ). (ara ello se identifican un reducido n)mero de factores* menor %ue el n)mero de varia&les. +os factores representarn a las varia&les* con una p$rdida m,nima de informacin. -i concretamos a un modelo de 5 varia&les o&servadas de las %ue lle.amos a 2 factores su&/acentes* la expresin al.e&raica / .rfica del modelo ser,a0 X1= X2= X3= X4= X5= a11 a21 a31 a41 a51 F1 F1 F1 F1 F1 + a12 + a22 + a32 + a42 + a52 F2 F2 F2 F2 F2 + + + + + d 1V1 d 2V2 d 3V3 d 4V4 d 5V5

En general el modelo factorial se !ede e" resar# X i j = Fi 1 a j1 + Fi 2 aj 2 + ... a jk + V ij dj

-iendo X i j la puntuacin del individuo i en la varia&le 1 F $ el 23esimo factor com)n a j k puntuaciones factoriales es el peso de la re.resin del factor 2 en la varia&le 1. Tam&i$n se las llama car.as factoriales o saturacin de la varia&le 1 en el factor 2 V j es el factor )nico de cada varia&le d j es la discrepancia existente entre la puntuacin o&servada / el valor %ue dar,a la relacin funcional exacta -e asume %ue los factores )nicos no estn correlacionados entre s, ni con los factores comunes. -e puede distin.uir entre Anlisis Factorial e" loratorio * donde no se conocen los factores 4a priori4* %ue se calculan mediante el anlisis Factorial / anlisis Factorial %onfirmatorio donde se propone 4a priori4 un modelo* se.)n el cual ha/ unos factores %ue representan a las varia&les ori.inales* siempre ha/ mas varia&les %ue factores / se somete a compro&acin el modelo. (ara %ue el anlisis factorial ten.a sentido hacen falta dos condiciones0 &arsimonia e inter reta'ilidad. -e.)n el principio de parsimonia los fenmenos de&en explicarse con el 1

menor n)mero de elementos posi&les* por lo %ue cuanto menos factores ten.amos me1or. (ero adems estos factores de&en poder ser interpretados mediante teor,a sustantiva. 5na &uena solucin factorial es siempre sencilla e interpreta&le. Antecedentes (ist)ricos. +os antecedentes del Anlisis Factorial se encuentran en las t$cnicas de re.resin lineal* iniciadas por Galton. 5n continuador su/o fue K. Pearson '16718* %ue present la primera propuesta del 4m$todo de componentes principales4* primer paso para el clculo del Anlisis Factorial. #l ori.en del Anlisis Factorial suele atri&uirse a Spearman '16748* en su clsico tra&a1o so&re inteli.encia* donde distin.ue un factor .eneral 'factor 98 / cierto n)mero de factores espec,ficos. Hotelling '16338* desarroll un m$todo de extraccin de factores so&re la t$cnica de 4componentes principales4. Thurstone '164!8* expres la relacin entre las correlaciones / las saturaciones de las varia&les en los factores. :ntrodu1o el concepto de estructura simple. Tam&i$n desarroll la teor,a / m$todo de las rotaciones factoriales para o&tener la estructura factorial ms sencilla. #n un principio las rotaciones eran .rficas. Kaiser '165"8 desarroll el m$todo ;arimax para realizar rotaciones orto.onales mediante procedimientos matemticos. A lo lar.o del desarrollo histrico del Anlisis Factorial se han planteado al.unos ro'lemas de fondo %ue han dado lu.ar a distintas propuestas de solucin. +os aspectos ms pol$micos han sido0 a3 +a estimacin de las comunalidades. *com!nalidad *( 2)# proporcin de la varianza total explicada por los factores comunes en una varia&le8 &3 +os m$todos de extraccin de factores. c3 #l n)mero de factores a extraer. d3 +os m$todos de rotacin de factores. -e han propuesto m)ltiples m$todos para la extraccin de factores* compro&ndose %ue ha&,a distintas soluciones al mismo pro&lema* se.)n el m$todo %ue se adoptase. <on esto se plantea el dilema de %u$ m$todo ele.ir. +as respuestas han sido distintas se.)n las diversas tendencias. #l m$todo de %om onentes &rinci ales suele ser el ms utilizado. A+A,-.-. FA%/01-A, 2s %03&0+E+/E. &1-+%-&A,E.. #l Anlisis Factorial / el Anlisis de <omponentes (rincipales estn mu/ relacionados. Al.unos autores consideran el se.undo como una etapa del primero / otros los consideran como t$cnicas diferentes. #l Anlisis de %om onentes &rinci ales trata de hallar componentes 'factores8 %ue sucesivamente expli%uen la ma/or parte de la 2arian4a total. (or su parte el Anlisis Factorial &usca factores %ue expli%uen la ma/or parte de la 2arian4a com5n. #n el Anlisis Factorial se distin.ue entre varianza com)n / varianza )nica. +a 2arian4a com5n es la parte de la variacin de la varia&le %ue es compartida con las otras varia&les. +a 2arian4a 5nica es la parte de la variacin de la varia&le %ue es propia de esa varia&le. #l Anlisis de <omponentes (rincipales no hace esa distincin entre los dos tipos de varianza* se centra en la varianza total. =ientras %ue el Anlisis de %om onentes &rinci ales &usca hallar com&inaciones lineales de las varia&les ori.inales %ue expli%uen la ma/or parte de la 2ariaci)n total* el Anlisis Factorial pretende hallar un nuevo con1unto de varia&les 'factores8* menor en n)mero %ue las varia&les ori.inales* %ue exprese lo %ue es com)n a esas varia&les. #l Anlisis Factorial supone %ue existe un factor com)n su&/acente a todas las varia&les* el Anlisis de <omponentes (rincipales no hace tal asuncin. 2

#n el Anlisis de %om onentes &rinci ales * el primer factor o componente ser,a a%uel %ue explica una ma/or parte de la varianza total* el se.undo factor ser,a a%uel %ue explica la ma/or parte de la varianza restante* es decir* de la %ue no explica&a el primero / as, sucesivamente. >e este modo ser,a posi&le o&tener tantos componentes como varia&les ori.inales aun%ue esto en la prctica no tiene sentido. ?a/ pues dos .randes tendencias0 a. Anlisis de <omponentes (rincipales. &. Anlisis factorial* dentro del cual existen diferentes m$todos. Ante la variedad de m$todos %ue existen dentro del Anlisis Factorial. @im / =ueller '16!"8 recomiendan utilizar el de mxima verosimilitud o el de m,nimos cuadrados. &A.0. E+ E, A+A,-.-. FA%/01-A, Tras compro&ar %ue se cumplen los supuestos del Anlisis factorial* 'los datos de&er,an ser intevalares o de razn / provenir de distri&uciones multinormales8 los pasos a se.uir son0 13 <alcular la matriz de correlaciones ' A 8 entre todas las varia&les / examinarla. 23 #xtraccin de los factores necesarios para representar los datos. 33 Aotacin de los factores con o&1eto de facilitar su interpretacin. Aepresentacin .rfica. 43 <alcular las puntuaciones factoriales de cada individuo. #n realidad slo los dos primeros pasos son indispensa&les* el 3B / 4B son un complemento. EXA3E+ 6E ,A 3A/1-7 6E %011E,A%-0+E. #l primer paso en el Anlisis Factorial ser calcular la matriz de correlaciones entre todas las varia&les %ue entran en el anlisis. >e tal forma %ue tendremos una matriz del tipo 0
X1 X1 X2 X3 X4 X5 X6 X2 X3 X4 X5 0.45 0.73 0.84 0.76 1 0.59 X6 0.63 0.40 0.68 0.92 0.59 1 1 0.50 0.65 0.70 0.5 1 0.30 0.82 0.65 0.30 1 0.38 0.70 0.82 0.38 1 0.45 0.73 0.84 0.76 0.63 0.49 0.68 0.92

5na vez %ue se dispone de esta matriz ha/ %ue examinarla para compro&ar si sus caracter,sticas son adecuadas para realizar un Anlisis Factorial. 8no de los re9!isitos 9!e de'en c!m lirse ara 9!e el Anlisis Factorial tenga sentido es 9!e las 2aria'les est:n altamente correlacionadas. ?a/ varios m$todos para compro&ar el .rado de asociacin entre las varia&les0 3 El determinante de la matriz de correlaciones 0 un determinante mu/ &a1o indicar altas intercorrelaciones entre las varia&les* pero no de&e ser cero 'matriz no sin.ular8* pues esto indicar,a %ue al.unas de las varia&les son linealmente dependientes / no se podr,an realizar ciertos clculos necesarios en el Anlisis Factorial. 3 Test de Esfericidad de Bartlett0 <omprue&a %ue la matriz de correlaciones se a1uste a la matriz identidad ( I ), es decir ausencia de correlacin si.nificativa entre las varia&les. #sto si.nifica %ue la nu&e de puntos se a1usta a una esfera perfecta* expresando la hiptesis nula por0 ?o0 1 C I es decir* %ue el determinante de la matriz de correlaciones es 1. ?o0 D 1D C 1 +a formula correspondiente asume la si.uiente expresin0 3

2 C 3 E n 3 1 3 '1F 8 G '2 G v H 58 I G ln DAD


donde n CtamaJo muestral.
lnClo.aritmo neperiano.

v Cn)mero de varia&les.
A Cmatriz de correlaciones .

si se acepta la hiptesis nula 'pK7.758 si.nifica %ue las varia&les no estn intercorrelacionadas / por tanto no tiene mucho sentido llevar a ca&o un Anlisis Factorial. #s mu/ )til cuando el tamaJo muestral es pe%ueJo. ; Indice KMO de Kaiser-Meyer-Olkin#

L
@=N C

L r 2 i1 L r 2 i1 H L L a 2 i1
iM1

iM1 33333333333333333333333333333333333333333333333333333333333333

L
iM1

donde

ri1C correlacin simple.

ai1C correlacin parcial.

;alores &a1os del ,ndice @=N desaconse1an la utilizacin de Anlisis Factorial. <omo &aremo para interpretar el ,ndice @=N podr,a tomarse se.)n @aiser0
1 0.9 0.8 0.7 0.6 >= >= >= >= >= KMO KMO KMO KMO KMO KMO >= >= >= >= > <= 0.9 0.8 0.7 0.6 0.5 0.5 muy bueno bueno mediano mediocre bajo muy bajo

Correlacin Anti-imagen0 %ue es el ne.ativo del coeficiente de correlacin parcial* de&er ha&er pocos coeficientes altos para %ue sea razona&le aplicar el Anlisis Factorial. Medida de Adecuacin de la Muestra (M A! #valores &a1os de este ,ndice desaconse1an el uso del Anlisis Factorial. Correlacin M"lti#le* %ue de&er ser alta. #l anlisis factorial* por defecto* toma los valores de la correlacin m)ltiple al cuadrado como los valores iniciales de comunalidad.

3A/1-7 FA%/01-A, A partir de la matriz de correlaciones* el Anlisis Factorial extrae otra matriz* la matri4 factorial* %ue reproduce la primera de forma ms sencilla / tiene la forma si.uiente0 1 2
1 2 3 4 5 6 P11 P12 P13 P14 P15 P16 P21 P22 P23 P24 P25 P26

<ada columna es un factor / ha/ tantas filas como varia&les ori.inales. +os elementos ( i1 pueden interpretarse como ,ndices de correlacin entre el factor i / la varia&le 1* aun%ue estrictamente slo son correlaciones cuando los factores no estn correlacionados entre s,* es decir* son orto.onales. #stos coeficientes reci&en el nom&re de pesos* car.as* ponderaciones o saturaciones factoriales. +os pesos factoriales indican el peso de cada varia&le en cada factor. +o ideal es %ue cada varia&le car.ue alto en un factor / &a1o en los dems. A8/0VA,01E. *VA,01E. &10&-0.) #l cuadrado de una car.a o peso factorial indica la proporcin de la varianza explicada por un factor en una varia&le particular. +a suma de los cuadrados de los pesos de cual%uier columna de la matriz factorial son los autovalores ' O 28* indica la cantidad total de varianza %ue explica ese factor para las varia&les consideradas como .rupo. +as car.as factoriales pueden tener como valor mximo 1* por tanto el valor mximo %ue puede alcanzar el autovalor 'valor propio8 es i.ual al n)mero de varia&les. -i dividimos el autovalor entre el n)mero de varia&les nos indica la proporcin 'tanto por ciento si multiplicamos por 1778 de la varianza de las varia&les %ue explica el factor.
1 2 3 4 5 6 P11 P12 P13 P14 P15 P16 + + P21 P22 P23 P24 P25 P26

O1 O2

P11 2 + P122 + ... P21 2 + P222 + ...

P1j 2 P2j 2

; ( O1

F n 8 C varianza explicada por el primer factor n 8 C varianza explicada por el se.undo factor

; ( O2 F

%038+A,-6A6E. -e denomina 4com!nalidad4 a la proporcin de la varianza explicada por los factores comunes en una varia&le. ,a com!nalidad *(2) es la s!ma de los esos factoriales al c!adrado en cada !na de las filas. +a matriz %ue reco.e los pesos factoriales 'saturaciones8* las comunalidades 'en la dia.onal8 / los autovalores se denomina matriz de patrones factoriales / coincide con la matriz de estructura factorial cuando los factores son orto.onales. <omo la comunalidad no se puede sa&er hasta %ue se conocen los factores* $ste resulta ser uno de los pro&lemas del Anlisis Factorial. #n el Anlisis de <omponentes (rincipales no suponemos la existencia de nin.)n factor com)n* por lo %ue la comunalidad toma como valor inicial 1. #n los otros m$todos se utilizan diferentes modos de estimar la comunalidad inicial0 - #stimando la comunalidad por la ma/or correlacin en la fila i3$sima de la matriz de correlaciones. 3 #stimando la comunalidad por el cuadrado del coeficiente de correlacin m)ltiple entre x / las dems varia&les. '#s el %ue da el ordenador -(-- por defecto8. 3 #l promedio de los coeficientes de correlacin de una varia&le con todas las dems. +a comunalidad final de cada varia&le viene dada por0 ( = & 1< 2+ & 2< 2+ ... + &$< 2 5

+83E10 6E FA%/01E. A %0+.E1VA1 +a matriz factorial puede presentar un n)mero de factores superior al necesario para explicar la estructura de los datos ori.inales. 9eneralmente ha/ un con1unto reducido de factores* los primeros* %ue son los %ue explican la ma/or parte de la varia&ilidad total. +os otros factores suelen contri&uir relativamente poco. 5no de los pro&lemas %ue se plantean* por tanto* consiste en determinar el n)mero de factores %ue de&emos conservar* de manera %ue se cumpla el principio de parsimonia. -e han dado diversos criterios para determinar el n)mero de factores a conservar. 5no de los ms conocidos / utilizados es el criterio o regla de Kaiser '16 78 %ue indicar,a lo si.uiente0 4conser2ar solamente a9!ellos factores c!=os a!to2alores son ma=ores a la !nidad 4. #ste criterio es el %ue suelen utilizar los pro.ramas estad,sticos por defecto. (ero este criterio es .eneralmente inadecuado /a %ue tiende a so&restimar el n)mero de factores. Ntros criterios propuestos han sido por e1emplo* el Scree-test de Cattell '16 8 consistente en representar en un sistema de e1es los valores %ue toman los autovalores 'ordenadas8 / el n)mero de factor 'a&cisas8. >onde la pendiente de esta l,nea poli.onal disminu/e nos indica el n)mero de factores a retener. Velicer '16! 8 propone el m$todo =A( '=inimum Avera.e (artial8* %ue implica calcular el promedio de las correlaciones parciales al cuadrado despu$s de %ue cada uno de los componentes ha sido parcializado de las varia&les ori.inales. <uando el promedio de las correlaciones parciales al cuadrado alcanza un m,nimo no se extraen ms componentes. #ste m,nimo se alcanza cuando la matriz residual se acerca ms a una matriz identidad. 5n re%uisito para utilizar esta re.la es %ue cada uno de los componentes retenidos de&en tener al menos dos varia&les con pesos altos en ellos. Bartlett '1657* 16518 propone una prue&a estad,stica para contrastar la hiptesis nula de %ue los restantes p3m autovalores son i.uales 'siendo p el n)mero ori.inal de varia&les / m el n)mero de factores o componentes retenidos8. <ada autovalor es excluido de manera secuencial hasta %ue no puede ser rechazada la hiptesis nula a trav$s de una prue&a de Pi3 cuadrado. #l Anlisis &aralelo fue su.erido por Horn '16 58 %uien seJala %ue a nivel po&lacional los autovalores de una matriz de correlaciones para varia&les no correlacionadas tomar,an valor 1. <uando se .eneran matrices muestrales &asadas en esa matriz po&lacional por fluctuaciones de&idas al azar los autovalores excedern levemente de 1 / los )ltimos estarn li.eramente por de&a1o de 1. ?orn propone contrastar los autovalores encontrados emp,ricamente en los datos reales con los o&tenidos a partir de una matriz de varia&les no correlacionadas &asada en el mismo n)mero de varia&les %ue los datos emp,ricos / en el mismo tamaJo de muestra. +os componentes emp,ricos con autovalores superiores a los de la matriz son retenidos. #l m$todo de Aazn de ;erosimilitud* introducido por Lawley '16478* se trata de un criterio de &ondad de a1uste pensado para la utilizacin del m$todo de extraccin de mxima verosimilitud* %ue se distri&u/e se.)n Pi3cuadrado. +a l.ica de este procedimiento es compro&ar si el n)mero de factores extra,do es suficiente para explicar los coeficientes de correlacin o&servados. >e todos estos criterios los %ue parecen ha&er demostrado un me1or

funcionamiento son el =A( / el Anlisis (aralelo* sin em&ar.o tienen la desventa1a de %ue no son mu/ accesi&les en la prctica.

10/A%-0+E. FA%/01-A,E. +a matriz factorial indica* como sa&emos* la relacin entre los factores / las varia&les. -in em&ar.o* a partir de la matriz factorial muchas veces resulta dif,cil la interpretacin de los factores.
!. 1 " # % 0.6 0.5 0." $0.# !. 0.7 0.5 $0.5 0.6

<omo se ve esta matriz factorial resulta dif,cil de interpretar pues no %ueda claro en %ue factor satura cada varia&le. (ara facilitar la interpretacin se realizan lo %ue se denominan rotaciones factoriales. +a rotacin factorial pretende seleccionar la solucin ms sencilla e interpreta&le. #n s,ntesis consiste en hacer .irar los e1es de coordenadas* %ue representan a los factores* hasta conse.uir %ue se aproximen al mximo a las varia&les en %ue estn saturados. +a saturacin de factores transforma la matriz factorial inicial en otra denominada matriz factorial rotada* de ms fcil interpretacin. +a matriz factorial rotada es una com&inacin lineal de la primera / explica la misma cantidad de varianza inicial.
!. 0.91" 0.70" 0.""6 0."16 !. 0.0"6 $0.018 $0.%8# 0.6#9

<omo hemos dicho el o&1etivo de la rotacin es o&tener una solucin ms interpreta&le* una forma de conse.uirlo es intentando aproximarla al principio de estructura simple 'Thurstone* 16358. -e.)n este principio* la matriz factorial de&e reunir las si.uientes caracter,sticas0 13 <ada factor de&e tener unos pocos pesos altos / los otros prximos a 7. 23 <ada varia&le no de&e estar saturada ms %ue en un factor. 33 Qo de&en existir factores con la misma distri&ucin* es decir* los factores distintos de&en presentar distri&uciones de car.as altas / &a1as distintas. #stos tres principios en la prctica no suelen lo.rarse* lo %ue se trata es de alcanzar una solucin lo ms aproximada posi&le a ello. <on la rotacin factorial aun%ue cam&ie la matriz factorial las comunalidades no se alteran* sin em&ar.o* cam&ia la varianza explicada por cada factor. #xisten varios m$todos de rotacin %ue podemos a.rupar en dos .randes tipos0 orto.onales / o&licuos. +a correlacin entre las varia&les puede representarse como el n.ulo entre dos vectores / espec,ficamente vendr,a dada como el coseno del n.ulo entre dos vectores. As, tendremos una rotacin orto.onal cuando la correlacin entre factores sea nula o lo %ue es lo mismo* !

tienen un n.ulo de 67 .rados entre factoresR / ha&laremos de rotacin o&licua cuando la correlacin entre factores no sea nula / por tanto el n.ulo distinto de 67 .rados. +o ms recomenda&le es la rotacin orto.onal* aun%ue en el caso de %ue existan razones para pensar %ue los factores estn correlacionados entonces utilizaremos la rotacin o&licua. >e entre las rotaciones orto.onales la ms utilizada es la 2arima" 'minimiza el n)mero de varia&les %ue tienen saturaciones altas en un factor8 se.uida por la >!artima" 'minimiza el n)mero de factores necesarios para explicar una varia&le / la E9!ama" %ue es una mezcla de las dos anteriores* mientras en %ue las o&licuas es la o'limin. #n la rotacin o&licua las ponderaciones factoriales no coinciden con las correlaciones entre el factor / la varia&le* puesto %ue los factores estn correlacionados entre s,. (or eso cuando hacemos rotacin o&licua la matriz factorial no rotada se convierte en dos matrices diferentes0 la matriz de ponderaciones '%ue es la %ue se utiliza en la interpretacin8 / la matriz de correlaciones entre factores / varia&les. Tam&i$n o&tendremos otra matriz de correlaciones entre factores. -+/E1&1E/A%-0+ 6E FA%/01E. #n la fase de interpretacin 1ue.a un papel preponderante la teor,a / el conocimiento sustantivo. A efectos prcticos se su.ieren dos pasos en el proceso de interpretacin0 13 #studiar la composicin de las saturaciones factoriales si.nificativas de cada factor. 23 :ntentar dar nom&re a los factores. Qom&re %ue se de&e dar de acuerdo con la estructura de sus saturaciones* es decir* conociendo su contenido. >os cuestiones %ue pueden a/udar a la interpretacin son0 - Nrdenar la matriz rotada de forma %ue las varia&les con saturaciones altas en un factor aparezcan 1untas. 3 +a eliminacin de las car.as factoriales &a1as '.eneralmente a%uellas %ue van por de&a1o de 7*258. +lamaremos varia&le comple1a a a%uella %ue satura altamente en ms de un factor / %ue no de&e ser utilizada para dar nom&re a los factores. Factores &ipolares* son a%uellos factores en los %ue unas varia&les car.an positivamente / otras tienen car.a ne.ativa.

&8+/8A%-0+E. FA%/01-A,E. 5na vez %ue se tienen los factores puede interesar conocer %ue puntuacin o&tendr,an los su1etos en estos factores. (ara contestar a esto ha/ %ue calcular lo %ue se conoce como puntuaciones factoriales de cada individuo. #l clculo de las puntuaciones factoriales se realiza a partir de la matriz factorial rotada / se &asa en el modelo de la re.resin m)ltiple* de acuerdo con la frmula0 "

Fi< = &i1 7l +&i2 72 + .... + &i r 7r


Fi1C en la puntuacin factorial del individuo 1 en el factor i. (il es la ponderacin factorial de la varia&le l en el factor i. Sl son las puntuaciones t,picas del su1eto con cada varia&le. +as puntuaciones factoriales exactas slo pueden calcularse estrictamente cuando el m$todo de extraccin ha sido el de Anlisis de <omponentes (rincipales. <on los otros m$todos slo podrn hacerse estimaciones por medio de al.)n m$todo correlacionado.

17

También podría gustarte