Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis Factorial
Analisis Factorial
SantiagodelaFuenteFernndez
AnlisisFactorial
SantiagodelaFuenteFernndez
AnlisisFactorial
INTRODUCCINANLISISFACTORIAL
Elanlisisfactorialesunatcnicadereduccindedatosquesirveparaencontrargrupos
homogneosdevariablesapartirdeunconjuntonumerosodevariables.
Losgruposhomogneosseformanconlasvariablesquecorrelacionanmuchoentresyprocurando,
inicialmente,queunosgruposseanindependientesdeotros.
Cuandoserecogenungrannmerodevariablesdeformasimultnea(porejemplo,enun
cuestionariodesatisfaccinlaboral)sepuedeestarinteresadoenaveriguarsilaspreguntasdel
cuestionarioseagrupandealgunaformacaracterstica.Aplicandounanlisisfactorialalas
respuestasdelossujetossepuedenencontrargruposdevariablesconsignificadocomnyconseguir
deestemodoreducirelnmerodedimensionesnecesariasparaexplicarlasrespuestasdelos
sujetos.
ElAnlisisFactoriales,portanto,unatcnicadereduccindeladimensionalidaddelosdatos.Su
propsitoltimoconsisteenbuscarelnmeromnimodedimensionescapacesdeexplicarelmximo
deinformacincontenidaenlosdatos.
Adiferenciadeloqueocurreenotrastcnicascomoelanlisisdevarianzaoelderegresin,enel
anlisisfactorialtodaslasvariablesdelanlisiscumplenelmismopapel:todasellasson
independientesenelsentidodequenoexisteaprioriunadependenciaconceptualdeunasvariables
sobreotras.
FundamentalmenteloquesepretendeconelAnlisisFactorial(AnlisisdeComponentesPrincipales
odeFactoresComunes)essimplificarlainformacinquenosdaunamatrizdecorrelacionespara
hacerlamsfcilmenteinterpretable.
SepretendeencontrarunarespuestaalpreguntarnosPorquunasvariablesserelacionanms
entresymenosconotras?.Hipotticamenteesporqueexistenotrasvariables,otrasdimensioneso
factoresqueexplicanporquunostemsserelacionanmsconunosqueconotros.
Endefinitiva,setratadeunanlisisdelaestructurasubyacenteaunaseriedevariables?.
CONCEPTOSPREVIOSDELANLISISFACTORIAL
Unejemploconcretodeintroduccinalconceptodevarianzacompartidayvarianzanica:Sean
unostemsdeunaescaladeactitudes,dondelapuntuacindecadasujetoencuestadoeslasumade
lasrespuestasatodoslostems,segnlaclavedecorreccindiseada:
1Melopasomuybienenmicasa,conmispadres
2Algunasvecesmegustaramarcharmedemicasa
Muydeacuerdo=5
Deacuerdo=4
..
Muydeacuerdo=1
Deacuerdo=2
Lavarianza 2 decadatemindicaladiferenciaquecreaenlasrespuestas.Sitodos
respondieranlomismolavarianzaseracero,nohabradiferencias.Silamitadestuvieramuy
agustoensucasaylaotramitadmuyadisgusto,lavarianzaseramxima.
SantiagodelaFuenteFernndez1
AnlisisFactorial
Cadatemovariabletienesuvarianza(diferenciasenlasrespuestas),lavarianzadecada
tempuedesercompartidaconlavarianzadeotrostems:Algunosindividuosencuestados
estnmuybienensucasaconsuspadres(tem1)ynuncapiensanirsedesucasa(tem2).
Otrosindividuosrespondernconotrasvariaciones.Enestecaso,lasrespuestassealadaa
estosdostemssoncoherentesconelsignificadopretendidodelosdostems,comparten
varianzaporquelosdostemsestnrelacionadospositivamente(estoybienencasa,nome
quieroir).
EstarelacinvieneexpresadaporelcoeficientedecorrelacinrdePearson,donder2
expresalaproporcindevarianzacomnodevariacinconjunta.Esdecir,silacorrelacin
entreestosdostemsesde0,90,estosignificaquetienenun81%devarianzacomn
(variacinenlasrespuestas).Elrestodelavarianza(19%)noesvarianzacompartida.
Lavarianzanocompartidapuededescomponerseenotrasdosfuentesdevarianza:Cada
variabletieneunavarianzaespecifica:unencuestadopuederesponderqueselopasamuy
bienconsuspadresyquelegustarairsedecasa,simplementeporquelegustaviajar.
Eltem1nocuantificanicamentelaintegracinfamiliar,tambintieneunsignificado
especficoqueparamuchosencuestadosnopuedecoincidirdeltodoconsentirsebienen
casa.
TambinhayunaVarianzadeerrordemedicin,ocasionadaporcansancio,estilos
personalesderesponder,ordenenqueseresponde,etc.
Lavarianzatotaldeuntempuededescomponerse:
VarianzaTotal
Varianzacompartida
+
ocomn
Varianzaespecfica
decadavariable
Varianzadeerrores
demedicin
Uniendolavarianzaespecficaconlavarianzadebidaaerroresdemedicin(todalavarianzanicao
nocompartidadecadatemovariable),setiene:
VarianzaTotal
Varianzacompartida
+
ocomn
Varianzadeerrores
demedicin
QuhaceelAnlisisFactorial?
Seencargadeanalizarlavarianzacomnatodaslasvariables.Partiendodeunamatrizde
correlaciones,tratadesimplificarlainformacinqueofrece.Seoperaconlascorrelacioneselevadas
alcuadrador2(coeficientesdedeterminacin),queexpresanlaproporcindevarianzacomnentre
lasvariables.
Encadacasilladelamatrizdecorrelacionessereflejalaproporcindevarianzacomnadostemso
variables,exceptoenladiagonalprincipal(dondecadatemcoincideconsigomismo).Enlos1dela
diagonalprincipalsereflejalavarianzaquecadatemovariablecomparteconlosdemsytambin
losquenocomparte(laespecficaonicadecadatem).
Sisedeseaanalizarexclusivamentelavarianzacompartidahabrqueeliminarlosunosdelamatriz
decorrelacionesyponerensulugarlaproporcindevarianzaquecadatemtieneencomncon
todoslosdems.
SantiagodelaFuenteFernndez2
AnlisisFactorial
EnelAnlisisFactorial,portanto,cabendosenfoques:
1. AnalizarTODAlavarianza(comnynocomn).Enestecasoutilizamoslosunosdelamatrizde
correlaciones.ElmtodomsusualeseldeAnlisisdeComponentesPrincipales.
2. AnalizarSOLOlavarianzacomn.Enestecaso,sesubstituyenlosunosdeladiagonalpor
estimacionesdelavarianzaquecadatemtieneencomnconlosdems(yquesedenominan
Comunalidades).Paralaestimacindelascomunalidadesnohayunclculonico,existen
diversosprocedimientos(correlacionesmltiplesdecadatemcontodoslosdems,coeficientes
defiabilidadsicadavariableesuntest).Elprocedimientoporelquesesustituyenlosunospor
lascomunalidadessedenominaAnlisisdeFactoresComunes.
LosdosenfoquescabenbajoladenominacingenricadeAnlisisFactorial,aunqueeselAnlisisde
FactoresComunesalqueconmspropiedadseleaplicaladenominacindeAnlisisFactorial.
Ambosenfoquesdanresultadossimilaresyseinterpretandemaneracasiidntica.
QuesunFACTOR?
Enrealidadlosfactoresnoexisten,loqueexistedecadasujetoesunasumadesusrespuestasauna
seriedetemsopreguntas,unacombinacinlinealdevariables(tema+temb+temc+).
Lasumatotaldetemssondistintosparacadasujeto,opuedenserlo,lavarianzadelostotalesnos
expresaladiversidadqueexisteentrelossujetos.
Sihaynfactores,seinterpretaqueelinstrumentooriginalsepuededescomponerenn
instrumentos(cadaunocompuestoportodoslostems),aunqueencadainstrumentolostems
tienenunpesoespecficodistintosegnseasurelacinconelfactor:
Siencontramos,porejemplo,tresfactores,estoquieredecirquepodemosdescomponer
elinstrumentooriginalentresinstrumentos;cadaunoestcompuestoportodoslostems,pero
encadainstrumentolostemstienenunpesoespecficodistintosegnseasurelacinconcada
factor:
a1a+b1b+c1c+....=TotalenelFactor1
a2a+b2b+c2c+....=TotalenelFactor2
....................................................................
ana+bnb+cnc+....=TotalenelFactorn
a1eselpesoespecficodeltemaenelFactor1
a2eselpesoespecficodeltemaenelFactor2
............................................................................
aneselpesoespecficodeltemaenelFactorn
Lasnuevaspuntuacionessonlaspuntuacionesfactorialesofactorscores.
Lospesospuedensergrandesopequeos,positivosonegativos.Generalmente,encadafactorhay
temsconpesosgrandesyotrosprximosacero;lostemsquemspesanencadafactorsonlosque
lodefinen.
Lavarianza(diversidad)detodaslasnuevasmedidasequivalealavarianzadelamedidaoriginal(no
atoda,perosalamximaqueesposibleexplicar);estosfactoresindicanlasfuentesdevarianza;si
haydiferenciasenlamedidaoriginalesporquelashayenestasnuevaspuntuaciones.
SantiagodelaFuenteFernndez3
AnlisisFactorial
Elanlisisfactorialsereducealabsquedadeestospesosparalocalizarmedidasdistintasapartirde
lasvariablesoriginales,ydemaneraque,apoderser,entretodaslasnuevasmedidasagoteno
expliquentodalavarianzapresenteenlasvariablesoriginales.
ESQUEMADEUNANLISISFACTORIAL:
FORMULACINDELPROBLEMA
ANLISISDELAMATRIZDECORRELACIN
EXTRACCINDEFACTORES
DETERMINACINDELNMERODEFACTORES
ROTACINDEFACTORES
INTERPRETACINDEFACTORES
VALIDACINDELMODELO
CLCULODEPUNTUACIONES
FACTORIALES
SELECCINDELAS
VARIABLESREPRESENTATIVAS
ANLISISPOSTERIORES:REGRESIN,CLUSTER...
ModelodelAnlisisFactorial
Sean(X1,X2,,Xp)laspvariablesobjetodeanlisisquesupondremosentodoloquesigue,que
estntipificadas.Sinoloestuvieranelanlisisserealizaradeformasimilarperolamatrizutilizada
paracalcularlosfactoresnoseralamatrizdecorrelacinsinoladevarianzasycovarianzas.
Elinvestigadormideestasvariablessobrenindividuos,obtenindoselasiguientematrizdedatos:
Sujetos
X1
Variables
X2
x11
x12
x1p
x21
x22
x2p
xn1
xn2
xnp
Xp
ElmodelodelAnlisisFactorialviene
dadohabitualmenteporlasecuaciones:
X1=a11F1+a12F2++a1kFk+u1
X2=a21F1+a22F2++a2kFk+u2
..................
Xp=ap1F1+ap2F2++apkFk+up
SantiagodelaFuenteFernndez4
AnlisisFactorial
Donde,(F1,F2,,Fk)(k<p)sonlosFactoresComunes,(u1,u2,,up)losFactoresnicoso
especficos,ylosCoeficientes(aij){i=1,,p;j=1,...,k}lasCargasfactoriales.
SesuponequelosFactoresComunesestnasuvezestandarizados[E(Fi)=0;Var(Fi)=1],losFactores
Especficostienenmedia0yestnincorrelados[E(ui)=0;Cov(ui,uj)=0sij;(i,j=1,,p)]yque
ambostiposdefactoresestnincorreladosCov(Fi,uj)=0,i=1,..,k;j=1,,p.
Si,adems,losFactoresComunesestnincorrelados[Cov(Fi,Fj)=0siij;j,i=1,,k]estamosanteun
modeloconfactoresortogonales.
Encasocontrarioelmodelosedicequeesdefactoresoblicuos.
Expresadoenformamatricial:
x=Af+uX=FA'+U
Xmatrizdedatos
Amatrizdecargasfactoriales
Fmatrizdepuntuacionesfactoriales
u1
a11 a12
X1
F1
u2
a21 a22
X2
F2
donde: x= , f= , u= , A =
M
L L
M
M
X
F
u
a
P
k
p
p1 ap2
L a1k
f11
L a2k
f21
, F =
L L
L
f
L apk
p1
f12 L f1k
f22 L f2k
L L L
fp2 L fpk
Utilizandolashiptesisanteriores,setiene:
k
EspecificidaddelavariableXi
k
Enconsecuencia,lavarianzadecadaunadelasvariablesanalizadassepuededescomponerendos
partes:laComunalidad h2i querepresentalavarianzaexplicadaporlosfactorescomunesyla
Especificidad i querepresentalapartedelavarianzaespecficadecadavariable.Ademssetiene:
k
k
k
Cov(Xi , Xl ) = Cov aij Fj , alj Fj , = aij alj i l
j=1
j=1
j=1
porloquesonlosfactorescomuneslosqueexplicanlasrelacionesexistentesentrelasvariables.
Porestemotivo,losfactorescomunestienenintersysonsusceptiblesdeinterpretacin
experimental.Losfactoresnicosseincluyenenelmodelodadalaimposibilidaddeexpresar,en
general,pvariablesenfuncindeunnmeromsreducidokdefactores.
SantiagodelaFuenteFernndez5
AnlisisFactorial
Ejemplo.Unosestudiantessonsometidosadiversostestendistintasmateriasparamedirsus
actitudesintelectuales.Comoconsecuencia,seobtienenunaseriedepuntuacionesestandarizadas
enMatemticas(Ma),Fsica(Fi),Qumica(Qu),Ingls(In),Historia(Hi)yDibujo(Di).
Elmodelofactorialvienedado
porlasecuaciones
Losfactorescomunesestn
estandarizadoseincorrelados
E[Fi]=0i=1,2;j{Ma,Fi,Qu,In,Hi,Di}
Var[Fi]=1i=1,2;
Cov(F1,F2)=0
E[ui]=0i=1,2;j{Ma,Fi,Qu,In,Hi,Di}
Losfactoresespecficos
tienenmedia0eincorrelados Cov(u1,u2)=0ij{Ma,Fi,Qu,In,Hi,Di}
Ambostiposdefactoresestnincorrelados
Cov(Fi,uj)=0ij{Ma,Fi,Qu,In,Hi,Di}
Cov(u1,u2)=0ij{Ma,Fi,Qu,In,Hi,Di}
0,8 0,2
0,7 0,3
0,6 0,3
Lamatrizdecargasfactoriales A =
0,2 0,8
0,15 0,82
0,25 0,85
ComunalidadyEspecificidad:
Var[Ma]=1=Var[0,8F1+0,2F2+uMa]=
Matemticas =0,82Var[F1]+0,22Var[F2]+Var[uMa]+2(0,8)(0,2)Cov(F1,F2)+2(0,8)Cov(F1,uMa)+
+2(0,2)Cov(F2,uMa)=0,68+Ma
2
LaComunalidadenMatemticases hMa
= 0,68 ylaEspecificidad Ma = 0,32
Dibujo
Var[Di]=1=Var[0,25F1+0,85F2+uDi]=
=0,252Var[F1]+0,852Var[F2]+Var[uDi]+2(0,25)(0,85)Cov(F1,F2)+2(0,25)Cov(F1,uDi)+
+2(0,85)Cov(F2,uDi)=0,785+Di
Comunalidades
Matemticas
0,68
Fsica
0,42
Qumica
0,55
Ingls
0,215
Historia
0,36
Dibujo
0,785
o Comolaspuntuacionesestnestandarizadas,lamatrizdevarianzasycovarianzascoincide
conlamatrizdecorrelaciones:
SantiagodelaFuenteFernndez6
AnlisisFactorial
1
0,51 0,38 0,351
0,43
0,62
0,54 0,51
1
0,36 0,336 0,405
1
0,686
0,73
0,32 0,38 0,36
0,284 0,351 0,336 0,686
1
0,7345
Advirtaseque,
Cov(Ma,Fi)=Cov(0,8F1+0,2F2+uMa,0,7F1+0,3F2+uFi)=
=(0,8)(0,7)Var(F1)+(0,8)(0,3)Cov(F1,F2)+(0,8)Cov(F1,uFi)+(0,2)(0,7)Cov(F2,F1)+(0,2)(0,3)Var(F2)
+(0,2)Cov(F2,uFi)+(0,7)Cov(uMa,F1)+(0,3)Cov(uMa,F2)+Cov(uMa,uFi)=0,56+0,06=0,62
Cov(Fi,Qi)=Cov(0,7F1+0,3F2+uFi,0,6F1+0,3F2+uQi)=
=(0,7)(0,6)Var(F1)+(0,6)(0,3)Cov(F1,F2)+(0,7)Cov(F1,uQi)+(0,3)(0,6)Cov(F2,F1)+(0,3)(0,3)
Var(F2)+(0,3)Cov(F2,uQi)+(0,6)Cov(uFi,F1)+(0,3)Cov(uFi,F2)+Cov(uFi,uQi)=0,42+0,09=0,51
ANLISISDELAMATRIZDECORRELACIN
TestdeesfericidaddeBarlett
Contrasta,bajolahiptesisdenormalidadmultivariante,silamatrizdecorrelacindelaspvariables
observadas( Rp )eslaidentidad.
Siunamatrizdecorrelacineslaidentidadsignificaquelasintercorrelacionesentrelasvariablesson
cero.Siseconfirmalahiptesisnula H0 : Rp = 1 o Rp = I ,lasvariablesnoestnintercorrelacionadas.
EltestdeesfericidaddeBarlettseobtienemedianteunatransformacindeldeterminantedela
matrizdecorrelacin.Elestadsticodeltestvienedadopor:
1
(2p + 11) p
dR = n 1 (2p + 5) log R = n
log ( j )
6
6
j=1
dondeneselnmerodeindividuosdelamuestray j (j=1,...,p)sonlosvalorespropiosdeR.
SantiagodelaFuenteFernndez7
AnlisisFactorial
Bajolahiptesisnula,elestadsticosedistribuyeasintticamentesegnuna
2
p(p1) 2
Silahiptesisnulaescierta,losvalorespropiosvaldrnuno,osulogaritmosernuloy,portanto,el
estadsticodeltestvaldracero.
Porelcontrario,siconeltestdeBarlettseobtienenvaloresaltosde 2 ,oundeterminantebajo,
hayvariablesconcorrelacionesaltas(undeterminanteprximoaceroindicaqueunaoms
variablespodranserexpresadascomocombinacinlinealdeotrasvariables).
Endefinitiva,sielestadsticodeltesttomavaloresgrandes(oundeterminanteprximoacero)se
rechazalahiptesisnulaconciertogradodesignificacin.Encasodeaceptarselahiptesisnula,las
variablesnoestnintercorreladasydeberareconsiderarselaaplicacindeunAnlisisFactorial.
Medidasdeadecuacindelamuestra
Elcoeficientedecorrelacinparcialesunindicadordelgradoderelacionesentredosvariables,
eliminandolainfluenciadelresto.
Silasvariablescompartenfactorescomunes,elcoeficientedecorrelacinparcialentreparesde
variablesesbajo,puestoqueseeliminanlosefectoslinealesdelasotrasvariables.
Lascorrelacionesparcialessonestimacionesdelascorrelacionesentrelosfactoresnicos,debiendo
serprximasacerocuandoelAnlisisFactorialesadecuado,dadoquesesuponequelosfactores
nicosestnincorreladosentres.
Endefinitiva,siexisteunnmeroelevadodecoeficientesdecorrelacinparcialdistintosdecero,se
interpretaquelashiptesisdelmodelofactorialnosoncompatiblesconlosdatos.
UnamaneradecuantificarestehechoesconlaMediadeAdecuacindelaMuestraKMOpropuesta
porKaiserMeyerOlkin:
rij2
ji i j
KMO =
0 KMO 1
r
ij2 + rij2(p)
ji i j
ji i j
lasvariables.
ElndiceKMOseutilizaparacompararlasmagnitudesdeloscoeficientesdecorrelacinparcial,de
formaquecuntomspequeoseasuvalor,mayorserelvalordeloscoeficientesdecorrelacin
parciales rij (p) y,enconsecuencia,menosapropiadoesrealizarunAnlisisFactorial.
KMO0,75Bien
KaiserMeyerOlkinpararealizarunAnlisisFactorial,proponen: KMO0,5Aceptable
KMO<0,5Inaceptable
LaexperienciaprcticaaconsejaqueesprecipitadotomarelndiceKMOcomonicamedidade
adecuacindelamuestraalashiptesisdelmodelodeAnlisisFactorial,sobretodosihayun
nmeropequeodevariablesconsideradas.
SantiagodelaFuenteFernndez8
AnlisisFactorial
Paratomarladecisindeeliminarunavariabledelestudioesaconsejablecomplementarla
informacinconotrasfuentes:lascomunalidadesdecadavariable,losresiduosdelmodelo,e
interpretarlosfactoresobtenidos.
EXTRACCINDEFACTORES
ElobjetivodelAnlisisFactorial(AF)esdeterminarunnmeroreducidodefactoresquepuedan
representaralasvariablesoriginales.
UnavezquesehadeterminadoqueelAFesunatcnicaapropiadaparaanalizarlosdatos,hayque
seleccionarelmtodoadecuadoparalaextraccindefactores.Existendiversosmtodos,cadauno
deellosconsusventajaseinconvenientes.
Elmodelofactorialenformamatricial: X = F A' + U ,teniendoquecuantificarlamatrizAdecargas
factorialesqueexplicaXenfuncindelosfactores.
Partiendode X = F A' + U ,sededucelallamadaIdentidadFundamentaldelAnlisisFactorial:
Rp = A A' +
dondeRpeslamatrizdecorrelacinpoblacionaldelasvariables(X1,X2,...,Xp)y = diag(i ) esla
matrizdiagonaldelasespecificidades.
Enestesentido,surgendosproblemas:
(a) ProblemasdeGradosdeLibertad.IgualandocadaelementodelamatrizRpconel
correspondientedelacombinacinlineal (A A' + ) ,resultan(pxp)ecuaciones,queesel
nmerodeelementosdeR.
p (p + 1)
elementos
2
distintos,queeselnmerorealdeecuaciones.Enelsegundomiembrodelaigualdad,los
parmetrosaestimarcon(pxk)elementosdelamatrizAylospelementosdelamatriz.
Ahorabien,lamatrizRpessimtricay,enconsecuencia,estintegradapor
Enconsecuencia,paraquepuedaefectuarseelprocesodeestimacinserequierequeelnmero
p (p + 1)
deecuacionesseamayoroigualqueelnmerodeparmetrosaestimar:
p (k + 1) ,olo
2
p 1
queesequivalente, k
.
2
(b) NoUnicidaddelaSolucin.LassolucionesdadasporlamatrizAnosonnicas,puestoque
cualquiertransformacinortogonaldeAestambinsolucin.
AnlisisFactorial
Sedefine F = F T (F*eselvectorFrotadoporlamatrizortogonalT).
SeverificaqueXyRpverificantambinlasecuacionesdelmodelo,esdecir:
Rp = A * A *' + = (A T) (T' A') + = A A'+
X = F * A *' + U = (F T) (T' A') + U = F A'+ U
Portanto,elmodeloesnicosalvorotacionesortogonales,esdecir,sepuedenrealizarrotaciones
delamatrizdelasponderacionesocargasfactorialessinalterarelmodelo.
Ejemplo.Enelmodelofactorialdefinidoanteriormente,setena:
Ma 0,8 0,2
UMa
Fi 0,7 0,3
UFi
Ma = 0,8 F1 + 0,2F2 + UMa
Qu 0,6 0,3 F U
Qu
1
+
Fi = 0,7F1 + 0,3F2 + UFi
=
In 0,2 0,8 F2 UIn
Qu = 0,6 F1 + 0,3F2 + UQu
Hi 0,15 0,82
U
Hi
Di 0,25 0,85
U
Di
1
' 1
F1 = 2 F1 + 2 F2
1 2 1
Sisedefinenlosfactores:
,siendolamatrizortogonal T =
1
1
1 2 1
F2' =
F1 +
F2
2
2
F' 1 2 1
1' =
F 1 2 1
2
1
2 F1
1
2 F2
2
2
F1 =
1 2 F1' F1
1 2 F2' F2
F2 =
1 '
F1
2
1 '
F1 +
2
1 '
F2
2
1 '
F2
2
dedonde,
Ma = 0,8 F1 + 0,2F2 + UMa =
Fi = 0,7F1 + 0,3F2 + UFi =
In = 0,71 F1' + 0,42 F2' + UIn Hi = 0,69 F1' + 0,47 F2' + UHi Di = 0,78 F1' + 0,42 F2' + UDi
verificndoseque Cov(F1' , F2' ) = 0 ,porloquelasnuevascargasfactorialessernlascorrelacionesde
losnuevosfactoresconlasvariablesoriginales.
Lascomunalidades,especificidadesymatricesdecorrelacinpermanecenigual.
SantiagodelaFuenteFernndez10
AnlisisFactorial
0,71 0,42
0,71 0,28
0,64 0,21
Lanuevamatrizdecargasfactorialesser: B =
0,71 0,42
0,69 0,47
0,78 0,42
LaformadecalcularlamatrizderotacinTyladenuevacargasfactorialesBdalugaralosdistintos
mtodosderotacinortogonales,siendolosmtodosmsutilizados:Varimax,Quartimaxy
Equamax.
MTODOSDEEXTRACCINDEFACTORES
Existendiferentesmtodosparaobtenerlosfactorescomunes,losimplantadosenSPSSson:
MtododelasComponentesPrincipales,MtododelosEjesprincipalesyMtododeMxima
Verosimilitud.
MtododelasComponentesPrincipales.Consisteenestimarlaspuntuacionesfactoriales
mediantelaspuntuacionestipificadasdelasprimeraskcomponentesylamatrizdecargas
factorialesmediantelascorrelacionesdelasvariablesoriginalescondichascomponentes.
Estemtodotienelaventajadequesiempreproporcionaunasolucin.
TieneelinconvenientedequealnoestarbasadoenelmodelodeAnlisisFactorialpuedellevara
estimadoresmuysesgadosdelamatrizdecargasfactoriales,especialmente,siexistenvariables
conComunalidadesbajas.
muestralesR,conloque:
R ' = R ' = A A'
Respetando R' = R ' = A A' ,elmtodoesiterativoyconsisteenalternarunaestimacindela
matrizdelasespecificidades conunaestimacindelamatrizdelascargasfactorialesA.
Separtedeunaestimacininicialdelamatriz , (0) ,yenelpasoisimodelalgoritmose
verificaque R (i) = A (i) A (i)' .
Laestimacin A(i) seobtieneaplicandoelmtododelascomponentesprincipalesalamatriz
R (i1) .Posteriormente,secalcula (i) apartirdelaigualdad R (i) = A (i) A (i)' yseiterahastaque
losvaloresdedichasestimacionesapenascambien.
EstemtodotienelaventajadeestarbasadoenelmodelodelAnlisisFactorialporloquesuele
proporcionarmejoresestimacionesqueelmtododecomponentesprincipales.Sinembargo,no
garantizasuconvergencia,sobretodoenmuestraspequeas.
SantiagodelaFuenteFernndez11
AnlisisFactorial
MtododelaMximaVerosimilitud.Basadoenelmodelox=Af+uX=FA'+U,
adoptandolahiptesisdenormalidadmultivariante,aplicaelmtododelamxima
verosimilitud.
Sobrelosanteriores,tienelaventajadequelasestimacionesobtenidasnodependendela
escalademedidadelasvariables.
Porotraparte,comoestbasadoenelmtododemximaverosimilitud,tienetodaslas
propiedadesestadsticasdestey,enparticular,esasintticamenteinsesgada,eficientey
normalsilashiptesisdelmodelofactorialsonciertas.
Adems,permiteseleccionarelnmerodefactoresmediantecontrastesdehiptesis.
EstemtodotambinpuedeserutilizadoenelAnlisisFactorialConfirmatorio,dondeel
investigadorpuedeplantearhiptesiscomoquealgunascargasfactorialessonnulas,que
algunosfactoresestncorrelacionadoscondeterminadosfactores,etc.,yaplicartests
estadsticosparadeterminarsilosdatosconfirmanlasrestriccionesasumidas.
Elprincipalinconvenientedelmtodoradicaenque,alrealizarselaoptimizacindelafuncin
deverosimilitudpormtodositerativos,silasvariablesoriginalesnosonnormales,puedehaber
problemasdeconvergenciasobretodoenmuestrasfinitas.
MtodoMnimoscuadradosnoponderados.Paraunnmerofijodefactores,generauna
matrizdecoeficientesqueminimizalasumadelasdiferenciasalcuadradoentrelasmatricesde
~=A
~A
~ ' ,eliminandoenlasdiferenciasloselementosde
correlacinobservadaRyreproducida R
ladiagonal.
MtodoMnimoscuadradosgeneralizados.MinimizaelmismocriterioLasumadelas
~=A
~A
~ '
diferenciasalcuadradoentrelasmatricesdecorrelacinobservadaRyreproducida R
ponderandolascorrelacionesinversamenteporlavarianzadelfactorespecfico.Estemtodo
permite,adems,aplicarcontrastedehiptesisparadeterminarelnmerodefactores.
MtododeFactorizacinporimgenes.Consisteenaplicarelmtododecomponentes
~ obtenidaapartirdelaspartespredichasdelas
principalesalamatrizdecorrelacionesR
diversasregresioneslinealesdecadaunadelasvariablessobrelasdems(dichaparterecibeel
nombredeimagendelavariable).
MtodoAlfa.MaximizaelalfadeCronbachparalosfactores.
ComparacinentredistintosMtodos
o Cuandolascomunalidadessonaltas(>0,6)todoslosprocedimientostienenadarlamisma
solucin.
SantiagodelaFuenteFernndez12
AnlisisFactorial
o Cuandolascomunalidadessonbajasparaalgunasdelasvariables,elmtodode
componentesprincipalestiendeadarsolucionesmuydiferentesdelrestodelosmtodos,
concargasfactorialesmayores.
o Sielnmerodevariablesesalto(>30),lasestimacionesdelacomunalidadtienenmenos
influenciaenlasolucinobtenidaytodoslosmtodostiendenaofrecerelmismoresultado.
o Sielnmerodevariablesesbajo,tododependedelmtodoutilizadoparaestimarlas
comunalidadesydesistassonaltasmsquedelmtodoutilizadoparaestimarlas.
o Esmsrobustoutilizarunmtodoparaelmodelodefactorescomunes.Elnicoproblema
puedeserlafaltadeconvergenciadelmtodoutilizado.
DETERMINARELNMERODEFACTORES
Lamatrizfactorialpuederepresentarunnmerodefactoressuperioralnecesarioparaexplicarla
estructuradelosdatosoriginales.Generalmente,hayunconjuntopequeodefactores,los
primeros,quecontienencasitodalainformacin.Elrestodefactoressuelencontribuir
relativamentepoco.
Unodelosproblemasconsisteendeterminarelnmerodefactoresqueconvieneconservar,pues
setratadecumplirelprincipiodeparsimonia.
Existendiversasreglasycriteriosparadeterminarelnmerodefactoresaconservar,algunosdelos
msutilizadosson:
(a) Determinacinapriori.Eselcriteriomsfiablesilosdatosylasvariablesestnbienelegidos
yelinvestigadorconocelasituacin,loidealesplantearelAnlisisFactorialconunaideaprevia
decuntosfactoreshayyculesson.
(b) RegladeKaiser.CalculalosvalorespropiosdelamatrizdecorrelacionesRytomacomo
nmerodefactoreselnmerodevalorespropiossuperioresalaunidad.
EstecriterioesunaalusindelAnlisisdeComponentesPrincipalesysehaverificadoen
simulacionesque,generalmente,tiendeainfraestimarelnmerodefactoresporloquese
recomiendasuusoparaestablecerunlmiteinferior.Unlmitesuperiorsecalcularaaplicando
estemismocriteriotomandocomolmite0,7.
(c) Criteriodelporcentajedelavarianza.EsunaalusindelAnlisisdeComponentesPrincipalesy
consisteentomarcomonmerodefactoreselnmeromnimonecesarioparaqueelporcentaje
acumuladodelavarianzaexplicadoalcanceunnivelsatisfactorio(75%,80%).
Tienelaventajadequesepuedeaplicartambincuandolamatrizanalizadaesladevarianzasy
covarianzas,peronotieneningunajustificacintericaoprctica.
(d) CriteriodeSedimentacin.Setratadelarepresentacingrficadondelosfactoresestnenel
ejedeabscisasylosvalorespropioseneldeordenadas.
Losfactoresconvarianzasaltassuelendiferenciarsedelosfactoresconvarianzasbajas.Se
puedenconservarlosfactoressituadosantesdeestepuntodeinflexin.
Ensimulacioneselcriteriohafuncionadobien,tieneelinconvenientedequedependedelojo
SantiagodelaFuenteFernndez13
AnlisisFactorial
delanalista.
(e) Criteriodedivisinalamitad.Lamuestrasedivideendospartesigualestomadasalazaryse
realizaelAnlisisFactorialencadaunadeellas.
Soloseconservanlosfactoresquetienenaltacorrespondenciadecargasdefactoresenlasdos
muestras.Antesdeaplicarlo,convienecomprobarquenoexistendiferenciassignificativasentre
lasdosmuestrasenloqueserefierealasvariablesestudiadas.
PRUEBASDESIGNIFICACIN
Paraseleccionarelnmero,consisteenaplicarcontrastesdehiptesisdemodelosanidados.Este
criteriosepuedeutilizarsielmtodoempleadoparaestimarlosfactoreseseldemxima
verosimilitud.
Enlamayorpartedeloscasoexploratoriosknopuedeserespecificadoporadelantadoy,en
consecuencia,seutilizanprocedimientossecuencialesparadeterminark.
Secomienzausualmenteconk=1(valorpequeo),losparmetrosenelmodelofactorialson
estimadosutilizandoelmtododemximaverosimilitud.Sielestadsticodeltestnoessignificativo,
seaceptaelmodeloconestenmerodefactores,encasocontrario,seaumentak=2yserepiteel
procesohastaalcanzarunasolucinaceptable.
Elprincipalinconvenientedeestemtodoesqueestbasadoenresultadosasintticosyque,siel
tamaodelamuestraesgrande,secorreelriesgodetomarelvalorkexcesivamentegrande
puestoqueeltestdetectacualquierfactorporpequeoqueseasupoderexplicativo.
INTERPRETACINDELOSFACTORES
Lainterpretacindelosfactoressebasaenlascorrelacionesestimadasdelosmismosconlas
variablesoriginales.
ElmodelodeAnlisisFactorialescierto,siseverifica:
k
i = 1, L , p ; l = 1, L , k
y,enparticular,silosfactoressonortogonales
Corre(Xi , Fl ) = ail
i = 1, L , p ; l = 1, L , k
Comoseobserva,lamatrizdecargasfactoriales(A)tieneunpapelfundamentalenlainterpretacin.
Porotraparte,lascargasfactorialesalcuadrado (a2il ) indicansilosfactoressonortogonales,qu
porcentajedelavariableoriginal(Xi)esexplicadoporelfactorFl.
Aefectosprcticos,enlainterpretacindelosfactores,sealar:
Identificarlasvariablescuyascorrelacionesconelfactorsonlasmselevadasenvalorabsoluto.
SantiagodelaFuenteFernndez14
AnlisisFactorial
Intentardarunnombrealosfactores.Elnombreseasignadeacuerdoconlaestructuradelas
correlaciones:Cuandoespositiva(resp.negativa)larelacinentreelfactorydichavariablees
directa(resp.inversa).
Analizandoconquvariablestieneunarelacinfuerteesposible,enmuchoscasos,teneruna
ideamsomenosclaradeculeselsignificadodeunfactor.
Unaayudaenlainterpretacindelosfactorespuedeserlarepresentacingrficadelos
resultadosobtenidos.Larepresentacinsehacetomandolosfactoresdosados.Cadafactor
representaunjedecoordenadas.Aestosejesselesdenominaejesfactoriales.
Sobrelosejesfactorialesseproyectanlasvariablesoriginales.
Lascoordenadasvienendadasporlosrespectivoscoeficientesdecorrelacinentrelavariabley
elfactor,deformaquelasvariablessaturadasenunmismofactoraparecenagrupadas.Esto
puedeservirdeayudaparadescubrirlaestructuralatentedeestefactor.
Lasvariablesalfinaldeunejesonaquellasquetienencorrelacionesaltassloenesefactory,
enconsecuencia,lodescriben.
Lasvariablescercadelorigentienencorrelacionesreducidasenambosfactores.
Lasvariablesquenoestncercadeningunodelosejesserelacionanconambosfactores.
Ordenarlamatrizfactorialdeformaquelasvariablesconcargasaltasparaelmismofactor
aparezcanjuntas.
Eliminarlascargasfactorialesbajasydeestemodosuprimirinformacinredundante.El
investigadordecideapartirdequvalordebeneliminarselascargasfactoriales.
Decaraaunamayorfacilidadinterpretativa,elinvestigadorpuedeordenarlamatrizfactorialy
eliminarlascargasfactorialesbajas.
Generalmente,setomacomosignificativaslascargassuperioresa0,5envalorabsoluto.Aunque,
sielfactoresmstardooelnmerodevariablesesgrande,seelevaelvalormnimodelacarga
factorialsignificativa.
Ejemplo.Enelmodelofactorialdefinido,setena:
matriz carg as
factoriales
64
4744
8
UMa
Ma 0,8 0,2
UFi
Fi 0,7 0,3
Ma = 0,8 F1 + 0,2F2 + UMa
Qu 0,6 0,3 F U
Qu
1
Fi = 0,7F1 + 0,3F2 + UFi
+
=
In 0,2 0,8 F2 UIn
Qu = 0,6 F1 + 0,3F2 + UQu
U
Hi 0,15 0,82
Hi
U
Di 0,25 0,85
Di
Corr(Ma, F1 ) = Cov(Ma, F1 ) = Cov(0,8 F1 + 0,2F2 + UMa ) = 0,8 Var(F1 ) + 0,2 Cov(F2 , F1 ) + Cov(UMa , F1 ) = 0,8
Engeneral,como F1 F2 Lascorrelacionesdelascalificacionesdelostestcondichosfactores
vendrndadasporlascargasfactoriales.
SantiagodelaFuenteFernndez15
AnlisisFactorial
Observandolamatrizdelascargasfactoriales,seapreciaqueelfactor F1 estmuyrelacionadocon
lavariablesMa,FiyQu,peropocorelacionadoconIn,HiyDi.Deotraparte,elfactor F2 estmuy
relacionadoconIn,HiyDiypococonlasrestantes.
Anlogamente,analizandolamatrizdecargasfactorialescorrespondientesalosfactores F1' y F2' :
Seobservaqueelfactor F1' estmuyrelacionadocontodaslasvariablesde
formadirectay,enconsecuencia,podrainterpretarsecomounfactorde
inteligenciageneral.
Porsuparte,elfactor F2' destacaenlaaptitudverbal,alestarrelacionado
deformainversaconMa,FiyQu.
0,71 0,42
0,71 0,28
0,64 0,21
B=
0,71 0,42
0,69 0,47
0,78 0,42
CabepreguntarseCuleslainterpretacinmscorrecta?.Tododependerdelateoraquesubyace
alproblemaquellevaralanalistaahacermshincapienunainterpretacinuotra.Decualquier
modo,tendrquevalidarelmodeloelegido.
ROTACINDELOSFACTORES
Lamatrizdecargasfactorialestieneunpapelimportanteparainterpretarelsignificadodelos
factores.Cuandolosfactoressonortogonalescuantificanelgradoytipodelarelacinentrestosy
lasvariablesoriginales.
Enlaprctica,losmtodosdeextraccindefactorespuedennoproporcionarmatricesdecargas
factorialesadecuadasparalainterpretacin.
ParaacometeresteproblemaestnlosprocedimientosdeRotacindeFactoresque,apartirdela
solucininicial,buscanfactorescuyamatrizdecargasfactorialesloshaganmsfcilmente
interpretables.
EstosmtodosintentanaproximarlasolucinobtenidaalPrincipiodeEstructuraSimple(LouisLeon
Thurstone,1935),segnelcuallamatrizdecargasfactorialesdebereunirtrescaractersticas:
1. Cadafactordebetenerunospocospesosaltosylosdemsprximosacero.
2. Cadavariablenodebeestarsaturadamsqueenunfactor.
3. Nodebenexistirfactoresconlamismadistribucin,estoes,dosfactoresdistintosdeben
presentardistribucionesdiferentesdecargasaltasybajas.
Deestamanera,dadoquehaymsvariablesquefactorescomunes,cadafactortendruna
correlacinaltaconungrupodevariablesybajaconelrestodelasvariables.
Alexaminarlascaractersticasdelasvariablesdeungrupoasociadoaundeterminadofactorse
puedenencontrarrasgoscomunesquepermitanidentificarelfactorydarleunadenominacinque
respondaaesosrasgoscomunes.
Siseconsigueidentificarclaramenteestosrasgos,ademsdereducirladimensindelproblema,
tambinsedesvelalanaturalezadelasinterrelacionesexistentesentrelasvariablesoriginales.
SantiagodelaFuenteFernndez16
AnlisisFactorial
Rotacin Ortogonal
ExistendosformasbsicasderealizarlaRotacindeFactores:
Rotacin Oblicua
Seeligeunouotroprocedimientosegnquelosfactoresrotadossigansiendoortogonalesono.
Sealarqueenambasrotacioneslacomunalidaddecadavariablenosemodifica,estoes,larotacin
noafectaalabondaddelajustedelasolucinfactorial:aunquecambielamatrizfactorial,las
especificidadesnocambiany,enconsecuencia,lascomunidadespermaneceninvariantes.Sin
embargo,cambialavarianzaexplicadaporcadafactor,portanto,losnuevosfactoresnoestn
ordenadosdeacuerdoconlainformacinquecontienen,cuantificadamediantesuvarianza.
RotacinOrtogonal.Losejesserotandeformaquequedepreservadalaincorrelacinentrelos
factores.Esdecir,losnuevosejes(ejesrotados)sonperpendicularesdeigualformaqueloson
losfactoressinrotar.
Larotacinseapoyaenelproblemadefaltadeidentificabilidaddelosfactoresobtenidospor
rotacionesortogonales,deformaquesiTesunamatrizortogonalcon T T' = T' T = I ,entonces:
Losmtodosempleadosenlarotacinortogonaldefactoresson:Varimax,Quartimax,Equamax,
ObliminyPromax.
MtodoVarimax.Esunmtododerotacinqueminimizaelnmerodevariablesconcargas
altasenunfactor,mejorandoaslainterpretacindefactores.
Elmtodoconsideraque,siselograaumentarlavarianzadelascargasfactorialesalcuadradode
cadafactorconsiguiendoquealgunasdesuscargasfactorialestiendanaacercarsea1mientras
queotrasseaproximana0,seobtieneunapertenenciamsclaraeinteligibledecadavariableal
factor.
Losnuevosejesseobtienenmaximizandolasumaparaloskfactoresretenidosdelasvarianzas
delascargasfactorialesalcuadradodentrodecadafactor.
Paraevitarquelasvariablesconmayorescomunalidadestenganmspesoenlasolucinfinal,se
efectalanormalizacindeKaiser(dividiendocadacargafactorialalcuadradoporla
comunalidaddelavariablecorrespondiente).
SantiagodelaFuenteFernndez17
AnlisisFactorial
Enconsecuencia,elmtodoVarimaxdeterminalaMatrizBdeformaquemaximicelasumadelas
varianzas:
2
k p b2
b
V = p ij 2ij
i=1 j=1 h
i=1 j=1 h j
j
MtodoQuartimax.Elobjetivoesquecadavariabletengacorrelacioneselevadasconun
pequeonmerodefactores.Paraello,maximizalavarianzadelascargasfactorialesalcuadrado
decadavariableenlosfactores,esdecir,setratademaximizarlafuncin:
S = k (b b
p
i=1
j=1
2
ij
2
i
donde , b2i =
1 k 2
bij
k j=1
Conello,selograquecadavariableconcentresupertenenciaenundeterminadofactor,estoes,
presenteunacargafactorialaltamientrasque,enlosdemsfactores,suscargasfactoriales
tiendenaserbajas.
Deestemodo,lainterpretacinganaenclaridadporcuantolacomunalidadtotaldecadavariable
permanececonstante,quedandomsevidentehaciaqufactorseinclinaconmsfuerzacada
variable.
Elmtodosermsclarificador,cuantomayornmerodefactoressehayancalculado.Este
mtodotiendeaproducirunprimerfactorgeneral,conocidoconelnombredetamao,yel
restodefactorespresentanponderacionesmenoresquelasdadasporelmtodoVarimax.
MtodoEquamax.Tratademaximizarlamediadeloscriteriosanteriores.Conun
comportamientosimilaraldelosmtodosanteriores.
Rotacinoblicua.EnestecasolamatrizTderotacinnotienequeserortogonal(cuando
unamatrizmultiplicadaporsutranspuestaeslamatrizidentidad T T' = I )sinonicamenteno
singular(matrizcuadradocuyodeterminantenoescero)
Deestamanera,losfactoresrotadosnotienenporquserortogonalesytener,portanto,
correlacionesdistintasdeceroentres.
Larotacinoblicuapuedeutilizarsecuandoesprobablequelosfactoresenlapoblacin
tenganunacorrelacinmuyfuerte.
Esnecesarioirconmuchaatencinenlainterpretacindelasrotacionesoblicuas,puesla
superposicindefactorespuedeconfundirlasignificacindelosmismos.
Deestaforma,elanlisisganamsflexibilidadyrealismoperoariesgodeperderrobustez,porlo
queconvieneaplicarestosmtodossielnmerodeobservacionesporfactoreselevada.
SantiagodelaFuenteFernndez18
AnlisisFactorial
Ejemplo.Enelmodelofactorialdefinido,setena:
matriz carg as
factoriales
64
4744
8
UMa
Ma 0,8 0,2
UFi
Fi 0,7 0,3
Ma = 0,8 F1 + 0,2F2 + UMa
Qu 0,6 0,3 F U
Qu
1
Fi = 0,7F1 + 0,3F2 + UFi
+
=
In 0,2 0,8 F2 UIn
Qu = 0,6 F1 + 0,3F2 + UQu
U
Hi 0,15 0,82
Hi
U
Di 0,25 0,85
Di
''
F =
1
Sisedefinenlosfactores:
F2'' =
4
F1 +
17
1
F1 +
17
1
F2
''
17 F1 = 4
F'' 1
4
2
F2
17
17 1
17 4
17 F1
17 F2
8
= 0,47 0 a Losnuevosfactoresestarncorrelacionados.
17
4 17 ''
17 ''
F1
F2
'
'
F1 =
17 1 17 F1
15 4 17 1 17 F1 F1
15
15
=
17 1 17 4 17 F2'' F2
17 4 17 F2
F = 17 F'' + 4 17 F''
1
2
2
15
15
Corr(F1'' , F2'' ) =
F1'' 4
=
F'' 1
2
dedonde,
4 17 ''
17 '' 4 17 ''
17 ''
Ma = 0,8 F1 + 0,2F2 + UMa = 0,8
F1
F2 + 0,2
F1 +
F2 + UMa = 0,82 F1'' + 0 F2'' + UMa
15
15
15
15
4 17 ''
17 '' 4 17 ''
17 ''
Fi = 0,7F1 + 0,3F2 + UFi = 0,7
F1
F2 + 0,3
F1 +
F2 + UFi = 0,69 F1'' + 0,14 F2'' + UFi
15
15
15
15
yassucesivamente.
Enestecaso,setienequelamatrizderotacin: T =
15 4 17
17 1 17
4 17
1 17 15
=
17
4 17
15
17
15
4 17
15
matriz de c arg as
factoriales
6447448
0,82 0,00
0,69 0,14
0,58 0,17
Lamatrizdeconfiguracin: B =
0,00 0,82
0,06 0,86
0,04 0,87
SantiagodelaFuenteFernndez19
AnlisisFactorial
Lamatrizdelaestructuraseraquellaquecontienelascorrelacionesdelasvariablesoriginalescon
losnuevosfactores:
matriz estructura
64
4744
8
0,82 0,39
0,82 0,00
0,76 0,46
0,69 0,14
0,58 0,17 1
8 / 17 0,66 0,44
=
1 0,39 0,82
0,00 0,82 8 / 17
0,34 0,83
0,06 0,86
0,45 0,89
0,04 0,87
s<q=1
k
MtodoOblimin.Buscaminimizarlaexpresin:
k
b2is b2iq
i=1
i=1
controlalainterpretabilidaddelosfactores
s<q=1 i=1
s<q=1 i=1
o Para = 1 sealcanzaelmximogradodeoblicuidad.
o Cuntomsseaproximaa0,msortogonalessonlosfactores.
Enlarotacinoblicua,comolosfactoresestncorrelacionadosentres,lascargasfactorialesno
coincidenconlascorrelacionesentreelfactorylavariable.
Porrestemotivo,lospaquetesestadsticoscalculandosmatrices:
Lamatrizdecargasfactorialesquemuestralacontribucinnicadecadavariablealfactor.
Lamatrizdeestructurafactorialquemuestralascorrelacionesentrelosfactoresylas
variables,mostrandoinformacinacercadelacontribucinnicaydelascorrelacionesentre
factores.
Ademsdeestasdosmatrices,convieneanalizarlamatrizdecorrelacionesentrefactores.
SantiagodelaFuenteFernndez20
AnlisisFactorial
Silascorrelacionesentrelosfactoressonmuypequeasesmsrobustoaplicarrotaciones
ortogonales.
Deotraparte,sidosfactoresestnmuycorrelacionadospuedeserporqueestnmidiendoelmismo
conceptoyque,portanto,hayaquereducirelnmerodefactores.
MtodoPromax.Alteralosresultadosdeunarotacinortogonalhastacrearunasolucincon
cargasfactorialeslomsprximasalaestructuraideal.
Laestructuraidealseobtieneelevandoaunapotencia(entre2y4)lascargasfactoriales
obtenidasenunarotacinortogonal.Cuantomayorsealapotencia,msoblicuaeslasolucin
obtenida.
SeaHlamatrizdecargasbuscadaporelmtodoPromax,buscaunamatrizTtalque A T = H .
Multiplicandoambosmiembrosporlamatriz (A' A)1 A' ,setiene: T = (A' A)1 A' H
CLCULODEPUNTUACIONESFACTORIALES
Habiendodeterminadolosfactoresrotados,secalculalasmatricesdepuntuacionesfactorialesF.
Sonvariadaslasposibilidadesdeanalizarlaspuntuacionesfactorialesdelossujetos:
Conocerqusujetossonlosmsrarosoextremos,esdecir,larepresentacingrficadelas
puntuacionesfactorialesparacadapardeejesfactorialesfacilitadetectarcasosatpicos.
Conocerdndeseubicanciertosgrupososubcolectivosdelamuestra(ejemplo;clasealtafrente
aclasebaja,unaprovinciafrentealasotrasprovincias,jvenesfrenteamayores,etc.)
Conocerenqufactorsobresalenunossujetosynqufactorno.
Explicar,atendiendolasinformacionesanteriores,porquhanaparecidodichosfactoresenel
anlisisfactorialrealizado.
Esnecesarioconocerlosvaloresquetomanlosfactoresencadaobservacin,puesenocasiones,el
AnlisisFactorialesunpasoprevioaotrosanlisis:RegresinMltipleoAnlisisCluster,enlosque
sustituyeelconjuntodevariablesoriginalesporlosfactoresobtenidos.
MtodosdelClculodelasPuntuaciones.ExistendiversosmtodosdeestimacindelamatrizF,
laspropiedadesdeseablesqueverificasenlosfactoresestimadosson:
Cadafactorestimadopresenteunacorrelacinaltaconelverdaderofactor.
Cadafactorestimadotengacorrelacinnulaconlosdemsfactoresverdaderos.
Losfactoresestimadossonincorreladosdosados(mutuamenteortogonalessisonortogonales).
SantiagodelaFuenteFernndez21
AnlisisFactorial
Losfactoresestimadosseanestimadoresinsesgadosdelosverdaderosfactores.
Sealarqueelproblemadeestimacinescomplejoporlapropianaturalezadelosfactores
comunes.Sepuededemostrarquelosfactoresnoson,engeneral,combinacinlinealdelas
variablesoriginales.
Porotraparte,enlamayoradelassituaciones,noexistirunasolucinexactanisiquierasernica.
Todoslosmtodosdeobtencindepuntuacionesfactorialespartendelaexpresin X = F A'+U ,con
E[U] = 0, Var[U] = ,buscandoestimarelvalordeF.
Losmtodosdeestimacinmsutilizados:Regresin,Barlett,AndersonRubin
MtododeRegresin.EstimaFporelmtododelosmnimoscuadrados: F = (A' A)1 A' X
MtododeBarlett.Utilizaelmtododelosmnimoscuadradosgeneralizadosestimandolas
puntuacionesfactorialesmediante: F = (A' 1 A)1 A' 1 X
MtododeAndersonRubin.EstimaFmedianteelmtododelosmnimoscuadrados
generalizados,imponiendolacondicin F'F = I
ElMtododeRegresindalugarapuntuacionesconmximacorrelacinconlaspuntuaciones
tericas.Sinembargo,elestimadornoesinsesgado,niunvocoy,encasodequelosfactores
seanortogonales,puededarlugarapuntuacionescorreladas.
ElMtododeBarlettdalugarapuntuacionescorreladasconlaspuntuacionestericas,insesgadas
yunvocas.Sinembargo,encasodequelosfactoresseanortogonales,puededarlugara
puntuacionescorreladas.
ElMtododeAndersonRubindalugarapuntuacionesortogonalesqueestncorreladasconlas
puntuacionestericas.Sinembargo,elestimadornoesinsesgadoniunvoco.
SeleccindeVariables.Elinvestigadorenocasionesdeseaseleccionarlasvariablesms
representativasdelosfactores,enlugardecalcularsuspuntuaciones.
Porejemplo,siseutilizaelAnlisisFactorialparareducirelnmerodedatos,porrazonesde
economa,sisequierenaplicarlosresultadosobtenidosaobjetosdiferentesdelosestudiadosenel
anlisis,esmsinteresanteseleccionaralgunasdelasvariablesoriginalmentemedidasdadala
dificultaddelclculodelaspuntuacionesfactorialesparalasquesenecesitaramedirtodaslas
variablesutilizadasenelestudio.
SantiagodelaFuenteFernndez22
AnlisisFactorial
Unaformadellevaracabolaseleccindevariablesesestudiarlamatrizdecorrelacionesdelas
variablesconlosfactores,seleccionandocomorepresentantedecadafactorlavariableconla
correlacinmselevadaenste,queseamsfcildemediryquetengamssentidodesdeunpunto
devistaterico.
Encualquiercaso,convieneelegirlasvariablesdeformaqueunamismavariablenoseutilicepara
medirdosfactoresdistintos.
Unavezelegidaslasvariables,selesasignapesosbasadosensucorrelacinconelfactor,yse
compruebasuvalidezestimandosucorrelacinconlosfactoresquedeseaestimarmediantela
frmula Rfs = A' W diag(Rss ) donde Rss eslamatrizdecorrelacionesdelaspuntuacionesestimadas.
VALIDACINDELMODELO.ElltimopasoenelAnlisisFactorialesestudiarlavalidezdelmodelo.
Elprocesodeberealizarseendosdirecciones:AnalizandolabondaddeajusteylaGeneralidaddelos
resultados.
BondaddeAjuste.UnasuposicinbsicasubyacentealAnlisisFactorialesquelacorrelacin
observadaentrelasvariablespuedeatribuirseafactorescomunes.
Porconsiguiente,lascorrelacionesentrevariablespuedendeducirseoreproducirseapartirdelas
correlacionesestimadasentrelasvariablesylosfactores.
Afindedeterminarelajustedelmodelo,puedenestudiarselasdiferencias(residuos)entrelas
correlacionesobservadas(matrizdecorrelacindeentrada)ylascorrelacionesreproducidas(como
seestimanapartirdelamatrizfactorial).
Elmodelofactorialesadecuadocuandolosresiduossonpequeos.
Sihayunporcentajeelevadoderesiduossuperioresaunacantidadpequeaprefijada(por
ejemplo,0,05),serunaindicacindequeelmodelofactorialestimadonoseajustaalosdatos.
Sesabeademsquehaymsestabilidadenlosresultadossielnmerodecasosporvariablees
alto.
Generalidaddelosresultados.Esconvenienterefrendarlosresultadosdelprimeranlisisfactorial
realizandonuevosanlisisfactorialessobrenuevasmuestrasextradasdelapoblacinobjetode
estudioy,encasodenoserposible,sobresubmuestrasdelamuestraoriginal.
Encadacasohabrqueestudiarqufactoresdeloscalculadossoncorroboradosenlosdistintos
anlisisllevadosacabo.
Otraposibilidadesrealizarnuevosanlisisfactorialesmodificandolasvariablesconsideradas,bien
seaeliminandoaquellasvariablesquenotienenrelacinconningnfactoroeliminandolas
variablesconrelacionesmsfuertestratandodedescubrircmosecomportaelrestodeellassin
supresencia.
Otrodelosprocedimientosmetodolgicosyestadsticosquecomplementanyprofundizanlas
interpretacionesquesededucendelanlisisfactorialconsisteenlarealizacindeotrosanlisis
factorialesenbase,noalconjuntototaldelamuestraopoblacin,sinoreferidoasubcolectivoso
gruposqueestnpresentesenlamuestrayquepuedenformarseutilizandolascategorasdelas
SantiagodelaFuenteFernndez23
AnlisisFactorial
variablesprimarias(sexo,clasesocial,tipodecentro,tipodemetodologapedaggica,tiposde
actitud,etc.).
Loquesedesprendedelostrabajoseinvestigacionesquehanutilizadoesteprocedimientoesque
generalmentelainterpretacinquesedayqueesvlidaparaelconjuntototaldesujetosdebe
modificarse,enalgunoscasossustancialmente,cuandoserefiereaesossubcolectivos.Encasode
seras,sederivaunadobleconclusin:
(a) LasvariablessecomportanenelAnlisisFactorialdedistintaformasegndequmuestra
setrate.
(b) Noexisteelsujetotiposinoqueexistendiferentestiposdesujetosenlamuestraglobal.
Finalmente,sedeberaplantearunAnlisisFactorialConfirmatorioparacomprobarlosresultados
obtenidosenlaversindeAnlisisFactorialExploratorio.
Resumen.ElAnlisisFactorialesunatcnicaestadsticamultivariantecuyafinalidadesanalizarlas
relacionesdeinterdependenciaexistentesentreunconjuntodevariables,calculandounconjuntode
variableslatentes,denominadasfactores,queexplicanconunnmeromenordedimensiones,
dichasrelaciones.
Porestemotivo,elAnlisisFactorialesunatcnicadereduccindedatosconunnmeromenorde
variablessindistorsionardichainformacin,loqueaumentaelgradodemanejoeinterpretacinde
lamisma.
SantiagodelaFuenteFernndez24
AnlisisFactorial
Ejemplo.Losdatosadjuntoscorrespondenalamedicinde17humedalesendeterminadapoca
delao.Lasvariablesmedidashansido:
1.
2.
3.
4.
5.
X1:Conductividadelctrica
X2:Contenidoenbicarbonatos
X3:Contenidoencloruros
X4:Contenidoensulfatos
X5:Contenidoencalcio
Humedal
Caja
Camuas
Capacete
Cerero
Chica
Dulce
FPSalinas
FPVicaria
Grande
Gualdal.May
Hoyos1
Lobn
Marcela
Ratosa
Redonda
Salada
Viso
X1
0,315
8
3,41
3,94
2,8
1,56
11
8,75
2,6
6,37
1,18
0,57
3,4
3,48
4,62
3,8
0,3
X2
1,6694
3,7282
4,0642
1,4585
4,4862
2,4745
1,2206
2,6384
3,3251
2,5483
5,1966
1,7494
2,1189
1,7207
1,0357
0,8685
1,8567
X3
5
2388
732
1359
220
269
3038
4325
840
2320
13
110
1121
1484
472
1023
7
6.X6:Contenidoenmagnesio
7.X7:Contenidoensodio
8.X8:Contenidoenpotasio
9.X9:Contenidoenfosfatos
X4
86
7638
881
772
2510
495
923
456
2270
1040
499
42
866
554
2964
2274
15
X5
55
2123
218
251
572
157
233
234
609
1294
202
21
157
151
752
1946
39
X6
4
972
122
96
20
38
226
229
86
192
20
12
115
151
160
360
3
X7
4
1757
379
710
458
162
1488
2371
284
485
5
60
643
708
652
430
4
X8
2
5
41
14
7
9
11
11
7
23
18
6
4
7
34
23
2
X9
1,8082
0,3228
74,588
0,0968
0,0968
0,3228
0,0645
1,1947
0,5166
0,4843
6,7807
0,5812
0,7426
0,1291
0,1291
0,5489
4,4882
Lasvariablesestnmedidasendistintasunidades,teniendoquetipificarensumomento
PararealizarenSPSSelAnlisisFactorialporelmtododeComponentesPrincipales:
[Analizar/ReduccindeDatos/AnlisisFactorial]
SantiagodelaFuenteFernndez
25
AnlisisFactorial
Enelbotn[Extraccin]sepuedecambiarlaopcindemtododeseado,SPSSrealizapordefectoel
mtododeComponentesprincipales.Losmtodosdisponiblesson:Componentesprincipales,
Mnimoscuadradosnoponderados,Mnimoscuadradosgeneralizados,Mximaverosimilitud,
FactorizacindeEjesprincipales,FactorizacinAlfayFactorizacinImagen.
Loprimeroqueserealizaesdeterminarla
estructurafactorialnecesaria,enlaopcin[Extraer]
seutilizaelmtododeKaiserquedeterminatantos
factorescomoautovaloresmayoresque1.Esel
mtodopordefectoquerealizaSPSS.
LaregladeKaiserproporciona
unaestructurafactorialcontres
factoresqueexplicanel81,946%
delavarianzatotal.
Noobstante,elcuartovalorseencuentramuyprximoa1,proporcionaunfactorquedeterminael
10,963%delavarianza,porloquesedecideincluirlotambinenlaestructurafactorial.
Finalmente,seeligeunaestructurafactorialdecuatrofactoresqueexplicaranel92,639%dela
varianza.EstadecisinseobservatambinenelGrficodeSedimentacin:
SantiagodelaFuenteFernndez
26
AnlisisFactorial
ElanlisisseenfocaenlasComunalidades(quemuestranqueporcentajedecadavariablees
explicadoporlanuevaestructurafactorial),yenlamatrizdeComponentesdelanuevaestructura
(eliminandolosvaloresmenoresde0,3).
Paraello,enelbotn[Extraccin]se
eligen4factores
Enelbotn[Opciones]seeligeOrdenarlascoeficientespor
tamaoySuprimirvaloresabsolutosmenoresque0,3.
ElVisordeSPSSpresenta:
LasComunalidadessonmuyaltas,loqueimplicaquetodaslasvariablesestnmuybien
representadasenelespaciodelosfactores(laComunalidadrepresentaelcoeficientedecorrelacin
linealmltipledecadavariableconlosfactores).
Laestructurafactorialnoestmuyclaraenprincipio,yaquediversosfactorescompartenvariables.
SantiagodelaFuenteFernndez
27
AnlisisFactorial
Porejemplo,lavariablePotasio(X8)estrelacionadaconlosfactoressegundo,terceroycuarto.La
variableFosfatos(X9)aparecetantoenelsegundofactorcomoeneltercero.Lomismoocurrepara
lasvariablesSulfatos(X4)yCalcio(X5)respectoalosejesprimeroytercero.
Grficamenteserepresentanlasvariablesenel
planodelosfactores(primero,tercero).Paraello,
enelbotn[Rotacin]seeligelaopcin
Grficosdesaturaciones.
EnelVisordeSPSSsaleelGrficodecomponentestridimensionaldelosfactores:
HaciendodosclickenelGrfico,obienconelbotndelaizquierdadelratnseleccionandoObjeto
GrficodeSPSS,seseleccionaPropiedades,yseeligenlasVariablesquesedeseanrepresentar.
Seobservaquelasdosvariables(Sulfatos,
Calcio)formanunnguloprximoa45o
concadaeje,locualnopermite
asociarlasaningunodeellos(las
saturacionesrepresentanenestecasolas
correlacionesdelasvariablesconcada
ejeyporlotantoelcosenodelnguloque
formanconellos).
Almismotiempo,lavariableBicarbonato
estacercadelejedecoordenadas,indica
quenoestrelacionadaconningunode
losdosejes.
SantiagodelaFuenteFernndez
28
AnlisisFactorial
Conlaideadeclarificarlaestructurafactorialsinperder
poderexplicativo,serealizaunarotacindeejes.Seeligeel
botn[Rotacin]yelmtodoVarimax(mtododerotacin
ortogonalqueminimizaelnmerodevariablesquetienen
saturacionesaltasencadafactor).
Lainterpretacinsimplificadelosfactoresoptimandola
solucinporcolumnaproducelasiguientematrizde
componentes(lascomunalidadesnovaran):
Factor1:AsociadoalasvariablesdeCloruros,Sodio,ConductividadElctricayenmenorproporcin
aMagnesio.Tieneunpoderexplicativodel44,291%delavarianzatotal(elporcentajedeinerciase
refierealosejesquesehanobtenidoenprimerlugarynotienenporqucoincidirconlos
porcentajesdeinerciaunavezrotados,aunquescoincideconeltotalexplicado,SSPSmuestrael
porcentajeenlarotacinVarimax:32,471%,29,308%,18,144%y12,716%).
LavariableConductividadElctricaquedaexplicadaporeltotaldelosfactoresenun93,6%
(Comunalidad0,936),mientrasquerepresentael84,08%(0,9172=84,08%)delavarianzatotal,
esdecir,el89,83%(0,8408/0,936=89,83%)deltotaldelespaciodelosfactores.
LaestructurafactorialcompletadeterminaalavariableClorurosunavarianzatotalde94,28%,
estoes,el98,31%deltotaldelespaciodelosfactores.
SantiagodelaFuenteFernndez
29
AnlisisFactorial
LavariableSodiotieneunaComunalidadde0,951,conun95,1%delavarianzaexplicada
(89,11%porestefactory93,7%enelespaciodelosfactores).
LavariableMagnesioquedaexplicadaporlaestructurafactorialenun92%,conmenoscarga
factorialquelasanteriores(0,447),loquerepresentacasiel20%desuvarianza(21,71%enla
estructurafactorial).
Factor2:AsociadoalasvariablesCalcio,SulfatosyMagnesio.Conunpoderexplicativode20,448%
deinercia.
LavariableMagnesio,representadaporunaestructurafactorialde92%(Comunalidadde0,92),
estmsrepresentadaporestefactor,susaturacin(cargafactorial)esde0,845,conloque
representael0,8452=71,40%desuvarianzatotal,esdecirel77,61%(0,714/0,92=77,61%)de
laexplicadaportodoslosfactores.
LavariableSulfatosquetieneunaComunalidadde0,93,unasaturacinde0,927,esexplicada
poresteejeconun85,93%(0,9272=0,8593),loqueesun92,4%enelespaciodelosfactores
(0,8593/0,93=92,397%).
LavariableCalcio,conunaComunalidadde0,915(representael91,5%),tieneunacarga
factorialde0,939,porloqueel88,17%desuvarianzatotal[0,9392=88,17%]viene
representadaporesteeje(96,36%deloexplicadoporlaestructurafactorialtotal
0,8817/0,915=96,36%)
Factor3:AsociadoalasvariablesPotasioyFosfatos,conunporcentajedeinerciaexplicadadel
17,207%.(18,144%conejesrotados).
LavariablePotasio,conunaComunalidadde0,922,yestefactoraportael89,68%,esdecir,un
97,27%deloexplicadoporlaestructurafactorial.
LavariableFosfatosestrepresentadaenelespaciodelosfactoresporunaComunalidadde
0,864,queatribuiblealtercerfactoresel65,55%,conunasaturacinde0,834,estoes,el80,5%
delespaciodelosfactores.
Factor4:RepresentadoprincipalmenteporlavariableBicarbonato,representadaporunaestructura
factorialde94,2%(Comunalidadde0,942),tieneunacargafactorialde0,956.Lavarianzaexplicada
porelfactores91,39%,loqueequivaleal97,02%delodeterminadoporloscuartofactores.
LaestructurafactorialhaquedadoclarificadaysolamentelavariableMagnesioparecequecomparte
partedesuvarianzacondosfactores.Elsiguientepasoserainterpretarentrminosgeolgicosel
significadodelosfactores,osea,intentarresumirelporquseunenesasvariableseinclusointentar
darunnombreacadafactor.
SantiagodelaFuenteFernndez
30
AnlisisFactorial
Apartirdeunamatrizdecorrelaciones,elAnlisisFactorialextraeotramatrizquereproducela
primeradeformamssencilla.Estanuevamatrizsedenominamatrizfactorialyadoptalasiguiente
forma:
1
2
3
..
l
1
P11
P12
P13
..
P1l
2
P21
P22
P23
..
P2l
Cadacolumnaesunfactoryhaytantasfilascomovariablesoriginales.
LoselementosPijpuedeninterpretarsecomondicesdecorrelacinentreelfactorisimoyla
variablejsima,aunqueestrictamenteslosoncorrelacionescuandolosfactoresnoestn
correlacionadosentres,esdecir,sonortogonales.
Estoscoeficientesrecibenelnombredepesos,cargas,ponderacionesosaturacionesfactoriales.Los
pesosfactorialesindicanelpesodecadavariableencadafactor.Loidealesquecadavariablecargue
altoenunfactorybajoenlosdems.
Eigenvalues
Elcuadradodeunacargafactorialindicalaproporcindelavarianzaexplicadaporunfactorenuna
variableparticular.
Lasumadeloscuadradosdelospesosdecualquiercolumnadelamatrizfactorialesloque
denominamoseigenvalues(),indicalacantidadtotaldevarianzaqueexplicaesefactorparalas
variablesconsideradascomogrupo.
Lascargasfactorialespuedentenercomovalormximo1,portantoelvalormximoquepuede
alcanzarelvalorpropioesigualalnmerodevariables.
Sidividimoselvalorpropioentreelnmerodevariablesnosindicalaproporcindelasvarianzade
lasvariablesqueexplicaelfactor.
Comunalidades
SedenominaComunalidadalaproporcindelavarianzaexplicadaporlosfactorescomunesenuna
variable.
LaComunalidad(h)eslasumadelospesosfactorialesalcuadradoencadaunadelasfilas.
ElAnlisisFactorialcomienzasusclculosapartirdeloqueseconocecomomatrizreducida
compuestaporloscoeficientesdecorrelacinentrelasvariablesyconlascomunalidadesenla
diagonal.
SantiagodelaFuenteFernndez
31
AnlisisFactorial
Comolacomunalidadnosepuedesaberhastaqueseconocenlosfactores,esteresultaserunodelos
problemasdelAnlisisFactorial.
EnelAnlisisdeComponentesPrincipalesnosesuponelaexistenciadeningnfactorcomnla
comunalidadtomacomovalorinicial1.
Enlosotrosmtodosseutilizandiferentesmodosdeestimarlacomunalidadinicial:
Estimandolacomunalidadporlamayorcorrelacinenlafilaisimadelamatrizdecorrelaciones.
Estimandolacomunalidadporelcuadradodelcoeficientedecorrelacinmltipleentrexylas
demsvariables.(SPSSpordefecto).
Elpromediodeloscoeficientesdecorrelacindeunavariablecontodaslasdems.
Calculandoapartirdelosdoscoeficientesdecorrelacinmayoresdeesavariablelasiguiente
r r
operacin: h2 = xy xz
ryz
LaGrficatridimensionaldelasvariablesenelespaciodelosfactorespermitenvisualizarla
estructurafactorial
matrizdelascargasfactorialescorrespondientesalosfactores
SantiagodelaFuenteFernndez
32