Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PCAscikitlearn0,18documentacin
Casa Instalacin
Documentacin
Ejemplos
sklearn.decomposition.PCA
clase(n_components=Ninguno,copia=True,blanquear=False,svd_solver="auto",tol=0.0,iterated_power="auto",random_state=Ninguno)
sklearn.decomposition.PCA [fuente]
Elanlisisdecomponentesprincipales(PCA)
reduccindedimensionalidadlinealutilizandodescomposicinenvaloressingularesdelosdatosparaproyectarlaaunespaciodimensionalinferior.
SeutilizalaaplicacinLAPACKdelaSVDcompletoounSVDtruncadoaleatorioporelmtododeHalkoetal.2009,dependiendodelaformadelos
datosdeentradayelnmerodecomponentesaextraer.
Textooriginal
Tambinpuedeutilizarlaaplicacinscipy.sparse.linalgARPACKtruncadadelaenfermedadvesicularporcina.
Linear dimensionality reduction using Singular Value Decomposition
ofthedatatoprojectittoalowerdimensionalspace.
LeemsenlaGuadelusuario.
parmetros: n_components:int,float,ounacadenaNinguno Sugiereunatraduccinmejor
Nmerodecomponentesquemantener.sinoseestablecen_componentstodosloscomponentessemantienen:
n_components==min(N_SAMPLES,n_features)
sin_components=='MLE'ysvd_solver=='completo',MLEdeMinkaseutilizarnparaintentardeterminarsila
dimensinysvd_solver=='completo',seleccioneelnmerodecomponentesdetalmaneraquelacantidaddevarianza
quenecesitaserexplicadoesmayorqueelporcentajeespecificadoporn_componentsn_componentsnopuedenser
igualesan_featuresparasvd_solver=='arpack'.0<n_components<1
copia:bool(pordefectoTrue)
Siesfalso,losdatospasadosparaencajarsesobrescribenyseejecutaenforma(X).transform(X)noseobtendrnlos
resultadosesperados,elusofit_transform(X)ensulugar.
blanquee:bool,opcional(pordefectoFalso)
CuandoVerdadero(Falsepordefecto)loscomponents_vectoressemultiplicanporlarazcuadradadeN_SAMPLESy
luegodivididosporlosvaloressingularesparaasegurarsalidascorrelacionadasconlasvariacionesdeloscomponentes
delaunidadagota.
Blanqueamientoquitaralgodeinformacindelasealtransformada(lasescalasdevariacinrelativadelos
componentes),peroenalgnmomentosepuedemejorarlaexactitudpredictivadelosestimadoresaguasabajo
haciendoquesusdatosrespetanalgunossupuestoscableados.
svd_solver:{string'auto','completo','arpack','aleatorio'}
Auto:
elsolucionadorseseleccionaporunapolticapordefectobasadoenX.shapeyn_components:silosdatosde
entradaesmayorque500x500yelnmerodecomponentesaextraeresmenorque80%deladimensinms
pequeadelosdatos,acontinuacin,acontinuacin,mseficiente"aleatorizado'estactivadomtodo.Delo
contrarioexactodelaenfermedadvesicularporcinacompletasecalculayopcionalmentetruncadadespus.
completo:
ejecutarexactaSVDcompletallamandoalsolucionadordeLAPACKestndaratravsdescipy.linalg.svdy
seleccionarloscomponentesdepostprocesado
arpack:
SVDcarreratruncaan_componentsllamadasARPACKsolucionadortravsscipy.sparse.linalg.svds.Serequiere
estrictamente0<n_components<X.shape[1]
aleatorio:
ejecutaraleatoriosSVDporelmtododeHalkoetal.
Nuevoenlaversin0.18.0.
tol:flotador>=0,opcional(pordefecto0.0)
Latoleranciaparalosvaloressingularescalculadasporsvd_solver=='arpack'.
Nuevoenlaversin0.18.0.
Anterior
http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 1/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin
iterated_power:int>=0,o"auto",(pordefecto'auto')
Nmerodeiteracionesparaelmtododelapotenciacalculadaporsvd_solver=='alazar'.
Nuevoenlaversin0.18.0.
random_state:intoinstanciaRandomStateoNinguno(predeterminadoNinguno)
PseudoRandomNumbercontroldelasemilladelgenerador.Sininguno,utiliceelsingletonnumpy.random.Utilizadopor
svd_solver=='arpack"o"aleatorio".
Nuevoenlaversin0.18.0.
atributos: components_:matriz,[n_components,n_features]
Ejesprincipalesenelespaciodecaractersticas,querepresentanlasdireccionesdemximavarianzaenlosdatos.Los
componentesestnordenadosporexplained_variance_.
explained_variance_:matriz,[n_components]
Lacantidaddevarianzaexplicadaporcadaunodeloscomponentesseleccionados.
Nuevoenlaversin0.18.
explained_variance_ratio_:matriz,[n_components]
Porcentajedevarianzaexplicadaporcadaunodeloscomponentesseleccionados.
Sin_componentsnoseestableceacontinuacin,sealmacenantodosloscomponentesylasumadelasvarianzas
explicadasesiguala1,0.
mean_:matriz,[n_features]
Porfuncinempricamedia,estimadaapartirdelconjuntodeentrenamiento.
IgualaX.mean(eje=1).
n_components_:int
Elnmeroestimadodecomponentes.Cuandon_componentsseestableceen'MLE'ounnmeroentre0y1(con
svd_solver=='completo'),estenmeroseestimaapartirdelosdatosdeentrada.Delocontrario,esigualalos
n_componentsdeparmetros,osin_featuresn_componentshayninguno.
noise_variance_:flotador
LacovarianzaderuidoestimadasiguiendoelmodeloprobabilsticodePCAapartirdevuelcoyelobispode1999.
Vaseel"reconocimientodepatronesyaprendizajeautomtico"porC.Bishop,12.2.1pg.574o
http://www.miketipping.com/papers/metmppca.pdf.Serequierecalculadolacovarianzaestimadadedatosyla
puntuacindelasmuestras.
vertambin: KernelPCA,SparsePCA,TruncatedSVD,IncrementalPCA
referencias
Paran_components=='MLE',estaclaseutilizaelmtododeThomasP.Minka:SeleccinautomticadeladimensionalidaddePCA.PELLIZCOS
2000:598604
ImplementaelmodeloprobabilsticodePCA:.M.vuelcoyC.Bishop,directordeAnlisisdeComponentesProbabilstico,RevistadelaRealSociedad
deEstadstica,SerieB,61,parte3,pp611622atravsdelapartiturayscore_samplesmtodos.verhttp://www.miketipping.com/papers/met
mppca.pdf
Parasvd_solver=='arpack',consultescipy.sparse.linalg.svds.
Parasvd_solver=="aleatorio",vase:Encontraralaestructuraconlaaleatoriedad:.Algoritmosestocsticosparalaconstruccindefactorizacinde
matricesaproximadasHalko,etal,2009(arXiv:909)UnalgoritmoaleatorioparaladescomposicindematricesPerGunnarMartinsson,Vladimiry
RokhlinMarcosTygert
Ejemplos
>>>Importnumpycomonp
>>>desklearn.decompositionimportacinPCA
>>>X=np.Array([[1,1],[2,1],[3,2],[1,1],[2,1],[3,2]])
>>>PCA=PCA(n_components=2)
>>>PCA.ajuste(X)
Anterior
http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 2/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin
PCA(copia=True,iterated_power="auto",n_components=2,random_state=Ninguno,
svd_solver="auto",tol=0,0,blanquee=False)
>>>print(PCA.explained_variance_ratio_)
[0.992440.00755......]
>>>PCA=PCA(n_components=2,svd_solver="total")
>>>PCA.Ajuste(X)
PCA(copia=True,iterated_power="auto",n_components=2,random_state=Ninguno,
svd_solver='completa',tol=0,0,blanquee=False)
>>>print(PCA.explained_variance_ratio_)
[0.992440.00755......]
>>>PCA=PCA(n_components=1,svd_solver='arpack')
>>>PCA.Ajuste(X)
PCA(copia=True,iterated_power="auto",n_components=1,random_state=Ninguno,
svd_solver='arpack',tol=0,0,blanquee=False)
>>>print(PCA.explained_variance_ratio_)
[0,99244...]
mtodos
fit(X[,y]) AjustarelmodeloconX.
fit_transform(X[,y]) AjustarelmodeloconXyaplicarlareduccindedimensionalidadenX.
get_covariance() Calcularlacovarianzadedatosconelmodelogenerativo.
get_params([profundo]) Obtenerparmetrosparaesteestimador.
get_precision() Calcularlamatrizdeprecisindedatosconelmodelogenerativo.
inverse_transform(X Transformarlosdatosdenuevoasuespaciooriginal.
[,y])
score(X[,y]) Devolvereldiariodeprobabilidadmediadetodaslasmuestras.
score_samples(X) Devolverellogaritmodelaverosimilituddecadamuestra.
set_params(** Establecerlosparmetrosdeesteestimador.
Params)
transform(X[,y]) AplicarlareduccindedimensionalidadaX.
__init__(N_components=Ninguno,copia=True,blanquear=False,svd_solver="auto",tol=0.0,iterated_power="auto",random_state=
Ninguno) [fuente]
fit(X,Y=ninguno) [fuente]
AjustarelmodeloconX.
parmetros: X:matrizcomo,deforma(N_SAMPLES,n_features):
Losdatosdeentrenamiento,dondeN_SAMPLESenelnmerodemuestrasyn_featureseselnmerode
caractersticas.
Devuelve: auto:Objeto
Devuelvelainstanciadesmismo.
fit_transform(X,Y=ninguno) [fuente]
AjustarelmodeloconXyaplicarlareduccindedimensionalidadenX.
parmetros: X:matrizsimilar,laforma(N_SAMPLES,n_features)
datosdeentrenamiento,dondeN_SAMPLESeselnmerodemuestrasyn_featureseselnmerode
caractersticas.
Devuelve: X_new:matrizsimilar,laforma(N_SAMPLES,n_components)
get_covariance() [Fuente]
Calcularlacovarianzadedatosconelmodelogenerativo.
cov=components_.T*S**2*components_+sigma2*eye(n_features)dondeS**2contienelasvarianzasexplicadas,ysigma2contieneel
ruidodelasvarianzas.
Devuelve: cov:matriz,forma=(n_features,n_features)
covarianzaestimadadedatos.
Anterior
http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 3/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin
get_params(Profundidad=True) [fuente]
Obtenerparmetrosparaesteestimador.
parmetros: profunda:booleano,opcional:
SiesTrue,devolverlosparmetrosparaesteestimadorycontenidasubobjetosquesonestimadores.
Devuelve: params:mapeodecadenaacualquier
Losnombresdeparmetrosasignanasusvalores.
get_precision() [Fuente]
Calcularlamatrizdeprecisindedatosconelmodelogenerativo.
Esigualalainversadelacovarianzaperocalculadaconlainversindelamatrizlemaparalaeficiencia.
Devuelve: precisin:matriz,forma=(n_features,n_features)
precisinestimadadelosdatos.
inverse_transform(X,Y=ninguno) [fuente]
Transformarlosdatosdenuevoasuespaciooriginal.
Enotraspalabras,devuelvaunaentradaX_originalcuyatransformarseraX.
parmetros: X:matrizsimilar,laforma(N_SAMPLES,n_components)
Losnuevosdatos,dondeN_SAMPLESeselnmerodemuestrasyn_componentseselnmerodecomponentes.
Devuelve: X_originalmatrizsimilar,deforma(N_SAMPLES,n_features):
notas
Siesthabilitadoelblanqueamiento,inverse_transformcalcularlaoperacininversaexacta,queincluyelainversindeblanqueamiento.
score(X,Y=ninguno) [fuente]
Devolvereldiariodeprobabilidadmediadetodaslasmuestras.
Ver."Reconocimientodepatronesyaprendizajeautomtico"porC.Bishop,12.2.1pg.574ohttp://www.miketipping.com/papers/metmppca.pdf
parmetros: X:matriz,forma(N_SAMPLES,n_features):
Losdatos.
Devuelve: LL:float:
Promediodiariodeprobabilidaddelasmuestrasbajoelmodeloactual
score_samples(X) [fuente]
Devolverellogaritmodelaverosimilituddecadamuestra.
Ver."Reconocimientodepatronesyaprendizajeautomtico"porC.Bishop,12.2.1pg.574ohttp://www.miketipping.com/papers/metmppca.pdf
parmetros: X:matriz,forma(N_SAMPLES,n_features):
Losdatos.
Devuelve: LL:matriz,deforma(N_SAMPLES,):
Logaritmodelaverosimilituddecadamuestrabajoelmodeloactual
http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 4/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin
Establecerlosparmetrosdeesteestimador.
Elmtodofuncionaenestimadoressimples,ascomoenobjetosanidados(talescomotuberas).Estosltimostienenparmetrosdelaforma
<component>__<parameter>demodoqueesposibleactualizarcadacomponentedeunobjetoanidado.
Devuelve: auto:
transform(X,Y=ninguno) [fuente]
AplicarlareduccindedimensionalidadaX.
Xseproyectaenlosprimeroscomponentesprincipalespreviamenteextradosdeunconjuntodeentrenamiento.
parmetros: X:matrizsimilar,laforma(N_SAMPLES,n_features)
Losnuevosdatos,dondeN_SAMPLESeselnmerodemuestrasyn_featureseselnmerodecaractersticas.
Devuelve: X_new:matrizsimilar,laforma(N_SAMPLES,n_components)
Ejemplos
>>>Importnumpycomonp
>>>desklearn.decompositionimportacinIncrementalPCA
>>>X=np.Array([[1,1],[2,1],[3,2],[1,1],[2,1],[3,2]])
>>>IPCA=IncrementalPCA(n_components=2,batch_size=3)
>>>IPCA.caber(X)
IncrementalPCA(batch_size=3,copia=True,n_components=2,blanquear=False)
>>>IPCA.transformar(X)
Losejemplosqueutilizan sklearn.decomposition.PCA
Anterior
http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 5/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin
Anterior
http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 6/6