Está en la página 1de 6

1/11/2016 sklearn.decomposition.

PCAscikitlearn0,18documentacin

Casa Instalacin
Documentacin
Ejemplos

sklearn.decomposition.PCA

clase(n_components=Ninguno,copia=True,blanquear=False,svd_solver="auto",tol=0.0,iterated_power="auto",random_state=Ninguno)
sklearn.decomposition.PCA [fuente]

Elanlisisdecomponentesprincipales(PCA)

reduccindedimensionalidadlinealutilizandodescomposicinenvaloressingularesdelosdatosparaproyectarlaaunespaciodimensionalinferior.

SeutilizalaaplicacinLAPACKdelaSVDcompletoounSVDtruncadoaleatorioporelmtododeHalkoetal.2009,dependiendodelaformadelos
datosdeentradayelnmerodecomponentesaextraer.
Textooriginal
Tambinpuedeutilizarlaaplicacinscipy.sparse.linalgARPACKtruncadadelaenfermedadvesicularporcina.
Linear dimensionality reduction using Singular Value Decomposition
ofthedatatoprojectittoalowerdimensionalspace.
LeemsenlaGuadelusuario.
parmetros: n_components:int,float,ounacadenaNinguno Sugiereunatraduccinmejor

Nmerodecomponentesquemantener.sinoseestablecen_componentstodosloscomponentessemantienen:
n_components==min(N_SAMPLES,n_features)

sin_components=='MLE'ysvd_solver=='completo',MLEdeMinkaseutilizarnparaintentardeterminarsila
dimensinysvd_solver=='completo',seleccioneelnmerodecomponentesdetalmaneraquelacantidaddevarianza
quenecesitaserexplicadoesmayorqueelporcentajeespecificadoporn_componentsn_componentsnopuedenser
igualesan_featuresparasvd_solver=='arpack'.0<n_components<1

copia:bool(pordefectoTrue)

Siesfalso,losdatospasadosparaencajarsesobrescribenyseejecutaenforma(X).transform(X)noseobtendrnlos
resultadosesperados,elusofit_transform(X)ensulugar.

blanquee:bool,opcional(pordefectoFalso)

CuandoVerdadero(Falsepordefecto)loscomponents_vectoressemultiplicanporlarazcuadradadeN_SAMPLESy
luegodivididosporlosvaloressingularesparaasegurarsalidascorrelacionadasconlasvariacionesdeloscomponentes
delaunidadagota.

Blanqueamientoquitaralgodeinformacindelasealtransformada(lasescalasdevariacinrelativadelos
componentes),peroenalgnmomentosepuedemejorarlaexactitudpredictivadelosestimadoresaguasabajo
haciendoquesusdatosrespetanalgunossupuestoscableados.

svd_solver:{string'auto','completo','arpack','aleatorio'}

Auto:
elsolucionadorseseleccionaporunapolticapordefectobasadoenX.shapeyn_components:silosdatosde
entradaesmayorque500x500yelnmerodecomponentesaextraeresmenorque80%deladimensinms
pequeadelosdatos,acontinuacin,acontinuacin,mseficiente"aleatorizado'estactivadomtodo.Delo
contrarioexactodelaenfermedadvesicularporcinacompletasecalculayopcionalmentetruncadadespus.

completo:
ejecutarexactaSVDcompletallamandoalsolucionadordeLAPACKestndaratravsdescipy.linalg.svdy
seleccionarloscomponentesdepostprocesado

arpack:
SVDcarreratruncaan_componentsllamadasARPACKsolucionadortravsscipy.sparse.linalg.svds.Serequiere
estrictamente0<n_components<X.shape[1]

aleatorio:
ejecutaraleatoriosSVDporelmtododeHalkoetal.

Nuevoenlaversin0.18.0.

tol:flotador>=0,opcional(pordefecto0.0)

Latoleranciaparalosvaloressingularescalculadasporsvd_solver=='arpack'.

Nuevoenlaversin0.18.0.
Anterior

http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 1/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin
iterated_power:int>=0,o"auto",(pordefecto'auto')

Nmerodeiteracionesparaelmtododelapotenciacalculadaporsvd_solver=='alazar'.

Nuevoenlaversin0.18.0.

random_state:intoinstanciaRandomStateoNinguno(predeterminadoNinguno)

PseudoRandomNumbercontroldelasemilladelgenerador.Sininguno,utiliceelsingletonnumpy.random.Utilizadopor
svd_solver=='arpack"o"aleatorio".

Nuevoenlaversin0.18.0.

atributos: components_:matriz,[n_components,n_features]

Ejesprincipalesenelespaciodecaractersticas,querepresentanlasdireccionesdemximavarianzaenlosdatos.Los
componentesestnordenadosporexplained_variance_.

explained_variance_:matriz,[n_components]

Lacantidaddevarianzaexplicadaporcadaunodeloscomponentesseleccionados.

Nuevoenlaversin0.18.

explained_variance_ratio_:matriz,[n_components]

Porcentajedevarianzaexplicadaporcadaunodeloscomponentesseleccionados.

Sin_componentsnoseestableceacontinuacin,sealmacenantodosloscomponentesylasumadelasvarianzas
explicadasesiguala1,0.

mean_:matriz,[n_features]

Porfuncinempricamedia,estimadaapartirdelconjuntodeentrenamiento.

IgualaX.mean(eje=1).

n_components_:int

Elnmeroestimadodecomponentes.Cuandon_componentsseestableceen'MLE'ounnmeroentre0y1(con
svd_solver=='completo'),estenmeroseestimaapartirdelosdatosdeentrada.Delocontrario,esigualalos
n_componentsdeparmetros,osin_featuresn_componentshayninguno.

noise_variance_:flotador

LacovarianzaderuidoestimadasiguiendoelmodeloprobabilsticodePCAapartirdevuelcoyelobispode1999.
Vaseel"reconocimientodepatronesyaprendizajeautomtico"porC.Bishop,12.2.1pg.574o
http://www.miketipping.com/papers/metmppca.pdf.Serequierecalculadolacovarianzaestimadadedatosyla
puntuacindelasmuestras.

vertambin: KernelPCA,SparsePCA,TruncatedSVD,IncrementalPCA

referencias

Paran_components=='MLE',estaclaseutilizaelmtododeThomasP.Minka:SeleccinautomticadeladimensionalidaddePCA.PELLIZCOS
2000:598604

ImplementaelmodeloprobabilsticodePCA:.M.vuelcoyC.Bishop,directordeAnlisisdeComponentesProbabilstico,RevistadelaRealSociedad
deEstadstica,SerieB,61,parte3,pp611622atravsdelapartiturayscore_samplesmtodos.verhttp://www.miketipping.com/papers/met
mppca.pdf

Parasvd_solver=='arpack',consultescipy.sparse.linalg.svds.

Parasvd_solver=="aleatorio",vase:Encontraralaestructuraconlaaleatoriedad:.Algoritmosestocsticosparalaconstruccindefactorizacinde
matricesaproximadasHalko,etal,2009(arXiv:909)UnalgoritmoaleatorioparaladescomposicindematricesPerGunnarMartinsson,Vladimiry
RokhlinMarcosTygert

Ejemplos
>>>Importnumpycomonp
>>>desklearn.decompositionimportacinPCA
>>>X=np.Array([[1,1],[2,1],[3,2],[1,1],[2,1],[3,2]])
>>>PCA=PCA(n_components=2)
>>>PCA.ajuste(X)
Anterior

http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 2/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin
PCA(copia=True,iterated_power="auto",n_components=2,random_state=Ninguno,
svd_solver="auto",tol=0,0,blanquee=False)
>>>print(PCA.explained_variance_ratio_)
[0.992440.00755......]

>>>PCA=PCA(n_components=2,svd_solver="total")
>>>PCA.Ajuste(X)
PCA(copia=True,iterated_power="auto",n_components=2,random_state=Ninguno,
svd_solver='completa',tol=0,0,blanquee=False)
>>>print(PCA.explained_variance_ratio_)
[0.992440.00755......]

>>>PCA=PCA(n_components=1,svd_solver='arpack')
>>>PCA.Ajuste(X)
PCA(copia=True,iterated_power="auto",n_components=1,random_state=Ninguno,
svd_solver='arpack',tol=0,0,blanquee=False)
>>>print(PCA.explained_variance_ratio_)
[0,99244...]

mtodos
fit(X[,y]) AjustarelmodeloconX.
fit_transform(X[,y]) AjustarelmodeloconXyaplicarlareduccindedimensionalidadenX.
get_covariance() Calcularlacovarianzadedatosconelmodelogenerativo.
get_params([profundo]) Obtenerparmetrosparaesteestimador.
get_precision() Calcularlamatrizdeprecisindedatosconelmodelogenerativo.
inverse_transform(X Transformarlosdatosdenuevoasuespaciooriginal.
[,y])
score(X[,y]) Devolvereldiariodeprobabilidadmediadetodaslasmuestras.
score_samples(X) Devolverellogaritmodelaverosimilituddecadamuestra.
set_params(** Establecerlosparmetrosdeesteestimador.
Params)
transform(X[,y]) AplicarlareduccindedimensionalidadaX.

__init__(N_components=Ninguno,copia=True,blanquear=False,svd_solver="auto",tol=0.0,iterated_power="auto",random_state=
Ninguno) [fuente]

fit(X,Y=ninguno) [fuente]

AjustarelmodeloconX.
parmetros: X:matrizcomo,deforma(N_SAMPLES,n_features):

Losdatosdeentrenamiento,dondeN_SAMPLESenelnmerodemuestrasyn_featureseselnmerode
caractersticas.

Devuelve: auto:Objeto

Devuelvelainstanciadesmismo.

fit_transform(X,Y=ninguno) [fuente]

AjustarelmodeloconXyaplicarlareduccindedimensionalidadenX.
parmetros: X:matrizsimilar,laforma(N_SAMPLES,n_features)

datosdeentrenamiento,dondeN_SAMPLESeselnmerodemuestrasyn_featureseselnmerode
caractersticas.

Devuelve: X_new:matrizsimilar,laforma(N_SAMPLES,n_components)

get_covariance() [Fuente]

Calcularlacovarianzadedatosconelmodelogenerativo.

cov=components_.T*S**2*components_+sigma2*eye(n_features)dondeS**2contienelasvarianzasexplicadas,ysigma2contieneel
ruidodelasvarianzas.
Devuelve: cov:matriz,forma=(n_features,n_features)

covarianzaestimadadedatos.

Anterior

http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 3/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin

get_params(Profundidad=True) [fuente]

Obtenerparmetrosparaesteestimador.
parmetros: profunda:booleano,opcional:

SiesTrue,devolverlosparmetrosparaesteestimadorycontenidasubobjetosquesonestimadores.

Devuelve: params:mapeodecadenaacualquier

Losnombresdeparmetrosasignanasusvalores.

get_precision() [Fuente]

Calcularlamatrizdeprecisindedatosconelmodelogenerativo.

Esigualalainversadelacovarianzaperocalculadaconlainversindelamatrizlemaparalaeficiencia.
Devuelve: precisin:matriz,forma=(n_features,n_features)

precisinestimadadelosdatos.

inverse_transform(X,Y=ninguno) [fuente]

Transformarlosdatosdenuevoasuespaciooriginal.

Enotraspalabras,devuelvaunaentradaX_originalcuyatransformarseraX.
parmetros: X:matrizsimilar,laforma(N_SAMPLES,n_components)

Losnuevosdatos,dondeN_SAMPLESeselnmerodemuestrasyn_componentseselnmerodecomponentes.

Devuelve: X_originalmatrizsimilar,deforma(N_SAMPLES,n_features):

notas

Siesthabilitadoelblanqueamiento,inverse_transformcalcularlaoperacininversaexacta,queincluyelainversindeblanqueamiento.

score(X,Y=ninguno) [fuente]

Devolvereldiariodeprobabilidadmediadetodaslasmuestras.

Ver."Reconocimientodepatronesyaprendizajeautomtico"porC.Bishop,12.2.1pg.574ohttp://www.miketipping.com/papers/metmppca.pdf
parmetros: X:matriz,forma(N_SAMPLES,n_features):

Losdatos.

Devuelve: LL:float:

Promediodiariodeprobabilidaddelasmuestrasbajoelmodeloactual

score_samples(X) [fuente]

Devolverellogaritmodelaverosimilituddecadamuestra.

Ver."Reconocimientodepatronesyaprendizajeautomtico"porC.Bishop,12.2.1pg.574ohttp://www.miketipping.com/papers/metmppca.pdf
parmetros: X:matriz,forma(N_SAMPLES,n_features):

Losdatos.

Devuelve: LL:matriz,deforma(N_SAMPLES,):

Logaritmodelaverosimilituddecadamuestrabajoelmodeloactual

Anterior set_params(**Params) [fuente]

http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 4/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin

Establecerlosparmetrosdeesteestimador.

Elmtodofuncionaenestimadoressimples,ascomoenobjetosanidados(talescomotuberas).Estosltimostienenparmetrosdelaforma
<component>__<parameter>demodoqueesposibleactualizarcadacomponentedeunobjetoanidado.
Devuelve: auto:

transform(X,Y=ninguno) [fuente]

AplicarlareduccindedimensionalidadaX.

Xseproyectaenlosprimeroscomponentesprincipalespreviamenteextradosdeunconjuntodeentrenamiento.
parmetros: X:matrizsimilar,laforma(N_SAMPLES,n_features)

Losnuevosdatos,dondeN_SAMPLESeselnmerodemuestrasyn_featureseselnmerodecaractersticas.

Devuelve: X_new:matrizsimilar,laforma(N_SAMPLES,n_components)

Ejemplos
>>>Importnumpycomonp
>>>desklearn.decompositionimportacinIncrementalPCA
>>>X=np.Array([[1,1],[2,1],[3,2],[1,1],[2,1],[3,2]])
>>>IPCA=IncrementalPCA(n_components=2,batch_size=3)
>>>IPCA.caber(X)
IncrementalPCA(batch_size=3,copia=True,n_components=2,blanquear=False)
>>>IPCA.transformar(X)

Losejemplosqueutilizan sklearn.decomposition.PCA

Laconcatenacinde Seleccindereduccinde Pipelining:encadenarun Explcitamapade


mltiplesmtodosde dimensionalidadconla PCAyunaregresin caractersticas
extraccinde tuberaydeGridSearchCV logstica aproximacinparancleos
caractersticas RBF

clasificacinetiqueta Carasejemplomedianteel UnademostracindeK Elconjuntodedatosdel


mltiple reconocimientoEigenfaces mediasdeagrupacinde iris
ySVM losdatosdgitos
manuscrita

Carasdescomposiciones laseparacinciegade FastICAdenubesde incrementalPCA


deconjuntosdedatos fuentesusandoFastICA puntos2D

Anterior

http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 5/6
1/11/2016 sklearn.decomposition.PCAscikitlearn0,18documentacin

kernelPCA Elanlisisdecomponentes ejemploPCAconIris Laseleccindelmodelo



principales(PCA) conjuntodedatos probabilsticodelaPCAy
elanlisisfactorial(AF)

proyeccinComparacin Escalamiento Kernelestimacinde Usando


deLDAyPCA2DdeIris multidimensional densidades FunctionTransformerpara
conjuntodedatos seleccionarcolumnas

Anterior

http://scikitlearn.org/stable/modules/generated/sklearn.decomposition.PCA.html 6/6

También podría gustarte