Está en la página 1de 10

Aprendizaje No Supervisado

Escuela Profesional de Estadı́stica


Universidad Nacional San Luis Gonzaga

Alfredo Valencia Toledo

www.alfredo.valencia.webs7.uvigo.es
alfredo.valencia@unsaac.edu.pe

Enero, 2022

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 1 / 10
Outline

1 Análisis de Componentes Principales

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 2 / 10
Análisis de Componentes Principales

Análisis de Componentes Principales: introducción

Objetivo
Deteminar componentes (factores) que sucesivamente expliquen la mayor
parte de la varianza total.

Hace falta reducir la cantidad de variables por los sigueinte motivos:


Frecuente se toma la mayor cantidad posible de variables de una
muestra. Sin embargo, demasiadas variables sobre un conjunto de
2 = 180 posibles
objetos, por ejemplo, con 20 variables, obtenemos C20
coeficientes de correlación.
La precencia de una fuerte correlación que muchas veces se presenta
entre las variables: si tomamos demasiadas variables, lo normal es que
estén relacionadas o que midan lo mismo bajo distintos puntos de
vista. Por ejemplo, en salud, la presión sanguı́nea a la salida del
corazón y a la salida de los pulmones están fuertemente relacionadas.

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 3 / 10
Análisis de Componentes Principales

Análisis de Componentes Principales: evolución

Fueron desarrolladas primero por Pearson a finales del siglo XIX


Posteriormente, fueron estudiadas por Hotelling en los años 30 del
siglo XX.
Desde la aparición de los ordenadores se empezaron a popularizar

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 4 / 10
Análisis de Componentes Principales

Análisis de Componentes Principales: fundamento

¿Podemos describir la “información” contenida en estos datos mediante


algún conjunto de variables menor que el de variables originales?
Estudiar las relaciones que existe entre p variables correlacionadas
(que miden información común) se puede transformar el conjunto
original de variables en otro conjunto de nuevas variables incorreladas
entre sı́ (que no tenga repetición o redundancia en la información)
llamado conjunto de componentes principales

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 5 / 10
Análisis de Componentes Principales

Determinación de Componentes Principales

Sean X = [X1 ...Xp ] y S = var (X ) su matriz de covarianzas. Dado que


S ≥ 0 y simétrica, su descomposición espectral es

S = T ∧ T′

, donde T ∧ T ′ = T ∧ T ′ = I , con T = [t1 , ..., tp ] y ∧ = diag (λ1 , ..., λp ),


con λ1 > .... > λp .
Ls componentes principales de X son las nuevas variables

Yj = Xtj , j = 1, ..., p.

Para cada j, la nueva variables Yj se construye a partir de j−ésimo


autovector de S.

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 6 / 10
Análisis de Componentes Principales

Determinación de Componentes Principales

Las componentes principales tienen varianza decreciente


var (Y1 ) = var (Xt1 ) = t1′ St1 = λ1 t1′ t1 = λ1
var (Y2 ) = var (Xt2 ) = t2′ St2 = λ2 t2′ t2 = λ2
....
var (Yp ) = var (Xtp ) = tp′ Stp = λp tp′ tp = λp
Estan incorrelacionadas unas con otras:
cov (Yi , Yj ) = cov (Xti , Xtj ) = ti′ Stj = λj t i tj = 0 para i ̸= j, puesto
que T es una matriz ortogonal

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 7 / 10
Análisis de Componentes Principales

Determinación de Componentes Principales

Las covarianzas entre cada componente principal y las variables


originales Xi son: Cov (Yj [X1 ....Xp ]) = λj t ′ j y j = 1, ..., p
La correlación entre Yj y las varaibles originales Xi es:
s
cov (Yj , Xi ) λj
corr (Yj , Yi ) = p = tij
var (Yj )var (Xi ) sii

donde tij es el elmento i−ésimo del autovector tj .

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 8 / 10
Análisis de Componentes Principales

Actividad

Implementar ACP en R: ananálisis de video propuesto y queda libre la


examinación de otros recursos

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 9 / 10
Análisis de Componentes Principales

Thank you for your attention!

Alfredo Valencia Toledo (www.alfredo.valencia.webs7.uvigo.es


Aprendizaje No Supervisado
alfredo.valencia@unsaac.edu.pe)
Enero, 2022 10 / 10

También podría gustarte