Está en la página 1de 11

Componentes

principales
Propiedades:

La suma de las varianzas de los componentes es igual a la varianza


de las variables originales.

La proporción de la variabilidad explicada por un componente es el


cociente entre su varianza.

Las covarianzas entre cada componente principal y las variables


columnas de X vienen dadas por el producto de las coordenadas del
vector propio y el autovalor propio asociado.

Si estandarizamos los componentes principales, dividiendo cada


uno por su desviación típica, se obtiene la estandarización
multivariante de los datos originales
Análisis de Componentes
Principales(PCA)
Estas componentes
El análisis de componentes principales no están
principales es una técnica de correlacionadas y se
reducción de la dimensión que obtienen en orden
describe la informaciónde un drecreciente de
conjunto de variables observadas, importancia.
mediante componentes
principales(un conjunto de
variables más pequeño).
El PCA se basa en la diagonalización de la matriz muestral
de covarianzas S

En álgebra lineal es hacer análisis del espectro de la


matriz, que es el estudio de los vectores y valores propios.

- Entonces lo que se busca es una matriz ortogonal A

que diagonaliza S y que nos proporcione unos nuevos

parámetros (componentes principales) Z1, Z2,..., Zp que

no estén correlacionadas.

- Y las componentes principales son las nuevas variables

Zi = ai Y, por ejemplo Z1 = a11Y1 + a12Y2 + ... + a1pYp.


Es importante resaltar que los resultados que se obtienen al
calcular las componentes principales a partir de la matriz
muestral de covarianzas S o a partir de la matriz muestral de
correlación R son diferentes
Ejemplo:
Las unidades muestrales o individuos a ser observados serán 6 rectángulos,
sobre los cuales mediremos dos atributos: longitud de la base, y altura del
rectángulo (medidas en las mismas unidades de longitud, por ejemplo
centímetros). De modo que, para este ejemplo, p = 2. Las observaciones
obtenidas son las indicadas por la siguiente tabla,

rectángulo X1(base) X2 (altura)

1 2 2
2 1.5 0.5
3 0.7 0.5
4 0.5 1.5
5 0.5 0.7
6 0.7 0.7
Aplicando a estos datos logaritmo en base 10 para facilitar la
interpretación de sus componentes., se obtiene la siguiene matriz de las
observaciones

obtenemos la matriz de
varianzas y covarianzas

30103 30103
0.176 0 −30102
x= −0.154 − 30102 -> S = 0.06387086891
0.01407125000
0.0140712500
0.0638708689
-30102 0.1760

−30102 −0.154
− 0.154 −0.154
Para determinar los compones principales solo se
necesita calcular los vectores y valores característicos
de la matriz S

0.06387086891 - λ 0.0140712500
( S - λI)= 0.01407125000 0.0638708689-λ

Los autovalores de esta matriz son:

λ1 = 0.07794211891 ; λ2 = 0.04979961890

Los autovectores de esta matriz son:


V1 = ( 0.7071067804, 0.7071067804 )

V2 = ( 0.7071067804, −0.7071067804 )
Entonces las primeras componentes son:
z1 = 0.7071067804 X1 + 0.7071067804 X2
z2 = 0.7071067804 X1 − 0.7071067804 X2

Se observa como las componenes principales


son combianaciones lineales de los
autovecores de la matriz A y una nueva
variable( X1, X2)
Conclusión

En el proceso de calcular las componentes principales a


través del análisis de estas componentes, se pudo
observar la aplicación de autovalores y autovectores
que a su vez fueron parte de la diagonalización que se
quería en el ejemplo.

También podría gustarte