Está en la página 1de 33

ANALISIS DE

COMPONENTES
PRINCIPALES
Curso
Algebra lineal
Docente
Marco Antonio Herrera Vargas
Integrantes
Rodriguez Huaraca Yofre
PROBLEMA
¿Cuál es la utilidad del análisis de componentes
principales?
¿posibles aplicaciones?
OBJETIVOS
Conocer la utilidad del análisis de componentes principales
Analizar la utilidad de las componentes principales
Definición
El análisis de componentes principales es una técnica de
reducción de la dimensión que describe la información de un
conjunto de variables observadas mediante un conjunto de
variables mas pequeño (las componentes principales ) que son
combinaciones lineales de las variables de partida.
Las nuevas variables (componentes principales) son incorreladas
y se obtienen en orden decreciente de importancia.
Esperamos que solo unas pocas recojan la mayor parte de la
información de los datos.
Reducción de dimensionalidad
Para entenderlo más claramente, tomar una foto es la forma mas
simple de reducir dimensionalidad.
Menor cantidad de información Mayor cantidad de información
Conceptos a conocer
• Promedio
• Varianza
• Covarianza
Promedio
El promedio es un número representativo que puede obtenerse a partir de
una lista de cifras. Usualmente se relaciona con el concepto de media
aritmética. Lo anterior quiere decir que normalmente el promedio es el
resultado de sumar un grupo de número y dividirlo entre el número de
sumandos.
Varianza
La varianza es una medida de dispersión que representa la
variabilidad de una serie de datos respecto a su media.
Formalmente se calcula como la suma de los residuos al
cuadrado divididos entre el total de observaciones.
Covarianza
La covarianza es el valor que refleja en qué cuantía dos variables aleatorias
varían de forma conjunta respecto a sus medias.
Caso
simetrico
Matriz de varianza-covarianza
►La matriz varianza–covarianza es una matriz
cuadrada de dimensión nxm que recoge las varianzas
en la diagonal principal y las covarianzas en los
elementos de fuera de la diagonal principal.
►La matriz de varianza-cobarianza es simetrica cuya.
►La matriz de varianza-cobarianza acostumbra a
expresarse como:

Σ sigma
Aplicamos transformación lineal.

(x ; y) ( 9x+4y ; 4x+3y)
(0;0) (0;0)
(1;0) (9;4)
(0;1) (4;3)
(-1;0) (-9;-4)
(0;-1) (-4;-3)
Aplicamos transformación lineal.
Hallamos los valores propios

Valores propios 11 y 1
Vectores propios
Vectores propios
El hecho de que la matriz sea simétrica implica que:
-los vectores existen
-los valores son reales
-los vectores son perpendiculares

Vectores propios

dirección

Valores propios

magnitud
Vectores propios

dirección

Valores propios

magnitud

¿Cuál de los vectores es mas grande?


Vectores propios

Valores propios
Vectores propios

Ya que el vector amarillo es


mas grande captura mas
información.
Proyectamos cada punto al
vector amarillo lanzando la
Valores propios perpendicular
Lo que se hizo fue mandar de 2 dimensiones a 1 dimensión, en la cual la data tiene mayor factor
de expansión
mayor

* * * * *
* *
* * * * *
* *

* * * * * menor * *

* * * * * * *
* * * * * * *

* * * * * * *

* * * * * * *
Tabla grande Tabla pequeña

* * * * * * *

* * * * * * *

* *
* * * * *

* * * * * * *

* * * * * * *

* * * * * * *

* * * * * * *

También podría gustarte