Está en la página 1de 2

Tutorial de Kernel PCA

Tu nombre
Hoy

1 Introducción
El análisis de componentes principales (PCA) es una técnica utilizada en el
preprocesamiento de datos y en el análisis exploratorio de datos. PCA es
una técnica de reducción de dimensionalidad que transforma los datos en un
nuevo sistema de coordenadas en el que la primera coordenada corresponde a la
primera componente principal que captura la mayor variación en los datos, la se-
gunda coordenada corresponde a la segunda componente principal que captura
la segunda mayor variación en los datos, y ası́ sucesivamente.
El PCA basado en Kernel es una extensión del PCA que permite el mapeo
no lineal de los datos. Esto puede ser útil cuando los datos no son linealmente
separables.

2 PCA basado en Kernel


El PCA basado en Kernel sigue el mismo procedimiento general que el PCA,
pero con un paso adicional al principio. En lugar de comenzar con el cálculo de
la matriz de covarianza, el PCA basado en Kernel comienza mapeando los datos
a un espacio de mayor dimensión utilizando una función de kernel. Luego, se
realiza el PCA en este espacio de mayor dimensión.

2.1 El algoritmo
A continuación se presenta un algoritmo básico para el PCA basado en Kernel:

1. Elija una función de kernel (por ejemplo, lineal, polinomial, RBF).


2. Calcule la matriz de kernel.

3. Centre la matriz de kernel.


4. Obtenga los vectores y valores propios de la matriz de kernel centrada.
5. Seleccione los k componentes principales según los k valores propios más
grandes.

1
6. Proyecte los datos en estos k componentes principales para obtener las
nuevas caracterı́sticas.

3 Aplicación
El PCA basado en Kernel puede ser útil en una variedad de aplicaciones, in-
cluyendo la reducción de dimensionalidad para la visualización de datos, la elim-
inación de ruido en los datos, y la preparación de datos para otros algoritmos
de aprendizaje automático.

También podría gustarte