Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Reduction
Representación de los Datos
• Aprender la mejor representación de los datos.
• Una representación que preserve la mayor cantidad
de información como sea posible.
• Una representación más simple que la original.
Dimensionality Reduction
Formas de Representar los Datos
Existen diferentes formas de representar los datos de
una manera mucho más simple:
• Low-dimensional representation
• Sparse representation
• Independent representation
Dimensionality Reduction
Reducción de Dimensionalidad
• Comprimir la información eliminando información
redundante.
• Permite la visualización de la distribución de datos
cuando la dimensionalidad es mayor a 3.
Dimensionality Reduction
Principal Component Analysis (PCA)
• Aprende una representación de menor dimensión y
que no posee correlación lineal entre sus elementos.
• Comprime la información eliminando información
redundante.
• Permite la visualización de la distribución de datos
cuando la dimensionalidad es mayor a 3.
Principal Component Analysis
• Aprende una transformación lineal y ortogonal de los
datos, en donde la entrada 𝐗 es proyectada como
una nueva representación 𝐳 de menor dimensión.
3.
𝐳=𝐔 𝐗 T
Proyección de dimensión reducida m × k
𝐱𝟏
1 (𝑖)
𝐗 ∈ ℝ3×n , 𝐗 = 𝐱 𝟐 , 𝛍𝑗 = σn𝑖=1 𝐱𝑗
Principal Component Analysis 𝐱𝟑
n
Normalización
𝐱𝟏
𝐗 ∈ ℝ3×n , 𝐗 = 𝐱 𝟐 , 𝐱𝑗 = 𝐱𝑗 − 𝛍𝑗
Principal Component Analysis 𝐱𝟑
Matriz de Covarianza
−0.39 −0.64
= 0.09 −0.74
k = 2 dimensiones, 𝐔
Principal Component Analysis −0.92 0.20
Proyección ortogonal
T𝐗
𝐳=𝐔
Principal Component Analysis
Proyección ortogonal
෩=𝐔
𝐗 𝒛