Está en la página 1de 3

-1-

Universitat Oberta
de Catalunya

Aula

22.504 - Álgebra lineal aula 1

Reto 4. ¿Cómo afrontar la maldición de la dimensionalidad en la ciencia de datos con el


análisis de componentes principales y la descomposición en valores singulares?

Inicio: Entrega: Solución: Calificación:


05/12/20 23/12/20 Solución 04/01/21
programada
28/12/20

Descripción del Reto

Ser capaces de reducir la dimensionalidad de datos es muy importante en el ámbito de la ciencia de


datos donde normalmente trabajamos con altos volúmenes de información.

En este reto veremos dos técnicas muy extendidas que nos permitirán reducir la dimensionalidad de
nuestros datos: la descomposición en valores singulares y el análisis de componentes principales, que
están muy relacionadas. Ambas técnicas, basadas en los conceptos del álgebra lineal analizados en
los retos 1, 2 y 3, permiten considerar un conjunto de datos inicial y transformarlo de manera que, o
bien la dimensión resultante sea inferior o bien la nueva representación de los datos permita desvelar
información relevante.

En el apartado de recursos encontraréis una contextualización a la ciencia de datos, un módulo teórico


que describe estas dos técnicas y nos presenta una serie de ejemplos y problemas genéricos. Además,
encontraréis una colección de problemas contextualizados a la ciencia de datos y un caso de uso y guía
de resolución en R.

En cada recurso se indica el tiempo que creemos que podéis necesitar para su comprensión y,
además, para el módulo teórico os damos una serie de orientaciones para su lectura y comprensión.
Este reto requiere un poco más de dedicación que los dos retos anteriores. Tomaos vuestro tiempo
para comprender la aplicación de estas técnicas y pensar cómo pueden ser útiles en diferentes ámbitos.
-2-

Descripción de la Práctica

Os pedimos en esta actividad que resolváis el caso de uso propuesto mediante (según se indique) el
análisis de componentes principales o la descomposición en valores singulares. Este caso de uso os
permitirá poner en práctica los conceptos trabajados en este reto, entender y coger destreza en su
aplicación a un caso de uso concreto utilizando datos reales o realistas. Veréis también la necesidad de
utilizar un lenguaje de programación como por ejemplo R para su resolución y cogeréis destreza en su
utilización.

Tened en cuenta que esta actividad formará parte de la nota de prácticas (Pr = (Pr1 + Pr2) / 2) de
esta asignatura. La nota de esta actividad corresponde a la Pr1. Recordad que debéis entregar las
dos prácticas y obtener como mínimo un 4 en cada una de ellas y un 5 en la Pr para superar la
asignatura. Para más información sobre el modelo de evaluación de la asignatura consultad el plan
docente.

Objetivos y competencias

CB1- Que los estudiantes hayan demostrado poseer y Comprender la utilidad de los conceptos de álgebra
comprender conocimientos en un área de estudio que lineal que se han trabajado en los retos 1-3 en
parte de la base de la educación secundaria general, la aplicación en el ámbito de la ciencia de datos
y se suele encontrar a un nivel que, si bien se apoya mediante el análisis de componentes principales y la
en libros de texto avanzados, incluye también algunos descomposición en valores singulares.
aspectos que implican conocimientos procedentes de
la vanguardia de su campo de estudio.

CB5- Que los estudiantes hayan desarrollado Comprender la utilidad de los conceptos de álgebra
aquellas habilidades de aprendizaje necesarias para lineal que se han trabajado en los retos 1-3 en
emprender estudios posteriores con un alto grado de la aplicación en el ámbito de la ciencia de datos
autonomía. mediante el análisis de componentes principales y la
descomposición en valores singulares.

CG3- Buscar, gestionar y usar la información más Ser capaz de resolver un problema utilizando la
adecuada para modelizar problemas concretos y descomposición en valores singulares en un caso de
aplicar adecuadamente procedimientos teóricos para uso utilizando datos reales o realistas.
su resolución de manera autónoma y creativa.

CE5- Utilizar de forma combinada los fundamentos Entender la utilidad de utilizar un lenguaje de
matemáticos, estadísticos y de programación para programación para el tratamiento de grandes
desarrollar soluciones a problemas en el ámbito de la volúmenes de datos.
ciencia de los datos. Coger destreza en la utilización del lenguaje R para
la resolución de problemas con un gran volumen de
datos.
-3-

CT1- Uso y aplicación de las TIC en el ámbito Entender la utilidad de utilizar un lenguaje de
académico y profesional. programación para el tratamiento de grandes
volúmenes de datos.
Coger destreza en la utilización del lenguaje R para
la resolución de problemas con un gran volumen de
datos.

Contenido

Descomposición en valores singulares

• La maldición de la dimensión en ciencia de datos.


• Análisis de componentes principales (PCA): reducción de la dimensión y extracción de características.
• Aplicación de PCA a la ciencia de datos.
• Descomposición en valores singulares (SVD).
• Aplicación de SVD a la ciencia de datos.

Recursos de aprendizaje

También podría gustarte