Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Proyecto Final
Proyecto Final
Reporte
Paulina Jacqueline Lavı́n Gaeta y José Eduardo Morales Mena
December 15, 2020
1
1 Introducción
Para el proyecto final de la materia se realizó un análisis de datos enfocado en la
búsqueda de un método de aprendizaje automático que nos permitiera predecir
los valores reales de la base de datos, para poder hacer el proyecto se utilizó
un conjunto de datos obtenidos de internet; de las opciones dadas nosotros
decidimos tomar nuestros datos de Kaggle, que en nuestro caso, ejemplificaban
las compras de libros en Amazon durante los últimos años, recolectando datos
como su tı́tulo, autor, el año de su publicación, el número de reseñas obtenidas,
su clasificación como ”Ficción” y ”No ficción” y su puntaje según las reseñas.
2 Marco Teórico
Tras el análisis de datos decidimos plantear tres preguntas que consideramos
serı́an importantes para comprender a nivel básico los datos proporcionados o
incluso para tomar una decisión en base a estos.
2.1 Preguntas
• ¿Cuál fue el libro de mejor rating?
Wrecking Ball (Diary of a Wimpy Kid Book 14)
• ¿Cuál es el libro más caro de todos?
105
2
De igual manera se realizó un histograma que representa la cantidad de libros
por año, llegando a la conclusión de que el último año se analizaron más libros
que en los anteriores.
3 Conclusión
Creo que es una buena forma de analizar los datos pero es importante elegir
bien las caracterı́sticas a evaluar ya que estas determinarán la efectividad que
3
tendrá el programa. Sirve como una gran ventaja cuando se deben relacionar
muchos datos, el tiempo empleado en el análisis se reduce y una efectividad final
está asegurada.
Paulina Jacqueline Lavı́n Gaeta