Está en la página 1de 4

Aprendizaje automatico.

Reporte
Paulina Jacqueline Lavı́n Gaeta y José Eduardo Morales Mena
December 15, 2020

1
1 Introducción
Para el proyecto final de la materia se realizó un análisis de datos enfocado en la
búsqueda de un método de aprendizaje automático que nos permitiera predecir
los valores reales de la base de datos, para poder hacer el proyecto se utilizó
un conjunto de datos obtenidos de internet; de las opciones dadas nosotros
decidimos tomar nuestros datos de Kaggle, que en nuestro caso, ejemplificaban
las compras de libros en Amazon durante los últimos años, recolectando datos
como su tı́tulo, autor, el año de su publicación, el número de reseñas obtenidas,
su clasificación como ”Ficción” y ”No ficción” y su puntaje según las reseñas.

2 Marco Teórico
Tras el análisis de datos decidimos plantear tres preguntas que consideramos
serı́an importantes para comprender a nivel básico los datos proporcionados o
incluso para tomar una decisión en base a estos.

2.1 Preguntas
• ¿Cuál fue el libro de mejor rating?
Wrecking Ball (Diary of a Wimpy Kid Book 14)
• ¿Cuál es el libro más caro de todos?
105

• ¿Cuál es el libro con menos reviews?


37

Las preguntas anteriormente presentadas se resolvieron mediante el ambi-


ente Pandas y representan máximos y mı́nimos, con la intención de buscar la
información de los mejores libros de la lista.
Además de lo antes mencionado, se realizaron análisis simples y gráficas que nos
ayudaron a entender de mejor manera la información presentada. En la siguiente
gráfica por ejemplo, se muestra la cantidad de “Reviws” por año, clasificadas
en dos grupos (“Ficción” y “No ficción”)

2
De igual manera se realizó un histograma que representa la cantidad de libros
por año, llegando a la conclusión de que el último año se analizaron más libros
que en los anteriores.

Tras un análisis completo de los métodos para el análisis de datos se llegó a


la conclusión de que la mejor opción para realizar un proyecto de ese tipo serı́a
un árbol de decisión, mismo que tuvo un puntaje de 0.95 de “accuracy”.

3 Conclusión
Creo que es una buena forma de analizar los datos pero es importante elegir
bien las caracterı́sticas a evaluar ya que estas determinarán la efectividad que

3
tendrá el programa. Sirve como una gran ventaja cuando se deben relacionar
muchos datos, el tiempo empleado en el análisis se reduce y una efectividad final
está asegurada.
Paulina Jacqueline Lavı́n Gaeta

El análisis de datos es una herramienta que nos permite recolectar infor-


mación de una gran cantidad de valores, buscando clasificarlos en grupos de
datos para luego obtener resultados de los mismos, por lo que aprender a usar
una herramienta que te permita hacer un análisis correcto de una manera más
sencilla y rápida es primordial, en especial en un ámbito profesional en el que
se tienen que hacer uso de muchos números, esta práctica aunque fue solo una
introducción a este tema, nos ayudó a comprender mejor el análisis de datos y
nos inició en la programación para el aprendizaje automático.
José Eduardo Morales Mena

También podría gustarte