Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CASO DE ESTUDIO
LIBRERIA IZTACCIHUATL
REALIZADO POR:
NOVIEMBRE, 2022
Tabla de contenido
Objetivo principal:......................................................................................................................................... 3
Introducción: ................................................................................................................................................. 3
Desarrollo ...................................................................................................................................................... 6
Conclusiones ................................................................................................................................................. 8
Objetivo principal:
Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de
la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones
para una organización.
Introducción:
La ciencia de datos en una organización es indispensable en la actualidad, permite a las
empresas a aumentar la eficiencia operativa, identificar nuevas oportunidades y mejorar sus ventas.
Para este trabajo lo que se pretende es analizar un caso de estudio en el cual podamos aplicar
conocimientos adquiridos en el curso de ‘Herramientas para el análisis de Big Data’, para este caso
se sugiere aplicar la ciencia de datos en la librería Iztaccíhuatl la cual está ubicada en Monterrey
México. El propósito de esta empresa es mejorar sus indicadores de desempeño (KPI’s) y a la vez
desarrollar una mejor estrategia en la toma de decisiones.
librería Iztaccíhuatl proporciona 4 archivos en una carpeta con información importante a analizar:
• El archivo “books” contiene los datos generales de cada libro existente en la librería y
además menciona el promedio de clasificación de cada libro de acuerdo a las votaciones y
compras del cliente.
• El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una
clasificación general.
• El archivo “ratings” contiene los datos de los libros más votados por los clientes dentro del
sitio web de la librería.
• El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el
sitio web sobre libros para leer.
¿Qué lenguaje de programación para ciencia de datos utilizaría para realizar el análisis de
datos de la Librería Iztaccíhuatl?
Lenguaje de programación Python, el cual cuenta con múltiples paquetes útiles para la
ciencia de datos. Python se ha convertido en un medio de intersección con la inteligencia artificial,
este lenguaje es muy utilizado para el aprendizaje automático.
Además, este lenguaje cuenta con múltiples librerías como numpy que proporciona
capacidad para estructura de datos como matrices, pandas con los data frames los cuales son
estructura de datos con dos dimensiones en la cual se puede guardar datos de distintos tipos y la
visualización con una librería como matplotlib.
¿Qué adecuaciones se podría hacer a los datos de la Librería Iztaccíhuatl para poder realizar
un análisis predictivo?
Se debería primeramente abordar según los pasos del ciclo de ciencia de datos. Los tres
archivos presentan información que la empresa reunió con el objetivo de contestar preguntas
importantes para ellos , sin embargo a los datos hay que darles una limpieza adecuada ,
posteriormente desarrollar un análisis y formulación de hipótesis sobre lo que queremos saber ,
para luego , a partir de todo este trabajo realizado seleccionar las características más importantes
y entrar a modelos predictivos (regresión lineal por ejemplo) en donde se crean predicciones y se
evalúan resultados.
¿Qué tipo de base de datos se utilizaría para alojar los análisis de los datos de la Librería
Iztaccíhuatl?
Base de datos relacional, principalmente por su sencilles al poder analizar y trabajar. Este
tipo de base de datos permite manejar grandes cantidades de datos con puntos de relación entre sí,
gestionándolos de forma segura y uniforme.
¿Qué tipo de servicio de la nube podría contratar la Librería Iztaccíhuatl para alojar la
información y el proyecto de ciencia de datos?