Está en la página 1de 6

UTILIZANDO LA CIENCIA DE

DATOS EN UNA EN LA LIBRERÍA


IZTACCIHUATL
Elaborado por Johan Sánchez para curso introductorio
de Ciencia de Datos
INDICE

INTRODUCCIÓN

En este documento se presenta un caso de estudio en Ciencia de Datos para la Librería Iztaccihuatl ubicada
en la ciudad de Monterrey, Nuevo León, México cuyo gerente ha decidido desarrollar un proyecto basado en
ciencia de datos para mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor
estrategia en la toma de decisiones.

Finalmente se mostrarán los beneficios la ciencia de datos aplicada a la venta de libros y una posible
implementación de la misma.

INFORMACIÓN SUMINISTRADA

La librería Iztaccihuatl nos suministró en la carpeta denominada “datasets_books” los siguientes archivos:
books; top_books; raitings; to_read.

Se detalla la estructura e información de cada archivo:

El archivo “books” contiene los siguientes datos:

 Id - Identificador del registro


 Book Id - Identificador del libro
 Number Editions - Número de ediciones
 ISBN - Clave estándar internacional del libro
 ISBN13 - Clave estándar extendida internacional del libro
 Authors - Autor del libro
 Original Publication - Fecha de publicación
 Original Title - Título original del libro
 Title - Título del libro
 Language Code - Clave de idioma del libro
 Average Rating - Promedio de la clasificación del libro
 Image - Enlace a la imagen de la portada del libro
 Small Image - Enlace a la imagen en versión optimizada de la portada del libro.

El archivo “top_books” contiene los siguientes datos:

 Position - Posición del libro en la clasificación del libro


 ISBN - Clave estándar extendida internacional del libro
 Title - Título del libro
 Author - Autor del libro
 Imprint - Editorial
 Publisher Group - Grupo Editorial
 Volume - Volumen de ventas hasta el 2010
 Value - Ventas determinadas por el volumen
 RRP - Precio recomendado para minoristas
 ASP - Precio promedio para venta
 Binding - Tipo de encuadernación
 Publ Date - Fecha de publicación
 Product Class - Clasificación del libro
 Classification - Clasificación General del libro

El archivo “ratings” contiene los siguientes datos:

 Book Id - Identificador del libro


 User Id - Identificador del cliente/usuario que clasifico un libro
 Rating - Nivel de clasificación del libro.

El archivo “to_read” contiene los siguientes datos:

 User Id - Identificador del cliente/usuario que clasifico un libro


 Book Id - Identificador del libro

El archivo “books” contiene los datos generales de cada libro existente en la librería y además menciona el
promedio de clasificación de cada libro de acuerdo a las votaciones y compras del cliente.

El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a una clasificación general.

El archivo “raitings” contiene los datos de los libros más votados por los clientes dentro del sitio web de la
librería.

El archivo “to_read” contiene las recomendaciones que cada cliente o usuario realiza en el sitio web sobre
libros para leer.

TIPO DE ANÁLISIS

El tipo de investigación será de corto plazo ya que la información suministrada es concisa y estructurada.

El tipo de análisis a utilizar será el descriptivo, ya que presenta pequeñas fuentes de datos estructuradas e
históricos que nos permite ver una fotografía de la situación actual de la librería.

Basado en la información analizada el análisis descriptivo nos permitirá categorizar a los clientes según sus
preferencias de libros y su etapa de vida.

Toda la información recaba nos permitirá mejorar los análisis y los algoritmos que recomiendan a cada
cliente de la librería que libros debería leer, incrementando la efectividad en las ventas de la librería.
ESTRATEGIA DE IMPLEMENTACIÓN

Debido a la cantidad de datos y plazo en el que se pueden obtener resultados la estrategia a utilizar para la
implementación, será la estrategia lineal donde al final tendremos un resultado.

Dicha estrategia se basa en que los datos están estructurados y buscamos beneficios a corto plazo.

Para llevar dicha estrategia a cabo se definirá un equipo basado en metodologías ágiles donde se tendrán las
siguientes premisas:

 Comunicación completa con todos los miembros del equipo, la comunicación es el factor
fundamental en el éxito de cualquier proyecto.
 Reuniones diarias de seguimiento, donde cada uno de los miembros indique si tiene alguna
problemática y entre los miembros del proyecto encontrar la mejor forma de resolverlo.
 Reuniones de resultados, en dichas reuniones se mostrarán el avance y los resultados del proyecto.
 Reunión de cierre, dicha reunión se realizará una vez finalizado el proyecto y se verán las lecciones
aprendidas.

Las etapas por las que se deberá pasar para concluir este proyecto serán las siguientes:

REVISIÓN DE LITERATU RA

Se revisará información en Internet sobre las librerías que más venden, casos como Amazon y los modelos
de ventas en línea serán analizados en esta etapa.

EXPLORACIÓN DE DATOS

En esta etapa se revisarán los datos de la carpeta denominada “datasets_books”, suministrada por la tienda,
se extraerán e integrarán los datos más relevantes para lograr posteriormente un análisis predictivo
eficiente y efectivo para los objetivos que busca la librería.

DESARROLLO DE ALGORI TMOS

Se procederá con el desarrollo y prueba de algoritmos que permitan a la librería tener un modelo predictivo
que finalmente sea más efectivo en la recomendación de los libros que deberían leer los diferentes clientes.

ANÁLISIS DE RESULTAD OS

Se realizarán cargas ficticias de datos en el sistema de la librería para lograr analizar qué tan efectivo es el
algoritmo desarrollado, de igual forma se probará con datos históricos y se cruzará con las ventas reales
históricas para verificar la efectividad del algoritmo.

REVISIÓN

El equipo realizará la revisión completa del algoritmo al igual que pruebas del mismo en el caso de detectar
fallas se volverá el mismo a desarrollo.
IMPLEMENTACIÓN

Se realizará la modificación del sitio web de la librería para incluir el nuevo algoritmo, para tal caso se
realizará mediante el equipo de desarrollo de software.

INDICADORES “KPI”

Los indicadores KPIs mas relevantes que se desprenden del análisis realizado son los siguientes:

1. Clasificación de libros menos vendidos del inventario de la Librería

Es importante conocer cuál o cuáles son las clasificaciones de libros de menos venta en la librería, para
así lograr la optimización del gasto y manejar el mínimo de existencias para las clasificaciones menos
vendidas.

2. ¿Cuántos clientes han comprado libros de la tabla “to_read” ?

Con esto se determinará la efectividad del algoritmo de recomendación de libros, dando la capacidad de
mejorar dicho algoritmo.

3. Cantidad de libros vendida del raiting

Al hacer el cruce entre la tabla de “raiting” y la tabla de libros más vendidos nos permitirá observar que
tan efectivo es el rating de los libros con respecto a sus ventas reales.

DESCUBRIMIENTOS DE LA INFORMACIÓN

Luego de analizada la información la librería podría tomar las siguientes decisiones basadas en modelos
predictivos:

Cuál debería ser la existencia de libros en cada una de las clasificaciones, optimizando el inventario y las
ganancias.

Qué tan rápido se deben adquirir los nuevos títulos de libros por la librería tomando en cuenta las
preferencias de los clientes.

Según el entorno cultural de la ciudad de Monterrey, Nuevo León, México definir un perfil más acertado de
los gustos y preferencias de los clientes de la ciudad donde se encuentra ubicada la librería, así como las
ciudades en la que la misma logra colocar la venta de sus libros mediante el sitio Web.
CONCLUSIONES

Es fundamental para la librería Iztaccihuatl desarrollar un proyecto de ciencia de datos que le permita
maximizar los inventarios de libros y las ventas lo que finalmente permita a la librería crecer y mejorar en
cuanto a las preferencias del cliente.

Mediante poder predecir y mejorar el manejo de las preferencias de los clientes la librería logrará vender
más y los clientes quedarán más felices al tener recomendaciones que realmente se acoplan a sus gustos.

También podría gustarte