Está en la página 1de 12

Visualización de Datos y Storytelling

Practica Individual con Evaluación entre pares

Proyecto
Aplicando la Ciencia de Datos en una organización

Elaborado por: William Quintanilla


Tabla de contenidos

I. INTRODUCCIÓN ............................................................................................................................................. 1
1.1 ANTECEDENTES ............................................................................................................................................... 1
1.2 OBJETIVO GENERAL......................................................................................................................................... 1
1.3 OBJETIVOS ESPECÍFICOS. ................................................................................................................................. 2
II. ANÁLISIS DE LA INFORMACIÓN PROPORCIONADA .......................................................................... 2
2.1 COMPRESIÓN DE LOS DATOS ............................................................................................................................ 2
2.2 MODELADO DE DATOS..................................................................................................................................... 6
III. VISUALIZACIONES RECOMENDADAS. ............................................................................................... 8
3.1 GRAFICAS A PRESENTA EN EL PROYECTO. ........................................................................................................ 8
3.2 COMPARACIONES. ............................................................................................................................................ 9
3.3 CORRELACIONES.............................................................................................................................................. 9
3.4 PREDICCIONES ............................................................................................................................................... 10
3.5 STORYTELLING SOBRE LOS DATOS DE LA LIBRERÍA. ...................................................................................... 10
3.6 CONCLUSIONES. ............................................................................................................................................. 10
Visualización de Datos y Storytelling

I. Introducción

En los proyectos de ciencias de datos es necesario contar con las herramientas


tecnológicas adecuadas para el procesamiento, almacenaje y presentación a la
información, información que en muchos casos incluye diversos tipos de datos o grandes
cantidades de ellos sobre los cuales las herramientas tradicionales no nos darían las
misma facilidad y rendimiento que las herramientas para Big Data nos ofrecen.

Las tecnologías de visualización de datos proporcionan un medio altamente efectivo para


presentar la información necesaria que permita la toma de decisiones solidas.

En este documento se centra en la aplicación de estas tecnologías de visualización como


parte de un proyecto de Ciencia de Datos desarrollado para la Librería Iztaccihuatl la cual
necesita definir los mejores tipos de visualizaciones para la toma de decisiones..

1.1 Antecedentes
La Librería Iztaccihuatl ubicada en la ciudad de Monterey, Nuevo León, México se ve
actualmente en la necesidad de mejorar sus indicadores de desempeño y a la vez
desarrollar una mejor estrategia para la toma de decisiones. La librería cuenta con un
sitio web en donde se generan calificaciones de los libros por parte de los clientes. La
librería ha entregado una serie de documentos los cuales se analizan en el capitulo dos
de este documento.

1.2 Objetivo General


Identificar las gráficas, comparaciones; correlaciones y una posible predicción a través
de una visualización de datos como parte de un modelo basado en Ciencia de Datos para
el apoyo a la toma de decisiones de la librería Iztaccihuatl.

Página 1 29/11/2020
Visualización de Datos y Storytelling

1.3 Objetivos Específicos.

• Identificar las gráficas se pueden realizar sobre el análisis de datos de la Librería


Iztaccihuatl

• Recomendar el tipo de comparaciones que se podrían graficar sobre los datos de


la Librería Iztaccihuatl
• Identificar que correlaciones se pueden tener de los datos de la Librería
Iztaccihuatl para poder realizar un análisis descriptivo.

• Justificar que predicción sería posible realizar sobre los datos de la Librería.

• Identificar qué historia se podría contar de las visualizaciones a los datos de la


Librería Iztaccihuatl.

II. Análisis de la Información Proporcionada

2.1 Compresión de los Datos

Para el presente análisis, contamos con una serie de archivos con datos en formato texto
delimitado por comas, que representan la operación de la librería. Una descripción de
estos sets de datos se presenta a continuación.

El archivo Books es un catálogo maestro de 10,000 registros que representan los datos
generales de cada libro existente en la librería, además de contener el promedio de
clasificación de cada libro de acuerdo a las votaciones y compras de los clientes.

Una muestra de los datos se presenta a continuación

Página 2 29/11/2020
Visualización de Datos y Storytelling

La descripción de la estructura del archivo es la siguiente

Nombre Dato Descripción

id Identificador del registro

Book Id Identificador del libro

Number Editions Número de ediciones

ISBN Clave estándar internacional del libro

ISBN13 Clave estándar extendida internacional del libro

Authors Autor del libro

Original Publication Fecha de publicación

Original Title Título original del libro

Title Título del libro

Language Code Clave de idioma del libro

Average Rating Promedio de la clasificación del libro

Image Enlace a la imagen de la portada del libro

Small Image Enlace a la imagen en versión optimizada de la portada del libro.

Página 3 29/11/2020
Visualización de Datos y Storytelling

El archivo to_read contiene 912,705 registros que representan las recomendaciones de


libros para leer que cada cliente o usuario ha realizado usando el sitio web.

Una muestra de los datos se presenta a continuación

La estructura del archivo es la siguiente:

Nombre Dato Descripción

User Id Identificador del cliente/usuario que clasifico un libro

Book Id Identificador del libro

El archivo top_books contiene 120 registros con el top 20 de los libros mas vendidos de
acuerdo a una clasificación general. El archivo contiene una serie de atributos de cada
libro desde características de identificación y generales, hasta ventas por volumen,
precios recomendados, etc.

Un ejemplo de los contenidos de este archivo se muestra a continuación.

Página 4 29/11/2020
Visualización de Datos y Storytelling

La estructura de archivo es la siguiente:

Nombre Dato Descripción

Position Posición del libro en la clasificación del libro

ISBN Clave estándar extendida internacional del libro

Title Título del libro

Author Autor del libro

Imprint Editorial

Publisher Group Grupo Editorial

Volume Volumen de ventas hasta el 2010

Value Ventas determinadas por el volumen

RRP Precio recomendado para minoristas

ASP Precio promedio para venta

Binding Tipo de encuadernación

Publ Date Fecha de publicación

Product Class Clasificación del libro

Classification Clasificación General del libro

Página 5 29/11/2020
Visualización de Datos y Storytelling

El archivo Ratings contiene 981,756 registros con los datos de los libros mas votados por
los clientes dentro del sitio web de la librería.

Una muestra de los datos se presenta a continuación:

La estructura del archivo se muestra a continuación;

Nombre Dato Descripción

Book Id Identificador del libro

User Id Identificador del cliente/usuario que clasifico un libro

Rating Nivel de clasificación del libro.

2.2 Modelado de Datos


Después de analizar la información proporcionada y su estructura, nos damos cuenta que
fácilmente se puede generar un modelo relacional como se presenta a continuación.

Página 6 29/11/2020
Visualización de Datos y Storytelling

Las relaciones entre los distintos archivos se evidencias al analizar su estructura,


conociendo esto y los requerimientos podemos realizar ciertas conclusiones y
recomendaciones sobre las visualizaciones a recomendar las cuales se presentan en el
siguiente capítulo.

Página 7 29/11/2020
Visualización de Datos y Storytelling

III. Visualizaciones Recomendadas.

3.1 Graficas a presenta en el proyecto.

Una de las primeras Graficas del tipo distribución, el top 10 de los títulos con mayor
rating.

Una segunda grafica es, los autores mejor ranqueados por periodo de tiempo.

Página 8 29/11/2020
Visualización de Datos y Storytelling

Una tercera grafica es la posición que se le da a un libro dentro de una clasificación y a


través del tiempo.

3.2 Comparaciones.
Algunas de las comparaciones que podrían realizarse son:

• Volumen de Ventas vs. Recomendaciones para lectura. Se puede elaborar una


grafica comparativa de barras que compare el volumen de ventas de un libro vs.
La cantidad de recomendaciones que reciba dicho libro.

• Comparación entre volúmenes de ventas por genero del libro.

• Ventas por genero o autor por Periodo.

3.3 Correlaciones

Dentro de las relaciones o correlaciones que se pueden apreciar en la data proporcionada


tenemos:

• Correlación entre Ratings, Recomendaciones de lectura y Volúmenes de Venta.


• Correlación entre Genero/Autor y Volúmenes de Venta.

Página 9 29/11/2020
Visualización de Datos y Storytelling

3.4 Predicciones

Una de las predicciones que se podría hacer es que géneros continuaran siendo bien
valorados y adquiridos por los usuarios. Una mejor predicción se podría realizar si contara
con el registro del tiempo o fecha de estas valoraciones, así como los detalles de los
volúmenes de venta por fecha.

3.5 Storytelling sobre los datos de la Librería.

Una de las historias que podría contarse, es basado en los rating recibidos para un Libro,
su volumen de ventas se ve incrementado lo que origina mayor recomendaciones de
lectura, lo anterior impacta en las ventas de libros del mismo genero o autor, por lo que
al tener un libro con altos ratings sería recomendable promocionar libros del mismo
género y autor.

3.6 Conclusiones.

Con la visualización de datos se cumple el dicho que una imagen dice mas que mil
palabras, por lo que con las herramientas correctas es posible la generación de distintos
tipos de graficas que no solo presentan datos históricos o comparativos, sino se
evolucione a un escenario de Storytelling.

Página 10 29/11/2020

También podría gustarte