Está en la página 1de 10

EDX

INTRODUCCIÓN A LA CIENCIA DE DATOS Y EL BIG DATA

Ejercicio: Utilizando la Ciencia de Datos en una Organización

Sandra Motta Ruiz

Mayo /2020
ÍNDICE

INTRODUCCIÓN 3

DESCRIPCIÓN DEL EJERCICIO 4

DESCRIPCIÓN DE LA EMPRESA 7

IDENTIFICACIÓN DE INDICADORES 7

TIPO DE ANÁLISIS 8

PROPUESTA DE DECISIONES QUE LA EMPRESA PODRÁ TOMAR EN BASE A LA


INFORMACIÓN ANALIZADA 8

CONCLUSIONES 10
INTRODUCCIÓN

La cantidad de datos históricos y en tiempo real recolectados por las diferentes


industrias, redes sociales, medios de comunicación, etc. cada vez van creciendo
significativamente, son una gran oportunidad para que las empresas a través de
técnicas y análisis de datos encuentren oportunidades que apoyen su estrategia y
es, a través de Big data y la ciencia de datos ,con lo que lograran esa ventaja
competitiva, que les permitirá generar mayores ingresos y permanencia en el
mercado.

En éste ejercicio y con base en la información recolectada con respecto a los libros
y clientes, se realizará un análisis descriptivo que nos muestre la situación actual,
pero también se puede llegar hasta un análisis predictivo que apunte a una
estrategia dirigida a los clientes actuales.
DESCRIPCIÓN DEL EJERCICIO

Objetivo: ​Analizar fuentes de información externas e internas de una organización a


través de herramientas computacionales para generar un modelo basado en Ciencia
de Datos como apoyo a la toma de decisiones.

La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha


decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la
toma de decisiones.

En la carpeta denominada “​datasets_books”​ se encuentran los siguientes archivos:


books; top_books; raitings; to_read.

Una vez analizada la información de la carpeta “datasets_books” deberás presentar


en un documento Word la respuesta a las siguientes preguntas:

● ¿Qué indicadores serían los más importantes a determinar de acuerdo a la


información presentada?
● ¿Qué tipo de análisis sería el más adecuado y por qué?
● ¿Qué decisiones se podrían tomar basadas en los descubrimientos o
inferencias de la información analizada?

El archivo “​books​” contiene los siguientes datos:

● Id - Identificador del registro


● Book Id - Identificador del libro
● Number Editions - Número de ediciones
● ISBN - Clave estándar internacional del libro
● ISBN13 - Clave estándar extendida internacional del libro
● Authors - Autor del libro
● Original Publication - Fecha de publicación
● Original Title - Título original del libro
● Title - Título del libro
● Language Code - Clave de idioma del libro
● Average Rating - Promedio de la clasificación del libro
● Image - Enlace a la imagen de la portada del libro
● Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.

El archivo “​top_books​” contiene los siguientes datos:

● Position - Posición del libro en la clasificación del libro


● ISBN - Clave estándar extendida internacional del libro
● Title - Título del libro
● Author - Autor del libro
● Imprint - Editorial
● Publisher Group - Grupo Editorial
● Volume - Volumen de ventas hasta el 2010
● Value - Ventas determinadas por el volumen
● RRP - Precio recomendado para minoristas
● ASP - Precio promedio para venta
● Binding - Tipo de encuadernación
● Publ Date - Fecha de publicación
● Product Class - Clasificación del libro
● Classification - Clasificación General del libro

El archivo “​ratings​” contiene los siguientes datos:

● Book Id - Identificador del libro


● User Id - Identificador del cliente/usuario que clasifico un libro
● Rating - Nivel de clasificación del libro.

El archivo “​to_read​” contiene los siguientes datos:

● User Id - Identificador del cliente/usuario que clasifico un libro


● Book Id - Identificador del libro

El archivo “​books​” contiene los datos generales de cada libro existente en la librería
y además menciona el promedio de clasificación de cada libro de acuerdo a las
votaciones y compras del cliente.

El archivo “​top_books​” contiene el top 20 de los libros más vendidos de acuerdo a


una clasificación general.

El archivo “​ratings​” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.

El archivo “​to_read​” contiene las recomendaciones que cada cliente o usuario


realiza en el sitio web sobre libros para leer.
 

DESCRIPCIÓN DE LA EMPRESA

La empresa sobre la cual se va a desarrollar este ejercicio es La Librería Iztaccihuatl


ubicada en la ciudad de Monterrey, Nuevo León, México que tiene una trayectoria
de más de 57 años que buscan Ser líderes en la distribución y comercialización de
material bibliográfico y ser una referencia cultural y de lectura mediante la difusión y
apoyos a editoriales, autores, asociaciones y eventos. El objetivo es desarrollar un
proyecto basada en ciencia de datos para mejorar sus indicadores de desempeño y
a la vez desarrollar una mejor estrategia en la toma de decisiones.

IDENTIFICACIÓN DE INDICADORES

Con la información dada para el ejercicio se pueden obtener muchos tipos de


indicadores que ayudarán a evaluar el estado actual de la librería, como por
ejemplo:

Libros vendidos en un periodo de tiempo


Número de clientes en un periodo de tiempo
libros más rentables
frecuencia de compra de los clientes

Para éste ejercicio en particular , nos vamos a centrar en un solo indicador que es:

Libros por top de ventas, rating y valor

Con éste indicador se quiere obtener cuáles de los libros de los más vendidos tienen
mayor rating y generan más ingresos .

se obtiene con la información de la siguiente data: ratings, top_books y books


TIPO DE ANÁLISIS

En éste ejercicio se pueden aplicar dos tipos de análisis. El descriptivo, con el que
podemos ver el comportamiento histórico en la librería, la información relevante de
los libros existentes, la clasificación de cada libro de acuerdo a las votaciones y
compras de los los clientes, que libros fueron los más vendidos y los que
recomiendan los propios clientes. Con éste análisis se puede obtener el una visión
de los que está pasando con el negocio y los clientes y cada una de estas variables
como aporta al estado actual del negocio.

De otra parte, con el análisis predictivo, se llega a posibles estrategias que puede
tomar el negocio para fortalecer las ventas y potencializar las ventas de los libros a
nuestro clientes de tal forma que aumenten los ingresos y además de un servicio
diferenciador a los clientes.

PROPUESTA DE DECISIONES QUE LA EMPRESA PODRÁ TOMAR


EN BASE A LA INFORMACIÓN ANALIZADA

De los clientes que recomiendan los libros (to_read) se puede identificar su tipo de
lectura preferida y ofrecerles libros que coincidan con sus gustos, de tal forma que,
en lugar de que los clientes lleguen a la librería con un título para comprar, la librería
se anticipe y recomiende posibles libros que le pueden gustar, todo esto con base
en la información de sus compras, votaciones y sugerencias. Con ésta información
se puede hacer una estrategia para sugerir a los clientes no solo lo que les puede
interesar, sino también los que generen mayor ingreso.

Con ésta estrategia, no sólo se aprovechan los clientes actuales y aumentan los
ingresos, sino que también les estamos dando un servicio y la percepción de
nuestro interés por sus gustos.

Para implementar este modelo debemos seguir las diferentes etapas que nos dá la
metodología de gestión de proyectos de Big Data y tendrá dos fases que nos darán
la visión actual y permitirá llegar al propósito de dar valor a los clientes:
1. Comprensión del negocio,
2. Comprensión de los datos,
3. preparación de los datos
4. modelamiento
5. Evaluación
6. Implementación

La evaluación se muestra en una etapa diferente, pero es importante anotar que es


una etapa clave de esta estrategia y debe realizarse de forma continua, porque es la
que permite medir los resultados y alinear nuevamente el modelo a través de una
mejora continua.
CONCLUSIONES

Con la información actual que se tiene de la librería y aplicando los diferentes


análisis que nos proporciona Big Data, se puede obtener una visión de la situación
actual e histórica del negocio. Adicional, también es posible consolidar esta
información para establecer nuevas estrategias que lleven al aumento de las ventas,
los ingresos y dar un mejor servicio a los clientes, lo que hace que esta librería
puede tener un servicio diferenciador en el mercado y por tanto lograr una ventaja
competitiva.

También podría gustarte