Está en la página 1de 9

Introducción a la Ciencia de Datos y el Big Data

TRABAJO INDIVIDUAL

ALUMNO: RAUL VALDIVIEZO LOPEZ

ANALISIS DE FUENTES DE INFORMACION EXTERNAS E


INTERNAS DE UNA ORGANIZACIÓN A TRAVES DE
HERRAMIENTAS COMPUTACIONALES PARA GENERAR
MODELO BASADO EN CIENCIA DE DATOS COMO
APOYO A LA TOMA DE DECISIONES

LIMA – PERÚ

FEBRERO 2020
- CONTENIDO -

1. INTRODUCCION

2. TIPO DE ANALISIS MAS ADECUADO

3. ESTRATEGIA DE IMPLEMENTACION

4. INDICADORES KPI

5. BUENAS PRACTICAS PARA EL LOGRO DEL PROYECTO

6. DESICIONES A TOMAR

7. CONCLUSIONES
1. INTRODUCCION

La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha


decidido desarrollar un proyecto basado en ciencia de datos, a fin de mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la
toma de decisiones de su negocio.

Como parte del desarrollo del trabajo se analizó la estructura de información


contenida en la carpeta “datasets_books”, el cual contiene los siguientes archivos:

 El archivo “books” contiene los datos generales de cada libro existente en la


librería y además menciona el promedio de clasificación de cada libro de acuerdo
a las votaciones y compras del cliente.

 El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a


una clasificación general.

 El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.

 El archivo “to_read” contiene las recomendaciones que cada cliente o usuario


realiza en el sitio web sobre libros para leer.

2. TIPO DE ANALISIS MAS ADECUADO

De la revisión de la estructura de información de la empresa, se puede aplicar los


tres tipos de análisis: descriptivo, predictivo y prescriptivo.

Dentro del análisis descriptivo los datos ofrecen información histórica de como
clasifican los clientes a los libros, cantidad de libros vendidos, libros más votados y
las que recomienda leer.

Para el análisis predictivo, teniendo en cuenta que existe información, se podría


identificar y construir patrones de los lectores de libros y conocer que influye en ellos
para realizar la compra, lo cual podría facilitar el conocer lo que puede suceder ante
una situación identificada.

En el caso del análisis prescriptivo, se podría sugerir que acciones debería de


realizarse, a fin de mejorar el enfoque del negocio. Por ejemplo, existe identificar las
tendencias con los libros más votados y con mayor nivel de recomendación, lo cual
puede influir sobre la temática de libros que tiene más demanda y que le conviene a
la librería vender, identificando nuevas oportunidades de negocio.
3. ESTRATEGIA DE IMPLEMENTACION

Existen diversas metodologías de implementación para el uso de minería de datos y


de la ciencia de datos, por ejemplo, el proceso KDD, que tiene como propósito el
descubrir conocimiento en una base de datos en función de medidas y umbrales;

Así mismo, también se tiene el proceso estructurado CRIS-DM, que permite definir y
documentar el proyecto:

Para implementar el proyecto de la librería, recomendamos seguir la metodología


fundamental para la ciencia de datos (FMDS), la cual incluye a los procesos KDD y
CRISP-DM:
La metodología FMDS presenta 10 etapas bien diferenciadas, las cuales sirven de
guía para los procesos y actividades que debe desarrollar la empresa. La
metodología proporcionará un marco sobre cómo proceder con los métodos,
procesos y argumentos que se utilizarán para obtener respuestas o resultados.

Etapa 1: Comprensión del negocio


El proyecto comienza con la comprensión del negocio. Se debe definir el problema,
los objetivos del proyecto y los requisitos de la solución desde una perspectiva
empresarial. Esta primera etapa sienta las bases para que el problema empresarial
sea resuelto con éxito.

Etapa 2: Enfoque analítico


Esta etapa implica expresar el problema bajo el contexto de las técnicas estadísticas
y de aprendizaje automático, para que la organización pueda identificar las más
adecuadas para el resultado deseado.

Etapa 3: Requisitos de datos


El enfoque analítico elegido determina los requisitos de datos. Más concretamente,
los métodos analíticos a utilizar requieren de determinados contenidos de datos,
formatos y representaciones, orientados por el conocimiento en el dominio.

Etapa 4: Recopilación de datos


En la etapa inicial de recopilación de datos, se debe identificar y reunir los recursos
de datos disponibles (estructurados, no estructurados y semiestructurados) y
relevantes para el dominio del problema.

Etapa 5: Comprensión de datos


Después de la recopilación de datos inicial, se debe utilizar estadísticas descriptivas
y técnicas de visualización para comprender el contenido de los datos, evaluar su
calidad y descubrir ideas iniciales sobre ellos.

Etapa 6: Preparación de datos


Esta etapa abarca todas las actividades para construir el conjunto de datos que se
utilizará en la subsiguiente etapa de modelado. Entre las actividades de preparación
de datos están la limpieza de datos (tratar con valores no válidos o que faltan,
eliminar duplicados y dar un formato adecuado), combinar datos de múltiples fuentes
(archivos, tablas y plataformas) y transformar los datos en variables más útiles.

Etapa 7: Modelado
La etapa de modelado utiliza la primera versión del conjunto de datos preparado y se
enfoca en desarrollar modelos predictivos o descriptivos según el enfoque analítico
previamente definido. En los modelos predictivos, los científicos de datos utilizan un
conjunto de capacitación (datos históricos en los que se conoce el resultado de
interés) para construir el modelo.

Etapa 8: Evaluación
Durante el desarrollo del modelo y antes de su implementación, se debe evaluar el
modelo para comprender su calidad y garantizar que aborda del problema
empresarial de la empresa de manera adecuada y completa. La evaluación del
modelo implica el cálculo de varias medidas de diagnóstico y de otros resultados,
como tablas y gráficos, lo que permite al científico de datos interpretar la calidad y la
eficacia del modelo en la resolución del problema.
Etapa 9: Implementación
La implementación de un modelo en un proceso operativo empresarial generalmente
involucra a grupos, habilidades y tecnologías adicionales dentro de la empresa. Por
ejemplo, un grupo de ventas puede implementar un modelo de propensión a la
respuesta a través de un proceso de administración de campañas creado por un
equipo de desarrollo y administrado por un grupo de marketing.

Etapa 10: Retroalimentación


Al recopilar los resultados del modelo implementado, la organización obtiene
retroalimentación sobre el rendimiento del modelo y su impacto en el entorno en el
que se implementó.

4. INDICADORES (KPI’S)

¿Qué indicadores serían los más importantes a determinar de acuerdo a la


información presentada?

1. Indicador de Rentabilidad por Autor de Libro según Cliente (RLC)

Es la medida con la cual se conoce cuanto beneficio genera un autor de libro


en la librería, a partir de los patrones de consumo de los clientes y de
potenciales clientes.

(Ingresos totales del libro– Gastos totales del libro)


/ Gastos totales del libro
(RLC) = -----------------------------------------------------------------
Tipos de patrones de cliente

2. Indicador de Rotación de Stock de Libros (RSL)

Es la medida con la cual se calcula el número de veces que el inventario de


libros se mueve en su totalidad, en una unidad de tiempo determinado
(mensual o anual).

Número de Libros Vendidos


(RSL) = ---------------------------------------------------
Inventario Libros Promedio

Inv. Inicial + Inv. Final


Inv. Libros Promedio = -------------------------------------
2

3. Indicador de Efectividad por Clasificación de libro por Cliente (ECC)

Es la medida con la cual se conoce el número de clasificaciones de un libro


por parte de los clientes, en relación a la efectividad de las ventas de dichos
libros clasificados.

Número de clasificaciones efectivas


(ECC) = -----------------------------------------------------------------
Total de ventas de libros clasificados
5. BUENAS PRACTICAS PARA EL LOGRO DEL PROYECTO

A continuación, se señalan algunas recomendaciones de buenas prácticas para


lograr la implementación del proyecto:

1. Tener claros los objetivos de negocio


El proyecto debe ir alineados con los objetivos de negocio para que generen valor en
la organización. Así que el primer paso es recopilar, analizar y comprender los
requerimientos del negocio para tener claras sus necesidades e iniciar con los
proyectos de análisis de datos.

2. La implementación del proyecto es una decisión de negocio


Las soluciones de análisis de datos del proyecto serán más exitosas cuando nacen
por un punto de vista o necesidad comercial y no desde el área de TI de las
organizaciones. Las soluciones deben adaptarse a las necesidades de negocios y no
las necesidades a la tecnología.

3. Utilizar soluciones ágiles


El proyecto debe iniciarse con un caso específico, en la medida que se vaya
implementando, las necesidades de las organizaciones evolucionan para incorporar
más técnicas y aprovechar los datos. Es importante incorporar soluciones ágiles que
se basen en las necesidades de negocio y permitan implementar técnicas para hallar
oportunidades y valor fácilmente.

4. Evaluar las necesidades de datos


Es importante llevar a cabo una evaluación completa de los datos que se cuentan
para identificar cómo utilizarlos para alcanzar los beneficios al máximo. Con un
equipo de trabajo, debe analizarse qué datos debe conservar, cómo administrarlos,
cómo acceder a ellos y qué datos debe descartar.

5. Liberar el valor de los datos


Es necesario aprovechar las inversiones anteriores en infraestructura, plataformas,
inteligencia de negocios y almacenes de datos, en lugar incorporar tecnologías
nuevas. Además, se debe invertir en fortalecer el acceso a los datos, de esta forma
los miembros de la empresa podrán correlacionar diferentes tipos y fuentes de datos,
para hacer asociaciones y hacer descubrimientos significativos. El análisis de datos
no es solo un aliado que entrega una ventaja competitiva, la empresa debe explotar
el valor de la información.
6. DECISIONES A TOMAR

La Librería Iztaccihuatl debe tomar los resultados de los indicadores para tomar
decisiones, tomando como base el desempeño de los indicadores, tratando de
descubrir o inferir sobre la información analizada.

1. Indicador de Rentabilidad por Autor de Libro según Cliente (RLC)

El indicador permite medir la rentabilidad de cada autor de libro por cliente, que
según se incremente el indicador, la empresa decidirá adquirir más libros de dichos
autores, en los casos que el indicador disminuya deberá reorientar los pedidos de
dichos libros por tener poca rentabilidad, tratando de reducir el stock de compra de
los mismos.

Asimismo, debe realizarse una evaluación según los patrones de compra de los
clientes con buena clasificación, para agrupar que otros posibles libros podrían
interesarle a este sector de clientes, y hacer una campaña de marketing para
asociar promociones y descuentos de los posibles libros que puedan ser adquiridos.

2. Indicador de Rotación de Stock de Libros (RSL)

El indicador permite medir el promedio de veces que el stock de libros se mueve en


su totalidad, dependiendo si el indicador muestra que existe baja rotación la
empresa debe decidir priorizar las campañas de marketing con dichos libros, en el
caso que el indicador muestra que sube la rotación, es necesario identificar los libros
que tienen dicho comportamiento para coordinar mayor adquisición o asociar un
libro sustituto que también pueda tener éxito en las ventas.

Asimismo, debe realizarse una evaluación según los patrones de compra de la


empresa, para mejorar el abastecimiento de libros que deben ser adquiridos.

3. Indicador de Efectividad por Clasificación de libro por Cliente (ECC)

El indicador permite medir las clasificaciones de los libros por parte de los clientes,
respecto a las ventas de dichos libros, si el indicador se incrementa, significa que
dichos libros son los más vendidos, ante ello la empresa decidirá adquirir más libros
de dichos autores, en los casos que el indicador disminuya deberá evitar abastecerse
o hacer pedidos de dichos libros por tener poca efectividad, deberá reducir el stock
de compra de los mismos.
7. CONCLUSIONES

El presente trabajo ha abordado el proyecto basado en ciencia de datos, que permita


mejorar los indicadores de desempeño de la Librería Iztaccihuatl y a la vez
desarrollar una mejor estrategia en la toma de decisiones de dicha empresa.

En el proyecto se propone aplicar como objetivo de la estrategia de implementación,


la metodología FMDS (Metodología Fundamental para la Ciencia de Datos), la cual
presenta 10 etapas bien diferenciadas, y que sirven de guía para los procesos y
actividades que debe desarrollarse. La metodología proporcionará un marco sobre
cómo proceder con los métodos, procesos y argumentos que se utilizarán para
obtener respuestas o resultados.

Dentro del trabajo realizado, se analizó la estructura de información contenida en la


carpeta “datasets_books”, a partir de la cual se vio conveniente utilizar los tres tipos
de análisis: descriptivo, predictivo y prescriptivo.

Para el análisis descriptivo se cuenta con información histórica de como clasifican los
clientes a los libros, cantidad de libros vendidos, libros más votados y las que
recomienda leer. En el análisis predictivo, se busca identificar y construir patrones de
los lectores de libros y conocer que influye en ellos para realizar la compra. Y en el
caso del análisis prescriptivo, se busca proponer acciones para mejorar el enfoque
del negocio.

Finalmente, se propuso tres indicadores de desempeño que deben ser


implementados en la librería, a fin de evaluar la rentabilidad por autor de libros y
clientes, medir la rotación de stock de libros y medir la efectividad según clasificación
de los libros por sus clientes. A partir de dichos resultados se tomarán decisiones en
la empresa, tratando de descubrir o inferir sobre la información analizada.

También podría gustarte