Está en la página 1de 13

Jorge Alberto Godinez Garcia

Guadalajara, Jalisco, México

Utilizando la Ciencia de Datos en una Organización

Objetivo: Analizar fuentes de información externas e internas de una organización


a través de herramientas computacionales para generar un modelo basado en
Ciencia de Datos como apoyo a la toma de decisiones.
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

Índice

Contenido
Utilizando la Ciencia de Datos en una Organización ............................................................1
Objetivo: Analizar fuentes de información externas e internas de una organización a
través de herramientas computacionales para generar un modelo basado en Ciencia de
Datos como apoyo a la toma de decisiones. ...........................................................................1
Índice ............................................................................................................................................2
1. Antecedentes......................................................................................................................3
2. Datos de identificación de la empresa. ........................................................................6
3. Descripción detallada de la estrategia de implementación. ...................................6
4. Proceso de evaluación de la estrategia de implementación. .................................8
KPIs de ventas .......................................................................................................................8
KPI´s de marketing ................................................................................................................8
KPI´s de evaluación ..............................................................................................................8
5. Buenas prácticas a utilizar para lograr la estrategia descrita. ...............................9
5.1. Tome decisiones: ..........................................................................................................9
5.2. Seguimiento: ...................................................................................................................9
5.3. Definir qué tipo de indicadores se quieren medir: ..............................................10
5.4. Tener en cuenta las condiciones básicas de un indicador: ..............................10
5.5. Tenga bien definido el temporizador de su indicador: .......................................10
5.6. Realizar con frecuencia estas preguntas claves: ................................................11
6. Justificación de la estrategia de implementación. ..................................................12
7. Conclusiones....................................................................................................................13
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

1. Antecedentes

Este trabajo forma parte del curso en edx dirigido por el Tec de Monterrey. Es sobre
la Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México. La
librería ha decidido desarrollar un proyecto basado en ciencia de datos para mejorar
sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia
en la toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos:
books; top_books; raitings; to_read.

El archivo “books” contiene los siguientes datos:

Id - Identificador del registro


Book Id - Identificador del libro
Number Editions - Número de ediciones
ISBN - Clave estándar internacional del libro
ISBN13 - Clave estándar extendida internacional del libro
Authors - Autor del libro
Original Publication - Fecha de publicación
Original Title - Título original del libro
Title - Título del libro
Language Code - Clave de idioma del libro
Average Rating - Promedio de la clasificación del libro
Image - Enlace a la imagen de la portada del libro
Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.

El archivo “top_books” contiene los siguientes datos:

Position - Posición del libro en la clasificación del libro


Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

ISBN - Clave estándar extendida internacional del libro


Title - Título del libro
Author - Autor del libro
Imprint - Editorial
Publisher Group - Grupo Editorial
Volume - Volumen de ventas hasta el 2010
Value - Ventas determinadas por el volumen
RRP - Precio recomendado para minoristas
ASP - Precio promedio para venta
Binding - Tipo de encuadernación
Publ Date - Fecha de publicación
Product Class - Clasificación del libro
Classification - Clasificación General del libro

El archivo “ratings” contiene los siguientes datos:

Book Id - Identificador del libro


User Id - Identificador del cliente/usuario que clasifico un libro
Rating - Nivel de clasificación del libro.

El archivo “to_read” contiene los siguientes datos:

User Id - Identificador del cliente/usuario que clasifico un libro


Book Id - Identificador del libro

El archivo “books” contiene los datos generales de cada libro existente en la


librería y además menciona el promedio de clasificación de cada libro de acuerdo a
las votaciones y compras del cliente.
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo


a una clasificación general.

El archivo “raitings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.

El archivo “to_read” contiene las recomendaciones que cada cliente o usuario


realiza en el sitio web sobre libros para leer.

Una vez analizada la información de la carpeta “datasets_books” se deberá


presentar en un documento Word la respuesta a las siguientes preguntas:

¿Qué indicadores serían los más importantes a determinar de acuerdo a la


información presentada?
¿Qué tipo de análisis sería el más adecuado y por qué?
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de
la información analizada?
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

2. Datos de identificación de la empresa.

Este estudio es realizado por la empresa homodixit para la Librería Iztaccihuatl.


ubicada en la ciudad de Monterrey, Nuevo León, México.

3. Descripción detallada de la estrategia de implementación.

La metodología a implementar es CRISP DM

Fuente: crisp-dm.org

Comprensión del negocio (Objetivos y requerimientos desde una perspectiva no


técnica)
▪ Establecimiento de los objetivos del negocio (Contexto inicial, objetivos,
criterios de éxito)
▪ Evaluación de la situación (Inventario de recursos, requerimientos,
supuestos, terminologías propias del negocio,…)
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

▪ Establecimiento de los objetivos de la minería de datos (objetivos y criterios


de éxito)
▪ Generación del plan del proyecto (plan, herramientas, equipo y técnicas)

Comprensión de los datos (Familiarizarse con los datos teniendo presente los
objetivos del negocio)
▪ Recopilación inicial de datos
▪ Descripción de los datos
▪ Exploración de los datos
▪ Verificación de calidad de datos
Preparación de los datos (Obtener la vista minable o dataset)
▪ Selección de los datos
▪ Limpieza de datos
▪ Construcción de datos
▪ Integración de datos
▪ Formateo de datos
Modelado (Aplicar las técnicas de minería de datos a los dataset)
▪ Selección de la técnica de modelado
▪ Diseño de la evaluación
▪ Construcción del modelo
▪ Evaluación del modelo
Evaluación (De los modelos de la fase anteriores para determinar si son útiles a
las necesidades del negocio)
▪ Evaluación de resultados
▪ Revisar el proceso
▪ Establecimiento de los siguientes pasos o acciones
Despliegue (Explotar utilidad de los modelos, integrándolos en las tareas de toma
de decisiones de la organización)
▪ Planificación de despliegue
▪ Planificación de la monitorización y del mantenimiento
▪ Generación de informe final
▪ Revisión del proyecto
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

4. Proceso de evaluación de la estrategia de implementación.

Los 3 tipos de análisis: descriptivo, predictivo y prescriptivo.

Con el análisis descriptivo se podría utilizar un análisis semántico para conocer las
palabras o textos que más impactan.
Con la analítica predictiva se podrán generar pronósticos de ventas, conocer las
tendencias y poder adelantarse al mercado.

La analítica prescriptiva servirá para mejorar la planificación con el análisis de


escenarios y tendencias.

Se recomiendan los siguientes KPI’s


KPIs de ventas
Los principales indicadores que se usan en ventas son:

• Cuotas de mercado
• Ratios de cierre- Porcentajes de conversiones
• Retención de clientes
• Ticket medio
• Ventas por día

KPI´s de marketing

Marketing comparte indicadores con ventas, pues en cierta medida la actividad de


marketing consiste en mejorar las ventas:
• Porcentajes de conversión
• Trafico de visitas/clientes
• Gastos por cliente (lead)

KPI´s de evaluación

La evaluación y percepción del cliente son una nueva métrica:


• Average Rating - Promedio de la clasificación del libro
• Classification - Clasificación General del libro
• Rating - Nivel de clasificación del libro
• User Id - Identificador del cliente/usuario que clasifico un libro
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

5. Buenas prácticas a utilizar para lograr la estrategia descrita.

Se proponen las siguientes buenas prácticas para dar seguimiento a la estrategia


descrita:

5.1. Tome decisiones:


Los equipos directivos se concentran en los indicadores que están mal, pero no
toman decisiones, no cambian la estrategia y/o no generan una acción correctiva
para el manejo de estos comportamientos, y obvian a los indicadores que van por
buen camino de los cuales se podría obtener una buena estrategia de manejo.
Revisar concienzudamente las buenas prácticas originadas desde un indicador con
un buen rendimiento y replicarlas en sus otros indicadores.

Medir con los indicadores.


• Recursos: Como talento humano, presupuesto, planta y equipos.
• Cargas de trabajo: como estadísticas y metas que se tenga para un periodo de
tiempo determinado y el tiempo y número de personas requeridas para realizar una
actividad.
• Resultados: Como ciudadanos atendidos, oficios respondidos, ejecución del
cronograma.
• Impacto: De los productos y/o servicios, tales como enfermedades prevenidas,
impuestos recolectados, niveles de seguridad alcanzados.
• Productividad: como solicitudes atendidas por profesionales, solicitudes procesadas
por persona.
• Satisfacción del usuario: como el número de quejas recibidas, resultados de las
encuestas, utilización de procesos participativos.
• Calidad y Oportunidad del producto y/o servicio: como tiempo de respuesta al
usuario, capacidad para acceder a una instancia, racionalización de trámites.

5.2. Seguimiento:
Es importante que dentro del seguimiento de los indicadores, (para este caso en el
sistema Suite Visión Empresarial) se incluyan comentarios que lleven a generar un
plan o una mejora. Independiente de lo que mida realizar el seguimiento del
indicador para hacer más eficiente la gestión.
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

5.3. Definir qué tipo de indicadores se quieren medir:

Con frecuencia escuchamos hablar de los indicadores de economía, eficacia,


eficiencia. Manejarlo de la manera más sencilla posible tipificando los indicadores
de modo que los reportes sean mucho más claros y que el sistema de gestión este
muy bien definido.

5.4. Tener en cuenta las condiciones básicas de un indicador:

Normalmente se definen a partir de una metodología que por sus siglas en ingles
se conoce como SMART, en tal sentido los indicadores tienen que ser específicos,
medibles, alcanzables, tener relevancia y contar con un límite de tiempo para
ejecutarlos.

5.5. Tenga bien definido el temporizador de su indicador:

Para el caso de Suite Visión Empresarial, es importante que haga revisión de los
temporizadores de su indicador, pues puede que los datos que usted espera recibir
quincenalmente se estén originando algunas semanas después, lo que origina
atrasos en los reportes de información, por eso es importante que tenga en cuenta
que el dato debe ser reportado de manera constante y a tiempo para que se puedan
tomar decisiones a tiempo.
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

5.6. Realizar con frecuencia estas preguntas claves:

Independiente del momento en el que se encuentren sus indicadores, haga una


revisión constante de los mismos teniendo en cuenta:
• ¿Qué debemos medir realmente? No llene su sistema de información y a su equipo
de trabajo con miles de indicadores, analice si realmente los indicadores que usted
tiene son los que necesita en su compañía o área.
• ¿Dónde es conveniente medirlo? ¿A qué nivel va a medirlo? A nivel estratégico,
táctico, operativo.
• ¿Cuándo hay que medir? ¿En qué momento o con qué frecuencia? Si mi indicador
es mensual, garantice que los datos aparecerán mensualmente en su sistema de
información. Cumpla con la frecuencia de medición.
• ¿Quién debe medir? Quien será la persona que se encargará de ese dato,
ingresando los datos a tiempo.
• ¿Cómo lo voy a medir? Se medirá manualmente con una persona ingresando el
dato, haré un consulta por base de datos o realizaré una fórmula matemática para
conocer el dato.
• ¿Cómo se van a difundir los resultados? Hay sistemas de gestión muy robustos,
con personas muy capaces para manejarlos, sin embargo estos suelen quedarse
guardados en el olvido. Comunique los resultados a su equipo de trabajo
reflejándolo a través de su herramienta software.
• ¿Quién y con qué frecuencia va a revisar y/o auditar el sistema de obtención de
datos? Muchas veces pasa que las personas tienen la información pero la persona
que lo revisa dice que ese no es el dato. Es importante que la información que
suministre sea válida ya que se encuentra en juego la credibilidad de su información.
Revise con frecuencia los datos y garantice que sean reales.
Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

6. Justificación de la estrategia de implementación.

La estrategia que se propone con la metodología CRISP-DM, es una estrategia

probada y de alta aceptación, además, permite la iteración que nos permitiría

incrementar el número de KPI’s para mejorar las estimaciones y necesidades del

estudio mediante la ciencia de datos.


Jorge Alberto Godinez Garcia
Guadalajara, Jalisco, México

7. Conclusiones.

Con los resultados de la ciencia de datos, se pueden tomar decisiones con

evidencia que permitirán disminuir los riesgos con decisiones de manera intuitiva y

aumentar las probabilidades de considerar y en especial el prescriptivo, que nos

permite analizar la sensibilidad al modelo propuesto para generar las estrategias

adecuadas en las nuevas y novedosas implementaciones.

También podría gustarte