Está en la página 1de 33

Analítica de datos 1

Gestión de desperdicio de vidrio

Juan Carlos Valencia Osorio

Tutor de la práctica empresarial

Jader Jesús Jácome Solano

Universidad Manuela Beltrán

Práctica empresarial 2

Quito, Ecuador

2023
Analítica de datos 2

Contenido

Lista de Tablas.................................................................................................................................4
Lista de Figuras................................................................................................................................4
Introducción....................................................................................................................................5
Objetivos.........................................................................................................................................6
Objetivo General.........................................................................................................................6
Objetivos Específicos...................................................................................................................6
Justificación.....................................................................................................................................7
Diseño metodológico......................................................................................................................8
Generalidades.............................................................................................................................8
Diseño..........................................................................................................................................8
Enfoque.......................................................................................................................................8
Población.....................................................................................................................................9
Muestra y muestreo....................................................................................................................9
Técnicas de recolección de datos................................................................................................9
Instrumentos de recolección de datos........................................................................................9
Técnicas de procesamiento de datos........................................................................................10
Herramientas para el procesamiento de datos.........................................................................11
Marco Teórico...............................................................................................................................12
Definición de Big Data...............................................................................................................12
Tipos de datos...........................................................................................................................12
Datos estructurados..............................................................................................................13
Características de Big Data........................................................................................................13
Adquisición de datos.............................................................................................................14
Organización de los datos......................................................................................................15
Análisis de información.........................................................................................................15
Decisión.................................................................................................................................15
Áreas de análisis de datos.........................................................................................................15
Analítica de datos (analytics).................................................................................................16
Técnicas y Tecnologías..................................................................................................................17
Minería de datos.......................................................................................................................17
Implementación............................................................................................................................18
Analítica de datos 3

Diagrama de bloques para el desarrollo del proyecto...............................................................18


Ejecución del proyecto..............................................................................................................19
Recolección de datos (ETL)....................................................................................................19
Almacenamiento...................................................................................................................21
Técnicas de filtrado................................................................................................................21
Análisis...................................................................................................................................22
Análisis de resultados y conclusiones............................................................................................24
Dashboard resultantes..............................................................................................................24
Conclusiones..............................................................................................................................30
Bibliografía....................................................................................................................................31
Analítica de datos 4

Lista de Tablas

Tabla 1 Tipos de datos en Python..................................................................................................12

Lista de Figuras

Ilustración 1 Power BI....................................................................................................................11


Ilustración 2 Datos estructurados, semi-estructurados y no estructurados.................................13
Ilustración 3 Las 7 V del Big Data..................................................................................................14
Ilustración 4 Analytics...................................................................................................................16
Ilustración 5 Diagrama de bloques................................................................................................18
Ilustración 6 ETL............................................................................................................................20
Ilustración 7 Datawarehouse resultante.......................................................................................21
Ilustración 8 Área de filtrado del dashboard resultante............................................................24
Ilustración 9 Área de filtrado del dashboard resultante............................................................25
Ilustración 10 Grafico1 - Área de gráficos del dashboard resultante.........................................26
Ilustración 11 Grafico2 y 3 - Área de gráficos del dashboard resultante...................................26
Ilustración 12 Tarjeta de desperdicio M2, Promedio de desperdicio, Total de M2 cortados y
Total de M2 templados 27
Ilustración 13 Tarjetas de M2 en reposición interna, M2 en reposición externa y promedio de
M2 templados 28
Ilustración 14 Tabla 1 - Área de tablas del dashboard resultante..............................................29
Ilustración 15 Tabla 2 y 3 - Área de tablas del dashboard resultante........................................29
Analítica de datos 5

Introducción

El escenario ocurre en una fábrica productora de vidrio templado, la problemática nace al


necesitar 2 dashboard, primero un dashboard con información sobre analítica descriptiva que indique de
acuerdo a varios orígenes de datos cual es la cantidad de desperdicio de vidrio en un rango de tiempo
especificado, también información sobre la producción y las rupturas ocasionadas por fallos ya sea por la
maquinaria o por el proceso de templado.

Por otro lado, se necesita incluir en el dashboard información sobre analítica predictiva que
determine de acuerdo a los datos de analítica descriptiva cuales pueden ser las tendencias de acuerdo al
desperdicio y a la producción.
Analítica de datos 6

Objetivos
Objetivo General

Construir un dashboard a partir del análisis de los datos relacionados con el desperdicio de vidrio
templado, esto con la finalidad de ayudar a la toma de decisiones en la disminución del desperdicio
utilizando Power BI como herramienta de procesamiento.

Objetivos Específicos

 Diseñar el Datawarenhouse a partir de los datos obtenidos de la base de datos llamada


VerticalProduccion la cual contiene todo el proceso de producción y los datos de un
archivo de Excel el cual contiene las compras de material e inventario.
 Crear un dashboard sobre analítica descriptiva el cual determine cuál es la cantidad de
materia prima que se está desperdiciando en la fábrica productora de vidrio templado.
 Crear un dashboard con analítica predictiva aplicada al gráfico de analítica descriptiva el
cual determine cuál es la cantidad de materia prima que se puede llegar a desperdiciar y
la posible producción en la fábrica productora de vidrio templado.
Analítica de datos 7

Justificación

El presente proyecto nace como una solución a las falencias que ocurren al momento de tomar
decisiones con respecto al vidrio que se rompe en el proceso de producción, puesto que la ruptura de
vidrio es algo que sucede en una fábrica de este tipo, se pueden detectar los motivos por los cuales se
genera dicha ruptura.

Al obtener esta información se pretende que la directiva de la empresa obtenga resultados


inmediatos sobre las decisiones que se toman en un rango de tiempo, así como sus repercusiones.
Puesto que para esta fábrica es un factor importante puesto que la información determina si se pueden
obtener ganancias o pérdidas de acuerdo a la cantidad de desperdicio de vidrio.

Por otro lado, al tener dicha información la empresa puede proyectarse y puede validar la
eficacia de sus procesos e inclusive puede determinar cuál es el producto que tiene mayor ruptura para
con ello validar problemas ya sea de manejo o de maquinaria.
Analítica de datos 8

Diseño metodológico

Generalidades

Balestrini (2000) señala que el marco metodológico “es el conjunto de procedimientos a seguir
con la finalidad de lograr los objetivos de la información de forma valida y con una alta precisión” (p 44).
En otras palabras, es la estructura sistemática para la recolección, ordenamiento y análisis de
información, que permite la interpretación de los resultados en función del problema que se investiga.

Diseño

Dado que el objetivo del proyecto es el de obtener datos, analizarlos, procesarlos, mezclarlos
para posteriormente transformarlos para ser presentados al usuario en el ámbito organizacional, se
recurrió a un diseño no experimental aplicado de forma transversal, considerando que el tema de
investigación tiene sustento teórico suficiente, se procedió a realizar una investigación de tipo
descriptiva para conocer a detalle cómo se produce el desperdicio de vidrio y en que etapas del proceso
de producción ocurre este evento.

De acuerdo con Hernández, Fernández y Baptista (2003) la investigación no experimental “es la


que se realiza sin manipular deliberadamente las variables; lo que se hace en este tipo de investigación
es observar fenómenos tal y como se dan en un contexto natural, para después analizarlos” (p.270).
Estos mismos autores señalan que los diseños de investigación transversales “recolectan datos en un
solo momento, en un tiempo único. Su propósito es describir variables y analizar su incidencia e
interrelación en un momento dado” (p.289).

Enfoque

El presente trabajo está diseñado bajo el planteamiento metodológico del enfoque cuantitativo,
puesto que es el que mejor se adapta a las características y necesidades del proyecto.

El enfoque cuantitativo utiliza la recolección y el análisis de datos para contestar preguntas de


investigación y probar hipótesis establecidas previamente, y confía en “la medición numérica, el conteo y
frecuentemente en el uso de la estadística para establecer con exactitud patrones de comportamiento
en una población” (Hernández, Fernández & Baptista, 2003, p.5).

Del enfoque cuantitativo se tomarán los datos suministrados por la empresa para con ello medir
la cantidad de vidrio desperdiciado y su relación con la producción y la optimización del proceso.
Analítica de datos 9

Población

La población se define como “un conjunto de todos los elementos que estamos estudiando,
acerca de los cuales intentamos sacar conclusiones” (Levin y Ruin, 1996, p.20).

En este caso no existe población de estudio puesto que los datos son suministrados desde un
archivo de Excel y una base de datos.

Muestra y muestreo

La muestra es definida por Fortín (1999) como “un subconjunto de una población o grupo de
sujetos que forman parte de una misma población” (p.160). En ese mismo sentido, Pineda, Alvarado y
Canales (1994) señalan que es “un subconjunto de la población en que se llevara a cabo la investigación
con el fin posterior de generalizar los hallazgos del todo” (p.108).

En este trabajo se utilizará el método de muestreo probabilístico puesto que todos los datos
tienen la misma probabilidad de formar parte de la muestra.

Técnicas de recolección de datos

Falcón y Herrera (2005) se refiere a la técnica de recolección de datos como “el procedimiento o
forma particular de obtener datos o información (…) la aplicación de una técnica conduce a la obtención
de información, la cual debe ser resguardada mediante un instrumento de recolección de datos” (p. 12).

La técnica de recolección de datos que se utiliza en el proyecto presente es de seguimiento de


las transacciones.

Instrumentos de recolección de datos

Un instrumento de recolección de datos es en principio:

Cualquier recurso de que pueda valerse el investigador para acercarse a los fenómenos y extraer
de ellos información. De este modo el instrumento sintetiza en si toda la labor de la investigación,
resume los aportes del marco teórico al seleccionar datos que corresponden a los indicadores y, por lo
tanto, a las variables o conceptos utilizados. (Sabino, 1992, p.88).

El instrumento es la base de datos del software gestor de producción y un archivo de Excel el


cual contiene datos referentes a costos, optimización e inventario.

Para evaluar el desperdicio y la producción generada se necesitan 6 dimensiones para la


producción obtenidos de la base de datos MS SQL Server:
Analítica de datos 10

1. Producto
2. Metros cuadrados producidos
3. Fecha de producción
4. Es reposición interna
5. Es reposición externa

4 dimensiones para el inventario obtenidos del archivo de Excel:

1. Producto
2. Cantidad de planchas actuales
3. Metros cuadrados actuales
4. Fecha de la toma de inventario

El desperdicio de vidrio es un valor resultante de la resta entre el inventario anterior a la


producción menos la producción actual, esto debe ser evaluado por producto, queda de la siguiente
forma:

Desperdicio = Inventario antes de producción – Producción

La optimización promedio real es un valor resultante que se expresa mediante las siguientes
formulas:

Materia prima usada = cantidad de planchas después de producción - cantidad de planchas


antes de producción

Metros cuadrados producidos por plancha = Metros cuadrados producidos / Materia prima
usada

Metros cuadrados por plancha = Metros cuadrados actuales / Cantidad de planchas actuales

Si existen otros valores relacionados se pueden obtener modificando las operaciones


mencionadas anteriormente.

Técnicas de procesamiento de datos

La técnica de procesamiento de datos es la analítica descriptiva la cual consiste en un conjunto


de procedimientos que tienen por objeto presentar masas de datos por medio de tablas, gráficos y/o
medidas de resumen, y la analítica predictiva la cual es una forma de análisis avanzado que utiliza datos
nuevos e históricos para pronosticar la actividad, el comportamiento y las tendencias. Implica aplicar
técnicas de análisis estadístico, consultas analíticas y algoritmos de aprendizaje automático
automatizados a conjuntos de datos para crear modelos predictivos que otorguen un valor numérico —o
puntuación— a la probabilidad de que ocurra un evento en particular.
Analítica de datos 11

Herramientas para el procesamiento de datos

Una herramienta es un “medio físico que nos permite registrar o medir la información” (Tamayo,
2001, p.190).

Para llevar a cabo el proceso de minería de datos, muestra y análisis de resultados, y cálculo de
los resultados se usará Power BI.

Ilustración 1
Power BI

Nota: Power BI Desktop (2022). https://powerbi.microsoft.com/es-es/desktop/


Analítica de datos 12

Marco Teórico

Definición de Big Data

Los macrodatos, también llamados datos masivos, inteligencia de datos, datos a gran escala o
big data (terminología en idioma inglés utilizada comúnmente) es un término que hace referencia a
conjuntos de datos tan grandes y complejos que precisan de aplicaciones informáticas no tradicionales
de procesamiento de datos para tratarlos adecuadamente. Los datos son la reproducción simbólica de
un atributo o variable cuantitativa o cualitativa; según la RAE «Información sobre algo concreto que
permite su conocimiento exacto o sirve para deducir las consecuencias derivadas de un hecho». Por
ende, los procedimientos usados para encontrar patrones repetitivos dentro de esos datos son más
sofisticados y requieren un software especializado. En textos científicos en español, con frecuencia se
usa directamente el término en inglés big data, tal como aparece en el ensayo de Viktor Schönberger La
revolución de los datos masivos.

Tipos de datos

En ciencias de la computación, un tipo de dato informático o simplemente tipo es un atributo de


los datos que indica al ordenador (y/o al programador/programadora) sobre la clase de datos que se va a
manejar. Esto incluye imponer restricciones en los datos, como qué valores pueden tomar y qué
operaciones se pueden realizar.

Los tipos de datos más comunes son: números enteros, números con signo (negativos), números
de coma flotante (decimales), cadenas alfanuméricas (y Unicode), estados, etc.

A continuación, se resumen los principales tipos de datos en el lenguaje de programación


Python:
Tabla 1
Tipos de datos en Python

Tipo Clase Notas Ejemplo


str Cadena Inmutable "Hola"
unicode Cadena Versión Unicode de str u"Hola"
list Secuencia Mutable, contiene objetos de diverso tipo [4,"Hola",3.14]
tuple Secuencia Inmutable, contiene objetos de diverso tipo (4,"Hola",3.14)
set Conjunto Mutable, sin orden y sin duplicados set([4,"Hola",3.14])
frozenset Conjunto Inmutable, sin orden y sin duplicados frozenset([4,"Hola",3.14])
dict Diccionario Pares de clave: valor {"clave1":4, "clave2":"Hola"}
int Entero Precisión fija, convierte a long si necesario 32
long Entero Precisión arbitraria 32L o 1298918298398923L
float Decimal Coma flotante de doble precisión 3.141
complex Complejo Parte real e imaginaria (4.5 * 3j)
Analítica de datos 13

bool Booleano Valores verdadero o falso True o False

Datos estructurados
El dato estructurado es el dato que está organizado y formateado, normalmente, en una base
datos. Sigue una estructura predeterminada o un conjunto de reglas, lo que significa que esos datos son
iguales los unos de los otros. Cuanto más estructurado esté el dato, más sencillo será de procesar.
Algunos ejemplos de datos estructurados son una lista de nombres, direcciones, teléfonos, historial de
compra o seguidores de social media.
Ilustración 2
Datos estructurados, semi-estructurados y no estructurados

Nota: Fusión legendaria: Data Science + Marketing para lograr la hiperpersonalización (2022).
https://keyrus.com/sp/es/insights/fusion-legendaria-data-science-marketing-para-lograr-la-hiperpersonalizacion

¿Cuáles son los beneficios del dato estructurado?

Implementar y analizar datos estructurados ofrece múltiples beneficios a una organización, por
ejemplo:

 Analizar y extraer conclusiones de grandes cantidades de datos.


 Optimizar y automatizar los procesos manuales.
 Rastrear el dato fácilmente mediante un CRM o la base de datos del contact center.
 Los profesionales de CRM, marketing o ventas pueden utilizarlos para medir el
rendimiento, establecer objetivos y fijar áreas de mejora.

Características de Big Data


Las características más importantes del Big Data perfectamente se pueden clasificar en cuatro
magnitudes, más conocidas como las cuatro V del Big Data, relativas a volumen, variedad, velocidad y
veracidad. A estas cuatro V, podemos añadir tres más, como pueden ser la de Viabilidad y Visualización.
Pero si hablamos de V en Big Data no podemos dejar pasar la principal característica del análisis de datos
que es la V de Valor de los datos. Así pues, en los últimos artículos se empieza a hablar, ya no de las
tradicionales cuatro V de Big Data, sino de las 7 «V» del Big Data:
Analítica de datos 14

Ilustración 3
Las 7 V del Big Data

Nota: Understanding the 7 V’s of Big Data (2022).


https://bigdatapath.wordpress.com/2019/11/13/understanding-the-7-vs-of-big-data/

Adquisición de datos

La adquisición de datos tiene 2 componentes claramente definidos: el primero es la


identificación de Big Data y el segundo es la recopilación de datos en sí. Estos se determinan mediante el
análisis de las 2 formas naturales de datos: los datos nativos en formato digital y los datos nativos en
formato analógico.

La segunda fase del proceso de adquisición de datos consiste en reunir y almacenar grandes
conjuntos de los mismos. Dado que la tecnología anticuada de los Sistemas de Gestión de Bases de Datos
(SGBD) no era suficiente para la gestión de grandes cantidades de datos, se utiliza un enfoque novedoso
para la recopilación y el almacenamiento de Big Data Analytics.

Este enfoque es llamado MAD (Magnetic, Agile and Deep). Traducido al español es: Magnético,
Ágil y Profundo. Dado que la gestión de grandes datos necesita de procesamiento y almacenamiento
considerables, es imposible que la mayoría de las empresas que dependen del Big Data Analytics creen
este tipo de sistemas.
Analítica de datos 15

Organización de los datos

El Big Data normalmente procede de diversas fuentes y, puesto que se trata de volúmenes


enormes de información, hace falta descubrir estrategias y tecnologías para poder recibir los datos de
manera eficiente. En algunos casos, decenas de petabytes de información llegan al sistema de una
empresa, por lo que integrar toda esta información en un sistema es todo un reto. Es necesario recibir
los datos, procesarlos y formatearlos de la manera más adecuada para cada empresa y, de tal forma que
los clientes puedan entenderlos.

Análisis de información

Tras recibir los datos y almacenarlos, el siguiente paso es el análisis del Big Data. Los datos se
analizan y utilizan para tomar decisiones importantes, como definir la oferta de una organización según
las preferencias de los clientes. Cada organización utilizará los datos con fines distintos para sacar el
mayor provecho posible y obtener una ventaja competitiva. Y es que la inversión que el Big Data
requiere no es una broma, por lo que sus resultados deben generar valor y beneficios para los clientes y
para la propia organización.

Decisión

La toma de decisiones la realiza la organización en base a los resultados obtenidos del análisis de
información, por tal motivo es sumamente importante que los resultados sean suficientemente fiables.

Áreas de análisis de datos

Lo que hace que Big Data sea tan útil para muchas empresas es el hecho de que proporciona
respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían. En otras palabras,
proporciona un punto de referencia. Con una cantidad tan grande de información, los datos pueden ser
moldeados o probados de cualquier manera que la empresa considere adecuada. Al hacerlo, las
organizaciones son capaces de identificar los problemas de una forma más comprensible.

La recopilación de grandes cantidades de datos y la búsqueda de tendencias dentro de los datos


permiten que las empresas se muevan mucho más rápidamente, sin problemas y de manera eficiente.
También les permite eliminar las áreas problemáticas antes de que los problemas acaben con sus
beneficios o su reputación.
Analítica de datos 16

Analítica de datos (analytics)

La analítica de datos permite a las organizaciones analizar todos sus datos (en tiempo real,
históricos, no estructurados, estructurados, cualitativos) para identificar patrones y generar
conocimientos para informar y, en algunos casos, automatizar decisiones, conectando la inteligencia y la
acción. Las mejores soluciones actuales respaldan el proceso analítico de un extremo a otro, desde el
acceso, la preparación y la analítica de datos hasta la operatividad de los análisis y el seguimiento de los
resultados.
Ilustración 4
Analytics

Nota: La analítica web. ¿Qué es y para qué sirve? https://estudiocreativodigital.com/la-analitica-web-que-


es-y-para-que-sirve/

La analítica de datos permite a las organizaciones transformar digitalmente su empresa y su


cultura, volviéndose más innovadoras y con visión de futuro en la toma de decisiones. Más allá del
monitoreo y la generación de informes tradicionales de KPI para encontrar patrones ocultos en los datos,
las organizaciones potenciadas por algoritmos son los nuevos innovadores y líderes empresariales.

Al cambiar el paradigma más allá de los datos para conectar los conocimientos con la acción, las
empresas podrán crear experiencias personalizadas para los clientes, crear productos digitales
conectados, optimizar las operaciones y aumentar la productividad de los empleados.

Con la analítica colaborativa de datos, las empresas permiten que todos contribuyan al éxito
empresarial, desde ingenieros de datos y científicos de datos, hasta desarrolladores y analistas
empresariales, e incluso profesionales y líderes empresariales. La analítica colaborativa de datos también
incentiva a quienes están dentro y fuera de una organización a conectarse y colaborar. Por ejemplo, los
científicos de datos pueden trabajar en estrecha colaboración con un cliente para ayudarlo a resolver sus
problemas en tiempo real utilizando la interfaz de usuario altamente colaborativa de la analítica
moderna del mundo de hoy.

La analítica de datos impulsa a las empresas a avanzar mediante la introducción de algoritmos en


todas partes para optimizar los momentos comerciales críticos, como un cliente que ingresa a su tienda,
un equipo a punto de fallar u otros eventos que podrían significar la diferencia entre ganar o perder
negocios. La analítica de datos se aplica a todas las industrias, incluidas las de servicios financieros y
seguros, fabricación, energía, transporte, viajes y logística, atención médica y otras. La analítica de datos
Analítica de datos 17

puede ayudar a predecir y manejar interrupciones, optimizar rutas, brindar un servicio proactivo al
cliente, realizar ofertas inteligentes de venta cruzada, predecir fallas inminentes de equipos, administrar
el inventario en tiempo real, optimizar los precios y prevenir el fraude.

Técnicas y Tecnologías
Minería de datos

Como data mining, también conocida como minería de datos, se describen los procedimientos
algorítmicos para la evaluación de datos aplicados a bloques de datos con un tamaño y una complejidad
determinados. Su función es la de extraer la información oculta en grandes volúmenes de datos,
especialmente en las masas de información conocidas como big data, y además reconocer tendencias,
relaciones y patrones ocultos en ellas. Para que este proceso se pueda llevar a cabo se recurre a las data
mining tools.

Para el presente proyecto usare 2 técnicas, la primera es la asociación en la cual una transacción
y la relación entre los elementos se utilizan para identificar un patrón. En este caso particular debemos
asociar los datos de los 2 orígenes los cuales me darán como patrón el desperdicio generado de forma
semanal.

La segunda técnica que voy a usar es la agrupación o clustering la cual crea agrupaciones de
objetos significativos que comparten las mismas características puesto que el objetivo es agrupar los
datos en productos y rangos de tiempo que en nuestro caso es semanal.

Por otro lado, la agrupación me ayuda a obtener grupos de datos asociados entre el archivo de
Excel y la base de datos que es el objetivo del presente proyecto, la intención con este agrupamiento es
la de obtener en ese periodo de tiempo la cantidad de vidrio consumido y por consecuencia el
desperdicio generado en producción.
Analítica de datos 18

Implementación
Diagrama de bloques para el desarrollo del proyecto

Ilustración 5
Diagrama de bloques
Analítica de datos 19

Ejecución del proyecto

Recolección de datos (ETL)


Para el presente proyecto estoy usando Power BI, puesto que podemos realizar toda la labor de
extracción, transformación y carga desde el mismo software, la cantidad de datos obtenida al 12 de
enero del 2022 es:

 Tabla de corte 21173 registros


 Tabla de temple 21347 registros
 Hoja de facturas 90 registros
 Hoja de inventario 1255 registros

A partir de estos registros se transforman los datos y quedan como se muestra a continuación:
Analítica de datos 20

Ilustración 6
ETL
Analítica de datos 21

Almacenamiento

Ya que los datos son el Datawarehouse resultante del ETL detallo en la Ilustración 7 su resultado
se muestra en dicha ilustración.
Ilustración 7
Datawarehouse resultante

Técnicas de filtrado

En base al Datawarenhouse resultante se aplican las siguientes técnicas de filtrado:

Medidas

Se crea una tabla la cual va a contener todas las medidas de filtrado necesarias para el
dashboard, dichas medidas se aplican en la analítica predictiva y se detallan en los puntos siguientes:

1. Se crea una medida llamada “Cost M2” la cual contiene la suma de los costos
2. Se crea una medida llamada “Costo Compra” la cual multiplica el costo de compra y los
metros cuadrados comprados para obtener el valor total
3. Se crea una medida llamada “Costo Desperdicio” la cual realiza una validación del costo
máximo por producto en caso de que no encuentre un costo y lo multiplica por el
desperdicio para obtener el costo del desperdicio
4. Se crea una medida llamada “Costo Maximo” la cual obtiene el costo máximo por producto
5. Se crea una medida llamada “Desperdicio M2” la cual contiene la suma del desperdicio
6. Se crea una medida llamada “Desviacion de Desperdicio” la cual contiene la varianza del
desperdicio
7. Se crea una medida llamada “Desviacion de M2 Producidos” la cual contiene la varianza de
los M2 cortados
8. Se crea una medida llamada “Inventario Inicial” la cual contiene la suma del inventario inicial
9. Se crea una medida llamada “Inventario Final” la cual contiene la suma del inventario final
Analítica de datos 22

10. Se crea una medida llamada “M2 Comprados” la cual contiene la suma de los metros
cuadrados comprados
11. Se crea una medida llamada “M2 Corte” la cual contiene la suma de los metros cuadrados
cortados
12. Se crea una medida llamada “Promedio de Desperdicio” la cual contiene el promedio total
del desperdicio
13. Se crea una medida llamada “Promedio de Temple” la cual contiene el promedio del
producto templado
14. Se crea una medida llamada “Tasa de Crecimiento” la cual contiene la tasa de crecimiento
del desperdicio

Filtros

De acuerdo al proyecto se filtran los datos en todo el dashboard y esto aplica tanto a la analítica
descriptiva como a la analítica predictiva y se detallan en los siguientes puntos:

1. Se aplica un filtrado por año a todo el dashboard el cual puede manipular el usuario
2. Se aplica un filtrado por semana a todo el dashboard el cual puede manipular el usuario
3. Se aplica un filtrado por grupo de producto a todo el dashboard el cual puede manipular
el usuario
4. En los datos descriptivos de corte y temple se aplica un filtro por reposición externa el
cual puede manipular el usuario.

Predicción

La analítica predictiva se aplica en los gráficos de líneas para predecir el comportamiento de los
datos, dicho comportamiento se debe proyectar a 3 meses y para este fin se usa el algoritmo exponential
smooth el cual utiliza el método de suavizado exponencial de Holt-Winters para descomponer las series
temporales de cada ubicación de un cubo de espacio-tiempo en componentes estacionales y de
tendencia para pronosticar eficazmente los periodos de tiempo futuros de cada ubicación. Dicho
algoritmo toma en este caso 12 datos anteriores al final los cuales generan una salida principal a 3 meses
el cual es un mapa del periodo de tiempo predicho final, esta predicción de datos se puede apreciar en
los siguientes gráficos:

1. En el gráfico de M2 Cortados
2. En el gráfico de M2 Templados
3. En el gráfico de Desperdicio
4. En el gráfico de M2 Comprados
5. En el gráfico de Inventario Inicial

Análisis

El resultado esperado es:


Analítica de datos 23

1. Una gráfica lineal que indique cuál es el desperdicio, los metros cuadrados cortados, los
metros cuadrados templados, el inventario inicial, los metros cuadrados comprados, todo
esto tanto en un rango de tiempo de terminado y a futuro tomando 3 meses como previsión,
también se debe mostrar en el grafico la tendencia para que la persona encargada de
analizar los datos pueda tener medidas estadísticas que permitan una mejor comprensión de
los datos, adicionalmente debe tener un filtrado para poder seleccionar los productos que se
deseen evaluar, las semanas y el año.
2. Una tabla que indique de acuerdo a los productos, el desperdicio generado, el inventario
inicial, inventario final, el precio del desperdicio y la compra.
3. Una tabla que indique de acuerdo a los productos la cantidad de metros cuadrados
templados.
4. Una tabla que indique de acuerdo a los productos la cantidad de metros cuadrados cortados.
Analítica de datos 24

Análisis de resultados y conclusiones

Dashboard resultantes

Dentro del dashboard resultante tengo un área de filtrado que se muestra en la Ilustración 8 y 9,
dicha área se encarga de filtrar los datos representados en los gráficos que se muestran en la ilustración
10 y 11, dichos gráficos contienen los resultados de la analítica predictiva. Adicionalmente se cuenta con
tarjetas de resumen las cuales se muestran en la ilustración 12 y 13, y por último tengo 3 tablas con
información resultante la cual es importante para el análisis resultante de los datos, dichas tablas se
muestran en las ilustraciones 14 y 15, y son las encargadas de mostrar la analítica descriptiva asi como
también lo hacen parte de los gráficos.
Analítica de datos 25

Ilustración 8
Área de filtrado del dashboard resultante
Analítica de datos 26

Ilustración 9
Área de filtrado del dashboard resultante
Analítica de datos 27

Ilustración 10
Grafico1 - Área de gráficos del dashboard resultante

Ilustración 11
Grafico2 y 3 - Área de gráficos del dashboard resultante
Analítica de datos 28

Ilustración 12
Tarjeta de desperdicio M2, Promedio de desperdicio, Total de M2 cortados y Total de M2 templados
Analítica de datos 29

Ilustración 13
Tarjetas de M2 en reposición interna, M2 en reposición externa y promedio de M2 templados
Analítica de datos 30

Ilustración 14
Tabla 1 - Área de tablas del dashboard resultante

Ilustración 15
Tabla 2 y 3 - Área de tablas del dashboard resultante
Analítica de datos 31

Conclusiones

En conclusión, existen diversas herramientas en el mercado capaces de ayudar en el proceso de


analítica de datos, estas herramientas ahorran mucho tiempo en el proceso de transformación de los
datos a resultados que sean de valor para una empresa.

Otro punto de vital importancia consiste en comprender que las herramientas como Power Bi la
cual fue empleada en este proyecto ayudan muchísimo cuando el objetivo es transformar y analizar
grandes volúmenes de datos, aunque hay otras formas mediante las cuales podemos hacer lo mismo
cabe recalcar que si pretendemos hacerlo mediante código sql y algún lenguaje de programación que
nos ayude a realizar el filtrado podremos determinar que será mucho mas complejo el obtener los
resultados que podremos obtener con una herramienta como Power BI.

También debemos analizar que power BI ayuda muchísimo en los procesos de transformación de
datos permitiendo obtener diferencias significativas entre los datos de entrada y los datos resultantes,
adicionalmente se debe entender que al integrar una gran cantidad de algoritmos nos ayuda a obtener
resultados rápidamente, principalmente en el área de analítica predictiva la cual es mucho mas compleja
permitiendo inclusive adquirir nuevos algoritmos (de pago por lo general) para labores mas complejas y
con ello podremos tener dashboards con herramientas muy potentes para la toma de decisiones por
parte de los usuarios.
Analítica de datos 32

Bibliografía

Balestrini, M. (2000). Como se elabora un proyecto de investigación. BL Consultores Asociados.

Brandwach (28 de noviembre del 2022). Las 10 mejores herramientas gratuitas de


monitorización de redes sociales. https://www.brandwatch.com/es/blog/las-10-mejores-herramientas-
gratuitas-de-monitorizacion-de-redes-sociales/

CEUPE (28 de noviembre del 2022). Big Data Analytics ¿Cuáles son sus herramientas y
aplicaciones? https://masterbigdataceupe.com/big-data-analytics-cuales-son-sus-herramientas-y-
aplicaciones/#Datos_semiestructurados

Cognizant (28 de noviembre del 2022). Dato estructurado.


https://www.cognizant.com/es/es/glossary/structured-data

Cognizant (28 de noviembre del 2022). Dato no estructurado.


https://www.cognizant.com/es/es/glossary/unstructured-data

Conocer, Hacer y Compartir (28 de noviembre del 2022). python – tipos de datos.
https://crlpiban.wordpress.com/2017/12/07/python-tipos-de-datos/

de Canales, F. H., De Alvarado, E. L., & Pineda, E. B. (1994). Manual para el desarrollo de personal
de salud. Washington, DC, 20037.

Digital Guide IONOS (28 de noviembre del 2022). Software de data mining: realiza análisis de
datos más efectivos. https://www.ionos.es/digitalguide/online-marketing/analisis-web/software-de-
data-mining-las-mejores-herramientas/

Falcón, J., & Herrera, R. (2005). Análisis del dato Estadístico. Guía didáctica.

Fortín, M. F. (1999). El proceso de la investigación: de la concepción a la realización (Edición


original en francés 1996). McGraw-Hill.

Hernández, Fernández & Baptista (1994). Metodología de la investigación. Editorial


Panamericana

Hernández, R., Fernández, C., & Baptista, P. (2003). Metodología de la investigación. McGraw-
Hill.

Imnovation (28 de noviembre del 2022). Qué es el Big Data Analytics: la datificación de la
sociedad. https://www.imnovation-hub.com/es/transformacion-digital/que-es-el-big-data-analytics-la-
datificacion-de-la-sociedad/?_adin=02021864894

Instituto de Ingeniería del Conocimiento (28 de noviembre del 2022). Las 7 V del Big data:
Características más importantes. https://www.iic.uam.es/innovacion/big-data-caracteristicas-mas-
importantes-7-v/

Levin, R. I., Rubín, D. S., & Samaniego, A. H. F. (1996). Estadística para administradores (No. 519.5
L47Y 1994). Prentice-Hall Hispanoamericana.
Analítica de datos 33

Mailjet (28 de noviembre del 2022). Big Data: ¿Qué es, cómo funciona y por qué es importante?
https://www.mailjet.com/es/blog/marketing/big-data/#subchapter-12

Sabino, C. (1992). Planteamiento de la investigación. Quehacer Científico Ii, 23.

SproutSocial (28 de noviembre del 2022). Microblog.


https://sproutsocial.com/es/glossary/microblog/

Tamayo y Tamayo, M. (2001). El proceso de la investigación científica. Editorial Limusa.

Telefónica Tech (28 de noviembre del 2022). Datos semi-estructurados.


https://aiofthings.telefonicatech.com/recursos/datapedia/datos-semi-estructurados

TIBCO (28 de noviembre del 2022). ¿Qué es la Analítica Big Data?


https://www.tibco.com/es/reference-center/what-is-big-data-analytics

TuDashboard (28 de noviembre del 2022). Qué es un KPI: Cómo definirlo, usos y ejemplos.
https://tudashboard.com/que-es-un-kpi/

Unir (28 de noviembre del 2022). Arquitectura Big Data: ¿en qué consiste y para qué se utiliza?
https://www.unir.net/ingenieria/revista/arquitectura-big-data/

Wikipedia (28 de noviembre del 2022). BigTable. https://es.wikipedia.org/wiki/BigTable

Wikipedia (28 de noviembre del 2022). Google File System


https://es.wikipedia.org/wiki/Google_File_System

Wikipedia (28 de noviembre del 2022). Macrodatos. https://es.wikipedia.org/wiki/Macrodatos

Wikipedia (28 de noviembre del 2022). Tipo de dato. https://es.wikipedia.org/wiki/Tipo_de_dato

También podría gustarte