Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2018 203 1405 1 PB AnalisisAvcola RevistaAlternativas
2018 203 1405 1 PB AnalisisAvcola RevistaAlternativas
net/publication/335414074
CITATION READS
1 987
4 authors, including:
J.P.N. Vicuña
Universidad Técnica de Machala
7 PUBLICATIONS 17 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Sistema de Telemetría Multipropósito, basado en WSN (red de sensores inalámbricos) para la Internet de las cosas (IoT) View project
All content following this page was uploaded by Bertha Mazon-Olivo on 27 August 2019.
RESUMEN ABSTRACT
Las organizaciones siempre están buscando el mejoramiento u optimización The organizations are always looking for the improvement or optimization
de sus procesos para ofertar productos o servicios de calidad que satisfagan of their processes to offer products or services of quality that satisfy their
a sus clientes; y en consecuencia, lograr mayor rentabilidad y beneficio. En clients, and consequently, to achieve greater profitability and profit. At
la actualidad, la Ciencia de Datos (DS), la Inteligencia de Negocios (BI) y la present, Data Science (DS), Business Intelligence (BI) and Data Mining (DM)
Minería de Datos (DM) son disciplinas que se centran en el análisis de datos are disciplines that focus on data analysis for decision making. The purpose
para la toma de decisiones. El propósito de este trabajo es la implementa- of this work is the implementation of a BI and DM solution in a web environ-
ción de una solución de BI y DM en ambiente web, enfocada en el análisis de ment, focused on the analysis of the key performance indicators (KPIs) of
los indicadores claves de desempeño (KPI's) de los procesos de producción the production and sales processes of a poultry company located in Pasaje -
y ventas de una empresa avícola ubicada en el cantón Pasaje - El Oro - El Oro - Ecuador. The web application called IncuAnalytic was implemented
Ecuador. La aplicación web denominada IncuAnalytic fue implementada according to the Cross Industry Standard Process for Data Mining (CRISP-
según la metodología Cross Industry Standard Process for Data Mining DM) methodology and through the use of tools such as Postgres SQL for
(CRISP-DM) y mediante la utilización de las herramientas como Postgres the DW, Pentaho BI Server for Online Analytical Processing (OLAP) and the
SQL para el data warehouse (DW), Pentaho BI Server para el Procesamiento design of a dashboard, the R language and the Shiny framework for the
Analítico en Línea (OLAP) y el diseño de un tablero de control (dashboard), implementation of predictive models with regression techniques and time
el lenguaje R y el framework Shiny para la implementación de los modelos series. The results are evident in IncuAnalytic, a tool that uses a dynamic
predictivos con técnicas de regresión y series temporales. Los resultados se and historical data, and that transforms the complexity of the techniques of
evidencian en IncuAnalytic, una herramienta que utiliza una data dinámica data analysis to the administrator or owner of the company, allowing him
e histórica, y que transparenta la complejidad de las técnicas de análisis to obtain in a timely manner updated information of his KPIs or simply to do
de datos al administrador o dueño de la empresa; permitiéndole obtener de predictions that guide decision making.
manera oportuna información actualizada de sus KPI's o simplemente hacer
predicciones que orienten la toma de decisiones.
ISSN: 13T90-1915 • VOL. 19 • N.O 2 • 2018 • 80-88
PALABRAS CLAVE: Inteligencia de Negocios, Minería de Datos, regresión, KEYWORDS: Business Intelligence, Data Mining, regression, time series,
series temporales, producción avícola. poultry production.
ALTERNATIVAS
DOI: http://dx.doi.org/10.23878/alternativas.v19i2.203
RECIBIDO: 18/10/2017
80 ACEPTADO: 21/2/2018
ANÁLISIS DE PRODUCCIÓN AVÍCOLA MEDIANTE TÉCNICAS DE INTELIGENCIA DE NEGOCIOS Y MINERÍA DE DATOS
potencialmente útil y comprensible basado camente por puntos dispersos cuya tendencia
en los datos, para establecer modelos tanto por lo general es de forma lineal, polinómica
predictivos como descriptivos (Jothi et al., 2015; o logarítmica y requiere como complemento el
Kavakiotis et al., 2017). desarrollo de un análisis de correlación para la 81
MANZON-OLIVO, B. | RIVAS-ASANZA, W. | NOVILLO-VICUÑA, J. | FLORES-CABRERA, C
adecuada emisión de juicios de valor respecto CSS y JavaScript para el diseño de cubos
a la solución planteada. Las series temporales OLAP y construcción del Dashboard BI.
son colecciones de observaciones obtenidas du- Los modelos predictivos de MD fueron
rante diferentes períodos de tiempo con lo que implementados utilizando RStudio, el
permite explicar el pasado y predecir el futuro lenguaje R y el framework Shiny.
respecto a las variables objeto de estudio.
Las técnicas de DM seleccionadas fueron A continuación, se describen las etapas apli-
implementadas utilizando el IDE RStudio con cadas según la metodología CRISP-DM para el
el lenguaje R, que incluye una consola, un edi- desarrollo de la solución BI y DM:
tor y herramientas para la gestión del espacio
de trabajo. Además, se utilizó el framework a. Comprensión del negocio. La empresa
Shiny para la visualización de la información INCUPASAJE tiene como finalidad obtener
a través de un navegador web (Hermawati & Si- ingresos económicos mediante la produc-
tanggang, 2016). Shiny permite la construcción ción de aves en estado inicial, garantizan-
de aplicaciones web interactivas, consta de dos do así la solvencia del negocio. Para llevar
estructuras esenciales: un archivo server.R y el control de sus actividades, almacena re-
un archivo ui.R, para instrucciones que cons- gistros en archivos de diferentes formatos
truyen componentes R y la interfaz de usuario (.xls, .csv) y posee un SPT que utiliza como
de la aplicación respectivamente (Hermawati & base de datos a Microsoft Office Access.
Sitanggang, 2016; Siknun & Sitanggang, 2016). b. Comprensión de los datos. Se recolecta-
ron los datos necesarios y se establecieron
MATERIALES Y MÉTODOS relaciones entre ellos para el diseño y crea-
▪▪ Ubicación geográfica donde se realizó ción de un DW, cuya estructura fue de tipo
la investigación. El estudio se desarrolló copo de nieve; y en el que se especificaron
en las empresas productoras avícolas de cada una de las entidades inmersas en los
la provincia de El Oro – Ecuador; concen- procesos de producción de la empresa.
trando la recogida de la data histórica en
la empresa INCUPASAJE, que se encuentra La figura 1 presenta el diseño de DW elaborado
ubicada en el cantón Pasaje. Se realizaron a partir de las entidades de datos que posee el
1500 observaciones aproximadamente, negocio; el cual ha sido dividido en data marts
referidas a los tres últimos años de los que agrupa tablas de hechos y dimensiones.
procesos de producción y ventas. Una tabla de hechos (th) agrupa las medidas
▪▪ Tipo de investigación. Se trata de un o indicadores claves de desempeño (KPI's), y
estudio descriptivo, predictivo y aplica- las dimensiones (dim) son las perspectivas o
tivo. Se empleó la metodología CRISP- vistas de análisis de los KPI's. En la tabla 1 se
DM para el diseño e implementación de recolectan los principales KPI's identificados en
un DW, la aplicación BI (Cubos OLAP y la empresa avícola.
Dashboard) y DM (modelos predictivos
de datos). Se utilizó esta metodología de- TABLA 1. ESTRUCTURA DE UN DATA WAREHOUSE DISTRIBUIDO POR
bido a su versatilidad de aplicación tanto TEMAS DE LA EMPRESA DE PRODUCCIÓN AVÍCOLA
en BI como en DM. Crisp-DM contiene DATAMART KPI’S FÓRMULA
fases que involucran: la comprensión Número de huevos incubados Suma de huevos incubados
del negocio, de los datos y su prepara- Número de huevos perdidos Suma de huevos perdidos
Incubación
ción; así como también, la modelación Número de huevos (Número de huevos incubados -
ISSN: 13T90-1915 • VOL. 19 • N.O 2 • 2018 • 80-88
Se realizó el proceso ETL mediante Penta- Venta Total de ventas Suma de ventas realizadas
ho Data Integration y se construyó la DW Utilidad (Suma total de ventas – Suma
en el DBMS PostgresSql. Se utilizó Pen- Utilidad Total de costo)
82 taho BI Server combinando con HTML, Porcentaje de utilidad (Utilidad / Ingresos)*100
ANÁLISIS DE PRODUCCIÓN AVÍCOLA MEDIANTE TÉCNICAS DE INTELIGENCIA DE NEGOCIOS Y MINERÍA DE DATOS
dim_mano_obra
R y su paquete Shiny para interfaz web de modelos predictivos se empleó R junto con
en la presentación de estadísticas y el el framework Shiny. Se consideraron como
modelo predictivo respecto a producción algoritmos factibles para la predicción de infor-
y ventas. mación la regresión y las series temporales. 83
MANZON-OLIVO, B. | RIVAS-ASANZA, W. | NOVILLO-VICUÑA, J. | FLORES-CABRERA, C
consideró un nivel de confianza del 95% (0.95) y ventas consistió en considerar las ventas
un grado de error del 5% (0.05). totales realizadas desde el año de 2014
hasta el mes de junio del 2016, con el fin
▪▪ Series Temporales. Es una secuencia de estimar las ventas a realizarse en los
de datos que se encuentra distribuida próximos años. Para la construcción del
cronológicamente. Los intervalos de modelo se aplicó la técnica de series tem-
separación entre datos pueden ser igua- porales y se consideraron las siguientes
ALTERNATIVAS
Figura 6. Datos pronosticados de producción de aves en su etapa inicial para dos años
nido al predecir las ventas en dos años (2017 y caso de Erkollar & Oberer (2016) que se basaron
2018) en base a la técnica de series temporales. en un modelo scorecard junto con la creación
En la gráfica las líneas continuas representan y diseño de un dashboard integral definiendo
datos reales históricos y las líneas entre corta- dimensiones, KPI, métricas y marcos de tiempo
das representan la predicción. que le posibilitaran a los dueños de la empresa
Según la predicción, la empresa tendría un una mejor visualización de sus datos.
incremento en sus ventas en los próximos dos Otra de las opciones usualmente utilizadas
ALTERNATIVAS
años. Cabe recalcar, que la predicción inicia en es la aplicación de DM teniendo como ejemplo
el mes de julio del 2016 debido a que los datos al trabajo desarrollado por Reuter & Brambring
que se recopilaron son hasta el mes de junio de (2016) que emplearon métodos Bayesianos y
86 2016. de árboles de decisión para el aumento de la
ANÁLISIS DE PRODUCCIÓN AVÍCOLA MEDIANTE TÉCNICAS DE INTELIGENCIA DE NEGOCIOS Y MINERÍA DE DATOS
Hotspots Data in Peatland in Sumatra. Procedia industrial services. Procedia CIRP, 11, 99–104.
Environmental Sciences, 33, 317–323. https://doi. https://doi.org/10.1016/j.procir.2013.07.056
org/10.1016/j.proenv.2016.03.082 Ng, A. H. C., Bandaru, S., & Frantzén, M. (2016).
Jothi, N., Rashid, N. A., & Husain, W. (2015). Innovative Design and Analysis of Production
Data Mining in Healthcare - A Review. Proce- Systems by Multi-objective Optimization
dia Computer Science, 72, 306–313. https://doi. and Data Mining. Procedia CIRP (50), 665–671.
org/10.1016/j.procs.2015.12.145 https://doi.org/10.1016/j.procir.2016.04.159
Kavakiotis, I., Tsave, O., Salifoglou, A., Maglave- Reuter, C., & Brambring, F. (2016). Improving
ras, N., Vlahavas, I., & Chouvarda, I. (2017). Data Consistency in Production Control. Pro-
Machine Learning and Data Mining Methods cedia CIRP, 41, 51–56. https://doi.org/10.1016/j.
in Diabetes Research. Computational and Structu- procir.2015.12.116
ral Biotechnology Journal, 15, 104–116. https://doi. Siknun, G. P., & Sitanggang, I. S. (2016). Web-
org/10.1016/j.csbj.2016.12.005 based Classification Application for Forest
Khan, A., Ehsan, N., Mirza, E., & Zahoor, S. Fire Data Using the Shiny Framework and
(2012). Integration between Customer Rela- the C5.0 Algorithm. Procedia Environmental
tionship Management ( CRM ) and Data Ware- Sciences, 33, 332–339. https://doi.org/10.1016/j.
housing, Procedia Technology 1, 239–249. https:// proenv.2016.03.084
doi.org/10.1016/j.protcy.2012.02.050 Tokola, H., Gröger, C., Järvenpää, E., & Niemi, E.
Lindberg, C. F., Tan, S., Yan, J., & Starfelt, F. (2016). ScienceDirect Designing manufacturing
(2015). Key Performance Indicators Improve dashboards on the basis of a Key Performance
Industrial Performance. Energy Procedia, 75, Indicator survey. Procedia CIRP, 0, 619–624.
1785–1790. https://doi.org/10.1016/j.egy- https://doi.org/10.1016/j.procir.2016.11.107
pro.2015.07.474 Tutunea, M. F. (2015). Business Intelligence
Longo, A., Giacovelli, S., & Bochicchio, M. A. Solutions for Mobile Devices – An Overview.
(2014). Fact - Centered ETL: A Proposal for Procedia Economics and Finance, 27(15), 160–169.
Speeding Business Analytics up. Procedia Tech- https://doi.org/10.1016/S2212-5671(15)00985-5
nology, 16, 471–480. https://doi.org/10.1016/j. van Os, H. W. A., Herber, R., & Scholtens, B.
protcy.2014.10.114 (2014). Designing a Decision Support System
Mazon-Olivo, B., Rivas, W., Pinta, M., Mosquera, for Subsurface Activities. Procedia Environmental
A., Astudillo, L., & Gallegos, H. (2017). Das- Sciences, 22, 12–19. https://doi.org/10.1016/j.
hboard para el soporte de decisiones en una proenv.2014.11.002
empresa del sector minero. Conference Proceedings Wessiani, N. A., & Sarwoko, S. O. (2015).
- Universidad Técnica de Machala, 1, 1218–1229. Risk Analysis of Poultry Feed Production
Meier, H., Lagemann, H., Morlock, F., & Rath- Using Fuzzy FMEA. Procedia Manufacturing,
mann, C. (2013). Key performance indicators 4(IESS), 270–281. https://doi.org/10.1016/j.
for assessing the planning and delivery of promfg.2015.11.041
ISSN: 13T90-1915 • VOL. 19 • N.O 2 • 2018 • 80-88
ALTERNATIVAS
88