Está en la página 1de 10

FACULTAD DE INGENIERÍA

ESCUELA PROFESIONAL DE INGENIERIA

ARTÍCULO DE OPINIÓN

“COMPARACION DE LAS HERRAMIENTAS DE MINERIA DE DATOS


EN MEDIO DE PANTALLA BISUITE CONTRA RAPIDMINER”

Autores:

Davila Chegne Ricardo

Gutierrez arias Lenin

Luna capaquira angelica milagros

Sotelo Samaniego Roberto

Asesor:

Dr. Carlos Ernesto Ruiz Huidobro Marro

Lima, Perú

2019
COMPARACIÓN DE LAS HERRAMIENTAS MINERÍA DE DATOS EN MEDIO
DE PANTALLA BISUITE CONTRA RAPIDMINER

I. INTRODUCCIÓN

Bussiness Intelligence o Inteligencia de Negocios es el proceso en el cual se analiza y


exploran los datos, datos que se convertirán en información y futuramente en conocimiento,
conocimiento que ayudará a la toma de decisiones en las empresas. Pentaho BI Suite y
RapidMiner son dos softwares libres orientados a Inteligencia de Negocios, estos
programas resultan beneficios para la toma de decisiones en base a información, puesto que
la realidad es que los directivos de las empresas cada vez tienen más información y menos
tiempo para analizarla lo que conlleva que sea aún más difícil tomar una decisión, decisión
que influirá negativa o positivamente en la organización. ​La encuesta realizada en 2014 por
KDnuggets, revista virtual tecnológica, cuya temática fue software de análisis y minería de
datos fue que “Con más de 3.000 mineros de datos participando en la decimoquinta
encuesta anual de software de KDnuggets, RapidMiner continúa liderando […]
RapidMiner, 44.2% de participación (39.2% en 2013)” ​lo que lo convierte en el software
libre por excelencia a pesar de contar con un lenguaje sofisticado, mientras que Pentaho BI
Suite ofrece facilidad de uso en procesos ETL (extraer, transformar y cargar).

La comparación entre Pentaho BI Suite y RapidMiner brinda la oportunidad de


identificar fortalezas y debilidades y, mirando a otros, pensar en la manera de optimizar el
proceso actual y que ello se refleje en la implementación de herramientas que pueden faltar
en algunos de los programas. El objetivo del artículo de opinión es informar sobre las
comparaciones de los programas Pentaho BI Suite y RapidMiner para que finalmente el
lector elija la mejor opción ha aplicar en la minería de datos. A partir de ello, podría surgir
la pregunta: ¿Cuáles son las diferencias entre los programas Pentaho BI Suite y
RapidMiner?
II. OPINIÓN

Desde nuestro punto de vista , la diferencia principal radica en la dificultad de uso, porque
mientras Pentaho BI Suite resulta intuitivo, RapidMiner es más complejo de usar y por
ende su uso es complicado para un usuario sin experiencia en la utilización de este tipo de
programas, fuera de eso, detectamos que RapidMiner a diferencia de Pentaho BI Suite
cuenta en sus características con un módulo de integración con R y aplicación de modelos
bayesianos mientras que Pentaho BI Suite cuenta con procesamiento analítico en línea
(OLAP) y dashboards intuitivos, por lo cual la utilización de software orientado a BI resulta
indispensable ya que el aprovechamiento de la información generada en las empresas.

Así como Pentaho BI Suite o RapidMiner, ya que este tipo de software asiste
finalmente al análisis y la presentación de los datos, por eso es que las organizaciones no
deben dudar en contar con personal dedicado a la minería de datos, puesto que será
beneficioso para la empresa tanto para la toma de decisiones y competir en el mercado
aunque el módulo de integración con R y aplicación de modelos bayesianos en RapidMiner
resulta oportuno para el cálculo basado en la estadística ya que los modelos bayesianos
permiten hacer cálculos en base a porcentajes y R, lenguaje de programación, permite la
codificación de esta lógica a lenguaje máquina siendo de esta manera reconocible por el
computador.

El procesamiento analítico en línea (OLAP) en Pentaho BI Suite hace que el


programa cargue, calcule y muestre los datos de manera más rápida, puesto que la manera
de operar de OLAP es que ubica los datos de la base de datos en cubos multidimensionales,
para que los datos puedan almacenarse físicamente en un vector multidimensional, la
utilización de OLAP resulta en el incremento de la capacidad a la hora de procesar grandes
volúmenes de información reduciendo así el tiempo en la obtención de respuestas mejor
indicado Dashboards en Pentaho BI Suite asiste a la toma de decisiones de manera directa,
puesto que los dashboards son representaciones de las principales métricas que afectan a un
negocio.

Por lo que en estas representaciones se presentan los datos en información que


resulta útil en la orientación de una estrategia, de la misma forma los dashboards o tableros
de control están diseñadas de manera que la visualización del contenido sea eficaz para
facilitar la toma de decisiones, decisiones que afectarán positiva o negativamente en la
organización de hecho los programas orientados a Inteligencia de Negocios son los
encargados de realizar la minería de datos, asistiendo de esta manera con información útil
para la toma de decisiones; puesto que sin la utilización de estos software tendríamos
muchos datos que se perderían porque no hay una herramienta con que analizarla.

III. ARGUMENTACIÓN

Los programas orientados a Inteligencia de Negocios son los encargados de realizar la


minería de datos, asistiendo de esta manera con información útil para la toma de decisiones;
puesto que sin la utilización de estos softwares tendríamos muchos datos que se perderían
porque no hay una herramienta con que analizarla. De esta manera Méndez (2018)
identifica ventajas como: Según Millán, René, Estrada Saavedra, Marco.

[Mejoramiento de la competitividad] incrementando los ingresos y reduciendo


los costes: el BI permite alcanzar este objetivo facilitando una visión integral y
oportuna de la información que posibilita la toma de las mejores decisiones.
[Gestión de la complejidad] ya que gracias al BI las compañías pueden
organizar y analizar sus datos y descubrir así patrones de comportamiento y
tendencia (p. 5)

De lo mencionado, se observa que la utilización de software orientado a BI resulta un


aliado al momento de tomar decisiones puesto que convierte los datos generados por la
empresa en información relevante, de manera que sea eficaz al momento de leer, y así el
tomador de decisiones pueda elegir la estrategia adecuada asimismo nos permitirá obtener
un motivo de una adecuada investigación.

RapidMiner de por sí ya es un programa personalizable, pero al contar con un módulo


que permita la utilización del lenguaje de programación R hace que esta característica
(personalizable) pueda explotarse hasta donde el usuario quiera, puesto que el límite estará
en la capacidad y en la creatividad de la persona encargada a programar. De este modo
Paradis (2017) nos presenta a R de la siguiente manera: Según López Inga, Milton Elvis
Guerrero Huaranga, Ricardo Martín.

R posee muchas funciones para análisis estadísticos y gráficos; estos últimos


pueden ser visualizados de manera inmediata en su propia ventana y ser
guardados en varios formatos (jpg, png, pdf; los formatos disponibles
dependen del sistema operativo). Los resultados de análisis estadísticos se
muestran en la pantalla, y algunos resultados intermedios.

Como se observó, el modulo de R en RapidMiner es compatible con distintos


sistemas operativos, a la vez el resultado de la utilización de R (programa) se puede adaptar
a varios formatos y trabajar en distintos tiempos fomentando así el desarrollo en el área de
minería de datos, por otro lado, cuenta con la función “bucle” que permitirá automatizar los
procesos y así trabajar con cantidades mayores de información.

El manejo de información de una organización para la toma de decisiones no es fácil,


más aún el tipo de datos que se maneja y presenta no siempre son números o cadenas de
texto, ya que podemos, y lo haremos, trabajar con porcentajes que resultaran en
probabilidades, es por esto que la aplicación del Teorema de Bayes resulta idónea para el
operar de estos datos. De esta manera Scotto y Garcés (2018) mencionan sobre el teorema
de Bayes lo siguiente:

Estas probabilidades reflejan la probabilidad posterior del procedimiento. Por


lo tanto, en el contexto de los contrastes de hipótesis, se puede afirmar que el
resultado de la inferencia bayesiana no es la aceptación o rechazo de las
hipótesis, pero sí la alteración de la credibilidad que es atribuida a cada una de
ellas. (p.1)

Por lo expresado se comprueba que la utilización del Teorema de Bayes a través de la


inferencia de la misma es más fáciles e informativas, a pesar de no brindar respuestas
absolutas puesto que se trabaja con probabilidades, sin embargo, el hecho de brindar como
resultado respuestas directas de las problemáticas desarrolladas por el investigador
(tomador de decisiones) resulta eficaz.

El proceso analítico en línea resulta al implementarse, en un atributo pasivo de la base


de datos, base de datos en donde se almacenarán por registros, información resultante para
la organización y resulta pasivo porque una vez implementado, sin necesidad de realizar
mantenimiento adicional, habrá una mejora de velocidad en la obtención de la información.
Es así que Rico y Rosado (2017) mencionan:

El procesamiento analítico en línea permite obtener acceso a datos


organizados y agregados de orígenes de datos empresariales, organiza
subconjuntos de datos con una estructura multidimensional de manera que
represente un significado especial o responda a una pregunta en particular.
Estas herramientas soportan el análisis interactivo de la información de
resumen. (p.323)

De esta manera se evidencia que la rapidez de la carga de datos depende de la


estructura en la que están organizados internamente los datos, de bases de datos comunes y
corrientes a bases de datos multidimensionales en donde la rapidez es una característica
pasiva, así es como trabaja OLAP. Es necesaria una lectura rápida y eficaz en la
visualización de la información en cualquier empresa ya sea para la toma de decisiones con
el fin de elegir estrategias o gestionar la organización, esta lectura eficaz se puede dar.

Rapidminer permite a los usuarios entregar resultados, ya sean creados, entregados,


mantenidos y actualizados; Con una gran interfaz y una interfaz gráfica. Ofrece soporte de
scripting en varios idiomas para la conveniencia del usuario. Con RapidMiner, los datos
limpios, desorganizados y aparentemente inútiles se vuelven muy valiosos. El sistema
simplifica el acceso y el administrador de datos, permitiéndole acceder, cargar y evaluar
todo tipo de datos, incluidos textos, imágenes y pistas de audio. De esta manera Su'ud,
Zaki(2017) menciona lo siguiente.

RapidMiner is a centralized solution that presents a very powerful


and robust graphical user interface that allows users to create, deliver
and maintain predictive analytics. In addition to allowing users to
create highly advanced workflows, RapidMiner offers scripting
support in several languages. (p306).

Con este programa, las empresas y sus usuarios que lo utilizan tendrán una gran
ventaja porque rapidminer nos enseña que los datos más insignificantes son los datos útiles
que sirven a la empresa y el programa lo hace conocido como que anteriormente se tomó
como algo sin interés. RapidMiner Te permite tener tu camino con tus datos. El software
es tan poderoso que puede proporcionar análisis basados en configuraciones de
transformación de datos de la vida real.

Pentaho es un programa que permite al usuario obtener resultados rápidamente sin


perder el tiempo que las empresas pueden usar para los siguientes propósitos: integración
de datos, análisis de negocios, big data, análisis integrado, análisis de la nube y análisis de
Internet de las cosas. diseñado para ayudar a las empresas de cualquier industria a obtener
valor de sus datos, incluido IoT (Internet of Things) y big data. Esto les permite funcionar
de manera más eficiente, reducir el riesgo, brindar un servicio excepcional y encontrar
nuevas fuentes de ingresos. Según Olaru, Adrian(2018).

RapidMiner is a centralized solution that presents a very powerful


and robust graphical user interface that allows users to create, deliver
and maintain predictive analytics. In addition to allowing users to
create highly advanced workflows, RapidMiner offers scripting
support in several languages. (P135).

Pentaho es una plataforma robusta de datos y análisis que ofrece una serie de
ventajas para las empresas que desean más datos: las visualizaciones potentes y completas
permiten a los usuarios ver los datos con claridad y ampliar la información y otros detalles
importantes más allá de las estadísticas. Obtenga un análisis en tiempo real de la
información a través del almacenamiento en caché de datos en memoria. Ejecute el control
total con paneles de control de arrastrar y soltar interactivos y personalizables en la web y
una biblioteca llena de funciones de filtro.

Una ventaja de tener el programa pentaho que beneficia a la empresa a tener la


información clara y detallada para que el usuario lo visualice sin problemas. El software de
integración de datos permite a los usuarios combinar información obtenida de otros grupos
de información, como NoSQL, Hadoop, bases de datos relacionales y bases de datos
analíticas. Pentaho ofrecen un análisis profundo de los datos. Es asi que Chen,
Wenzhe(2017) dicen lo siguiente.

Commercial users can benefit from the intuitive features of the


Pentaho interactive web-based access and reporting wizard. The
software provides a solid data federation and integration for
developers. Access and integrate a range of data types from Hadoop to
Excel. Interactive visual analysis tools. (p.138)

Los usuarios comerciales pueden beneficiarse de las funciones intuitivas del asistente
de acceso y presentación de informes interactivos basados ​en la web de Pentaho. El
software proporciona una sólida federación de datos e integración para
desarrolladores. Accede e integra una gama de tipos de datos desde Hadoop a Excel. Las
herramientas interactivas de análisis visual permiten a los tomadores de decisiones extraer
datos para obtener información detallada. Pentaho proporciona una vasta biblioteca de
visualizaciones interactivas para encontrar anomalías y patrones que incluyen gráficos de
dispersión / burbuja, rejillas de calor y geo-mapeo.

IV. CONCLUSIONES

En conclusión, RapidMiner y Pentaho BI Suite son programas orientados a Inteligencia de


Negocios, y, por ende, estos programas se especializan en: carga, procesamiento y
visualización de los datos, realizando así la minería de datos; siendo que finalmente de este
modo, como cualquier como cualquier otro programa orientado a BI, termina asistiendo la
toma de decisiones en una organización.
Actualmente la utilización de RapidMiner, Pentaho BI Suite o cualquier otro programa
parecido, resulta una ventaja en cuanto a toma de decisiones; pero en un futuro las
empresas se darán cuenta de esto y todos tendrán la misma ventaja, pero como ya vimos
RapidMiner cuenta con un módulo de integración con R, es entonces que, en ese entorno
habrá variedad, y ahí es donde estará la diferencia de cada empresa.

REFERENCIAS BIBLIOGRÁFICAS

● Lázaro J​.​ Innovation Cuban Experiences and Perspectives in Terms of the


Teaching-Learning Process of ICTs in Economics, Accounting, Administration,
Auditing and Finances.[en linea] Cuba,Universidad Agraria ​de​ La Habana, p48-63.
16p. 2018, ISSN:0257-4314

● · Orozco, E. «Preguntas y Respuestas sobre la Inteligencia Empresarial». [En


línea]:

http://eds.a.ebscohost.com/eds/detail/detail?vid=10&sid=48b9857f-7acf-4d8d-8c68-441d19
e3a1c0%40sdc-v-sessmgr01&bdata=Jmxhbmc9ZXMmc2l0ZT1lZHMtbGl2ZQ%3d%3d#
db=edsgii&AN=edsgcl.568009277 [Consultado Mayo 2018]

● ¿Qué es la Inteligencia de Negocios? [En línea]:


http://eds.a.ebscohost.com/eds/detail/detail?vid=9&sid=48b9857f-7acf-4d8d-8c68-4
41d19e3a1c0%40sdc-v-sessmgr01&bdata=Jmxhbmc9ZXMmc2l0ZT1lZHMtbGl2Z
Q%3d%3d#db=fua&AN=129479377. [Consultado Mayo 2018]

● ​INFORMATION TECHNOLOGY AT CALIFORNIA STATE UNIVERSITY.


Definition Business Intelligence – Competitive Intelligence Portal. Data Warehouse
Glossary. Monterrey Bay. [En línea]:
http://eds.a.ebscohost.com/eds/detail/detail?vid=13&sid=48b9857f-7acf-4d8d-8c68-
441d19e3a1c0%40sdc-v-sessmgr01&bdata=Jmxhbmc9ZXMmc2l0ZT1lZHMtbGl2
ZQ%3d%3d#db=edselp&AN=S0149197007001278 [Consultado Mayo 2018].

También podría gustarte