Está en la página 1de 11

Inteligencia de Negocios

Grupo: E4
Caso de estudio de
Rapidminer
Ascencio Herrera Irving David
Almazn Flores Jos Moroni
Duarte Fuentes Emmanuel

Investigacion rapid Miner


Rapid Miner, Software Business Intelligence
Historia
RapidMiner , anteriormente conocido como YALE (Sin embargo, otro entorno de
aprendizaje), se desarroll a partir de 2001 por Ralf Klinkenberg, Ingo mierswa, y
Simon Fischer en la Unidad de Inteligencia Artificial de la Universidad Tcnica de
Dortmund . A partir de 2006, su desarrollo fue impulsado por la rpida-I, una
empresa fundada por Ingo mierswa y Ralf Klinkenberg en el mismo ao. en 2007,
el nombre del software se cambi de Yale para RapidMiner. En 2013, la compaa
marc de nuevo desde Rapid-I a RapidMiner.

Descripcin
RapidMiner utiliza un cliente / servidor de modelo con el servidor ofrece
como software como servicio o en infraestructuras de nube.
De acuerdo con Bloor Research, RapidMiner proporciona el 99% de una solucin
analtica avanzada a travs de los marcos basados en plantillas que la velocidad
de entrega y reducir los errores en casi eliminando la necesidad de escribir
cdigo. RapidMiner
ofrece la
minera
de
datos y aprendizaje
automtico procedimientos incluyendo: carga y transformacin de datos
( extraccin, transformacin, carga (ETL)), pre-procesamiento y visualizacin de
datos,
anlisis
predictivo
y
modelos
estadsticos,
evaluacin
y
despliegue. RapidMiner est escrito en el lenguaje de programacin
Java. RapidMiner proporciona una interfaz grfica de usuario para disear y
ejecutar los flujos de trabajo de anlisis. Esos flujos de trabajo se denominan
"proceso" en RapidMiner y consisten en mltiples "Operadores". Cada operador
est llevando a cabo una nica tarea dentro del proceso y la salida de cada
operador se forma la entrada de la siguiente. Como alternativa, el motor se puede
llamar desde otros programas o se utiliza como un API. Las funciones individuales
se pueden llamar desde la lnea de comandos. RapidMiner proporciona el
aprendizaje de esquemas, modelos y algoritmos y se puede ampliar
usando R y Python scripts.
RapidMiner funcionalidad se puede ampliar con plugins adicionales que estn
disponibles a travs de RapidMiner mercado. El RapidMiner mercado ofrece una
plataforma para que los desarrolladores puedan crear algoritmos de anlisis de
datos y publicarlos en la comunidad.
Con la versin 7.0, RapidMiner incluye cambios a sus obteniendo materiales
iniciadas, una interfaz de usuario actualizada y mejoras en sus capacidades de
preparacin de datos.

Adopcin
En 2016, Gartner Research coloca RapidMiner en el cuadrante de lderes de su
Cuadrante Mgico de Advanced Analytics. El informe pone de relieve "sabidura de
las multitudes" orientacin de RapidMiner para los prximos pasos recomendados
en un proceso de anlisis predictivo, adems de facilidad de uso general. En los
2014 y 2013 KDnuggets encuesta anual de software clasific RapidMiner el ms
popular software de anlisis de datos con los de la encuesta los encuestados que
citan el paquete de software como la herramienta que utilizan. RapidMiner
recibido uno de los ndices de satisfaccin ms fuertes de la Encuesta Miner
Rexer Analytics de datos de 2011. RapidMiner ha recibido ms de 3 millones de
descargas
totales
y
tiene
ms
de
250.000
usuarios
incluyendo eBay , Intel , PepsiCo y Kraft
Foods como
el
pago
de
los
clientes. RapidMiner afirma ser el lder del mercado en el software de anlisis de
datos
predictivos
servicios
contra
competidores
como Revolucin
Analytics , SAS , Predixion Software , SQL Server , StatSoft y IBM .

Desarrollador
Cerca de 50 desarrolladores de todo el mundo participan en el desarrollo de la
RapidMiner de cdigo abierto con la mayora de los contribuyentes que son
empleados de RapidMiner. La empresa que desarrolla RapidMiner recibi un $ 16
de millones de la Serie C financiacin con la participacin de empresas de capital
riesgo Nokia Growth Partners, Ascenso Venture Partners, Longworth Venture
Partners, Earlybird capital de riesgo y capital ocano abierto. Abrir socio
Ocano Michael "Monty" Widenius es uno de los fundadores de MySQL.

Qu es Rapid Miner?
Rapid Miner es una herramienta de Business Inteligence (Inteligencia de
Negocios) que proporciona un entorno integrado de aprendizaje automtico para
la Minera de Datos, se utiliza para aplicaciones de negocios, para la investigacin,
educacin, formacin, creacin de prototipos y desarrollo de aplicaciones; es
compatible con todos los pasos del proceso de minera de datos.

Ventana diseo en el entorno de trabajo de Rapid Miner

RapidMiner utiliza un cliente / servidor de modelo con el servidor se ofreci como


software como servicio o en infraestructuras de nube.Segn Bloor
Research, RapidMiner proporciona el 99% de una solucin analtica avanzada a
travs de marcos basados en plantillas que aceleran la entrega y reducen los
errores sin la necesidad de escribir cdigo. RapidMiner ofrece la minera de datos
y procedimientos de aprendizaje automtico que incluye:

Carga y transformacin de datos (extraccin, transformacin, carga ETL)


Pre-procesamiento de datos y visualizacin
Anlisis predictivo y modelos estadsticos

Evaluacin y despliegue
Cerca de 50 desarrolladores de todo el mundo participan en el desarrollo
de RapidMiner de cdigo abierto con la mayora de los contribuyentes que son
empleados de RapidMiner. La empresa que desarrolladora recientemente se
cambi su nombre de Rapid-I a RapidMiner y recibi 5.000.000 dlares de
financiacin con la participacin de las empresas europeas de capital de. La
empresa afirm que la financiacin se utilizar para construir los equipos de
desarrollo y comercializacin.

Tabla Resmen Informacin de Rapid Miner

Desarrollador

RapidMiner

Versin inicial

2006; Hace 9 aos

ltima versin estable

6.1 / 08 de octubre 2014; Hace 4 meses

Sistema operativo

Multiplataforma

Tipo

El anlisis estadstico, minera de datos, anlisis predictivo

Licencia

AGPL / Propietaria

Sitio web

rapidminer .com

Versiones de Rapid Miner


En 2001, fue creadoRapidMinerpor Ralf Klinkenberg, Ingo mierswa y Simon
Fischer en la Unidad de Inteligencia Artificial de la Universidad Tcnica de
Dortmund.
En 2006, su desarrollo fue impulsado por rpida-i, una empresa fundada por Ingo
mierswa y Ralf Klinkenberg en el mismo ao.
En 2007, el nombre del software fue cambiado de YALE a RapidMiner y la
empresa Rpido-I GmbH fue incorporada.

Rapid-I Co-Founder and CBDO Ralf Klinkenberg with co-worker Anna Szot and
Dr. Simon Fischer

Con la versin 6.0, RapidMiner comenz a ofrecer nuevos asistentes para


aplicaciones dirigidas a las necesidades de negocio de los analistas para el
anlisis predictivo. La versin Starter Edition est disponible para su descarga
gratuita, un Personal Edition se ofrece por US $ 999, una edicin profesional es $
2999 y los precios de la Enterprise Edition estn disponibles desde el
desarrollador.

Cmo Funciona Rapid Miner?


RapidMiner est escrito en el lenguaje de programacin Java, proporciona una
interfaz grfica para disear y ejecutar flujos de trabajo de anlisis. Esos flujos de
trabajo se llaman "Proceso" y stos consisten en mltiples "Operadores".

En
Rapid
Miner
Mltiples Operadores.

se

trabaja

con Procsos que

pueden

contener

Rapid Miner proporciona esquemas y modelos y algoritmos de aprendizaje Weka y


R scripts que se pueden utilizar a travs de extensiones. Se puede ampliar con
plugins adicionales. El mercado Extensiones proporciona una plataforma para los
desarrolladores para crear algoritmos de anlisis de datos y publicarlos en la
comunidad. Rapid Miner se distribuye bajo la AGPL licencia de cdigo abierto y ha
sido organizada por SourceForge.

Caractersticas
Desarrollado en Java.
Multiplataforma.
Representacin interna de los procesos de anlisis de datos en ficheros XML.
Permite el desarrollo de programas a travs de un lenguaje de script.

Puede usarse de diversas maneras:


A travs de un GUI.
En lnea de comandos.
En batch (lotes).
Desde otros programas a travs de llamadas a sus bibliotecas.
Extensible.
Incluye grficos y herramientas de visualizacin de datos.
Dispone de un mdulo de integracin con R.

La herramienta cuenta con dos componentes:


RapidMiner Studio: Versin stand-alone para analistas. Implementa todos los
operadores de data mining, modelos predictivos, modelos descriptivos,
transformacin de datos, series de tiempo, etc.
RapidMiner Server: Versin Servidor de RapidMiner. Permite trabajo colaborativo,
escalable y concurrente mltiples usuarios, capacidad de delegar en bases de
datos (In-Database Mining) y otras mejoras de funcionalidad como: plataforma
Web de publicacin de reportes, implementacin de sistemas de scoring, diseo y
navegacin Web de de Reportes, Single-sign on, integracin va Servicios Web,
entre otras.

http://www.postecnologia.com/2015/03/rapid-miner-software-businessintelligence.html
Guido Deutsch, " RapidMiner de Rapid-I en el CeBIT 2010 ," Blog de minera de
datos , 18 de marzo, 2010.

rbol de decisiones.
En este caso de estudio realizara la creacin de un rbol de decisin con RapidMiner
versin 7.0 a partir de la informacin de alguna base de datos.
Lo primero que debe realizar es buscar la base de datos a usar que para este caso se
llama golf-testset. Para ubicarla debe ir a la pestaa repository y seleccionar
//Samples/data /Golf-Testset una vez que la selecciono debe arrastrarla a la zona de
trabajo quedando como lo muestra la imagen 1

Imagen 1

Lo que a continuacin realizara es seleccionar el operador de rbol de decisin


para lo cual en la barra de la izquierda donde dice operators debe escribir tree y
seleccionar el operador Decision Tree para despus arrastrarlo al rea de trabajo.
Todo esto como lo muestra la imagen 2.

Imagen 2

Enseguida debe conectar la base de datos con el rbol de decisin y este al


resultado, para hacer esto debe dar clic en out de la base de datos y arrastrar al
rbol, lo mismo con el rbol solo que debe dar clic en mod y arrstralo a donde
dice res en el rea de trabajo. Debe quedar como lo muestra la imagen 3

Imagen 3

Para poder visualizar los resultados debe dar clic al botn run e inmediatamente
debe mostrar el rbol de decisin como lo muestra la imagen 4

Imagen 4

El rbol de decisin quedo creado y ahora para ver los resultados en una tabla
sobre si se debe realizar o no la actividad debe dar doble cilc a la base de datos
Golf-Testset para que arroje los resultados como los de la imagen 5

Imagen 5

Listo su rbol de decisin quedo terminado y ahora ya puede ver los resultados
que este arroja.