Está en la página 1de 12

12 Minera de Datos Reglas de asociacin.

Objetivos:

Genera reportes a partir de tcnicas de Data Mining.


Utiliza software de Data Mining.

Recursos:

Guas prcticas.
Datos ejemplo.
http://rapidminer.com

http://www.karpetas.com/almacen1/comestibles.rar

Introduccin
En la actualidad uno de los usos ms importantes de las bases de datos es en la aplicacin
del uso de tcnicas de minera de datos, con los cuales cualquier empresa o institucin
puede obtener resultados importantes para la toma de decisiones.
Como este es un tema muy amplio y complejo, lo que veremos es el uso de una aplicacin
RapidMiner, el cual proporciona un entorno muy bueno de pruebas y adems tiene una
versin de cdigo abierto.

Ejemplo de Aplicacin
Realizaremos un ejemplo basado en Reglas de Asociacin para cual iniciaremos, creando
una carpeta con el nombre comestibles y guardaremos ah el archivo que contiene la
data el cual es extensin csv y puede obtenerse en la siguiente direccin:
http://www.karpetas.com/almacen1/comestibles.rar (recuerda descomprimirlo) , y el
programa Rapid Miner el cual ya esta instalado en su computadora, al entrar al programa
puede que les pida crear un directorio de trabajo, sino es as, la aplicacin tendr la
siguiente apariencia.

Para crear nuestro ejemplo, seleccionaremos file y posteriormente New Process segn
muestra la siguiente figura:

Al seleccionar esta opcin la aplicacin nos presentara un lienzo en el que podremos trabajar en
base a una data, y a la unin de operadores, la aplicacin aparecer como la siguiente figura.

OPERADOR 1 Read CSV


Ahora vamos seleccionar nuestro primer operador el cual ser Read CSV, para localizar este
operador entre los ms de 300 operadores, usaremos el buscador de operadores y digitaremos
read y cual nos mostrara todas las coincidencias.

Para ocupar el operador tenemos dos formas de hacerlo, ya sea tomando y arrastrando el
operador hacia el lienzo o dndole doble clic.

Una vez colocado el operador, lo primeros que haremos es borrar la lnea que conecta a nuestro
operador con el lado derecho del lienzo, para hacer esto, seleccionamos la lnea y presionamos
suprimir, ahora vamos a usar los datos de prueba, y ocuparemos la parte derecha de la aplicacin
que donde esta los parmetros de cada operador, y seleccionaremos la opcin Import
Configuration Wizard como lo muestra la siguiente figura.

Recuerde en que carpeta descomprimi el archivos de datos, pues tendr que llamar al archivo
comestibles.csv, como lo muestra la siguiente figura.

Una vez seleccionado el archivo, presionaremos Next para continuar con la configuracin del
modelo, y nos presentara la siguiente pantalla.

Verificamos que la pantalla tenga la configuracin correcta, no se debe de cambiar los datos de
esta, porque el ejemplo se ha configurado de tal forma, pero en futuros caso puede ser necesario
modificar algn parmetro, dependiendo de cmo estos sean obtenidos.
Ahora presionaremos Next y nos presentara la siguiente pantalla.

Esta pantalla confirmara la informacin que se incorporara al modelo, para continuar presiono
Next.

La ltima pantalla nos permite configurar todava an ms la data que importamos, para terminar
este proceso presionaremos Finish.
Una vez importado los datos, me aparecer en el lienzo el operador, solamente con un circulo
amarrillo y debo de configurar la parte derecha con los datos tal y como aparecen en la siguiente
figura.

OPERADOR 2 Set Role


Realizo el mismo proceso con el operador 1, lo busco y al encontrarlo, presiono doble clic o lo
arrastro al lienzo, este proceso dejara unidos los dos operadores con una lnea, pero tambin el
operador con 2 con el lado derecho del lienzo es importare borrar esta lnea, seleccionndola y
presionando suprimir, al final el modelo se vera de la siguiente manera.

Ahora debemos de configurar los parametros de del operador, los cuales estan a la derecha de la
aplicacin, los cuales deben de quedar de siguiente forma.

Lo que hacemos es decirle que la columna Cdigo no debe ser tomada en cuenta pues
solamente representa al id de un comprador, y estamos listos para el operador 3.

OPERADOR 3 Numerical to Binominal


Ahora agregaremos otro operador al modelo, lo buscaremos y lo incorporaremos al lienzo, es
importante siempre recordar el borrar la lnea que une al operador a la parte derecho del lienzo, la
unin entre operador 2 y 3 ser automtica, es importante ver que el operador 2 tiene 2 salidas, el
lienzo nos quedara de la siguiente forma.

En la parte de los parmetros no se cambiara ninguna seleccin por lo cual debe de quedar de la
siguiente manera.

OPERADOR 4 Numerical to Binominal


El siguiente operador es el Numerical to Binominal, para agregarlo hacemos como los anteriores
los buscamos y lo incorporamos al lienzo, y como en los otros casos borramos la lnea del operador
con la parte derecha del lienzo y nos queda como la siguiente figura.

Ahora configuramos los parmetros del operador, y estos datos deben de quedar con la siguiente
figura.

La lnea de unin se realizara en forma automtica, ahora solo nos falta incorporar el ultimo
operador.

OPERADOR 5 Create Association Rules


De la misma forma en que hemos agregado los dems operadores, agregaremos el ltimo, que es
Create Association Rules el cual nos servir para configurar que reglas y que valores
necesitamos que aplique el modelo.
En este operador SI dejaros la lnea que conecta el operador con la parte derecha del lienzo, para
que pueda generar resultados segn nuestras condiciones. El lienzo completo se vera de esta
forma.

Y debemos tambin configurar los parmetros, y realizaremos una prueba con la siguiente
configuracin

EJECUTAR EL MODELO
Para que se realice todo el proceso, ejecutamos el modelo presionando el icono de Play azul, el
cual nos servir para tener los datos disponibles, tambin ocuparemos los iconos de libreta de
apuntes que servir para regresar al modelo, y el icono de presentacin que servir para ir al
modelo.

La primera vez que lo corramos nos pedir que lo guardemos, a lo cual accederemos, y nos pedir
en que repositorio lo alojaremos, si el repositorio no est a la vista usemos el que tenemos por
default.
El nombre que usaremos para este ejemplo es: reglas_asociacion_ejemplo, pero puede usar otro
nombre, la informacin debe estar colocada con la pantalla siguiente.

Despues nos preguntara si queremos cerrar procesos viejos antes de empezar, responderemos
Yes.

Este proceso nos mostrara el siguiente resultado.

Es muy difcil en una gua mostrar todos los resultados, entonces debemos de experimentar
utilizando las opciones de la parte izquierda, seleccionando valores, cambiando criterios, o
cambiando el valor mnimo del criterio, esto nos puede generar muchas opciones y resultados,
adems debemos de analizar los datos de la lista.

Otra opcin viable para mostrar resultados es Graph View a donde podemos ver las relaciones
de un producto con otros, su soporte, su ganancia y ms, tambin podemos filtrar resultados
usando los controles de la parte izquierda, este es un ejemplo del resultado.

Y por ltimo tambin puede utilizar la opcin Text View y me generara una lista, de productos
con la relacin y valor de estas.

Este es un proceso para realizar reglas de asociacin, puede ser utilizado para la toma de
decisiones, este proceso es muy utilizado en la actualidad, el programa genera dos archivos.

Como ejercicio cambia los parmetros del operador Create Association Rules y genera nuevos
resultados, para ver el cambio de los datos.
Es importante el anlisis de los resultados, adems de la elaboracin del modelo, pues a partir de
la forma de construirlo se obtendrn datos tiles o no, tambin, investiga para que sirve cada
operador.