Está en la página 1de 10

Daniel Perez Solis

02/06/2016

CONECTAR WEKA
CON MYSQL
Para poder realizar esta conexin de Weka a MySQL.
Necesitas tener instalado:Software de base de datos
( MySQL), el conector MySQL de Java e instalar Weka.

Contenido
Qu es weka?.................................................................................................... 1
Descripcin......................................................................................................... 1
Razones a favor de Weka.................................................................................... 2
La interfaz del usuario........................................................................................ 2
Simple CLI........................................................................................................ 2
Explorer........................................................................................................... 3
Experimenter................................................................................................... 4
Knowledge Flow............................................................................................... 4
Archivo arf........................................................................................................... 4
Conexin de weka con mysql.............................................................................. 4
Comprobar.......................................................................................................... 6
Conclusin.......................................................................................................... 9

Qu es weka?
Weka (Waikato Environment for Knowledge Analysis, en espaol entorno para
anlisis del conocimiento de la Universidad de Waikato) es una plataforma
de software para el aprendizaje automtico y la minera de datos escrito en Java y
desarrollado en la Universidad de Waikato. Weka es software libre distribuido bajo
la licencia GNU-GPL.

Descripcin
El paquete Weka contiene una coleccin de herramientas de visualizacin
y algoritmos para anlisis de datos y modelado predictivo, unidos a una interfaz
grfica de usuariopara acceder fcilmente a sus funcionalidades. La versin
original

de

Weka

fue

un front-end en TCL/TK para

modelar

algoritmos

implementados en otros lenguajes de programacin, ms unas utilidades para pre


procesamiento de datos desarrolladas en C para hacer experimentos de
aprendizaje automtico. Esta versin original se dise inicialmente como
herramienta para analizar datos procedentes del dominio de la agricultura, pero la
versin ms reciente basada en Java (WEKA 3), que empez a desarrollarse en

1997, se utiliza en muchas y muy diferentes reas, en particular con finalidades


docentes y de investigacin.

Razones a favor de Weka


Los puntos fuertes de Weka son:

Est disponible libremente bajo la licencia pblica general de GNU.

Es muy portable porque est completamente implementado en Java y


puede correr en casi cualquier plataforma.

Contiene una extensa coleccin de tcnicas para preprocesamiento de


datos y modelado.

Es fcil de utilizar por un principiante gracias a su interfaz grfica de


usuario.

Weka soporta varias tareas estndar de minera de datos, especialmente,


preprocesamiento de datos, clustering, clasificacin, regresin, visualizacin, y
seleccin. Todas las tcnicas de Weka se fundamentan en la asuncin de que los
datos estn disponibles en un fichero plano (flat file) o una relacin, en la que cada
registro de datos est descrito por un nmero fijo de atributos (normalmente
numricos o nominales, aunque tambin se soportan otros tipos). Weka tambin
proporciona acceso a bases de datos va SQLgracias a la conexin JDBC (Java
Database Connectivity) y puede procesar el resultado devuelto por una consulta
hecha a la base de datos. No puede realizar minera de datos multi-relacional,
pero existen aplicaciones que pueden convertir una coleccin de tablas
relacionadas de una base de datos en una nica tabla que ya puede ser
procesada con Weka.

La interfaz del usuario


Al ejecutar la aplicacin nos aparece el selector de interfaz de Weka (Weka GUI
Chooser) que da la opcin de seleccionar entre cuatro posibles interfaces de
2

usuario para acceder a las funcionalidades del programa, stas son "Simple CLI",
"Explorer", "Experimenter" y "Knowledge Flow".

Simple CLI
Simple CLI es la abreviatura de Simple Command-Line Interface (interfaz simple
de lnea de comandos). Se trata de una consola que permite acceder a todas las
opciones de Weka desde lnea de comandos.

Explorer
La interfaz Explorer (Explorador) dispone de varios paneles que dan acceso a los
componentes principales del banco de trabajo:

El panel "Preprocess" dispone de opciones para importar datos de


una base de datos, de un fichero CSV, etc., y para preprocesar estos
datos utilizando los denominados algoritmos de filtrado. Estos filtros se
pueden utilizar para transformar los datos (por ejemplo convirtiendo
datos numricos en valores discretos) y para eliminar registros o
atributos segn ciertos criterios previamente especificados.

El

panel

"Classify"

permite

al

usuario

aplicar

algoritmos

de clasificacin estadstica y anlisis de regresin a los conjuntos de


datos resultantes. Tambin permite estimar la exactitud del modelo
predictivo resultante, mediante curvas ROC, etc. Finalmente, tiene
utilidades para visualizar el propio modelo, en aquellos casos en que
esto sea posible, como por ejemplo un rbol de decisin.

El

panel

"Associate"

proporciona

acceso

las reglas

de

asociacin aprendidas que intentan identificar todas las interrelaciones


importantes entre los atributos de los datos.

El

panel

"Cluster"

da

acceso

las

tcnicas

de clustering o agrupamiento de Weka como por ejemplo el algoritmo K3

means. Este es slo una implementacin del algoritmo expectacinmaximizacin para aprender una mezcla de distribuciones normales.

El panel "Selected attributes" proporciona algoritmos para identificar los


atributos ms predictivos en un conjunto de datos.

El panel "Visualize" muestra una matriz de puntos dispersos (scatterplot)


donde cada punto individual puede seleccionarse y agrandarse para ser
analizados en detalle usando varios operadores de seleccin.

Experimenter
La interfaz Experimenter (experimentador) permite la comparacin sistemtica
de una ejecucin de los algoritmos predictivos de Weka sobre una coleccin de
conjuntos de datos.

Knowledge Flow
Knowledge Flow (flujo de conocimiento) es una interfaz que en esencia
implementa las mismas funciones que Explorer, y adems permite "arrastrar y
soltar". Tambin puede ofrecer aprendizaje incremental .

Archivo arf
@relation becas
@attribute
@attribute
@attribute
@attribute
@attribute
@attribute
@attribute

'Gasto ' numeric


Casado {S,No}
Coche {No,S}
Alq/Prop {Alquiler,Prop}
Beca {No,S}
Semestre numeric
Sexo {H,M}

@data
300,S,No,Propia,No,6,H
400,S,S,Alquiler,No,7,M
500,No,S,Alquiler,No,2,H
600,No,No,Propia,S,4,M
700,S,No,Alquiler,S,10,M

Conexin de weka con mysql


Como primer paso debemos de crear la base de datos en este caso ser una
llamada becas y su respectiva tabla alumnos.

Para poder conectar Weka con MySQL, ocuparemos el conector de MySQL (.jar), este
archivo lo copiaremos en el directorio de Weka en mi caso est en C:\Program
Files\Weka-3-8.

Despus editaremos el fichero de Weka, llamado RunWeka.ini (este archivo lo


puedes abrir con un editor de texto, y ejecutar como administrador o bien darle los
permiso a la carpeta donde se encuentra el archivo para poderlo editar) y aadir la
ruta del conector.
En la ltima lnea llamada cp=%CLASSPATH%, aadiremos la ruta del conector.

Comprobar

Abrimos weka y seleccionamos la ventana de Explorer

Une vez que estemos en esa ventana le damos clic en open DB

Estando ah aparecer la URL donde esta guardada la base de datos que haba
sido creada anteriormente damos clic en la opcin de usuario y pedir que
ingresemos el usuario y la contrasea con la que dicho usuario entra a mysql
6

Realiza una consulta, en este caso se hizo la consulta a la tabla alumnos ya antes creada,
para observar los registros que ya se insertaron.

En esta imagen, podemos visualizar el nmero de instancias, atributos, graficas de


cada uno de nuestros atributos

Primero tendremos que elegir el clasificador, en choose, arriba a la izquierda


(actualmente est seleccionado ZeroR, nosotros elegiremos el J48). Debajo de
choose, podemos elegir las opciones de test, nosotros usaremos use training
set, porque nos permite utilizar todos los registros cargados en Weka y ah
podremos observar la cantidad de clousters que le agregamos y pues las
respectivas variables.

En el rbol se muestra si se dar o no la beca a los alumnos que este caso estn
casados siendo factor los datos proporcionados anteriormente cuando se
ingresaron en la tabla alumnos

Conclusin
Bueno en lo particular pues no saba que estos dos programas se podan conectar
entre si y pues para ser el primer ejercicio que realizo de esta manera se me ha
hecho algo llamativo ya que pues se hace de una manera similar a la que se lleva
a cabo en mysql.