Está en la página 1de 58

Weka: Waitako Environment

for Knowledge Analysis

Introducción
Explorer

Carlos J. Alonso González


Departamento de Informática
Universidad de Valladolid
Contenidos

 Fuentes
 Introducción
 The Explorer

Introducción a Weka: explorer 2


Fuentes

El contenido de esta presentación se basa en el capítulo 10 de


I. Witten, E. Frank. Data Minig: Practical Machine Learning
tools and Techniques, Second Edition. Morgan Kaufmman,
Elsevier. San Francisco, CA, 2005. ISBN: 0 12 088407

Sitio weka: http://www.cs.waikato.ac.nz/ml/weka/

Presentación weka.ppt (descripción de todas las interfaces


gráficas de weka, por E. Franck)

Varios tutoriales, en el sitio weka


Tutorial.pdf (parte II de la obra citada)
Introducción de Alex K. Seewald
Manual en español:
http://metaemotion.com/diego.garcia.morate/download/weka.pdf

Introducción a Weka: explorer 3


Introducción

 Software para el aprendizaje automático/minería de


datos escrito en JAVA con licencia GNU.
 Principalmente investigación, educación.
 Complementa DATA MINIG, de Witten y Frank
 Características principales:
 Sistema integrado de herramientas de preprocesado de
datos, algoritmos de aprendizaje y métodos de evaluación
de algoritmos.
 Interfaces gráficas.
 Entorno para la comparación de herramientas de
aprendizaje.

Introducción a Weka: explorer 4


Ejecución

 Instalada máquina virtual


java
 Instalado weka

 java –jar weka.jar


 Aparece la ventana
selector de interfaces

Introducción a Weka: explorer 5


Selector de interfaces

Introducción a Weka: explorer 6


Introducción a Weka: explorer 7
Explorer: formato de datos ARFF
@relation heart-disease-simplified

@attribute age numeric


@attribute sex { female, male}
@attribute chest_pain_type { typ_angina, asympt, non_anginal,
atyp_angina}
@attribute cholesterol numeric
@attribute exercise_induced_angina { no, yes}
@attribute class { present, not_present}

@data
63,male,typ_angina,233,no,not_present
67,male,asympt,286,yes,present
67,male,asympt,229,yes,present
38,female,non_anginal,?,no,not_present
...

Introducción a Weka: explorer 8


Explorer: formato de datos ARFF
@relation heart-disease-simplified CABECERA

@attribute age numeric DECLARACIóN DE ATRIBUTOS


@attribute sex { female, male}
@attribute chest_pain_type { typ_angina, asympt, non_anginal,
atyp_angina}
@attribute cholesterol numeric
@attribute exercise_induced_angina { no, yes}
@attribute class { present, not_present}

@data SECCIÓN DE DATOS


63,male,typ_angina,233,no,not_present
67,male,asympt,286,yes,present
67,male,asympt,229,yes,present
38,female,non_anginal,?,no,not_present
...

Introducción a Weka: explorer 9


Explorer: preprocesado

 Se pueden importar datos en varios formatos: ARFF,


CSV, binarios...

 Herramientas de preprocesado: filters

 Filtros para: discretización, normalización, selección de


atributos, resampling,...

Introducción a Weka: explorer 10


Datos: IRIS

 Problema: determinar la clase de planta Iris: setosa,


versicolor, virginica
 Descripción de instancias: 4 atributos numéricos
1. sepal longitud en cm
2. sepal anchura en cm
3. petal longitud en cm
4. petal anchura en cm
 Nº de ejemplos: 150 (50 de cada clase)
 Dominio muy simple

Introducción a Weka: explorer 11


Archivo IRIS.ARFF

@relation iris

@attribute sepallength numeric


@attribute sepalwidth numeric
@attribute petallength numeric
@attribute petalwidth numeric
@attribute class {Iris-setosa,Iris-versicolor,Iris-virginica}

@data

5.1,3.5,1.4,0.2,Iris-setosa
4.9,3,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
....

Introducción a Weka: explorer 12


Introducción a Weka: explorer 13
Introducción a Weka: explorer 14
Introducción a Weka: explorer 15
Introducción a Weka: explorer 16
Introducción a Weka: explorer 17
Introducción a Weka: explorer 18
Introducción a Weka: explorer 19
Introducción a Weka: explorer 20
Introducción a Weka: explorer 21
Introducción a Weka: explorer 22
Introducción a Weka: explorer 23
Introducción a Weka: explorer 24
Introducción a Weka: explorer 25
Introducción a Weka: explorer 26
Introducción a Weka: explorer 27
Introducción a Weka: explorer 28
Introducción a Weka: explorer 29
Introducción a Weka: explorer 30
Introducción a Weka: explorer 31
Introducción a Weka: explorer 32
Introducción a Weka: explorer 33
Explorer: construcción de
clasificadores

 WEKA denomina clasificador a cualquier


modelo con capacidad de predecir un valor
nominal (clase discreta, clasificación) o un
valor numérico (regresión).

 Numerosos métodos básicos.


 Listas decisión, árboles decisión, reglas, PMC, SVM...
 Meta-clasificadores.
 Baggin, boosting, stacking...

Introducción a Weka: explorer 34


Introducción a Weka: explorer 35
Introducción a Weka: explorer 36
Introducción a Weka: explorer 37
Introducción a Weka: explorer 38
Introducción a Weka: explorer 39
Introducción a Weka: explorer 40
Introducción a Weka: explorer 41
Introducción a Weka: explorer 42
Introducción a Weka: explorer 43
Introducción a Weka: explorer 44
Introducción a Weka: explorer 45
Introducción a Weka: explorer 46
Introducción a Weka: explorer 47
Introducción a Weka: explorer 48
Introducción a Weka: explorer 49
Introducción a Weka: explorer 50
Introducción a Weka: explorer 51
Introducción a Weka: explorer 52
Introducción a Weka: explorer 53
Introducción a Weka: explorer 54
Introducción a Weka: explorer 55
Introducción a Weka: explorer 56
Introducción a Weka: explorer 57
Introducción a Weka: explorer 58

También podría gustarte