Está en la página 1de 6

Universidad Nacional de Loja

rea de la Energa, las Industrias y los


Recursos Naturales no Renovables

Inteligencia Articial

MINERIA DE DATOS

Jhymer Martnez, Erika Masache

Ingeniera en Sistemas (10o Mdulo)

Loja - 3 de julio de 2014

1.

ALGORITMOS PARA MINERA DE DATOS


UTILIZANDO WEKA

Existen algoritmos diseados para realizar clasicaciones en minera de datos, algunos de los cuales son OneR, ZeroR, J48, etc, de los cuales Se analizarn
ZeroR y Ridor aplicados en un ejemplo.
1.1.

Algoritmo ZerorR

Este es uno de los ms primitivos clasicadores, si las clases son categricas


predice la predominante, o en caso de ser clases numricas la promedia, segn
estudios de Witten y Frank (2000). Este es muy usado como punto de comparacin para comprobar la efectividad de otros algoritmos.[2]
Caractersticas:
Cuando la clase es numrica se predice la media cuando la clase es nominal
se predice la moda (el valor ms frecuente.
sirve como base para comparar con otros mtodo.
Si un mtodo es peor que este, posiblemente haya sobreajuste.
1.2.

Algoritmo Ridor

Ridor abrevia a RIpple-DOwn Rule. Este algoritmo genera una regla por
defecto que se ajuste a la mayora de los ejemplos de entrenamiento y luego
busca excepciones con la menor tasa de error al clasicar los propios ejemplos
de entrenamiento. A continuacin genera las excepciones a las excepciones con
menos error, de manera recursiva. As, lleva a cabo una expansin de excepciones en forma de rbol donde la raz est formada por la regla por defecto.
Las excepciones son un conjunto de reglas que predicen las clases que no contempla la regla por defecto. IREP una implementacin de Ridor y es el algoritmo
empleado para encontrar excepciones. ste construye las reglas aadiendo un
trmino al antecedente en cada iteracin de tal forma que el error se minimice.
Los trminos del antecedente son de la forma (atributo signo valor). [2]
1.3.

Ejemplo

Para el siguiente ejemplo se han creado 2 archivos .ar sobre las condiciones
necesarias para jugar un partido de tenis. La nica diferencia entre los archivos
es que uno de ellos se agrega el atributo de si jugar o no.
Para descargar la librera de WEKA bamos a la siguiente direccin: http://
www.cs.waikato.ac.nz/ml/weka/downloading.html. Como adicional se utiliz el siguiente programa http://publicacioneshenry.wordpress.com/2011/
05/11/weka-with-data-mining-done-in-java/ para realizar la lectura de los
archivos.

Archivo JugarTenis.ar
@relation " Jugar Tenis "
@attribute
@attribute
@attribute
@attribute

vista { soleado , nublado , lluvioso }


temperature { Alta , Media , Baja }
humedad { Alta , Normal }
windy { TRUE , FALSE }

@data
soleado , Alta , Alta , FALSE
soleado , Alta , Alta , TRUE
nublado , Alta , Alta , FALSE
lluvioso , Media , Alta , FALSE
lluvioso , Baja , Normal , FALSE
lluvioso , Baja , Normal , TRUE
nublado , Baja , Normal , TRUE
soleado , Media , Alta , FALSE
soleado , Baja , Normal , FALSE
lluvioso , Media , Normal , TRUE
soleado , Media , Normal , TRUE
nublado , Baja , Alta , TRUE
nublado , Alta , Normal , FALSE
lluvioso , Media , Alta , TRUE

Utilizando el algoritmo ZeroR

Figura 1: Algoritmo ZeroR

Utilizando el algoritmo Ridor

Figura 2: Algoritmo Ridor


Ahora con el siguiente archivo:

Archivo JugarTenisCompleto.ar
@relation " Jugar Tenis Completo "
@attribute
@attribute
@attribute
@attribute
@attribute

vista { soleado , nublado , lluvioso }


temperature { Alta , Media , Baja }
humedad { Alta , Normal }
viento { TRUE , FALSE }
jugar { SI , NO }

@data
soleado , Alta , Alta , FALSE , NO
soleado , Alta , Alta , TRUE , NO
nublado , Alta , Alta , FALSE , SI
lluvioso , Media , Alta , FALSE , SI
lluvioso , Baja , Normal , FALSE , SI
lluvioso , Baja , Normal , TRUE , NO
nublado , Baja , Normal , TRUE , SI
soleado , Media , Alta , FALSE , NO
soleado , Baja , Normal , FALSE , SI
lluvioso , Media , Normal , TRUE , SI
soleado , Media , Normal , TRUE , SI
nublado , Baja , Alta , TRUE , SI
nublado , Alta , Normal , FALSE , SI
lluvioso , Media , Alta , TRUE , NO

Utilizando el algoritmo ZeroR

Figura 3: Algoritmo ZeroR Completo


Utilizando el algoritmo Ridor

Figura 4: Algoritmo Ridor Completo

2.

Bibliografa

Referencias

[1] J. Serrano. Mtodos de Aprendizaje Automtico para el Descubrimiento de Conocimiento en Datos Mdicos sobre Arterosclerosis. Disponible en: http://www.ejbi.org/en/ejbi/article/

41-es-metodos-de-aprendizaje-automatico-para-el-descubrimiento-de-conocimiento-en-dato
html Fecha de consulta: 03-07-2014.

[2] M. Rigoberto. Aplicacin de tcnicas de minera de datos con Weka Acknowledge Explorer. Disponible en: http://innovaciontec.idict.
cu/innovacion/article/viewFile/244/245 Fecha de consulta: 03-072014.
[3] H. Angelica. Minera de datos: competencias bsicas. Disponible en:
http://inteligenciartificialudec.wikispaces.com/file/view/
TRABAJO+DE+INT+ARTFICIAL+WEKA.pdf Fecha de consulta: 03-07-2014.