Está en la página 1de 10

MATERIA

Ingeniería Del
Conocimiento

- Gpo. T82

PROFESOR

Lic. Ezequiel Alejandro


Duarte Hernández

INTEGRANTES DEL EQUIPO

Emanuel Castro Martinez


– 19251077
Tecnológico Nacional De México. Miguel Angel Contreras
Lopez
Instituto Tecnológico De Tlalnepantla.
- L19250015

Unidad 1. Tarea 3 descargar y usar Weka para Kevin Oswaldo Guerrero


crear una aplicación de minería de datos Juarez
- 19251072
Karent Dannaee Miranda
Estrada
- 19251084
David Arandith Perez Rico
- B161130277
Aylin Valencia Orta
– 19253581
Introducción
En este trabajo vamos a ver como descargar e instalar Weka, también vamos a ver
cómo aplicar una minería de datos en Weka ya que esta nos sirve para saber el
porcentaje de los datos.

Descarga de Weka

Entrar a la página oficial de Weka y descargarlo.

Ya descargado abre el archivo WEATHER_NOMINAL.ARFF para que puedas hacer


la minería de datos.
En esta imagen podemos ver como ya esta abierto el archivo y como se tiene que
ver cuando lo hayas abierto.
En la imagen también podemos ver los 5 atributos de la que consta nuestra base
de datos los cuales son apariencia del cielo, temperatura, humedad, si hace viento
o no y si se juega o no.

Cuando le damos clic a apariencia del cielos tenemos que cinco son soleados, 4
son nublados y 5 lluviosos dando un total de 14 registros
Aplicación de la minería de datos

Filtrar los datos


Lo primero que se hace es filtrar los datos, seleccionamos en choose abrimos la
carpeta de Weka, seleccionamos los supervisados que son los que ya Weka tiene
establecidos, nos vamos a atributos vamos a usar el algoritmo de discretizar
seleccionamos lo aplicamos a todos los atributos y tiene que salir así.

Y como podemos ver lo que es temperatura y humedad tienen que es todo, el


viento tiene true o false y el de jugar sigue siendo sí o no una ves que ya se
realizo el filtro lo que se hace es clasificar.

Clasificar
Nos vamos a la opción de clasificar seleccionamos el algoritmo, nos vamos a árbol
utilizamos el J48 ya que es el más común y utilizamos la opción de lise training set
ya que nos permite utilizar todos los registros que se cargaron ahora la variable va
a estar en función de jugar o no, le damos clic en start y se debe de ver así.
En la análisis del árbol nos dice que, si esta soleado no juegan 2 de 5 personas, si
es nublado entonces juegan 4 personas, pero si es lluvioso y aparte esta haciendo
viento no juegan 2 personas, pero si no está haciendo viento entonces juegan 3
personas.
La matriz de confusión nos dice que para a son las personas que si juegan y para
b son las personas que no juegan entonces nos dice que de 7 registros que se
hicieron para jugar hubo 0 errores y de 5 registros de no jugar hubo 2 errores, en
la matriz de confusión debemos de tener en cuenta que la diagonal debe de ser
mayor para que sea muy confiable.

Si lo queremos ver de forma grafica le damos clic derechos le ponemos en


visualizar se tiene que ver como en la imagen de arriba.
Cluster
Vamos a utilizar el de SimpleKMeans, usamos otra ves el modo de use training set
le damos start y se tiene que ver así.

En los Cluster nos dice que lo que más predomino fue una apariencia soleada dice
que todo temperatura, todo humedad, no hubo viento y que las personas tendían a
jugar.
En el Cluster 0 que hay diez registros nos dice que predomino la lluvia dice que
todo temperatura, todo humedad, no hubo viento y que las personas tendían a
jugar.
En el Cluster 1 que hay 4 registros nos dice que predomino fue una apariencia
soleada dice que todo temperatura, todo humedad, hubo viento y que las personas
tendían a jugar.
Asociación
Nos vamos a la pestaña de asociación le damos en el algoritmo de a priori y start
se tiene que ver así.

Nos dice que encontró 10 características que nosotros no notamos.

Selección de atributos
Nos vamos a la pestaña de selección de atributos elegimos CfsSubsetEval y en el
otro seleccionamos BestFirst le damos clic también a Use full training set la
variable va a ser jugar y le damos start, se tiene que ver así.
Visualización
Le damos clic a la pestaña de visualización en donde nos da una matriz de todos
contra todos, vamos a aumentar PointSize para tener mejor apreciación de los
puntos en la matriz se tiene que ver así.

Nos dice que los puntos azules son si y el rojo es no pero como podemos ver no
hay relación asi que lo que vamos hacer es aumentar en ruido se tiene que ver
asi.
Conclusión
En este trabajo pudimos ver como se aplica la minería de datos en un partido de
futbol ya que esto nos puede servir para otras cosas como en el marketing o en la
medicina.

Bibliografía

https://www.youtube.com/watch?v=3vebWrQ_BNc&list=WL&index=67&t=1s
https://sourceforge.net/projects/weka/

También podría gustarte