Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Mineria de Datos
Mineria de Datos
Ingeniería Del
Conocimiento
- Gpo. T82
PROFESOR
Descarga de Weka
Cuando le damos clic a apariencia del cielos tenemos que cinco son soleados, 4
son nublados y 5 lluviosos dando un total de 14 registros
Aplicación de la minería de datos
Clasificar
Nos vamos a la opción de clasificar seleccionamos el algoritmo, nos vamos a árbol
utilizamos el J48 ya que es el más común y utilizamos la opción de lise training set
ya que nos permite utilizar todos los registros que se cargaron ahora la variable va
a estar en función de jugar o no, le damos clic en start y se debe de ver así.
En la análisis del árbol nos dice que, si esta soleado no juegan 2 de 5 personas, si
es nublado entonces juegan 4 personas, pero si es lluvioso y aparte esta haciendo
viento no juegan 2 personas, pero si no está haciendo viento entonces juegan 3
personas.
La matriz de confusión nos dice que para a son las personas que si juegan y para
b son las personas que no juegan entonces nos dice que de 7 registros que se
hicieron para jugar hubo 0 errores y de 5 registros de no jugar hubo 2 errores, en
la matriz de confusión debemos de tener en cuenta que la diagonal debe de ser
mayor para que sea muy confiable.
En los Cluster nos dice que lo que más predomino fue una apariencia soleada dice
que todo temperatura, todo humedad, no hubo viento y que las personas tendían a
jugar.
En el Cluster 0 que hay diez registros nos dice que predomino la lluvia dice que
todo temperatura, todo humedad, no hubo viento y que las personas tendían a
jugar.
En el Cluster 1 que hay 4 registros nos dice que predomino fue una apariencia
soleada dice que todo temperatura, todo humedad, hubo viento y que las personas
tendían a jugar.
Asociación
Nos vamos a la pestaña de asociación le damos en el algoritmo de a priori y start
se tiene que ver así.
Selección de atributos
Nos vamos a la pestaña de selección de atributos elegimos CfsSubsetEval y en el
otro seleccionamos BestFirst le damos clic también a Use full training set la
variable va a ser jugar y le damos start, se tiene que ver así.
Visualización
Le damos clic a la pestaña de visualización en donde nos da una matriz de todos
contra todos, vamos a aumentar PointSize para tener mejor apreciación de los
puntos en la matriz se tiene que ver así.
Nos dice que los puntos azules son si y el rojo es no pero como podemos ver no
hay relación asi que lo que vamos hacer es aumentar en ruido se tiene que ver
asi.
Conclusión
En este trabajo pudimos ver como se aplica la minería de datos en un partido de
futbol ya que esto nos puede servir para otras cosas como en el marketing o en la
medicina.
Bibliografía
https://www.youtube.com/watch?v=3vebWrQ_BNc&list=WL&index=67&t=1s
https://sourceforge.net/projects/weka/