Está en la página 1de 2

Trabajo: Construcción de un árbol de decisión mediante Weka y

análisis del modelo

Esta actividad tiene como objetivo tomar un primer contacto con la herramienta Weka
aplicando técnicas de árbol de decisión sobre un conjunto de datos, y comprendiendo la
visualización en árbol mostrada por Weka.

Los pasos a seguir son los siguientes:

1. Descárgate e instala Weka en tu ordenador. El software está disponible en la


sección de descargas de la página oficial de Weka:

http://www.cs.waikato.ac.nz/ml/weka/downloading.html

2. Weka trae consigo una serie de datasets o conjuntos de datos por defecto. Estos
están disponibles en la carpeta /data incluida en el directorio raíz de Weka creado
en la instalación del software. Abre el fichero iris.arff que se encuentra en dicha
carpeta con un editor de texto.

3. Una vez abierto el fichero con un editor de texto podrás ver en comentarios
quién es el creador de ese conjunto de datos, publicaciones en las que ha sido
utilizado y otra información relevante.

4. A continuación ejecuta el Explorer de Weka y abre el fichero iris.arff.

5. Trata de ejecutar el algoritmo ID3 (desde la pestaña Classify).

6. Ejecuta el algoritmo C4.5 (algoritmo denominado J48 en Weka) con las


opciones por defecto: factor de confianza igual a 0.25, validación cruzada de 10
iteraciones y un mínimo número de instancias requerido en una hoja igual a 2.

7. Copia la salida obtenida tras la ejecución del algoritmo en el paso previo y


pégala antes del informe que incluye tus respuestas a esta actividad.

En esta actividad debes entregar un informe que incluya la salida obtenida al ejecutar el
algoritmo C4.5 y que responda a las preguntas 1 a 7 expuestas a continuación

TEMA 2 –Actividades © Universidad Internacional de La Rioja (UNIR)


Pregunta 1: Describe los datos del problema indicando:

Número de clases indicando qué representan dichas clases y el tipo de valor que
toman.
Número de instancias en total.
Número de instancias pertenecientes a cada clase.
Número de atributos de entrada, su significado y tipo.
¿Hay algún valor de atributo desconocido?

Pregunta 2: ¿Por qué crees que no se puede seleccionar el clasificador ID3?

Pregunta 3: Dibuja el árbol resultante de ejecutar el algoritmo C4.5 con Weka en el


paso 6.

Pregunta 4: Una instancia nueva con los siguientes valores de atributos, según el
árbol de decisión generado, ¿en qué clase se clasificaría? Indica cómo has efectuado la
clasificación de la instancia.

Petalwidth= 1.6 cm
Petallength= 4 cm
Sepalwidth= 3.4 cm
Sepallength= 6 cm

Pregunta 5: ¿Qué significan los números que Weka muestra entre paréntesis junto a
los nombres de las clases en las hojas del árbol generado?

Pregunta 6: De acuerdo al resumen de resultados de la validación cruzada con 10


iteraciones, que es una medida de los errores que se esperarían si se aplicara un
conjunto de datos de prueba independiente, ¿se puede considerar que el árbol generado
en el paso 6 (utilizando el conjunto completo de datos de entrenamiento) es optimista
respecto a la precisión en la predicción? ¿Por qué?

Pregunta 7: De acuerdo a la matriz de confusión obtenida, de las instancias que


pertenecen a la clase Iris-setosa, ¿cuántas de ellas son clasificadas correctamente como
de esa clase? ¿Cuántas son incorrectamente clasificadas y en qué clase son
incorrectamente clasificadas?

TEMA 2 –Actividades © Universidad Internacional de La Rioja (UNIR)

También podría gustarte