Está en la página 1de 3

Asignatura Datos del estudiante Fecha

Apellidos:
Sistemas Expertos
Nombre:

Actividades

Trabajo: Construcción de un árbol de decisión mediante


RapidMiner y análisis del modelo, Bayes, Histogramas,

Esta actividad tiene como objetivo tomar un primer contacto con la herramienta
RapidMiner aplicando técnicas de árbol de decisión sobre un conjunto de datos, y
comprendiendo la visualización en árbol mostrada por RapidMiner.

Los pasos a seguir son los siguientes:

1. Descarga e instala RapidMiner en tu ordenador. El software está disponible en


la sección de descargas de la página oficial de RapidMiner:

2. RapidMiner permite el trabajo con datasets o conjuntos de datos, para esta


actividad se debe abrir el archivo iris.cvs–

3. Una vez abierto el archivo con un editor de texto podrás ver en comentarios
quién es el creador de ese conjunto de datos, publicaciones en las que ha sido
utilizado y otra información relevante.

4. A continuación ejecuta el Explorer de RapidMiner y abrir el archivo iris.cvs.

5. Copia la salida obtenida tras la ejecución del algoritmo en el paso previo y


pégala antes del informe que incluye tus respuestas a esta actividad.

En esta actividad debes entregar un informe que incluya la salida obtenida al ejecutar el
algoritmo C4.5 y que responda a las preguntas 1 a 7 expuestas a continuación

El informe, sin contar con la salida proporcionada por RapidMiner, tendrá


una extensión máxima de 4 páginas (Georgia 11, interlineado, 1,5).
Asignatura Datos del estudiante Fecha
Apellidos:
Sistemas Expertos
Nombre:

Pregunta 1: Describe los datos del problema indicando:

Número de clases indicando que representan dichas clases y el tipo de valor que
toman.
Número de instancias en total.
Número de instancias pertenecientes a cada clase.
Número de atributos de entrada, su significado y tipo.
¿Hay algún valor de atributo desconocido?

Pregunta 3: Dibuja el árbol resultante de ejecutar con RapidMiner en el paso 6.

Pregunta 4: Una instancia nueva con los siguientes valores de atributos, según el
árbol de decisión generado, ¿en qué clase se clasificaría? Indica cómo has efectuado la
clasificación de la instancia.

Petalwidth= 1.6 cm
Petallength= 4 cm
Sepalwidth= 3.4 cm
Sepallength= 6 cm

Pregunta 5: ¿Qué significan los números que RapidMiner muestra entre paréntesis
junto a los nombres de las clases en las hojas del árbol generado?

Pregunta 6: De acuerdo al resumen de resultados de la validación cruzada con 10


iteraciones, que es una medida de los errores que se esperarían si se aplicara un
conjunto de datos de prueba independiente, ¿se puede considerar que el árbol generado
en el paso 6 (utilizando el conjunto completo de datos de entrenamiento) es optimista
respecto a la precisión en la predicción? ¿Por qué?

Pregunta 7: De acuerdo a la matriz de confusión obtenida, de las instancias que


pertenecen a la clase Iris-setosa, ¿cuántas de ellas son clasificadas correctamente como
Asignatura Datos del estudiante Fecha
Apellidos:
Sistemas Expertos
Nombre:

de esa clase? ¿Cuántas son incorrectamente clasificadas y en qué clase son


incorrectamente clasificadas?

También podría gustarte