Está en la página 1de 12

DATA SET CLICO EQUINO

CARGUE DELA BASE DE DATOS

Primero se debe descargar la base de datos (Repositorio)


Organizarlo en un documento Excel , se coloca el encabezado y guardarlo en
formato .csv
Se carga en el nodo File Reader
Se configura y se ejecuta.

DATA SET CLICO EQUINO

Primer nodo que se carga es el Missing Value que nos ayuda a manejar los
valores perdidos que se encuentran en las clulas de la tabla de entrada. La
primera ficha en el cuadro de dilogo (con la etiqueta "Default") ofrece
opciones de manejo por defecto para todas las columnas de un tipo
determinado (es decir, doble, cadena, entero, y todos los dems tipos de
columna desconocidos).

DATA SET CLICO EQUINO

El siguiente nodo es el Number to String que nos sirve para convierte los
nmeros en una columna (o un conjunto de columnas) en cadenas.

DATA SET CLICO EQUINO

El cuarto nodo es el String Replacer que nos sustituye valores de las celdas de
cadena si coinciden con un determinado patrn de comodines.

DATA SET CLICO EQUINO

El siguiente nodo es el Column Filter, este nodo permite columnas que se


filtran de la primera tabla con la segunda tabla como tabla de referencia.

El sexto nodo es el SMOTE, Este nodo un sobremuestreo de los datos de


entrada (es decir, agrega filas artificiales) para enriquecer los datos de
entrenamiento.

El siguiente nodo es el Partitioning nos sirve para que la mesa de entrada se


divide en dos particiones (es decir, por filas) de datos, por ejemplo, entrenar y
probar. Las dos particiones estn disponibles en los dos puertos de salida.

El siguiente nodos es Decision tree Learner, Este nodo induce un rbol de


decisin de clasificacin en la memoria principal. El atributo de destino debe
ser nominal.

El anterior nodo va conectado con Decision tree Predicor, este nodo utiliza un
rbol de decisin existentes (pasado en el puerto a travs de modelo) para
predecir el valor de la clase de nuevos patrones.

Para terminar y saber el resultado usamos el nodo Scorer Compara dos


columnas por sus pares de valores de atributos y muestra la matriz de
confusin, es decir, el nmero de filas de las cuales atributo y su partido de
clasificacin.

RESULTADO

Por conclusin la estadstica que nos arroja es: Siendo la respuesta 2 que
muere el caballo y 1 que vive el caballo.

También podría gustarte