Está en la página 1de 3

Materia Información del Estudiante Fecha

Last name: Carrera Atapuma


Data Minning 1-NOV-2021
Name: Carlos

Ejercicio Práctico 5

Random Forest

1 Algoritmo Random_Forest_1

1.1 Realizar la predicción.

Para realizar la predicción de tipos de pétalos con el algoritmo Random Forest, se ha


seleccionado el 70% de los datos para entrenamiento (111 datos) y el 30% para test (39
datos).

En la ejecución se ha obtenido una precisión (accuracy) del modelo del 94,87%, es decir
en la tabla cruzada se observan dos errores entre 39 predicciones, como se observa en la
tabla 1.

Tab. 1 Crosstab para cálculo de accuracy

1.2. Cross-Validation 4-Folds

Haciendo uso de la función “cross_val_score” de la biblioteca de “sklearn”, se ha realizado


la validación cruzada con 4 folds, obteniendo una precision calculada del modelo del 96%.
Las líneas de programación y los resultados se pueden apreciar en la ilustración 1.
Universidad Politécnica Salesiana - MT/MIT

Ilustración 1 Cross-Validation 4-Folds

Digital Communications
1
Homework Unit 6
Materia Información del Estudiante Fecha
Last name: Carrera Atapuma
Data Minning 1-NOV-2021
Name: Carlos

La desviación standard (0,03) demuestra que los datos están adecuadamente distribuidos,
permitiendo un cálculo acceptable del accuracy que haciendo uso de la cross validation
resulta mejor que el calculado a partir de los resultados de predicción con el conjunto de
evaluación.

2 Algoritmo Random_Forest_2

2.1. Visualizar el árbol

Se observa que es un árbol sumamente grande que dificulta el uso práctico, como se
aprecia en la ilustración 2 .

Ilustración 2 Árbol de decision Random Forest

Para apreciar major, la ilustración 3 muestra únicamente los 3 primeros niveles del árbol
aleatorio de decisión:

Ilustración 3 Árbol de decision Random Forest (3 primeros niveles)


Universidad Politécnica Salesiana - MT/MIT

Digital Communications
2
Homework Unit 6
Materia Información del Estudiante Fecha
Last name: Carrera Atapuma
Data Minning 1-NOV-2021
Name: Carlos

2.2 Modificación del tamaño de los conjuntos de evaluación ( de 10% a 40%, step 5%)

Tamaño Tamaño Error Error Precisión


conjunto conjunto promedio promedio
evaluación entrenamiento baseline absoluto
(grados)
10% 35 313 5,27 4,2 93,86%
15% 53 295 5,69 4,05 93,79%
20% 70 278 5,09 3,89 93,55%
25% 87 261 5,06 3,87 93,93%
30% 105 243 5,11 3,84 93,98%
35% 122 226 5,06 3,8 94%
40% 140 208 4,85 3,61 94,22%
Tab. 2 Cálculo de precision con diferentes tamaños de conjunto de evaluación

Se puede apreciar que desde un 10% de tamaño de conjunto de evaluación, la precision


disminuye hasta un tamaño del 20% pero a partir del 25% de tamaño del conjunto de
evaluación, la precision incrementa. Quiere decir que un tamaño adecuado del conjunto
de evaluación para el presente modelo es de al menos un 25% o mayor.
Universidad Politécnica Salesiana - MT/MIT

Digital Communications
3
Homework Unit 6

También podría gustarte