0% encontró este documento útil (0 votos)

178 vistas12 páginas

Random Forest (Bosque Aleatorio) - Combinando Árboles

Random Forest es una técnica de aprendizaje automático que combina árboles de decisión para mejorar la generalización. Cada árbol se entrena en una muestra aleatoria de los datos, lo que compensa errores y mejora el rendimiento fuera de la muestra. Random Forest tiene una implementación popular en scikit-learn con hiperparámetros como el número de árboles y la profundidad máxima.

Cargado por

Ine Gi

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

178 vistas12 páginas

Random Forest (Bosque Aleatorio) - Combinando Árboles

Cargado por

Ine Gi

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - IArtificial.

net

[Link]

Inicio > machine learning > Random Forest (Bosque Aleatorio): combinando
árboles

Random Forest (Bosque Aleatorio):

combinando árboles
Actualizado 18/09/2020 | por Jose Martinez Heras

Un Random Forest (Bosque Aleatorio), es una técnica de aprendizaje automático

muy popular. Los Random Forests tienen una capacidad de generalización muy
alta para muchos problemas.

[Link] 1/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

Índice
1. Limitaciones de los Árboles de Decisión
2. ¿Qué es un Random Forest?
3. Diferencia intuitiva entre un árbol de decisión y un random forest
4. ¿Cómo se combinan las predicciones?
4.1. Podemos inventar nuestra propia forma de combinar predicciones
5. Random Forest en scikit-learn: hiper-parámetros más útiles
6. Resumen
7. Recursos

Limitaciones de los Árboles de Decisión

Los árboles de decisión tienen la tendencia de sobre-ajustar (overfit). Esto quiere
decir que tienden a aprender muy bien los datos de entrenamiento pero su
generalización no es tan buena. Una forma de mejorar la generalización de los
árboles de decisión es usar regularización. Para mejorar mucho más la
capacidad de generalización de los árboles de decisión, deberemos combinar
varios árboles.

¿Qué es un Random Forest?

Un Random Forest es un conjunto (ensemble) de árboles de decisión
combinados con bagging. Al usar bagging, lo que en realidad está pasando, es
que distintos árboles ven distintas porciones de los datos. Ningún árbol ve todos
los datos de entrenamiento. Esto hace que cada árbol se entrene con distintas
muestras de datos para un mismo problema. De esta forma, al combinar sus
resultados, unos errores se compensan con otros y tenemos una predicción que
generaliza mejor.

[Link] 2/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

Diferencia intuitiva entre un árbol de decisión y un

random forest
En la siguiente imagen puedes ver la diferencia entre el modelo aprendido por
un árbol de decisión y un random forest cuando resuelven el mismo problema
de regresión. Este random forest en particular, utiliza 100 árboles.

Como puedes ver, tanto el árbol de decisión como el bosque aleatorio, tienen un
error cuadrático medio (MSE) de entrenamiento pequeño y similar. Sin embargo,
el error de generalización del random forest es mucho mejor. Esto se puede ver
también en que el modelo aprendido es mucho más suave como se puede
observar en la figura.

[Link] 3/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

¿Cómo se combinan las predicciones?

Para problemas de clasificación, se suelen combinar los resultados de los
árboles de decisión usando soft-voting (voto suave). En el voto suave, se le da
más importancia a los resultados en los que los árboles estén muy seguros.

Para problemas de regresión, la forma más habitual de combinar los resultados

de los árboles de decisión, es tomando su media aritmética.

Podemos inventar nuestra propia forma de combinar

predicciones

También podemos inventarnos nuestra propia forma de combinar los resultados

de un bosque aleatorio. Esto es posible porque podemos acceder a las
predicciones individuales de cada árbol. Así, podemos hacer el uso de estas
predicciones que nos interesen.

Predicción (en rojo) de los 100 árboles de decisión de este bosque

aleatorio. En negro puedes ver la media aritmética.

Por ejemplo, imagínate que en vez de querer predecir un resultado, queremos

predecir el rango de valores probables en el futuro. Podemos obtener los valores
mínimo y máximo de cada predicción para definir el intervalo más probable.

[Link] 4/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

Predicción del rango más probable (mínimo y máximo en rojo) y la

media aritmética de las predicciones de los 100 árboles en negro. El
rango se corresponde con la predicción máxima y mínima para cada
muestra.

Random Forest en scikit-learn: hiper-parámetros

más útiles
scikit-learn ofrece dos implementaciones de random forests:

Para clasificación: RandomForestClassifier

Para regressión: RandomForestRegressor

Estos son los hiper-parámetros más útiles:

Propios del Bosque Aleatorio:

n_estimators: número de árboles que va a tener el bosque aleatorio.
Normalmente cuantos más mejor, pero a partir de cierto punto deja de
mejorar y sólo hace que vaya más lento. Un buen valor por defecto
puede ser el uso de 100 árboles.
n_jobs: número de cores que se pueden usar para entrenar los
árboles. Cada árbol es independiente del resto, así que entrenar un
bosque aleatorio es una tarea muy paralelizable. Por defecto sólo
[Link] 5/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

utiliza 1 core de la CPU. Para mejorar el rendimiento puedes usar

tantos cores como estimes necesario. Si usas n_jobs = -1, estás
indicando que quieres usar tantos cores como tenga tu máquina.
max_features: usa forma de garantizar que los árboles son diferentes,
es que todos se entrenan con una muestra aleatoria de los datos. Si
queremos que todavía sean más diferentes, podemos hacer que
distintos árboles usen distintos atributos. Esto puede ser útil
especialmente cuando algunos atributos están relacionados entre sí.
Hay varias estrategias para elegir el número máximo de atributos que
se pueden usar; mira la documentación para saber más.
Regularización (también disponibles para Decision Trees):
max_depth: la profundidad máxima del árbol. En los ejemplos
anteriores hemos usado max_depth = 2
min_samples_split: número mínimo de muestras necesarias antes de
dividir este nodo. También se puede expresar en porcentaje.
min_samples_leaf: número mínimo de muestras que debe haber en
un nodo final (hoja). También se puede expresar en porcentaje.
max_leaf_nodes: número máximo de nodos finales

Resumen
Random Forest es un técnica de aprendizaje automático supervisada basada en
árboles de decisión. Su principal ventaja es que obtiene un mejor rendimiento de
generalización para un rendimiento durante entrenamiento similar. Esta mejora
en la generalización la consigue compensando los errores de las predicciones de
los distintos árboles de decisión. Para asegurarnos que los árboles sean
distintos, lo que hacemos es que cada uno se entrena con una muestra aleatoria
de los datos de entrenamiento. Esta estrategia se denomina bagging.

[Link] 6/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

Dato que un random forest es un conjunto de árboles de decisión, y los árboles

son modelos no-paramétricos, los random forests tienen las mismas ventajas y
desventajas de los modelos no-paramétricos:

ventaja: pueden aprender cualquier correspondencia entre datos de

entrada y resultado a predecir
desventaja: no son buenos extrapolando … porque no siguen un modelo
conocido

Recursos
En este [vídeo] explico cómo funcionan los árboles de decisión, bagging y
los random forests (en inglés)
Implementación de Random Forest en scikit-learn para clasificación y
regresión: RandomForestClassifier y RandomForestRegressor
Ventajas y desventajas de los árboles de decisión como modelos no-
paramétricos

Créditos Imagen: pixabay

Relacionado
1. Árboles de Decisión con ejemplos en Python Los árboles de decisión son una
técnica de aprendizaje automático supervisado muy utilizada en muchos negocios. Como su
nombre indica, esta técnica de machine learning toma una serie de decisiones...
2. Inteligencia Artificial aplicada a [Link] En este artículo, vamos a aplicar
Inteligencia Artificial a todas las noticias de portada de [Link] en 2018. Empezaremos
realizando un análisis estadístico y visualización de datos. Después usaremos Procesamiento...

3. 15 Librerías de Python para Machine Learning Estas son las 15 mejores librerías
de python para Machine Learning. Temas: Visualización, Cálculo Numérico, Análisis de Datos,

[Link] 7/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

Aprendizaje Automático, Deep Learning, Inteligencia Artificial Explicable, Procesamiento del

Lenguaje Natural y mucho...

4. Aguathon: mi solución al primer Hackathon del Agua En este artículo explico

mi solución al Aguathon: el primer Hackathon del Agua, organizado por ITAINNOVA. Introducción al

Aguathon: el Hackathon del Agua de ITAINNOVA El Instituto Tecnológico de Aragón...

machine learning
aprendizaje automático, aprendizaje supervisado, bagging, bosque aleatorio,
ensemble, random forest
Ensembles: voting, bagging, boosting, stacking
Avances en la generación de caras con GANs

Deja un comentario

Nombre *

Correo electrónico *

Web

[Link] 8/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

Publicar comentario

¿Qué buscas?

Buscar...

English version

Click here for an automatically translated version

Lo último

Machine Learning en Operaciones Espaciales

Segmentación de Imágenes con Redes Convolucionales
Algoritmos Genéticos y Memoria Visual
TorchServe para servir modelos de PyTorch
Detección de anomalías en espacio

Contenido relacionado

[Link] 9/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

Precision, Recall, F1, Accuracy en clasificación

Ensembles: voting, bagging, boosting, stacking

Árboles de Decisión con ejemplos en Python

[Link] 10/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

15 Librerías de Python para Machine Learning

Error Cuadrático Medio para Regresión

Más Información

Inicio
Guía rápida
Sobre mí
Contacto

Legal

Términos y condiciones
Política de cookies
[Link] 11/12
3/31/23, 10:42 AM Random Forest (Bosque Aleatorio): combinando árboles - [Link]

Política de privacidad

[Link] 12/12

También podría gustarte

Random Forest en Python: Guía Completa
Aún no hay calificaciones
Random Forest en Python: Guía Completa
72 páginas
Random Forest
Aún no hay calificaciones
Random Forest
6 páginas
Modelo Predictivo con Random Forest en Python
Aún no hay calificaciones
Modelo Predictivo con Random Forest en Python
9 páginas
Exposición sobre Random Forests
Aún no hay calificaciones
Exposición sobre Random Forests
2 páginas
Random Forest en Minería de Datos
Aún no hay calificaciones
Random Forest en Minería de Datos
26 páginas
Random Forest
Aún no hay calificaciones
Random Forest
10 páginas
Introducción a Random Forest en Minería de Datos
Aún no hay calificaciones
Introducción a Random Forest en Minería de Datos
15 páginas
Introducción a Random Forests en R
Aún no hay calificaciones
Introducción a Random Forests en R
12 páginas
Aula Virtual 16-11-2022
Aún no hay calificaciones
Aula Virtual 16-11-2022
10 páginas
Random Forest
Aún no hay calificaciones
Random Forest
7 páginas
Introducción al Algoritmo Random Forest
Aún no hay calificaciones
Introducción al Algoritmo Random Forest
35 páginas
Árboles de Decisión vs Random Forest
Aún no hay calificaciones
Árboles de Decisión vs Random Forest
3 páginas
Introducción a Random Forest
100% (2)
Introducción a Random Forest
26 páginas
Random Forests y Ensamble de Modelos
Aún no hay calificaciones
Random Forests y Ensamble de Modelos
72 páginas
Técnicas de Random Forest en Aprendizaje Automático
Aún no hay calificaciones
Técnicas de Random Forest en Aprendizaje Automático
43 páginas
Árboles de Decisión: Clasificación y Regresión
Aún no hay calificaciones
Árboles de Decisión: Clasificación y Regresión
6 páginas
Modelos de Regresión en Machine Learning
Aún no hay calificaciones
Modelos de Regresión en Machine Learning
25 páginas
Bagging y Random Forest en Modelos de Decisión
Aún no hay calificaciones
Bagging y Random Forest en Modelos de Decisión
61 páginas
Ejemplos de Random Forest y Bagging
Aún no hay calificaciones
Ejemplos de Random Forest y Bagging
25 páginas
Presentacion - Random Forest
Aún no hay calificaciones
Presentacion - Random Forest
15 páginas
RF Presentation
Aún no hay calificaciones
RF Presentation
62 páginas
Clase 7 Random Forest
Aún no hay calificaciones
Clase 7 Random Forest
10 páginas
Regresión y Clasificación con Random Forests
Aún no hay calificaciones
Regresión y Clasificación con Random Forests
17 páginas
Ensembles en Aprendizaje Automático: Bagging
Aún no hay calificaciones
Ensembles en Aprendizaje Automático: Bagging
30 páginas
Taller de Random Forest en Python
Aún no hay calificaciones
Taller de Random Forest en Python
12 páginas
Algoritmos de Machine Learning: Guía Completa
Aún no hay calificaciones
Algoritmos de Machine Learning: Guía Completa
11 páginas
Introducción a Árboles de Decisión en ML
Aún no hay calificaciones
Introducción a Árboles de Decisión en ML
1 página
Modelos de Árbol para Toma de Decisiones
Aún no hay calificaciones
Modelos de Árbol para Toma de Decisiones
46 páginas
Clase 04 Predicción Con Random Forest
Aún no hay calificaciones
Clase 04 Predicción Con Random Forest
19 páginas
Algoritmos de Aprendizaje Supervisado en IA
Aún no hay calificaciones
Algoritmos de Aprendizaje Supervisado en IA
45 páginas
Guia Arboles Decision
Aún no hay calificaciones
Guia Arboles Decision
6 páginas
Diabetes Tree Trabajo Final
Aún no hay calificaciones
Diabetes Tree Trabajo Final
40 páginas
Árboles de Decisión: Ventajas y Desventajas
Aún no hay calificaciones
Árboles de Decisión: Ventajas y Desventajas
18 páginas
Algoritmos de Clasificación: Árboles y Redes
Aún no hay calificaciones
Algoritmos de Clasificación: Árboles y Redes
42 páginas
ML&AI-Árboles de Decisión y Churn Rate
Aún no hay calificaciones
ML&AI-Árboles de Decisión y Churn Rate
33 páginas
Algoritmos Random Tree y Random Forest
Aún no hay calificaciones
Algoritmos Random Tree y Random Forest
12 páginas
Clase14-Arboles y Random Forest
Aún no hay calificaciones
Clase14-Arboles y Random Forest
25 páginas
Estrategias para Modelos Analíticos
Aún no hay calificaciones
Estrategias para Modelos Analíticos
14 páginas
Clasificación de Imágenes con Random Forest
Aún no hay calificaciones
Clasificación de Imágenes con Random Forest
14 páginas
Clasificación musical con árboles de decisión
Aún no hay calificaciones
Clasificación musical con árboles de decisión
9 páginas
Orange: Herramienta de Data Mining
Aún no hay calificaciones
Orange: Herramienta de Data Mining
6 páginas
Predicción de Pétalos con Random Forest
Aún no hay calificaciones
Predicción de Pétalos con Random Forest
3 páginas
Random Forests
Aún no hay calificaciones
Random Forests
24 páginas
Árboles de Regresión y Clasificación Jose Vicente
Aún no hay calificaciones
Árboles de Regresión y Clasificación Jose Vicente
59 páginas
Inducción de Árboles de Decisión en WEKA
Aún no hay calificaciones
Inducción de Árboles de Decisión en WEKA
77 páginas
Inducción de Árboles de Decisión con WEKA
Aún no hay calificaciones
Inducción de Árboles de Decisión con WEKA
77 páginas
Algoritmos de Árbol en Machine Learning
Aún no hay calificaciones
Algoritmos de Árbol en Machine Learning
24 páginas
CART - Análisis Multivariado (2023-II)
Aún no hay calificaciones
CART - Análisis Multivariado (2023-II)
11 páginas
Árboles de Predicción: Métodos y Ejemplos
Aún no hay calificaciones
Árboles de Predicción: Métodos y Ejemplos
97 páginas
Arboles de Decisión Probabilidad Sara, Sara, Ilan
Aún no hay calificaciones
Arboles de Decisión Probabilidad Sara, Sara, Ilan
5 páginas
Bosques Aleatorios: Mejora y Desafíos
100% (1)
Bosques Aleatorios: Mejora y Desafíos
9 páginas
Clase 14 - Aprendizaje Supervisado
Aún no hay calificaciones
Clase 14 - Aprendizaje Supervisado
68 páginas
Ensayo
Aún no hay calificaciones
Ensayo
5 páginas
Análisis de Algoritmos de Clasificación
Aún no hay calificaciones
Análisis de Algoritmos de Clasificación
4 páginas
Árboles de Decisión en Machine Learning
Aún no hay calificaciones
Árboles de Decisión en Machine Learning
6 páginas
Algoritmos de Árbol de Decisión en Python
Aún no hay calificaciones
Algoritmos de Árbol de Decisión en Python
10 páginas
Técnicas de Ensamble: Bagging y Random Forest
Aún no hay calificaciones
Técnicas de Ensamble: Bagging y Random Forest
46 páginas
Árboles de Decisión en Python: Guía Práctica
Aún no hay calificaciones
Árboles de Decisión en Python: Guía Práctica
4 páginas
Cantos Viernes Santo
Aún no hay calificaciones
Cantos Viernes Santo
3 páginas
Metodologia de La Investigacion
Aún no hay calificaciones
Metodologia de La Investigacion
11 páginas
Resumen de Derecho Constitucional - Ucv PDF
Aún no hay calificaciones
Resumen de Derecho Constitucional - Ucv PDF
19 páginas
Músculos Cigomáticos: Funciones y Estructura
Aún no hay calificaciones
Músculos Cigomáticos: Funciones y Estructura
5 páginas
Portafolio Final del Curso IVU
Aún no hay calificaciones
Portafolio Final del Curso IVU
42 páginas
Uso y ejemplos de signos de puntuación
Aún no hay calificaciones
Uso y ejemplos de signos de puntuación
3 páginas
Polinomios de Taylor y Maclaurin en Matemáticas
Aún no hay calificaciones
Polinomios de Taylor y Maclaurin en Matemáticas
22 páginas
Sociología de la Educación: Análisis Crítico
Aún no hay calificaciones
Sociología de la Educación: Análisis Crítico
3 páginas
Curso Lean Manufacturing Gratis
Aún no hay calificaciones
Curso Lean Manufacturing Gratis
47 páginas
Antología Docencia en Enfermería
Aún no hay calificaciones
Antología Docencia en Enfermería
113 páginas
Linea de Tiempo Derecho Civil Completa
Aún no hay calificaciones
Linea de Tiempo Derecho Civil Completa
3 páginas
Actividades de Musicología y Cultura Musical
Aún no hay calificaciones
Actividades de Musicología y Cultura Musical
8 páginas
Higiene de Genitales
Aún no hay calificaciones
Higiene de Genitales
1 página
Estudio 20 La C320 Presentaci B3 N
Aún no hay calificaciones
Estudio 20 La C320 Presentaci B3 N
46 páginas
Historia de La Constitucion Política Del Perú
Aún no hay calificaciones
Historia de La Constitucion Política Del Perú
7 páginas
Biografia y Obras de Socrates
Aún no hay calificaciones
Biografia y Obras de Socrates
8 páginas
Anuario 2024 Ok
Aún no hay calificaciones
Anuario 2024 Ok
3 páginas
Nomenclatura de Los Dientes Mi Tarea Iris Mia
Aún no hay calificaciones
Nomenclatura de Los Dientes Mi Tarea Iris Mia
4 páginas
La Payunia
Aún no hay calificaciones
La Payunia
1 página
Taller Carnaval
100% (1)
Taller Carnaval
2 páginas
Habilidades y Valores del Emprendimiento
100% (3)
Habilidades y Valores del Emprendimiento
9 páginas
Técnicas de Entrevista - Análisis y Estrategias en El Contexto Laboral-Leidy Montes
Aún no hay calificaciones
Técnicas de Entrevista - Análisis y Estrategias en El Contexto Laboral-Leidy Montes
21 páginas
Limpiando La Memoria Celular-Zelig
75% (4)
Limpiando La Memoria Celular-Zelig
45 páginas
Antropología Política y Procesos Sociales
Aún no hay calificaciones
Antropología Política y Procesos Sociales
18 páginas
Campaña Salud Mental San Gerardo 2022
Aún no hay calificaciones
Campaña Salud Mental San Gerardo 2022
11 páginas
Estudios de Documentos y Pertenencias Del Cadáver
Aún no hay calificaciones
Estudios de Documentos y Pertenencias Del Cadáver
4 páginas
Porqué Dios Permite El Sufrimiento
100% (1)
Porqué Dios Permite El Sufrimiento
21 páginas
Juan Manuel de Rosas: Gobernador Argentino
Aún no hay calificaciones
Juan Manuel de Rosas: Gobernador Argentino
19 páginas
Toradora: Resumen del Capítulo 2
Aún no hay calificaciones
Toradora: Resumen del Capítulo 2
46 páginas
Searle Taxonomía de Los Actos Ilocucionarios
100% (1)
Searle Taxonomía de Los Actos Ilocucionarios
45 páginas