¡Te damos la bienvenida a Scribd!

Saltar el carrusel

Bosques Aleatorios

Cargado por

Lisbeth Martinez

0% encontró este documento útil (0 votos)

6 vistas10 páginas

Métodos de Analítica para la Industria PhD Andrés Abad

Título original

BOSQUES_ALEATORIOS

Derechos de autor

Formatos disponibles

PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Métodos de Analítica para la Industria PhD Andrés Abad

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

6 vistas10 páginas

Bosques Aleatorios

Cargado por

Lisbeth Martinez

Métodos de Analítica para la Industria PhD Andrés Abad

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 10

Buscar dentro del documento

ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL

Introducción a Bosques Aleatorios

Andrés G. Abad, Ph.D.

Andrés G. Abad, Ph.D., agabad@espol.edu.ec 1 / 10

Agenda

Introducción al problema de clasificación

Bosques aleatorios (random forests)

Introducción a los bosques aleatorios
Error Out-of-bag
Importancia de las variables (caracterı́sticas)

Referencias Bibliográficas

Andrés G. Abad, Ph.D., agabad@espol.edu.ec 2 / 10

Definición del problema de clasificación I
I Un objeto x = [x1 , . . . , xp ], con caracterı́sticas xi , pertenece exactamente a
una clases c ∈ {1, 2, . . . , C}.
I Asumimos que tenemos un conjunto de datos
D = {(x(1) , c(1) ), . . . , (x(n) , c(n) )}
I Buscamos una función f̂ que asigne x(i) a c(i) lo mejor posible:
f̂ = arg mı́n P(x,c) [1(f (x) , c)]
f

I Objeto x pertenece a una de dos clases:

{Basico, Premium}
I Objeto x medidos en dos caracterı́sticas: x1
ingresos anuales, y x2 edad en años
I Dos clasificadores f̂ ’s: convexo-cuadrático (linea
negra) y no-convexo (linea roja)

Andrés G. Abad, Ph.D., agabad@espol.edu.ec 3 / 10

Agenda

Introducción al problema de clasificación

Bosques aleatorios (random forests)

Introducción a los bosques aleatorios
Error Out-of-bag
Importancia de las variables (caracterı́sticas)

Referencias Bibliográficas

Andrés G. Abad, Ph.D., agabad@espol.edu.ec 4 / 10

Bosques aleatorios (random forests) I
Los árboles de clasificación sufrir de sobre-ajuste (bajo sesgo - alta variabilidad)

I Los bosques aleatorios (introducidos en Breiman [2001]) combinan varios

árboles de decisión cada uno entrenado en diferentes partes del conjunto de
entrenamiento para reducer la variabilidad
I reducen el error de predicción
I El conjunto de árboles de decisión operan a manera de conjunto de expertos
votando por la predicción de la clase del objeto
I El objeto es asignado a la clase con más votos
Andrés G. Abad, Ph.D., agabad@espol.edu.ec 5 / 10
Tree bagging I
Tree bagging (bootstrap aggregating)
Para b = 1, . . . , B:
1. Tome una muestra con reemplazo de tamaño n de datos Xb y Yb
2. Entrene un árbol de clasificación f̂b en la muestra Xb y Yb .
Con los B árboles entrenados se conforma un clasificador f̂ que asigna el objeto x
a la clase con más votos entre los B árboles

Andrés G. Abad, Ph.D., agabad@espol.edu.ec 6 / 10

Bosque aleatorio I

Bosque aleatorio
Se sigue casi el mismo procedimiento que en Tree Bagging con la siguiente
adición:
I En cada nodo se escoge solo un subconjunto de las caracterı́sticas como
candidatas
I Si se tienen p caracterı́sticas, en Hastie et al. [2003] se recomienda escoger
√
p (rendondeado hacia abajo)

Andrés G. Abad, Ph.D., agabad@espol.edu.ec 7 / 10

Out-of-bag error I

Es un método para predecir el error de predicción para bosques aleatorios

Def. Out-of-bag error (OOB)

Es el promedio de los errores de predicción sobre cada objeto de entrenamiento
xi , utilizando solamente los árboles que no tenian a xi en su muestra de
entrenamiento.

Andrés G. Abad, Ph.D., agabad@espol.edu.ec 8 / 10

Importancia de las variables (caracterı́sticas) I
Es un método para estimar la importancia de cada caracterı́stica (variables) en la
predicción.

Def. Importancia de las variables (caracterı́sticas)

1. Se obtiene el error OOB para cada objeto de la muestra y se promedio sobre

todos los árboles
2. Para medir la importancia de la caracterı́stica xj permutamos el valor de la
caracterı́stica en la muestra y calculamos de nuevo el error OOB en la nueva
muestra permutada
3. La medida de importancia de la caracterı́stica xj se mide como el promedio
sobre todos los árboles de las diferencias del error OOB entre la muestras
antes y después de la permutación

Andrés G. Abad, Ph.D., agabad@espol.edu.ec 9 / 10

Referencias Bibliográficas I

Breiman, L. (2001). Random Forests. Machine Learning, 45(1):5–32.

Hastie, T., Tibshirani, R., and Friedman, J. (2003). The Elements of Statistical Learning. Springer.

Andrés G. Abad, Ph.D., agabad@espol.edu.ec 10 / 10

También podría gustarte

Bioestadística
De Everand
Bioestadística
Liliana López-Kleine
Calificación: 2 de 5 estrellas
2/5 (1)
Reglas para La Clasificación
Documento165 páginas
Reglas para La Clasificación
ROXANA ERIKA CARDENAS CANTU
Aún no hay calificaciones
Manual MENTOR UT - Español - 2020
Documento130 páginas
Manual MENTOR UT - Español - 2020
Alexander Sueco Leyan Castillo
100% (1)
Arboles de Decision
Documento16 páginas
Arboles de Decision
Pablito Totola
Aún no hay calificaciones
Conjuntos, Relaciones, Funciones y Secuencias
Documento61 páginas
Conjuntos, Relaciones, Funciones y Secuencias
Margarita Vasco
100% (1)
Lenguaje RAPID. Robotics Application Programming Interactive Dialogue. Automatización Industrial - II. 56 10569 2º Cuatrimestre 2006
Documento44 páginas
Lenguaje RAPID. Robotics Application Programming Interactive Dialogue. Automatización Industrial - II. 56 10569 2º Cuatrimestre 2006
fmvm
Aún no hay calificaciones
Cuando Botar
Documento2 páginas
Cuando Botar
Kamy Muñoz Pizarro
Aún no hay calificaciones
ADABOOST
Documento48 páginas
ADABOOST
Maria Lopez
Aún no hay calificaciones
Ada Boost
Documento24 páginas
Ada Boost
Lisbeth Martinez
Aún no hay calificaciones
Resumenes Machine Learning 1
Documento6 páginas
Resumenes Machine Learning 1
saradt.clase
Aún no hay calificaciones
Arboles
Documento30 páginas
Arboles
amordebebe
Aún no hay calificaciones
S10 S1-Material (Presencial)
Documento34 páginas
S10 S1-Material (Presencial)
Rodrigo Dueñas
Aún no hay calificaciones
Tema2 ModelosBinarios 2023
Documento48 páginas
Tema2 ModelosBinarios 2023
Federico
Aún no hay calificaciones
Sesión 1 - FCC 2023-2
Documento26 páginas
Sesión 1 - FCC 2023-2
JESSICA JULIANA YAURI CHUQUILLANQUI
Aún no hay calificaciones
Apuntes
Documento11 páginas
Apuntes
saradt.clase
Aún no hay calificaciones
Problema Endogeneidad
Documento26 páginas
Problema Endogeneidad
Manuela Caicedo
100% (1)
Clase1 PDF
Documento152 páginas
Clase1 PDF
jantoniohergut
Aún no hay calificaciones
Reconocimiento de Patrones
Documento39 páginas
Reconocimiento de Patrones
jose
Aún no hay calificaciones
Arbolesdecision
Documento11 páginas
Arbolesdecision
Luis Eduardo Moran López
Aún no hay calificaciones
Guia 1, Mat6
Documento4 páginas
Guia 1, Mat6
Carlos Muñoz Alvear
Aún no hay calificaciones
S10.s1 - Material
Documento18 páginas
S10.s1 - Material
Cristhian Zacarias
Aún no hay calificaciones
Clustering
Documento56 páginas
Clustering
Lisbeth Martinez
Aún no hay calificaciones
Probabilidad
Documento6 páginas
Probabilidad
Josue Alessandro Ticona Castro
Aún no hay calificaciones
Regresion Logistica
Documento33 páginas
Regresion Logistica
Lisbeth Martinez
Aún no hay calificaciones
1 - Conceptos Básicos de Aprendizaje Automático
Documento42 páginas
1 - Conceptos Básicos de Aprendizaje Automático
Agustín
Aún no hay calificaciones
Evaluacion
Documento30 páginas
Evaluacion
jose
Aún no hay calificaciones
Relaciones Entre Conjuntos para Quinto Grado de Primaria
Documento7 páginas
Relaciones Entre Conjuntos para Quinto Grado de Primaria
Sisas Nea
Aún no hay calificaciones
Relaciones Entre Conjuntos para Quinto Grado de Primaria
Documento7 páginas
Relaciones Entre Conjuntos para Quinto Grado de Primaria
enmanuel mejiapana
Aún no hay calificaciones
Tema 1 Repaso Probabilidad - Distribuciones Multivariantes - Mezclas
Documento63 páginas
Tema 1 Repaso Probabilidad - Distribuciones Multivariantes - Mezclas
chechoapolo
Aún no hay calificaciones
Algebra Ejercicios Con Alternativa
Documento9 páginas
Algebra Ejercicios Con Alternativa
Alexis Gil Suárez
Aún no hay calificaciones
Pre Tarea Quiz Nociones de Conjuntos PDF
Documento3 páginas
Pre Tarea Quiz Nociones de Conjuntos PDF
Daniel Marin
Aún no hay calificaciones
Semana 08 Funciones 2019-1B
Documento19 páginas
Semana 08 Funciones 2019-1B
Juan Bendezu Huayhualla
Aún no hay calificaciones
Guía de Actividad y Rúbrica de Evaluación - Tarea 2 - Genética y Biotecnología
Documento17 páginas
Guía de Actividad y Rúbrica de Evaluación - Tarea 2 - Genética y Biotecnología
Maria Angelica Fernandez Masmela
Aún no hay calificaciones
GonzaloValdiviezo - Estadística Taller 2
Documento19 páginas
GonzaloValdiviezo - Estadística Taller 2
Tania Basantes
Aún no hay calificaciones
VA Discretas y Continuas
Documento23 páginas
VA Discretas y Continuas
Sebastian Gutierrez
0% (1)
P Sem 10 Distribución Binomial
Documento15 páginas
P Sem 10 Distribución Binomial
Jorge Luis Soria
50% (2)
Examen de Probabilidad y Estadistica - Unidad 3
Documento2 páginas
Examen de Probabilidad y Estadistica - Unidad 3
SlimeElLectorPro
Aún no hay calificaciones
5 - FMyE Introducción Al Diseño de Experimentos
Documento27 páginas
5 - FMyE Introducción Al Diseño de Experimentos
MakotoBushido
Aún no hay calificaciones
Guía de Actividad y Rúbrica de Evaluación - Tarea 2 - Genética y Biotecnología
Documento18 páginas
Guía de Actividad y Rúbrica de Evaluación - Tarea 2 - Genética y Biotecnología
oscar
Aún no hay calificaciones
Matematicas-2020 UMSA MEDECINA
Documento88 páginas
Matematicas-2020 UMSA MEDECINA
Victor Cristian Calamani
Aún no hay calificaciones
Tarea 2 - Genética y Biotecnología PDF
Documento17 páginas
Tarea 2 - Genética y Biotecnología PDF
Haciendas San Pedro San Pablo
40% (5)
GTP Bioestadística 2017
Documento67 páginas
GTP Bioestadística 2017
Eva Soto
Aún no hay calificaciones
Econo
Documento68 páginas
Econo
Carla Andrea Ojeda Escobar
Aún no hay calificaciones
Guia Didactica Matematicas Discretas
Documento11 páginas
Guia Didactica Matematicas Discretas
juanperozo86
Aún no hay calificaciones
Estructuras Discretas 2
Documento7 páginas
Estructuras Discretas 2
Bri Neymar Barrera
Aún no hay calificaciones
Anexo Presentación Tarea 1
Documento16 páginas
Anexo Presentación Tarea 1
pablo cesar gonzalez camacho
Aún no hay calificaciones
S09.s1 Material 1
Documento23 páginas
S09.s1 Material 1
Percy Calixtro
Aún no hay calificaciones
S09.s1 - DISTRIBUCION BINOMIAL - UTP FINAL
Documento16 páginas
S09.s1 - DISTRIBUCION BINOMIAL - UTP FINAL
Esther Valencia
Aún no hay calificaciones
Modulo de Teoria de Conjuntos (Sesion 01)
Documento8 páginas
Modulo de Teoria de Conjuntos (Sesion 01)
Lorena Vebtura
Aún no hay calificaciones
Pretarea - Nociones de Conjuntos - Cuestionario de Evaluación - Revisión Del Intento4
Documento6 páginas
Pretarea - Nociones de Conjuntos - Cuestionario de Evaluación - Revisión Del Intento4
Claudia Filipo
Aún no hay calificaciones
Daniela Tarea
Documento6 páginas
Daniela Tarea
Carlos Cedeño
Aún no hay calificaciones
Clase 2 - Análisis y Visualización de Datos
Documento100 páginas
Clase 2 - Análisis y Visualización de Datos
Marco Pavez
Aún no hay calificaciones
Clase1 Conjuntos
Documento55 páginas
Clase1 Conjuntos
Rolando Vásquez Jaico
Aún no hay calificaciones
Teoría de Conjuntos
Documento14 páginas
Teoría de Conjuntos
Percy MCH
Aún no hay calificaciones
Asignación A Cargo Del Docente
Documento5 páginas
Asignación A Cargo Del Docente
Gustavo Hernandez
Aún no hay calificaciones
Anexo 6 - Plantilla Tarea 2
Documento15 páginas
Anexo 6 - Plantilla Tarea 2
sandra Garcia
Aún no hay calificaciones
Lógica Cuantificacional
Documento15 páginas
Lógica Cuantificacional
jhan garcia
Aún no hay calificaciones
2do Parcial Estadistica
Documento28 páginas
2do Parcial Estadistica
J
Aún no hay calificaciones
KEDF - Planeacion Actividades - U1 - 2020
Documento8 páginas
KEDF - Planeacion Actividades - U1 - 2020
Ismael Choix
Aún no hay calificaciones
Semana 05 - Conjuntos
Documento5 páginas
Semana 05 - Conjuntos
Pame Moreno Granados
Aún no hay calificaciones
Practica Prolog
Documento5 páginas
Practica Prolog
tu
Aún no hay calificaciones
Tarea Teorica 1
Documento7 páginas
Tarea Teorica 1
Lisbeth Martinez
Aún no hay calificaciones
Regresion Logistica
Documento33 páginas
Regresion Logistica
Lisbeth Martinez
Aún no hay calificaciones
Intro Clasificacion
Documento13 páginas
Intro Clasificacion
Lisbeth Martinez
Aún no hay calificaciones
Clustering
Documento56 páginas
Clustering
Lisbeth Martinez
Aún no hay calificaciones
REGLAS ASOCIACION v2
Documento33 páginas
REGLAS ASOCIACION v2
Lisbeth Martinez
Aún no hay calificaciones
Arboles Clasificacion
Documento19 páginas
Arboles Clasificacion
Lisbeth Martinez
Aún no hay calificaciones
Clase 3 - Definicion Cadena de Markov1
Documento5 páginas
Clase 3 - Definicion Cadena de Markov1
Lisbeth Martinez
Aún no hay calificaciones
PROBABILIDADES DE TRANSICION Enésima Etapa Modelos Estocásticos
Documento4 páginas
PROBABILIDADES DE TRANSICION Enésima Etapa Modelos Estocásticos
Lisbeth Martinez
Aún no hay calificaciones
Clase 10 Modelos Estocasticos
Documento3 páginas
Clase 10 Modelos Estocasticos
Lisbeth Martinez
Aún no hay calificaciones
Trabajo Roger
Documento7 páginas
Trabajo Roger
rogu77
Aún no hay calificaciones
Teatro de Usos Múltiples para La Zona Industrial de Paramillo Como Nueva Centralidad Urbana, San Cristobal Estado Táchira
Documento29 páginas
Teatro de Usos Múltiples para La Zona Industrial de Paramillo Como Nueva Centralidad Urbana, San Cristobal Estado Táchira
Mary Pacheco
Aún no hay calificaciones
Practica 7, Interfaz Grafica
Documento20 páginas
Practica 7, Interfaz Grafica
Velázquez Donato
Aún no hay calificaciones
Edupague Instructivo-Colcustodio
Documento2 páginas
Edupague Instructivo-Colcustodio
Karen Gomez
Aún no hay calificaciones
Topicos de Algebra 1
Documento5 páginas
Topicos de Algebra 1
Luis Nina Ponce
Aún no hay calificaciones
Ig en Google
Documento20 páginas
Ig en Google
tatis.re.11
Aún no hay calificaciones
Algoritmos
Documento22 páginas
Algoritmos
CARMELO HILARIO VILCAPOMA
Aún no hay calificaciones
Aplicacion de La Teoria de Las Vibraciones
Documento13 páginas
Aplicacion de La Teoria de Las Vibraciones
carlos ignacio loya sanchez
Aún no hay calificaciones
Tipos de Mantenimiento - MMM - NTO
Documento14 páginas
Tipos de Mantenimiento - MMM - NTO
Natalia Tavera Orozco
Aún no hay calificaciones
Potenciación y Radicación - Ecuaciones y Funciones Exponenciales
Documento9 páginas
Potenciación y Radicación - Ecuaciones y Funciones Exponenciales
Judith Aguilar
Aún no hay calificaciones
Problemas 2
Documento6 páginas
Problemas 2
Angel Vargas
Aún no hay calificaciones
Analisis Socioeconómico Ecuador
Documento7 páginas
Analisis Socioeconómico Ecuador
Cristian David Pachacama
Aún no hay calificaciones
El Futuro de Las Tics
Documento7 páginas
El Futuro de Las Tics
santiago peña
Aún no hay calificaciones
Presentación de Gestion de Seguridad Interna
Documento12 páginas
Presentación de Gestion de Seguridad Interna
Luis Felipe Galeano
Aún no hay calificaciones
Router Fujitel
Documento22 páginas
Router Fujitel
Diego Ramírez Parra
Aún no hay calificaciones
Informe Centro de Presión
Documento2 páginas
Informe Centro de Presión
eduar
Aún no hay calificaciones
Introducción A Ahpl
Documento23 páginas
Introducción A Ahpl
Arturo72
100% (1)
Objetivos en Investigacion Cientifica
Documento5 páginas
Objetivos en Investigacion Cientifica
Jose F LV
Aún no hay calificaciones
Cómo Obtener Acceso A La Carpeta Información Del Volumen Del Sistema
Documento3 páginas
Cómo Obtener Acceso A La Carpeta Información Del Volumen Del Sistema
Quichi Sarco
Aún no hay calificaciones
Ultraportátil Toshiba NB 500 v01r02
Documento14 páginas
Ultraportátil Toshiba NB 500 v01r02
Mario Sánchez Bañares
Aún no hay calificaciones
Proyecto X1
Documento17 páginas
Proyecto X1
Hadid Cruz cena
Aún no hay calificaciones
Aleluya Cohen Letra y Fonetica - PDF - Leisure
Documento5 páginas
Aleluya Cohen Letra y Fonetica - PDF - Leisure
Alberto Arteaga
Aún no hay calificaciones
Desembolso de Credito
Documento1 página
Desembolso de Credito
Nely Ccama
Aún no hay calificaciones
Cuadro Sinoptico Metodos de Estudio de Tiempos
Documento1 página
Cuadro Sinoptico Metodos de Estudio de Tiempos
Jesus Alviarez
Aún no hay calificaciones
SENATI VIRTUAL - Atención Al Cliente
Documento4 páginas
SENATI VIRTUAL - Atención Al Cliente
Jerson Quispe
100% (1)
Guía Examen Extraordinario Geometría y Trigonometría
Documento12 páginas
Guía Examen Extraordinario Geometría y Trigonometría
Anonymous TbJ81qEBw
33% (3)