0% encontró este documento útil (0 votos)

10 vistas29 páginas

Tema 9.1 - TAA

El documento presenta técnicas de combinación de clasificadores en aprendizaje automático, enfocándose en métodos como Bootstrapping, Bagging, Boosting y Stacking. Se discute cómo la fusión de clasificadores puede mejorar la robustez y precisión de los modelos, aprovechando la diversidad de errores entre ellos. Además, se comparan diferentes arquitecturas y enfoques para implementar clasificadores Ensemble.

Cargado por

fvsalvador98

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

10 vistas29 páginas

Tema 9.1 - TAA

Cargado por

fvsalvador98

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

TÉCNICAS DE APRENDIZAJE AUTOMÁTICO

Prof. José Manuel Bernal

Tema 9. Combinación de clasificadores.

Bootstrapping, Bagging, Boosting, y Stacking

Universidad Internacional de La Rioja

INTRODUCCIÓN Y OBJETIVOS

Propósito del Tema 9: Presentar la fusión o combinación de clasificadores

como una opción potente en el aprendizaje automático

Problema Planteado: ¿Puede un modelo de aprendizaje automático ser

más robusto utilizando un enfoque Ensemble?
 ¿Cuál es el mejor método Ensemble?

Objetivos de la actividad de hoy:

 Introducir los conceptos básico sobre la fusión de clasificadores.

 Entender el principio de funcionamiento de la técnica estadística Boostrap.
 Describir los métodos Bagging, Boosting, y Stacking.

2
SUMARIO

1. Introducción
2. Fusión o combinación de clasificadores
3. Enfoques para clasificadores Ensemble
o Técnica de muestreo Boostrap
o Bagging, Boosting, y Stacking
4. Comparación entre modelos de ensamble

3
TRABAJO EN PYTHON
Técnicas de Aprendizaje Automático (MIA) - PER 11096 -
Octubre 2024  Recursos  Recursos audiovisuales
+
REVISAR TAMBIÉN:
https://scikit-learn.org/stable/modules/ensemble.html
https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.BaggingClassifier.html
https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html
https://scikit-learn.org/1.5/modules/generated/sklearn.ensemble.StackingClassifier.html
https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.StackingRegressor.html

+
Bibliografía complementaria:
Combining Pattern Classifiers: Methods and Algorithms
Ludmila Ilieva Kuncheva

4
INTRODUCCIÓN:
Existe una multiplicidad de diseños de clasificadores
 Se construyen con el próposito:
 En el pasado: encontrar el “mejor” clasificador.
 En el presente: sacar provecho de la diversidad
o Utilizar distintos clasificadores para obtener mayor eficiencia y precisión.
o Clasificadores distintos se equivocan en muestras distintas.

 Especialmente útiles si los clasificadores

individuales son independientes

5
INTRODUCCIÓN:
Existe una multiplicidad de diseños de clasificadores
 Se construyen con el próposito:
 En el pasado: encontrar el “mejor” clasificador.
 En el presente: sacar provecho de la diversidad
o Utilizar distintos clasificadores para obtener mayor eficiencia y precisión.
o Clasificadores distintos se equivocan en muestras distintas.

 Especialmente útiles si los clasificadores Turner y Ghosh (1996)

individuales son independientes mostraron que el
promediado de clasificadores
con errores no
correlados e insesgados
mejoran la performance y
si son infinitos alcanza el
óptimo de Bayes.

6
INTRODUCCIÓN:
Existe una multiplicidad de diseños de clasificadores
 Se construyen con el próposito:
 En el pasado: encontrar el “mejor” clasificador.
 En el presente: sacar provecho de la diversidad
o Utilizar distintos clasificadores para obtener mayor eficiencia y precisión.
o Clasificadores distintos se equivocan en muestras distintas.

 Especialmente útiles si los clasificadores

individuales son independientes
– Dimensionalidad del problema
 Eficiencia: – Complejidad del sistema
– Velocidad
 Precisión

7
INTRODUCCIÓN
El teorema 'no free lunch' en el aprendizaje automático

El teorema "no free lunch" establece que, dado un conjunto de características X

y un conjunto de etiquetas L, no existe un algoritmo de aprendizaje automático
que sea superior a otros en todos los problemas de aprendizaje.

8
INTRODUCCIÓN
El teorema 'no free lunch' en el aprendizaje automático

El teorema "no free lunch" establece que, dado un conjunto de características X

y un conjunto de etiquetas L, no existe un algoritmo de aprendizaje automático
que sea superior a otros en todos los problemas de aprendizaje.

El teorema "no free lunch" no significa que todos los algoritmos de

aprendizaje sean iguales. Simplemente nos dice que los algoritmos no
pueden ser superiores en todos los casos y que el conocimiento
previo sobre el problema de aprendizaje es crucial para obtener
resultados óptimos.

9
FUSIÓN O COMBINACIÓN DE CLASIFICADORES

 La fusión de clasificadores puede mejorar el desempeño del mejor

clasificador y en el algunos casos alcanzar la cota de Bayes.

 Esto es posible si los diferentes clasificadores realizan errores distintos.

Sistema multiclasificadores
• Sistema con múltiples expertos
• Comité de expertos
• Mezcla de expertos
• Ensamble de clasificadores
• Composición de sistemas de clasificación

10
COMBINACIÓN DE CLASIFICADORES: ARQUITECTURA

1. Paralela: Se seleccionan las salidas de los clasificadores individuales o se

pesan antes de ser combinados.

2. Cascada o combinación serie: Se invocan los distintos clasificadores en

forma secuencial.
o Primero se pasa por los más simples y/o menos costosos y luego se refina.

3. Híbrida o Jerárquica: Se combinan los clasificadores en una forma

estructurada como la de los árboles de decisión.
o Cada nodo se asocia con un clasificador complejo (muy eficiente y flexible).

11
COMBINACIÓN DE CLASIFICADORES: ARQUITECTURA

Serie Paralela

12
COMBINACIÓN DE CLASIFICADORES: ARQUITECTURA
Dos ejemplos conocidos de arquitecturas diferentes para lograr clasificación múltiples con SVM

Paralela

Serie
13
COMBINACIÓN DE CLASIFICADORES: ARQUITECTURA

Hibrida

14
ARQUITECTURAS Y MÚLTIPLES FUENTES

Clasificadores distintos, entrenados con los mismos datos,

pueden tener diferente desempeño global y local.

 Cada clasificador tiene su región del espacio de características donde es el

“mejor”.

 Incluir diversidad mediante múltiples fuentes también es una opción

interesante.
 Espacio de características distintos: huellas, voz, caras, iris
 Conjunto de entrenamiento distinto: muestreo
 Clasificadores distintos: DT, SVM, Bayes
 Arquitecturas y Parámetros distintos para los modelos.

15
ARQUITECTURA vs. MÚLTIPLES FUENTES

Características Biométricas

Fusión basada en un
solo espacio de
características pero
• Chequear que una persona es quien refiere ser. con diferentes
• Identificación forense de un individuo desconocido
clasificadores

16
ARQUITECTURA vs. MÚLTIPLES FUENTES

Características Biométricas

Fusión basada en
diferentes espacios de
características y
• Chequear que una persona es quien refiere ser. diferentes clasificadores
• Identificación forense de un individuo desconocido

17
MÉTODOS DE FUSIÓN Y REGLAS DE COMBINACIÓN

 Nivel de decisión (Tipo I)

 Cada clasificador asigna una
clase a cada patrón

 Nivel de ordenamiento (Tipo II)

 Cada clasificador da una lista
ordenada de las posibles clases.

 Nivel de medida de la salida

(Tipo III)  Lista de clases con
índice de confianza

18
MÉTODOS DE FUSIÓN Y REGLAS DE COMBINACIÓN

 Voto por mayoría: Cuenta la

cantidad de votos que tuvo cada
clase y elige la clase con más
votos

 Conteo de Borda: Suma los

rankings para cada clase y elige
la que tiene la mayor suma.

 Regla de la suma: Utiliza la

suma los índices de cada clase,
elige la clase con mejor suma y
requiere normalización de índices.

19
Enfoques para clasificadores Ensemble:
Bootstrap,
Bagging, Boosting, y Stacking

20
TÉCNICA DE MUESTREO BOOSTRAP
En estadística, Bootstrap Sampling es un método basado en una técnica
estadística que consiste en un muestreo aleatorio con
reemplazamiento.

Si tenemos el reto de modelar una población con una muestra de dos

millones de ejemplos de diez millones que realmente son, decimos que
existe una representación de la población, aunque se duda si esta
muestra representa el promedio real de toda la población.

Boostrapping resuelve ese problema: en lugar de calcular la media una

sola vez, lo hace varias veces mediante un remuestreo con reemplazo de la
muestra original.

21
ENFOQUE CON BAGGING

BAGGING es un método para combinar

varias instancias de estimadores que se han
construido sobre muestras aleatorias del
conjunto de entrenamiento original y que
agregan las predicciones individuales para
obtener una predicción única.

Out-of-bag error (OOB)

El error de test en un modelo basado en Bagging se
aborda utilizando el out-of-bag error (OOB), y calcula
usando la muestra de datos (1/3) que no se utilizan para
el entrenamiento.

22
ENFOQUES BOOSTING Y ADABOOST

BOOSTING es un método de combinación de modelos que se puede

aplicar a los modelos de regresión y clasificación.
• No involucra el uso de remuestreo.
• Los modelos se generan de forma secuencial
• En cada iteración de la secuencia los datos son recalibrados.
o Los ejemplos que estaban correctamente clasificados pierden peso y los ejemplos incorrectamente clasificados
ganan peso.

Método Boosting  AdaBoost

• AdaBoost (adaptive boosting) fue propuesto por Freund and Schapire (1995)
• Consiste en crear varios predictores sencillos en secuencia, de tal manera que el segundo ajuste bien
lo que el primero no ajustó, que el tercero ajuste un poco mejor lo que el segundo no pudo ajustar y
así sucesivamente.

23
ENFOQUES BOOSTING Y ADABOOST

24
STACKING
El método de Stacking (denominado también stacked generalization o
meta ensamblado) implica el entrenamiento de un modelo para combinar
las predicciones de otros modelos:
 PASO 1: Entrenar varios modelos sobre
los datos de entrenamiento  modelos
de primer nivel.

 PASO 2: Entrenar el modelo final 

modelo de segundo nivel o stacking
model, sobre los datos originales
considerando como características
adicionales las predicciones de los
primeros. Este modelo final es
frecuentemente una regresión
logística.

25
STACKING
El método de Stacking (denominado también stacked generalization o
meta ensamblado) implica el entrenamiento de un modelo para combinar
las predicciones de otros modelos:

 Válido en escenarios supervisados y no

supervisados.

 El rendimiento aumenta cuanto más diversos

sean los modelos de primer nivel.

 En el segundo nivel puede incluir varios

modelos, siendo posible crear niveles
adicionales (por ejemplo un tercer nivel) en el
que se entrene un modelo basado en las
predicciones de los modelos de segundo nivel.

26
COMPARACIÓN ENTRE BAGGING, BOOSTING, STACKING

27
CONCLUSIONES

28
www.unir.net

También podría gustarte

Semana 4
Aún no hay calificaciones
Semana 4
37 páginas
Multiclasificadores
Aún no hay calificaciones
Multiclasificadores
28 páginas
Combinación de Clasificadores: Bagging y Boosting
Aún no hay calificaciones
Combinación de Clasificadores: Bagging y Boosting
18 páginas
Combinación de Clasificadores: Bagging y Boosting
Aún no hay calificaciones
Combinación de Clasificadores: Bagging y Boosting
42 páginas
Métodos de Ensambles: Bagging, RF y Boosting
Aún no hay calificaciones
Métodos de Ensambles: Bagging, RF y Boosting
78 páginas
Apuntes Master Aprendizaje
Aún no hay calificaciones
Apuntes Master Aprendizaje
6 páginas
Clase 4 - Machine Learning - Clasificación
Aún no hay calificaciones
Clase 4 - Machine Learning - Clasificación
42 páginas
DIP Data Science - Supervised Methods S4
Aún no hay calificaciones
DIP Data Science - Supervised Methods S4
95 páginas
Técnicas de Boosting en Modelos Predictivos
Aún no hay calificaciones
Técnicas de Boosting en Modelos Predictivos
84 páginas
Algoritmos de Clasificación y Regresión
Aún no hay calificaciones
Algoritmos de Clasificación y Regresión
45 páginas
Clase 0207
Aún no hay calificaciones
Clase 0207
22 páginas
Metodología para Análisis de Datos en Minería
Aún no hay calificaciones
Metodología para Análisis de Datos en Minería
4 páginas
Métodos de Ensamblaje en Machine Learning
Aún no hay calificaciones
Métodos de Ensamblaje en Machine Learning
8 páginas
Ensambles de Clasificadores en Machine Learning
Aún no hay calificaciones
Ensambles de Clasificadores en Machine Learning
7 páginas
Conceptos Machine Learning
Aún no hay calificaciones
Conceptos Machine Learning
8 páginas
MUIAEI AA 2024 11 17 Tema 3
Aún no hay calificaciones
MUIAEI AA 2024 11 17 Tema 3
30 páginas
Técnicas de Ensamble: Bagging y Clasificadores
Aún no hay calificaciones
Técnicas de Ensamble: Bagging y Clasificadores
20 páginas
AlgoritmosClasificación - AdaboostGBM
Aún no hay calificaciones
AlgoritmosClasificación - AdaboostGBM
29 páginas
Fundamentos del Aprendizaje Automático
Aún no hay calificaciones
Fundamentos del Aprendizaje Automático
68 páginas
1-Plantilla PPT Talento Tech
Aún no hay calificaciones
1-Plantilla PPT Talento Tech
21 páginas
Algoritmos de Clasificación: Random Forest
100% (1)
Algoritmos de Clasificación: Random Forest
25 páginas
Clasificadores Lineales y SVM en Machine Learning
Aún no hay calificaciones
Clasificadores Lineales y SVM en Machine Learning
17 páginas
Introducción al Aprendizaje Automático
Aún no hay calificaciones
Introducción al Aprendizaje Automático
19 páginas
Informe Mineria de Datos N°5
Aún no hay calificaciones
Informe Mineria de Datos N°5
4 páginas
Modelos Predictivos: Naive Bayes vs Árboles
Aún no hay calificaciones
Modelos Predictivos: Naive Bayes vs Árboles
62 páginas
Comparativa de Aprendizaje Supervisado y No Supervisado
Aún no hay calificaciones
Comparativa de Aprendizaje Supervisado y No Supervisado
18 páginas
Algoritmos de Aprendizaje Automático
Aún no hay calificaciones
Algoritmos de Aprendizaje Automático
3 páginas
TI4. Infografía Técnicas de Análisis de Datos.
Aún no hay calificaciones
TI4. Infografía Técnicas de Análisis de Datos.
5 páginas
Proyecto 1662
Aún no hay calificaciones
Proyecto 1662
72 páginas
Modelos de Machine Learning y Tipos
Aún no hay calificaciones
Modelos de Machine Learning y Tipos
4 páginas
Minería de Datos Clínicos: Clasificación y Evaluación
Aún no hay calificaciones
Minería de Datos Clínicos: Clasificación y Evaluación
55 páginas
Algoritmo KNN
Aún no hay calificaciones
Algoritmo KNN
8 páginas
Algoritmos de Aprendizaje Supervisado en IA
Aún no hay calificaciones
Algoritmos de Aprendizaje Supervisado en IA
45 páginas
Estudio de Bootstrapping en Algoritmos de Clasificacion
Aún no hay calificaciones
Estudio de Bootstrapping en Algoritmos de Clasificacion
82 páginas
Respuestas A Preguntas Sobre Métodos de Ensamble
Aún no hay calificaciones
Respuestas A Preguntas Sobre Métodos de Ensamble
5 páginas
Reducción de Dimensionalidad en Reconocimiento de Formas
0% (1)
Reducción de Dimensionalidad en Reconocimiento de Formas
51 páginas
Combinación de Clasificadores Supervisados
Aún no hay calificaciones
Combinación de Clasificadores Supervisados
54 páginas
Introducción al Machine Learning y Validación
Aún no hay calificaciones
Introducción al Machine Learning y Validación
5 páginas
Ingeniería de Características en Machine Learning
Aún no hay calificaciones
Ingeniería de Características en Machine Learning
20 páginas
Introducción Al Machine Learning - Una Guía Desde Cero
Aún no hay calificaciones
Introducción Al Machine Learning - Una Guía Desde Cero
14 páginas
Teoria Machine Learning
Aún no hay calificaciones
Teoria Machine Learning
8 páginas
Algoritmo XGBoost ML
Aún no hay calificaciones
Algoritmo XGBoost ML
25 páginas
Clustering y Aprendizaje Automático
Aún no hay calificaciones
Clustering y Aprendizaje Automático
21 páginas
Evaluación de Algoritmos de Regresión
Aún no hay calificaciones
Evaluación de Algoritmos de Regresión
16 páginas
Clase 5 DAAF 2023
Aún no hay calificaciones
Clase 5 DAAF 2023
54 páginas
3 Tecnicas Supervisadas - MD
Aún no hay calificaciones
3 Tecnicas Supervisadas - MD
95 páginas
Imágenes en Aprendizaje Automático
Aún no hay calificaciones
Imágenes en Aprendizaje Automático
15 páginas
Modelos de Machine Learning Con Impacto Empresarial - Clasificación, Clustering y Recomendaciones
Aún no hay calificaciones
Modelos de Machine Learning Con Impacto Empresarial - Clasificación, Clustering y Recomendaciones
13 páginas
Bagging vs Boosting: Comparativa
Aún no hay calificaciones
Bagging vs Boosting: Comparativa
9 páginas
06c. Introducción Al Análisis Predictivo de Datos
Aún no hay calificaciones
06c. Introducción Al Análisis Predictivo de Datos
24 páginas
Fundamentos de Aprendizaje Supervisado
Aún no hay calificaciones
Fundamentos de Aprendizaje Supervisado
26 páginas
7-Aprendizaje Automático
Aún no hay calificaciones
7-Aprendizaje Automático
17 páginas
Introducción a Machine Learning y Algoritmos
Aún no hay calificaciones
Introducción a Machine Learning y Algoritmos
38 páginas
Introducción a la Minería de Datos
Aún no hay calificaciones
Introducción a la Minería de Datos
44 páginas
Introducción a la Ciencia de Datos
Aún no hay calificaciones
Introducción a la Ciencia de Datos
59 páginas
Introducción al Aprendizaje Automático
Aún no hay calificaciones
Introducción al Aprendizaje Automático
4 páginas
Notas Telecomunicaciones
Aún no hay calificaciones
Notas Telecomunicaciones
2 páginas
Tumec A01 P002
Aún no hay calificaciones
Tumec A01 P002
2 páginas
Tumec A01 P002 C01
Aún no hay calificaciones
Tumec A01 P002 C01
2 páginas
Tumec A01 p002 Sp2
Aún no hay calificaciones
Tumec A01 p002 Sp2
2 páginas
Tele Comunica C I Ones
Aún no hay calificaciones
Tele Comunica C I Ones
3 páginas
Inteligencia Artificial
Aún no hay calificaciones
Inteligencia Artificial
3 páginas
Archivo 1
Aún no hay calificaciones
Archivo 1
1 página
Tumec A01-P013
Aún no hay calificaciones
Tumec A01-P013
2 páginas
Tumec - A01-P014 SPL 2
Aún no hay calificaciones
Tumec - A01-P014 SPL 2
2 páginas
Tumec A01-P012
Aún no hay calificaciones
Tumec A01-P012
2 páginas
Tumec - A01 P012 C01
Aún no hay calificaciones
Tumec - A01 P012 C01
2 páginas
Presentación Actividad 3
Aún no hay calificaciones
Presentación Actividad 3
14 páginas
Defi 28 Enero
Aún no hay calificaciones
Defi 28 Enero
20 páginas
Secuencia Didáctica Espacios Rurales y Urbanos.
Aún no hay calificaciones
Secuencia Didáctica Espacios Rurales y Urbanos.
19 páginas
Ficha Técnica de Phostoxin Bag
Aún no hay calificaciones
Ficha Técnica de Phostoxin Bag
10 páginas
Orientaciones Técnicas Establecimiento Seguro 2019
Aún no hay calificaciones
Orientaciones Técnicas Establecimiento Seguro 2019
32 páginas
Análisis Sismorresistente con SAP2000
Aún no hay calificaciones
Análisis Sismorresistente con SAP2000
65 páginas
Programa Curso - 1 - Proyectos - Turisticos - para - El - Desarrollo
Aún no hay calificaciones
Programa Curso - 1 - Proyectos - Turisticos - para - El - Desarrollo
10 páginas
Acta de Constitución de SpeaceGamer S.A.
Aún no hay calificaciones
Acta de Constitución de SpeaceGamer S.A.
5 páginas
Comunicación de Siniestros: Guía Rápida
Aún no hay calificaciones
Comunicación de Siniestros: Guía Rápida
2 páginas
Aventura 5
Aún no hay calificaciones
Aventura 5
1 página
Alc - Vivienda Unifamiliar
Aún no hay calificaciones
Alc - Vivienda Unifamiliar
1 página
Eficiencia Adiabática en Compresores
Aún no hay calificaciones
Eficiencia Adiabática en Compresores
2 páginas
Formato de Retro Excavadora
Aún no hay calificaciones
Formato de Retro Excavadora
1 página
Efecto del ajo en acuicultura y salud fish
Aún no hay calificaciones
Efecto del ajo en acuicultura y salud fish
7 páginas
Comunica Sí Leemos Infograficas Sobre Las Tradiciones Culturales de Huaral
Aún no hay calificaciones
Comunica Sí Leemos Infograficas Sobre Las Tradiciones Culturales de Huaral
6 páginas
Geoinformación Territorial Flavio Alfaro
Aún no hay calificaciones
Geoinformación Territorial Flavio Alfaro
38 páginas
Indiana Jones Sands of Adventure Spanish Rules v1.0
Aún no hay calificaciones
Indiana Jones Sands of Adventure Spanish Rules v1.0
11 páginas
Angulo de Fabricación para Codos Combinados
Aún no hay calificaciones
Angulo de Fabricación para Codos Combinados
2 páginas
Lectura de La Realidad
Aún no hay calificaciones
Lectura de La Realidad
53 páginas
63-Proyectos para Electromedicina-17-19
50% (2)
63-Proyectos para Electromedicina-17-19
3 páginas
Reglamento de Polígonos de Tiro
Aún no hay calificaciones
Reglamento de Polígonos de Tiro
10 páginas
NFPA - 402 (Operaciones de Rescate y Combate de Incendios en Aeronaves)
100% (1)
NFPA - 402 (Operaciones de Rescate y Combate de Incendios en Aeronaves)
83 páginas
Historia Pepsico Con Flujogramas
Aún no hay calificaciones
Historia Pepsico Con Flujogramas
31 páginas
Investigación Exploratoria en Trabajo Social
100% (1)
Investigación Exploratoria en Trabajo Social
10 páginas
Sopas de Letras
Aún no hay calificaciones
Sopas de Letras
12 páginas
Introducción a Variables Aleatorias
Aún no hay calificaciones
Introducción a Variables Aleatorias
11 páginas
Test Introducción Al Hacking Ético - Revisión Del Intento
Aún no hay calificaciones
Test Introducción Al Hacking Ético - Revisión Del Intento
3 páginas
La Resta
Aún no hay calificaciones
La Resta
19 páginas
Mujeres en la Ciencia: Proyecto Educativo
Aún no hay calificaciones
Mujeres en la Ciencia: Proyecto Educativo
5 páginas
Tecnicatura Superior en Desarrollo de Software A Distancia
Aún no hay calificaciones
Tecnicatura Superior en Desarrollo de Software A Distancia
2 páginas
Album de Los Sentidos
Aún no hay calificaciones
Album de Los Sentidos
7 páginas