¡Te damos la bienvenida a Scribd!

Resumenes Machine Learning 4

Cargado por

0% encontró este documento útil (0 votos)

6 vistas2 páginas

Este documento resume varios métodos de clasificación y aprendizaje por refuerzo. Bagging genera múltiples modelos sobre diferentes muestras de datos para evitar sobreajuste. Boosting construye modelos secuencialmente centrándose en los datos difíciles para el modelo anterior. Stacking combina las predicciones de varios clasificadores usando un metaclasificador. Q-Learning es un método de aprendizaje por refuerzo que actualiza iterativamente la función Q para maximizar la recompensa esperada.

Descripción original:

Título original

Resumenes machine learning 4

Derechos de autor

Formatos disponibles

PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

6 vistas2 páginas

Resumenes Machine Learning 4

Cargado por

saradt.clase

Copyright:

Formatos disponibles

Descargue como PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 2

Buscar dentro del documento

TEMA 7: CONJUNTOS DE CLASIFICADORES

• Bagging: se crean modelos base paralelamente, con el mismo método. Clasifica los datos por
votación y regresión con medias.

Objetivo: evitar que los métodos se adapten excesivamente a las muestras de entrenamiento;
esto se consigue generando métodos sobre diferentes muestras y calculando sus medias.

Bagging (D, B, T)

• Randomnización: creación de varios modelos. Existen algoritmos estocásticos que cada vez que
se usa, generan modelos ligeramente diferentes (ej: redes neuronales, con sus pesos iniciales
aleatorios)

• Boosting: construye modelos base de forma secuencial, cuando uno se centra en datos difíciles
para el anterior.

• Stacking: combina decisiones de clasificadores utilizando el concepto de “meta-clasificador”.

Entrena modelo para combinar predicciones de los otros:

1) Entrena aprendices sobre datos de entreno (modelos nivel 0)

2) Entrena modelo final (nivel 1) sobre datos originales.

• Método Monte Carlo: estimación de una función f(x), que dice, dado un par de “estado-acción”,
el refuerzo acumulado esperado.

• Q-Learning: aprendizaje por prueba y error.

Q(s,a)

s = estado inicial; a = acción

• Funciones de Actualización
o Determinista: devuelve mismos resultados.
o No determinista: devuelve diferentes resultados.

26
TEMA 8: APRENDIZAJE POR REFUERZO

1. INTRODUCCIÓN

- Problema de Aprendizaje por Refuerzo (definido como MDP):

o Conjunto de todos los posibles estados (S)

o Conjunto de todas las posibles acciones (A)
o Función de transición de estados desconocida (T : S × A × S → ℜ)
o Función de refuerzo desconocida (R : S × A → ℜ)

- Objetivo: aprender política de acción (Π : S → A) que maximice refuerzo medio esperado.

2. MÉTODO MONTE CARLO

- Estima función Q à dice (dado un par estado-acción) el refuerzo acumulado a obtener.

- Basado en:
o alternar evaluación de política y su mejora
o la ejecución de episodios de aprendizaj
o actualización de Q basada en media de refuerzos obtenidos en distintos episodios.

3. REPRESENTACIÓN TABULAR DE LA FUNCIÓN Q

- Problema: espacio de estados continuo/de gran tamaño.

- Solución: métodos de generalización:
o Aproximaciones ad-hoc basadas en conocimiento del dominio
o Discretización del espacio de estados
o Aproximación de funciones

4. Q-LEARNING (WATKINS, 1989)

- Aprendizaje por prueba y error.

Q-Learning (γ, α)
› Inicializar Q(s, a), ∀s ∈ S, a ∈ A
› Repetir (para cada episodio)
› Inicializa el estado inicial, s, aleatoriamente.
› Repetir (para cada paso del episodio)
- Selecciona una acción a y ejecútala
- Recibe el estado actual (s) y el refuerzo (r)
- Q(s, a) ← Q(s, a) + α[r + γ maxaʹ Q(sʹ, aʹ) − Q(s, a)]
- Asigna s ← sʹ
› Devuelve Q(s, a)

También podría gustarte

FN Sem11
Documento12 páginas
FN Sem11
Melidy Eided Hinostroza Mitacc
Aún no hay calificaciones
Laboratorio N°9 SC2
Documento5 páginas
Laboratorio N°9 SC2
Brayan VQ
Aún no hay calificaciones
0104 Arquitectura Del Computador
Documento186 páginas
0104 Arquitectura Del Computador
daniela
Aún no hay calificaciones
Algebra 2 - Patrones Multiplicativos 4to
Documento4 páginas
Algebra 2 - Patrones Multiplicativos 4to
Victor Alberto Peña Flores
100% (2)
Álgebra clásica
De Everand
Álgebra clásica
Gonzalo Masjuán Torres
Aún no hay calificaciones
Reporte 3 POO Con El Profesor Edgar Tista
Documento12 páginas
Reporte 3 POO Con El Profesor Edgar Tista
marcoantonio1103
100% (1)
Evaluación Propiedad Conmutativa y Asociativa
Documento2 páginas
Evaluación Propiedad Conmutativa y Asociativa
ANA CORDOVA
Aún no hay calificaciones
Programacion No Lineal
Documento8 páginas
Programacion No Lineal
olivermancedca
Aún no hay calificaciones
K Medias I
Documento18 páginas
K Medias I
aoky
Aún no hay calificaciones
Marcoteoricoaprendizaje Qlearning
Documento10 páginas
Marcoteoricoaprendizaje Qlearning
Alejandro Estrada Padilla
Aún no hay calificaciones
Guía de Referencia de Scikit-Learn
Documento1 página
Guía de Referencia de Scikit-Learn
Anthony Guzman Lopez
Aún no hay calificaciones
Semana 07 - 2022-2f
Documento75 páginas
Semana 07 - 2022-2f
sebastian mundaca
Aún no hay calificaciones
Inteligencia Artificial
Documento9 páginas
Inteligencia Artificial
SantiNeira
Aún no hay calificaciones
Clase 06 Aprendizaje Por Refuerzo
Documento22 páginas
Clase 06 Aprendizaje Por Refuerzo
Yesica Lima Contreras
Aún no hay calificaciones
2-Algoritmos Voraces
Documento97 páginas
2-Algoritmos Voraces
Mauricio Lezama
Aún no hay calificaciones
Aprendizaje Por Refuerzo Tradicional y Profundo (Reinforcement Learning)
Documento13 páginas
Aprendizaje Por Refuerzo Tradicional y Profundo (Reinforcement Learning)
francisco reales
Aún no hay calificaciones
EXA-2021-2S-CÁLCULO VECTORIAL-8-2Parcial
Documento19 páginas
EXA-2021-2S-CÁLCULO VECTORIAL-8-2Parcial
Gerardo Rosero
Aún no hay calificaciones
Reporte P10
Documento6 páginas
Reporte P10
luis gonzalez
Aún no hay calificaciones
Práctica 3 de Sistemas de Control
Documento11 páginas
Práctica 3 de Sistemas de Control
JorgeGarcia
Aún no hay calificaciones
ExamenSustitutorio CC421
Documento11 páginas
ExamenSustitutorio CC421
RONALDO LOPEZ CAMPOMANES
Aún no hay calificaciones
Fenao 0005 U2 C7 ST
Documento4 páginas
Fenao 0005 U2 C7 ST
Juan Pablo Lamilla Estrada
Aún no hay calificaciones
Milestone Challenge en El Conjunto de Datos de Bicicletas Usadas
Documento12 páginas
Milestone Challenge en El Conjunto de Datos de Bicicletas Usadas
ScribdTranslations
Aún no hay calificaciones
Pep I Econometría
Documento2 páginas
Pep I Econometría
Felipe López
Aún no hay calificaciones
984 Metodos Cuantitativos en La Empresa PDF
Documento4 páginas
984 Metodos Cuantitativos en La Empresa PDF
car
Aún no hay calificaciones
4-Programacion Dinamica
Documento105 páginas
4-Programacion Dinamica
Mario Guzman
Aún no hay calificaciones
24 de JUNIO - PROPIEDADES DE LA MULTIPLICACION
Documento5 páginas
24 de JUNIO - PROPIEDADES DE LA MULTIPLICACION
Nya///.///
Aún no hay calificaciones
Cuaderno de Ejercicios de DOE.
Documento173 páginas
Cuaderno de Ejercicios de DOE.
Juan Carlos Santiesteban Aguilar
Aún no hay calificaciones
(05-4) MatClase 01 - AG - Agentes Inteligentes
Documento53 páginas
(05-4) MatClase 01 - AG - Agentes Inteligentes
johannavargasf05
Aún no hay calificaciones
Trabajo de Practico AM II-1
Documento6 páginas
Trabajo de Practico AM II-1
Priscila Cornejo
Aún no hay calificaciones
Prog Est Avanzadas 1
Documento47 páginas
Prog Est Avanzadas 1
Jeronimo Quesada
Aún no hay calificaciones
S02 Determinantes
Documento19 páginas
S02 Determinantes
Avril Gonzales Asto
Aún no hay calificaciones
Semestral EDOS MC JS
Documento6 páginas
Semestral EDOS MC JS
Maria Castillo
Aún no hay calificaciones
Práctica Nº3
Documento3 páginas
Práctica Nº3
DARMA01
Aún no hay calificaciones
Taller 3
Documento2 páginas
Taller 3
Nicolas Álvarez Bernal
Aún no hay calificaciones
6RN Con Sklearn 5
Documento14 páginas
6RN Con Sklearn 5
Victor
Aún no hay calificaciones
EsquemasAlgoritmicos VueltaAtras
Documento8 páginas
EsquemasAlgoritmicos VueltaAtras
josemanuel
Aún no hay calificaciones
Aaa2 - Huacanca Padilla, Denys Farid - Sección CS37
Documento5 páginas
Aaa2 - Huacanca Padilla, Denys Farid - Sección CS37
Denys farid Huacanca Padilla
Aún no hay calificaciones
Refuerzo PDF
Documento38 páginas
Refuerzo PDF
Fredy Calsin Cari
Aún no hay calificaciones
Algoritmos Voraces
Documento25 páginas
Algoritmos Voraces
null
Aún no hay calificaciones
Parcial Final - Algebra Lineal
Documento14 páginas
Parcial Final - Algebra Lineal
Michael
Aún no hay calificaciones
Matematicas para Redes Neuronales Profundas Profa Olga
Documento25 páginas
Matematicas para Redes Neuronales Profundas Profa Olga
Tavo Tavo
Aún no hay calificaciones
Ejercicios Potencias 1º ESO
Documento1 página
Ejercicios Potencias 1º ESO
soysuperguay
Aún no hay calificaciones
Ejercicios de Practicas
Documento8 páginas
Ejercicios de Practicas
txarlye
Aún no hay calificaciones
Retroalimentación-Oper-Comp Func
Documento1 página
Retroalimentación-Oper-Comp Func
Antony Yucra Morales
Aún no hay calificaciones
IA & ML Optimizacion de Busquedas - 15 Combinación de Clasi Cadores
Documento21 páginas
IA & ML Optimizacion de Busquedas - 15 Combinación de Clasi Cadores
jeison_130
Aún no hay calificaciones
DB3 - 2B Bryan Matailo
Documento6 páginas
DB3 - 2B Bryan Matailo
Bryan Matailo
Aún no hay calificaciones
6 Ein7937 c10 Guia Ejercicios
Documento3 páginas
6 Ein7937 c10 Guia Ejercicios
Katherine Dominguez
Aún no hay calificaciones
Ejercicios de Repaso Primer Parcial (MPE)
Documento5 páginas
Ejercicios de Repaso Primer Parcial (MPE)
Francisco Mundo
Aún no hay calificaciones
Algoritmos de Aprendizaje Supervisado
Documento39 páginas
Algoritmos de Aprendizaje Supervisado
Ishioka Cosplay
Aún no hay calificaciones
4o Medio Guia Autoaprendizaje Potencias
Documento2 páginas
4o Medio Guia Autoaprendizaje Potencias
MAURICIO ALEJANDRO SANDOVAL CONTRERAS
Aún no hay calificaciones
1er Parcial - Revisión Del Intento - Campus Virtual
Documento13 páginas
1er Parcial - Revisión Del Intento - Campus Virtual
Rocío Navarro
Aún no hay calificaciones
(ACDB1-15%) Foro Sistemas de Ecuaciones Lineales
Documento5 páginas
(ACDB1-15%) Foro Sistemas de Ecuaciones Lineales
mauricio
Aún no hay calificaciones
Ejercicios Python
Documento7 páginas
Ejercicios Python
Emerson Asto Rodriguez
0% (1)
Preparando El Examen Final - Caso 2019 2
Documento3 páginas
Preparando El Examen Final - Caso 2019 2
Joaquín Cruz
Aún no hay calificaciones
Sesión 06 - Algoritmos de Retroceso
Documento50 páginas
Sesión 06 - Algoritmos de Retroceso
AnthonyRosas
Aún no hay calificaciones
001 - Machine Learning
Documento10 páginas
001 - Machine Learning
CRCR6
Aún no hay calificaciones
05 Backtracking
Documento75 páginas
05 Backtracking
Pedro Menéndez
Aún no hay calificaciones
U1. Actividad de Aprendizaje para RA 1 - Taller Derivadas Parciales - CÁLCULO VECTORIAL
Documento8 páginas
U1. Actividad de Aprendizaje para RA 1 - Taller Derivadas Parciales - CÁLCULO VECTORIAL
Wendy Mora
Aún no hay calificaciones
Evaluacion Practica Matematicas
Documento6 páginas
Evaluacion Practica Matematicas
Andrea Ramirez
Aún no hay calificaciones
Capí Tulo I. Formas Cuadra Ticas: Ejercicio 1
Documento4 páginas
Capí Tulo I. Formas Cuadra Ticas: Ejercicio 1
grenovsuper
Aún no hay calificaciones
Guia de Practica.
Documento5 páginas
Guia de Practica.
Santos Pava
Aún no hay calificaciones
Tarea de Matematica 3p (E)
Documento16 páginas
Tarea de Matematica 3p (E)
elias dominguez buelvas
Aún no hay calificaciones
Libro de Operaciones Formatos
Documento10 páginas
Libro de Operaciones Formatos
Fredy pucyura huari
Aún no hay calificaciones
Tarea I de Ingeniería Sísmica UTP
Documento8 páginas
Tarea I de Ingeniería Sísmica UTP
Paul
Aún no hay calificaciones
Flujo Bifasico
Documento17 páginas
Flujo Bifasico
Angela Centofanti Rodriguez
Aún no hay calificaciones
06 Interpretacionplanos Contenidos PDF
Documento29 páginas
06 Interpretacionplanos Contenidos PDF
David Antonio Olivares Olivares
Aún no hay calificaciones
Fo - sst.22 Hoja de Vida de Equipos de Protección Contra Caídas
Documento20 páginas
Fo - sst.22 Hoja de Vida de Equipos de Protección Contra Caídas
Lizzeth Natalia Villar
Aún no hay calificaciones
Prueba Diagnóstico Informática
Documento1 página
Prueba Diagnóstico Informática
Iris Claudia Rocha Martinez
Aún no hay calificaciones
Plan Estrategico 2021 2023 Istec
Documento44 páginas
Plan Estrategico 2021 2023 Istec
Daniel MG
Aún no hay calificaciones
Iec 61215 2 2016pdf
Documento100 páginas
Iec 61215 2 2016pdf
diezar
Aún no hay calificaciones
1 CPA 2006 - Auscultación en Argentina
Documento22 páginas
1 CPA 2006 - Auscultación en Argentina
Jorge Romero
Aún no hay calificaciones
Vigas de Celosia
Documento11 páginas
Vigas de Celosia
JD Tenorio
Aún no hay calificaciones
Programa de Mantenimiento de Los Equipos
Documento2 páginas
Programa de Mantenimiento de Los Equipos
Alisohn Andrea Cutiño Lima
Aún no hay calificaciones
Ups GT002146
Documento166 páginas
Ups GT002146
jefferson rodriguez
Aún no hay calificaciones
GEHC Service Manual - CARESCAPE Monitor B650 v1 7.en - Es
Documento20 páginas
GEHC Service Manual - CARESCAPE Monitor B650 v1 7.en - Es
Maria Chirinos Rodriguez
Aún no hay calificaciones
Zevallos Estrada, Manuel Orlando
Documento133 páginas
Zevallos Estrada, Manuel Orlando
jfxm62mh6r
Aún no hay calificaciones
Apendice Tablas Estadísticas Sensorial 2018 PDF
Documento29 páginas
Apendice Tablas Estadísticas Sensorial 2018 PDF
Gísvel Rentería
Aún no hay calificaciones
Mi Tesis Servicios Contables N.R. C.A. Nilda Rodriguez
Documento21 páginas
Mi Tesis Servicios Contables N.R. C.A. Nilda Rodriguez
alex
Aún no hay calificaciones
Sonido y Requerimientos Tecnicos Diapositivas
Documento37 páginas
Sonido y Requerimientos Tecnicos Diapositivas
MarcoVillaranReyes
Aún no hay calificaciones
Proyecto de Investigacion de Mercados Parte 2 01
Documento21 páginas
Proyecto de Investigacion de Mercados Parte 2 01
Wilkins Jose Cuello Gomez
Aún no hay calificaciones
Topcon Link PDF
Documento11 páginas
Topcon Link PDF
isaac901202
Aún no hay calificaciones
Crackeo Elegante
Documento14 páginas
Crackeo Elegante
Fernando Gonzalez
Aún no hay calificaciones
Proyecto Venta de Multiservicios
Documento34 páginas
Proyecto Venta de Multiservicios
Rogelio Sanchez Trejo
Aún no hay calificaciones
Mat 001705539
Documento2 páginas
Mat 001705539
Brayan Ribaldo Ochoa Moreno
Aún no hay calificaciones
3er Cuestionario - MKTG
Documento2 páginas
3er Cuestionario - MKTG
Nora Lizet Anccasi
Aún no hay calificaciones
POBLACION
Documento8 páginas
POBLACION
Sergio Martinez
Aún no hay calificaciones
Dop, Dap
Documento11 páginas
Dop, Dap
Pablo Monar
Aún no hay calificaciones
Fascículo U1
Documento42 páginas
Fascículo U1
Helena Garcia Rojas
Aún no hay calificaciones
C1 Introducción PDF
Documento41 páginas
C1 Introducción PDF
Alexander Macedo
Aún no hay calificaciones
3°clase 24-Ag-2021-2) Formulación de Un Modelo Matemático
Documento20 páginas
3°clase 24-Ag-2021-2) Formulación de Un Modelo Matemático
mileth pinto
Aún no hay calificaciones