Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Resumenes Machine Learning 4
Resumenes Machine Learning 4
• Bagging: se crean modelos base paralelamente, con el mismo método. Clasifica los datos por
votación y regresión con medias.
Objetivo: evitar que los métodos se adapten excesivamente a las muestras de entrenamiento;
esto se consigue generando métodos sobre diferentes muestras y calculando sus medias.
Bagging (D, B, T)
• Randomnización: creación de varios modelos. Existen algoritmos estocásticos que cada vez que
se usa, generan modelos ligeramente diferentes (ej: redes neuronales, con sus pesos iniciales
aleatorios)
• Boosting: construye modelos base de forma secuencial, cuando uno se centra en datos difíciles
para el anterior.
• Método Monte Carlo: estimación de una función f(x), que dice, dado un par de “estado-acción”,
el refuerzo acumulado esperado.
Q(s,a)
• Funciones de Actualización
o Determinista: devuelve mismos resultados.
o No determinista: devuelve diferentes resultados.
26
TEMA 8: APRENDIZAJE POR REFUERZO
1. INTRODUCCIÓN
27