¡Te damos la bienvenida a Scribd!

Sistemas Inteligentes Clase 4-Ejercicios

Cargado por

0% encontró este documento útil (0 votos)

18 vistas7 páginas

Este documento presenta conceptos introductorios sobre aprendizaje automático reforzado, incluyendo métodos para generar el valor de una acción y actualizar promedios de recompensas de forma incremental con cálculos pequeños. También incluye preguntas sobre cómo se comporta la estimación de valores cuando hay muchos o pocos pasos, y cuando la diferencia entre la recompensa y el valor estimado es grande o pequeña.

Descripción original:

Derechos de autor

Formatos disponibles

PPT, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como PPT, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

18 vistas7 páginas

Sistemas Inteligentes Clase 4-Ejercicios

Cargado por

Gustavo Merino

Copyright:

Formatos disponibles

Descargue como PPT, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 7

Buscar dentro del documento

Objetivos

• En esta clase se revisaran concepto introductorios del aprendizaje

automático reforzado y se definen métodos para generar el valor de una
acción.

Casa Central: Toesca 1783 | Mesa Central: 2 2582 6000

La Serena: Av. Francisco de Aguirre 0405 | Mesa Central: 51 247 9150
Implementación incremental

Sea Ri ahora la recompensa recibida después de la i-ésima selección de esta acción, y sea Qn la
estimación del valor de su acción después de haber sido seleccionada n - 1 veces, que ahora
podemos escribir simplemente como

Casa Central: Toesca 1783 | Mesa Central: 2 2582 6000

La Serena: Av. Francisco de Aguirre 0405 | Mesa Central: 51 247 9150
Implementación incremental

Es fácil y mejor idear fórmulas incrementales

para actualizar promedios con cálculos
pequeños y constantes necesarios para
procesar cada nueva recompensa. Dadas Qn y
la n-ésima recompensa, Rn, el nuevo
promedio de todas las n recompensas puede
calcularse mediante.

Casa Central: Toesca 1783 | Mesa Central: 2 2582 6000

La Serena: Av. Francisco de Aguirre 0405 | Mesa Central: 51 247 9150
Trabajo en clases
• Responda las siguientes preguntas para el caso de estimación de Qn+1 estacionario

• 1. Si la cantidad de pasos es grande que pasa con la estimación de Qn+1

• 2. Si la cantidad de pasos es pequeña que pasa con la estimación de Qn+1

• 3. ¿Qué sucede si Qn es igual a Rn.

• 4. ¿Qué sucede si la diferencia entre la recompensa y el valor de la acción es grande?

• 5. ¿Qué sucede si la diferencia entre la recompensa y el valor de la acción es pequeño?

Casa Central: Toesca 1783 | Mesa Central: 2 2582 6000

La Serena: Av. Francisco de Aguirre 0405 | Mesa Central: 51 247 9150
Implementación incremental

Inicializar, para a=1 hasta k

Q(a) = 0
¿Cual es la complejidad del
N(a) = 0
algoritmo?
Loop:
A= max Q(a) con probabilidad 1-e Defina una estrategia para
a (acción aleatoria) con probabilidad e mejorar este algoritmo en cuanto
R = bandido(A) al recurso computacional utilizado
para resolver un problema
N(A) = N(A)+1
complejo de muchas opciones.
Qn+1 = Qn + (1/n) [Rn – Qn]

Casa Central: Toesca 1783 | Mesa Central: 2 2582 6000

La Serena: Av. Francisco de Aguirre 0405 | Mesa Central: 51 247 9150

También podría gustarte

1) Trabajo de Investigación Sobre Algoritmos
Documento4 páginas
1) Trabajo de Investigación Sobre Algoritmos
darielyreyes04
Aún no hay calificaciones
Problemas resueltos de Hidráulica de Canales
De Everand
Problemas resueltos de Hidráulica de Canales
Máximo Villón Béjar
Calificación: 4.5 de 5 estrellas
4.5/5 (7)
La Guía Definitiva en Matemáticas para el Ingreso a la Universidad
De Everand
La Guía Definitiva en Matemáticas para el Ingreso a la Universidad
Heinrich Grothendieck
Calificación: 4 de 5 estrellas
4/5 (11)
Capitulo 2 Sistemas Digitales Tocci
Documento3 páginas
Capitulo 2 Sistemas Digitales Tocci
Miguel TGC
Aún no hay calificaciones
Laboratorio N°9 SC2
Documento5 páginas
Laboratorio N°9 SC2
Brayan VQ
Aún no hay calificaciones
Álgebra clásica
De Everand
Álgebra clásica
Gonzalo Masjuán Torres
Aún no hay calificaciones
Problemas de sucesiones recurrentes
De Everand
Problemas de sucesiones recurrentes
Yu Takeuchi
Calificación: 5 de 5 estrellas
5/5 (1)
Parcial 1 Abr 2016
Documento1 página
Parcial 1 Abr 2016
Steven Ramirez
Aún no hay calificaciones
1 ICI Métodos Estadísticos S4 PPT1 Unidad 4
Documento68 páginas
1 ICI Métodos Estadísticos S4 PPT1 Unidad 4
Cristian Ponce
Aún no hay calificaciones
Nyquist y Margen de Ganancia, Fase
Documento12 páginas
Nyquist y Margen de Ganancia, Fase
ferlocoton
Aún no hay calificaciones
Optimización Bajo Incertidumbre
Documento52 páginas
Optimización Bajo Incertidumbre
Ramón Rico Moreno
Aún no hay calificaciones
Analisis y Diseño de Algoritmos - Guia1
Documento4 páginas
Analisis y Diseño de Algoritmos - Guia1
Fabián Ríos Carvajal
Aún no hay calificaciones
Complejidad Computacional Estructura de Datos
Documento38 páginas
Complejidad Computacional Estructura de Datos
José Nicolás Jorquera Herrera
Aún no hay calificaciones
Riezgo Cervantes Sanchez - Control - Tarea1 1
Documento39 páginas
Riezgo Cervantes Sanchez - Control - Tarea1 1
ANGEL DAVID SOTO OSORNIO
Aún no hay calificaciones
EvaluacionFinal Grupo 2
Documento24 páginas
EvaluacionFinal Grupo 2
Luis German Ceron
Aún no hay calificaciones
3-Divide y Venceras PDF
Documento62 páginas
3-Divide y Venceras PDF
Alder Friederich Yacila Espinoza
Aún no hay calificaciones
S04.s2 - LABORATORIO T14
Documento38 páginas
S04.s2 - LABORATORIO T14
Adrian Pachas Pazos
Aún no hay calificaciones
Modelo Matematico para El Acondicionamiento de Senales
Documento15 páginas
Modelo Matematico para El Acondicionamiento de Senales
Rene Alberto Alvarez Sierra
Aún no hay calificaciones
Unidad 1 Paso 2 Trabajo Colaborativo Grupo 382
Documento27 páginas
Unidad 1 Paso 2 Trabajo Colaborativo Grupo 382
Thaylor Mosquera Castro
Aún no hay calificaciones
Tarea 4 - Grupo100412 - 335
Documento27 páginas
Tarea 4 - Grupo100412 - 335
Lizeth Galviz
Aún no hay calificaciones
Guia de Laboratorio N°5 - Grupo 7
Documento11 páginas
Guia de Laboratorio N°5 - Grupo 7
Saul Champac
Aún no hay calificaciones
Unidad 5
Documento24 páginas
Unidad 5
Julian Denis
Aún no hay calificaciones
EM M3 A8 AldoJavier Rivas
Documento6 páginas
EM M3 A8 AldoJavier Rivas
Aldo Javier Rivas Vázquez
Aún no hay calificaciones
3-Divide y Venceras
Documento61 páginas
3-Divide y Venceras
Andrés Gonzales Lezama
Aún no hay calificaciones
1 ICI Investigación de Operaciones S2 PPT1Método Gráfico
Documento29 páginas
1 ICI Investigación de Operaciones S2 PPT1Método Gráfico
Lionel
Aún no hay calificaciones
SEMANA 4 Función Cuadrática PDF
Documento27 páginas
SEMANA 4 Función Cuadrática PDF
eli javier revilla sanchez
Aún no hay calificaciones
Clase Semana 2 MN PDF
Documento33 páginas
Clase Semana 2 MN PDF
Diego Joel
Aún no hay calificaciones
SESIÓN 2.2 - Sumatorias-Propiedades
Documento14 páginas
SESIÓN 2.2 - Sumatorias-Propiedades
Richard Carrasco
Aún no hay calificaciones
Trabajo Final Est
Documento23 páginas
Trabajo Final Est
Edyan Enrique De La Cruz
Aún no hay calificaciones
3 ICI Investigación de Operaciones S2 PPT3 Método Simplex DOS FACES
Documento21 páginas
3 ICI Investigación de Operaciones S2 PPT3 Método Simplex DOS FACES
Lionel
Aún no hay calificaciones
Teoría de Control
Documento15 páginas
Teoría de Control
Jorge Alonso D
Aún no hay calificaciones
Ecuaciones de Automatizacion
Documento7 páginas
Ecuaciones de Automatizacion
Ces Cr
Aún no hay calificaciones
EXAMEN FINAL Ingenieria Procesos
Documento7 páginas
EXAMEN FINAL Ingenieria Procesos
Kmpos Percy
Aún no hay calificaciones
T3 19 MilagrosJCoronado
Documento11 páginas
T3 19 MilagrosJCoronado
elvis
Aún no hay calificaciones
Laboratorio 8 Control de Procesos
Documento17 páginas
Laboratorio 8 Control de Procesos
Alberto Miguel Quispe Lima
Aún no hay calificaciones
Series Numericas
Documento29 páginas
Series Numericas
VyCtor's Monterrosa
Aún no hay calificaciones
Tema2 Transparencias
Documento107 páginas
Tema2 Transparencias
tsuru108
Aún no hay calificaciones
Informe Previo 5
Documento5 páginas
Informe Previo 5
LuceroMilagrosCubaMiranda
Aún no hay calificaciones
Lab 01 CO-pacherrez Quinde David
Documento11 páginas
Lab 01 CO-pacherrez Quinde David
David Pacherrez
Aún no hay calificaciones
Repaso de Series de Potencia
Documento45 páginas
Repaso de Series de Potencia
Angel Sandonas Romero
Aún no hay calificaciones
Matemáticas 1 MKT-U3
Documento69 páginas
Matemáticas 1 MKT-U3
Humberto Garcia Cedillo
Aún no hay calificaciones
1 5107213519401518323
Documento15 páginas
1 5107213519401518323
Andres Mora
Aún no hay calificaciones
Tarea 3 - Diseñar Compensadores Según Respuesta en Frecuencia y Sintonización de Controladores.
Documento18 páginas
Tarea 3 - Diseñar Compensadores Según Respuesta en Frecuencia y Sintonización de Controladores.
Sneider Alvarez
100% (1)
Universidad de La Serena
Documento14 páginas
Universidad de La Serena
HECTOR JOVANNY HEREDIA ARANCIBIA
Aún no hay calificaciones
Desafío 02 (Problema - La Sucesión 3n + 1 (O Sucesión de Collatz) ) - Revisión Del Intento - UV
Documento5 páginas
Desafío 02 (Problema - La Sucesión 3n + 1 (O Sucesión de Collatz) ) - Revisión Del Intento - UV
consuelo
Aún no hay calificaciones
Entrega Final Del Proyecto Control Digital
Documento26 páginas
Entrega Final Del Proyecto Control Digital
shirlyalvarez83
Aún no hay calificaciones
RETO - SEMANA 1 Phyton
Documento5 páginas
RETO - SEMANA 1 Phyton
Juan Jesus Figueroa Chipana
100% (1)
Clase13 PDF
Documento18 páginas
Clase13 PDF
Néstor Dávila Flores
Aún no hay calificaciones
Determinantes
Documento17 páginas
Determinantes
FRED LEAL RIVERA
Aún no hay calificaciones
Informe 2
Documento11 páginas
Informe 2
luis p guerrero
Aún no hay calificaciones
Pautacontrol 3
Documento6 páginas
Pautacontrol 3
fbargstedramirez
Aún no hay calificaciones
Ut8. Actividades Resueltas
Documento20 páginas
Ut8. Actividades Resueltas
Daniel Garcia Fradejas
Aún no hay calificaciones
Prueba 1 Repaso Fundamentos
Documento2 páginas
Prueba 1 Repaso Fundamentos
Rodri Lopez
Aún no hay calificaciones
Lab 05
Documento30 páginas
Lab 05
Diego Fernandez Arteaga
Aún no hay calificaciones
Diseño de Controladores Experimentales
Documento6 páginas
Diseño de Controladores Experimentales
Andrea Fajardo
Aún no hay calificaciones
2020 D7 Medidas Posicion
Documento39 páginas
2020 D7 Medidas Posicion
Jeremy Richard Cj
Aún no hay calificaciones
Análisis de Un Algoritmo - S4
Documento24 páginas
Análisis de Un Algoritmo - S4
Alberto Rodriguez
Aún no hay calificaciones
TAREA 1 - Señales y Sistemas
Documento28 páginas
TAREA 1 - Señales y Sistemas
cristian camilo contreras diaz
100% (1)
Curso básico de teoría de números
De Everand
Curso básico de teoría de números
Sebastian Castañeda Hernández
Calificación: 5 de 5 estrellas
5/5 (2)
Ejercicios de Logaritmos y Exponenciales
De Everand
Ejercicios de Logaritmos y Exponenciales
Simone Malacrida
Aún no hay calificaciones
Retos matemáticos con soluciones
De Everand
Retos matemáticos con soluciones
Juan Flaquer
Calificación: 3.5 de 5 estrellas
3.5/5 (8)
2 Numeros Signados
Documento31 páginas
2 Numeros Signados
Alejandro Vasquez
Aún no hay calificaciones
Breviario s7 200
Documento6 páginas
Breviario s7 200
Victor Arias
Aún no hay calificaciones
Trabajo de Mañana Poo
Documento10 páginas
Trabajo de Mañana Poo
JhonnySanchez
Aún no hay calificaciones
Grafos4 5
Documento60 páginas
Grafos4 5
Eduardo Rosales
Aún no hay calificaciones
Hechos y Reglas en Prolog
Documento24 páginas
Hechos y Reglas en Prolog
Mario Enrique Baide Pascua
Aún no hay calificaciones
4 - Logicaprop
Documento38 páginas
4 - Logicaprop
Claudia Yanina González
Aún no hay calificaciones
Yiselle Espinal Vargas 100605551 Foro Unidad 6
Documento3 páginas
Yiselle Espinal Vargas 100605551 Foro Unidad 6
Marileidis Del Carmen
Aún no hay calificaciones
03 Lenguajes Regulares
Documento34 páginas
03 Lenguajes Regulares
janus2101_317187901
Aún no hay calificaciones
Trabajo Práctico #2 UCASAL Seguridad Informatica
Documento2 páginas
Trabajo Práctico #2 UCASAL Seguridad Informatica
Micaela Escudero
Aún no hay calificaciones
Análisis Sintáctico
Documento24 páginas
Análisis Sintáctico
anon_688211329
Aún no hay calificaciones
Teoría de Grafos
Documento10 páginas
Teoría de Grafos
Hun
Aún no hay calificaciones
Mapa Conceptual Guia 1
Documento1 página
Mapa Conceptual Guia 1
Andres Cifuentes
Aún no hay calificaciones
Pseudocódigo Diagrama de Flujo: Ejercicios en Clase
Documento3 páginas
Pseudocódigo Diagrama de Flujo: Ejercicios en Clase
Marly Palacios Bedoya
Aún no hay calificaciones
Ejercicios
Documento7 páginas
Ejercicios
Claudia Yazmin Romero Barrera
Aún no hay calificaciones
Divide YVenceras
Documento35 páginas
Divide YVenceras
Jonathan Almache Montoya
Aún no hay calificaciones
Guia Algoritmos 2020
Documento27 páginas
Guia Algoritmos 2020
victor FLORES
Aún no hay calificaciones
P7. Programa Saludo
Documento6 páginas
P7. Programa Saludo
VICTOR ALEXIS MIRAMONTES MENDOZA
Aún no hay calificaciones
Guia 3
Documento7 páginas
Guia 3
Candida López Loayza
Aún no hay calificaciones
Unidad 4
Documento8 páginas
Unidad 4
Henrry Uray
Aún no hay calificaciones
Sentencias Repetitivas Semana 6
Documento7 páginas
Sentencias Repetitivas Semana 6
Juan Diego Ospina
Aún no hay calificaciones
CA105 DSintetica R01
Documento16 páginas
CA105 DSintetica R01
fer 2101
Aún no hay calificaciones
Polinomio de Chebyshev y Fenómeno de Runge
Documento8 páginas
Polinomio de Chebyshev y Fenómeno de Runge
Eddy Rock
Aún no hay calificaciones
(AC-S04-PA3) Participación en Clase 3
Documento3 páginas
(AC-S04-PA3) Participación en Clase 3
Granja De Cuy Flor De Canela LM
Aún no hay calificaciones
Programa Polinomio de Lagrange Andres Bernal - Camilo Torres
Documento5 páginas
Programa Polinomio de Lagrange Andres Bernal - Camilo Torres
Andres Felipe Bernal Navas
Aún no hay calificaciones
Algoritmo de Booth Modificado FRANCISCO
Documento5 páginas
Algoritmo de Booth Modificado FRANCISCO
Francisco Clotet
Aún no hay calificaciones
El Modelo de Asignacion
Documento7 páginas
El Modelo de Asignacion
horacio4espinoza4cal
Aún no hay calificaciones
Examen Parcial Semana 4 Estructura de Datos PDF
Documento6 páginas
Examen Parcial Semana 4 Estructura de Datos PDF
Eider Fernado Ocoro
Aún no hay calificaciones
Análisis
Documento10 páginas
Análisis
warashirley
Aún no hay calificaciones