¡Te damos la bienvenida a Scribd!

Saltar el carrusel

Apuntes Curso Ai Python

Cargado por

samuel.boscan.18

0% encontró este documento útil (0 votos)

5 vistas7 páginas

Título original

APUNTES CURSO AI PYTHON

Derechos de autor

Formatos disponibles

DOCX, PDF, TXT o lea en línea desde Scribd

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Denunciar este documento

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

0% encontró este documento útil (0 votos)

5 vistas7 páginas

Apuntes Curso Ai Python

Cargado por

samuel.boscan.18

Copyright:

Formatos disponibles

Descargue como DOCX, PDF, TXT o lea en línea desde Scribd

Marcar por contenido inapropiado

Saltar a página

Está en la página 1de 7

Buscar dentro del documento

APUNTES CURSO AI PYTHON

1. REINFORCEMENT LEARNING

Mecanismo de recompensas a un agente inteligente dependiendo de su comportamiento en

un entorno y el análisis de un intérprete sobre dicho comportamiento, dichas recompensas
pueden ser negativas o positivas.

1.1.ECUACIÓN DE BELLMAN

Ecuación de programación dinámica, en la que se escribe el valor de un problema de decisión

en un determinado punto de tiempo en términos de la recompensa que dan algunas opciones
iniciales y el valor del problema de decisión restante que resulta de esas opciones iniciales.

S – estados
A – acciones

R – recompensas

ɣ - descuento

1.1.1. AGENTE EN EL LABERINTO

Fuego: R= -1; A= {up, down, left, right}

Trofeo: R= +1;

V=1 V=1

V=1

V=1
Al agente conseguir una recompensa positiva, estudiara el estado anterior y estudia el cómo y
por qué consiguió dicha recompensa. El estado anterior al de la recompensa positiva posee un
valor de 1 (V=1), siguiendo esta dinámica cada estado anterior al R=+1 al pertenecer al algoritmo
de funcionamiento correcto se le otorga un valor de 1 (V=1). Esta explicación es vaga e imperfecta
debido a que la presencia de estados de valor 1 en cada paso del algoritmo ideal generara dudas
en la IA, esta problemática es resuelta por la presencia de ganma o descuento (ɣ) en la Ecuación
de Bellman.

1.1.2. PLANTEO DE LA ECUACIÓN DE BELLMAN EN SU FORMA REAL

V(s) – Valor de un estado.

R (s, a) – Recompensa de al estar en el estado actual ‘s’ llevar a cabo una acción ‘a’.
V(s’) – Valor del nuevo estado producido por la acción.
max a – Numero total de acciones disponibles.
ɣ - factor matemático de descuento que proporciona prioridad a estados posteriores.

Teniendo en cuenta que ɣ=0.9 y aplicando la ecuación de Bellman

V=0.7 V=0.8
V=0.6

V=0.7 V=0.9

V=0.8 V=0.9 V=1

V=0.7
1.1.3. EL PLAN

Acciones ideales a seguir según los cálculos realizados mediante la ecuación de Bellman.

1.2. BUSQUEDA DETERMINISTA Y NO DETERMINISTA

1.2.1. BUSQUEDA DETERMINISTA

Proceso en el que el agente realiza una acción específica y previamente determinada.

1.2.2. BUSQUEDA NO DETERMINISTA

Proceso en el que el accionar del agente depende de un conjunto de probabilidades debido a

la presencia de diversas opciones, aleatoriedad; normalmente las situaciones en las que se
encuentra un agente serán no deterministas.
1.2.2.1. PROCESOS DE DECISION DE MARKOV

Proceso utilizado cuando existe aleatoriedad en la toma de decisiones del agente, para ello es
necesario realizar una serie de cambios en la ecuación de Bellman.

Se reemplaza en la ecuación de Bellman el estado a seguir por todos los estados posibles.

Tomando probabilidades aleatorias tenemos:

1.2.2.2. ECUACION DE BELLMAN ESTOCASTICA

V(s) – Valor de un estado.

max a – Número total de acciones disponibles.
R (s, a) – Recompensa de al estar en el estado actual ‘s’ llevar a cabo una acción ‘a’.
ɣ - factor matemático de descuento que proporciona prioridad a estados posteriores.
'
Σ s P (s , a , s ) - Suma de todas las probabilidades sobre todas las acciones posibles.
'

V(s’) – Valor del nuevo estado producido por la acción.

1.3. POLITICA O PLAN

Solo pueden ser implementados de forma literal cuando el proceso no sea estocástico, en caso de
serlo se tiene que calcular un nuevo conjunto de acciones inspiradas en el plan original.

Utilizando la ecuación de Bellman modificada y probabilidades especificas en el

movimiento del agente tenemos un nuevo conjunto de probabilidades a las cuales ya no llamamos
plan si no política de actuación: (10% girar a izquierda o derecha y 80% de ir recto)

0.8 0.8 0.8

0.8

0.8
0.8

0.1 0.1 0.8

0.1

También podría gustarte

Dinero en La Funcion de Utilidad
Documento33 páginas
Dinero en La Funcion de Utilidad
Fotocopiadora Ets
0% (1)
Bitacora Estabilidad
Documento14 páginas
Bitacora Estabilidad
ivan
Aún no hay calificaciones
Control PID y Óptimo de Una Red RC
Documento40 páginas
Control PID y Óptimo de Una Red RC
Mumul
Aún no hay calificaciones
Control 3
Documento4 páginas
Control 3
xioly
Aún no hay calificaciones
Control Por Realimentacion de Estados
Documento3 páginas
Control Por Realimentacion de Estados
Carlos Alberto Huaycho Chavez
Aún no hay calificaciones
12a - Cadenas de Markov (Estado Estable)
Documento17 páginas
12a - Cadenas de Markov (Estado Estable)
Myrella Mori
Aún no hay calificaciones
2 Informe de Control JTP
Documento12 páginas
2 Informe de Control JTP
Cristian
Aún no hay calificaciones
ACTIVIDAD 2 - Representación en Espacio de Estado
Documento13 páginas
ACTIVIDAD 2 - Representación en Espacio de Estado
Jorge Esteban Martínez Macancela
Aún no hay calificaciones
Tarea2 3
Documento15 páginas
Tarea2 3
JUAN DANIEL VASQUEZ RENGIFO
Aún no hay calificaciones
Practica7 Alfa
Documento29 páginas
Practica7 Alfa
Elias
Aún no hay calificaciones
Juan Beltran
Documento14 páginas
Juan Beltran
elver galinda
Aún no hay calificaciones
Reporte P3 John Pozo
Documento20 páginas
Reporte P3 John Pozo
John Andrés Pozo Villón
Aún no hay calificaciones
Charla Kalman
Documento8 páginas
Charla Kalman
Diego Diaz
Aún no hay calificaciones
Analisis de Datos
Documento19 páginas
Analisis de Datos
Cyc Bade
Aún no hay calificaciones
Estabilidad Absoluta
Documento6 páginas
Estabilidad Absoluta
FERNANDA
Aún no hay calificaciones
Informe 4 Fisica
Documento14 páginas
Informe 4 Fisica
Brayan Lui Estalla Quinteros
Aún no hay calificaciones
Cadenas de Markov
Documento4 páginas
Cadenas de Markov
Torrez Fuentes Johan I.
Aún no hay calificaciones
Cadenas de Markov (Parte II) PDF
Documento40 páginas
Cadenas de Markov (Parte II) PDF
Diiänä I. Äguäs
Aún no hay calificaciones
Semana06 Probit Logit
Documento17 páginas
Semana06 Probit Logit
ariasmarquez
Aún no hay calificaciones
Laboratorio - Modelamiento 1
Documento12 páginas
Laboratorio - Modelamiento 1
Fabian Ojeda
Aún no hay calificaciones
Preambulo
Documento19 páginas
Preambulo
Fl-e Salazar Fajardo
Aún no hay calificaciones
MT227B Unidad 3b Diseño de Observadores de Estado 2022-1b
Documento66 páginas
MT227B Unidad 3b Diseño de Observadores de Estado 2022-1b
Gabriel JG
Aún no hay calificaciones
IF7 - Espinoza-CCoyori
Documento24 páginas
IF7 - Espinoza-CCoyori
MARIO ALBERTO CCOYORI MENDOZA
Aún no hay calificaciones
Laboratorio N°9
Documento15 páginas
Laboratorio N°9
Didier Hernández
100% (1)
Teoria de Control Estabilidad y Controladores Pid
Documento20 páginas
Teoria de Control Estabilidad y Controladores Pid
Aleicarg Goddeliet
100% (1)
Sesión 12 Análisis de Markov 1
Documento50 páginas
Sesión 12 Análisis de Markov 1
María Sugeidy Villalobos Briceño
Aún no hay calificaciones
Estabilidad y Error en Estado Estacionario
Documento12 páginas
Estabilidad y Error en Estado Estacionario
Carlos Oswaldo
Aún no hay calificaciones
Control de Un Puente Grua
Documento11 páginas
Control de Un Puente Grua
David Freeman
0% (1)
Clase 2 - Control en Matlab
Documento6 páginas
Clase 2 - Control en Matlab
Eric Mosvel
100% (1)
Examen Final Grupo Martes
Documento19 páginas
Examen Final Grupo Martes
DAVID
Aún no hay calificaciones
C-15-Estabilidad de Pequeña Señal PDF
Documento7 páginas
C-15-Estabilidad de Pequeña Señal PDF
augusto paredes taipe
Aún no hay calificaciones
Wuolah Free Ilovepdfmerged 8
Documento8 páginas
Wuolah Free Ilovepdfmerged 8
M Castan
Aún no hay calificaciones
Sistemas de Control
Documento81 páginas
Sistemas de Control
Daniel Castañeda
Aún no hay calificaciones
Automatizacion y Control Fase I Unidad I Simple
Documento10 páginas
Automatizacion y Control Fase I Unidad I Simple
sanlymorales23
Aún no hay calificaciones
Laboratorio 2 (Ejercicios y Asignaciones)
Documento8 páginas
Laboratorio 2 (Ejercicios y Asignaciones)
Mauricio Cerón
Aún no hay calificaciones
Laboratorio N4
Documento11 páginas
Laboratorio N4
Jaíra Morales
Aún no hay calificaciones
P4 ConProConInt AlanAlvaradoRamirez JonatanAliMedinaMolina
Documento30 páginas
P4 ConProConInt AlanAlvaradoRamirez JonatanAliMedinaMolina
Alan Alvarado
Aún no hay calificaciones
Control Clasico Tarea 2
Documento27 páginas
Control Clasico Tarea 2
Angel Cruz Arroniz
Aún no hay calificaciones
Actividades 24 de Marzo
Documento2 páginas
Actividades 24 de Marzo
Ykel Gomez
Aún no hay calificaciones
Tarea 5 Neptali Plua
Documento5 páginas
Tarea 5 Neptali Plua
Mäurï Älëxändër
Aún no hay calificaciones
Redes de Adelanto
Documento10 páginas
Redes de Adelanto
Sebastián Arica Vidal
Aún no hay calificaciones
Proceso Estocástico
Documento5 páginas
Proceso Estocástico
Carlos Angel Hernandez
Aún no hay calificaciones
Covarianza y Coeficiente de Correlacion de La Rentabilidad de Dos Acciones
Documento6 páginas
Covarianza y Coeficiente de Correlacion de La Rentabilidad de Dos Acciones
DavidGutierrezSalas
Aún no hay calificaciones
Retroalimentacion de Estados
Documento11 páginas
Retroalimentacion de Estados
Víctor S
Aún no hay calificaciones
Control PID
Documento21 páginas
Control PID
OscarAdarveLores
Aún no hay calificaciones
Primer Parcial Control 1 Noche
Documento2 páginas
Primer Parcial Control 1 Noche
STEVEN ALEXANDER CHAMPUTIZ VILLOTA
Aún no hay calificaciones
Aprendizaje Por Refuerzo Tradicional y Profundo (Reinforcement Learning)
Documento13 páginas
Aprendizaje Por Refuerzo Tradicional y Profundo (Reinforcement Learning)
francisco reales
Aún no hay calificaciones
MT227 Unidad 3b Sistemas de Seguimiento - Diseño de Observadores de Estado 2021-2
Documento48 páginas
MT227 Unidad 3b Sistemas de Seguimiento - Diseño de Observadores de Estado 2021-2
Leugim Escalante LLanos
Aún no hay calificaciones
Sa - 2019-01-31
Documento2 páginas
Sa - 2019-01-31
Diego Gutiérrez
Aún no hay calificaciones
Sa - 2021-09-03
Documento2 páginas
Sa - 2021-09-03
Diego Gutiérrez
Aún no hay calificaciones
Elctronica
Documento3 páginas
Elctronica
alder anthony anahue
Aún no hay calificaciones
Clase Respuesta en El Tiempo Usando Matlab
Documento26 páginas
Clase Respuesta en El Tiempo Usando Matlab
Jesus Tapia Gallardo
Aún no hay calificaciones
Lab 2 Transformada Laplace 2018
Documento9 páginas
Lab 2 Transformada Laplace 2018
Mumul
Aún no hay calificaciones
Final 2013-2
Documento2 páginas
Final 2013-2
Termosoluciones sas
Aún no hay calificaciones
Observador de Estado Control III
Documento40 páginas
Observador de Estado Control III
Reimer Bolivar
Aún no hay calificaciones
Metodo Fluijo Descontado Capm
Documento111 páginas
Metodo Fluijo Descontado Capm
Lidia
Aún no hay calificaciones
Lab6 Linealizacion y Punto de Operacion
Documento6 páginas
Lab6 Linealizacion y Punto de Operacion
Johan Adrian Arcos Santacruz
Aún no hay calificaciones
Ejercicios de Logaritmos y Exponenciales
De Everand
Ejercicios de Logaritmos y Exponenciales
Simone Malacrida
Aún no hay calificaciones
Ejercicios de Derivadas
De Everand
Ejercicios de Derivadas
Simone Malacrida
Aún no hay calificaciones
Introducción al Análisis Matemático Avanzado
De Everand
Introducción al Análisis Matemático Avanzado
Simone Malacrida
Aún no hay calificaciones
Introducción al cálculo vectorial y matricial
De Everand
Introducción al cálculo vectorial y matricial
Simone Malacrida
Aún no hay calificaciones
Trabajo Final
Documento21 páginas
Trabajo Final
samuel.boscan.18
Aún no hay calificaciones
Angel Abreu
Documento5 páginas
Angel Abreu
samuel.boscan.18
Aún no hay calificaciones
Proyecto2 Lab Sistemas de Control
Documento19 páginas
Proyecto2 Lab Sistemas de Control
samuel.boscan.18
Aún no hay calificaciones
Comunicacion Inalambrica
Documento17 páginas
Comunicacion Inalambrica
samuel.boscan.18
Aún no hay calificaciones
Trabajo Final Servicio Comunitario, Samuel Ali, C.I 28.312.919, O713
Documento22 páginas
Trabajo Final Servicio Comunitario, Samuel Ali, C.I 28.312.919, O713
samuel.boscan.18
Aún no hay calificaciones
Proyecto Final Samuel Ali, C.I 28.312.919 O713
Documento14 páginas
Proyecto Final Samuel Ali, C.I 28.312.919 O713
samuel.boscan.18
Aún no hay calificaciones
Reporte de Control PID
Documento8 páginas
Reporte de Control PID
samuel.boscan.18
Aún no hay calificaciones
Daniela Rosales
Documento4 páginas
Daniela Rosales
samuel.boscan.18
Aún no hay calificaciones
Espectro Expandido
Documento14 páginas
Espectro Expandido
samuel.boscan.18
Aún no hay calificaciones
Espectro Expandido Samuel Ali C.I 28.312.919
Documento20 páginas
Espectro Expandido Samuel Ali C.I 28.312.919
samuel.boscan.18
Aún no hay calificaciones
Tema 1 EDT
Documento12 páginas
Tema 1 EDT
samuel.boscan.18
Aún no hay calificaciones
1ra Actividad Sumativa. - Samuel Ali, C.I 28.312.919, H813
Documento5 páginas
1ra Actividad Sumativa. - Samuel Ali, C.I 28.312.919, H813
samuel.boscan.18
Aún no hay calificaciones
Metodología Telecomunicaciones.
Documento4 páginas
Metodología Telecomunicaciones.
samuel.boscan.18
Aún no hay calificaciones
Jailene Camarillo
Documento3 páginas
Jailene Camarillo
samuel.boscan.18
Aún no hay calificaciones
Informe Modulación FSK
Documento12 páginas
Informe Modulación FSK
samuel.boscan.18
Aún no hay calificaciones
Practica 2 Sistemas de Comunicacio I
Documento10 páginas
Practica 2 Sistemas de Comunicacio I
samuel.boscan.18
Aún no hay calificaciones
2da Actividad Sumativa, Samuel Ali, C.I 28.312.919, O713
Documento16 páginas
2da Actividad Sumativa, Samuel Ali, C.I 28.312.919, O713
samuel.boscan.18
Aún no hay calificaciones
Proyecto y Evaluacion Antes y Despues de Impuestos, Samuel Ali-H913 Ingenieria Economica
Documento9 páginas
Proyecto y Evaluacion Antes y Despues de Impuestos, Samuel Ali-H913 Ingenieria Economica
samuel.boscan.18
Aún no hay calificaciones
Practica DIAC-TRIAC
Documento1 página
Practica DIAC-TRIAC
samuel.boscan.18
Aún no hay calificaciones
Informe Tecnicas de Banda Ancha
Documento14 páginas
Informe Tecnicas de Banda Ancha
samuel.boscan.18
Aún no hay calificaciones
Economides (2002) Electoral Uncertainty, Economic Policy and Growth III 7 PDF
Documento28 páginas
Economides (2002) Electoral Uncertainty, Economic Policy and Growth III 7 PDF
Janyra Jhoana Chavez
Aún no hay calificaciones
2° Parciales Anteriores Matematica para Economistas UBA
Documento5 páginas
2° Parciales Anteriores Matematica para Economistas UBA
Yani Bel Fernandez
Aún no hay calificaciones
Optimizacion Dinamica Tiempo Discreto Horizonte Infinito Paso A Paso
Documento7 páginas
Optimizacion Dinamica Tiempo Discreto Horizonte Infinito Paso A Paso
Anthony Velasquez
Aún no hay calificaciones
Elementos de Programación Dinámica
Documento10 páginas
Elementos de Programación Dinámica
Miguel Tasayco Martinez
Aún no hay calificaciones
Tarea de Investigacion de Operaciones Segundo Corte Jeremy Morin
Documento19 páginas
Tarea de Investigacion de Operaciones Segundo Corte Jeremy Morin
jamyrey
Aún no hay calificaciones
Examen Final (Duración: 2 Horas) : Max Exp (−Ρt) (Lnl − E) Dt
Documento3 páginas
Examen Final (Duración: 2 Horas) : Max Exp (−Ρt) (Lnl − E) Dt
RonaldPortugal
100% (1)
Matematica para Economistas - Ejercicios Resueltos 4
Documento41 páginas
Matematica para Economistas - Ejercicios Resueltos 4
Julieta
Aún no hay calificaciones
4to Matematica IV Optimizacion Dinamica
Documento6 páginas
4to Matematica IV Optimizacion Dinamica
gonzprin
100% (2)
4to Ep Matematica IV Optimizacion Dinamica
Documento7 páginas
4to Ep Matematica IV Optimizacion Dinamica
CristhianRosadioAranibar
Aún no hay calificaciones
S14 .Horizonte Infinito
Documento8 páginas
S14 .Horizonte Infinito
ccorcuerar
Aún no hay calificaciones
Mo¿dulo 3 - Procesos de Decisio¿n de Markov PDF
Documento53 páginas
Mo¿dulo 3 - Procesos de Decisio¿n de Markov PDF
Antonio
Aún no hay calificaciones
Prog Dinamica
Documento18 páginas
Prog Dinamica
Rodrigo Aliaga Puma
Aún no hay calificaciones
Semana 6
Documento7 páginas
Semana 6
rafueliux
Aún no hay calificaciones
Proyecto de Programación Dinámica
Documento16 páginas
Proyecto de Programación Dinámica
ricardo
Aún no hay calificaciones
Teoria y Politica Monetaria
Documento21 páginas
Teoria y Politica Monetaria
ALEXANDER LOZANO TELLO
Aún no hay calificaciones
Optimización y Simulación Dinámica de Las Especies, Ejemplo
Documento53 páginas
Optimización y Simulación Dinámica de Las Especies, Ejemplo
Isabel Reséndiz
Aún no hay calificaciones
Walsh - MIU Cap 2
Documento8 páginas
Walsh - MIU Cap 2
Enzo Felizzola
Aún no hay calificaciones
Act 4 5
Documento40 páginas
Act 4 5
Rafael Galicia
Aún no hay calificaciones
Programación Dinámica (Introducción)
Documento26 páginas
Programación Dinámica (Introducción)
Elphego Torres
Aún no hay calificaciones
4 Matematica IV Economia Unmsm
Documento7 páginas
4 Matematica IV Economia Unmsm
Felipe
Aún no hay calificaciones
Compendio Ejercicios 2013 PDF
Documento25 páginas
Compendio Ejercicios 2013 PDF
Valeria
Aún no hay calificaciones
Temario Mate IV Eco 2023
Documento6 páginas
Temario Mate IV Eco 2023
artxmonroy
Aún no hay calificaciones
Economia Matematica PDF
Documento79 páginas
Economia Matematica PDF
Jorge Chira Sedano
Aún no hay calificaciones
Introducción A La Optimización Dinámica
Documento37 páginas
Introducción A La Optimización Dinámica
Juancho Pal
Aún no hay calificaciones
Programacic3b3n Dinc3a1mica
Documento7 páginas
Programacic3b3n Dinc3a1mica
janeth
Aún no hay calificaciones
4-Programacion Dinamica 1 - Rev
Documento63 páginas
4-Programacion Dinamica 1 - Rev
ALEYDA PAMELA VALDEZ SALINAS
Aún no hay calificaciones
Semana 5 Parte 2
Documento9 páginas
Semana 5 Parte 2
rafueliux
Aún no hay calificaciones
Maestría Economía CIDE
Documento3 páginas
Maestría Economía CIDE
ALBERT_11
Aún no hay calificaciones
5-Programacion Dinamica 2-Soluciones
Documento6 páginas
5-Programacion Dinamica 2-Soluciones
Jose Mario
100% (1)