Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Sesión 10
• Aprendizaje a partir de la
observación
• Aprendizaje en las redes
neuronales.
• Representaciones estructuradas
(ontologías).
• Incertidumbre en el conocimiento.
• Ejemplo, estudiamos porque nos satisface sacar notas más altas, o jugamos
a un videojuego porque nos satisface jugar. Y para satisfacer esos estímulos
positivos (reforzamientos), estudiamos/jugamos más horas y recurrimos a
procesos de prueba y error para evaluar nuevas estrategias de
estudio/juego. Esto es, aprendemos gracias al condicionamiento operante.
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Aprendizaje a partir de la observación
Aplicando la psicología conductista a la máquina
Para dar forma a una política óptima, el agente se enfrenta al dilema de explorar
nuevos estados (exploración) al tiempo que maximiza su recompensa acumulada
esperada (explotación).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Aprendizaje a partir de la observación
¿Qué necesitamos para formular un problema básico de aprendizaje de
refuerzo?
• Por ejemplo Pacman, siempre podemos intentar llevarlo al mundo real:
imaginemos que tenemos un macaco en casa (ejemplo real donde los haya) y
que está aburrido en nuestro salón, con la televisión apagada y el mando de la
TV sobre la mesa.
• Hasta aquí tenemos un agente (el simio en cuestión), un ambiente (el salón) y
un estado (la tele apagada). Por curiosidad o mero aburrimiento, el macaco
puede empezar a toquetear botones del mando: la acción, que generará un
nuevo estado.
• En 2016, DeepMind presentó ante el mundo a AlphaGo, una IA que, tras ser
entrenada durante varios meses en el análisis de miles de partidas jugadas por
humanos fue capaz de batir a un campeón humano de Go, un juego complejo al
que las máquinas nunca habían jugado bien recurriendo a la programación
convencional, por la dificultad para incorporar la estrategia al código.
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Aprendizaje a partir de la observación
Cuando DeepMind popularizó el aprendizaje por refuerzo
• Pero, un año más tarde, DeepMind presentaba una nueva IA, AlphaGo Zero, que
con menos de 3 días de entrenamiento fue capaz de ganar 100 veces seguidas a
su predecesora. ¿Residía el secreto en una mayor potencia de procesamiento?
• No, la clave reside en que AlphaGo Zero aprendió a jugar ella sola mediante
aprendizaje por refuerzo, jugando millones de partidas contra sí misma, hasta
que aprendió, como decíamos antes a maximizar su recompensa acumulada
esperada.
• Una red neuronal artificial es un grupo interconectado de nodos similar a la vasta red de
neuronas en un cerebro biológico. Cada nodo circular representa una neurona artificial y
cada flecha representa una conexión desde la salida de una neurona a la entrada de otra.
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Aprendizaje en las redes neuronales.
• Cada neurona está conectada con otras a través de unos enlaces. En estos
enlaces el valor de salida de la neurona anterior es multiplicado por un valor de
peso. Estos pesos en los enlaces pueden incrementar o inhibir el estado de
activación de las neuronas adyacentes. Del mismo modo, a la salida de la
neurona, puede existir una función limitadora o umbral, que modifica el valor
resultado o impone un límite que no se debe sobrepasar antes de propagarse a
otra neurona. Esta función se conoce como función de activación.
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Aprendizaje en las redes neuronales.
• Las redes neuronales se han utilizado para resolver una amplia variedad de
tareas, como la visión por computador y el reconocimiento de voz, que son
difíciles de resolver usando la ordinaria programación basado en reglas.
Históricamente, el uso de modelos de redes neuronales marcó un cambio de
dirección a finales de los años ochenta de alto nivel, que se caracteriza por
sistemas expertos con conocimiento incorporado en si-entonces las reglas, a
bajo nivel de aprendizaje automático, caracterizado por el conocimiento
incorporado en los parámetros de un modelo cognitivo con algún sistema
dinámico.
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Representaciones estructuradas (ontologías).
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Incertidumbre en el conocimiento
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Incertidumbre en el conocimiento
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Incertidumbre en el conocimiento
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Incertidumbre en el conocimiento
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Incertidumbre en el conocimiento
Inteligencia Artificial
MÓDULO 2: Resolución de problemas y Lógica de Predicados
Unidad 5. Aprendizaje.
Ruta de aprendizaje