Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Diferenciables
Dr. Erik Zamora
Objetivo
i. Introduccin
i. Cul es el poder de computo de las redes neuronales?
ii. Problema: desvanecimiento del gradiente
iii. Algunas soluciones del desvanecimiento del gradiente
iv. Conclusin
Cual es el poder de computo de las redes neuronales?
Cual es el poder de computo de las redes neuronales?
Super-turing machines
Memoria ilimitada (Cinta)
Cabezal de Escritura/Lectura
Registro del Estado Tienen que ser diseadas,
Tabla de Instrucciones (smbolo ledo y estado)
Son maquinas que No aprenden
Propiedades
Datos secuenciales
Memoria
Aprende dependencias con el
pasado o futuro
Aproxima programas arbitrarios
= 1 +
= ( )
Mas poder de computo. En principio, cualquier problema resuelto por una red feedforward, puede ser
resuelta por una RNN. Pero no es cierto lo converso.
Problema: desvanecimiento del gradiente
Redes de Memoria
= 1 +
LSTM
= 1 , +
= 1 , +
= 1 , +
= 1 +
[Olahs blog 2015] = 1 , +
=
Maquina de Turing Neuronal: Arquitectura
Lectura
Aqu aprende
Escritura
Aqu memoriza
Direccionamiento
Maquina de Turing Neuronal: Experimentos
Qu tan compactos son los programas que la MTN aprende? Qu tan bien generaliza?
En todos los experimentos, la MTN aprendi ms rpido que una red LSTM (es decir, en
un nmero menor de iteraciones; en tiempo no necesariamente es ms rpido porque las
iteraciones en la MTN podran tardan ms). Por ltimo, el nmero de parmetros que
necesit una MTN en comparacin con una red LSTM, es mucho menor. Lo cual puede
explicar porque el aprendizaje era ms rpido en la MTN.
Computadora Neuronal Diferenciable
Computadora Neuronal Diferenciable: Diferencias y Experimentos
Computadora Neuronal Diferenciable: Experimentos
Oportunidades de Investigacin
Comentarios en Seminario
1. Qu es una computadora?
2. Qu es una memoria?
3. Qu se le puede aadir a la maquina de Turing para aumentar su poder de
computo?
Propuestas?
Conclusin
Differentiable
Neural Computers
Super-turing machines
Referencias