Está en la página 1de 3

TAO Entregable 5: Descenso por gradiente estocástico 1

Entregable 5: Descenso por gradiente estocástico

28 de octubre de 2021

Instrucciones
Objetivo El objetivo del informe es mostrar que el estudiante fue capaz de resolver una serie de
problemas teóricos e implementar y analizar una serie de problemas prácticos. En el primer caso, es
fundamental justificar cualquier paso no trivial de la resolución. En el caso de problemas prácticos, es
fundamental analizar y comentar todo resultado que se obtenga.

Contenido El informe debe contener: resolución detallada de problemas teóricos, resultados de los
problemas prácticos, análisis y discusión de los resultados obtenidos. No es necesario (ni aconsejable)
incluir: letra de ejercicios, código de los ejercicios prácticos. El código de los ejercicios prácticos debe
incluirse en un archivo aparte para posible referencia por parte de los docentes.

Autorı́a Esta es una tarea individual. Sus ejercicios deben ser resueltos por el estudiante cuyo
nombre, cédula y firma se deben incluir en la carátula del informe. No es admisible la realización
colectiva de ninguno de los ejercicios ni sus partes. Tampoco es admisible la búsqueda y/o reutilización,
total o parcial, de material en Internet u otros medios, ası́ como entregas disponibles de años anteriores.
Sı́ es admisible y aconsejable consultar, cotejar, e intercambiar ideas y sugerencias con otros estu-
diantes. También es admisible utilizar material de referencia tales como: documentación sobre lengua-
jes de programación, resultados, definiciones y propiedades matemáticas, incluyendo todo el material
expuesto en el teórico de este curso, tanto teórico como práctico.
También es admisible la reproducción e inclusión de recetas y código relacionado con aspectos
auxiliares, tales como el graficado de funciones, etc., que no hacen al objetivo de los ejercicios.

Sanciones Cualquier violación a las anteriores reglas constituye una falta disciplinaria. En primera
instancia, dicha falta implica la pérdida de los puntos del obligatorio en su totalidad. En caso de
reincidencia, se desvinculará al estudiante del curso y quedará registrado como reprobado.

Conformidad
Todo informe debe incluir una carátula identificando claramente el obligatorio al que hace referen-
cia, la fecha, y el/la autor/a del trabajo. En el último caso, debe incluirse nombre, cédula de identidad
(o equivalente), y firma, preferentemente digital. Asimismo, debe incluirse de manera obligatoria el
siguiente texto:
i) He leı́do y estoy de acuerdo con las Instrucciones especificadas en la carátula obligatorio. ii) He
resuelto por mi propia cuenta los ejercicios, sin recurrir a informes de otros compañeros, o soluciones
existentes. iii) Soy el único autor de este trabajo. El informe y todo programa implementado como
parte de la resolución del obligatorio son de mi autorı́a y no incluyen partes ni fragmentos tomados
de otros informes u otras fuentes, salvo las excepciones mencionadas.
TAO Entregable 5: Descenso por gradiente estocástico 2

Ejercicio 1 - Optimización estocástica (Convergencia a una bola)


Se desea hallar el valor θ? que minimiza la función

u(θ) = EX,y [||Xθ − y||2 ]


La matrix X es aleatoria, según el modelo de ruido aditivo X = A + N con
 
2 1
A=
1 2
y  
n n12
N = 11
n21 n22
donde nij ∼ N (0, σ 2 ) independientes entre si para i = 1, 2, j = 1, 2, de varianza σ 2 = 1.
El vector y tambien es aleatorio, siguiendo el modelo y = X ∗ θ0 + w con
 
1
θ0 =
1
y  
w1
w=
w2
donde wi ∼ N (0, σ 2 ) independientes entre si para i = 1, 2, de varianza σ 2 = 1.
du
a) Muestre que f (θ) = dθ = 2(AT A + 2σ 2 I)θ − 2(AT A + 2σ 2 I)θ0 , anulándose en θ = θ0 .

b) Dadas muestras i.i.d. ξk = (Xk , yk ) distribuidas como X e y, obtenga la secuencia de desenso por
gradiente estocástico

θk+1 = θk − αk F (θk , Xk , yk )
especificando la función F (θk , Xk , yk )..

c) Implemente K = 10000 pasos de SGD según la iteración hallada en la parte anterior. Grafique la
secuencia de valores de θk en el plano. Pruebe con paso constante αk = 0,1, αk = 0,01, y αk = 0,001,
y con paso decreciente αk = 0,1/k

d) (opcional) Obtenga las constantes c1 y c2 de las hipótesis del teorema de Robbins Monró, y
represente la bola de radio B = c2c1 α2 alrededor de θ0 .
TAO Entregable 5: Descenso por gradiente estocástico 3

Ejercicio 2 - Entrenamiento de una neurona artificial.


Considere los pares (x, y) donde los vectores x ∈ RN pertenecen a dos clases indicadas por la
variable de activación y ∈ 0, 1. Se desea obtener el parámetro a ∈ RN solución de

mı́n Ex,y [G(a; x, y)] = mı́n Ex,y (y − Relu(a0 x))2


 
(1)
a∈RN a∈RN

con
(
z, z ≤ 0
Relu(z) = (2)
z, z ≥ 0

paramétrico en  ∈ [0, 1).

a) Halle el subgradiente de G(a; x, y) respecto a a.

b) Escriba la iteración del algoritmo SGD que resuelve (1) a partir de muestras (xk , yk ).

En las siguientes partes se programará SGD para clasificar imágenes de gatos y conejos. Las imáge-
nes de M = 30 gatos están contenidas en el archivo Gatos.asc y M = 30 conejos en Conejos.asc,
respectivamente. Estos archivos contienen matrices G ∈ RN ×M y C ∈ RN ×M cuyas columnas tie-
nen dimensión N = (256)(256)(3) + 1 y corresponden a una imagen de tamaño 256 × 256 pı́xeles
codificadas en tres canales de color RGB y con un elemento adicional siempre igual a uno para lo-
grar una función afı́n. Los vectores se pueden visualizar como imagen en Matlab usando la función
mostrar imagen(x, y, 256).

c) Corra el algoritmo diseñado en la parte anterior para los K = 40 vectores xk contenidos en los las
primeras K = 20 columnas de C y R. Utilice las etiquetas y = 0 para los gatos y y = 1 para los
conejos. Seleccione un paso constante α = 1e−9 y  = 0,1.

d) A partir de la solución aK obtenida en la parte anterior clasifique los vectores x en las últimas
10 columnas de C y R. Presente una gráfica del valor de z = a0K x contra el número de muestra,
observando la clasificación obtenida para las muestras de entrenamiento y validación.

e) (opcional) Estudie la convexidad de g(a) = E[G(a; x, y)].

f ) (opcional) Seleccione distintos grupos de entrenamiento y validación y reevalue los resultados.

g) (opcional) Evalúe el error promedio en la muestra de validación contra el número de iteración


k = 1, . . . , K confirmando que el clasificador aprende progresivamente de los datos. Para ello intercale
gatos y conejos en el entrenamiento.

h) (opcional) Clasifique esta muestra con la SVM desarrollada en el Entregable 3.

También podría gustarte