Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Considere el problema
1
mı́nn kAx − bk22 + kxk1 . (1)
x∈R 2
Escribe los siguientes métodos para esta problema e indica si el método es factible. Es
decir, son los mapeos proximales involucrados sencillos? Por qué? Por qué no?
Demostración.
a) Definimos las funciones F (x) = 12 kAx − bk22 y G (x) = kxk1 . Es sencillo ver que
F es Fréchet diferenciable en todo x ∈ Rn . Además, del ejemplo 6.22 [CV20, pg.
75] tenemos
∇Fe (y) = y + b .
1
f.b.s.m. es la abreviatura de forward-backward splitting method.
2
De acuerdo a [CV20, pg. 55].
1
Por otro lado, para G,
e la definición de operador proximal nos dice que
1
kz − yk2 + δB∞ (0,1) −AT z
proxτ G (y) = argmin
z∈Rk 2
1
= argmin kz − yk2
k T
z∈R , A z∈B∞ (0,1) 2
= projC (y) ,
donde C = s ∈ Rk |
AT s
∞ ≤ 1 . Es claro que C es convexo, ası́ por el Teore-
ma de la proyección existe un único ze ∈ C tal que
donde ATi ∈ Rk son las i-ésimas filas de la matriz AT . Del Teorema 13 existen λi
y γi , con i = 1, ..., n, multiplicadores de Lagrange tal que satisfacen el siguiente
sistema de optimalidad
n
X n
X
ze − y + λi ATi − γi ATi = 0
i=1 i=1
ATi ze − 1 ≤ 0, ∀ i = 1, ..., n,
−ATi ze − 1 ≤ 0 , ∀ i = 1, ..., n,
γi , λi ≥ 0 , i ∈ Σ (e
z) ,
γi , λi = 0 , i ∈ Γ (e
z) .
Note que la dificultad recae en encontrar los multiplicadores que cumplen con el
sistema optimalidad. No podemos escribir explı́citamente el operador proximal
de G.
e La iteración de f.b.s.m., en general, viene dada por
2
Más aún, sabemos que el conjugado de G viene dado por
1
G∗ (y) = kyk22 + y T b .
2
Ası́, el operador proximal de G∗ es
y − σb
proxσG∗ (y) = .
1+σ
De modo que la iteración de p.d.p.s4 es
x − τ AT y k − τ + sign xk − τ AT y k
k+1 k
x i
= i
, ∀ i = 1, ..., n.
k k+1
i i
y + σ Ax −b
y k+1 = .
1+σ
Ası́, el método p.d.p.s. es factible, ya que los operadores proximales son sencillos
de obtener, tanto de G∗ como de F .
d) Consideramos las funciones definidas en (a). Para G, que es mas sencillo, tenemos
que el operador proximal es5 :
z − x + τ AT Az − τ AT b = 0 I + τ AT A z = x + τ AT b .
⇔
I + τ AT A xk+1 = z k + λAT b
k+1 +
= 2xk+1 − z k − τ sign 2xk+1 − z k ,
y i i i
∀ i = 1, ..., n.
k+1 k k+1 k+1
z =z +y −x .
En este caso, es método D.R.S también es factible, puesto que el operador pro-
ximal de G es sencillo de obtener, y el operador proximal de F viene dado por la
resolución de un sistema lineal8 .
4
Abreviatura de primal-dual proximal splitting.
5
Ver ejemplo 6.22 [CV20, pg. 75].
6
Ver [CV20, pg. 38]
7
Abreviatura de Douglas-Rachford splitting.
8
Aquı́ cabe mencionar que resolver el sistema lineal puede ser un reto si la matriz I + τ AT A no es
bien condicionada.
3
Ejercicio 2. Supongamos que D ∈ Rm×n . Considere el problema
1
mı́nn kx − bk22 + kDxk1 . (4)
x∈R 2
Escribe los siguientes métodos para esta problema e indica si el método es factible. Es
decir, son los mapeos proximales involucrados sencillos? Por qué? Por qué no?
(a) forward-backward splitting para la formulación de arriba.
(b) forward-backward splitting para la formulación dual.
(c) primal-dual proximal splitting.
(d) Douglas-Rachford splitting.
Demostración. Tanto para los literales (a), (b) y (d) consideramos las siguientes fun-
ciones F (x) = 12 kx − bk22 y G (x) = kDxk1 . En el literal (c) consideramos también F ,
pero G (y) = kyk1 y K = D.
a) Claramente F es Fréchet diferenciable, y su derivada viene dado por: ∇F (x) =
x − b. Sin embargo, el operador proximal de G, no es tan sencillo de obtener, ya
que no se tiene ninguna propiedad de la matriz D. La iteración de f.b.s.m., en
general, viene dada por
xk+1 = proxτk G xk − τk xk − τk b = proxτk G xk (1 − τk ) − τk b .
kz − xk2 + kuk1
( 1
mı́n m2
⇔ n
(z,u)∈R ×R (6)
s.a u = τ Dz
Del Lema 3.9 [CV20, pg. 32] sabemos que el funcional en (5) es coercivo9 . Más
aún, el Teorema 2.1 [CV20, pg. 13] garantiza la existencia de un minimizador de
(5). De modo que, existen (e e) ∈ Rn × Rm que minimiza (6). Fijemos u
z, u e = u en
(6),
1
2
kz − xk2
mı́nn
z∈R s.a u
e = τ Dz
Ya que la restricción es afı́n10 , para ze, existe y ∈ Rm , tal que
1
ze ∈ argmin kz − xk2 + y T (τ Dz − u
e)
z∈Rn 2
τ Dez=ue. (7)
9
Ya que toda norma el w.l.s.c, pero en Rn , convergencia débil es equivalente a convergencia fuerte,
de modo que la norma es l.s.c.
10
Condición de calificación.
4
De donde, ze = x − τ DT y. Reemplazando en (7), se tiene
1
τ Dx − τ 2 DDT y = u
e, ⇔ τ DDT y = Dx − ue
τ
Hemos encontrado, entonces, x − τ DT y = ze = proxτ G (x). Basta encontrar y y u
e.
Para ello, fijamos z = ze en (6), ası́, tenemos que
1
x − τ DT y − x
2
e = argmin kuk1 +
u
u∈Rm 2
τ2
DT y
2 .
= argmin kuk1 + 2
u∈Rm 2
Esto nos indica que para obtener el operador proximal de G, ze = proxτ G (x), es
necesario resolver el problema de minimización auxiliar (8); el cual puede ser tan
complicado de resolver como el problema de minimización original. De modo que,
f.b.s.m. no es factible para resolver el problema primal.
5
para todo i = 1, ..., m. Finalmente, basta multiplicar por el signo negativo a la
solución dada por f.b.s.m. para el problema (10) para obtener la solución del
problema dual. Es decir, si y ∗ es la solución dada por f.b.s.m. del problema (10),
entonces −y ∗ resuelve (9).
De modo que, f.b.s.m. es factible para el problema dual, ya que los operadores
proximales son sencillos de obtener.
c) Los operadores proximales de F y G, son sencillos de obtener. Usaremos el ejemplo
6.22 [CV20, pg. 75] para el operador proximal de G∗ , y para F usaremos el
principio de Fermat [CV20, pg. 38] junto con el Teorema 4.6 [CV20, pg. 39]:
x + τb
proxτ F (x) = ,
1+τ
yi
[proxσG∗ (y)]i = , ∀ i = 1, ..., m
máx {1, |yi |}
De modo que, la iteración de p.d.p.s. es
xk − τ D T y k + τ b
xk+1 =
k 1 + τ k+1
k+1 y i + σ Dx i
y i
= , ∀ i = 1, ..., m.
máx {1, [y k + σDxk+1 ]i }
6
Forward-backward ya no se puede prácticamente aplicar al problema primal ni al dual:
los mapeos proximales serı́an difı́ciles. Cómo se puede reformular el problema tal que
primal-dual proximal splitting sea factible, es decir, tal que todas las matrices entrarı́an
en K? Formule el algoritmo resultante.
Demostración. Desarrollamos el término cuadrático de la función de costo en de (11)
de tal forma que obtenemos problema equivalente:
1 1
mı́nn kbk2 + kAxk2 − hAx, bi + kDxk1 . (12)
x∈R 2 2
Definimos las funciones F : Rn → R, G : Rk × Rm → R y K ∈ L Rn , Rk × Rm , tal
que
1
F (x) = kbk22 ,
2
1
G (y, w) = kyk2 − hy, bi + kwk1
2
K (x) = (I1 ◦ A + I2 ◦ D) (x) = (Ax, Dx) ,
donde Ij , j = 1, 2, son las inyecciones canónicas. Claramente, F y G son propias,
convexas y semicontinuas inferior. Ası́, el problema (12) se define como
mı́n F (x) + G (Kx) .
x∈Rn
11
Usando la regla de la suma para el conjugado, hoja de ejercicios # 3.
12 p
Usaremos la siguiente notación para un vector en Rp , x = (xi )i=1 .
7
Teorema 1. Sea x ∈ Rn una solución local de
mı́n F (x)
gi (x) ≤ 0
h (x) = 0
s.a. j
i = 1, ..., m ,
j = 1, ..., p .
8
Bibliografı́a