Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tarea # 1 Fecha de Entrega: 2 de Noviembre de 2017
Tarea # 1 Fecha de Entrega: 2 de Noviembre de 2017
Tarea # 1
Fecha de entrega: 2 de noviembre de 2017
a) Muestre que f esta bien definido en `2 (R), es decir,f (x) ∈ R para todo x ∈ `2 (R)
b) Justifique que f es dos veces Fréchet diferenciable en `2 (R) y demuestre que x̄ = 0 es un
punto crı́tico de f , es decir, satisface la CNPO.
c) Calcule D2 f (x) para cualquier x ∈ `2 (R)y muestre que
donde k0 ∈ N es tal que εk0 > 2. Demuestre que f (x) < 0 = f (0)y concluya que x̄ = 0
no es un mı́nimo local de f .
Desarrollo:
1
a) Tomamos x = {xk } ∈ `2 (R) por lo tanto tenemos:
∞ 2
X xk
|f (x)| = − x3k
k
k=1
∞ 2 ∞
X xk X
3
= − xk
k=1
k k=1
X ∞ ∞
2
X 3
≤ xk − xk
k=1 k=1
X ∞ X ∞
2
xk = kxk2`2 (R) + kxk3`3 (R)
3
≤ xk +
k=1 k=1
luego ,como siempre se cumple que `p (R) ⊂ `q (R) para p < q entonces tenemos que
kxk2`2 (R) + kxk3`3 (R) es un valor finito, por lo tanto la serie siempre converge.
b) Calculamos el gradiente de la función f ,para ello calculamos las derivadas parciales.
∂f 2xj
(x) = − 3x2j
∂xj j
de este modo, tenemos que :
2xj
∇f (x) = − 3x2j
j j∈N
con esto podemos verificar que es una vez Fréchet diferenciable ,solo basta verificar que
dado x, y ∈ `2 (R):
|f (x + y) − f (x) − h∇f (x), yi|
lı́m =0
kyk→0 kyk
con k.k la norma usual del espacio.
Tenemos que
∞ 2
xk + 2xk yk + yk2
X
3
(1) f (x + y) = − (xk + yk )
k=1
k
∞ 2
xk + 2xk yk + yk2
X
3 3 2 2
(2) = − xk − yk − 3xk yk − 3xk yk
k=1
k
2
es decir
(7) |f (x + y) − f (x) − h∇f (x), yi| ≤ M kyk2
|f (x + y) − f (x) − h∇f (x), yi|
(8) ≤ M kyk
kyk
tomando kyk → 0 concluimos que es una vez Fréchet diferenciable,y además
∞
X 2xk yk 2
Df (x)(y) = − 3xk yk
k=1
k
Por lo tanto
∞ ∞
X 2(xk + hk )yk 2
X 2xk yk
Df (x + h)(y) − Df (x)(y) = − 3(xk + hk ) yk − − 3x2k yk
k=1
k k=1
k
∞
X 2hk yk
= − 6xk hk − h2k yk
k=1
k
Por lo tanto tenemos
∞
X 2hk yk
Df (x + h)(y) = − 6xk hk − h2k yk + Df (x)(y)
k=1
k
∞
X
= Df (h)(y) − 6hxk , hk i − h2k yk + Df (x)(y)
k=1
P∞
de esta manera tenemos: o(h) := − k=1 h2k yk ,que cumple con o(0) = 0 y además
|o(h)| 1 |o(h)|
≤ khk2 sup yk ⇒ lı́m =0
khk k∈N khk khk→0 khk
De esta manera concluimos que la segunda diferencial de Fréchet esta dada por
∞
2
X 2hk yk
D f (x)(h, y) = − 6xk hk
k=1
k
P∞ 2xk yk
como Df (x)y = k=1 k
2
− 3xk yk entonces Df (0)y = 0 para todo y ∈ `2 (R) por lo
que satisface la CNPO.
c) Del ı́tem anterior tenemos que
∞ ∞
2
X 2hk yk 2
X 2hk yk
(9) D f (x)(h, y) = − 6xk hk ⇒ D f (0)(h, y) =
k=1
k k=1
k
∞
2h2k
X
2
(10) ⇒ D f (0)(h, h) =
k=1
k
Por lo que para todo h 6= 0 se cumple D2 f (0)(h, h) > 0,lo que implicarı́a que f (0) = 0
es un mı́nimo.
d) Tomamos la sucesión , y evaluamos en f
ε2 ε3
2 1 ε
f (x) = − =ε −
4k0 8 4k0 8
2 2 k0 ε
=ε − < 0 dado que εk0 > 2
8k0 8k0
por lo tanto f (0)no es un mı́nimo.
Obs:no se consideraron las restricciones inactivas dado que se eligió de primer momento.
3
P2. Promédio Geométrico y aritmético
Considere el siguiente problema de optimización:
Desarrollo:
Para abordar el problema definimos la función:
f :Rn → R
x → f (x) = |x|2
y la restricción
h :Rn → R
n
Y
x → h(x) = xi − 1
i=1
S = {x ∈ Rn : xi > 0 h(x) = 0}
Notamos que f, h, gi ∈ C∞ (R) para toda 1 ≤ i ≤ n y por ende Fréchet diferenciable, y además
sus gradientes están dados por
∇f (x) = 2x
n
Y
∇h(x) = xi
i=1i6=j xi
1≤j≤n
Encontraremos un candidato a mı́nimo por KKT de manera informal , y una vez teniendo el
mı́nimo probaremos que realmente lo es.Por ello tenemos :
Yn
∇x L(x, λ) = 2x + λ xi
i=1i6=j
1≤j≤n
4
Luego
n
Y
∇x L(x, λ) = 0 ⇔ 2xj + λ xi = 0∀j ∈ {1, ..., n}
i=1i6=j
lo que es equivalente a:
n
−λ Y
xj = xi ∀j ∈ {1, ..., n}
2 i=1
i6=j
entonces
n2
−λ
=1
2
LS (x̄) = {d ∈ Rn : h∇h(x̄), di = 0}
= {d ∈ Rn : h(1, ..., 1), di = 0}
X n
n
= {d ∈ R : d = (− di , d2 , d3 , ..., dn )}
i=2
n
= h{d ∈ R : d1 = −dj , di = 0∀j 6= i}i
5
Por lo tanto se satisface la CNPO. Notamos que se cumplen las hipótesis de KKT,por lo
tanto λ = −2 es un multiplicador.
Además tenemos
n
Y
2
Dxx L(x) = 2Id + λ xi
i=1i6=ji6=k
j,k
Como ∇f (x̄) k ∇h(x̄) entonces el cono tangente y de direcciones crı́ticas son iguales. Además:
2
Dxx L(x̄, λ) = 2id + λ1
Con 1 una matriz que contiene solo 1 en sus entradas y ceros en la diagonal, por lo tanto
si d ∈ KS (x̄),tal que d1 = −α y dj = α para un j 6= 1 fijo con todas demás entradas fijas,
tenemos que
Por lo tanto se cumple CSSO y por ende concluimos que x̄ es minimo del problema (P ).
1/2
Qn ai
b) Tomamos ai tal que i=1 ai = 1 y además xi = Qn 1/2n entonces
( i=1 ai )
n
!2 n
!
1/2
X ai X ai
n ≤ |x|2 ⇒ n ≤ 1/2n
⇒n≤ 1/n
( ni=1 ai ) ( ni=1 ai )
Q Q
1 1
quedando demostrado.
(P ) Minimizar f (x) sobre los x ∈ Rn tales que gi (x) ≤ 0, i = 1, ..., p, hj (x) = 0, j = 1, ..., q
Asuma que (P ) tiene solución y,por lo tanto ,Val(P ) ∈ R.Dada la función φ : Rn → R definida
por:
p q
X X
φ(x) := máx{0, gi (x)} + h2i (x)
i=1 i=1
Sea θ(c) := Val(Pc ).Supondremos que para todo c ≥ 0,existe xc ∈ R solución de (Pc )
6
Para cada c > 0 definimos la función fc (x) = f (x) + cφ(x) notamos que
f (x) = fc (x) ∀x ∈ S
Val(P ) ≥ θ(c)
f (x) = fc (x) ∀x ∈ S
mı́n{f (x) : x ∈ S} = mı́n{fc (x) : x ∈ S}
entonces,como tenemos
Sumando tenemos
Por lo tanto
7
tenemos
restando tenemos
(c − k)(φ(xc ) − φ(xk )) ≤ 0
f (xc ) − f (xk ) ≤ 0
y la relación de equivalencia
8
Luego,dado que I(x) ∈ Γ/R tenemos que solo existe una cantidad finita de elementos tal
que
para algún k ∈ N.Por lo tanto tomemos una sucesión {x̄k }k tal que {I(x̄k )}k RI(xk ).Por
lo tanto tenemos una sucesión constante y maximal con respecto a la inclusión.
Ahora , sea i 6∈ I(x̄k ) defino la sucesión yk = xk+1 + tk (xk+1 − xk ) entonces tomamos tk
tal que
Ai yk = bi
es decir
Ai xk+1
Ai xk+1 + tk (Ai xk+1 − Ai xk ) = bi ⇒ tk =
(Ai xk − Ai xk+1 )
(tk , dk ) → (0, d)
hAi , x + tk dk i ≤ bi
Además
1
Di (x + tk dk ) = hDi , xi + hDi , di = hDi , xi = ei
k
Por lo tanto d ∈ LS (x) donde si Xi denota la fila i-ésima de una matriz como vector.
Λ = {(µ, λ) ∈ Rp × Rq |c + AT µ + DT λ = 0 y µ ≥ 0}
y tal que
9
Dem:
Por el inciso anterior tenemos que el cono tangente y el linealizante son iguales. Escribi-
mos el Lagrangeano asociado de la siguiente manera.
p q
X X
L(x, µ1 , ..., µp , λ1 , ...., λq ) = cT x + µi (Ai x − bi ) + λi (Di x − ei )
i=1 i=1
Por lo tanto tomaremos µ = (µ1 , ..., µp ) ∈ Rp+ y µ = (λ1 , ...., λq ) ∈ Rq para simplificar
notación,luego como x̄ es un minimo local, tenemos
p q
X X
T
∇x L(x, µ, λ) = c + µi Ai + λi Di
i=1 i=1
(11) cT + µA + λD = 0
lo que es equivalente a
p q
( )
X X
−cT ∈ A = v ∈ Rn : ∃µ ∈ Rp+ , λ ∈ Rq tales que v = µi Ai + λi D i
i=1 i=1
Si i 6∈ I(x̄) pedimos que µi = 0 (12) para ser consistente con la definición del cono
Linealizante.
Supongamos ,por contradicción que −cT 6∈ A entonces por Hahn-Banach ∃d1 , d2 ∈ X\{0}
tal que
p q
X X
h µi A i + λi Di , d1 i < −hcT , d1 i
i=1 i=1
o
p q
X X
h µi A i + λi Di , d1 i < −hcT , d2 i
i=1 i=1
para todo (µ, λ) ∈ Rp+ ×Rq Utilizaremos la primera desigualdad, dado que el procedimieto
es análogo tomando d1 = −d2 .
Por lo tanto si evaluamos la desigualdad parai ∈ I(x̄) con µ = kni donde ni , el vector
canónico. y λ = 0 tenemos
Ai k ≤ ci d1
kDi d1 ≤ cT d1
10
y tomando k = −k tenemos −kDi d1 ≤ cT d1 por lo tanto
1 1
− cT d1 ≤ Di d1 ≤ cT d1
k k
haciendo k → ∞ tenemos Di d1 = 0 por lo tanto
0 ≤ −cT d1 ⇒ cT d1 ≥ 0
Ax ≤ b Dx = e
c + AT µ + DT λ = 0
Por lo tanto
−xT AT ≤ bT ⇒ xT AT µ ≥ −bT µ
⇒ xT AT µ − xT DT λ ≥ −bT µ − xT DT λ = −bT µ − eT λ
c + AT λ + D T λ = 0
xT c = −xT AT µ − xT DT λ ⇒ xT c ≥ −bT µ − eT λ
luego tomando supremo sobre S sobre cada conjunto, tenemos que Val(P ) ≥ Val(D)
e) Pruebe que Val(D) ∈ R si y sólo si existe (µ̄, λ̄) ∈ Sol(D)
Dem:
⇐ trivial
⇒
Como Val(P ) ∈ R entonces, tomamos la sucesión {(µk , λk )}k∈N ⊂ Λ si definimos f (µ, λ) =
−bT µ − eT λ,se cumpla
f (µk , λk ) → Val(P )
como f es un funcional continuo, tenemos que (µk , λk ) →w (µ̄, λ̄),pero como convergencia
débil implicaconvergencia fuerte en Rn tenemos que (µk , λk ) →w (µ̄, λ̄) y como Λ es
cerrado se tiene el resultado.
11
f) Demuestre que si S 6= ∅ entonces Val(P ) = Val(D)
Tenemos que S 6= ∅ por lo tanto,como el máximo se alcanza en el máximo de restricciones
activas, tenemos que Ai x = bi para todo i ∈ I(x) por lo tanto, dado que se cumple
cT + µT A + λT D = 0
cT x̄ + µT Ax̄ + λT Dx̄ = cT x̄ + µT b + λT e = 0
Notamos que o(h) = |hy|2 y por c-s tenemos que el error se va a cero antes que la norma por
lo tanto
∇g(x) = Xyy T + yy T X
12