Está en la página 1de 9

EE364a, Invierno 2007-08 Prof. S.

Boyd

EE364a Tarea 1 Soluciones

2.1 Let do ⊆ R norte ser un conjunto convexo, con X 1, . . . , X k ∈ DO, y deja θ 1, . . . , θ k ∈ R satisfacer θ yo ≥ 0,
θ 1 + · · · + θ k = 1. Demostrar que θ 1 X 1 + · · · + θ k X k ∈ C. ( La definición de la convexidad es que esto se cumple para k = 2; usted debe
demostrar que para arbitraria k.) Insinuación. Utilizar la inducción de k.

Solución. Esto se muestra fácilmente por inducción a partir de la definición de conjunto convexo. Nos ilustran la
idea de k = 3, dejando el caso general para el lector. Suponer que
X 1, X 2, X 3 ∈ DO, y θ 1 + θ 2 + θ 3 = 1 con θ 1, θ 2, θ 3 ≥ 0. Vamos a demostrar que y = θ 1 X 1 + θ 2 X 2 + θ 3 X 3 ∈ DO. Al menos una de las θ
yo no es igual a uno; sin pérdida de generalidad podemos suponer que θ 1 6 = 1. Entonces podemos escribir

y = θ 1 X 1 + ( 1 - θ 1) ( μ 2 X 2 + μ 3 X 3)

dónde μ 2 = θ 2 / ( 1 - θ 1) y μ 2 = θ 3 / ( 1 - θ 1). Tenga en cuenta que μ 2, μ 3 ≥ 0 y

μ1+ μ2= θ2+ θ3 = 1 - θ1 = 1.


1 - θ1 1 - θ1

Ya que do es convexa y X 2, X 3 ∈ DO, concluimos que μ 2 X 2 + μ 3 X 3 ∈ DO. Desde este punto y X 1 se encuentran en C, y ∈ DO.

2.2 Demostrar que un conjunto es convexo si y sólo si su intersección con cualquier línea es convexa. Demostrar que un conjunto es una ne
fi si y sólo si su intersección con cualquier línea es una ne fi.

Solución. Se prueba la primera parte. La intersección de dos conjuntos convexos es convexa. Por lo tanto, si S es un conjunto
convexo, la intersección de S con una línea es convexa. A la inversa, supongamos que la intersección de S con cualquier línea
es convexa. Tomemos dos puntos distintos X 1 y X 2 ∈ S. La intersección de S con la línea a través X 1 y X 2 es convexa. Por lo
tanto combinaciones convexas de X 1 y X 2 pertenecer a la intersección, por lo tanto, también a

S.

2.5 ¿Cuál es la distancia entre dos hiperplanos paralelos { X ∈ R n | un T x = b 1} y


{ X ∈ R n | un T x = b 2}?

Solución. La distancia entre los dos hiperplanos es | segundo 1 - segundo 2 | / ‖ un ‖ 2. Para ver esto, considere la construcción de
la figura a continuación.

1
X 2 = ( segundo 2 / ‖ un ‖ 2) un

hacha 1 = ( segundo 1 / ‖ un ‖ 2) un
un T x = b 2

un T x = b 1

La distancia entre los dos hiperplanos es también la distancia entre los dos puntos
X 1 y X 2 donde el hiperplano corta la línea a través del origen y paralelo al vector normal a. Estos puntos son
dados por

X 1 = ( segundo 1 / ‖ un ‖2)2 a, x 2 = ( segundo 2 / ‖ un ‖ 2 2) un,

y la distancia es
‖ X 1 - X 2 ‖ 2 = | segundo 1 - segundo 2 | / ‖ un ‖ 2.

2.7 Descripción de Voronoi del semiespacio. Dejar un y segundo ser puntos distintos en R norte. Demostrar que el

conjunto de todos los puntos que están más cerca (en norma euclidiana) a un que segundo, es decir, { x | ‖ X - un ‖ 2 ≤ ‖ X - segundo ‖ 2}, es un

semiespacio. Describir explícitamente como una desigualdad de la forma do T X ≤ re.

Dibuja una imagen.

Solución. Puesto que una norma es siempre no negativo, tenemos ‖ X - un ‖ 2 ≤ ‖ X - segundo ‖ 2 si y solo si ‖ X - un ‖ 2

2≤ ‖ X - segundo ‖ 2 2, asi que

‖ X - un ‖ 2 2 ≤ ‖ X - segundo ‖ 2 2 ⇐⇒ ( X - un) T ( X - un) ≤ ( X - segundo) T ( X - segundo)


⇐ ⇒ X T X - 2 un T x + a T un ≤ X T X - 2 segundo T x + b T segundo

⇐ ⇒ 2 ( segundo - un) T X ≤ segundo T segundo - un T a.

Por lo tanto, el conjunto es de hecho un semiespacio. Podemos tomar c = 2 ( segundo - un) y d = b T segundo - un T a.

Esto tiene sentido geométrica: los puntos que son equidistantes a un y segundo están dados por un hiperplano cuya
normal es en la dirección segundo - a.

2.8 ¿Cuál de los siguientes conjuntos S son poliedros? Si es posible, expresar S en la forma S =
{ x | Hacha b, Fx = g}.

(un) S = {y 1 un 1 + y 2 un 2 | - 1 ≤ y 1 ≤ 1, - 1 ≤ y 2 ≤ 1}, donde un 1, un 2 ∈ R norte.

(segundo) S = {x ∈ R n | X 0, 1 T x = 1, Σ ni = 1 X yo un i = segundo 1, Σ ni = 1 X yo un 2 i = segundo 2}, dónde

un 1, . . . , un norte ∈ R y segundo 1, segundo 2 ∈ R.

2
(do) S = {x ∈ R n | X 0, X T y ≤ 1 para todos y con ‖ y ‖ 2 = 1}. (re) S = {x ∈ R n | X 0, X T y ≤ 1 para

todos y con Σ ni = 1 | y i | = 1}.

Solución.

(un) S es un poliedro. Es el paralelogramo con esquinas un 1 + un 2, un 1 - un 2, - un 1 + un 2,


- un 1 - un 2, como se muestra a continuación para un ejemplo en el R 2.

un 2
do 2 un 1

do 1

Por simplicidad suponemos que un 1 y un 2 son independientes. Podemos expresar S como la intersección de tres
conjuntos:

• S 1: el plano definido por un 1 y un 2


• S 2 = { z + y 1 un 1 + y 2 un 2 | un T 1z = aT 2z = 0, - 1 ≤ y 1 ≤ 1}. Este es un paralelo losa
a un 2 y ortogonales S 1
• S 3 = { z + y 1 un 1 + y 2 un 2 | un T 1z = aT 2z = 0, - 1 ≤ y 2 ≤ 1}. Este es un paralelo losa
a un 1 y ortogonales S 1

Cada uno de estos conjuntos se pueden describir con desigualdades lineales.

• S 1 puede ser descrito como

v Tk x = 0, k = 1, . . . , norte - 2

dónde v k son norte - 2 vectores independientes que son ortogonales un 1 y un 2


(Que forman una base para el espacio nulo de la matriz [ un 1 un 2] T).

• Dejar do 1 ser un vector en el plano definido por un 1 y un 2, y ortogonales un 2.


Por ejemplo, podemos tomar

1 un 2
do 1 = un 1 - un T un 2.
‖ un 2 ‖22

Entonces X ∈ S 2 si y solo si

- | do 1Tun 1 | ≤ do T 1X ≤ | do T 1 un 1 |.

3
• Del mismo modo, y mucho do 2 ser un vector en el plano definido por un 1 y un 2, y ortogonales un 1, p.ej,

2 un 1
do 2 = un 2 - un T un 1.
‖ un 1 ‖22

Entonces X ∈ S 3 si y solo si

- | do 2Tun 2 | ≤ do T 2X ≤ | do T 2 un 2 |.

Poniendo todo junto, podemos describir S como el conjunto solución de 2 norte desigualdades lineales

v Tk X ≤ 0, k = 1, . . . , norte - 2
- v Tk X ≤ 0, k = 1, . . . , norte - 2
do1 TX ≤ | do T 1 un 1 |

- do1TX ≤ | do T 1 un 1 |

do2 TX
≤ | do T 2 un 2 |

- do2TX ≤ | do T 2 un 2 |.

(segundo) S es un poliedro, definido por las desigualdades lineales X k ≥ con- 0 y tres igualdad
straints. (do) S No es un poliedro. Es la intersección de la bola unidad { x | ‖ X ‖ 2 ≤ 1} y

el ortante no negativo R norte +


. Esto se deduce del hecho siguiente, que sigue
de la desigualdad de Cauchy-Schwarz:

X T y ≤ 1 para todos y con ‖ y ‖ 2 = 1 ⇐⇒ ‖ X ‖ 2 ≤ 1.

Aunque en este ejemplo definimos S como una intersección de semiespacios, no es un poliedro, porque la
definición requiere infinitamente muchos semiespacios. (re) S es un poliedro. S es la intersección del conjunto { x
| | x k | ≤ 1, k = 1, . . . , norte}
y el ortante no negativo R norte +
. Esto se deduce del hecho siguiente:

Σ norte
X T y ≤ 1 para todos y con | y i | = 1 ⇐⇒ | X i | ≤ 1, i = 1, . . . , norte.
i=1

Podemos demostrar esto de la siguiente manera. En primer lugar suponer que | X i | ≤ 1 para todos yo. Entonces

XTy =Σ X yo y yo ≤ Σ | X i || y i | ≤ Σ | yi|= 1
yo yo yo

Si Σ i| y i | = 1.
Por el contrario, supongamos que X es un vector no nulo que satisface fi ca X T y ≤ 1 para todos y

con Σ i| y i | = 1. En particular, podemos hacer la siguiente opción para y: dejar k ser un índice para el cual
| X k | = máx i | X i |, y tomar y k = 1 si X k> 0, y k = - 1 si X k < 0, y y i = 0 para yo 6 = k. Con esta elección de y tenemos

XTy =Σ X yo y i = y k X k = | X k | = máx | X i |.
yo
yo

4
Por lo tanto debemos tener como máximo i | X i | ≤ 1. Todo esto implica que podemos describir S por un número
finito de desigualdades lineales: es la intersección de la ortante no negativo con el conjunto { x | - 1 X 1},

es decir, la solución de 2 norte desigualdades lineales

- X yo ≤ 0, i = 1, . . . , nx yo ≤ 1, i = 1, . . . , norte.

Tenga en cuenta que al igual que en la parte (c) el conjunto S fue dado como una intersección de una en fi número finito
de semiespacios. El rencia di ff es que aquí la mayoría de las desigualdades lineales son redundantes, y sólo se necesita
un número finito de caracterizar S.

Ninguno de estos conjuntos son unos conjuntos de fi ne o subespacios, excepto en algunos casos triviales. Por ejemplo, el conjunto se define en la

parte (a) es un subespacio (por lo tanto una un ne conjunto FFI), si un 1 = un 2 = 0; el conjunto se define en la parte (b) es un conjunto de un ne FFI si n = 1

y S = { 1}; etcétera

2.11 conjuntos hiperbólicos. Demostrar que el hiperbólica conjunto { X ∈ R 2 +


| X 1 X 2 ≥ 1} es convexa. Como un

generalización, muestran que { X ∈ R norte +


| Π ni = 1 X yo ≥ 1} es convexa. Insinuación. Si a, b ≥ 0 y

0 ≤ θ ≤ 1, entonces un θ segundo 1 - θ ≤ θa + ( 1 - θ) b; ver § 3.1.9.

Solución.

(A) Se prueba la primera parte sin utilizar la indirecta. Considere una combinación convexa z
de dos puntos ( X 1, X 2) y ( y 1, y 2) en el conjunto. Si X Y, entonces z = θx + ( 1 - θ) yy
y, obviamente, z 1 z 2 ≥ y 1 y 2 ≥ 1. Prueba similares si y X.

Suponer y 6? X y X 6? Y, es decir, ( y 1 - X 1) ( y 2 - X 2) < 0. A continuación,

( θx 1 + ( 1 - θ) y 1) ( θx 2 + ( 1 - θ) y 2)
= θ 2 X 1 X 2 + ( 1 - θ) 2 y 1 y 2 + θ ( 1 - θ) x 1 y 2 + θ ( 1 - θ) x 2 y 1
= θx 1 X 2 + ( 1 - θ) y 1 y 2 - θ ( 1 - θ) (y 1 - X 1) ( y 2 - X 2)
≥ 1.

(B) Supongamos que Π yo X yo ≥ 1yΠ yo y yo ≥ 1. Uso de la desigualdad en la pista, tenemos


Π
( θx i + ( 1 - θ) y yo) ≥ Π X theta i y 1 - θ i=( Π X i) θ ( Π y yo) 1 - θ ≥ 1.
yo yo yo

2.12 ¿Cuál de los siguientes conjuntos son convexos?

(A) A losa, es decir, un conjunto de la forma { X ∈ R n | α ≤ un T X ≤ β}.

(B) A rectángulo, es decir, un conjunto de la forma { X ∈ R n | α yo ≤ X yo ≤ β yo, i = 1, . . . , norte}. UN


rectángulo se denomina a veces hyperrectangle cuando n> 2.

(C) A cuña, es decir, { X ∈ R n | un T 1X ≤ segundo 1, un2TX ≤ segundo 2}.

5
(D) El conjunto de puntos más cerca de un punto dado de un conjunto dado, es decir,

{ x | ‖ X - X 0 ‖ 2 ≤ ‖ X - y ‖ 2 para todos y ∈ S}

dónde S ⊆ R norte.

(E) El conjunto de puntos más cerca de un conjunto que otro, es decir,

{ x | dist ( x, S) ≤ dist ( x, t)},

dónde S T ⊆ R norte, y

dist ( x, S) = inf { ‖ X - z ‖ 2 | z ∈ S}.

(F) el conjunto { x | x + S 2 ⊆ S 1}, dónde S 1, S 2 ⊆ R norte con S 1 convexo. (G) El conjunto de puntos cuya distancia a un

no exceda una fracción fijada θ del


distancia para segundo, es decir, el conjunto { x | ‖ X - un ‖ 2 ≤ θ ‖ X - segundo ‖ 2}. Se puede suponer un 6 = segundo y 0 ≤ θ ≤ 1.

Solución.

(A) Una losa es una intersección de dos semiespacios, por lo tanto es un conjunto convexo y un polyhe-
Dron.

(B) Como en la parte (a), un rectángulo es un conjunto convexo y un poliedro porque es un finito
intersección de semiespacios.

(C) Una cuña es una intersección de dos semiespacios, por lo que es convexa y un poliedro. Eso
es un cono si segundo 1 = 0 y segundo 2 = 0.

(D) Este conjunto es convexa, ya que puede ser expresado como


{ x | ‖ X - X 0 ‖ 2 ≤ ‖ X - y ‖ 2},
y∈S

es decir, una intersección de semiespacios. (Recuerde del ejercicio 2.7 que, por fi ja Y, el conjunto

{ x | ‖ X - X 0 ‖ 2 ≤ ‖ X - y ‖ 2}

es un semiespacio.)

(E) En general este conjunto no es convexa, como el ejemplo siguiente en R muestra. Con
S = { - 1, 1} y T = { 0}, tenemos

{ x | dist ( x, S) ≤ dist ( x, t)} = {x ∈ R | X ≤ - medio o X ≥ 1/2}

lo que claramente no es convexa.

6
(F) Este conjunto es convexo. x + S 2 ⊆ S 1 Si x + y ∈ S 1 para todos y ∈ S 2. Por lo tanto

{ x | x + S 2 ⊆ S 1} = ⋂ { x | x + y ∈ S 1} = ⋂ ( S 1 - y),
y ∈ S2 y ∈ S2

la intersección de conjuntos convexos S 1 - y.

(G) El conjunto es convexo, de hecho una bola.

{ x | ‖ X - un ‖ 2 ≤ θ ‖ X - segundo ‖ 2}

= { x | ‖ X - un ‖ 2 2≤ θ 2 ‖ X - segundo ‖ 2 2}

= { x | ( 1 - θ 2) X T X - 2 ( un - θ 2 segundo) T x + (una T un - θ 2 segundo T segundo) ≤ 0}

Si θ = 1, este es un semiespacio. Si θ < 1, es una bola

{ x | (X - X 0) T ( X - X 0) ≤ R 2},

con el centro X 0 y el radio R dada por

( θ 2 ‖ segundo ‖ 2 ) 1/2
2- ‖ un ‖ 22
2
X 0 = un - θ 2 segundo R= + ‖ X 0 ‖ 22 .
1 - θ 2, 1 - θ2

2.15 Algunos conjuntos de distribuciones de probabilidad. Dejar X ser una variable aleatoria verdadera de valor con

prob ( x = a i) = pag yo, i = 1, . . . , norte, dónde un 1 < un 2 < · · · < un norte. Por supuesto pag ∈ R norte se encuentra en el simplex de probabilidad estándar P
= {p | 1 T p = 1, pag 0}. Cuál de los siguientes
condiciones son convexas en ¿pag? ( Es decir, ¿por cuál de las siguientes condiciones es el conjunto de
pag ∈ PAG que satisfacen la condición convexa?)

(un) α ≤ mi f (x) ≤ β, dónde mi f (x) es el valor esperado de f (x), es decir, mi f (x) =


Σ ni = 1 pag yo fa yo). ( La función f: R → R se da.) (b) prob ( x> α) ≤ β.

(do) E | X 3 | ≤ α E | x |.

(re) mi X 2 ≤ α.

(mi) mi X 2 ≥ α.

(F) var ( X) ≤ α, dónde var ( x) = MI( X - mi X) 2 es la varianza de X.

(gramo) var ( X) ≥ α.

(H) cuartilla( X) ≥ α, dónde cuartilla( x) = inf { β | prob ( X ≤ β) ≥ 0.25}. (yo) cuartilla( X) ≤ α.

Solución. Nos Fi Nota primero que las restricciones pag yo ≥ 0, i = 1, . . . , norte, de fi ne semiespacios, y Σ ni = 1 pag i = 1 define un hiperplano,

por lo PAG es un poliedro. El primeros cinco restricciones son, de hecho, las desigualdades lineales en las probabilidades pag yo.

7
(un) mi f (x) = Σ ni = 1 pag yo fa yo), por lo que la restricción es equivalente a dos desigualdades lineales

Σ norte
α≤ pag yo fa yo) ≤ β.
i=1

(segundo) prob ( X ≥ α) = Σ I a yo ≥ α pag yo, por lo que la restricción es equivalente a una desigualdad lineal
Σ
pag yo ≤ β.
I a yo ≥ α

(C) La restricción es equivalente a una desigualdad lineal

Σ norte
pag i (| un 3 i | - α | una i |) ≤ 0.
i=1

(D) La restricción es equivalente a una desigualdad lineal

Σ norte
pag yo un 2 yo ≤ α.
i=1

(E) La restricción es equivalente a una desigualdad lineal

Σ norte
pag yo un 2 yo ≥ α.
i=1

Los primeros cinco limitaciones, por tanto, de definir conjuntos convexos.

(F) La restricción

Σ norte Σ norte
var ( x) = mi X 2 - ( mi X) 2 = pag yo un 2 yo - ( pag yo un yo) 2 ≤ α
i=1 i=1

No es convexa en general. Como contraejemplo, podemos tomar n = 2, un 1 = 0, un 2 = 1, y α = 1/5. p = ( 1, 0) y p


= ( 0, 1) son dos puntos que satisfacen var ( X) ≤ α,
pero la combinación convexa p = ( 1/2, 1/2) no lo hace. (G) Esta

restricción es equivalente a

Σ norte Σ norte
un 2 yo pag i + ( un yo pag yo) 2 = segundo T p + p T ap ≤ α
i=1 i=1

dónde segundo i = un 2 yo y A = aa T. Este conjunto, define una forma convexa desde la matriz Automóvil club británico T es positivo finito SEMIDE.

Denotemos cuartilla( x) = f (p) hacer hincapié en que es una función de pag. En la figura se ilustra la definición. Se
muestra la distribución acumulada de una distribución pag con
f (p) = a 2.

8
prob ( X ≤ β)

pag 1 + pag 2 + · · · + pag norte - 1

pag 1 + pag 2

0.25 1
pag 1

β
un 1 un 2 un norte

(H) La restricción f (p) ≥ α es equivalente a

prob ( X ≤ β) < 0,25 para todos β <α.

Si α ≤ un 1, esto es siempre cierto. De lo contrario, definen k = max { i | un i < α}. Este es un número entero fijo,
independiente de pag. la restricción f (p) ≥ α se cumple si y sólo si

Σk
prob ( X ≤ un k) = pag i < 0.25.
i=1

Esta es una desigualdad lineal estricta en pag, que define un semiespacio abierta. (I) La

restricción f (p) ≤ α es equivalente a

prob ( X ≤ β) ≥ 0,25 para todos β ≥ α.

A continuación, vamos definen k = max { i | un yo ≤ α}. De nuevo, esto es un número entero fijo, independiente de pag. la restricción f

(p) ≤ α se cumple si y sólo si

Σk
prob ( X ≤ un k) = pag yo ≥ 0.25.
i=1

Si α ≤ un 1, entonces no pag satis fi ca f (p) ≤ α, lo que significa que el conjunto está vacía.

También podría gustarte