Está en la página 1de 9

Breve sobre Kuhn-Tucker

Alejandro Lugon
21 de marzo de 2014

Resumen
Se presentan a manera de manual de referencia los resultados relevantes para la solución de problemas
de maximización usando los resultados de Kuhn-Tucker.

1. Problema básico
Para el problema:

M ax F (x) (1)
s.a. gj (x) ≤ cj con j = 1, . . . , m

con x ∈ Rn . Se forma el Lagrangiano:


m
X
L ≡ F (x) − λj (gj (x) − cj ) (2)
j=1

para obtener las:

Condiciones de Kuhn-Tucker (CKT)


∂L
1. = 0 para cada i = 1, . . . , n
∂xi
2. gj (x) ≤ cj para cada j = 1, . . . , m
3. λj ≥ 0 para cada j = 1, . . . , m

4. Si gj (x) < cj entonces λj = 0 para cada j = 1, . . . , m1

1.1. Necesidad y suficiencia de las CKT


Los resultados teóricos para el uso de estas condiciones se dan a continuación:

Teorema 1 (Necesidad) Sea x∗ solución del problema (1). Si x∗ cumple la cualificación de las res-
tricciones2 entonces existe λ∗ ∈ Rm tal que (x∗ , λ∗ ) cumplen las condiciones de Kuhn-Tucker
1 Formas equivalentes de esta condición son: [λj > 0 entonces gj (x) = cj ] o [λj (gj (x) − cj ) = 0]
2 Veremos luego a qué se refiere esta condición

1
Supongamos por el momento que toda x posible cumple la cualificación de las restricciones. En ese caso,
el teorema nos dice que toda solución debe satisfacer las CKT para cierto λ. Leı́da de otra forma; si x no
cumple la CKT para ningún λ entonces no puede ser solución. En la práctica si aplicamos y resolvemos las
ecuaciones de la CKT, todos los puntos que encontremos serán candidatos a resolver el problema (aunque
no es seguro que sean solución), todos los demás puntos han sido descartados como posibles soluciones.
La cualificación de las restricciones es una condición técnica que puede tomar varias formas, las
más usuales son:
Para el problema (1) el punto x cumple con la cualificación de las restricciones en cualquiera de los
siguientes casos:

Ind.Lin El conjunto de vectores de Rn : {∇gj (x)|gj (x) = cj } es linealmente independiente

Lin Todas las restricciones gj son lineales.


Slater Todas las restricciones gj son convexas y existe x0 tal que gj (x0 ) < cj para cada j = 1, . . . , m.

Repitiendo lo dicho antes, con bastante generalidad las Condiciones de Kuhn-Tucker seleccionan un
conjunto de puntos que debe incluir a la solución, si esta existe. Para poder asegurar que aquellos puntos
que satisfacen las CKT son la solución tenemos los resultados de suficiencia.

Teorema 2 (Suficiencia 1) Si en el problema (1), la función objetivo f es cóncava y todas las restricciones
gj son convexas se cumple que:
Si (x∗ , λ∗ ) cumple las condiciones de Kuhn-Tucker entonces x∗ es solución de (1).

Teorema 3 (Suficiencia 2) Si en el problema (1), (x∗ , λ∗ ) cumple las condiciones de Kuhn-Tucker y


L(x, λ∗ ), como función de x, es cóncava, entonces x∗ es solución de (1).

Demostración.
∂L ∗ ∗
Al ser L(x, λ∗ ) cóncava, las condiciones: (x , λ ) = 0 para cada i = 1, . . . , n nos aseguran que x∗ es un
∂xi
máximo de L(x, λ∗ ), por lo que para todo x:

L(x∗ , λ∗ ) ≥ L(x, λ∗ )
m
X Xm
F (x∗ ) − λ∗j (gj (x∗ ) − cj ) ≥ F (x) − λ∗j (gj (x) − cj )
j=1 j=1
m
X m
X

F (x ) − F (x) ≥ λ∗j ∗
(gj (x ) − cj ) − λ∗j (gj (x) − cj )
j=1 j=1
Xm Xm
F (x∗ ) − F (x) ≥ λ∗j (gj (x∗ ) − cj ) − λ∗j (gj (x) − cj )
j=1 j=1

Por las CKT sabemos que λ∗j (gj (x∗ ) − cj ) = 0 para toda j.
m
X
F (x∗ ) − F (x) ≥ − λ∗j (gj (x) − cj )
j=1
m
X
F (x∗ ) − F (x) ≥ λ∗j (cj − gj (x))
j=1

2
Como x debe cumplir las restricciones tenemos que gj (x) ≤ cj y además los multiplicadores deben ser no
negativos: λ∗j ≥ 0 luego para cada sumando λ∗j (cj − gj (x)) ≥ 0 con lo que llegamos a:

F (x∗ ) − F (x) ≥ 0

es decir:
F (x∗ ) ≥ F (x)

El primero de estos teoremas se puede aplicar antes de usar las CKT. Para aplicar el segundo necesitamos
resolver las CKT para verificar en cada candidato si L(x, λ∗ ) es cóncavo.
Debe ser claro que el primer teorema de suficiencia se desprende del segundo.
Otra forma de estar seguros de haber obtenido la solución es usar el:

Teorema 4 (Weierstrass) Si en (1), la función F es continua y las restricciones generan un conjunto no


vacı́o, cerrado y acotado, entonces el problema tiene al menos una solución.

Si podemos aplicar el Teorema de Weierstass, la solución debe ser uno de los puntos seleccionados por
las CKT y basta entonces evaluar la función objetivo en cada candidato para saber cuál es la solución.

1.2. Uso de las CKT


Al usar las CKT debemos encontrar soluciones completas, valores para las x0 s y para las λ0 s, es decir
tenemos n + m incógnitas. Para esto necesitamos (genéricamente) n + m ecuaciones. Observando las CKT, el
punto 1 provee de n ecuaciones, las otras m ecuaciones salen del punto 4 considerando las dos alternativas:
[gj (x) = cj ] o [gj (x) < cj y por lo tanto λj = 0]. Como tenemos m de estas posibilidades se generan 2m
casos que envuelven a m + n ecuaciones para m + n variables. En cada caso luego de resolver las ecuaciones
se deben verificar las desigualdades de los puntos 2 y 3.

1.3. Ejemplo

M ax F (x, y)
s.a. g1 (x, y) ≤ c1
g2 (x, y) ≤ c2
g3 (x, y) ≤ c3
El lagrangiano es:

L(x, y, λ1 , λ2 , λ3 ) = F (x, y) − λ1 (g1 (x, y) − c1 ) − λ2 (g2 (x, y) − c2 ) − λ3 (g3 (x, y) − c3 )

y las CKT:
∂L
1. ∂x =0
∂L
∂y =0

2. g1 (x, y) ≤ c1
g2 (x, y) ≤ c2
g3 (x, y) ≤ c3
3. λ1 ≥ 0
λ2 ≥ 0
λ3 ≥ 0

3
4. Si g1 (x, y) < c1 entonces λ1 = 0
Si g2 (x, y) < c2 entonces λ2 = 0
Si g3 (x, y) < c3 entonces λ3 = 0
Como tenemos 3 restricciones tenemos 23 = 8 casos:
g1 g2 g3
1 = c1 = c2 = c3
2 > c1 = c2 = c3
3 = c1 > c2 = c3
4 > c1 > c2 = c3
5 = c1 = c2 > c3
6 > c1 = c2 > c3
7 = c1 > c2 > c3
8 > c1 > c2 > c3

2. Problemas con condiciones de nonegatividad


En muchos problemas de la teorı́a económica las variables de elección deben ser no negativas, planteándose
en este caso el problema:

M ax F (x) (3)
s.a. gj (x) ≤ cj con j = 1, . . . , m
xi ≥ 0 para i = 1, . . . , n

Este problema puede ser tratado como se fuera del tipo (1) ahora con n + m restricciones (y multiplicado-
res). Lo que sucede es que los multiplicadores de las restricciones de no negatividad no tienen mayor interés.
Es por esto que se adecuan las condiciones de Kuhn-Tucker para no trabajar con dichos multiplicadores.

2.1. Adecuación de las condiciones de Kuhn-Tucker


El lagrangiano original para el problema (3) es:
m
X n
X
L ≡ F (x) − λj (gj (x) − cj ) − µi (−xi ) (4)
j=1 i=1

pero vamos a escribir las condiciones de K-T en base al “Lagrangiano corto”:


m
X
L ≡ F (x) − λj (gj (x) − cj ) (5)
j=1

donde no usamos los multiplicadores µ.


Observemos que:
∂L ∂L
= + µi
∂xi ∂xi
Para el lagrangiano (4) las condiciones de K-T son:
∂L ∂L
1. ∂xi = ∂xi + µi = 0 para cada i = 1, . . . , n

4
2. gj (x) ≤ cj para cada j = 1, . . . , m
xi ≥ 0 para i = 1, . . . , n
3. λj ≥ 0 para cada j = 1, . . . , m
µi ≥ 0 para cada i = 1, . . . , n
4. Si gj (x) < cj entonces λj = 0
Si xi > 0 entonces µi = 0
Observemos que de la primera condición podemos despejar:
∂L
µi = −
∂xi
y reemplazar en las otras:

1.
2. gj (x) ≤ cj para cada j = 1, . . . , m
xi ≥ 0 para i = 1, . . . , n
3. λj ≥ 0 para cada j = 1, . . . , m
∂L
− ∂x i
≥ 0 para cada i = 1, . . . , n
4. Si gj (x) < cj entonces λj = 0
∂L
Si xi > 0 entonces − ∂x i
=0

Donde observamos que no aparecen los multiplicadores µ y las condiciones están expresadas en términos
del Lagrangiano (5). Finalmente podemos ordenar, simplificar y renumerar las condiciones para obtener:
∂L
1. ∂xi ≤ 0 para cada i = 1, . . . , n
2. gj (x) ≤ cj para cada j = 1, . . . , m
3. xi ≥ 0 para i = 1, . . . , n
4. λj ≥ 0 para cada j = 1, . . . , m
5. Si gj (x) < cj entonces λj = 0
∂L
6. Si xi > 0 entonces ∂xi =0

Los casos y sistemas de ecuaciones se obtienen de las condiciones 5 y 6.

2.2. Ejemplo

M ax xy − x + y
s.a. x + y ≤ 9
x + 5y ≤ 25
x≥0
y≥0
Tenemos:
L ≡ xy − x + y − λ1 (x + y − 9) − λ2 (x + 5y − 25)
con las condiciones:

5
∂L
1. ∂x = y − 1 − λ1 − λ2 ≥ 0
∂L
∂y = x + 1 − λ1 − 5λ2 ≥ 0
2. x + y ≤ 9
x + 5y ≤ 25

3. x ≥ 0
y≥0
4. λ1 ≥ 0
λ2 ≥ 0

5. Si x + y < 9 entonces λ1 = 0
Si x + 5y < 25 entonces λ2 = 0
6. Si x > 0 entonces y − 1 − λ1 − λ2 = 0
Si y > 0 entonces x + 1 − λ1 − 5λ2

De las condiciones 5 y 6 tenemos 24 = 16 casos:

R1 R2 x y
a = = = =
b > = = =
c = > = =
d > > = =
e = = > =
f > = > =
g = > > =
h > > > =
i = = = >
j > = = >
k = > = >
l > > = >
m = = > >
n > = > >
p = > > >
q > > > >

3. Problemas con restricciones mixtas


Consideremos ahora el problema:

M ax F (x) (6)
s.a. gj (x) ≤ cj con j = 1, . . . , m
hk (x) = dk con k = 1, . . . , l

con x ∈ Rn . en el cual tenemos restricciones de desigualdad y de igualdad.

6
3.1. Adecuación de las CKT
Para poder aplicar las condiciones de Kuhn-Tucker podemos transformar el problema en:

M ax F (x) (7)
s.a. gj (x) ≤ cj con j = 1, . . . , m
hk (x) ≤ dk con k = 1, . . . , l
hk (x) ≥ dk con k = 1, . . . , l

Donde hemos usado:

hk (x) = ck ⇐⇒ dk ≤ hk (x) ≤ dk

hk (x) ≤ dk
⇐⇒
hk (x) ≥ dk

Para el problema ?? se forma el Lagrangiano:


m
X l
X l
X
L(x, λ, µ, ν) = F (x) − λj (gj (x) − cj ) − µk (hk (x) − dk ) + νk (hk (x) − dk ) (8)
j=1 k=1 k=1

y se obtienen las condiciones de Kuhn-Tucker:


∂L
1. = 0 para cada i = 1, . . . , n
∂xi
2. gj (x) ≤ cj para cada j = 1, . . . , m
hk (x) ≤ dk para cada k = 1, . . . , l
hk (x) ≥ dk para cada k = 1, . . . , l
3. λj ≥ 0 para cada j = 1, . . . , m
µk ≥ 0 para cada k = 1, . . . , l
νk ≥ 0 para cada k = 1, . . . , l
4. Si gj (x) < cj entonces λj = 0
Si hk (x) < dk entonces µk = 0
Si hk (x) > dk entonces νk = 0

Del punto 2 podemos recuperar hk (x) = ck para cada k = 1, . . . , l, lo cual nos permite no considerar las
dos últimas condiciones del punto 4 .
Por otro lado podemos transformar el lagrangiano de 8:
m
X l
X l
X
L(x, λ, µ, ν) = F (x) − λj (gj (x) − cj ) − µk (hk (x) − dk ) + νk (hk (x) − dk )
j=1 k=1 k=1
m
X l
X
= F (x) − λj (gj (x) − cj ) − (µk − νk )(hk (x) − dk )
j=1 k=1
m
X l
X
= F (x) − λj (gj (x) − cj ) − ηk (hk (x) − dk )
j=1 k=1
= L(x, λ, η)

7
Donde hemos definido un nuevo multiplicador:

ηk = µk − νk

y un nuevo Lagrangiano:
m
X l
X
L(x, λ, η) = F (x) − λj (gj (x) − cj ) − ηk (hk (x) − dk ) (9)
j=1 k=1

y es fácil ver la relación entre las derivadas de ambos Lagrangianos (ecuaciones (8) y(9):
∂ ∂
L(x, λ, µ, ν) = L(x, λ, η)
∂xi ∂xi
En términos de este Lagrangiano las condiciones establecidas serı́an:
∂L
1. = 0 para cada i = 1, . . . , n
∂xi
2. gj (x) ≤ cj para cada j = 1, . . . , m
hk (x) = dk para cada k = 1, . . . , l
3. λj ≥ 0 para cada j = 1, . . . , m

4. Si gj (x) < cj entonces λj = 0

Donde los multiplicadores ηk , al ser la diferencia de dos números no negativos, pueden tomar valores
negativos, positivos o nulos. Es decir que no están restringidos a ser no negativos, como lo están los multi-
plicadores asociados a las restricciones de desigualdad.

3.2. Ejemplo

M ax xy − x + y
s.a. x + y ≤ 9
x + 5y = 25
Tenemos:
L ≡ xy − x + y − λ1 (x + y − 9) − λ2 (x + 5y − 25)
con las condiciones:
∂L
1. ∂x = y − 1 − λ1 − λ2 = 0
∂L
∂y = x + 1 − λ1 − 5λ2 = 0

2. x + y ≤ 9
x + 5y = 25
3. λ1 ≥ 0

4. Si x + y < 9 entonces λ1 = 0
De la condición 4 tenemos 21 = 2 casos: x + y < 9 y x + y = 9.

8
4. Teorema de la Envolvente
Consideremos un problema de optimización con variables de elección x ∈ Rn y parámetros q ∈ Q ⊂ Rs :

M ax F (x, q) (10)
s.a. gj (x, q) ≤ 0 con j = 1, . . . , m

y supongamos que para todo juego de parámetros q ∈ Q el problema tiene solución y esta es única, ası́ po-
demos escribir: x(q), la solución de (10) para q. Lo que estamos haciendo es definir la función solución:
x : Q → Rn , que a cada juego de parámetros q le asigna la solución particular del problema3 .
También podemos definir la función valor óptimo: v : Q → R, que a cada juego de parámetros q le asigna
el valor máximo de la función: v(q) = F (x(q), q).
Estas dos funciones en la teorı́a económica pueden ser de interés, por ejemplo: si el problema de maxi-
mización corresponde al problema del consumidor, los parámetros q son los precios y el ingreso, la función
x(q) es la función demanda y la función v(q) es la utilidad indirecta.
Una primera pregunta es si estas funciones x( ) y v( ) son continuas o, aún más, diferenciables respecto
de los parámetros q, para lo que sigue asumiremos lo segundo.
El Teorema de la Envolvente para el caso en que se tiene solo restricciones de igualdad es conocido:

Teorema 5 (Envolvente) Para el problema

M ax F (x, q)
s.a. gj (x, q) = 0 con j = 1, . . . , m

sea v(q) = F (x(q), q) la función valor, la cual asumiremos diferenciable. Se cumple:


∂v(q) ∂L(x, q, λ)
=
∂qs q̄ ∂qs
(x(q̄),q̄,λ(q̄))
m
∂F (x, q) X ∂gj (x, q)
= − λj (q̄)
∂qs (x(q̄),q̄) j=1 ∂qs (x(q̄),q̄)

Para tener un resultado similar para el problema con restricciones de desigualdad se debe asegurar que el
conjunto de restricciones que se cumplen con igualdad en la solución x(q) :

B(q) = {j|gj (x(q), q) = 0}

es invariante en una vecindad de q̄.

3 Observemos que también los multiplicadores de Lagrange que acompañan a cada solución dependen de q: λ(q)

También podría gustarte