Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Alejandro Lugon
21 de marzo de 2014
Resumen
Se presentan a manera de manual de referencia los resultados relevantes para la solución de problemas
de maximización usando los resultados de Kuhn-Tucker.
1. Problema básico
Para el problema:
M ax F (x) (1)
s.a. gj (x) ≤ cj con j = 1, . . . , m
Teorema 1 (Necesidad) Sea x∗ solución del problema (1). Si x∗ cumple la cualificación de las res-
tricciones2 entonces existe λ∗ ∈ Rm tal que (x∗ , λ∗ ) cumplen las condiciones de Kuhn-Tucker
1 Formas equivalentes de esta condición son: [λj > 0 entonces gj (x) = cj ] o [λj (gj (x) − cj ) = 0]
2 Veremos luego a qué se refiere esta condición
1
Supongamos por el momento que toda x posible cumple la cualificación de las restricciones. En ese caso,
el teorema nos dice que toda solución debe satisfacer las CKT para cierto λ. Leı́da de otra forma; si x no
cumple la CKT para ningún λ entonces no puede ser solución. En la práctica si aplicamos y resolvemos las
ecuaciones de la CKT, todos los puntos que encontremos serán candidatos a resolver el problema (aunque
no es seguro que sean solución), todos los demás puntos han sido descartados como posibles soluciones.
La cualificación de las restricciones es una condición técnica que puede tomar varias formas, las
más usuales son:
Para el problema (1) el punto x cumple con la cualificación de las restricciones en cualquiera de los
siguientes casos:
Repitiendo lo dicho antes, con bastante generalidad las Condiciones de Kuhn-Tucker seleccionan un
conjunto de puntos que debe incluir a la solución, si esta existe. Para poder asegurar que aquellos puntos
que satisfacen las CKT son la solución tenemos los resultados de suficiencia.
Teorema 2 (Suficiencia 1) Si en el problema (1), la función objetivo f es cóncava y todas las restricciones
gj son convexas se cumple que:
Si (x∗ , λ∗ ) cumple las condiciones de Kuhn-Tucker entonces x∗ es solución de (1).
Demostración.
∂L ∗ ∗
Al ser L(x, λ∗ ) cóncava, las condiciones: (x , λ ) = 0 para cada i = 1, . . . , n nos aseguran que x∗ es un
∂xi
máximo de L(x, λ∗ ), por lo que para todo x:
L(x∗ , λ∗ ) ≥ L(x, λ∗ )
m
X Xm
F (x∗ ) − λ∗j (gj (x∗ ) − cj ) ≥ F (x) − λ∗j (gj (x) − cj )
j=1 j=1
m
X m
X
∗
F (x ) − F (x) ≥ λ∗j ∗
(gj (x ) − cj ) − λ∗j (gj (x) − cj )
j=1 j=1
Xm Xm
F (x∗ ) − F (x) ≥ λ∗j (gj (x∗ ) − cj ) − λ∗j (gj (x) − cj )
j=1 j=1
Por las CKT sabemos que λ∗j (gj (x∗ ) − cj ) = 0 para toda j.
m
X
F (x∗ ) − F (x) ≥ − λ∗j (gj (x) − cj )
j=1
m
X
F (x∗ ) − F (x) ≥ λ∗j (cj − gj (x))
j=1
2
Como x debe cumplir las restricciones tenemos que gj (x) ≤ cj y además los multiplicadores deben ser no
negativos: λ∗j ≥ 0 luego para cada sumando λ∗j (cj − gj (x)) ≥ 0 con lo que llegamos a:
F (x∗ ) − F (x) ≥ 0
es decir:
F (x∗ ) ≥ F (x)
El primero de estos teoremas se puede aplicar antes de usar las CKT. Para aplicar el segundo necesitamos
resolver las CKT para verificar en cada candidato si L(x, λ∗ ) es cóncavo.
Debe ser claro que el primer teorema de suficiencia se desprende del segundo.
Otra forma de estar seguros de haber obtenido la solución es usar el:
Si podemos aplicar el Teorema de Weierstass, la solución debe ser uno de los puntos seleccionados por
las CKT y basta entonces evaluar la función objetivo en cada candidato para saber cuál es la solución.
1.3. Ejemplo
M ax F (x, y)
s.a. g1 (x, y) ≤ c1
g2 (x, y) ≤ c2
g3 (x, y) ≤ c3
El lagrangiano es:
y las CKT:
∂L
1. ∂x =0
∂L
∂y =0
2. g1 (x, y) ≤ c1
g2 (x, y) ≤ c2
g3 (x, y) ≤ c3
3. λ1 ≥ 0
λ2 ≥ 0
λ3 ≥ 0
3
4. Si g1 (x, y) < c1 entonces λ1 = 0
Si g2 (x, y) < c2 entonces λ2 = 0
Si g3 (x, y) < c3 entonces λ3 = 0
Como tenemos 3 restricciones tenemos 23 = 8 casos:
g1 g2 g3
1 = c1 = c2 = c3
2 > c1 = c2 = c3
3 = c1 > c2 = c3
4 > c1 > c2 = c3
5 = c1 = c2 > c3
6 > c1 = c2 > c3
7 = c1 > c2 > c3
8 > c1 > c2 > c3
M ax F (x) (3)
s.a. gj (x) ≤ cj con j = 1, . . . , m
xi ≥ 0 para i = 1, . . . , n
Este problema puede ser tratado como se fuera del tipo (1) ahora con n + m restricciones (y multiplicado-
res). Lo que sucede es que los multiplicadores de las restricciones de no negatividad no tienen mayor interés.
Es por esto que se adecuan las condiciones de Kuhn-Tucker para no trabajar con dichos multiplicadores.
4
2. gj (x) ≤ cj para cada j = 1, . . . , m
xi ≥ 0 para i = 1, . . . , n
3. λj ≥ 0 para cada j = 1, . . . , m
µi ≥ 0 para cada i = 1, . . . , n
4. Si gj (x) < cj entonces λj = 0
Si xi > 0 entonces µi = 0
Observemos que de la primera condición podemos despejar:
∂L
µi = −
∂xi
y reemplazar en las otras:
1.
2. gj (x) ≤ cj para cada j = 1, . . . , m
xi ≥ 0 para i = 1, . . . , n
3. λj ≥ 0 para cada j = 1, . . . , m
∂L
− ∂x i
≥ 0 para cada i = 1, . . . , n
4. Si gj (x) < cj entonces λj = 0
∂L
Si xi > 0 entonces − ∂x i
=0
Donde observamos que no aparecen los multiplicadores µ y las condiciones están expresadas en términos
del Lagrangiano (5). Finalmente podemos ordenar, simplificar y renumerar las condiciones para obtener:
∂L
1. ∂xi ≤ 0 para cada i = 1, . . . , n
2. gj (x) ≤ cj para cada j = 1, . . . , m
3. xi ≥ 0 para i = 1, . . . , n
4. λj ≥ 0 para cada j = 1, . . . , m
5. Si gj (x) < cj entonces λj = 0
∂L
6. Si xi > 0 entonces ∂xi =0
2.2. Ejemplo
M ax xy − x + y
s.a. x + y ≤ 9
x + 5y ≤ 25
x≥0
y≥0
Tenemos:
L ≡ xy − x + y − λ1 (x + y − 9) − λ2 (x + 5y − 25)
con las condiciones:
5
∂L
1. ∂x = y − 1 − λ1 − λ2 ≥ 0
∂L
∂y = x + 1 − λ1 − 5λ2 ≥ 0
2. x + y ≤ 9
x + 5y ≤ 25
3. x ≥ 0
y≥0
4. λ1 ≥ 0
λ2 ≥ 0
5. Si x + y < 9 entonces λ1 = 0
Si x + 5y < 25 entonces λ2 = 0
6. Si x > 0 entonces y − 1 − λ1 − λ2 = 0
Si y > 0 entonces x + 1 − λ1 − 5λ2
R1 R2 x y
a = = = =
b > = = =
c = > = =
d > > = =
e = = > =
f > = > =
g = > > =
h > > > =
i = = = >
j > = = >
k = > = >
l > > = >
m = = > >
n > = > >
p = > > >
q > > > >
M ax F (x) (6)
s.a. gj (x) ≤ cj con j = 1, . . . , m
hk (x) = dk con k = 1, . . . , l
6
3.1. Adecuación de las CKT
Para poder aplicar las condiciones de Kuhn-Tucker podemos transformar el problema en:
M ax F (x) (7)
s.a. gj (x) ≤ cj con j = 1, . . . , m
hk (x) ≤ dk con k = 1, . . . , l
hk (x) ≥ dk con k = 1, . . . , l
hk (x) = ck ⇐⇒ dk ≤ hk (x) ≤ dk
hk (x) ≤ dk
⇐⇒
hk (x) ≥ dk
Del punto 2 podemos recuperar hk (x) = ck para cada k = 1, . . . , l, lo cual nos permite no considerar las
dos últimas condiciones del punto 4 .
Por otro lado podemos transformar el lagrangiano de 8:
m
X l
X l
X
L(x, λ, µ, ν) = F (x) − λj (gj (x) − cj ) − µk (hk (x) − dk ) + νk (hk (x) − dk )
j=1 k=1 k=1
m
X l
X
= F (x) − λj (gj (x) − cj ) − (µk − νk )(hk (x) − dk )
j=1 k=1
m
X l
X
= F (x) − λj (gj (x) − cj ) − ηk (hk (x) − dk )
j=1 k=1
= L(x, λ, η)
7
Donde hemos definido un nuevo multiplicador:
ηk = µk − νk
y un nuevo Lagrangiano:
m
X l
X
L(x, λ, η) = F (x) − λj (gj (x) − cj ) − ηk (hk (x) − dk ) (9)
j=1 k=1
y es fácil ver la relación entre las derivadas de ambos Lagrangianos (ecuaciones (8) y(9):
∂ ∂
L(x, λ, µ, ν) = L(x, λ, η)
∂xi ∂xi
En términos de este Lagrangiano las condiciones establecidas serı́an:
∂L
1. = 0 para cada i = 1, . . . , n
∂xi
2. gj (x) ≤ cj para cada j = 1, . . . , m
hk (x) = dk para cada k = 1, . . . , l
3. λj ≥ 0 para cada j = 1, . . . , m
Donde los multiplicadores ηk , al ser la diferencia de dos números no negativos, pueden tomar valores
negativos, positivos o nulos. Es decir que no están restringidos a ser no negativos, como lo están los multi-
plicadores asociados a las restricciones de desigualdad.
3.2. Ejemplo
M ax xy − x + y
s.a. x + y ≤ 9
x + 5y = 25
Tenemos:
L ≡ xy − x + y − λ1 (x + y − 9) − λ2 (x + 5y − 25)
con las condiciones:
∂L
1. ∂x = y − 1 − λ1 − λ2 = 0
∂L
∂y = x + 1 − λ1 − 5λ2 = 0
2. x + y ≤ 9
x + 5y = 25
3. λ1 ≥ 0
4. Si x + y < 9 entonces λ1 = 0
De la condición 4 tenemos 21 = 2 casos: x + y < 9 y x + y = 9.
8
4. Teorema de la Envolvente
Consideremos un problema de optimización con variables de elección x ∈ Rn y parámetros q ∈ Q ⊂ Rs :
M ax F (x, q) (10)
s.a. gj (x, q) ≤ 0 con j = 1, . . . , m
y supongamos que para todo juego de parámetros q ∈ Q el problema tiene solución y esta es única, ası́ po-
demos escribir: x(q), la solución de (10) para q. Lo que estamos haciendo es definir la función solución:
x : Q → Rn , que a cada juego de parámetros q le asigna la solución particular del problema3 .
También podemos definir la función valor óptimo: v : Q → R, que a cada juego de parámetros q le asigna
el valor máximo de la función: v(q) = F (x(q), q).
Estas dos funciones en la teorı́a económica pueden ser de interés, por ejemplo: si el problema de maxi-
mización corresponde al problema del consumidor, los parámetros q son los precios y el ingreso, la función
x(q) es la función demanda y la función v(q) es la utilidad indirecta.
Una primera pregunta es si estas funciones x( ) y v( ) son continuas o, aún más, diferenciables respecto
de los parámetros q, para lo que sigue asumiremos lo segundo.
El Teorema de la Envolvente para el caso en que se tiene solo restricciones de igualdad es conocido:
M ax F (x, q)
s.a. gj (x, q) = 0 con j = 1, . . . , m
∂v(q) ∂L(x, q, λ)
=
∂qs q̄ ∂qs
(x(q̄),q̄,λ(q̄))
m
∂F (x, q) X ∂gj (x, q)
= − λj (q̄)
∂qs (x(q̄),q̄) j=1 ∂qs (x(q̄),q̄)
Para tener un resultado similar para el problema con restricciones de desigualdad se debe asegurar que el
conjunto de restricciones que se cumplen con igualdad en la solución x(q) :
3 Observemos que también los multiplicadores de Lagrange que acompañan a cada solución dependen de q: λ(q)