Breve Sobre KuhnTucker PDF

Breve sobre Kuhn-Tucker
Alejandro Lugon
21 de marzo de 2014
Resumen
Se presentan a manera de manual de referencia los resultados relevantes para la solución de problemas
de maximización usando los resultados de Kuhn-Tucker.
1. Problema básico
Para el problema:
M ax F (x) (1)
s.a. gj (x) ≤ cj con j = 1, . . . , m
con x ∈ Rn . Se forma el Lagrangiano:

m
X
L ≡ F (x) − λj (gj (x) − cj ) (2)
j=1
para obtener las:
Condiciones de Kuhn-Tucker (CKT)

∂L
1. = 0 para cada i = 1, . . . , n
∂xi
2. gj (x) ≤ cj para cada j = 1, . . . , m
3. λj ≥ 0 para cada j = 1, . . . , m
4. Si gj (x) < cj entonces λj = 0 para cada j = 1, . . . , m1
1.1. Necesidad y suficiencia de las CKT

Los resultados teóricos para el uso de estas condiciones se dan a continuación:
Teorema 1 (Necesidad) Sea x∗ solución del problema (1). Si x∗ cumple la cualificación de las res-
tricciones2 entonces existe λ∗ ∈ Rm tal que (x∗ , λ∗ ) cumplen las condiciones de Kuhn-Tucker
1 Formas equivalentes de esta condición son: [λj > 0 entonces gj (x) = cj ] o [λj (gj (x) − cj ) = 0]
2 Veremos luego a qué se refiere esta condición
1
Supongamos por el momento que toda x posible cumple la cualificación de las restricciones. En ese caso,
el teorema nos dice que toda solución debe satisfacer las CKT para cierto λ. Leı́da de otra forma; si x no
cumple la CKT para ningún λ entonces no puede ser solución. En la práctica si aplicamos y resolvemos las
ecuaciones de la CKT, todos los puntos que encontremos serán candidatos a resolver el problema (aunque
no es seguro que sean solución), todos los demás puntos han sido descartados como posibles soluciones.
La cualificación de las restricciones es una condición técnica que puede tomar varias formas, las
más usuales son:
Para el problema (1) el punto x cumple con la cualificación de las restricciones en cualquiera de los
siguientes casos:
Ind.Lin El conjunto de vectores de Rn : {∇gj (x)|gj (x) = cj } es linealmente independiente
Lin Todas las restricciones gj son lineales.

Slater Todas las restricciones gj son convexas y existe x0 tal que gj (x0 ) < cj para cada j = 1, . . . , m.
Repitiendo lo dicho antes, con bastante generalidad las Condiciones de Kuhn-Tucker seleccionan un
conjunto de puntos que debe incluir a la solución, si esta existe. Para poder asegurar que aquellos puntos
que satisfacen las CKT son la solución tenemos los resultados de suficiencia.
Teorema 2 (Suficiencia 1) Si en el problema (1), la función objetivo f es cóncava y todas las restricciones
gj son convexas se cumple que:
Si (x∗ , λ∗ ) cumple las condiciones de Kuhn-Tucker entonces x∗ es solución de (1).
Teorema 3 (Suficiencia 2) Si en el problema (1), (x∗ , λ∗ ) cumple las condiciones de Kuhn-Tucker y

L(x, λ∗ ), como función de x, es cóncava, entonces x∗ es solución de (1).
Demostración.
∂L ∗ ∗
Al ser L(x, λ∗ ) cóncava, las condiciones: (x , λ ) = 0 para cada i = 1, . . . , n nos aseguran que x∗ es un
∂xi
máximo de L(x, λ∗ ), por lo que para todo x:
L(x∗ , λ∗ ) ≥ L(x, λ∗ )
m
X Xm
F (x∗ ) − λ∗j (gj (x∗ ) − cj ) ≥ F (x) − λ∗j (gj (x) − cj )
j=1 j=1
m
X m
X
∗
F (x ) − F (x) ≥ λ∗j ∗
(gj (x ) − cj ) − λ∗j (gj (x) − cj )
j=1 j=1
Xm Xm
F (x∗ ) − F (x) ≥ λ∗j (gj (x∗ ) − cj ) − λ∗j (gj (x) − cj )
j=1 j=1
Por las CKT sabemos que λ∗j (gj (x∗ ) − cj ) = 0 para toda j.
m
X
F (x∗ ) − F (x) ≥ − λ∗j (gj (x) − cj )
j=1
m
X
F (x∗ ) − F (x) ≥ λ∗j (cj − gj (x))
j=1
2
Como x debe cumplir las restricciones tenemos que gj (x) ≤ cj y además los multiplicadores deben ser no
negativos: λ∗j ≥ 0 luego para cada sumando λ∗j (cj − gj (x)) ≥ 0 con lo que llegamos a:
F (x∗ ) − F (x) ≥ 0
es decir:
F (x∗ ) ≥ F (x)
El primero de estos teoremas se puede aplicar antes de usar las CKT. Para aplicar el segundo necesitamos
resolver las CKT para verificar en cada candidato si L(x, λ∗ ) es cóncavo.
Debe ser claro que el primer teorema de suficiencia se desprende del segundo.
Otra forma de estar seguros de haber obtenido la solución es usar el:
Teorema 4 (Weierstrass) Si en (1), la función F es continua y las restricciones generan un conjunto no

vacı́o, cerrado y acotado, entonces el problema tiene al menos una solución.
Si podemos aplicar el Teorema de Weierstass, la solución debe ser uno de los puntos seleccionados por
las CKT y basta entonces evaluar la función objetivo en cada candidato para saber cuál es la solución.
1.2. Uso de las CKT

Al usar las CKT debemos encontrar soluciones completas, valores para las x0 s y para las λ0 s, es decir
tenemos n + m incógnitas. Para esto necesitamos (genéricamente) n + m ecuaciones. Observando las CKT, el
punto 1 provee de n ecuaciones, las otras m ecuaciones salen del punto 4 considerando las dos alternativas:
[gj (x) = cj ] o [gj (x) < cj y por lo tanto λj = 0]. Como tenemos m de estas posibilidades se generan 2m
casos que envuelven a m + n ecuaciones para m + n variables. En cada caso luego de resolver las ecuaciones
se deben verificar las desigualdades de los puntos 2 y 3.
1.3. Ejemplo
M ax F (x, y)
s.a. g1 (x, y) ≤ c1
g2 (x, y) ≤ c2
g3 (x, y) ≤ c3
El lagrangiano es:
L(x, y, λ1 , λ2 , λ3 ) = F (x, y) − λ1 (g1 (x, y) − c1 ) − λ2 (g2 (x, y) − c2 ) − λ3 (g3 (x, y) − c3 )
y las CKT:
∂L
1. ∂x =0
∂L
∂y =0
2. g1 (x, y) ≤ c1
g2 (x, y) ≤ c2
g3 (x, y) ≤ c3
3. λ1 ≥ 0
λ2 ≥ 0
λ3 ≥ 0
3
4. Si g1 (x, y) < c1 entonces λ1 = 0
Si g2 (x, y) < c2 entonces λ2 = 0
Si g3 (x, y) < c3 entonces λ3 = 0
Como tenemos 3 restricciones tenemos 23 = 8 casos:
g1 g2 g3
1 = c1 = c2 = c3
2 > c1 = c2 = c3
3 = c1 > c2 = c3
4 > c1 > c2 = c3
5 = c1 = c2 > c3
6 > c1 = c2 > c3
7 = c1 > c2 > c3
8 > c1 > c2 > c3
2. Problemas con condiciones de nonegatividad

En muchos problemas de la teorı́a económica las variables de elección deben ser no negativas, planteándose
en este caso el problema:
M ax F (x) (3)
s.a. gj (x) ≤ cj con j = 1, . . . , m
xi ≥ 0 para i = 1, . . . , n
Este problema puede ser tratado como se fuera del tipo (1) ahora con n + m restricciones (y multiplicado-
res). Lo que sucede es que los multiplicadores de las restricciones de no negatividad no tienen mayor interés.
Es por esto que se adecuan las condiciones de Kuhn-Tucker para no trabajar con dichos multiplicadores.
2.1. Adecuación de las condiciones de Kuhn-Tucker

El lagrangiano original para el problema (3) es:
m
X n
X
L ≡ F (x) − λj (gj (x) − cj ) − µi (−xi ) (4)
j=1 i=1
pero vamos a escribir las condiciones de K-T en base al “Lagrangiano corto”:

m
X
L ≡ F (x) − λj (gj (x) − cj ) (5)
j=1
donde no usamos los multiplicadores µ.

Observemos que:
∂L ∂L
= + µi
∂xi ∂xi
Para el lagrangiano (4) las condiciones de K-T son:
∂L ∂L
1. ∂xi = ∂xi + µi = 0 para cada i = 1, . . . , n
4
xi ≥ 0 para i = 1, . . . , n
3. λj ≥ 0 para cada j = 1, . . . , m
µi ≥ 0 para cada i = 1, . . . , n
4. Si gj (x) < cj entonces λj = 0
Si xi > 0 entonces µi = 0
Observemos que de la primera condición podemos despejar:
∂L
µi = −
∂xi
y reemplazar en las otras:
1.
xi ≥ 0 para i = 1, . . . , n
3. λj ≥ 0 para cada j = 1, . . . , m
∂L
− ∂x i
≥ 0 para cada i = 1, . . . , n
∂L
Si xi > 0 entonces − ∂x i
=0
Donde observamos que no aparecen los multiplicadores µ y las condiciones están expresadas en términos
del Lagrangiano (5). Finalmente podemos ordenar, simplificar y renumerar las condiciones para obtener:
∂L
1. ∂xi ≤ 0 para cada i = 1, . . . , n
3. xi ≥ 0 para i = 1, . . . , n
4. λj ≥ 0 para cada j = 1, . . . , m
∂L
6. Si xi > 0 entonces ∂xi =0
Los casos y sistemas de ecuaciones se obtienen de las condiciones 5 y 6.
2.2. Ejemplo
M ax xy − x + y
s.a. x + y ≤ 9
x + 5y ≤ 25
x≥0
y≥0
Tenemos:
L ≡ xy − x + y − λ1 (x + y − 9) − λ2 (x + 5y − 25)
con las condiciones:
5
∂L
1. ∂x = y − 1 − λ1 − λ2 ≥ 0
∂L
∂y = x + 1 − λ1 − 5λ2 ≥ 0
2. x + y ≤ 9
x + 5y ≤ 25
3. x ≥ 0
y≥0
4. λ1 ≥ 0
λ2 ≥ 0
5. Si x + y < 9 entonces λ1 = 0
Si x + 5y < 25 entonces λ2 = 0
6. Si x > 0 entonces y − 1 − λ1 − λ2 = 0
Si y > 0 entonces x + 1 − λ1 − 5λ2
De las condiciones 5 y 6 tenemos 24 = 16 casos:
R1 R2 x y
a = = = =
b > = = =
c = > = =
d > > = =
e = = > =
f > = > =
g = > > =
h > > > =
i = = = >
j > = = >
k = > = >
l > > = >
m = = > >
n > = > >
p = > > >
q > > > >
3. Problemas con restricciones mixtas

Consideremos ahora el problema:
M ax F (x) (6)
s.a. gj (x) ≤ cj con j = 1, . . . , m
hk (x) = dk con k = 1, . . . , l
con x ∈ Rn . en el cual tenemos restricciones de desigualdad y de igualdad.
6
3.1. Adecuación de las CKT
Para poder aplicar las condiciones de Kuhn-Tucker podemos transformar el problema en:
M ax F (x) (7)
s.a. gj (x) ≤ cj con j = 1, . . . , m
hk (x) ≤ dk con k = 1, . . . , l
hk (x) ≥ dk con k = 1, . . . , l
Donde hemos usado:
hk (x) = ck ⇐⇒ dk ≤ hk (x) ≤ dk

hk (x) ≤ dk
⇐⇒
hk (x) ≥ dk
Para el problema ?? se forma el Lagrangiano:

m
X l
X l
X
L(x, λ, µ, ν) = F (x) − λj (gj (x) − cj ) − µk (hk (x) − dk ) + νk (hk (x) − dk ) (8)
j=1 k=1 k=1
y se obtienen las condiciones de Kuhn-Tucker:

∂L
1. = 0 para cada i = 1, . . . , n
∂xi
hk (x) ≤ dk para cada k = 1, . . . , l
hk (x) ≥ dk para cada k = 1, . . . , l
3. λj ≥ 0 para cada j = 1, . . . , m
µk ≥ 0 para cada k = 1, . . . , l
νk ≥ 0 para cada k = 1, . . . , l
Si hk (x) < dk entonces µk = 0
Si hk (x) > dk entonces νk = 0
Del punto 2 podemos recuperar hk (x) = ck para cada k = 1, . . . , l, lo cual nos permite no considerar las
dos últimas condiciones del punto 4 .
Por otro lado podemos transformar el lagrangiano de 8:
m
X l
X l
X
L(x, λ, µ, ν) = F (x) − λj (gj (x) − cj ) − µk (hk (x) − dk ) + νk (hk (x) − dk )
j=1 k=1 k=1
m
X l
X
= F (x) − λj (gj (x) − cj ) − (µk − νk )(hk (x) − dk )
j=1 k=1
m
X l
X
= F (x) − λj (gj (x) − cj ) − ηk (hk (x) − dk )
j=1 k=1
= L(x, λ, η)
7
Donde hemos definido un nuevo multiplicador:
ηk = µk − νk
y un nuevo Lagrangiano:
m
X l
X
L(x, λ, η) = F (x) − λj (gj (x) − cj ) − ηk (hk (x) − dk ) (9)
j=1 k=1
y es fácil ver la relación entre las derivadas de ambos Lagrangianos (ecuaciones (8) y(9):
∂ ∂
L(x, λ, µ, ν) = L(x, λ, η)
∂xi ∂xi
En términos de este Lagrangiano las condiciones establecidas serı́an:
∂L
1. = 0 para cada i = 1, . . . , n
∂xi
hk (x) = dk para cada k = 1, . . . , l
3. λj ≥ 0 para cada j = 1, . . . , m
Donde los multiplicadores ηk , al ser la diferencia de dos números no negativos, pueden tomar valores
negativos, positivos o nulos. Es decir que no están restringidos a ser no negativos, como lo están los multi-
plicadores asociados a las restricciones de desigualdad.
3.2. Ejemplo
M ax xy − x + y
s.a. x + y ≤ 9
x + 5y = 25
Tenemos:
L ≡ xy − x + y − λ1 (x + y − 9) − λ2 (x + 5y − 25)
con las condiciones:
∂L
1. ∂x = y − 1 − λ1 − λ2 = 0
∂L
∂y = x + 1 − λ1 − 5λ2 = 0
2. x + y ≤ 9
x + 5y = 25
3. λ1 ≥ 0
4. Si x + y < 9 entonces λ1 = 0
De la condición 4 tenemos 21 = 2 casos: x + y < 9 y x + y = 9.
8
4. Teorema de la Envolvente
Consideremos un problema de optimización con variables de elección x ∈ Rn y parámetros q ∈ Q ⊂ Rs :
M ax F (x, q) (10)
s.a. gj (x, q) ≤ 0 con j = 1, . . . , m
y supongamos que para todo juego de parámetros q ∈ Q el problema tiene solución y esta es única, ası́ po-
demos escribir: x(q), la solución de (10) para q. Lo que estamos haciendo es definir la función solución:
x : Q → Rn , que a cada juego de parámetros q le asigna la solución particular del problema3 .
También podemos definir la función valor óptimo: v : Q → R, que a cada juego de parámetros q le asigna
el valor máximo de la función: v(q) = F (x(q), q).
Estas dos funciones en la teorı́a económica pueden ser de interés, por ejemplo: si el problema de maxi-
mización corresponde al problema del consumidor, los parámetros q son los precios y el ingreso, la función
x(q) es la función demanda y la función v(q) es la utilidad indirecta.
Una primera pregunta es si estas funciones x( ) y v( ) son continuas o, aún más, diferenciables respecto
de los parámetros q, para lo que sigue asumiremos lo segundo.
El Teorema de la Envolvente para el caso en que se tiene solo restricciones de igualdad es conocido:
Teorema 5 (Envolvente) Para el problema
M ax F (x, q)
s.a. gj (x, q) = 0 con j = 1, . . . , m
sea v(q) = F (x(q), q) la función valor, la cual asumiremos diferenciable. Se cumple:

∂v(q) ∂L(x, q, λ)
=
∂qs q̄ ∂qs
(x(q̄),q̄,λ(q̄))
m
∂F (x, q) X ∂gj (x, q)
= − λj (q̄)
∂qs (x(q̄),q̄) j=1 ∂qs (x(q̄),q̄)
Para tener un resultado similar para el problema con restricciones de desigualdad se debe asegurar que el
conjunto de restricciones que se cumplen con igualdad en la solución x(q) :
B(q) = {j|gj (x(q), q) = 0}
es invariante en una vecindad de q̄.
3 Observemos que también los multiplicadores de Lagrange que acompañan a cada solución dependen de q: λ(q)

Breve Sobre KuhnTucker PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Breve Sobre KuhnTucker PDF

Cargado por

Copyright:

Formatos disponibles

Breve sobre Kuhn-Tucker

con x ∈ Rn . Se forma el Lagrangiano:

para obtener las:

Condiciones de Kuhn-Tucker (CKT)

4. Si gj (x) < cj entonces λj = 0 para cada j = 1, . . . , m1

1.1. Necesidad y suficiencia de las CKT

Ind.Lin El conjunto de vectores de Rn : {∇gj (x)|gj (x) = cj } es linealmente independiente

Lin Todas las restricciones gj son lineales.

Teorema 3 (Suficiencia 2) Si en el problema (1), (x∗ , λ∗ ) cumple las condiciones de Kuhn-Tucker y

Teorema 4 (Weierstrass) Si en (1), la función F es continua y las restricciones generan un conjunto no

1.2. Uso de las CKT

L(x, y, λ1 , λ2 , λ3 ) = F (x, y) − λ1 (g1 (x, y) − c1 ) − λ2 (g2 (x, y) − c2 ) − λ3 (g3 (x, y) − c3 )

2. Problemas con condiciones de nonegatividad

2.1. Adecuación de las condiciones de Kuhn-Tucker

pero vamos a escribir las condiciones de K-T en base al “Lagrangiano corto”:

donde no usamos los multiplicadores µ.

Los casos y sistemas de ecuaciones se obtienen de las condiciones 5 y 6.

De las condiciones 5 y 6 tenemos 24 = 16 casos:

3. Problemas con restricciones mixtas

con x ∈ Rn . en el cual tenemos restricciones de desigualdad y de igualdad.

Donde hemos usado:

Para el problema ?? se forma el Lagrangiano:

y se obtienen las condiciones de Kuhn-Tucker:

4. Si gj (x) < cj entonces λj = 0

Teorema 5 (Envolvente) Para el problema

sea v(q) = F (x(q), q) la función valor, la cual asumiremos diferenciable. Se cumple:

B(q) = {j|gj (x(q), q) = 0}

es invariante en una vecindad de q̄.

También podría gustarte