Está en la página 1de 31

Página 1

6
Restricciones de desigualdad y el teorema de
Kuhn y Tucker

Sobre la base del análisis del capítulo anterior, pasamos ahora a un estudio de opti
Problemas de mización definidos por restricciones de desigualdad . El conjunto de restricciones ahora será
se supone que tiene la forma

V = U n {x E] Rn Yo hi (X) ::: 0, i = 1 ,. . . , /},

donde U c IR n está abierto, y h i : IR n ➔ IR, i = 1 ,. . . , l. La pieza central de este


capítulo es el Teorema de Kuhn y Tucker, que describe las condiciones necesarias
para óptimos locales en tales problemas. Siguiendo la descripción del teorema-y
de su uso para localizar óptimos en problemas restringidos por desigualdad, mostramos que la
El teorema de Lagrange se puede combinar con el teorema de Kuhn y Tucker
Obtener las condiciones necesarias para óptimos locales en el caso general de optimización.
problemas definidos por restricciones mixtas , donde el conjunto de restricciones toma la forma

V = U n {x E] Rn I gj (X) = 0, j = 1 ,. . . k, hola (X) ::: 0, i = 1 ,. . . , /}.


6.1 El teorema de Kuhn y Tucker

El teorema de Kuhn y Tucker proporciona una caracterización elegante del ser


comportamiento de la función objetivo fy las funciones de restricción h i en los óptimos locales de
Problemas de optimización restringidos por la desigualdad. Las condiciones que describe pueden ser
vistos como las condiciones necesarias de primer orden para los óptimos locales en estos problemas.
El enunciado del teorema, y ​una discusión de algunos de sus componentes, es el
tema de esta sección.
6.1.1 Declaración del teorema

En el enunciado del teorema, como en otras partes de la secuela, decimos que una desigualdad
restricción h i (x) ::: 0 es efectiva en un punto x * si la restricción se cumple con igualdad en

145

Capítulo 6 Optimización restringida por desigualdad


Página 2
x *, es decir, tenemos hi (x *) = 0. También usaremos la expresión IEI para denotar la
146
cardinalidad de un conjunto finito E, es decir, el número de elementos del conjunto E.

ser funciones C 1 , i = 1 ,. . . , l. Suponga que x * es un máximo local desactivado activado


0, i f: l,. n. ➔
Teorema 6.1 (Teorema IR y hi:] R n ➔ IR
V = Ude
Kuhn
n {x E IRyn Tucker)
lh i (x) ::: Sea = IR . , l},
donde U es un conjunto abierto en IR n . Sea E C {1,. . . , l} denota el conjunto de restricciones efectivas
en x *, y sea h E = (hi) iEE · Suponga que p (Dh E (x *)) = IEI. Entonces, existe un vector

[KT-1} A [ 2: 0 y A [hi (x *) = 0 para i = ,.


1 . . , l.
A * = (A !,..., Ai) E IR 1 tal que se cumplan las siguientes condiciones:

[KT-2] Df (x *) + LA [Dhi (x *) = 0.

yo = l

Prueba Ver la Sección 6.5. 1 □

de fAunque
en V, x *hemos
habríaestablecido
un máximo el local
teorema
de -de Kuhn
f en y Tucker
V. Desde = -DJ,
D (-f)para los máximos
nos locales , el
El teorema se extiende fácilmente para cubrir los mínimos locales . Porque, si x * fuera un mínimo local

tener lo siguiente:
mínimo desactivado en V. Sea E el conjunto de restricciones efectivas en x *, sea hE = (hi) i E E,
yCorolario
suponga que
6.2pSuponga *)) =
(DhE (x que f yIEI.
V seEntonces, existeenAel* teorema
definen como E IR 1 tal6.1,
quey x * es un local

[KT-1 '] A [ 2: 0 y A [hi (x *) = 0 para todo i.

[KT-2 '] Df (x *) - LA [Dhi (x *) = 0.

yo = l

Demostración se deriva inmediatamente del teorema 6.1. □

Observación En la secuela, diremos que un par (x *, A *) cumple con el primer orden necesario
condiciones para un máximo (o que cumpla con las condiciones de primer orden de Kuhn-Tucker para
un máximo) en un problema de maximización restringido por desigualdad dado, si (x *, A *) sat
isfies h (x *) 2: 0 así como las condiciones [KT-1] y [KT-2] del Teorema 6. 1. De manera similar,

1 Con la (importante) excepción de la no negatividad del vector} .., las conclusiones del Teorema de
Kuhn y Tucker se pueden derivar del Teorema de Lagrange. De hecho, este constituye el punto de partida
de nuestra demostración del teorema de Kuhn y Tucker en la sección 6.5.
Página 3
6.1 El teorema de Kuhn-Tucker 147

diremos que (x *, A *) cumple las condiciones necesarias de primer orden para un mínimo
(o que cumple con las condiciones de primer orden de Kuhn-Tucker por un mínimo) si cumple
h (x *) 0 así como las condiciones [KT-1 '] y [KT-2'] del Corolario 6.2. D

Condición [KT-1] en el teorema 6.1 (que es la misma que la condición [KT-1 '] en
El corolario 6.2) se denomina condición de "holgura complementaria". El terminol
gía surge simplemente de la observación de que por la viabilidad de x *, debemos tener

hi (x *) 0 para cada i; por lo tanto, para queAr hi (x *) = 0 se mantenga junto a Ar 0,


debe tener Ar = 0 si hi (x *) > 0, y hi (x *) = 0 si Ar > 0. Es decir, si una desigualdad
es "flojo" (no estricto), el otro no puede ser.
Debe enfatizarse que el teorema de Kuhn y Tucker proporciona condiciones que
sólo son necesarios para óptimos locales, y además, sólo para óptimos locales que cumplen con los
calificación de restricción. No se pretende que estas condiciones sean suficientes para identificar
un punto como un óptimo local y, de hecho, es fácil construir ejemplos para mostrar
que las condiciones no pueden ser suficientes. Aquí hay uno particularmente simple:
g (x) = x, respectivamente. Considere el problema de maximizar f en el conjunto V =
Ejemplo 6.3 Sea /: IR ➔ IR yg: IR ➔ IR definidas por f (x) = x 3 y

{x E IR I g (x) 0}.
Sea x * = A * = 0. Entonces, x * está evidentemente en el conjunto factible, y el problema
la restricción simple es efectiva en x *. Además, g '(x) = 1 para todo x, por lo que la restricción
la calificación se mantiene en todo x y, en particular, en x *. Finalmente, tenga en cuenta que

J ' (x *) + A * g' (x *) = 0.
Así, si las condiciones del teorema de Kuhn y Tucker también fueran suficientes, x *
por
seríaloun
que, evidentemente,
máximo * no
local de fxen puede
V.Sin ser un fmáximo
embargo, local. creciente en x * = 0,
es estrictamente D

A pesar de este ejemplo, el teorema de Kuhn y Tucker resulta ser


bastante útil en la práctica para identificar óptimos de problemas restringidos por la desigualdad. Su
el uso en esta dirección se explora en las Secciones 6.2 y 6.3 a continuación.
En las subsecciones que siguen, elaboramos dos aspectos del teorema de
Kuhn y Tucker. La subsección 6.1.2 analiza la importancia de la condición de rango

que p (DhE (x *)) = IEI. La subsección 6.1.3 luego esboza una interpretación de la
vector A *, cuya existencia afirma el teorema.

6.1.2 La calificación de restricción


Al igual que con la condición análoga en el Teorema de Lagrange, la condición en el
Teorema de Kuhn y Tucker de que el rango de DhE (x *) es igual a IE! se llama

Capítulo 6 Optimización restringida por desigualdad


Página 4
la calificación de restricción. Esta condición juega un papel central en la prueba de la
148
teorema (consulte la Sección 6.5 a continuación). Además, si la calificación de restricción falla, la
el teorema mismo podría fallar. Aquí hay un ejemplo para ilustrar este punto:

Ejemplo 6.4 Sea f: lif. 2 ➔ lif. y h: vida. 2 ➔ lif. estar dado por f (x, y) = - (x 2 + y 2 )
y h (x, y) = (x - 1) 3 - y 2 , respectivamente. Considere el problema de maximizar f
En el set

D = {(x, y) E lif. 2 Yo h (x, y) 0}.


Se puede obtener una solución a este problema mediante inspección: la función f alcanza
un máximo en el punto donde (x 2 + y 2 ) alcanza un mínimo. Dado que la restricción
requiere (x - 1) 3 y 2 , y y 2 0 para todo y, el valor absoluto más pequeño de x en D
es x = 1, que ocurre cuando y = O; y, por supuesto, el valor absoluto más pequeño de
y en D es y = 0. De ello se deduce que f se maximiza en (x *, y *) = (1, 0). Tenga en cuenta que el
La restricción única del problema es efectiva en este punto.

En este máximo global de f en D, tenemos Dh (x *, y *) = (3 (x * - 1) 2 , 2y *) =


(0, 0), entonces p (Dh (x *, y *)) = 0 <1, y la calificación de restricción falla. Sobre el
otro lado, tenemos D f (x *, y *) = ( -2x *, -2y *) = (-2, 0), entonces no puede existir
) c 0 tal que Df (x *, y *) + ) cDh (x *, y *) = (0, 0). Por tanto, las conclusiones de
el teorema de Kuhn y Tucker también falla.

El vector) c * en el teorema de Kuhn y Tucker se llama vector de Kuhn


Multiplicadores de Tucker6.1.3 Los multiplicadores
correspondientes al máximodelocal
Kuhn-Tucker
x *. Al igual que con el Lagrangean
multiplicadores, los multiplicadores de Kuhn-Tucker también se pueden considerar como
sensibilidad de la función objetivo en x * a la relajación de las diversas restricciones.
De hecho, esta interpretación es particularmente intuitiva en el contexto de la desigualdad.
tensiones. A saber, si hi (x *)> 0, entonces la restricción i-ésima ya está floja, por lo que es relajante
Además, no ayudará a aumentar el valor de la función objetivo en la maximización.
ejercicio, y)., 1 debe ser cero. Por otro lado, si hi (x *) = 0, entonces relajar el
i-ésima restricción puede ayudar a aumentar el valor del ejercicio de maximización, por lo que tenemos
Ai 0,2
Para una demostración más formal de esta interpretación de A, imponemos algunos
simplificando los supuestos de una manera similar a las utilizadas en el Capítulo 5. Primero,
Asumirá a lo largo de esta discusión que las funciones de restricción hi se dan todas

2La razón por la que tenemos A; 2: 0 en este caso, y no la desigualdad estricta A; > 0, también es intuitivo: otro
la restricción, digamos la j-ésima, también puede haber sido vinculante en x *, y puede que no sea posible elevar el objetivo
funcionan sin relajar simultáneamente las restricciones i y j.
Página 5
6.1 El teorema de Kuhn-Tucker 149

en forma paramétrica como

Bajo este supuesto, podemos definir una relajación de la restricción i-ésima como una "pequeña"
aumento en el valor del parámetro C i .
Sea C c IR 1 un conjunto abierto de valores factibles para los parámetros (er,..., Cz).
Suponga que para cada c EC, hay un máximo global x * (c) de f en la restricción
colocar

V (c) = U norte {x E! R norte Yo h yo (X) + Ci 0, yo = 1 ,. . . , /}.


Suponga además que la calificación de restricción se cumple en cada c EC, por lo que existe
) .. * (c) 0 tal que

Df (x * (c)) + L, Af (c) Dhi (x * (c)) = 0.


yo = l

Finalmente, suponga que) .. * (·) yx * (,) son funciones C 1 de los parámetros c en el


establecer C.
Defina F: C ➔ JR por

F (c) = f (x * (c)).

La demostración estará completa si mostramos que oF (c) / oci = Ai, i = 1 ,. . . , /.


Elija cualquier c E C. Suponga que i es tal que h i (x * (c)) + Ci> 0. Elija cualquier Ci tal que
Ci <ci y

Considere el conjunto de restricciones 'D (Ci, ci) que resulta cuando el parámetro q en con
la cepa i se reemplaza por Ci. Dado que Ci <C i , debemos tener

V (C- i , ci) C 'D (c).


Dado que x * = x * (c) es un máximo local de f en el conjunto de restricciones más grande 'D (c), y
dado que x * (c) E 'D (c_i, ci) por elección de Ci, se deduce que x * (c) también es un máximo de
J en el conjunto de restricciones 'D (ci, ci). Por lo tanto,

F (c- i , Ci) = f (x * (c)) = F (c).


De ello se deduce inmediatamente que oF (c) / oc i = 0. Por otro lado, también es el caso
que h i (x * (c)) + C i > 0 implica por la holgura complementaria de Kuhn-Tucker
condiciones que ) .. 7 (c) = 0. Por lo tanto, hemos demostrado que si la restricción i está floja en
c, debemos tener
de
*
(c) =
-aq \ (c).

Capítulo 6 Optimización restringida por desigualdad


Página 6
150

Queda por demostrar que esta relación también se cumple si i es una restricción efectiva
en c, es decir, si la restricción i se cumple con igualdad. Esto se puede lograr adaptando el
argumento utilizado en la subsección 5.2.3 del Capítulo 5. Los detalles se dejan al lector.
6.2 Usando el teorema de Kuhn y Tucker
6.2.1 Procedimiento de un "libro de cocina"

El procedimiento del libro de cocina para usar el teorema de Kuhn y Tucker para resolver un
El problema de optimización restringido por desigualdad implica esencialmente los mismos pasos que
aquellos que usan el Teorema de Lagrange para resolver problemas restringidos por igualdad:
es decir, formamos una L "lagrangeana" , luego calculamos sus puntos críticos y, finalmente,
Evaluamos el objetivo en cada punto crítico y seleccionamos el punto en el que
el objetivo está optimizado.
imaSin
y mínimos
embargo,locales . Esto
existen requiere
algunas una diferencia
diferencias en los
importantes enpasos a seguirUno
los detalles. en de estos surge
del hecho de que las conclusiones del teorema de Kuhn-Tucker difieren para el máximo local

resolver problemas de maximización, desde los que se utilizarán para resolver problemas de minimización
problemas dediferencias
lemas. Estas maximización
sonde la formano obstante, para facilitar la exposición, posponemos
menores;
discusión del problema de minimización hasta el final de esta subsección, y concéntrese en

L: R n x ffi :. 1 ---Maximice
+ R, que fseguiremos
(x) sujeto allamando n {x I h (x) :::
x ED = Ulagrangeano, O}.
definido por:
Como primer paso en el procedimiento para resolver este problema, formamos una función
L (x, A) = f (x) + 2) -; h; (x).

yo = l

El segundo paso en el procedimiento es encontrar todas las soluciones (x, A ) para el siguiente conjunto
- (x, A) = 0, j = l,. . . , n,
de ecuaciones: a Xj
Alabama

Alabama Alabama
a A / X, A ) ::: 0, A i ::: 0, A i a A / X, A ) = 0, i = l,. . . , l .
Cualquier solución a este sistema de ecuaciones se denominará "punto crítico" de L. Es
Es importante notar que las ecuaciones que definen los puntos críticos de L difieren de
los correspondientes en problemas restringidos por la igualdad, en particular con respecto
M=
a las A -derivadas. Sea ) Iconjunto
{(x,MA el (x, A ) es de
untodos
puntolos
crítico
puntos de críticos
L yx EU}.de L para los cuales x E U:
Página 7
6.2 Uso del teorema de Kuhn-Tucker 151
{x I hay A tal que (x, A) EM}.
Como tercer y último paso, calculamos el valor de f en cada x en el conjunto

En la práctica, el valor de x que maximiza f sobre este conjunto suele ser también la solución
al problema de maximización original.
La razón por la que este procedimiento funciona bien en la práctica y las condiciones que pueden
causar su falla, se exploran en las siguientes subsecciones. Pero primero, algunas notas sobre
problemas de minimización restringidos por la desigualdad . Suponga que el problema original es
resolver

Minimice f (x) sujeto ax E 1J = U n {x I h (x) : ": 0}.


Se nos abren dos rutas. Primero, dado que x minimiza f sobre 1J si, y solo si, x
maximiza -f sobre JJ, simplemente podríamos reescribir el problema como una maximización
problema con la función objetivo dada por -f, y utilice el procedimiento mencionado anteriormente.
La ruta alternativa es modificar la definición de Lagrangean para

C (x, ).) = F (x) - I> ihi (x),


i == 1

y siga los mismos pasos restantes que se enumeran para el problema de maximización. Es decir,
en el segundo paso, encontramos el conjunto M de todos los puntos (x, A) que satisfacen x EU como
así como
ac - (x, A)
0, j = l,. . . , n,
dXj

C.A C.A
".1,1(X, A): ": 0, Ai:": 0, A; - (X, A) = 0, i = l,. . . , l.
U / \. 1
dA;

Por último, evaluamos f en cada punto x del conjunto {x I hay A tal que (x, A) EM}.
El valor de x que minimiza f sobre este conjunto suele ser también un mínimo global de
el problema original.
6.2.2 Por qué suele funcionar el procedimiento
Como antes con el Teorema de Lagrange, no es muy difícil ver por qué este método
suele tener éxito. Discutimos las razones en el contexto de la desigualdad limitada
problemas de maximización aquí. Con las modificaciones oportunas, los mismos argumentos
también es válido para problemas de minimización.
La clave, una vez más, está en una propiedad del Lagrangean L:

El conjunto de puntos críticos de L contiene el conjunto de todos los máximos locales de f en V en los que el
se cumple la calificación de restricción. Es decir, si x es un máximo local de f en V, y la restricción
la calificación se satisface en x, entonces debe existir A tal que (x, ;> ..) sea un punto crítico de L.

Capítulo 6 Optimización restringida por desigualdad


Página 8
152

Como antes, esto es una consecuencia inmediata de la definición de L y su crítica


puntos. Desde que tenemos (x,-.>i-) = hola (x)
-a>

oL
Alabama af
I
ahi

OXj OXj
- (x, > -.) = - (x) + I> i - (x),
i = l OXj

un par (x, > -.) puede ser un punto crítico de L si y solo si satisface lo siguiente
hola (x) 0, A, ·> 0 > -. ih; (x) = 0, i = 1 ,. . . , l.
condiciones:
I
Df (x)
I-
+ L' Ai Dh; (x) = 0.

yo = l

De manera equivalente, (x, > -.) Es un punto crítico de L si y solo si satisface el Kuhn-Tucker
condiciones de primer orden para un máximo, es decir, satisface h (x) 0 así como las condiciones
[KT-1] y [KT-2] del teorema 6.1.
Ahora, suponga que x * es un máximo local de f en TJ, y la calificación de restricción
se mantiene en x *. Dado que x * es factible, debe satisfacer h (x *) 0. Según el teorema de Kuhn
y Tucker, también debe existir A * tal que (x *, A *) satisfaga las condiciones [KT-1]
y [KT-2] del teorema 6.1. Esto dice precisamente que (x *,),. *) Debe ser un punto crítico
de L, estableciendo la propiedad reclamada.
Proposición 6.5 Suponga
Un caso especial quepropiedad
de esta se cumplen
es:las siguientes condiciones:

1. Existe un
Entonces, máximo
existe global
A * tal x **,),
que (x para_ *)elesproblema
un puntorestringido por desigualdad dado.
crítico de L.
2. La calificación de restricción se cumple en x *.

De ello se deduce que, bajo las condiciones de la Proposición 6.5, el procedimiento que tenemos
descrito anteriormente logrará identificar el máximo x *. Ya que ni la exis
La tencia de las soluciones ni la calificación de la restricción suele ser un problema en las aplicaciones,
La Proposición 6.5 también proporciona una explicación indirecta de por qué este procedimiento es bastante
exitoso en la práctica.

6.2.3 Cuándo podría fallar


Desafortunadamente, el fracaso de cualquiera de las condiciones de la Proposición 6.5 también podría conducir a
fracaso de este procedimiento en la identificación de óptimos globales. Esta subsección proporciona una
varios ejemplos para ilustrar este punto.

Página 9
6.2 Uso del teorema de Kuhn-Tucker 153
Primero, incluso si existe un óptimo, la calificación de restricción puede fallar en el
óptimo, y como consecuencia, el óptimo puede no aparecer como parte de una solución para
las ecuaciones que definen los puntos críticos de L.Es muy importante entender que
esto no implica que L no posea puntos críticos. En cada uno de los ejemplos 6.6
y 6. 7, existe un máximo global único para el problema indicado, y en cada caso
la calificación de restricción falla en el óptimo. En el ejemplo 6.6, esto da como resultado una
situación en la que L no tiene puntos críticos. Sin embargo, este no es el caso
en el ejemplo 6.7, donde L posee múltiples puntos críticos, aunque el problema
el máximo único no se encuentra entre estos.
J (x, y) = - (x 2 + y 2 ) y h (x, y) = (x - 1) 3 - y 2 , respectivamente. Hemos visto en
Ejemplo 6.6 Como en el ejemplo 6.4, sean J y h funciones C 2 en JR 2 definidas por

Ejemplo 6.4 que el máximo global único de Jon V se logra en (x, y) = (I, 0),
pero que la calificación de restricción falla en este punto; y que, como consecuencia, no
no es AE IR + tal que (1, 0, A) cumple con las conclusiones del Teorema de Kuhn y
Fatigar. Evidentemente, entonces, no hay valor de A para el cual el punto (1, 0, A) surge como

un punto crítico de L (x, y) = f (x, y) + Ah (x, y), y el procedimiento del libro de cocina falla
para identificar este óptimo global único.
De hecho, hay no hay soluciones a las ecuaciones que definen los puntos críticos de L
-2x + 3). (X - 1) 2 = 0
en este problema. Estas ecuaciones vienen dadas por:
-2y - 2) .y = 0

(x - 1) 3 - y 2 0, A 0, A ((x - 1) 3 - y 2 ) = 0.

Si y = f. 0, entonces la segunda ecuación implica A = -1, lo que viola la tercera ecuación.


= 0-la condición
yEntonces debemos de y = 0.complementaria
holgura
tener Si A también esimplica (x - 1) 3 =
cero, entonces x = 1, pero
de0,laoprimera ecuación, tenemos x = 0,
pero x = y = 0 viola (x - 1) 3 - y 2 0. Por otro lado, si A> 0, entonces-ya que

esto viola la primera ecuación. D


g (x) = (3 - x ) 3 , respectivamente. Considere el problema de maximizar f sobre el conjunto
Ejemplo 6.7 Let J y g ser funciones en JR definidas por f (x) = 2x 3 - 3x 2 y

V = {x yo g (x) O}.
Dado que (3 - x) 3 0 si y solo si 3 - x 0, el conjunto de restricciones es solo el
intervalo
g '(x *) = (-oo,
-3 (3 3].
- x Un
*) 2cálculo
= 0, porsimple
lo quemuestra que J no
la calificación de laesrestricción
positivo para i,
x ::Tes mostraremos
falla. y eso,
es estrictamente positivo y estrictamente creciente para x > i.Por lo tanto, el único global
el máximo de J en V ocurre en el punto x * = 3. En este punto, sin embargo, tenemos

como consecuencia, el procedimiento que hemos descrito no identificará x *.

Página 10
154 Capítulo 6 Optimización restringida por desigualdad

Forme el Lagrangeano L (x, ).) = F (x) + ) .g (x). Los puntos críticos de L son los
Soluciones a

6x 2 - 6x - 3). (3 - x) 2 = 0,

). 0, (3 - x) 3
0,). (3 - x) 3= 0.
Para que se mantenga la condición de holgura complementaria, debemos tener cualquiera de las dos). = 0 o
x = 3. Un cálculo simple muestra que si A = 0, hay precisamente dos soluciones para
estas ecuaciones, a saber (x, A) = (0, 0) y (x, ).) = (1, 0). Como hemos visto, ni
x = 0 norx = 1 es un máximo global del problema. Por otro lado, si x = 3, el
la primera ecuación no se puede satisfacer, ya que 6x 2 -6x - 3). (3 -x) 2 = 6x 2 - 6x = 36 f :. 0.
Entonces, el máximo global único x * no es parte de una solución a los puntos críticos de L.

Alternativamente, incluso si la calificación de restricción se mantiene en todas partes en el factible


establecido, el procedimiento puede todavía no identificar los óptimos globales, porque los óptimos globales pueden
simplemente no existe. En este caso, las ecuaciones que definen los puntos críticos de L pueden
no tengo soluciones; alternativamente, pueden existir soluciones a estas ecuaciones que
no son óptimos
Ejemplo 6.8 Letglobales,
f y g ser Co 1incluso locales.
funciones de JRConsidere los siguientes
definida por f (x) = x 2 ejemplos:

- x, y
g (x) = x, respectivamente. Considere el problema de maximizar f sobre el conjunto D =
{x I g (x) 0}. Tenga en cuenta que dado que g '(x) = 1 en todas partes, la calificación de restricción
se mantiene en todas partes en D.

Defina L (x, A) = f (x) + ) .g (x). Los puntos críticos de L son las soluciones (x, ).)
para

2x - 1 + A = 0,

x 0,). 0, h = 0.
Este sistema de ecuaciones admite dos soluciones: (x, A) = (0, l) y (x, A) = <½, 0).
Sin embargo, ningún punto es una solución al problema de maximización dado: por ejemplo,
en x = 2 (que es un punto factible), tenemos j (x) = 3, mientras que / (0) = 0 y

/ (½) = -¼- De hecho, el problema dado no tiene solución en absoluto, ya que el conjunto factible
D
Ejemplo
es todo de6.9
lRLet
+, yf fy (x) t oo
g son funciones
como xen oo.2 definido por j (x, y) = x + y y
t JR.
g (x, y) = xy - 1, respectivamente. Considere el problema de maximizar f sobre el

conjunto factible

D = {(x, y) E JR. 2 Yo g (x, y) 0}.

Página 11
6.2 Uso del teorema de Kuhn-Tucker 155

Este problema evidentemente no tiene solución: para cualquier número real x 1, el vector (x, x)
que, no 'D,
está en obstante, existe
y f (x, x) = 2x,una
quesolución únicae ailimitada
es creciente los puntos
en críticos del Lagrangean
x. Nosotros mostraremosen
este problema.
El Lagrangean L tiene la forma L (x, y, A) = x + y + A (xy - 1). El critico
los puntos de L son las soluciones (x, y, A) para

1 + ; __ y = 0
A 0, xy 1, A (l - xy) = 0.

Un simple cálculo muestra que el vector (x, y, A) = (-1, -1, 1) satisface todos estos
condiciones (y es, de hecho, la única solución a estas ecuaciones). Como hemos visto,
este punto no define una solución al problema dado. D

Estos ejemplos sugieren que se debe tener precaución al usar el libro de cocina.
técnica para resolver problemas de optimización con restricciones de desigualdad. Si uno puede verificar
existencia de óptimos globales y la calificación de restricción a priori, entonces el método
funciona bien para identificar los óptimos. Por otro lado, en situaciones donde las respuestas
a estas preguntas no están disponibles a priori, surgen problemas.
Primero, el Lagrangean L puede no tener puntos críticos para dos
razones. Por un lado, esto puede deberse a que el problema en sí no tiene
una solución (ejemplo 6.8). Por otro lado, esta situación puede surgir incluso cuando un
existe una solución, ya que la calificación de restricción puede violarse en el nivel óptimo
(testigo del ejemplo 6.6). Por tanto, la ausencia de puntos críticos de L no nos permite
sacar cualquier conclusión sobre la existencia o no existencia de soluciones a la situación dada
problema.
En segundo lugar, incluso si el Lagrangean L tiene uno o más puntos críticos, este conjunto de
los puntos no necesitan contener la solución. Una vez más, esto puede deberse a que no hay solución
existe para el problema (como en el ejemplo 6.9), o porque existe una solución, pero una
en el que se viola la calificación de restricción (véase el ejemplo 6.7). Por lo tanto, incluso el
La presencia de puntos críticos de L no nos permite sacar conclusiones sobre la
existencia de soluciones al problema dado.

6.2.4 Un ejemplo numérico


Sea g (x, y) = 1 - x 2 - y 2 . Considere el problema
D = {(x, dey)
y) yo g (x, maximizar
O}. f (x, y) = x 2 - y
sobre el set

Pagina 12
156 Capítulo 6 Optimización restringida por desigualdad

Primero argumentaremos que se satisfacen ambas condiciones de la Proposición 6.5, por lo que
el procedimiento del libro de cocina debe tener éxito en identificar el óptimo. Lo factible
el conjunto D en este problema es solo el disco de la unidad cerrada en JR. 2 , que evidentemente es
compacto. Dado que la función objetivo es continua en D, existe un máximo por
el teorema de Weierstrass, por lo que la primera de las dos condiciones de la proposición 6.5 es
2 + y 2 = 1),
xsatisfecho. Para ver quetener
debemos también
x = /:se- cumple
0 o y = la
/: -segunda
0. Dadocondición, y) = en
que Dg (x,tenga cuenta
(-2x, -2y) que en cualquier punto donde
la restricción única del problema es efectiva (es decir, en cualquier (x, y) donde tenemos
p (Dg (x, y)) = 1. Por lo tanto, la calificación de restricción se cumple si ocurre el óptimo
en todo (x, y), se sigue que en todos los puntos donde g es efectivo, debemos tener
g (x, y) > 0, entonces el conjunto de restricciones efectivas está vacío. Dado que la restricción

en un punto (x, y) donde g (x, y) = 0. Si el óptimo ocurre en un punto (x, y) donde

La calificación se refiere solo a las restricciones efectivas, en este caso se mantiene vacía
además. Por lo tanto, también se cumple la segunda de las dos condiciones de la Proposición 6.5.
..) = x 2 - y 0+ ) .. (1 - x 2 - y 2 ). El critico
Ahora configure el Lagrangean L (x,2xy, -) 2h
los puntos de L son las soluciones (x, y, ) ..) a

- 1 - 2) .. y = 0
) .. :::: 0, (1 - x 2 - y 2 ) :::: 0,) .. (1 - x 2 - y 2 ) = 0.
Para que se mantenga la primera ecuación, debemos tener x = 0 o) .. = 1. Si) .. = 1, entonces de

la segunda ecuación, debemos tener y =


tener x 2
-½,
mientras que de la tercera ecuación, debemos

valor de x:+ y 2 = l. Esto nos da dos puntos críticos de L, que difieren solo en el

Tenga en cuenta que en cualquiera de estos puntos críticos, tenemos f (x, y) = ¾ + ½ = ¾-


+ y deja
x 2 Esto 2 = 1, caso x = y0.=Si±también
el entonces que y = 1..es=inconsistente
1. Dado tenemos) 0, entonces lacon un valor
segunda positivo para) ..
ecuación
no se puede satisfacer, por lo que debemos tener) ..> 0. Esto implica a partir de la tercera ecuación que

de la segunda ecuación, el único (x,


punto crítico
y,) ..) (0, -1,) -
= posible en este caso es

En este punto crítico, tenemos f (0, - 1) = 1 <¾, lo que significa que este punto no puede ser un
solución al problema de maximización original. Dado que no hay otros puntos críticos,
y sabemos que cualquier máximo global de f en D debe surgir como parte de una

Página 13
6.3 Ilustraciones de economía 157

punto de L, se deduce que hay exactamente dos soluciones para la optimización dada
problema, a saber, los puntos (x, y) = (, J'3 / 4, -1/2) y (x, y) = (-, J'3 / 4, -1/2).
D
6.3 Ilustraciones de economía
En esta sección, presentamos dos ejemplos extraídos de la economía, que ilustran la
el uso del procedimiento descrito en el apartado anterior en la búsqueda de soluciones a la desigualdad
problemas de optimización restringidos. El primer ejemplo, presentado en la subsección 6.3.1,
considera un problema de maximización de la utilidad. El segundo ejemplo, presentado en la subsección
La sección 6.3.2 describe un problema de minimización de costos.
La presentación en esta sección tiene un doble propósito:

1. Explica el proceso de verificación de la condición de calificación de restricción en


la presencia de múltiples restricciones de desigualdad. A diferencia del caso de la igualdad
problemas limitados donde este proceso es relativamente sencillo, hay
La complicación adicional aquí es que la calificación de restricción depende de la
subconjunto preciso de restricciones que son efectivas en el punto óptimo desconocido .
Por tanto, la única forma, en general, de comprobar que la calificación de restricción
mantener en el punto óptimo es tomar todas las ubicaciones posibles del punto óptimo,
y demostrar que la condición se mantendrá en cada uno de estos lugares.
2. Detalla un método mediante el cual los puntos críticos de L pueden identificarse a partir de
ecuaciones que definen estos puntos. Este proceso es nuevamente más complicado que
la situación correspondiente en problemas de optimización con restricciones de igualdad, ya que
una parte de las ecuaciones (es decir, las condiciones de holgura complementarias) no son
especificado en forma de desigualdades.

En la práctica, estos ejemplos señalan un punto importante: que, siempre que este
es posible, es mejor resolver un problema de optimización restringido por desigualdad
reduciéndolo a uno restringido por la igualdad, ya que el cálculo de los puntos críticos de la
Lagrangean en la última clase de problemas es una tarea significativamente más fácil.
También son importantes algunos comentarios sobre los ejemplos mismos. Los dos exámenes
Los elementos presentados en esta sección comparten algunas características comunes. Más notablemente, en cada
mayúsculas y las formulaciones consideradas son tales que el problema no se puede reducir a una
Problema restringido por la igualdad. Sin embargo, también están diseñados para ilustrar diferentes
aspectos importantes de la resolución de problemas de optimización restringidos por desigualdad. Por ejemplo,
El conjunto de puntos críticos del Lagrangean en el primer ejemplo es muy sensible a
la3 "Todas
relación entre losposibles
las ubicaciones parámetros del problema,
del punto óptimo" mientras
no significa el que esta
conjunto factible dependencia
completo, esposible
ya que puede ser
utilizar la estructura del problema específico en cuestión para descartar ciertas partes del conjunto factible. Ver el
ejemplos que siguen en esta sección.
Página 14
158 Capítulo 6 Optimización restringida por desigualdad

mucho menos pronunciado en el segundo ejemplo. Por otro lado, cada punto crítico
en el primer ejemplo también identifica una solución del problema; en contraste, el segundo
El ejemplo siempre tiene al menos un punto crítico que no es una solución.

6.3.J Una ilustración de la teoría del consumidor


En esta subsección, consideramos el problema de maximizar la función de utilidad
u (x1, x2) = x1 + x2 en el conjunto presupuestario

donde I, PI y P2 son términos estrictamente positivos. Hay tres con desigualdad


tensiones que definen este problema:

h 1 (x1, x2) = x1 ::: 0

h2 (x1, x2) = x2 ::: 0

h3 (x1, x2) = yo - p1x1 - p2x2 ::: 0.

Como hemos visto en la subsección 5.5.3, las restricciones de no negatividad h 1 y h2 no pueden


ignorarse, por lo que este problema no se puede reducir a uno con restricciones de igualdad. Nosotros
mostrará que se puede resolver mediante el procedimiento descrito en la Sección 6.2.
Comenzamos mostrando que se cumplen ambas condiciones de la Proposición 6.5. El presupuesto
conjunto B (p, /) es evidentemente compacta, ya que los precios e ingresos son todos estrictamente positivo, y
la función de utilidad es continua en este conjunto. Una apelación al teorema de Weierstrass
arroja la existencia de un máximo en este problema, por lo que uno de los dos requisitos
de la Proposición 6.5 se cumple.
Para comprobar que también se cumple el otro requisito, primero identificamos todos los
combinaciones de restricciones que pueden, en principio, ser eficaz en el óptimo. Ya que
hay tres restricciones de desigualdad, hay un total de ocho combinaciones diferentes
a comprobar: a saber, 0, h 1, h2, h3, (h 1, h2), (h 1, h3), (h2, h3) y (h 1, h2, h3).
De estos, el último puede descartarse, ya que h 1 = h2 = 0 implica h3> 0. Además,
ya que la función de utilidad es estrictamente creciente en ambos argumentos, es obvio que
todos los ingresos disponibles deben usarse en el punto óptimo, por lo que debemos tener h3 = 0.
Por lo tanto, solo hay tres valores posibles para el conjunto h E de restricciones efectivas

en el óptimo, es decir, h E = (h 1, h3), h E = (h2, h3) y h E = h3. Nosotros mostraremos


que la calificación limitación se mantiene en cada uno de estos casos.
Si el óptimo ocurre en un punto donde solo la primera y tercera restricciones son
efectivo y h E = (h 1, h3), tenemos

1 O
DhE (X1, x2) = [ ]
-p1 -p2

Página 15
6.3 Ilustraciones de economía 159

en cualquier (x1, x2). Dado que Pl y p2 son estrictamente positivos por hipótesis, esta matriz tiene
rango, por lo que la calificación de restricción se mantendrá en ese punto. Un cálculo similar
muestra que si el óptimo ocurre en un punto donde solo la segunda y tercera restricciones
son efectivos, se cumplirá la calificación de restricción. Finalmente, si la tercera restricción
es el único efectivo en el óptimo y hE = h3, tenemos DhE (x1, x2) =
(- p 1, -pz), y una vez más la positividad de los precios implica que no hay
problemas aquí.
En resumen, el óptimo en este problema debe ocurrir en un punto donde h3 = 0, pero
sin importar en qué parte de este conjunto se encuentre el óptimo (es decir, sin importar qué otras restricciones
son efectivos en el óptimo), la calificación de restricción debe mantenerse. por lo tanto, el
La segunda condición de la Proposición 6.5 también se cumple, y los puntos críticos de la
Lagrangean debe contener los máximos globales del problema.
El Lagrangeano para este problema es:

Los puntos críticos de la lagrangiana son las soluciones (x1, x2, AJ, Az, A3) a la
siguiente sistema de ecuaciones:

1. l + A1 - A3p1 = 0.
2. 1 + A2 - A3p2 = 0.
3. AJ> 0, XJ 2 '.: 0, AJXJ = 0.
4. A2> 0, x2 2 '.: 0, A2x2 = 0.
5. A.3> 0, I - ¡PIX! - p2x2 2 '.: 0, A.3 (/ - ¡PIX! - p2x2) = 0.

Para resolver todos los puntos críticos de este sistema, adoptamos el siguiente procedimiento.
Fijamos un subconjunto C de {h 1, h2, h3} y examinamos si hay puntos críticos en los que
solo las restricciones en el conjunto C se mantienen con igualdad. Luego, variamos C sobre todos los posibles
subconjuntos de {h 1, h2, h3}, y así obtener todos los puntos críticos.
En general, este procedimiento sería algo largo, ya que hay 8 posibles
valores para C: a saber, 0, {hi}, {h2}, {h3}, {h1, h2}, {h1, h3}, {h2, h3} y {h1, h2, h3}.
Sin embargo, como ya hemos mencionado, el óptimo en este problema debe ocurrir en un
1 = h2
hpunto = 0h3implica
donde = 0, por
h3>lo0.
que eslosuficiente
Por encontrar
tanto, solo hay que el conjunto tres
considerar de puntos
casos:críticos
{h3}, de L en el que h3 = 0.
Además, como también se mencionó, el caso C = {h1, h2, h3} no tiene soluciones porque

Caso
{h2, h3} y {h1, h3}. Examinamos cada = {h3}
uno1:deCestos casos por turno.

Dado que solo se supone que la restricción 3 se cumple con igualdad en este caso, debemos tener
x1> 0 y x2> 0. Por las condiciones de holgura complementarias, esto implica que
también debe tener A 1 = A2 = 0. Sustituyendo esto en las dos primeras ecuaciones que definen
Página 16
160 Capítulo 6 Optimización restringida por desigualdad

los puntos críticos de L, obtenemos

> -. 3p1 = A3p2 = 1.

Estas condiciones solo tienen sentido si PI = pz. Por tanto, conservamos este caso como posible
solución solo si los parámetros satisfacen p1 = pz. De lo contrario, se descarta.
En el caso de que PI y pz sean iguales a un valor común p> 0, debemos evi
realmente tiene A3 = 1 / p. Ahora se ve fácilmente que, cuando PI = pz = p, hay
infinitos puntos críticos de L que satisfacen x1> 0 y x2> 0. De hecho, cualquier punto
(x1, x2, A 1, A2, A3) es un punto crítico siempre que

A] = A2 = 0, A3 = 1 / p, X] E (0, // p) y x2 = (/ - px1) / p.

Tenga en cuenta que en todos estos puntos críticos, tenemos u (x1, x2) = I / p.

Caso 2: C = {h2, h3}

Dado que h2 = h3 = 0 se traduce en x2 = 0 y / - p1x1 - p2x2 = 0, debemos tener


x1 = I / p> 0 en este caso. Por tanto, por la condición de holgura complementaria,
debemos tener> -. 1 = 0. Por supuesto, también debemos tener> -. 2 0. Sustituyendo estos en
las dos primeras ecuaciones que definen los puntos críticos de L, obtenemos

> -. 3p1 = 1 ::: 1 + > -. 2 = A3pz.


Por lo tanto, dicho punto crítico solo puede existir si PI. ::: pz. Asumiendo esta desigualdad
Para ser cierto, se ve que el único punto crítico de L en el que h2 = h3 = 0 es
(I P2
(x1, x2,> -. 1,> -. 2,> -. 3) = -, 0, 0, - - 1, -.
Pl Pi 1)
Pi
El valor de la función objetivo en este punto crítico viene dado por u (x1, x2) = I / PI.
Caso 3: C = {h1, h3}

Esto es similar al Caso 2. Es posible como punto crítico de L solo si PI pz. los
el punto crítico único de L en este caso viene dado por:
1
(x1, x2, A1, A2, A3) = 0,
( Yo
-, -PI- 1, 0, - )
P2 P2 P2
El valor de la función objetivo en este punto crítico viene dado por u (x1, x2) = I / pz.

Resumiendo, tenemos lo siguiente:

• Si PI> pz, hay exactamente un punto crítico de L (a saber, el que surge en el Caso 3),
cuyos valores x asociados son (x1, x2) = (0, I / pz).
• Si PI <pz, L tiene un solo punto crítico (a saber, el que surge en el Caso 2), y
esto tiene los valores x asociados (x1, x2) = (// PI, 0).

Página 17
6.3 Ilustraciones de economía 161
• Si Pl = p2 = p, L tiene infinitos puntos críticos (es decir, todos los puntos críticos
que surgen en cada uno de los tres casos). El conjunto de valores x que surge en este caso es

{(x1, x2) I x1 + x2 = 1 / p, x1 0, x2 O}.


Ya hemos demostrado que para cualquier Pl> 0 y P2> 0, los puntos críticos
de L debe contener la solución del problema. Dado que L tiene un punto crítico único
cuando Pl> P2, se deduce que este punto crítico también identifica el problema global
máximo para esta configuración de parámetros; es decir, la única solución al problema

cuando Pl> P2 es (x1, x2) = (0, I / p2). Del mismo modo, la única solución al problema
cuando Pl <P2 es (x1, x2) = (1 / Pl, 0). Finalmente, cuando Pl = p2 = p, hay
infinitos puntos críticos de L, pero en todos ellos tenemos u (x1, x2) = I / p.
Por tanto, cada uno de estos valores de (x1, x2) define un máximo global del problema
en este caso.

6.3.2 Una ilustración de la teoría del productor


El problema que consideramos en esta sección es el de minimizar w 1 x 1 + w2x2 sobre
el conjunto factible

V = {(x1, x2) E IR! I xf + x} y}.


El conjunto de restricciones de este problema se define a través de tres restricciones de desigualdad,
a saber

h 1 (x1, x2) = x1> 0


h2 (x1, x2) = x2> 0

h3 (x1, x2) = xf + x} - y 0.

Como de costumbre, asumiremos que todos los parámetros del problema, a saber, w 1, w2,
y y son estrictamente positivos.
Una vez más, comenzamos nuestro análisis con una demostración de que ambas condiciones de
La Proposición 6.5 está satisfecha. La existencia de soluciones puede demostrarse en muchos
formas, por ejemplo, compactando el conjunto de acciones factibles de la manera descrita
en el ejemplo 3.8. Se omiten los detalles.
Para comprobar que la calificación de restricción se mantendrá en el óptimo, primero identificamos
todas las combinaciones posibles de las restricciones que pueden, en principio, mantenerse con igualdad
en el óptimo. Dado que hay tres restricciones, hay que verificar ocho casos:
0, h 1, h2, h3, (h 1, h2), (h 1, h3), (h2, h3) y (h 1, h2, h3). De estos, el ultimo puede
ser descartado ya que h 1 = h2 = 0 implica xf + x} = 0, mientras que el conjunto de restricciones
requiere xf + x} y. También es evidente que, dado que w1 y w2 son estrictamente positivos,
debe tener h3 = 0 en el óptimo (es decir, la producción total x1 + x} debe ser exactamente igual
y), o los costos podrían reducirse reduciendo la producción. Esto significa que solo hay tres
Página 18
162 Capítulo 6 Optimización restringida por desigualdad

posibles descripciones del conjunto h E de restricciones efectivas en el óptimo: h E = h3,


h E = (h 1, h3) y h E = (h 2 , h3). Mostraremos que en cada caso, la restricción
la calificación debe mantenerse.
Primero, considere el caso hE = (h1, h3). Dado que h 1 y h3 son efectivas, tenemos
x, = 0 y Xf + x? = y, entonces x 2 = , Jy. Por lo tanto,

DhE (x, x 2 ) =[ 2 !, 22
=[
Dado que esta matriz tiene evidentemente el rango requerido,
] l
2se deduce que si el óptimo
ocurre en un punto donde h I y h3 son las únicas restricciones efectivas, la restricción
se cumplirá la calificación.
Un argumento idéntico, con los cambios obvios, muestra que la restricción cali
La ficación no es un problema si el óptimo ocurre en un punto donde h 2 y h3
son eficaces. Esto deja el caso hE = h3. En este caso, tenemos

Dado que asumimos que solo h3 se cumple con igualdad, debemos tener x,, x 2 > 0,
entonces p (DhE (x1, x2)) = IEI = 1 según sea necesario.
Resumiendo, el óptimo debe ocurrir en un punto donde h3 = 0, pero no importa
donde en este conjunto ocurre el óptimo, se cumplirá la calificación de restricción. Eso
se deduce que el conjunto de puntos críticos del Lagrangean debe contener la (s) solución (es)
del problema.
La Lagrangean L en este problema tiene la forma

L (x1, x 2 , AJ, A2, A3) = -w1x1 - w 2 x 2 + AJXJ + A 2 x 2 + A3 (xf + Xi - y).


Tenga en cuenta que hemos planteado implícitamente el problema como un problema de maximización, con
objetivo -w, x, -w 2 x 2 . Los puntos críticos de L son las soluciones (x`` x 2 , AJ, A2, A3)
al siguiente sistema de ecuaciones:
1.
-w1 + AJ + 2A3XJ = 0.
2. -w 2 + A2 + 2A3X2 = 0.
3. AJ> 0, x,> 0, AJXJ = 0.
4. 5.A2> 0, x 2 > 0, A 2 X 2 0.
A3> 0, x 2I+ x 2 2- y > - 0, A3 (Xf + Xi - y) = 0.
Como en la subsección 6.3 .1, fijamos un subconjunto C de {h 1, h 2, h 3} y encontramos el conjunto de todas las pos.
soluciones posibles para estas ecuaciones cuando solo las restricciones en C se mantienen con igualdad.
Como C varía sobre todos los subconjuntos posibles de {h 1, h 2 , h3}, obtenemos el conjunto de todos los valores críticos
puntos de L.

Página 19
Una vez más, este proceso se simplifica por el hecho de que no tenemos que considerar todos
6.3 Ilustraciones
posibles subconjuntos C. En primer lugar, comode hemos
economía 163óptimo,
mencionado, h 3 debe ser eficaz en un
por lo que es suficiente encontrar todos los puntos críticos de L en los que h3 = 0. En segundo lugar, el caso

h 3 :::: 0. Esto da como resultado tres valores posibles para C, a saber, C = {h3}, C = {h2, h 3 },
yC
C =={ {h h1, 1,h 2,h h3}.3}Consideramos
se descarta, yacada 1 =de
que huno 2 = 0 aviola
h estos su vez.
la tercera restricción que

Como debemos tener x 1 > 0 y x2> 0 en este caso, la holgura complementaria


Caso 1: C =estos
condiciones implican) q = A2 = 0. Sustituyendo {h3}valores en las dos primeras ecuaciones
que definen los puntos críticos de L, obtenemos

2A3X 1 = Wj
2A3x2 = w 2 .
Dividiendo la primera ecuación por la segunda, esto implica
XJ = (: :) X 2 -

Por hipótesis, también tenemos h 3 = 0 o x? + x? = y. Por lo tanto, tenemos


2 2
UNA. w? + wi
Xj = ( t? Y
W I +2)W1 2; , x2 = ( tiY
W 2) 1 ;
I+ W 2
, 3=( )l/2

Combinado con AJ = A2 = 0, esto representa el único punto crítico de L en


y
que h 1> 0, h 2 > 0 y h 3 = 0. Tenga en cuenta que el valor de la función objetivo
-w 1 x 1 - w 2 x 2 en este punto crítico es

-w 1 x 1 - w 2 x 2 = - (wf + Wi) 1 1 2 y 1 1 2 _

En este caso, tenemos x 1 > 0 (y, de hecho, x 1 = , Jy, ya que h 2 = h 3 = 0 implica


x 2 = 0 y Xf + x? - y = 0). Por lo tanto, 2: C = {h2,
Casotambién h3} tener A 1 = 0. Sustituyendo
debemos
x 1 = , Jy y AJ = 0 en la primera de las ecuaciones que definen los puntos críticos de
L, obtenemos

2A3XJ - Wj = 2A3, Jy - Wj = 0,
o A3 = W 1 /2, Jy. Finalmente, sustituyendo x 2 = 0 en la segunda ecuación que define
los puntos críticos de L, obtenemos A2 = w 2. Por tanto, el único punto crítico de L que
satisface h 2 = h 3 = 0 es

(x 1 , x2, A 1 , A2, A3) = (Jy, 0, 0, w 2 , wi / Jy).


El valor de la función objetivo (-w 1 x 1 - w 2 x 2 ) en este punto crítico es -w 1 y 1 1 2 .
Página 20
164 Capítulo 6 Optimización restringida por desigualdad

Caso 3: C = {h 1, h3}
Este es el mismo que el caso 2, con los cambios obvios. El único punto crítico de L
que cae en este caso es

y el valor de la función objetivo (-w1x1 - w2x2) en este punto crítico es


-w2y l / 2.

Resumiendo, L tiene tres puntos críticos, y los valores tomados por el objetivo
La función en estos tres puntos es - (wf + w) 1 12 y 1 12, -w I y I 12, y -w2y 1 12. Ahora,
ya hemos establecido que el conjunto de puntos críticos de L en este problema contiene
la (s) solución (es) al problema; y, por tanto, que los puntos que maximizan el valor
de la función objetivo entre el conjunto de puntos críticos debe ser la (s) solución (es) para
el problema. Todo lo que queda ahora es comparar el valor de la función objetivo
en los tres puntos críticos.
Como w1> 0 y w2> 0, siempre ocurre que (wf + w) 1 12> w1 y,
por lo tanto, que

Como consecuencia, podemos ignorar el primer valor de la función objetivo, y la


punto que representa. Comparando el valor de la función objetivo en el resto
dos puntos, se puede ver que

• Cuando w1 <w2, entonces el mayor de los dos valores es -w 1 y 1 12, que surge en
(x 1, x2) = (y I 12, 0). Por lo tanto, el problema tiene una solución única cuando w 1 <w2,
a saber (y 1 12, 0).
• Cuando w1 <w2, entonces el mayor de los dos valores es -w 1 y I 12, que surge en
(x 1, x2) = (0, y 112). Por lo tanto, el problema tiene una solución única cuando w 1> w2,
a saber (0, y 1 12).
• Cuando w1 y w2 tienen un valor común w> 0, entonces estos dos valores del
función objetivo coinciden. Por tanto, si w1 = w2, el problema tiene dos soluciones,
a saber (y 1 12, 0) y (0, y 1 12).
6.4 El caso general: restricciones mixtas

Un problema de optimización restringida con restricciones mixtas es un problema donde el


el conjunto de restricciones V tiene la forma

V = U norte {x ER norte Yo g (x) = 0, h (x) :::: 0},

Página 21
6.5 Prueba del teorema de Kuhn-Tucker 165

donde U c n está abierto, g: n ➔ k y h: n ➔ 1 . Para facilitar la notación, defina


'Pi: n ➔ k + l , donde
si yo E {k + 1 ,. . . , k + /}.
si yo E {1,. . . , k}

El siguiente teorema es una simple consecuencia de combinar el teorema de La


grange
Teorema con
6.10 Sean f: nde
el teorema ➔Kuhn
y 'Pi: yn ➔. i = 1 ,. . . , / + k son funciones C 1 .
Tucker:
Suponga que x * maximiza f en

donde U C n está abierto. Sea E C {1,. . . , k + l} denotan el conjunto de restricciones efectivas en


V = U norte {x E norte l <f! I (X) = 0, i = l,. . . , k, <{! j (X) 2 :: 0, j = k + l,. . . , k + l},
x *, y sea <pE = (<pJiEE • Suponga que p ((D <pE (x *)) = IEI. Entonces, existe) .., E l + k
tal que
I. Aj 2 :: 0 y Aj <f! J (x *) = 0 para j E {k + 1 ,. . . , k + /}.
2. D f (x *) + Z ::},! F Ai D <pi (x *) = 0.
6.5 Una prueba del teorema de Kuhn y Tucker

Sea x * un máximo local de f en el conjunto

V= u norte {x E yo h (x) 2 :: O},


norte

hE = (hi)
donde h =iEE · Debemos
(h 1,..., mostrar
ht) es una que Chay)
función 1 de..,n aE 1/, tal c n está abierta. Deje E
y Uque
ser el conjunto de restricciones efectivas en x *, y suponga que p (DhE (x *)) = IEI, donde

1. Ai 2 :: 0 y Aihi (x *) = 0, i = 1 ,. . . , /.
2. Df (x *) + Li = I AiDhi (x *) = 0.
Con la importante excepción de la no negatividad del vector A, el teorema de
Kuhn y Tucker pueden derivarse como consecuencia del Teorema de Lagrange. Para
simplifique la notación en la demostración, denotaremos / El por k; también asumiremos que el
hola (x *) = 0, i = l,. . . , k
las restricciones efectivas en x * son las primeras k restricciones:
hola (x *)> 0, i = k + l,. . . l.

Por supuesto, no hay pérdida de generalidad en esta suposición, ya que esto se puede lograr
simplemente renumerando las restricciones.

También podría gustarte