Notas de Clase - Metodos Cuantitativos

1
Curso de Métodos Cuantitativos

Banco Central de Reserva del Perú
Curso de Extensión 2012
Profesor: Ramón García-Cobián Jáuregui
Notas de clases basadas en el texto de E. Cerdá Tena, Optimización Dinámica.
1. Cálculo de Variaciones
Formulación del problema (PCV): Dados los momentos t0 < t1 en , la función de clase
C2, F: 3, y los estados a y b en ; se quiere hallar una función de clase C2, x() que
t1
∫ F ( x(t ), ẋ(t ), t )dt

maximice la t0 sujeta a: x(t0) = a y x(t1) = b.
Nótese que si el problema consistiera en minimizar, en vez de maximizar, no haría falta
una nueva teoría, pues la solución que minimiza la integral de F es la que maximiza la
integral de –F.
Ejemplo: Hallar la función real de variable real cuya gráfica tenga longitud mínima
entre las que pasan por dos puntos dados, (a, ) y (b, ), siendo a  b.
b
∫ √ 1+ ẋ(t )2 dt
Este problema se formula como: min a sujeto a: x (a) =   x (b) = .
Nociones preliminares:
En el conjunto  de las funciones reales de clase C2 definidas en [t0 , t1] se definen las
operaciones de adición y de multiplicación por escalares así:
1º) Si x   y , entonces x + y : [t0, t1] , se define por (x + y) (t):= x(t) + y(t). 2º) Si x
   , entonces  x : [t0, t1] , se define por ( x)(t):=  x(t).
Se comprueba fácilmente que , provisto de estas dos operaciones, es un espacio
vectorial real. Ahora bien, en dicho espacio vectorial se define una norma así:
x:= max {|x(t)|: t[t0, t1]}.
Ejemplos: Si t0 = 1 y t1 = 5, entonces para x(t) = t2, será x = max {t2 : t  [1, 5]} = 25; y
si y(t) = 1 + t – t2/4, se tendrá y = max {|1 + t – t2/4| : t  [1, 5]} = 2.
Dada una norma en un espacio vectorial, ella induce una métrica en él, i. e., una función
de distancia entre elementos del espacio, como se indica a continuación. Si x y y son
elementos de , entonces la distancia entre ellos será d (x, y):= x - y.
Así, para las funciones del ejemplo sería d(x, y) = max{|t2 – (1 + t – t2/4)|: t[1, 5]} =
25.
Teniendo ya una métrica el espacio vectorial, en él puede definirse la bola abierta de
centro x y de radio r como B(x, r):= {z : d(x, z) < r}.
En el contexto de optimización, se distingue entre máximo global y máximo local.
El primero es el que lleva a su máximo valor posible a la integral de la función objetivo;
el segundo es uno tal que en alguna bola abierta centrada en él, ningún otro elemento
lleva a la integral de la función objetivo a un valor mayor que el que alcanza con el
máximo local. Así, x* de  es un máximo global del PCV si y de ,
2
t1 t1
∫ F ( x∗(t ), ẋ∗(t ), t )dt ∫ F ( y (t ), ẏ (t ),t )dt

t0 t0
 si es que y(t0) = a = x*(t0)  y(t1) = b =
x*(t1).
Pero, una x de  es un máximo local del PCV si  r > 0 tal que  y de B(x, r), se tiene
t1 t1
∫ F ( x(t ), ẋ(t ), t )dt ∫ F ( y (t ), ẏ (t ),t )dt

t0 t0
que  si es que y(t0) = a = x(t0)  y(t1) = b =
x(t1).
Ecuación de Euler como condición necesaria de primer orden:

Teorema: Una función x de  es un máximo local del PCV sólo si satisface a la siguiente
d
F ẋ ( x(t ), ẋ(t ),t )
ecuación diferencial, llamada de Euler: 0 = F x ( x(t ), ẋ(t ),t ) - dt en
∂F ∂F dF
[t0, t1]. En esta ecuación Fx := ∂ x ,
F ẋ := ∂ ẋ y dt , derivada total de F, es
igual a F x ( x(t ), ẋ(t ),t ) ẋ+ F ẋ ( x(t ), ẋ(t ),t ) ẍ+Ft ( x , ẋ ,t ) .
Ejemplo:
b
∫ √ 1+ ẋ (t )2 dt
Para el PCV de la página anterior, min a sujeto a: x (a) =   x (b) = ,
b
∫−√ 1+ ẋ (t )2 dt
vemos que, ya que él equivale a: max a sujeto a: x (a) =   x (b) =  ,
− ẋ
2
F ẋ =
se tendrá : F( x(t ), ẋ(t ),t ) = −√ 1+ ẋ(t )
, por lo que Fx = 0 y √(1+ ẋ 2 ) .
2
Entonces, la ecuación de Euler es: 0 = ( 1+ ẋ(t ) )-3/2 ẍ , i. e., 0 = ẍ , ya que el otro
factor es distinto de 0. Las soluciones de esa ecuación diferencial son todas las que se
obtienen dando valores arbitrarios a los parámetros h y k en x(t) = h + kt. Entre ellas, las
condiciones extremas exigen que  = h + a k   = h + kb, de donde sólo queda que k = (
- )/(b - a)  h =  - a ( - )/(b - a). Luego, si el problema tuviera solución, ella habría de
ser la función x (t) =  - a ( - )/(b - a) + (( - )/(b - a)) t.
2
∫ (−12 tx− ẋ 2 )dt

Otro ejemplo: Se pide max 0 sujeto a: x(0) = 2  x(2) = 12.
d
(−2 ẋ)
La ecuación de Euler resulta ser: 0 = -12 t - dt = -12t + 2 ẍ , i. e., ẍ = 6t.
Entonces, integrando, se obtienen todas las extremales (así se llaman las soluciones de
la ecuación de Euler). Ellas son dadas por x(t) = t3 + ht + k. Las condiciones extremas
exigen que 2 = k  12 = 8 + 2h +k, de donde, h = 1  k = 2, por lo que la única candidata
a solución es la función x (t) = t3 + t +2.
Nota: Para problemas de minimización, la ecuación de Euler es la misma, como

fácilmente puede comprobar el estudiante diligente.
3
Casos especiales de la ecuación de Euler:

1º) En la función F no aparece x:
d
F ẋ F
Como Fx = 0, se obtiene que 0 = dt , lo que equivale a ẋ = h, siendo h una
constante arbitraria.
1
∫ (t 2− ẋ 2)dt
Ejemplo: max 0 sujeto a: x(0) = 1  x(1) = 2.
La ecuación de Euler es: -2 ẋ = h , de donde x(t) = -ht/2 + k, que con las condiciones
extremas da: 1 = x(0) = k  2 = x(1) = -h/2 + k. De esto resulta que h = -2  k = 1, por lo
que la única posible solución es x(t) = t + 1.
2º) En la función F no aparece ẋ :

F
Como ẋ = 0, se obtiene que 0 = Fx , que es una ecuación algebraica que no depende
de constantes arbitrarias, por lo que difícilmente se satisfarán las condiciones extremas.
Ejemplo:
1
∫ (−t +x 2)3 dt
Se pide min 0 sujeto a: x(0) =   x(1) = , con  y  dados.
La ecuación de Euler es: 0 = Fx = 3 (-t + x2) 2x, de donde t, x(t) = 0  x(t) =  √t .
Hay cuatro casos posibles:
(i)  = 0 =  ; entonces la única posible solución continua sería x(t) = 0 t ;
(ii)  = 0   = 1; entonces la única posible solución continua sería x(t) = t t ;
(iii)  = 0   = -1; entonces la única posible solución continua sería x(t) = - √t , t .
En cualquier otro caso, no habría solución al problema planteado.
3º) En la función F no aparece t:

d
F=F x ẋ +F ẋ ẍ
Como F no depende de t, dt , y, como según la ecuación de Euler,
d d d d
F ẋ F=( F ẋ ) ẋ+F ẋ ẍ ( F ẋ ẋ)
Fx = dt , se obtiene dt dt = dt , de lo cual se sigue que
F
ha de ser constante la expresión F - ẋ .
ẋ
1
∫ (2−3 x ẋ 2 )dt
Ejemplo: Se pide max 0 sujeto a: x(0) = 0  x(1) = 1.
2 2
Entonces, (2 – 3x ẋ ) - (-6x ẋ ) ẋ = h, de donde x ẋ =¿ ¿ H (cte.). Así, pues,
H
ẋ=
3
√ x , de donde ∫ √ xdx = ∫ √ H dt ; ahora, de esto se sigue que x3/2 =
( √ H t+K )
2 , que con las condiciones extremas dan: K = 0  H = 4/9. Por lo tanto, la
única posible solución sería la función x(t) = t2/3.
Condición de Legendre como condición necesaria de 2º orden para optimalidad:

4
Teorema: Una función x* de  es un máximo local del PCV sólo si F ẋ ẋ ( x∗(t ),t ) 0, t
de [t0, t1]. Además, una función x* de  es un mínimo local del PCV sólo si
F ẋ ẋ ( x∗(t ),t ) 0, t de [t0, t1].
1
∫ (x 2+ ẋ2+2 xe t )dt
Ejemplo: Dado el problema de opt 0 sujeto a: x(0) = 0  x(1) = 1/2 ,
t
la ecuación de Euler es 0 = (2x + 2et) – d(2 ẋ )/dt , que equivale a: ẍ−x=e , cuya
t t
e
solución general es x(t) = A e + B e + 2 t -t
. Las condiciones extremas dan como
e t
(e−t −e t )+ e t
única posible solución a la función x(t) = 2(1+e ) 2 . Como F ẋ ẋ = 2,
sólo se cumple la condición de Legendre necesaria para un mínimo local. Así, no hay
solución para el problema si se trata de maximizar, pero quizá sí la haya para el
problema de minimizar.
Condiciones de transversalidad
El PCV planteado es uno de momentos inicial y final dados así como de estados inicial
y final también dados. Además de éste, hay otros tipos de problemas, a saber:
a) problema de estado final libre pero estado inicial y momentos inicial y final dados;
b) problema de estado y momento finales libres pero estado y momento iniciales dados;
c) problema de momento final libre pero estado final y momento y estado iniciales
dados;
d) problema de estado y momentos iniciales parcialmente determinados por cierta
ecuación dada: 0 = g(t, x), con estado y momento iniciales dados.
En todos estos casos siguen vigentes las condiciones necesarias dadas por la ecuación
de Euler y la condición de Legendre, pero aparece una nueva condición necesaria, a
saber, la llamada condición de transversalidad que se abreviará por Ŧ.
Para enunciarla, se requiere definir el vector de ortogonalidad : v := (F - ẋ F ẋ , F ẋ ) .
Ahora bien, el enunciado general de la condición Ŧ es el siguiente.
En el punto terminal (t1*, x(t1*)) de una curva óptima, x*(), el vector de ortogonalidad,
v , ha de ser perpendicular (u ortogonal) a cualquier dirección admisible1 desde el
punto terminal.
Veamos qué se sigue de esto en cada uno de los casos antes mencionados.
Caso (a): Como la única dirección admisible es la vertical, el v ha de ser horizontal, por
lo cual su segundo componente ha de ser nulo, i. e., Ŧ es: 0 = F ẋ ( x∗(t 1 ), ẋ∗(t 1 ), t1 ) .
Caso (b): Como toda dirección desde el punto terminal (t1, x*(t1)) es dirección admisible
puesto que son libres el momento y el estado finales, entonces el v ha de ser el vector
nulo. i. e., Ŧ es:
0 = F ( x∗(t 1 ), ẋ∗(t1 ),t 1 ) - ẋ(t1 )F ẋ ( x∗(t 1 ), ẋ∗(t 1 ), t1 )  0 = F ẋ ( x∗(t 1 ), ẋ∗(t 1 ), t1 ) .
1
Se llama dirección admisible desde el punto terminal a cualquier recta tangente a una curva que parta
desde dicho punto terminal y satisfaga las condiciones finales dadas durante un lapso positivo.
∂g ∂g
, )
∂t ∂x
5
Ha de notarse que esto equivale a:

F ( x∗(t 1 ), ẋ∗(t1 ),t 1 ) = 0  0 = F ẋ ( x∗(t 1 ), ẋ∗(t 1 ), t1 ) .
Caso (c): como en este caso la única dirección admisible desde un punto terminal es la
horizontal, el v ha de ser vertical, por lo cual su primer componente habrá de anularse
en el punto terminal, i. e., Ŧ es: 0 = F ( x∗(t 1 ), ẋ∗(t1 ),t 1 ) -
ẋ(t1 )F ẋ ( x∗(t 1 ), ẋ∗(t1 ), t1 ) .
Caso (d): Como en este caso la única dirección admisible desde el punto terminal es la
de la recta tangente en dicho punto a la gráfica de la función 0 = g (t, x), se deduce que
el vector v habrá de ser paralelo al gradiente de la función g en el punto terminal, i. e.,
Ŧ es: grad g (t1 , x*(t1)) // (F - ẋ F ẋ , F ẋ ) en (t1 , x*(t1)) 2.
Ha de notarse que incluso en el PCV se cumple el enunciado general de la condición de
Ŧ, pues, no habiendo ninguna dirección admisible en el punto terminal, el vector de
ortogonalidad en dicho punto es absolutamente libre de tomar cualesquiera valores, ya
que no está obligado a ser perpendicular a ninguna dirección en particular.
Ejemplos
2
∫ (t ẋ+ ẋ 2 )dt
1) Se pide optimizar 0 sujeto a: x (0) = 0. Entonces, la ecuación de Euler
d
(t+2 ẋ )
es: 0 = dt , de donde se sigue que ha de ser constante la expresión
t+2 ẋ . Esta ecuación se resuelve fácilmente dando como solución general x (t) =
2
-t /4 + kt/2 + h. La condición inicial da por resultado que 0 = h. Así, sólo quedan
como posibles soluciones las funciones de la forma x (t) = -t2/4 + kt/2. Veamos lo
referente a la condición de Legendre: como
F ẋ ẋ (en t = 2) = 2  0, se ve que sólo
puede haber mínimos locales. Finalmente, la condición de Ŧ exige que 0 = ẋ (en
F
t = 2) = (t+2 ẋ ) |t = 2 = 2 + 2(-1 + k/2) = k, por lo que la única posible solución es
x*(t) = -t2/4.
1
∫ (x 2+ ẋ2 )dt
2) Se pide optimizar 0 sujeto a: x(0) = 0  x(1)  1.
d
2x− (2 ẋ )⇔0=x− ẍ
La ecuación de Euler es: 0 = dt , de donde se sigue que las
extremales del problema son dadas por x(t) = Aet + Be-t, que con la condición inicial
da 0 = A + B, por lo que las extremales se reducen a x(t) = A(et - e-t).
Además, ya que x(1)  1, ha de ser A(e - e-1) 1, de lo que se sigue que A > 0.
F
La condición de Legendre: ẋ ẋ = 2  0, de donde se sigue que sólo puede haber
mínimos locales.
Ahora, supongamos, momentáneamente, que x(1) > 1; entonces la condición de Ŧ
F
implicaría que 0 = ẋ |t = 1 = 2 ẋ(1) = 2 A (e - 1/e), que es imposible ya que A ha
de ser positivo como se estableció cinco líneas más arriba.
∂g ∂g
, )
2
Recuérdese que el gradiente de una función g (t, x) := ( ∂t ∂x
6
De todo esto concluimos que x(1) = 1, i. e., A = e /(e2-1), y que la única posible
e
2
(et −e−t )
solución es x* (t) = e −1 .
t1
∫ ( ẋ 2+10tx )dt
3) Se pide optimizar 0 sujeto a: x(0) = 1  t1 > 0.
d
10 t− (2 ẋ )=10 t−2 ẍ
La ecuación de Euler: 0 = dt por lo que las extremales son
5
ẋ=5 t 2 /2+h∧x (t )= t 3 +ht+ k
dadas por 6 . Con la condición inicial se obtiene
5 3
t +ht +1
que las extremales se reducen a x (t) = 6 .
F
La condición de Legendre: ẋ ẋ = 2  0, por lo que sólo puede haber mínimos
locales.
F
La condición de Ŧ: 0 = ( F− ẋ F ẋ ) |pto. term.  0 = ẋ |pto. term.. Así, se obtiene que
5 5 5
t 2 +h ¿ 0=( ẋ 2 +10 tx−2 ẋ 2 )=10 t 1 ( t 3 +ht 1 +1 )−( t 2 +h )2 .
2( 2 1 )=0 6 1 2 1
Finalmente, de estas dos últimas condiciones se obtiene que t1 = (3/5)1/3  h =
−5 3 2/3
( )
2 5 , por lo que la única posible solución es x (t) = (5/6) t3 – (5/2)(3/5)2/3t +
1, con t1 = (3/5)1/3.
t1
∫ (3 ẋ 2+x )dt
4) Se pide optimizar 0 sujeto a: x (0) = 0  x (t1) = 5.
d
(6 ẋ)
La ecuación de Euler: 0 = 1 - dt = 1 - 6 ẍ , por lo que las extremales son
2
1 t
ẋ= t +h∧x (t )= + ht + k
dadas por 6 12 . Ahora, con la condición inicial sale que
k = 0. La condición de Legendre:
F ẋ ẋ =6≥0 , por lo que sólo puede haber mínimo
t
12
+ ht 1
local. La condición terminal: 5 = x (t1) = 12 .
2
La condición de Ŧ: 0 = ( F− ẋ F ẋ ) |pto. term.= ( x−3 ẋ ) |.= 5 – 3 (t1/6 +
h)2. De estas dos últimas condiciones se obtiene que t1 = √ 60  h = 0, por lo que
la única posible solución es x (t) = t2/12.
5) Encontrar, si existe, la senda más corta desde el punto (0, 1) hasta la recta de
ecuación: x = 3t. El problema puede ponerse en la forma típica del cáculo de
t1
∫ √ 1+ ẋ 2 dt
variaciones: min 0 sujeto a: x (0) = 1  x (t1) – 3t1 = 0.
d ẋ ẋ
( )
La ecuación de Euler: 0 =
dt √1+ ẋ 2 , de donde resulta: √1+ ẋ 2 constante,
7
por lo que queda ẋ = h, es decir, x = h t + k, y con la condición inicial se obtiene

1
F ẋ ẋ =
k = 1. La condición de Legendre: (1+ ẋ 2 )3/2 > 0, por lo que sólo puede
haber mínimos locales. De la condición terminal se obtiene h t1 + 1 = 3 t1.
(i) La condición de Ŧ : v (pto. term.) // grad  (pto. term.), donde 
F− ẋ F ẋ 1
( ) ẋ(t1 )=−
(t , x) := - 3 t + x. Esto es: - 3 = F ẋ |pto. term. , i. e., h = 3
(ii) lo que con (i) da que t1 = 3/10.
Entonces, la única posible solución es la función x (t) = 1 – t /3 con t1 = 3/10.
Condiciones suficientes para óptimos del PCV

Han de considerarse algunas variantes del problema típico del Cálculo de Variaciones.
La diferencia entre ellas consiste en la condición final solamente. Así, los problemas
que han de ocuparnos ahora son:
t1
∫ F ( x , ẋ, t )dt
t0
PCV1: max sujeto a: x (t0) = a  x (t1) = b ;
t1
∫ F ( x , ẋ, t )dt
t0
PCV2: max sujeto a: x (t0) = a  x (t1)  b ;
t1
∫ F ( x , ẋ, t )dt
PCV3: max t0 sujeto a: x (t0) = a  x (t1) libre.
Para todos estos problemas vale la siguiente condición suficiente.
Teorema: Si en cualquiera de los PCVi , con i  {1, 2, 3}, la función F es cóncava en (
x, ẋ ) y x* () satisface la condición de Ŧ, la ecuación de Euler y las condiciones
extremas; entonces x*() es un máximo global.
Nota: Si en vez de maximizar se quisiera minimizar, entonces la concavidad en ( x, ẋ

) de la función F ha de sustituirse por la convexidad en ( x, ẋ ) para garantizar que se
tiene un mínimo global .
1
∫ (x 2+ ẋ2 )dt
Ejemplo: Se quiere min 0 sujeto a: x (0) = 1  x (1) libre.
La función F es convexa en ( x, ẋ ) pues su matriz hessiana correspondiente a esas
F xx F x ẋ 2 0
variables es positivo-definida, ya que
[ =
][ ]
F ẋ x F ẋ ẋ 0 2
, matriz todos cuyos
autovalores son positivos. Así, la posible solución hallada mediante la ecuación de
Euler, la condición de Ŧ y la condición inicial, a saber x*(t) = (1 + e2)-1 (et + e2-t), es un
mínimo global.
8
Extensiones del Cálculo de Variaciones:
1) Funcional objetivo más general:

t1
∫ F ( x , ẋ, t )dt
El problema ahora es el PCV: max ( t0 + S (x (t1))) sujeto a: x (t0) =
a, en donde son datos los momentos t0 y t1 así como las funciones F(, , ) y S() .
Teorema: Una función x() es un máximo local del problema PCV sólo si satisface la
d
F x − F ẋ F ẋ ẋ ≤0 , la condición
ecuación de Euler: 0 = dt , la condición de Legendre:
'
inicial y la nueva condición de Ŧ : 0 = ( F ẋ +S ( x(t )) )|pto. term..
Demostración:
t1
d '
∫ S' ( x ) ẋ dt=S( x (t 1))−S( x (a ))
S (x (t ))=S ( x(t )) ẋ (t )
Como dt , se tiene que t0
.
t1
∫ (F ( x , ẋ ,t )+ S' ( x ) ẋ )dt−S (a )
Entonces, la funcional objetivo es t0 . Y como maximizar
una función equivale (en términos de soluciones) a maximizar dicha función sumada
con una constante cualquiera, el problema puede formularse como el de
t1
∫ (F ( x , ẋ ,t )+S' ( x ) ẋ )dt
t0
max sujeto a: x (t0) = a.
d '
'' − ( F ẋ +S ( x ))
Para éste, la ecuación de Euler es: 0 = F x +S ( x ) ẋ dt =
d
F x − F ẋ
dt . La condición de
2
0≥ ∂ 2 ( F +S (x ) ẋ )= ∂ ( F ẋ +S ( x ))=F ẋ ẋ
' '
Legendre: ∂ ẋ ∂ ẋ .
0= ∂ ( F( x , ẋ ,t )+S (x ) ẋ)
'
'
La condicición de Ŧ : ∂ ẋ |pto. term.= ( F ẋ +S ( x ) )|pto. term..
Teorema: Si F es cóncava en ( x, ẋ ) y S() es cóncava, entonces cualquier función x
() que satisfaga la ecuación de Euler, la condición de Legendre, la condición de Ŧ y las
condiciones extremas es un máximo global.
Nota: Si se quisiera minimizar, en vez de concavidad en ( x, ẋ ) para la función F,

habría de exigirse convexidad en ( x, ẋ ); además, para la función S() también habría
que exigirse convexidad en lugar de concavidad.
1
∫ (x 2+ ẋ2 )dt+x (1 )2
Ejemplo: Se pide min ( 0 ) sujeto a: x (0) = 1.
9
La ecuación de Euler: x− ẍ = 0, de donde x (t) = A et+ Be-t.

De la condición inicial sale que 1 = A + B, por lo que x(t) = A et + (1 - A) e-t .
La condición de Legendre:
F ẋ ẋ =2≥0 , por lo que sólo puede haber mínimos locales.
La condición de Ŧ : 0 = (2 ẋ +2 x ) |pto. term. = 2 ( ẋ(1 )+x(1 ) ) = 2 Ae, de donde A = 0 
B = 1. Entonces, la única posible solución es x (t) = e-t.
Como la función S(s) = x2 es convexa y la F es ( x, ẋ )-convexa, se satisfacen las
condiciones suficientes para que la función x (t) = e-t sea un mínimo global.
2) Espacio de estados multidimensional:

Ahora la variable x es vectorial de dimensión n, i. e., que x n.
t1
∫ F ( x1 (t ), . .. , x n(t ), ẋ 1(t ), .. . , ẋ n (t ),t )dt

t0
El problema: max sujeto a: x (t0) = a  x1
(t1) = b1  … xk (t1) = bk con xk+1(t1), …, xn(t1) libres.
d
0=F x − F ∀ i≤n
Se tienen n ecuaciones de Euler: i dt ẋi .
0=F ẋ ( pto. term .)∀ i>k
Hay también n – k condiciones de Ŧ : i .
La condición de Legendre consiste en que sea negativo-semidefinida la matriz hessiana
F ẋ ẋ en ( x, ẋ ).
La condición suficiente es que F sea ( x, ẋ )-cóncava para todo momento t.
1
∫ ( ẋ 12+ ẋ 22+2 x1 )dt

Ejemplo: Se pide min 0 sujeto a: x (0) = (1, 0)  x (1) = (3/2, 1).
Las ecuaciones de Euler: 0 = 2 - 2 ẍ 1  0 = 0 - 2 ẍ 2 , de donde: x1(t) = t2/2 + At + B 
x2(t) = Ct + D.
De las condiciones extremas se sigue: A = 0  B = 1  C = 1  D = 0.
Así, la única candidata a mínimo local es la función vectorial (x1(t), x2(t)) = (t2/2 + 1, t).
2 0
La condición de Legendre: ẋ ẋ =
F [ ] 0 2
es positivo-definida, por lo cual sólo
puede haber mínimos locales.
Para ver si se cumplen las condiciones suficientes hay que examinar la convexidad de F
0 0 0 0
en ( x, ẋ ):
H x ẋ =
0
0
0
[ ] 0
0
0
0
2
0
0
0
2
que es positivo-semidefinida, y por ende, sí se
cumple la suficiencia pudiendo afirmarse que la función antes hallada sí es un mínimo
global.
3) Derivadas de orden superior en la funcional objetivo:

t1
∫ F ( x , ẋ , ẍ ,. .. , x( n) , t )dt
Ahora el problema es: max t0 sujeto a:
1 ( n−1)
(t 0 )=a ∧x (t 1 )=b∧ẋ (t 1 )=b1 ∧. ..∧x( n−1) (t 1 )=b n−1
n−1
x ( t0 )=a∧ ẋ (t 0 )=a ∧. ..∧x
10
d d2 dn
Fx− F ẋ + 2 F ẍ−. ..+(−1)n n F x( n )
La ecuación de Euler-Poisson es: 0 = dt dt dt .
∫ ẍ2 dt
Ejemplo: Se quiere min 0 sujeto a: x(0) = 0 = x(1)  ẋ (0)=a∧ ẋ (1)=b .
d d2 d2
F x − F ẋ + 2 F ẍ 2
(2 ẍ )
La ecuación de Euler-Poisson es: 0 = dt dt = 0 – 0 + dt = 2 x(4).
3 2
De esto se sigue que x(t) = h t /6 + k t /2 + l t + m.
Las condiciones extremas dan: m = 0  l = a  h = 6 (a + b)  k = -2 (b + 2a), luego x(t) =
(a + b) t3 – (b + 2a) t2 + at es la única posible solución. Además se verifica fácilmente
que se cumplen las condiciones de Legendre y la de concavidad.
Interpretación económica:
Se considera un modelo de gestión de reservas. En un momento dado, t0 , la empresa

posee una cantidad dada, x0 , de reservas de cierto producto. Por almacenamiento se
pagan S/. c diariamente por unidad del producto.
En cada momento t de un lapso dado, [t0 , t1], la tasa de venta es de q(t) unidades diarias
del producto. Esto genera un beneficio de S/. (q (t)) por día, siendo () una función
dada. Se quiere hallar la manera de ir vendiendo a fin de maximizar las ganancias en el
horizonte temporal dado. Esto es:
t1
∫ (Π ( q(t ))−cx (t ))dt

t0
max sujeto a:
ẋ=−q∧x (t 0 )=x 0∧x (t 1 )≥0 .
t1
∫ (Π (− ẋ (t ))−cx (t ))dt
Esto equivale a hallar una x* () que maximice t0
sujeto a:
x (t 0 )=x 0 ∧x (t 1 )≥0 .
Se asume que () es estrictamente cóncava y que después del momento t1 el producto es
nulo.
d d '
F x − F ẋ Π (q)
Entonces, la ecuación de Euler es: 0 = dt = -c + dt , i. e. , c =
d ' d '
Π (q) ( Π ∘q )(t ).
dt = dt Como c es constante, se sigue que ct + h = (q(t)).
Puesto que () < 0, ()-1, por lo cual ()-1(ct + h) = q(t) = - ẋ(t ) , de donde x (t) = k
t1
∫−(Π ' )−1 (ct +h )dt∧x 0 =x (t 0 )=k +0

t0
+ , de donde k = x0  x(t) = x0 -
t
∫ (Π ' )−1(ct +h )dt

t0
.
11
1 ' 1
∧ ( Π )−1 ( z)=
Si, por ejemplo, (q) = √q , entonces (q) = 2 √q 4 z 2 , luego
t t t
∫ (Π ) (ct +h )dt=∫ 4 (ct1+h )2 dt= 41c ct+h

1 0
t0
' −1
t0
[ ] t
con lo que
1 1 1 1 1 1
x (t )=x 0 + ( − )∧0=x(t 1 )=x 0 + ( − )
4 c ct+ h ct 0 +h 4 c ct 1 +h ct 0 +h de donde sale
''
el valor de h . Como F ẋ ẋ =Π (− ẋ) < 0, puede haber máximo local. F es ( x, ẋ )-
cóncava, así que sí hay máximo global.
El modelo de crecimiento de Ramsey

Siendo k el capital per cápita; c, el consumo per cápita; u(), la función de utilidad del
consumo, y [0, T] el horizonte temporal, se quiere hallar la senda temporal del capital
per cápita que maximice la utilidad acumulada durante el lapso de 0 a T, sujetándose a
la ley dinámica : f (k) = c + k̇ +  k, siendo los valores inicial y final de k : k0 y kT .
Se asume que las funciones u() y f () son estrictamente cóncavas y crecientes.
El problema puede ponerse en el marco del Cálculo de Variaciones expresando c en
T
∫ u( f (k )−δk− k̇ )dt
términos de k y k̇ como sigue: max 0 sujeto a: k(0) = k0 y k(0) =
kT .
d ' ' d ' d '
F k− F k̇ =u (c )(f (k )−δ)+ u (c ) u ( c)
La ecuación de Euler: 0 = dt dt , y como dt
−u' (c ) '
ċ= (f ( k )−δ)
= u() ċ , se obtiene: u' ' (c ) . Esta ecuación y la que se obtiene de
la ley dinámica: k̇=f ( k)−δk−c , forman un sistema de dos ecuaciones diferenciales
no lineales.
Se obtiene un equilibrio, (k*, c*), del sistema imponiendo las condiciones de nulidad de
las velocidades de cambio k̇ y ċ . Así, k* = (f)-1() y c* = f (k*) -  k*.
Puede comprobarse que, debido a las asunciones hechas, este equilibrio es uno del tipo
de ensilladura. En efecto, la matriz jacobiana del sistema evaluada en el equilibrio es:
f ' (k∗)−δ
[ ]
−1
'
u (c∗) ''
− '' f ( k∗) 0
J* = u ( c∗) . Ya que su traza es J*11 = 0 y su determinante J*21 < 0 ,
se deduce que los autovalores de J* son de signos opuestos, por lo que el equilibrio
correspondiente ha de ser una ensilladura.
Caso de horizonte temporal infinito

∞
∫ F( x, ẋ,t )dt
Considérese el problema de max 0 sujeto a la condición inicial x(0) = a y
tal vez a una condición final asintótica: b = limt x(t).
Como el integrando es una función dada, podría ser que la integral impropia no fuese
convergente. Por tal motivo, en muchas aplicaciones se agrega la condición de que
F( x , ẋ ,t )=G( x , ẋ ,t ) e-t, siendo G una función acotada y  un positivo dado, i. e., que
12
 M tal que ∀(x , ẋ,t), M>|G(x , ẋ,t )| . En tal caso, la integral impropia sí que
∞ ∞ ∞
− ρt M −ρt 0 M
|∫ G( x, ẋ ,t )e dt|≤∫|G( x, ẋ,t )|e dt≤M ∫ e−ρt dt=
−ρt
[ e ]∞ =
converge, pues 0 0 0 .
ρ ρ
Para este problema siguen vigentes la ecuación de Euler y la condición de Legendre,
pero ahora la condición de Ŧ toma una forma algo diferente. Así, caso de haber una
condición terminal asintótica b = limt x(t), la condición de Ŧ es (
F− ẋ F ẋ )| = 0; y
t=
para el caso en que no hay condición terminal, Ŧ es: (

F− ẋ F ẋ F
)|t =  = 0 = ẋ |t =  .
Ejemplo
En el modelo de crecimiento de Ramsey con horizonte temporal infinito:
∞
∫ u( c)e−ρt dt
max 0 sujeto a: f (k) = c + k̇ +  k  k(0) = k0  k() = k , la condición de
Ŧ es: 0 = limt(
F−k̇ F k̇ ) = lim e-t(u(c(t)) + k̇ (t) u(c(t))).
t
F
Si no se exigiera que k(∞)=k ∞ , se tendría, además, la condición: 0 = limt( k̇ ) =
limte-t(u(c(t)) (-1).
2.Control Óptimo
Formulación de Bolza
t1
∫ F ( x , u , t )dt +S ( x (t1 ))
t0
PCOB: max ( ) sujeto a:
ẋ=f ( x , u , t )∧x (t 0 )=a∧u (t )∈Ω t ∀ t .
En la función objetivo se halla una evaluación de la dinámica mediante la integral y
también hay otra evaluación del estado terminal, mediante la función S.
Los datos del problema son: los momentos inicial y final, t0 y t1 ; las funciones F, S y f ;
el estado inicial a y la colección de conjuntos de valores admisibles para la variable de
control, {t : t[t0 , t1]}. A la variable x, fácilmente reconocible por ser aquella cuya
derivada temporal aparece en la ley dinámica ẋ=f ( x , u , t ) , se la llama variable de
estado, así como a la u se la llama variable de control. Si no se especifica cuál es la
familia de los t , entenderemos que todos ellos son , es decir, que cualquier valor
numérico es admisible para la variable de control en cualquier momento.
Es de notarse que en este problema hay una jerarquización natural entre las variables de
estado y de control, siendo la principal esta última, pues para cada forma específica que
ella asuma, en condiciones bastante generales, hay sólo una forma funcional para la
variable de estado correspondiente, ya que, entonces, la ley dinámica se habría
convertido en una ecuación diferencial en la variable de control. Teniendo en cuenta que
los términos “causa” y “efecto” son de muy discutible precisión, parece preferible
13
interpretar a las variables de control y de estado como “estímulo” y “respuesta”,

respectivamente.
Formulación de Mayer
PCOM : max S (x (t1)) sujeto a ẋ=f ( x , u , t )∧x (t 0 )=a∧u (t )∈Ω t ∀ t .
Resulta evidente que es esta formulación un caso particular de la de Bolza y que
corresponde al caso en que en ésta se da la función nula en el papel de la F.
Que la de Bolza sea representable como la de Mayer es algo que se muestra a
continuación.
Defínanse las variables x1 y x2 así: x1 := x  ẋ 2 := F(x1, u, t) con x2(t0) = 0. Entonces, el
t1
∫ ẋ 2(t )dt= t1
problema puede formularse como: max t0

max [ x 2 (t ) ] t 0 = max x2 (t1) sujeto
ẋ 1=f ( x 1 ,u ,t )
a: ẋ 2=F ( x 1 ,u, t ) , donde S(x1, x2) := x2.
Formulación de Lagrange
t1
∫ F ( x, u, t )dt
PCOL : max t0 sujeto a: ẋ=f ( x , u , t )∧x (t0 )=a∧u (t )∈Ω t ∀ t .
Resulta evidente que es esta formulación un caso particular de la de Bolza
correspondiente al caso en que es nula la función S.
Que la de Bolza sea representable como la de Lagrange es algo que se muestra a
continuación.
t1 t1
∫ dtd S ( x(t ))dt=∫ S ' ( x ) ẋ dt

t0 t
Ya que S(x(t1)) - S(x(t0)) = 0 , se obtiene como funcional
t1
∫ (F ( x , f ( x , u , t ), t )dt+S ' ( x ) f ( x , u , t ))dt

objetivo: t0 , puesto que maximizar una función
cualquiera equivale, en términos de soluciones, a maximizar dicha función sumada de
una constante cualquiera.
Por lo tanto, las tres formulaciones son equivalentes entre sí.
Condiciones necesarias para que una u*(), con su respuesta x*(), den un máximo local
del problema PCOL
1) Ha de haber una función *(), llamada covariable de estado, tal que t, sea
λ̇∗(t )=−H x (x *,u *, t )∧λ∗(t 1 )=0∧ ẋ∗(t )=f (x *,u *, t )∧x∗(t 0 )=a , en
donde la función H, llamada hamiltoniana¸se define como H (x, u, , t) := F(x, u,
t) +  f(x, u, t).
Las ecuaciones diferenciales ẋ=f ( x , u , t ) y x λ̇∗(t )=−H (x *,u *, t )
se
conocen como las ecuaciones canónicas.
2) t  [t0 , t1], u*(t) ha de ser un máximo global de H(x*(t), , *(t), t). Ésta
condición se conoce como principio del máximo de Pontriaguin.
14
∫ (x+u)dt 2
Ejemplo: max 0 sujeto a: ẋ=1−u ∧x (0 )=1 .
Entonces la hamiltoniana es: x + u + ()(1 – u2) y las ecuaciones canónicas son:
2
ẋ=1−u ∧¿ ¿ λ̇=−H x =−1 . De esta última, con (1) = 0, se obtiene *(t) = 1 – t.
Como la función H es cóncava en u, el principio del máximo implica que
∂ H =1−2 λu 1
0= ∂u , por lo que u*(t) = 2(1−t ) .
1
ẋ=1−
Entonces, la ley dinámica es: 4 (1−t )2 con x(0) = 1, de donde sale:
1 1
x∗(t )=t−∫ dt=t− +k
4(1−t )2 4(1−t ) , que con x (0) = 1, da k = 5/4.
1 5
t− +
Así, x *(t) = 4 (1−t ) 4 . Si hay solución, ella estaría dada por u*() y x*() .
Condición general de transversalidad Ŧ

Definiendo el vector de ortogonalidad, v := (H, -), se tiene como condición necesaria
para óptimo local el que dicho vector evaluado en el punto terminal sea perpendicular u
ortogonal a toda dirección admisible3 en dicho punto terminal.
Para el problema planteado como PCOL , no hay sino una dirección admisible, a saber,
la vertical; luego, el v evaluado en el punto terminal debe ser horizontal, esto es, que su
segundo componente se anule: 0 =  (t1).
Ejemplos
5
∫ (ux−u2−x2 )dt
1) max 1 ẋ=x+ u∧x (1)=2 .
sujeto a:
Entonces, H = ux – u2 –x2 + ()(x + u) 
λ̇=−H x =−u+2 x−λ∧λ (5 )=0 .
Como H es u-cóncava, del principio del máximo se sigue: 0 = Hu = x – 2u -.
Por lo tanto, u = (½)(x + ).
Si esta expresión se lleva a las ecuaciones canónicas resulta: ẋ= 3x/2 + /2 
λ̇= 3x/2 - 3/2 con x(1) = 2  (5) = 0.
De la primera de las dos ecuaciones diferenciales se obtiene  = 2 ẋ−3 x.
(i) De esto se sigue que λ̇ = 2 ẍ −3 ẋ .
Reemplazando en la segunda sale: ẍ−3 x=0 , por lo que x(t) = A e3 t + B e-3 t
que con la condición inicial da: 2 = A e3 + B e-3.
Ahora, llevando la expresión de x(t) a la (i), sale:
 = 2 ẋ−3 x = 2A3 e3 t – 2B 3 e-3 t – 3A e3 t – 3B e-3 t y con la condición 0 =
(5) salen los valores de las constantes A y B.
∂g ∂g
, )
3 ∂t ∂x La definición de dirección admisible es la misma que la que se usó en Cálculo de
Variaciones.
15
Finalmente, la única candidata a ser control óptimo es:

u (t) = ½ (x(t) + (t)) = A (3 - 1) e3 t – B (3 + 1) e-3 t.
1
∫ xdt ẋ=u∧x (0 )=1∧u(t )∈ Ωt := [-1, 1].

2) Se pide min 0 sujeto a:
Entonces, H = -x + u 
λ̇=−H x =1 con  (1) = 0. Resulta: *(t) = t – 1.
El principio del máximo exige maximizar (- x(t) + *(t) u) sujeto a: u [-1, 1] y,
como ya se tiene que *(t) = t – 1  0, se sigue que u*(t) = -1,  t de [0, 1].
Finalmente, de la primera ecuación canónica con su condición inicial se sigue
que x*(t) = 1 – t , t de [0, 1].
1
∫ u2 dt+x(1)2
3) Se quiere min ( 0 ) sujeto a: ẋ=x+u∧x (o )=1 .
Se reconoce la función S (x) = x2, por lo que
d
S (x (t ))=S ' ( x(t )) ẋ (t )=2 x (t )(x (t )+u(t ))
dt .
1
∫ dtd S ( x (t ))dt=S( x(1))−S(x (0))=x(1 )2−1

Así, como 0 , se sigue que el
problema equivale, en lo que toca a soluciones, al de
1
∫ (u 2+2 x( x +u ))dt
min 0 sujeto a las mismas condiciones del original.
2 2
Entonces, H = u + 2x + 2xu + ()(x + u).
Las ecuaciones canónicas: ẋ=x+u∧¿ ¿
λ̇=−H x =−4 x−2 u−λ .
Como H es u-convexa, el principio del máximo (en verdad del mínimo) implica
que 0 = Hu = 2u + 2x +, de donde, u = -x -/2, lo que llevado a las ecuaciones
1
ẋ=− λ∧ λ̇=−2 x
canónicas da el sistema dinámico en x y : 2 .
(&) De aquí, por eliminación, sale: ẍ−x=0 , que, con la
t −t
condición inicial da: x (t )= Ae +Be ∧1= A+B .
Llevando esto a la primera ecuación de (&) sale:
t −t −1
λ(t )=−2 Ae +2 Be ∧0=λ(1 )=−2 Ae+2 Be .
2 -1 2 2
Entonces, A = (e + 1)  B = e /(e + 1), de lo que se sigue
e 2−t −et
x∗(t )=(e 2 +1 )−1 (e t + e )∧λ∗(t )=2 2
e +1 .
Finalmente, resulta que la única candidata a control óptimo es la función
−2e 2 −t
2
e
u*(t) = e +1 .
2
∫ (2 x−3 u−u2 )dt

4) Se pide max 0 ẋ=x+u∧x (0 )=5 ¿ ∀ t ,Ωt =
sujeto a:
2
[0, 2]. Entonces, H = 2 x −3u−u +( λ )( x+u )∧ λ̇=−H x =−2−λ∧λ (2)=0 .
2−t
De estas dos últimas sale: λ∗(t )=2(e −1) .
16
Como H es u-cóncava, parecería oportuno intentar la aplicación del principio de

Pontriaguin mediante 0 = Hu, lo que daría como único máximo global de H ,
vista sólo como función de la variable de control, que u = (½) ((t) - 3).
Sin embargo, la dificultad radica en que algunos de tales valores de u podrían no
caer en el intervalo [0, 2]. En efecto,
0  (½) ( - 3)  2 ssi 0  ( - 3)  4 ssi 3    7 ssi 2e2/9  et  2e2/5.
Esto equivale a: ½  1 := 2 – ln 4.5  t  2 –ln 2.5 =: 2  1.05.
Entonces, sólo para t  [1 ,2] puede usarse la igualdad 0 = Hu como expresión
del principio de Pontriaguin. Fuera de ese intervalo el valor de u*(t) tiene que
ser 0 ó 2. Esto se ilustra en la siguiente gráfica.
Para t  [0, 1], de la gráfica de ((t) - 3) u – u2 (que en esencia es la H vista

como función sólo de u), se sigue que u*(t) = 2.
Para t  [2 , 2], de la gráfica de ((t) - 3) u – u2 , se sigue que u*(t) = 0.
2, t ∈[ 0 ,τ 1 ]
En suma, u*(t) =
{
1
2
( λ∗(t )−3 ),
0,
t ∈[ τ 1 , τ 2 ]
si t ∈[ τ 2 ,2 ] .
Si se quisiera calcular la respuesta, x*(), a esta función de control, habría que
proceder en tres etapas.
1º) para t ∈[ 0 ,τ 1 ] , de ẋ−x=2∧x (0 )=5 , se sigue que x*(t) = 7et – 2;
τ1
2º) para t ∈[ τ 1 , τ 2 ] , de ẋ−x=( λ( t )−3 )/ 2=e −5 / 2∧ x ( τ 1 )=7 e −2 ,
2−t
se sigue: x*(t) = Bet – (e2-t )/2 + 5/2, en donde B sale de la condición “inicial” en
1; 3º), para
τ e 2 −τ 2 5
t ∈[ τ 2 , 2 ] , de ẋ−x=0∧x (τ 2 )=Be 2 − e +
2 2 , se sigue que
x*(t) = Cet en donde C sale de la condición “inicial” en 2.
Todo esto porque en general se quiere que la respuesta sea una función continua.
Interpretación económica
17
t1
∫ F ( x, u, t )dt
Para el PCOL de max t0 sujeto a: ẋ=f ( x , u , t )∧x (t 0 )=a∧u (t )∈Ω t ∀ t ,
se define la “función valor”, V*, como aquella que a cada estado y momento inicial
posibles, (z, t´), asigna el valor máximo que puede alcanzarse con el subproblema que se
inicia en t´ desde el estado z, esto es,
V*: ×[t0 , t1]  ,
t1
∫ F ( x , u , τ )dt '
(z, t´)  max t '
sujeto a ẋ=f ( x , u , τ )∧x(t )=z .
Así, V* (a, t0) dará el máximo valor alcanzable en el problema original.
∂ V∗( z,t )
Sea (t) := ∂z , i.e., la sensibilidad de la función valor respecto a cambios en
t del estado “inicial”; es lo que suele llamarse precio sombra del capital.
Sea que x (t) represente el acopio de capital de la empresa, siendo el inicial a en el
momento t0. Que sea u(t) la tasa de producción decidida y que sea F (x(t), u(t), t) la tasa
de beneficio instantánea medida en soles por día. El cambio temporal en el acopio del
capital, ẋ , depende del nivel de éste, x (t), de la decisión de la empresa, u(t), y del
momento actual, t : ẋ(t )=f (x(t ), u(t ),t ) .
A partir de un momento t del horizonte temporal en el que el nivel del capital es x(t) y la
decisión empresarial es u(t), considérese un breve lapso dt. Entonces, Hdt = Fdt +  f dt
= F dt +  ẋ dt = F dt +  dx. Aquí, F dt es la contribución directa en soles a la
función objetivo desde t hasta t + dt, si el estado en t era x(t) y la decisión fue u (t). Por
otra parte, dx es el valor en soles del incremento en el nivel de acopio de capital; es la
contribución indirecta a la función de valor. Luego, H dt es la contribución total a la
función de valor durante el lapso dt. Así, se ve que lo que ha de maximizarse en cada
momento t es H, y no sólo F, lo cual muestra cuán razonable resulta ser el principio del
máximo.
La condición
λ̇=−H x da: - d = Fx dt +  (fx dt), que dice que en la senda óptima ha
de igualarse la caída del precio sombra del capital y el ingreso marginal de invertir ese
capital, que es la suma de las contribuciones marginales directa e indirecta.
Condiciones suficientes de optimalidad

Para el problema PCOL se tiene el siguiente teorema debido a Mangasarian.
Teorema (de Mangasarian): Si F y f son funciones (x, u)-cóncavas y, caso que f(x, u, t)
no sea lineal en (x, u), la covariable de estado, *(), que sale junto a u*() y x*() de
las ecuaciones canónicas y del principio del máximo, es innegativa; entonces u*() es el
control óptimo.
Notas:
1)La premisa de este teorema puede formularse así:
(F y f son funciones (x, u)-cóncavas t)  (f (x, u, t) no es lineal en (x, u)  *(t)  0).
También puede adoptar la forma:
(F y f son funciones (x, u)-cóncavas)  (f (x, u, t) es lineal en (x, u)  *(t)  0).
18
2) Si se tratara de minimizar la funcional objetivo, entonces la (x,u)-concavidad de F y f

habría de reemplazarse por la correspondiente (x,u)-convexidad.
1
∫ (x+u)dt 2
Ejemplo: En max 0 sujeto a: ẋ=1−u ∧x (0 )=1 , se ve que F y f son (x,
u)-cóncavas y como f(x, u, t) no es (x, u)-lineal, debe tenerse que *() sea innegativa
para que se cumplan las condiciones suficientes de Mangasarian.
Como H = x + u + ()(1 – u2), la segunda ecuación canónica es
λ̇=−H =−1
x con
(1) = 0 y, por la condición de Ŧ: *(1) = 0, se sigue que *(t) = 1 – t, que en [0, 1] es 
1 1
=
0. Luego, el control óptimo es la u* (t) = 2 λ∗(t ) 2(1−t ) , que sale
del principio del máximo: 0 = Hu.
5
∫ (ux−u2−x2 )dt
Ejemplo: En max 1 sujeto a: ẋ=x+ u∧x (1)=2 , se ve que
0 0
f (x , u ,t )=x+u es (x, u)-cóncava, pues es lineal, por lo que su hessiana [ ]
0 0 es
negativo-semidefinida.
−2 1
La función F( x ,u ,t ) tiene hessiana en (x, u):
[ ]
1 −2 , que es negativo-
semidefinida, pues sus menores principales valen -2 y 3. Como f (x ,u ,t ) es ( x,u) -
lineal, no hay nada que exigir a la función *(). Luego, se cumplen las condiciones
suficientes de Mangasarian, por lo que el control u*() que salga con x*() y *() será
óptimo (Ver el ejem. 1 de la pag. 14).
1
∫ u2 dt+x(1)2
Ejemplo: En el problema de min ( 0 ) sujeto a: ẋ=x+ u∧x (0 )=1 , ya
se sabe que puede adoptarse la formulación de Lagrange, puesto que por ser S(x) = x2, se
d '
S (x (t ))=S ( x(t )) ẋ (t )=2 x (t )(x (t )+u(t ))
tiene que dt . Además, ya que
1
∫ dtd S( x(t ))dt

0 = S(x(1)) – S(x(0)) = x(1)2 – 1, y que la constante 1 en la funcional
objetivo, como sumando ó sustraendo no afecta a los óptimos del problema; resulta
1
∫ (u 2+2 x( x +u ))dt
equivalente pedir: max 0 sujeto a: ẋ=x+ u∧x (0 )=1 . Ahora
4 2
resulta que F es (x, u)-convexa, pues su hessiana
[ ]
2 2
tiene menores principales 4
y 4; además, f , por ser lineal en (x, u), es convexa. Igual que antes, la condición: “si f
no es lineal en (x, u), entonces *()  0” se cumple trivialmente ya que f sí es lineal.
19
Valen, pues, las condiciones suficientes de Mangasarian, por lo que la función u*(t) =
2
−2e −t
e
e 2 +1 , del ejemplo 3 de la página 14, es óptimo.
Hay otra condición suficiente para máximo global en el PCOL debida a Arrow.
Teorema (de Arrow): Para el problema de PCOL defínase la función hamiltoniana

derivada, H0, mediante: H0 : ××[t0 , t1] ,
(x, , t) max H ( x,u , λ , t ) para u  t .
0
Entonces, si H ( x , λ *,t ) es x- cóncava, se sigue que la u*() que sale de las
ecuaciones canónicas y del principio del máximo es el control óptimo.
Nota: En un problema de minimización, ha de reemplazarse la x- concavidad de

H0(x, , t) por la x- convexidad para tener una condición suficiente.
1
∫ (x+u)dt 2
Ejemplo: Se pide max 0 sujeto a: ẋ=1−u ∧x (0 )=1 .
1
Resulta que H (x, , t) = x +  + 4 λ , que es x- cóncava (pues es x- lineal), por lo que
0
1
se cumplen las condiciones suficientes de Arrow, y así, el control u* (t) = 2(1−t ) ya
hallado en la página 18, es óptimo.
Extensiones del control Óptimo

Pueden darse diversos tipos de condiciones terminales como las siguientes.
a) Momento y estado finales dados: t1 y b = x(t1) son datos. La única modificación

con respecto al caso ya considerado consiste en que no hay que usar la condición
de Ŧ sino que ahora entra en cambio la condición terminal: b = x(t1). Esto vale
también para la minimización.
1
∫−u 2 dt
Ejemplo: Se pide max 0 sujeto a: ẋ=x+u∧x (0 )=1∧x (1)=0 .
2
Entonces, la hamiltoniana es H = −u +( λ )(x +u ) y la segunda ecuación
canónica es:
λ̇=−H =−λ
x , de donde λ(t )=Ae .
−t
El principio del máximo: 0 = Hu , pues H es u- cóncava y t = , t.

A −t
e
Luego, 0 = -2 u + , de donde u = 2 .
A
ẋ−x= e−t
La primera ecuación canónica es ahora: 2 , cuya solución general
A
x (t )=Be t − e−t
es: 4 .
A
Las condiciones extremas dan: 1 = x (0) = B – A/4  0 = x(1) = Be - 4e .
20
4 e2 1
2
∧B=
De aquí se deduce que A = 1−e 1−e 2 .
et −e2−t 4 e2−t 2 e 2−t
∧ λ∗(t )= ∧u∗( t )=
Luego, x*(t) = 1−e 2 1−e 2 1−e 2 .
Se ve fácilmente que se cumplen las condiciones de suficiencia de Mangasarian,
por lo que u*() es el control óptimo (¡a pesar de que *(t) < 0, t !).
b) Momento final dado y estado final inferiormente acotado: x (t1)  b.

Lo mismo que en el caso (a), la antigua condición de Ŧ se sustituye por esta
nueva: 0 = λ(t 1 )(x(t 1 )−b) .
1
∫−u 2 dt
Ejemplo: Se pide max 0 sujeto a: ẋ=x+u∧x (0 )=1∧x (1)≥3 .
−t −t
Igual que líneas arriba, se obtiene λ(t )=Ae ∧u(t )= λ(t )/2= Ae /2 ¿
A
x(t )=Be t − e−t
4 .
La condición de Ŧ : 0 = (1) (x(1) - 3) = (A/e) (Be – A/4e -3).
Si A = 0, entonces de la condición inicial para x se sigue que B = 1, con lo que
Be – 3 < 0 que contradiría la restricción x(1)≥3 .
Por lo tanto, A tiene que ser diferente de 0, por lo que Be – A /4e = 3, que con
1 = B – A/4, da A = 4e (3 - e)/(e2 - 1)  B = (3 e - 1)/(e2 - 1).
c) Momento y estado finales libres.

En este caso la condición de Ŧ es: *(t1) = 0 = H(x*(t1), u*(t1), *(t1), t1).
t1
∫ (u−tx−u2 )dt
Ejemplo: Se quiere max 0 sujeto a: ẋ=2 u+1∧x (0 )=0 .
Entonces, la hamiltoniana es H = -u2 + u – tx + () (2u + 1) y la segunda
2
ecuación canónica: λ̇=t , da λ(t )=t /2+ h .
De la primera parte de la condición de Ŧ se tiene que 0 = t12/2 + h, de donde
h = -t12/2.
2
λ( t )=t / 2−t2 /2
Entonces, 1 .
Como H es u-cóncava, el principio del máximo lleva a 0 = Hu = -2u + 1 + 2, de
donde, u(t) = (t) + ½ = t2/2 – t12/2 + ½.
2
ẋ=t −t 2 +2
La primera ecuación canónica es: 1 , de donde x(t) = t3/3 + (2 –
t12) t pues 0 = x (0).
Además, la segunda parte de la condición de Ŧ es: 0 = H ( x(t 1 ),u(t 1 ),λ (t1 ),t 1 ) ,
x ( t 1 )=t 3 /3+( 2−t 2 ) t 1 ∧λ ( t 1 )=0∧u( t 1 )=1/ 2
de donde, como 1 1 , se obtiene
que 0 = (2/3) t14
- 2 t1 2 + ¼. Esto da dos posibles valores para el
momento final, a saber, t1  0.36 ó t1 1.69.
Así, quedan dos posibles controles óptimos:
u*(t) = 0.43 + t2/2 y u*(t) = -0.93 + t2/2.
En el primer caso se trata de una función u* definida en el intervalo [0, 0.36], y,
en el segundo caso, de una función definida en [0, 1.69].
21
d) Momento final libre y estado final dado: x (t1) = b.

En este caso la condición de Ŧ es: 0 = H ( x(t 1 ),u(t 1 ),λ (t1 ),t 1 ) , estando el valor
de t1 por determinarse.
t1
∫ (t 2+u 2 )dt ẋ=u∧x (0 )=4∧x(t 1 )=5 , con

Ejemplo: Se pide min 0 sujeto a
t1 por determinarse.
2 2
La hamiltoniana es: H=t +u +( λ )(u ) .
La segunda ecuación canónica es:
λ̇=−H x =0 , de donde (t) = A.
Como H es estrictamente convexa en u, el principio del máximo implica que
0 = Hu = 2u + , de donde u(t) = -A/2.
De la primera ecuación canónica ẋ=u = -A/2 con su condición inicial se
obtiene que x (t) = -At/2 + 4.
La condición de Ŧ: 0 = H ( x(t 1 ),u(t 1 ),λ (t1 ),t 1 ) = t12 + (-A/2)2 + (A) (-A/2),
luego, t12= A2/4.
La condición terminal es: 5 = x (t1) = -At1/2 + 4.
De estas dos últimas ecuaciones salen t1 = 1  A = -2. Por lo tanto, la única
candidata que queda a ser control óptimo es u*(t) = 1 en el intervalo [0, 1].
Hamiltoniana de “valor presente”ó de “valor corriente”

T
∫ G( x ,u,t )e−δ t dt
Para el problema de max 0 sujeto a: ẋ=f ( x , u , t )∧x(0)=a
- t
, se tiene que H = Ge + f.
Defínase la variable :=e t.
Entonces resulta ser H = G e- t +  e- tf = e- t(G + f) =: e- t , donde se define
 := G + f. Esta función  se llama hamiltoniana de valor corriente.
Las ecuaciones canónicas pueden expresarse en términos de esta nueva

hamiltoniana como sigue. La primera:
ẋ=f =H λ=  ; y la segunda, μ̇ =

-x + , pues e- t ( μ̇ - ) = μ̇ e- t -  e- t = λ̇ = -Hx = - e- t x.
Principio del máximo: t, u*(t) ha de ser máximo global de H (x*(t), , *(t), t).
Pero H (x*(t), u, *(t), t)  H (x*(t), u, *(t), t) ssi  (x*(t), u, *(t), t)  
(x*(t), u, *(t), t), de donde se sigue que el principio del máximo en términos
de la hamiltoniana de valor corriente es así:
t, u*(t) ha de ser máximo global de  (x*(t), , *(t), t).
En suma, las condiciones necesarias para ser control óptimo, en términos de la

hamiltoniana de valor corriente son: ẋ=   μ̇ = -x +   el principio del
máximo como se lo enuncia en el párrafo anterior.
22
∫ e−δ t (u2+( x−1)2 )dt

Ejemplo: Se quiere min 0 , con  positivo, sujeto a:
ẋ=2 x−3 u∧x (0 )=5 .
Entonces,  = u2 + (x - 1)2 + () (2x – 3u).
La segunda ecuación canónica es: μ̇ = -x +  = - (2 (x - 1) + 2 ) + .
El principio del máximo, dada la convexidad estricta de  respecto a u es:
0 = u = 2u - 3, de donde, u = 3/2.
Entonces, reemplazando u por 3/2 en la primera canónica se obtiene un sistema
9
ẋ=2 x− μ
2
dinámico lineal en x y : μ̇=−(2−δ ) μ−2 x +2
Si de la primera se despeja  y luego se la deriva respecto a t para reemplazar en
la segunda, se obtiene una ecuación diferencial de segundo orden en x cuya
solución permitirá luego hallar  y u. Esta última será el control óptimo pues se
cumplen las condiciones de suficiencia de Mangasarian.
Caso de horizonte temporal infinito

∞
∫ e−δ t F( x ,u,t )dt
Se considera el problema con una integral t0 . La condición
terminal puede variar, y para cada una de diversas posibilidades se da la
condición de Ŧ.
a) Si se impone la condición b = limt x(t), entonces la condición de Ŧ es:
0 = limt [H]t.
b) Si el estado final es libre, entonces la condición de Ŧ es: 0 = limt [H]t 
0 = limt (t).
c) Si la condición terminal es que b  limt x(t), entonces la condición de Ŧ es:
0 = limt (t) (x(t) – b).
Problema de tiempo mínimo

Se trata, no de hallar la senda más corta, sino la de más breve recorrido. Así, se
pretende min T sujeto a: ẋ=f ( x , u , t )∧x (0)=a ¿ x(T )=b∧u(t )∈ Ωt , con
T libre.
T T
∫ 1dt ∫ 1dt
Como T = 0 , la funcional objetivo es 0 .
Ejemplo: Se pide min T sujeto a: ẋ=x+u∧x (0 )=5∧x(T )=11∧Ω t = [-1, 1].
Entonces, la hamiltoniana es H = 1 + ()(x + u) y la segunda canónica es:
λ̇=−λ , de donde, (t) = A e-t.
Como H es (x- u)-lineal, el principio del mínimo permite concluir que
u*(t) =
{−1,1, λ<0λ>0
.
La condición de Ŧ: 0 = Hpto.term. = 1 + (T) (x(T) + u(T)) = 1 + A e-T(11 + u (T)),
23
T
−e
de donde sale: A = 11+u(T ) , que en cualquier caso resulta ser negativo, pues
u(T)  {1, -1}.
Luego, (t) < 0, t, por lo que u*(t) = 1, t.
La primera ecuación canónica es, entonces, ẋ=x+ 1 , lo que, con las
condiciones extremas para x da x*(t) = Bet – 1 con 5 = B – 1. Luego, x*(t) = 6et –
1.
Ahora, como 11 = 6 eT – 1, resulta T = ln 2.
Ya que F(x, u, t) = 1, entonces F es (x, u)-convexa; similarmente, f (x, u, t), que
es igual a x + u, también es (x, u)-convexa y además (x, u)-lineal; por lo tanto, se
cumplen las condiciones de suficiencia de Mangasarian, y el control óptimo es
u*(t) = 1, t siendo su respuesta la x*(t) = 6 et – 1 y T = ln 2.
Control óptimo con restricciones

T
∫ F ( x,u1 ,u2 ,t )dt

a) Restricciones de igualdad: Se quiere max 0 sujeto a:
ẋ=f ( x , u , t )∧x (0)=a∧h( x , u , t )=0 y condiciones extremas al final y al
inicio del proceso. Entonces, hay que maximizar H como función de u sujeto a h
= 0. Para ello hay que considerar la función lagrangiana L:= H - h.
Entonces las condiciones necesarias de primer orden son:
0 =Lu =F u + λf u −μh u
1 1 1 1
0=Lu2 =Fu2 + λf u2 −μhu2

ẋ=f ∧h=0 que con las condiciones extremas llevan a la
solución.
1
∫ (2 x 2−2u 2−2 v 2 )dt

Ejemplo: Se quiere max 0 sujeto a:
ẋ=−x−4(u+v )∧x−(u+ v )=1 ¿ x( 0)=1 .
Entonces, la lagrangiana es L = 2x2 - 2u2 - 2v2+()(-x - 4u - 4v) - (x – u – v -1).
Así, las condiciones necesarias son:

0 = Lu = -4u -4 λ + μ∧ λ̇=−L x=−4 x + λ+ μ
0=Lv =−4 v−4 λ+μ∧ ẋ=L λ=−x−4 (u+ v ) , junto con: x = (u + v) +1  x(0) =
1. Ahora bien, como u + v =
x – 1, se sigue que ẋ=−x−4( x−1 ) , i. e., ẋ+5 x=4 con x (0) = 1.
Entonces, x*(t) = A e-5t + 4/5  1 = x(0) = A + 4/5, por lo que A = 1/5 con lo que
1 −5t 4
e +
x*(t) = 5 5 .
24
De las dos primeras se sigue que u = v, por lo cual, de u + v = x – 1 sale que u*(t) =
1 1
( x∗(t )−1)= (e−5t −1 )
v*(t) = - 2 10 . Finalmente, la covariable de estado sale de
λ̇−λ=−4 x+μ , con =4u + 4  (de la primera), por lo que
1 1 −5 t
− e
λ̇−λ=−4 x +4 u+4 λ , de donde: *(t) = B e5t + 25 50 , que con la
condición de Ŧ: *(1) = 0, da el valor de B.
T
∫ F ( x, u, t )dt
b) Restricciones integrales: Se quiere max 0 sujeto a: ẋ=f ( x, u , t )
T
∫ G( x ,u, t )dt=K
 0 , constante dada, y las condiciones extremas.
Al precio de introducir una nueva variable de estado, este problema se reformula
t
∫ G( x (τ ),u( τ ),τ )dτ

como uno sin restricciones: y(t) := 0 , de donde ẏ(t )=
T
∫ F ( x, u, t )dt
G( x(t ),u(t ),t ) . Ahora, el problema es el de max 0 sujeto a:
ẋ=f ( x,u,t )
ẏ=G( x ,u ,t ) con y(0) = 0 y(T) = K.
Ejemplo: Hallar la curva desde (0, a) hasta (1, b) de longitud dada l, que maximice
el área encerrada por ella y por el eje de abscisas.
1 1
∫ xdt ∫ √ 1+u2 dt
Entonces, se trata de max 0 sujeto a: l = 0  ẋ=u 
x(0)=a  x(1 )=b .
t
2 ∫ √ 1+u2 dt
Pongamos ẏ=√ 1+u , que sale de y(t) := 0 . Ahora, el problema es
1
ẋ=u
x(0)=a
∧ ¿ y(0 )=0
∫ x(t )dt 2 x(1)=b y(1)=l .
el de max 0 sujeto a: ẏ= √ 1+u con ¿
λ̇1 =−H x=−1
λ̇ 2=−H y =0
ẋ=u
Entonces, la hamiltoniana es: H = x + 1u + 2 (1+u2)  ẏ= √1+u 2 y el
λ2 u
principio del máximo exige que 0 = Hu = 1 + √1+u2 . De todo ello sale: 1 = A –
25
Bu t− A
2 2
t  2 = B, por lo que 0 = A – t + √1+u2 que da u*(t) = √ B −(t− A ) .
Ahora, como ẋ∗(t )=u∗(t ) , de las condiciones extremas salen los valores de las
t
∫ u∗( τ )dτ +C
constantes B y C, pues x*(t) = 0 .
T
∫ F ( x, u, t )dt
c) Restricciones de desigualdad: Se quiere max 0 sujeto a:
ẋ=f ( x, u, t )
h( x, u, t )≤0 con condiciones extremas.
El principio del máximo implica que t, u*(t) ha de ser máximo global de
H(x*(t), , *(t), t) sujeto a: h(x*(t), , t)  0. Esto puede lograrse con la función
lagrangiana L := F +  f -  h.
Entonces, las condiciones necesarias de primer orden son las siguientes. 0 = Lu 
λ̇=−Lx  ẋ=f ∧h≤0∧μ≥0∧0=μh , además de la condición de Ŧ y
las condiciones extremas.
1
∫−u 2 dt
Ejemplo: Se quiere max 0 sujeto a: ẋ=x+u∧x (0 )=1∧xu≤2 .
La hamiltoniana es: H = - u2 + ()(x + u)  L = -u2 + ()(x + u) - (xu -2).
Las condiciones necesarias son: = 0 = Lu = -2u +  - x 
ẋ=L λ=x +u∧ λ̇=−L x = - +  x  (1) = 0  x u = 2  0    0  0 = (x u -
2).
3. Programación Dinámica
El problema típico de la Programación Dinámica (PD) es el siguiente. Se quiere

N −1
∑ F (x (k ),u (k ), k )+S ( x( N ))
max( 0 ) sujeto a: x(k+1) = f(x(k), u(k), k)  x(0) = a 
u(k)  k k{0, 1, …, N-1}.
Esta maximización se da entre las diversas sucesiones finitas (u(0), …, u(N-1)).
Los datos del problema son: las funciones F : 3  , S: , f :3 y los números
N , a , así como la sucesión de subconjuntos de  : (0, …, N-1), que dan, para
cada momento k, los valores admisibles de la variable de control u(k).
Para resolver este problema suele usarse la llamada inducción regresiva, que es un
método consistente en convertir un problema de múltiples etapas en varios
problemas de una sola etapa retrocediendo en el tiempo. Para ilustrarlo se da el
siguiente ejemplo.
Ejemplo: Desde una ciudad A se quiere llegar a una ciudad H, no siendo posible
hacerlo en una sola etapa. En la primera etapa se puede llegar a una de las ciudades
B, C y D. En la segunda etapa, partiendo de una cualquiera de estas ciudades, puede
llegarse a una de las ciudades E, F y G. En la tercera etapa, partiendo de una
26
cualquiera de éstas, puede llegarse a la ciudad H. Se pretende seguir la ruta más

corta, siendo las distancias entre ciudades las que se indican en la siguiente figura.
En la tercera etapa, las rutas más cortas desde E, F y G hasta H son,

respectivamente, EH(3), FH(6) y GH(2).
En la segunda etapa, las rutas más cortas desde B, C y D hasta H son,

respectivamente, BGH(4), CEH(7) y DGH(7).
En la primera etapa, las tres posibles rutas óptimas son ABGH(11), ACEH(15) y
ADGH(12). Luego, la ruta óptima es ABGH de longitud 11.
Propiedad de “causalidad” en la PD
Para dos etapas cualesquiera, j y k, ocurre que si j < k, entonces x(k) sólo depende de
x(j) y de los controles u(j), u(j + 1), …, u(k - 1)
Esto es claro, pues si en j el estado es x(j) y se aplica el control u(j), la ley dinámica
determina el estado x(j+1) = f (x(j), u(j), j); si en j+1 se aplica u(j+1), de nuevo, la
ley dinámica determina el estado x(j+2) = f (x(j+1), u(j+1), j+1), y así sucesivamente
hasta que x(k) resulte determinado por x(k-1) y u(k-1) según f (, , k-1).
N-1
Entonces, cada (u(k ))0 determina la sucesión de estados ocupados por el sistema
N
en las diversas etapas: ( x( k))0 . Estas dos sucesiones hacen que la funcional
N-1
objetivo alcance un valor denotado por J[x(0), (u(k ))0 ]. El problema de la PD
consiste en hallar el máximo valor posible, J*(a), usando como instrumento de
N-1
maximización todas las posibles sucesiones (u(k ))0 .
Teorema de Bellman:
max u ∈Ω ( F (z , u , k )+J k+1 (f ( z ,u ,k )))

Con el algoritmo JN(z) := S(z), …, Jk(z) := k ,
…, hasta llegar a J0(z), se obtendrá el valor máximo buscado J*(a) como J0(a).
27
Además, la sucesión (u*(0), …, u*(N-1)) es la que permite alcanzar J0(a) si, y sólo
si, para todo k se cumple que
max u ∈Ω ( F (x ( k ),u ,k )+J k +1( f ( x (k ), u , k )))

Jk(x(k)) = k =
F( x (k ),u∗( k ),k )+J k +1 (f ( x(k ),u∗( k), k)) ;
N −1
es decir, que (u∗(k ))0 es el control óptimo.
La ecuación de arriba se conoce como la ecuación de Bellman.
Principio de optimalidad de Bellman

N −1 N
Si (u∗(k ))0 es un control óptimo del problema de PD y (x*( k ))0 es la
correspondiente respuesta generada por la ley dinámica; entonces
N −1
j{1, …, N -1}, (u∗(k )) j es un control óptimo del problema PDj consistente en
N −1
∑ F (x (k ),u (k ), k )+S ( x( N ))
maxu k= j sujeto a: x(k+1) = f(x(k), u(k), k)  x(j) =x*(j)
 u(k)  k k {j, …, N-1}.
Ejemplo: Se quiere minu ((u(0) - 2)2 + (u(1) - 4)2 + x(2)) sujeto a: x(0) = 1  x(1) =
3x(0) + u(0)  x(2) = x(1) + 2u(1).
Nótese aquí que F( x(0),u(0),0 ) = (u(0) - 2)2, F( x(1),u(1),1 ) = (u(1) - 4)2,

S(x(2)) = x(2), x(1) = f(x(0), u(0), 0) = 3x(0) + u(0) y, finalmente, que
x(2) = f(x(1), u(1), 1) = x(1) + 2u(1).
El algoritmo del teorema de Bellman se construye como sigue.

1º) J2 (z) = S(z) = z.
2º) J1 (z) = minu ((u-4)2 + J2 (f(z, u, 1))) = minu ((u-4)2 + J2 (z + 2 u))) = minu ((u-4)2 +
(z + 2u)) y como (u-4)2 + z + 2u es u- convexa estrictamente, el mínimo global se
obtiene haciendo 0 = 2(u - 4) + 2, i.e., u* = 3, siendo el valor mínimo
correspondiente J1 (z) = (3-4)2 + (z + 23) = 7 + z.
3º) J0 (z) = minu ((u-2)2 + J1 (f(z, u, 0))) = minu ((u-2)2 + J1 (3z + u)) = minu ((u-2)2 +
3z + u + 7) y como (u-2)2 + 3z + u + 7 es estrictamente u- cóncava, el mínimo
global se obtiene haciendo 0 = 2 (u - 2) + 1. i.e., u* = 3/2, y el valor mínimo es
J0 (z) = (3/2 - 2)2 + 3z + 3/2 + 7 = 3z + 35/4.
Así, pues, el mínimo valor de la funcional del problema planteado, J*(1), se obtiene
como igual a J0 (1) = 47/4.
Este valor se alcanza con la sucesión de controles óptimos: u*(0) = 3/2 y u*(1) = 3,
siendo la correspondiente respuesta del sistema: x*(0) = 1, x*(1) = f (x*(0), u*(0), 0)
= 3 x*(0) + u*(0) = 31 + 3/2 = 9/2 y, finalmente, x*(2) = f (x*(1), u*(1), 1) =
x* (1) + 2 u*(1) = 9/2 + 23 = 21/2.
Ejercicio: Se pide minu (x(0) u(0) + x(1) u(1) + x(2)2) sujeto a: x (k+1) = x(k)u(k) +
u(k)2  x (0) = 2  k = {1, -1, 0}.
28
Ejemplo: Se quiere repartir una cantidad C de cierto recurso entre N actividades. Si

a la actividad k se asigna una cantidad u, se genera un beneficio de √u . Hallar el
reparto óptimo.
Si el estado en la etapa k se define como la cantidad que queda luego de haber

repartido a las actividades anteriores 0, …, k-1; entonces puede plantearse el
problema como el de
N −1
∑ √ u(k ) x (k +1)=x( k )−u(k )∧x (0)=C x(N )=0∧¿ ¿
maxu 0 sujeto a: ¿
k, Ωk =[0 , x(k)] .
Como S(x (N)) = 0, se tiene que JN (z) = S (z) = 0.
Luego, JN-1 (z) = maxu  z ( √ u+J N (f ( z ,u, N−1)) ) = maxu  z ( √ u+0 ) , que da
como máximo global u* (z) = z y como valor máximo JN-1 (z) = √ z .
Ahora, JN-2 (z) = maxu  z ( √ u+J N −1(f ( z ,u ,N −2)) ) = maxu  z ( √ u+ √ z−u) .

Como la función √ u+ √ z−u es estrictamente u-cóncava, pues su segunda
derivada en u es negativa, el máximo global sale de
∂ ( √u+ √ z−u ) 1 1 1
( − )
0= ∂u = 2 √ u √ z−u , por lo que u* = z /2  [0, z].
Así, resulta JN-2 (z) = √ 2z .
De manera enteramente similar, se obtienen JN-3 (z) = √ 3z con máximo global

u*(z) = z /3, y, más generalmente, que JN-m (z) = √ mz con máximo global u*(z) =
z /m. Finalmente, J*(z) = JN-N (z) = √ Nz con máximo global u*(z) = z /N.
Por lo tanto el valor máximo de la funcional objetivo del problema planteado es
J*(C) = √ NC y los controles óptimos, junto con los estados generados por ellos,
son u*(0) = C/N, x*(1) = x*(0) - u*(0) = C - C/N = (1 – 1/N) C,
u*(1) = x*(1)/(N - 1) = C/N, x*(2) = x*(1) - u*(1) = (1 – 2/N) C,
u*(2) = x*(2)/(N-2) = C/N, etc.
Descuento en el problema de Control Óptimo de tiempo discreto

N −1
∑ β k F ( x( k ),u (k ), k )+β N S( x ( N ))
Para el problema: maxu ( k =0 ) sujeto a:
x (k+1)=f ( x (k ),u( k), k ) ¿ x( 0)=a con los 1, .., N-1 dados; la ecuación de
Bellman también puede obtenerse como:
V N ( x( N ))=S(x( N ))∧¿ ¿
∀k ∈ {0, …, N -1}, V k (x(k ))= maxu (
F( x(k ),u( k ),k )+ βV k +1 (f (x (k ),u (k ),k )) ).
29
Ha de notarse que Jk (z) es el valor máximo descontado al período inicial de la

funcional objetivo cuando se empieza en la etapa k en el estado z, mientras que Vk(z)
da ese mismo valor pero sin descontar, i.e. en valor corriente del periodo k.
Obviamente, J0 (a) = V0 (a).
2
∑ δk (u(k )2 +( x (k )−2 k )2 )+ δ3 (x (3 )−5 )2
Ejemplo: Se pide minu( 0 ) con  = 0.9 y
sujeto a: x (k+1)=x( k)+(k +1) u(k )∧x(0 )=0 .
2
V 3 ( z)=( z−5 ) .
2 2
V 2 ( z )=min u (u +( z−4 ) +δV 3 ( z +3 u)) . Como esta función es u-convexa, el
mínimo global sale de: 0 = 2u+2 δ( z+3u−5 )3 , i.e., u* = 1.48 – 0.3 z.
Así, V 2 ( z)= 1.1 z2 – 9z + 18.47.
2 2
Similarmente, V 1 ( z )=minu (u +( z−2) +δV 2 ( z+2u )) =
2 2 2
min u (u +( z−2 ) +δ (1. 1( z+2 u ) −9( z+2 u )+ 18. 47 )) . El mínimo global es
2
u* = 1.63 – 0.4 z, por lo que V 1 ( z)=1. 2 z −3 . 63 z+4 . 42 .
2 2 2
Finalmente, V 0 ( 0)=minu (u +δ V 1 (u )) = min u (u +δ(1 . 2u −3 . 63u+4 . 42 )) .
El mínimo global es u*(0) = 0.65 y V0 (0) = 2.73. Además, se obtiene que x*(0) =
0, u*(0) = 0.65, x*(1) = 0.65, u*(1) = 1.37, x*(2) = 3.39, u*(2) = 0.46 y x*(3) =
4.77.
Programación Dinámica con horizonte temporal infinito

N −1
∞
(uk )k=0 ∑ β k F ( x k ,u k )
El problema es el de maximizar J (x0 , ) := limN k =0 sujeto
a: x k +1=f ( x k , uk )  uk   ,k ; estando dados  ]0, 1[ , las funciones f :
2 y F: 2, el conjunto de controles admisibles  y el estado inicial x0.
∞
Ha de notarse que el instrumento de maximización es la sucesión (uk )k=0 pues de
los valores de x0 y u0 se obtendrá x1= f (x0 , u0) , que con u1 dará x2 = f (x1, u1), etc.
∞
Si se tuviera una sucesión (u∗k )k=0 que fuera un máximo global del problema,
∞
entonces al valor máximo alcanzado J (x0 , (u∗k )k=0 ) se lo denotará simplemente
por J (x0).
En este problema ha de asumirse que la función F es acotada, esto es, que  M tal
que (x , u), F (x , u) M. De este modo desaparecen las dudas sobre la
convergencia de la serie de la funcional objetivo, pues, como es fácil comprobar,
∞ ∞
cualquiera que sea la sucesión (uk )k=0 , se tendrá que J (x0 , (uk )k=0 ) M / (1-
).
Para buscar una solución del problema planteado puede recordarse el caso de la
Programación Dinámica con horizonte temporal finito en el que se quería maximizar
30
N −1
∑ β k F ( x k ,u k )
k =0 sujeto a la misma ley dinámica y a las mismas restricciones de
arriba. En tal caso, si se designa por Jk(z) al valor máximo del subproblema
correspondiente que empieza desde el estado z en la etapa k, y por Vk (z) := -k Jk (z),
el algoritmo de Bellman era: VN (z) = 0, z; y luego Vk (z) =
maxu ∈Ω (
F( z ,u )+βV k+1 ( f ( z ,u )) ).
Ha de notarse aquí que Jk(z) es el valor máximo del subproblema antedicho
expresado en unidades de valor de la etapa inicial 0, mientras que Vk (z) es el
correspondiente valor pero expresado en unidades de valor de la etapa k.
Como se comprueba fácilmente, resulta que V0 (z) = J0 (z).
Ahora bien, para poder generalizar más fácilmente en el caso de horizonte temporal
infinito, conviene cambiar un poquito la notación definiendo las funciones
Vk* := VN-k k. Así, se obtienen consecutivamente del algoritmo de Bellman las
funciones V*0 , V*1 , …, V*N , siendo esta última el valor máximo buscado de la
funcional objetivo, es decir, J0 (z).
Como puede intuirse, cuando el horizonte temporal es infinito, que el problema
empiece en la etapa 0 ó en cualquier otra etapa, k, poco importa siempre que el
estado inicial sea el mismo, ya que en cualquiera de estos casos hay el mismo
horizonte temporal: desde 0 hasta  en el primer caso, y desde k hasta  en el
segundo.
Luego, J0 (z) = Jk (z) y la ecuación de Bellman es:
V*(z) = maxu ( F( z ,u )+βV ∗( f ( z, u)) ).
Esta ecuación sugiere definir un operador funcional como sigue.
Cualquiera que sea la función W: , se define el resultado de operarla por T
como la función T(W): , que a cada z de , le asigna por imagen
T(W)(z) := maxu ( F( z ,u )+βW ( f ( z ,u )) ).
Conviene, además definir las iteraciones del operador T mediante: T0(W):= W,
T1(W):= T(W), T2(W):= T(T(W)), …, Tk+1(W):= T(Tk(W)), etc.
Entonces, se demuestran los dos siguientes lemas que han de permitir resolver el
problema por aproximaciones sucesivas cuando no con toda exactitud.
Lema 1: Cualesquiera sean las funciones W y W´, si W  W´, (i.e. z, W(z)W´(z)),
entonces k, Tk(W)(z)  Tk(W’)(z), es decir, que las iteraciones del operador
preservan el eventual orden de las funciones.
Esto se expresa como que el operador T es monótono.
Lema 2: Si se define la función constante e:  por e(z) := 1 z, entonces r de 

y para toda función W, se tiene que k, Tk(W+re)(x) = Tk(W)(x) + k r.
Esta propiedad suele referirse diciendo que el operador T descuenta.
Finalmente, se obtienen dos fundamentales teoremas para el problema planteado.
Teorema 1: Cualquiera sea la función W, el limk Tk(W)(z) = J (z), z .

31
Teorema 2: La función de valor máximo, J, es el único punto fijo del operador T, es

decir, que J = T(J), esto es, que J(z) = maxu ( F( z ,u )+β J (f ( z ,u )) ), z .
Según el primer teorema, puede iniciarse un proceso iterativo desde cualquier

función a la que repetidamente se le aplicará el operador T, de modo que cada vez se
obtendrá una función más y más aproximada a la solución buscada, esto es, la
función J.
Según el segundo teorema, la solución es única y por satisfacer a la ecuación de
Bellman, podrá ser posible en ciertos casos conjeturar la forma de ella, con lo que, al
imponer la satisfacción de dicha ecuación, se podrá determinar con toda precisión
cuál es la función solución. Esto se ilustra con el siguiente ejemplo.
∞
max c( .)∑ β t ln c(t ) α
Ejemplo: Se quiere t=0 sujeto a: k t +1 =(k t ) −c t
α
¿ c t ∈[ 0 ,(k t ) ] , ∀t estando dado el valor inicial k0 , así como las constantes
positivas menores que 1,  y . Se busca la función de valor máximo, J (k), para
cualquier estado inicial k. Aplicando el proceso iterativo del teorema 1, se puede
partir de una función cualquiera, por ejemplo, la función nula V0(k) = 0, k. A ésta
se la aplicará el operador T obteniéndose la función
α α
V1 (k) = max{ ln c +βV 0 (k −c ) :0≤c≤k } = max{ ln c : 0≤c≤k } =
α
α ln k , ya que el único máximo global del lado derecho es k.

A continuación, volviendo a aplicar el operador a la función V1 se obtendrá la
α α
función V (k) = max{ ln c + βV 1 ( k −c ): 0≤c≤k } = max{
2
α α
ln c +βα ln( k −c ):0≤c≤k } =  (1+) ln k – (1+) ln (1+) +  ln ,
ya que el único máximo global del lado derecho es c = k/(1+) que  [0, k].
Observando las formas de estas dos funciones obtenidas, V0 y V1, puede notarse que
ellas coinciden en ser una constante por ln k más otra constante. Lo único diferente
entre ellas son los valores de las constantes. Luego, es razonable conjeturar que la
forma definitiva de la función J buscada es también así, es decir, que J(k) = A ln k +
B, donde A y B son constantes por determinar.
Como la función J ha de satisfacer la ecuación de Bellman, de esto han de seguirse
α
los valores de A y B: A ln k + B = max {ln c + (A ln (k-c) + B) : 0≤c≤k }.
Resolviendo este pequeño problema de maximización, resulta que el único máximo
global es c = (1+A)-1 k, con lo cual el lado derecho es igual a:
(+A) ln k + B + A ln (A) – (1+A) ln (1+A).
Igualando ambos miembros, el derecho y el izquierdo, salen los valores de las
constantes: A = /(1-) y B=/(1- ).
Así, la función de valor máximo será: J(k) =
α αβ
ln k + ln(αβ )+ln(1−αβ)
1−αβ 1−αβ .
.
32

Notas de Clase - Metodos Cuantitativos

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Notas de Clase - Metodos Cuantitativos

Cargado por

Copyright:

Formatos disponibles

1

Curso de Métodos Cuantitativos

∫ F ( x(t ), ẋ(t ), t )dt

∫ F ( x∗(t ), ẋ∗(t ), t )dt ∫ F ( y (t ), ẏ (t ),t )dt

∫ F ( x(t ), ẋ(t ), t )dt ∫ F ( y (t ), ẏ (t ),t )dt

Ecuación de Euler como condición necesaria de primer orden:

∫ (−12 tx− ẋ 2 )dt

Nota: Para problemas de minimización, la ecuación de Euler es la misma, como

Casos especiales de la ecuación de Euler:

2º) En la función F no aparece ẋ :

3º) En la función F no aparece t:

Condición de Legendre como condición necesaria de 2º orden para optimalidad:

Ha de notarse que esto equivale a:

por lo que queda ẋ = h, es decir, x = h t + k, y con la condición inicial se obtiene

Condiciones suficientes para óptimos del PCV

Nota: Si en vez de maximizar se quisiera minimizar, entonces la concavidad en ( x, ẋ

Extensiones del Cálculo de Variaciones:

1) Funcional objetivo más general:

Nota: Si se quisiera minimizar, en vez de concavidad en ( x, ẋ ) para la función F,

La ecuación de Euler: x− ẍ = 0, de donde x (t) = A et+ Be-t.

2) Espacio de estados multidimensional:

∫ F ( x1 (t ), . .. , x n(t ), ẋ 1(t ), .. . , ẋ n (t ),t )dt

∫ ( ẋ 12+ ẋ 22+2 x1 )dt

3) Derivadas de orden superior en la funcional objetivo:

Se considera un modelo de gestión de reservas. En un momento dado, t0 , la empresa

∫ (Π ( q(t ))−cx (t ))dt

∫−(Π ' )−1 (ct +h )dt∧x 0 =x (t 0 )=k +0

∫ (Π ' )−1(ct +h )dt

∫ (Π ) (ct +h )dt=∫ 4 (ct1+h )2 dt= 41c ct+h

El modelo de crecimiento de Ramsey

Caso de horizonte temporal infinito

para el caso en que no hay condición terminal, Ŧ es: (

interpretar a las variables de control y de estado como “estímulo” y “respuesta”,

problema puede formularse como: max t0

∫ dtd S ( x(t ))dt=∫ S ' ( x ) ẋ dt

∫ (F ( x , f ( x , u , t ), t )dt+S ' ( x ) f ( x , u , t ))dt

Condición general de transversalidad Ŧ

Finalmente, la única candidata a ser control óptimo es:

∫ xdt ẋ=u∧x (0 )=1∧u(t )∈ Ωt := [-1, 1].

∫ dtd S ( x (t ))dt=S( x(1))−S(x (0))=x(1 )2−1

∫ (2 x−3 u−u2 )dt

Como H es u-cóncava, parecería oportuno intentar la aplicación del principio de

Para t  [0, 1], de la gráfica de ((t) - 3) u – u2 (que en esencia es la H vista

Condiciones suficientes de optimalidad

2) Si se tratara de minimizar la funcional objetivo, entonces la (x,u)-concavidad de F y f

∫ dtd S( x(t ))dt

Teorema (de Arrow): Para el problema de PCOL defínase la función hamiltoniana

Nota: En un problema de minimización, ha de reemplazarse la x- concavidad de

Extensiones del control Óptimo

a) Momento y estado finales dados: t1 y b = x(t1) son datos. La única modificación

El principio del máximo: 0 = Hu , pues H es u- cóncava y t = , t.

b) Momento final dado y estado final inferiormente acotado: x (t1)  b.

c) Momento y estado finales libres.

d) Momento final libre y estado final dado: x (t1) = b.

∫ (t 2+u 2 )dt ẋ=u∧x (0 )=4∧x(t 1 )=5 , con

Hamiltoniana de “valor presente”ó de “valor corriente”

Las ecuaciones canónicas pueden expresarse en términos de esta nueva

En suma, las condiciones necesarias para ser control óptimo, en términos de la

∫ e−δ t (u2+( x−1)2 )dt

Caso de horizonte temporal infinito

Problema de tiempo mínimo

Control óptimo con restricciones

∫ F ( x,u1 ,u2 ,t )dt