Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos Básicos de
Optimización Dinámica y
Cálculo de Variaciones
1
1.-Conceptos básicos
Consideremos un monto de dinero 𝑀 que se deposita en un banco, por un
periodo de t años, a la tasa de interés anual “𝑖” ¿Cuál será el monto de
dinero a retirarse al finalizar el año 𝑡 ?
1 año 𝑀 + 𝑖 𝑀 = 𝑀 (1 + 𝑖)
2 año 𝑀(1 + 𝑖) + 𝑖 𝑀(1 + 𝑖) = 𝑀(1 + 𝑖)2
3 año 𝑀(1 + 𝑖)2 + 𝑖 𝑀(1 + 𝑖)2 = 𝑀(1 + 𝑖)3
t años
= 𝑀(1 + 𝑖)𝑡
1 año 1er 𝑖 𝑖
𝑀 + 𝑀 = (1 + ) → 𝑚𝑜𝑛𝑡𝑜 𝑓𝑖𝑛𝑎𝑙 𝑑𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 𝑠𝑒𝑚𝑒𝑠𝑡𝑟𝑒
2 2
2do 𝑖 𝑖 𝑖 𝑖 2
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
2 2 2 2
2 año 1er
𝑖 2 𝑖 𝑖 2 1 3
2do 𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
2 2 2 2
𝑖 3 𝑖 𝑖 3 𝑖 4
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
3 año 1er 2 2 2 2
2do 𝑖 4 𝑖 𝑖 4 𝑖 5
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
2 2 2 2
𝑖 5 𝑖 𝑖 5 𝑖 6
4 año 1er 𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
2 2 2 2
2do 𝑖 6 𝑖 𝑖 6 𝑖 7
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
2 2 2 2
𝑖 7 𝑖 𝑖 7 𝑖 8
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
2 2 2 2
2
Resumiendo por año:
Años Monto Final
1 año 𝑖 2
𝑀 (1 + )
2 año 2
𝑖 4
𝑀 (1 + )
3 año 2
𝑖 6
4 año 𝑀 (1 + )
2
𝑖 8
t años 𝑀 (1 + )
2
𝑖 2𝑡
𝑀 (1 + )
2
1 año 1er 𝑖 𝑖
(4meses) 𝑀 + 𝑀 = 𝑀 (1 + )
3 3
2do 𝑖 𝑖 𝑖 𝑖 2
(8 meses) 𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
3ro 3 3 3 3
(12 meses) 𝑖 2 𝑖 𝑖 2 𝑖 3
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
3 3 3 3
2 año 1er
(4meses) 𝑖 3 𝑖 𝑖 3 𝑖 4
2do 𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
(8 meses) 3 3 3 3
3ro 𝑖 4 𝑖 𝑖 4 𝑖 5
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
(12meses) 3 3 3 3
𝑖 5 𝑖 𝑖 5 𝑖 6
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
3 3 3 3
3año 1er
(4 meses)
2do 𝑖 6 𝑖 𝑖 6 𝑖 7
(8 meses) 𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
3ro 3 3 3 3
(12 meses) 𝑖 8 𝑖 𝑖 8 𝑖 9
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
3 3 3 3
𝑖 8 𝑖 𝑖 8 𝑖 9
𝑀 (1 + ) + 𝑀 (1 + ) = 𝑀 (1 + )
3 3 3 3
3
Resumiendo por año:
Año Monto final
𝑖 3
1año 𝑀 (1 + )
3
2año 𝑖 6
𝑀 (1 + )
3
3año 𝑖 9
𝑀 (1 + )
3
t años 𝑖 3𝑡
𝑀 (1 + )
3
𝑛=1 𝑖 𝑛(𝑡)
𝑀 (1 + ) 𝑀(1 + 𝑖)𝑡
𝑛
𝑛=2 𝑖 𝑛(𝑡) 𝑖 2𝑡
𝑀 (1 + ) 𝑀 (1 + )
𝑛 2
𝑛=3 𝑖 𝑛(𝑡) 𝑖 3𝑡
𝑀 (1 + ) 𝑀 (1 + )
𝑛 3
𝑛=𝑛 𝑖 𝑛(𝑡) 𝑖 𝑛𝑡
𝑀 (1 + ) 𝑀 (1 + )
𝑛 𝑛
Ejemplo:
Willy deposita 10 000 s/. en un banco, durante 5 años, a la tasa de interés anual
de 10% ; el banco capitaliza intereses cada trimestre, al terminar el quinto año.
¿Cuál será el monto que retirara Willy del banco?
𝑀 = 10 000𝑆/. 𝑡 = 5 𝑎ñ𝑜𝑠
4
𝑖 𝑛𝑡 𝑆 = (1.025)20 (10000)
𝑆 = (1 + ) 𝑀
𝑛
𝑆 = 1.63861644(10000)
0.1 4(5)
𝑆 = (1 + 4
) (10000)
𝑆 = 16386.2
𝑆 = (1 + 0.025)20 (10000)
𝑖 𝑛𝑡
Si asumimos lo siguiente: 𝑍 = (1 + )
𝑛
𝑆 = 16386.2
5
3) 𝑍 es un número puro cuyo valor está comprendido en el siguiente
intervalo.
a) Si la 𝑖 = 0 𝑍 = 1
b) Si la 𝑖 0 𝑍 = 1
1 −𝑛𝑡
Sea: 𝛽= = 𝑍 −1 𝛽 = (1 + )
𝑍 𝑛
Periodo de estudios
1 año 1 año 1 año 1 año 1 año 1 año
6
𝑆 = 8000 𝑛 = 12
𝑖 = 5% 𝑡=3
Sí 𝑖 = 𝜌 entonces:
𝜌 −𝑛𝑡 241 −36
𝑀 = 𝑆 (1 + ) 𝑀 = 8000 ( )
𝑛 240
𝑖 𝑛𝑡
Se busca encontrar: lim 𝑍 = lim (1 + 𝑛)
𝑛→𝛼 𝑛→𝛼
Analizando; Si 𝑖 = 10% 𝑡 = 1
Replanteando: 𝑖
𝑙𝑛 (1 + )
lim 𝑙𝑛 𝑍 = lim [ 𝑛 ]
𝑛→𝛼 𝑛→𝛼 1
𝑖 𝑛𝑡
𝑙𝑛 𝑍 = 𝑙𝑛 (1 + ) 𝑛. 𝑡
𝑛
𝑖
lim [𝑙𝑛 (1 + )]
Luego: lim 𝑙𝑛 𝑍 = 𝑛→𝛼 𝑛
𝑛→𝛼 1
lim
𝑖 𝑛𝑡 𝑛→𝛼 𝑛. 𝑡
lim 𝑙𝑛 𝑍 = lim 𝑙𝑛 (1 + 𝑛)
𝑛→𝛼 𝑛→𝛼
0
lim 𝑙𝑛 𝑍 =
𝑖 𝑛→𝛼 0
lim 𝑙𝑛 𝑍 = lim [𝑛. 𝑡 𝑙𝑛 (1 + )]
𝑛→𝛼 𝑛→𝛼 𝑛
7
Si observa que el límite es una forma indeterminada especial por lo que es
necesario aplicar la regla de L’ Hospital.
Asumiendo:
𝑖 1
𝑥(𝑛) = 𝑙𝑛 (1 + ) ; 𝑎(𝑛) =
𝑛 𝑛𝑡
Luego: Sabemos:
𝑥(𝑛) 1 −𝑖
lim 𝑙𝑛 𝑍 = lim 𝑥 ′ (𝑛) = )(
𝑖 2
𝑛→𝛼 𝑛→𝛼 𝑎(𝑛)
1+𝑛 𝑛
Según la regla de L’ Hospital
1
𝑎′ (𝑛) = −
𝑥′(𝑛) 𝑛2 𝑡
lim 𝑙𝑛 𝑍 = lim [ ]
𝑛→𝛼 𝑛→𝛼 𝑎′(𝑛)
Luego:
−𝑖
𝑛2
− 𝑖 ⁄𝑛 2 𝑖 −𝑖𝑛
1 + 𝑖 ⁄𝑛 1+𝑛 𝑛2 (𝑛 + 𝑖)
lim 𝑙𝑛𝑍 = lim [ ] = lim = lim [ ]=
𝑛→𝛼 𝑛→𝛼 −1 →𝛼 −1 𝑛→𝛼 −1
𝑛2 𝑡 𝑛2 𝑡 𝑛2 𝑡
[ ]
−𝑖𝑛3 𝑡 𝑖𝑛𝑡 𝑖𝑡
lim [ 2 ] = lim [ ] = lim [ ] = 𝑖𝑡
𝑛→𝛼 −𝑛 (𝑛 + 𝑖) 𝑛→𝛼 𝑛 + 𝑖 𝑛→𝛼 𝑖
1+𝑛
Tomando antilogaritmos:
Ejemplo:
Un monto de dinero s/. 18 000 es depositado en un banco que ofrece pagar una
tasa de interés de 5%. ¿Cuál será el monto a retirarse después de 9años?
a) Considere 12 capitalizaciones por año.
b) Considere que el número de capitalizaciones tiende al infinito.
8
b) Con capitalización continua:
𝑆 = 28 229.61934
(0.05)(9)
𝑆=𝑒 (18 000)
𝑆 = 𝑠/.28 229.61
0.45
𝑆=𝑒 (18 000)
Diferencias
Optimización Estática Optimización Dinámica
1.- Existe una función objetivo sujeto 1.- Existe un funcional objetivo
a restricciones (ecuaciones sujeto a restricciones (ecuaciones
algebraicas). diferenciales o ecuaciones en
diferencias).
2.- Existe dos tipos de variables 2.- Existen dos tipos de variables de
endógenas y exógenas. estado y control.
9
1.6.-Funcional objetivo
Es una aplicación donde su dominio es un conjunto de funciones y el
rango un conjunto de números reales, además a todas las funcionales se
asocia un costo y un beneficio (ventaja y desventaja).
R1 = R1(t) V1=15 min R2
Formalizando:
Consideremos la función dinámica 𝑦 = 𝑦(𝑡) y además dos puntos inicial
y final:
𝑦(0) = 𝑦0 𝑦0 𝑓𝑖𝑗𝑜 Condición inicial
10
Además se debe observar que los costos o beneficios 𝑉 dependerán de la
trayectoria elegida 𝑦(𝑡) ; es decir existe la siguiente relación funcional:
𝑉 = 𝑉[𝑦(𝑡)]
ℝ f
El grafico que representa estos datos por lo tanto será:
Yt Y2(t)
Y1(t)
Y0
Y3(t)
0 T t
¿Qué es el funcional?
Es una aplicación en la que el dominio es un conjunto de funciones y el rango
un conjunto de números reales.
𝑦 = 𝑥 + 1 → 𝑦 = 𝑓(𝑥)
Maximización 𝑉 = 𝑉[𝑦(𝑡)]
Minimización 𝑉 = 𝑉[𝑦(𝑡)]
11
2.-Calculo de variaciones
El cálculo de variaciones es una de las metodologías empleadas para
encontrar la senda óptima (extremal) de un problema de optimización
dinámica.
Las nociones del cálculo de variaciones se posicionan en el siglo XVII. Uno
de los trabajos pioneros en este campo fue el de John Bernoulli, realizado
en 1696, quien resolvió el problema de la braquistócrana. Que consiste en
encontrar la trayectoria más veloz de un pequeño objeto, entre dos
puntos, bajo la influencia de la gravedad.
La aplicación de esta metodología a la economía se da a partir de la
década de los veinte, con los trabajos de Evans, Ramsey y Hotelling. De
manera general puede ser planteado de la siguiente forma:
𝑇
𝑂𝑝𝑡𝑖𝑚𝑖𝑧𝑎𝑟 𝑉[𝑦] = ∫ 𝑓(𝑡, 𝑦(𝑡), 𝑦´(𝑡)𝑑𝑡
0
𝑠𝑢𝑗𝑒𝑡𝑜 𝑎 𝑦(0) = 𝑦0
𝑦(𝑇) = 𝑦𝑇
𝑅 2 = 49 + 25 12 B
𝑅 2 = 74
𝑅 = √74 5 A
𝑅 = 8.6
2 7 t
12
Solución 2
Se busca la distancia mínima entre A y B asumiendo que el recorrido sea
una línea curva, a través del cálculo de variaciones lo plantearemos de la
siguiente manera:
Y Si tomamos un trozo o segmento de
12 B de dicha curva y lo analizamos, ten-
dremos lo siguiente:
5 A dR dY
2 t2 t3 7 t dt
El problema será:
7
Minimizar 𝐷 = ∫2 √1 + 𝑦̇ 2 𝑑𝑡
13
2.1.-El Problema de Cálculo de Variaciones
El problema de cálculo de variaciones consiste en encontrar la trayectoria
óptima de estado, en un horizonte de tiempo definido de tal forma que
el funcional sea maximizado o minimizado.
𝑇
Optimizar un funcional: 𝑉[𝑦] = ∫0 𝑓(𝑦̇ , 𝑦, 𝑡) 𝑑𝑡
Dónde:
𝑦 = 𝑦(𝑡) Variable de estado 𝑉 = 𝑉[𝑦] Funcional
Ejemplo:
Solución
El objetivo del monopolista es maximizar sus beneficios o ganancias,
como cualquier empresario o ente económico.
Teniendo en cuenta esto, planteamos las funciones que determinan el
problema:
Función de beneficios: 𝜋 = 𝑖𝑛𝑔𝑟𝑒𝑠𝑜𝑠 – 𝑐𝑜𝑠𝑡𝑜𝑠 … … … (1)
Función de ingresos: 𝐼𝑛𝑔𝑟𝑒𝑠𝑜𝑠 = 𝑃𝑟𝑒𝑐𝑖𝑜 × 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑
𝐼 = 𝑃. 𝑄
14
Función de costos: 𝐶 = 𝑄2 + 𝑄 + 1
2
𝐶 = (2 − 2𝑃 + 𝑃̇) + (2 − 2𝑃 + 𝑃̇ ) + 1
𝜋 =𝐼−𝐶
En general:
5 5
∑ 𝜋𝑖 ∫ 𝜋𝑑𝑡
𝑖=0 0
5
max 𝛱 = ∫0 𝜋(𝑃̇, 𝑃) 𝑑𝑡
5
max 𝛱 = ∫0 (−7 + 12𝑃 − 6𝑃2 − 5𝑃̇ + 5𝑃𝑃̇ − 𝑃̇2 )𝑑𝑡
𝑠. 𝑎. 𝑃(0) = 3 𝑃(5) = 6
15
Metodología de Solución
La solución consiste en encontrar la mejor trayectoria dinámica, senda óptima o
extremal de la variable de estado ya sea para minimizar o maximizar.
𝑑 𝑓𝑦̇
La Ecuación de Euler es: 𝑓𝑦 =
𝑑𝑡
𝑑𝑓 𝑑𝑓
Dónde: 𝑓𝑦 = 𝑓𝑦̇ =
𝑑𝑦 𝑑𝑦̇
16
Desarrollando la ecuación de Euler:
Dividimos todo entre 𝑓𝑦̇ 𝑦̇
𝑑
𝑓𝑦 (𝑦,̇ 𝑦, 𝑡) = [𝑓𝑦̇ (𝑦̇ , 𝑦, 𝑡)]
𝑑𝑡 𝑓𝑦̇ 𝑦 𝑓𝑦 − 𝑓𝑦̇ 𝑡
𝑦̈ + 𝑦̇ =
𝑑𝑓𝑦̇ 𝑑𝑦̇ 𝑑𝑓𝑦̇ 𝑑𝑦 𝑑𝑓𝑦̇ 𝑑𝑡 𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇
𝑓𝑦 = + +
𝑑𝑦̇ 𝑑𝑡 𝑑𝑦 𝑑𝑡 𝑑𝑡 𝑑𝑡
Además:
𝑓𝑦 = 𝑓𝑦̇ 𝑦̇ 𝑦̈ + 𝑓𝑦̇ 𝑦 𝑦̇ + 𝑓𝑦̇ 𝑡 … … (∗) 𝑓𝑦̇ 𝑦 𝑓𝑦 − 𝑓𝑦̇ 𝑡
= 𝑎 =𝑏
𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇
𝑓𝑦 − 𝑓𝑦̇ 𝑡 = 𝑓𝑦̇ 𝑦̇ 𝑦̈ + 𝑓𝑦̇ 𝑦 𝑦̇
𝑦̈ + 𝑎𝑦̇ = 𝑏
𝑓𝑦̇ 𝑦̇ 𝑦̈ + 𝑓𝑦̇ 𝑦 𝑦̇ = 𝑓𝑦 − 𝑓𝑦̇ 𝑡
2.3.-Condiciones de transversalidad:
Si la condición de transversalidad es la siguiente:
[𝑓𝑦̇ ]𝑡=𝑇 ∆𝑦𝑇 + [𝑓 − 𝑦̇ 𝑓𝑦̇ ]𝑡=𝑇 ∆𝑇 = 0
Dónde:
CASO I:
Y
𝑇 fijo y 𝑦𝑇 fijo
Si 𝑇 es fijo → ∆𝑇 = 0
Si 𝑦𝑇 es fijo → ∆𝑦𝑇 = 0 YT
Y0
T t
17
Incorporando en la condición de transversalidad general se verifica el
cumplimiento automático, por lo que no será necesario aplicar ninguna
condición de transversalidad especial, bastara aplicar las condiciones inicial y
final para resolver el problema.
CASO II:
Y
𝑇 libre y 𝑦𝑇 fijo
Si 𝑇 libre → ∆𝑇 ≠ 0
Si 𝑦𝑇 fijo → ∆𝑦𝑇 = 0 YT
Entonces la condición de
transversalidad es:
[𝑓 − 𝑦̇ 𝑓𝑦̇ ]𝑡=𝑇 = 0 Y0
CASO III:
Y
𝑇 fijo y 𝑦𝑇 libre
Si 𝑇 fijo→ ∆𝑇 = 0
Si 𝑦𝑇 libre→ ∆𝑦𝑇 ≠ 0
Entonces la condición de
transversalidad es:
[𝑓𝑦̇ ]𝑡=𝑇 = 0 Y0
T t
CASO IV:
𝑇 libre y 𝑌𝑇 libre
Curva terminal: Es una función que determina todos los valores que puede
tomar la variable de estado con diferentes horizontes temporales, en la cual se
induce que el valor de estado en el último instante del horizonte temporal es
una función del tiempo.
18
Observe diferenciando totalmente:
Si 𝑑 ≅ ∆
𝑓𝑦̇ ∆𝑦𝑇 + (𝑓 − 𝑦̇ 𝑓𝑦̇ )∆𝑇 = 0
Si 𝑦𝑇 = ∅(𝑇)
𝑓𝑦̇ ∅′ (𝑇)∆𝑇 + (𝑓 − 𝑦̇ 𝑓𝑦̇ )∆𝑇 = 0
𝑑∅(𝑇)
𝑑 𝑦𝑇 = 𝑑𝑇 ∆𝑇(𝑓𝑦̇ ∅′ 𝑇 + 𝑓 − 𝑦̇ 𝑓𝑦̇ ) = 0
𝑑𝑇
t
Ejemplo:
1
Optimizar: 𝑉[𝑌] = ∫0 𝑒 −0.5𝑡 (𝑦 − 𝑦 2 − 2𝑦̇ 2 )𝑑𝑡
(1 − 2𝑦)𝑒 −0.5𝑡 = −4𝑦̈ 𝑒 −0.5𝑡 + 2𝑦̇ 𝑒 −0.5𝑡 (1 − 2𝑦)𝑒 −0.5𝑡 = 𝑒 −0.5𝑡 (−4𝑦̈ + 2𝑦̇ )
19
Tenemos que resolver esta ecuación diferencial:
4𝑦̈ − 2𝑦̇ − 2𝑦 = −1 1−3
𝑟2 = = −0.5
4𝑟 2 − 2𝑟 − 2 = 0 4
2𝑟 2 − 𝑟 − 1 = 0 𝑦𝑐 = 𝐴1 𝑒 𝑟1 𝑡 + 𝐴2 𝑒 𝑟2 𝑡
−𝑏 ± √𝑏 2 − 4𝑎𝑐
𝑟= 𝑦𝑐 = 𝐴1 𝑒 𝑡 + 𝐴2 𝑒 −0.5𝑡
2𝑎
−(−1) ± √−12 − 4(2)(−1)
𝑟= −1
2(2) 𝑦𝑝 = = 0.5
−2
1 ± √1 + 8 1 ± √9
𝑟= =
4 4 La solución General será:
1±3
𝑟= 𝑦(𝑡) = 𝐴1 𝑒 −0.5𝑡 + 𝐴2 𝑒 𝑡 + 0.5
4
1+3
𝑟1 = =1
4
20
1.5 + 0.5𝑒 Remplazamos 𝐴1 ∶
𝐴1 =
𝑒 −0.5 − 𝑒
−1.3539 + 𝐴2 = −0.5
𝐴1 = −1.3539
𝐴2 = 1.3 − 0.5
𝐴2 = 0.85
1
𝑉[𝑦(𝑡)] = ∫ 𝑒 −0.5𝑡 (−1.445𝑒 2𝑡 + 1.1475𝑒 1.5𝑡 − 2.278125𝑒 −𝑡 + 0.25)𝑑𝑡
0
1
𝑉[𝑦(𝑡)] = ∫ (−1.445𝑒 1.5𝑡 + 1.1475𝑒 𝑡 − 2.278125𝑒 −1.5𝑡 + 0.25𝑒 −0.5𝑡 ) 𝑑𝑡
0
𝑉[𝑦(𝑡)] = −2.365435139
1 y(t)
1 t
21
Ejemplo:
Dado el siguiente funcional objetivo, sujeto a la restricción temporal.
5
Optimizar: 𝐽[𝑥] = ∫0 (3𝑥̇ 2 − 12𝑥)𝑑𝑡
Sujeto a: 𝑥(0) = 0
a) Halle la extremal.
b) Halle el valor óptimo del funcional.
c) Realice un gráfico del problema.
d) ¿Es 𝐽[𝑥] un máximo o mínimo?
e) Explique la solución, encontrada.
De (1) se obtiene:
𝑓𝑥 = −12 … … (3) 𝑑𝑓𝑥̇
= 6𝑥̈ … … (5)
𝑓𝑥̇ = 6𝑥̇ … … (4) 𝑑𝑡
Simplificando:
𝑥̈ = −2 … … (6) 𝑎1 y 𝑎2 = 0
𝑥̈ + 𝑎1 𝑥̇ + 𝑎2 𝑥 = 𝑏 𝑥̈ + 0𝑥̇ + 0𝑥 = −2
Solución complementaria:
𝑥̈ + 0𝑥̇ + 0𝑥 = 0 −0 ± √02 − 4(1)(0)
𝑟=
2(1)
𝑟 2 + 0𝑟 + 0 = 0
𝑟1 = 0 𝑟2 = 0
22
Solución Particular:
𝑥̈ + 0𝑥̇ + 0𝑥 = −2 2𝐾 = −2
2𝐾 + 0(2𝐾𝑡) + 0(2𝐾) = −2 𝐾 = −1
2𝐾 + 0 = −2 𝑥𝑝 = 𝐾𝑡 2 → 𝑥𝑝 = −𝑡 2
Condición inicial:
𝑥(0) = 0 𝑥(0) = −02 + 𝐾0 (0) + 𝐾1 𝐾1 = 0 … … (8)
a) Halle extremal:
En nuestro ejercicio la mejor trayectoria de estado es:
𝑥(𝑡) = −𝑡 2 + 10𝑡
5
b) Hallar el valor óptimo del funcional: 𝐽[𝑥] = ∫0 (3𝑥̇ 2 − 12𝑥) 𝑑𝑡
Si: 𝑥(𝑡) = −𝑡 2 + 10𝑡 𝑥′(𝑡) = −𝑡 2 + 10
5
𝐽[𝑥] = ∫ [3(−2𝑡 + 10)2 − 12(−𝑡 2 + 10𝑡)]𝑑𝑡
0
23
5
𝐽[𝑥] = ∫ [3(4𝑡2 − 40𝑡 + 100) + 12𝑡2 − 120𝑡]𝑑𝑡
0
5
𝐽[𝑥] = ∫ (12𝑡2 − 120𝑡 + 300 + 12𝑡2 − 120𝑡)𝑑𝑡
0
5
𝐽[𝑥] = ∫ (24𝑡 2 − 240𝑡 + 300)𝑑𝑡
0
𝐽[𝑥] = −500
25
X(t)
5 t
24
Recordemos que lo que tratamos de evaluar es la concavidad o convexidad de la
función intermedia con respecto ha 𝑦, 𝑦̇ , 𝑡, sin embargo para evaluarla podemos
tomar en cuenta solo 𝑦 ˄ 𝑦̇ es decir: 𝑓 = 𝑓(𝑦̇ , 𝑦) por lo tanto la primera y
segunda diferencial deben ser solo con respecto a estas dos variables, lo que
implica que la segunda diferencial será:
𝜕𝑓 𝜕𝑓
𝑑𝑓 = 𝑑𝑦̇ + 𝑑𝑦
𝜕𝑦̇ 𝜕𝑦
𝑑𝑓 = 𝑓𝑦̇ 𝑑𝑦̇ + 𝑓𝑦 𝑑𝑦
2𝑓𝑦̇ 𝑦 𝑑𝑦𝑑𝑦̇
𝑑 2 𝑓 = 𝑓𝑦̇ 𝑦̇ [𝑑𝑦̇ 2 + ] + 𝑓𝑦𝑦 𝑑𝑦 2
𝑓𝑦̇ 𝑦̇
2 2
2 2
2𝑓𝑦̇ 𝑦 𝑑𝑦𝑑𝑦̇ 𝑓𝑦̇ 𝑦 𝑑𝑦 𝑓𝑦̇ 𝑦 𝑑𝑦
𝑑 𝑓 = 𝑓𝑦̇ 𝑦̇ [𝑑𝑦̇ + +( ) −( ) ] + 𝑓𝑦𝑦 𝑑𝑦 2
𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇
2 2
2 2
2𝑓𝑦̇ 𝑦 𝑑𝑦𝑑𝑦̇ 𝑓𝑦̇ 𝑦 𝑑𝑦 𝑓𝑦̇ 𝑦 𝑑𝑦
𝑑 𝑓 = 𝑓𝑦̇ 𝑦̇ [𝑑𝑦̇ + +( ) ] − 𝑓𝑦̇ 𝑦̇ ( ) + 𝑓𝑦𝑦 𝑑𝑦 2
𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇
2 2
2
𝑓𝑦̇ 𝑦 𝑑𝑦 𝑓𝑦̇ 𝑦 𝑑𝑦
𝑑 𝑓 = 𝑓𝑦̇ 𝑦̇ (𝑑𝑦̇ + ) − 𝑓𝑦̇ 𝑦̇ ( ) + 𝑓𝑦𝑦 𝑑𝑦 2
𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇
2
2
𝑓𝑦̇ 𝑦 𝑑𝑦 𝑓𝑦̇ 𝑦 2
𝑑 𝑓 = 𝑓𝑦̇ 𝑦̇ (𝑑𝑦̇ + ) − (𝑑𝑦)2 + 𝑓𝑦𝑦 (𝑑𝑦)2
𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇
25
2
2
𝑓𝑦̇ 𝑦 𝑑𝑦 𝑓𝑦̇ 𝑦 2
𝑑 𝑓 = 𝑓𝑦̇ 𝑦̇ (𝑑𝑦̇ + ) −( − 𝑓𝑦𝑦 ) (𝑑𝑦)2
𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇
2
2
𝑓𝑦̇ 𝑦 𝑑𝑦 𝑓𝑦̇ 𝑦 2
𝑑 𝑓 = 𝑓𝑦̇ 𝑦̇ (𝑑𝑦̇ + ) + (𝑓𝑦𝑦 − ) (𝑑𝑦)2
𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇
2
2
𝑓𝑦̇ 𝑦 𝑑𝑦 𝑓𝑦𝑦 𝑓𝑦̇ 𝑦̇ − 𝑓𝑦̇ 𝑦 2
𝑑 𝑓 = 𝑓𝑦̇ 𝑦̇ (𝑑𝑦̇ + ) +( ) (𝑑𝑦)2 … … (4)
𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦̇
a) Si 𝑓𝑦̇ 𝑦̇ > 0 y 𝑓𝑦𝑦 𝑓𝑦̇ 𝑦̇ − 𝑓𝑦̇ 𝑦 2 > 0 𝑑2 𝑓 > 0 esto nos lleva a concluir lo
siguiente:
b) Si 𝑓𝑦̇ 𝑦̇ < 0 𝑦 𝑓𝑦𝑦 𝑓𝑦̇ 𝑦̇ − 𝑓𝑦̇ 𝑦 2 > 0 𝑑2 𝑓 < 0 esto nos lleva a concluir lo
siguiente:
26
La matriz cuadrada se denomina, “matriz Hessiana”
𝑓𝑦̇ 𝑦̇ 𝑓𝑦𝑦̇
𝐻 = [𝑓 𝑓𝑦𝑦
]
𝑦̇ 𝑦
𝑓𝑦̇ 𝑦̇ 𝑓𝑦𝑦̇ 2
|𝐻2 | = | | = 𝑓𝑦̇ 𝑦̇ 𝑓𝑦𝑦 − (𝑓𝑦𝑦̇ )
𝑓𝑦̇ 𝑦 𝑓𝑦𝑦
𝑓 𝑓𝑥𝑥̇ 6 0
𝐻 = [𝑓𝑥̇ x 𝑓𝑥𝑥
]=[ ]
𝑥̇ 𝑥 0 0
𝑓𝑥 = −12 𝑓𝑥𝑥 = 0 𝑓𝑥𝑥̇ = 0
2
𝑓𝑥̇ 𝑥 𝑑𝑥
(𝑑𝑥̇ + 𝑓𝑥̇ 𝑥̇
) → Este siempre es positivo, porque esta elevado al cuadrado.
27
Ejemplo: (Problema planteado en la noción de cálculo de variaciones)
Hallar la distancia entre los puntos (2; 5) y (7; 12)
Y
12 B
5 A
2 7 t
Resolución 1:
Por Pitágoras dimos como respuesta 8.6.
Resolución 2:
Pero formulando el problema en base a la metodología del cálculo de variaciones
el problema es:
7
𝑀𝑖𝑛 𝐷 = ∫2 √1 + 𝑦̇ 2 𝑑𝑡 𝑠. 𝑎: 𝑦(2) = 5 𝑦 (7) = 12
Luego:
𝑓𝑦 = 0 𝑓𝑦̇ 𝑦̇ = 0 … … (3)
𝑓𝑡 = 0 𝑓𝑦̇ 𝑡 = 0 … … (4)
𝑓𝑦̇ 𝑦̇ 𝑦̈ = 0 … … (5)
28
Esa es la ecuación de Euler especial, que se debe utilizar cuando la función
intermedia solo depende de 𝑦̇ .
Si observamos esta condición, nos damos cuenta que obligatoriamente 𝑓𝑦̇ 𝑦̇ 𝑜 𝑦̈
debe ser cero, lo que da lugar a dos casos:
CASO I: 𝑓𝑦̇ 𝑦̇ = 0 ˄ 𝑦̈ ≠ 0
𝑦 = 8𝑡 2 + 5𝑡 + 2 𝑦̇ = 16𝑡 + 5 𝑦̈ = 16
29
𝑦(7) = 12 → 𝑦(7) = 𝑘0 + 𝑘1 (7) → 𝑘0 + 7𝑘1 = 12
Resolviendo el sistema:
𝑘0 + 2𝑘1 = 5 𝑘0 + 2𝑘1 = 5
𝑘0 + 7𝑘1 = 12 𝑘0 + 2(7⁄5) = 5
−𝑘0 − 2𝑘1 = −5
5𝑘0 + 14 = 25
𝑘0 + 7𝑘1 = 12
5 𝑘0 = 11 → 𝑘0 = 11⁄5
5𝑘1 = 7 → 𝑘1 = 7⁄5
11 7
Portando la trayectoria: 𝑦(𝑡) = 𝑘0 + 𝑘1 𝑡 𝑦(𝑡) = 5
+ 5𝑡
Si 𝑦̇ = 7⁄5 7
√74
𝐷=∫ 𝑑𝑡
2 5
7 1⁄
2 2
𝐷 = ∫ (1 + (7⁄5) ) 𝑑𝑡 √74 √74
2 𝐷= (7) − (2)
5 5
7 1⁄
49 2
𝐷 = ∫ (1 + ) 𝑑𝑡 𝐷 = √74
2 25
𝐷 = 8.602325267
1⁄ 𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦
Sea 𝑓 = (1 + 𝑦̇ 2 ) 2 𝐻=[
𝑓𝑦𝑦̇ 𝑓𝑦𝑦
]
𝑓𝑦̇ 𝑦̇ 𝑓𝑦̇ 𝑦
|𝐻1 | = |𝑓𝑦̇ 𝑦̇ | = 𝑓𝑦̇ 𝑦̇ |𝐻2 | = | | = 𝑓𝑦̇ 𝑦̇ 𝑓𝑦𝑦 − 𝑓𝑦̇ 𝑦 2
𝑓𝑦𝑦̇ 𝑓𝑦𝑦
𝑓𝑦 = 0 𝑓𝑦𝑦 = 0 𝑓𝑦𝑦̇ = 0
1 1⁄
𝑓𝑦̇ = 2 (1 + 𝑦̇ 2 )− 2 (2𝑦̇ ) 𝑓𝑦̇ 𝑦 = 0 𝑓𝑦̇ 𝑦̇ =
1 1 1 3
𝑓𝑦̇ 𝑦̇ = [2(1 + 𝑦̇ 2 )− ⁄2 + (2𝑦̇ ) (− ) (1 + 𝑦̇ 2 )− ⁄2 (2𝑦̇ )]
2 2
30
1 1 1 3
𝑓𝑦̇ 𝑦̇ = [2(1 + 𝑦̇ 2 )− ⁄2 + 4𝑦̇ 2 (− ) (1 + 𝑦̇ 2 )− ⁄2]
2 2
1 1 3
𝑓𝑦̇ 𝑦̇ = [2(1 + 𝑦̇ 2 )− ⁄2 − 2𝑦 2̇ (1 + 𝑦̇ 2 )− ⁄2 ]
2
1 2 2𝑦̇ 2
𝑓𝑦̇ 𝑦̇ = [ − ]
2 (1 + 𝑦̇ 2 )1⁄2 (1 + 𝑦̇ 2 )3⁄2
1 2(1 + 𝑦̇ 2 ) − 2𝑦̇ 2
𝑓𝑦̇ 𝑦̇ = [ 3 ]
2 (1 + 𝑦̇ 2 ) ⁄2
1 + 𝑦̇ 2 − 𝑦̇ 2 1
𝑓𝑦̇ 𝑦̇ = 3 = 3⁄
(1 + 𝑦̇ 2 ) ⁄2 (1 + 𝑦̇ 2 ) 2
𝑓𝑦̇ 𝑦̇ > 0
2.5.-Condiciones de Legendre
Máximo absoluto: Es el punto máximo para todo el dominio.
Máximo relativo: Es el punto, máximo para un intervalo del dominio.
Es el punto máximo para un externo del dominio para puntos de la
derecha y de la izquierda.
Es una condición que expresa la concavidad o convexidad de la
función intermedia de manera lineal (extremo lineal).
Dada la función intermedia 𝑓(𝑦̇ , 𝑦, 𝑡), es posible hallar 𝑓𝑦̇ 𝑦̇
31
Luego:
a) Si 𝑓𝑦̇ 𝑦̇ > 0 entonces la trayectoria optima de estado encontrada
permite minimizar el funcional.
32
UNIDAD I I
Control Óptimo y
Programación Dinámica
En esta unidad daremos a conocer las dos metodologías restantes, control optimo
y programación dinámica, como ya mencionamos la primera será formulada en
términos continuos y la segunda en términos discretos.
Como en el cálculo de variaciones, nuestro objetivo será optimizar las variables
económicas a lo largo del tiempo, con la diferencia de que en estas dos
metodologías, no buscaremos solamente optimizar la variable de estado sino
también la variable de control, la cual determina de alguna manera parte de la
conducta de la variable de estado, además cabe connotar que estas variables se
relacionan atreves de la ecuación de movimiento, que no es otra cosa que la
especificación dinámica de la restricción intertemporal de la variable de estado. A
continuación pasaremos a estudiar el control óptimo y finalmente la
programación dinámica.
1.-Control optimo
La teoría de control óptimo constituye una generalización del cálculo de
variaciones. Este método fue desarrollado por el matemático ruso L.S.
Pontryagin, afines de la década de los cincuenta. Este matemático desarrollo
la condición de primer orden al problema de control optimo, la cual se
denomina principio del máximo.
El control óptimo se ha venido aplicando en la formulación de problemas
económicos desde mediados de los años sesenta. Los trabajos pioneros
fueron los de Koopmans y Cass, en los cuales se modela el crecimiento
óptimo de una economía a lo largo del tiempo.
A diferencia del cálculo de variaciones, en el problema de control optimo
se incorpora tanto la variable de control (u) como la variable de estado (y).
Además las dos variables se encuentran relacionadas mediante la ecuación
de movimiento g(y,u,t).
33
El objetivo del control óptimo es determinar las trayectorias de las variables
de control y estado que optimicen el funcional objetivo.
Ejemplo:
𝑦𝑡+1 = 𝑔(𝑦𝑡 , 𝐶𝑡 ) = (1 + 𝑟)(𝑦𝑡 − 𝐶𝑡 )
34
Aplicación de la relación entre variables de estado y variables de control
𝑅(0) = 𝑅0 ; 𝑅0 fijo
A lo largo del tiempo estos recursos se irán agotando, (tasa de extracción-
determina la velocidad en la que se agota el recurso) regidos por su tasa de
extracción, que será establecida por los agentes económicos que toman
decisiones.
Tasa de extracción:
𝑑𝑅(𝑡) 𝑑𝑅(𝑡)
= −𝜀(𝑡) Además −𝜀(𝑡) influye en
𝑑𝑡 𝑑𝑡
Dónde:
𝑅 (𝑡) es la variable de estado 𝜀 (𝑡) es la variable de control
35
Consideramos un periodo de explotación 𝑡 ∈ [0, 𝑇] (horizonte temporal), en el
que cada instante del tiempo se obtiene un nivel de bienestar.
U0 U1 U2 U3 U4 U5 U6 U7 U8
0 1 2 3 4 5 6 7 8 …….. T
Ecuación de movimiento
𝑔 = Ecuación de movimiento
36
1.3.- Condición de primer orden: El principio
del máximo de L.S. Pontryagin
Este principio constituye la condición de primer orden, es decir es una
condición necesaria, para identificar las mejores trayectorias de estado y
control que resuelvan el problema planteado. Para poder emplearlo se
debe construir previamente la función Hamiltoniana.
𝑢∗ ∈< 𝑢1 , 𝑢2 >
37
B) Si H es una función lineal de 𝑢, se tendrá dos soluciones de contorno,
que exige lo siguiente:
H H
max max
u1 u2 u1 u2
𝑑𝐻 𝑑𝐻
𝑑𝑢
> 0 𝑢 ∗ = 𝑢2 𝑑𝑢
> 0 𝑢∗ = 𝑢1
𝑑𝐻
Ambos escenarios exigen la siguiente condición: 𝑑𝑢
≠0
𝑑𝐻
2) Ecuación de movimiento de estado: 𝑦̇ = 𝑑𝜆
𝑑𝐻
3) Ecuación de movimiento de coestado: 𝜆̇ = − 𝑑𝑦
Ejercicio:
Resolver el siguiente problema de control óptimo.
2
Maximizar: 𝑉 = ∫0 (3𝑦 − 2𝑢2 ) 𝑑𝑡
Sujeto a: 𝑦̇ = 3𝑢 − 1 𝑦(0) = 1
2
Además se verifica 𝑑𝑑𝑢𝐻2 = −4 < 0 lo que indica que el problema es un
caso de maximización.
Despejamos la ecuación encontrada con respecto a la variable de control
porque queremos hallar la variable de estado.
3 𝜆
𝑢= … … (2)
4
38
𝑑𝐻
Aplicamos la ecuación de movimiento de estado: 𝑦̇ =
𝑑𝜆
→ 𝑦̇ = 3𝑢 − 1 … … (3)
𝑑𝐻
Ecuación de movimiento de coestado: 𝜆̇ = − 𝑑𝑦 = −3 → 𝜆̇ = −3 … … (4)
𝜆𝑝 = 𝐾𝑡 𝜆𝑐 = 𝐴𝑒 𝑟𝑡
𝜆̇𝑝 = 𝐾 𝑟+0=0
𝐾 + 0(𝐾𝑡) = −3 𝑟=0
𝐾 + 0 = −3 𝜆𝑐 = 𝐴𝑒 0
𝐾 = −3 𝜆𝑐 = 𝐴
𝜆(𝑡) = 𝐴 − 3𝑡
𝜆(𝑡) = −3𝑡 + 𝐴 … … (5)
Queremos que las ecuaciones determinen “𝑢”, pero no es el caso por lo que
aplicamos las condiciones de transversalidad.
Condición de transversalidad: ∆𝑇 = 0 ; ∆𝑦𝑇 ≠ 0
Aplicamos la condición de 0 = −6 + 𝐾0
transversalidad
𝐾0 = 6 … … (8)
𝜆(𝑇) = −3𝑡 + 𝐾0
Remplazamos (8) en (5):
𝑇=2 𝜆(2) = 0
𝜆(𝑇) = −3𝑡 + 6 … … (9)
𝜆(2) = −3(2) + 𝐾0
Reemplazamos (9) en (2):
3 3 −9𝑡 9
𝑢 = 𝜆 → 𝑢 = (−3𝑡 + 6) 𝑢= + … … (10)
4 4 4 2
39
−27𝑡 2 25𝑡 −27𝑡 2 25𝑡
𝑦= + + 𝐾0 𝑦(𝑡) = + + 𝐾0
8 2 8 2
Resumen:
−27𝑡 2 25𝑡 −27(2)2 25(2)
𝑦(𝑡) = + +1 𝑦(2) = + +1
8 2 8 2
−9𝑡 9 −27
𝑢(𝑡) = + 𝑦(2) = + 25 + 1
4 2 2
2
−27𝑡 2 25𝑡 −9𝑡 9 2
𝑉 = ∫ [3 ( + + 1) − 2 ( + ) ] 𝑑𝑡
0 8 2 4 2
2
−81𝑡 2 75𝑡 81𝑡 2 81𝑡 81
𝑉=∫ [ + + 3 − 2( − + )] 𝑑𝑡
0 8 2 16 4 4
2
−81𝑡 2 75𝑡 81𝑡 2 81𝑡 81
𝑉=∫ [ + +3− + − ] 𝑑𝑡
0 8 2 8 2 2
2
−81𝑡 2 156𝑡 75
𝑉=∫ ( + − ) 𝑑𝑡
0 4 2 2
𝑉 = 27
Ejercicio:
4
Maximizar: 𝑉 = − ∫0 5𝑦𝑑𝑡
40
𝑑𝐻 𝜆 ≠ 𝑢 … … (2)
≠ 0 … … (2)
𝑑𝑢
Tenemos dos opciones:
Si: 𝜆 >0 u=1 Si: 𝜆 < 0 u = 3 … … . (4)
H H
min min
1 3 u 1 3 u
𝑑𝐻
Ecuación de movimiento de estado: 𝑦̇ =
𝑑𝜆
→ 𝑦̇ = 𝑦 + 𝑢
𝑑𝐻
Ecuación de movimiento de coestado: 𝜆̇ = − 𝑑𝑦 → 𝜆̇ = −(−5 + 𝜆)
𝜆̇ + 𝜆 = 5 𝜆̇ + 𝜆 = 5
𝜆𝑐 = 𝐴𝑒 𝑟𝑡 𝜆𝑝 = 𝐾 𝜆̇ = 0
𝜆̇ + 𝜆 = 0 0+𝐾 =5
𝑟+1=0 𝜆𝑝 = 𝐾 𝜆𝑝 = 5
𝑟 = −1 𝜆 = (𝑡) = 𝜆𝑐 + 𝜆𝑝
𝜆(𝑡) = 𝐴𝑒 −𝑡 + 5
𝑦(𝑇) = 𝑦𝑇 → 𝑦(4) = 𝑦𝑇 𝐴𝑒 −4 + 5 = 0 𝐴𝑒 −4 = −5
41
Remplazando (12) en (5) 𝑦̇ = 𝑦 + 3
Resolviendo:
𝑦̇ = 𝑦 + 3 𝑦 = 𝐵𝑒 𝑡 − 3 … … (13)
Sabemos:
𝑦(0) = 5 𝐵−3=5 → 𝐵=8
𝑢(𝑡) = 3
4 𝑉 = −2083.926001
𝑉 = − ∫ 5(8𝑒 𝑡 − 3)𝑑𝑡
0
Ejercicio:
1
Maximizar: 𝑉 = ∫0 ln(4𝑦𝑢) 𝑑𝑡
Construimos la Hamiltoniana:
𝐻 = ln(4𝑦𝑢) + 𝜆(4𝑦(1 − 𝑢)) 𝐻 = ln(4𝑦𝑢) + 𝜆(4𝑦 − 4𝑦𝑢)
𝑑𝐻 1 1
= − 4𝑦𝜆 𝑢= … … (1)
𝑑𝑢 𝑢 4𝑦𝜆
42
𝑑𝐻 1 𝑑2 𝐻 1
= − 4𝜆𝑦 =− 2
𝑑𝑢 𝑢 𝑑𝑢 2 𝑢
4𝑢 1
𝜆̇ = − ( + 𝜆(4 − 4𝑢)) 𝜆̇ = − − 4𝜆(1 − 𝑢) … … (3)
4𝑦𝑢 𝑦
1 1 𝜆̇ = −4𝜆
𝜆̇ = − − 4𝜆 (1 − )
𝑦 4𝑦𝜆
𝜆̇ + 4𝜆 = 0
1 1
𝜆̇ = − − 4𝜆 + 4𝜆 ( )
𝑦 4𝑦𝜆
𝜆𝑐 = 𝐴𝑒 𝑟𝑡 𝜆𝑃 = 𝐾 𝜆̇𝑃 = 0
𝑟 + 4 = 0 → 𝑟 = −4 0 + 4𝑘 = 0 → 𝑘 = 0
𝜆𝑐 = 𝐴0 𝑒 −4𝑡 𝜆𝑃 = 0
Solución general:
𝜆(𝑡) = 𝜆𝑐 + 𝜆𝑝 𝜆(𝑡) = 𝐴0 𝑒 −4𝑡 … … (4)
43
1 Pero: 𝜆(𝑡) = 𝐴0 𝑒 −4𝑡
𝑦̇ = 4𝑦 (1 − )
4𝑦𝜆
1
1 𝑦̇ − 4𝑦 = −
𝑦̇ = 4𝑦 − 𝐴0 𝑒 −4𝑡
𝜆
1 4𝑡
1 𝑦̇ − 4𝑦 = − 𝑒
𝑦̇ − 4𝑦 = − 𝐴0
𝜆
Obtenemos de esta manera una ecuación diferencial de primer orden con
coeficiente y termino variable. Por lo que procederemos a resolverla con el
método de coeficientes indeterminados.
Planteamos una solución de prueba parecida:
𝑦 = 𝑘𝑒 4𝑡 𝑦̇ = 4𝑘𝑒 4𝑡
𝑦̇ = 𝑘(4𝑒 4𝑡 𝑡 + 𝑒 4𝑡 )
44
𝑦𝑐 = 𝐴1 𝑒 𝑟𝑡 𝑦𝑐 = 𝐴1 𝑒 4𝑡
Pero: 𝐴1 = 1 𝐴0 = 1.16
4𝑡
𝑒 4𝑡 𝑡 𝜆(𝑡) = 1.16𝑒 −4𝑡
𝑦(𝑡) = 𝑒 −
1.16
Reemplazamos para hallar 𝑢:
1 1
𝑢= 𝑢=
4𝑦𝜆 𝑒 4𝑡 𝑡
4 (𝑒 4𝑡 − 1.16) (1.16𝑒 −4𝑡 )
1 1
𝑢= 𝑢=
4(1.16𝑒 0 − 𝑒 0 𝑡) 4.64 − 4𝑡
45
1
𝑢(𝑡) = ( )
4.64 − 4𝑡
46
𝑌
𝑌=
𝐿
Producción percápita, es la producción por cada unidad de la
→
población, o nivel de producción con que contribuye.
𝐾
𝑘=
𝐿
→Stock percápita es el stock de capital promedio que tiene cada
individuo en un instante del tiempo.
𝑌 = 𝑓(𝑘; 1) 𝑒𝑛 𝑔𝑒𝑛𝑒𝑟𝑎𝑙 𝑌 = 𝑓(𝑘) … … (2)
Características:
Productividad Marginal del Capital: Porque se supone que cuando
aumenta el capital en una unidad, la producción también aumenta, por lo
que su tasa decrecimiento será positiva.
𝑓′(𝐾) > 0
Condiciones de inada:
Y Y
k k
𝐶 = 𝐶(𝑡) 𝐼 = 𝐼(𝑡)
47
Consumo: Esla compra de bienes y servicios por parte de todos los agentes
económicos ajenos al estado, como empresas y consumidores.
Inversión: La inversión es toda variación del stock de capital y el monto de
depreciación para mantenerlo, es decir la inversión se orienta al incremento del
stock de capital y al remplazo de la maquinaria, formalmente podemos plantearlo
de la siguiente forma.
𝑑𝐾 𝑑𝑘
𝐼= + 𝛿𝐾 … … (2) = Inversión neta
𝑑𝑡 𝑑𝑡
Dónde: 𝛿𝑘 = Depreciación
𝐼= Inversión Bruta 𝛿 = Tasa de depreciación
El objetivo es expresar la demanda agregada en términos percápita, por lo tanto,
remplazamos la ecuación (2) en la ecuación (1):
𝐷𝐴 = 𝐶 + 𝐼 1 𝑑𝐾
𝑓(𝑘) = 𝑐 + + 𝛿𝑘 … … (3)
𝐿 𝑑𝑡
𝑑𝐾
𝐷𝐴 = 𝐶 + + 𝛿𝐾
𝑑𝑡 Observe:
Dividiendo por 𝐿: 𝐿𝑑𝐾 𝐾𝑑𝐿
−
𝑑 𝐾
( ) = 𝑑𝑡 2 𝑑𝑡
𝐷𝐴 𝐶 1 𝑑𝐾 𝛿𝐾 𝑑𝑡 𝐿 𝐿
= + +
𝐿 𝐿 𝐿 𝑑𝑡 𝐿 𝑑𝑘 1 𝑑𝐾 𝐾 𝑑𝐿
= −
1 𝑑𝐾 𝑑𝑡 𝐿 𝑑𝑡 𝐿2 𝑑𝑡
𝑑𝑎 = 𝑐 + + 𝛿𝑘
𝐿 𝑑𝑡 𝑑𝑘 1 𝑑𝐾 𝐾 1 𝑑𝐿
= −
Equilibrio: 𝑑𝑡 𝐿 𝑑𝑡 𝐿 𝐿 𝑑𝑡
𝑑𝑘 1 𝑑𝐾 1 𝑑𝐿
𝑌 = 𝑑𝑎 𝑌 = 𝑓(𝑘) = −𝑘
𝑑𝑡 𝐿 𝑑𝑡 𝐿 𝑑𝑡
Dónde:
𝑑𝐿 𝑑𝐿
→ Variación de la población
𝐿 𝐿
𝑑𝑡
→ Variación a lo largo del tiempo
𝑑𝐿
1 𝑑𝐿
𝐿 𝑑𝑡
= 𝐿
𝑑𝑡
=𝑛 → Tasa de crecimiento poblacional
Luego despejamos:
1 𝑑𝐾
= 𝑘̇ + 𝑛𝑘 … … (4)
𝐿 𝑑𝑡
48
Sustituyendo (4) en (3): 𝑘̇ = 𝑓(𝑘) − 𝑐 − (𝑛 + 𝛿)𝑘 … … (5)
Características:
Las utilidades marginales del consumo son positivas 𝑢′ (𝑐) > 0
Las utilidades marginales son decrecientes 𝑢′ ′(𝑐) < 0
Condiciones de inada: 𝑐→0
lim 𝑢′(𝑐) = 𝛼 ; lim 𝑢′(𝑐) = 0
𝑐→𝛼
0 ≤ 𝑐 ≤ 𝑓(𝑘)
Solución:
Primero planteamos nuestra función Hamiltoniana:
𝐻 = 𝑒 −𝜌𝑡 𝑢(𝑐) + 𝜆[𝑓(𝑘) − 𝑐 − (𝑛 + 𝛿)𝑘] … … (1)
49
Seguidamente aplicamos el principio del máximo de Pontryagin:
Se aprecia que la función Hamiltoniana, es una expresión no lineal con respecto
al consumo percápita (variable de control), por lo que la condición será la
siguiente:
𝑑𝐻
=0
𝑑𝑐
𝑑𝐻 𝑑𝐻
= 𝑒 −𝜌𝑡 𝑢′ (𝑐) + 𝜆(−1) = 𝑒 −𝜌𝑡 𝑢′ (𝑐) − 𝜆 … … (1)
𝑑𝑐 𝑑𝑐
𝑑2 𝐻
Comprobando si el funcional es un máximo o un mínimo: 𝑑𝑐 2
= 𝑒 −𝜌𝑡 𝑢′′ (𝑐) < 0
Ecuación de movimiento de λ:
𝑑𝐻
𝜆̇ = − → 𝜆̇ = −𝜆[𝑓 ′ (𝑐) − (𝑛 + 𝛿)] … … (4)
𝑑𝑘
Es posible reducir el análisis a solo dos ecuaciones, para tal efecto consideramos
la expresión dos, derivándola con respecto al tiempo:
𝜆 = 𝑒 −𝜌𝑡 𝑢′ (𝑐)
−𝜌𝑒 −𝜌𝑡 𝑢′ (𝑐) + 𝑒 −𝜌𝑡 𝑢′′ (𝑐) 𝑐̇ = −𝑒 −𝜌𝑡 𝑢′ (𝑐) [𝑓 ′ (𝑐) − (𝑛 + 𝛿)]
50
−𝜌 𝑢′ (𝑐) + 𝑢′′ (𝑐)𝑐̇ = −𝑢′(𝑐)[𝑓 ′ (𝑐) − (𝑛 + 𝛿)]
Despejando 𝑐̇:
𝜌 𝑢′ (𝑐) − 𝑢′ (𝑐)[𝑓 ′ (𝑐) − (𝑛 + 𝛿)] 𝑢′ (𝑐)
𝑐̇ = 𝑐̇ = (−)[𝑓 ′ (𝑐) − (𝑛 + 𝛿 + 𝜌)]
𝑢′′(𝑐) 𝑢′′(𝑐)
𝑢′ (𝑐) 𝑢′ (𝑐)
𝑐̇ = [𝜌 − 𝑓 ′ (𝑐) + (𝑛 + 𝛿)] 𝑐̇ = − [𝑓 ′ (𝑐) − (𝑛 + 𝛿 + 𝜌)]
𝑢′′(𝑐) 𝑢′′ (𝑐)
Para: 𝑘̇ = 0 c (𝑛 + 𝛿)𝑘
𝑐 = 𝑓(𝑘) − (𝑛 + 𝛿)𝑘
𝑑𝑘̇ 𝑑𝑘̇
= −1 → <0 k
𝑑𝑐 𝑑𝑐
Por consiguiente: c
↑ 𝑐 →↓ 𝑘̇ (+ 0 −)
Ojo:
Tenemos que derivar con respec-
to a la variable que más nos fa-
cilite el análisis, por ejemplo en
este caso con respeto al stock de
𝑘 sería más complicado:
𝑑𝑘̇
𝑑𝑘
= 𝑓 ′ (𝑘) − (𝑛 + 𝛿) - + 𝑘̇ = 0 k
51
Para: 𝑐̇ = 0 c (𝑛 + 𝛿 + 𝜌)𝑘
𝑢′ (𝑐)
0 = − 𝑢′′ (𝑐) [𝑓 ′ (𝑘) − (𝑛 + 𝛿 + 𝜌)] (𝑛 + 𝛿)𝑘
0 = 𝑓 ′ (𝑘) − (𝑛 + 𝛿 + 𝜌) 𝑓(𝑘)
𝑓 ′ (𝑘) = 𝑛 + 𝛿 + 𝜌
𝑢′ (𝑐)
Sea: 𝑐̇ = − 𝑢′′ (𝑐) [𝑓 ′ (𝑘) − (𝑛 + 𝛿 + 𝜌)]
𝑑𝑐̇ 𝑢′ (𝑐)
𝑑𝑘
= − 𝑢′′ (𝑐) [𝑓′′(𝑘)] k* k
𝑑𝑐̇ 𝑑𝑐̇
𝑑𝑘
=− → 𝑑𝑘
<0 c 𝑐̇ = 0
Por consiguiente:
↑ 𝑘 →↓ 𝑐̇ (+ 0 −)
Ojo:
𝑑𝑐̇
→ 𝑐𝑜𝑚𝑝𝑙𝑖𝑐𝑎𝑑𝑜 + k* - k
𝑑𝑐
+ -
c* E + -
𝑘̇
0 k* k
52
𝑐̇
2.-Programacion dinámica
La técnica de programación dinámica fue desarrollada a fines de la década
de los cincuenta, por el matemático norteamericano Richard Bellman. Este
matemático desarrollo el principio de optimalidad o ecuación de Bellman.
En términos generales el principio de optimalidad establece que la
trayectoria optima de la variable de control debe satisfacer la siguiente
propiedad: en cualquier periodo t del tiempo, dado un valor de la variable
de estado yt que depende delas decisiones tomadas previamente, el resto de
la secuencia de la variable de control (ut, ut+1, ut+2,… uT) también debe ser
óptimo. Apartir de este principio se desarrolla toda la teoría de
programación dinámica. Una aplicación a esta técnica la constituye el
modelo de crecimiento óptimo de Koopmans y Cass.
La programación dinámica, al igual que cualquier problema de optimización
dinámica, puede formularse tanto en tiempo discreto como en tiempo
continuo. Sin embargo, para resolver el problema en tiempo continuo, es
necesario tener un conocimiento previo de ecuaciones diferenciales
parciales. Por ello, con el fin de brindar una explicación clara y sencilla de
esta metodología, se estudiara el problema en su versión discreta
Al igual que en el control optimo se incorpora la variable de control (u)
como la variable de estado (y), y también las dos variables se encuentran
relacionadas mediante la ecuación de movimiento g(y,u,t).
El objetivo del control óptimo es determinar las secuencias de las variables
de control y estado que optimicen el funcional objetivo.
53
La programación dinámica como método de solución de problemas
de optimización, utiliza el análisis discreto del tiempo.
La programación dinámica resuelve un problema de T periodos o
etapas, mediante la resolución de T problemas de un periodo o
etapa.
La programación dinámica analiza un problema comenzando desde
la última etapa hasta llegar a la primera, en cada una de ellas
establece la mejor decisión.
20 E
B
15 17 19
25 15
10 C 16 F 21
A H
23 17
16 18 15
D G
54
El proceso de solución se inicia en el último periodo del horizonte
temporal de análisis, además dado que existen tres etapas, la programación
dinámica considerara tres problemas, de una etapa cada una.
Maximizar: 𝐽 = ∑𝑇−1
𝑖=0 𝐹[𝑥𝑡 , 𝑢𝑡 , 𝑡] + 𝑆[𝑥𝑡 ]
Con: 𝑥 0 𝑓𝑖𝑗𝑜 𝑢𝑡 ∈ Ω
Dónde:
55
𝑔 =Ecuación de movimiento 𝑢 = Variable de control
Ejercicio:
Hallar la secuencia optima de la variable de estado y de control que
permita minimizar el siguiente funcional.
Minimizar: 𝐽 = (𝑢0 − 1)2 + (𝑢1 − 2)2 + 2𝑥2
Sujeto a: 𝑥0 = 1 𝑥1 = 3𝑥0 + 2𝑢0 𝑥2 = 𝑥1 + 2𝑢1
𝐽1 {𝑥1 } = 4 + 2𝑥1
57
𝐽0 {𝑥0 } = 4 + 6𝑥0 − 4 + 4 = 6𝑥0 + 4
𝑥2 = 𝑥1 + 2𝑢1 = 1 + 2(0) = 1
𝑢0 = −1 𝑢1 = 0
𝐽 = 4 + 4 + 2 = 10
Ejercicio:
Hallar la secuencia optima de la variable de estado y de control que
permita minimizar el siguiente funcional.
Minimizar: 𝐽 = 𝑥0 𝑢0 + 𝑥1 𝑢1 + 𝑥2 2
Sujeto a: 𝑥𝑡+1 = 𝑥𝑡 𝑢𝑡 + 𝑢𝑡 2 ; ⩝ 𝑡 = 0; 1
58
𝑥1 = 3 𝑢1 = −1 𝑥2 = −3 + 1 = −2
𝑥1 = 3 𝑢1 = 0 𝑥2 = 0 + 0 = 0
𝑥1 = 3 𝑢1 = 1 𝑥2 = 3 + 1 = 4
𝑥1 = 0 𝑢1 = −1 𝑥2 = 0 + 1 = 1
𝑥1 = 0 𝑢1 = 0 𝑥2 = 0 + 0 = 0
𝑥1 = 0 𝑢1 = 1 𝑥2 = 0 + 1 = 1
Síntesis:
Variable de estado Valor
𝑥0 2
𝑥1 -1, 0, 3
𝑥2 -2; 0; 1; 2; 4
𝑥1 𝑢1 𝑥1 𝑢1 + 𝐽2 {𝑥1 𝑢1 + 𝑢1 2 }
-1 -1 1 + 𝐽{1 + 1} = 1 + 𝐽{2} = 1 + 4 = 5
-1 0 0 + 𝐽{0 + 0} = 0 + 𝐽{0} = 0 + 0 = 0
-1 1 0 + 𝐽{0 + 0} = −1 + 𝐽{0} = −1 + 0 = −1
0 -1 0 + 𝐽{0 + 1} = 0 + 𝐽{1} = 0 + 1 = 1
0 0 0 + 𝐽{0 + 0} = 0 + 𝐽{0} = 0 + 0 = 0
0 1 0 + 𝐽{0 + 1} = 0 + 𝐽{1} = 0 + 1 = 1
59
3 -1 −3 + 𝐽{−3 + 1} = −3 + 𝐽{−2} = −3 + 4 = 1
3 0 0 + 𝐽{0 + 0} = 0 + 𝐽{0} = 0 + 0 = 0
3 1 3 + 𝐽{3 + 1} = 3 + 𝐽{4} = 3 + 16 = 19
Solo tomamos los valores donde se minimiza porque eso es lo que nos pide
la ecuación de Bellman, en síntesis:
𝑥1 𝑢1 𝐽1 {𝑥1 }
-1 -1 1
0 0 0
0 3 0
Sabemos: 𝑥0 = 2 𝑢0 𝜖{−1; 0; 1}
𝑥0 𝑢0 𝐽0 {𝑥0 } = 𝑥0 𝑢0 + 𝐽0 {𝑥0 𝑢0 + 𝑢0 2 }
2 -1 −2 + 𝐽{−1} = −2 − 1 = −3
2 0 0 + 𝐽{0} = 0 + 0 = 0
2 1 2 + 𝐽{3} = 2 + 0 = 2
Entonces 𝐽0 {𝑥0 } = −3
𝑥0 = 2 𝑥1 = −1 𝑥2 = 0
𝑢0 = −1 𝑢1 = 1
Ejercicio:
Hallar la secuencia optima de la variable de estado y de control que
permita minimizar el siguiente funcional.
Minimizar: (𝑥1 − 10)2 + (𝑥2 − 15)2 + 𝑢0 + 𝑢1 + 𝑢2
60
Sujeto a: 𝑥𝑡+1 = 2𝑥𝑡 + 𝑢𝑡 ; 𝑡 = 0; 1; 2
Con: 𝑥0 = 6 𝑥3 = 20
𝑥3 = 20 1
𝑥2 = 10 − 𝑢2
2
𝑥3 = 2𝑥2 + 𝑢2
Remplazando 𝑥2 en el funcional
𝐽2 {𝑥2 } = 𝑚𝑖𝑛[(𝑥2 + 15)2 + 𝑢2 ]
𝑑[(5 + 0.5𝑢2 )2 + 𝑢2 ] 1
=0 𝑢 = −6
𝑑𝑢2 2 2
Aplicamos la C.S.O:
𝑑 2 [(5 + 0.5𝑢2 )2 + 𝑢2 ]
= 0.5
𝑑𝑢2 2
61
1
Si 𝑢2 = −12 𝑥2 = 10 − 𝑢2
2
1
𝑥2 = 10 − (−12) 𝑥2 = 16
2
Remplazando 𝑢2 en el funcional:
𝐽2 {𝑥2 } = [(5 + 0.5𝑢2 )2 + 𝑢2 ]
Sabemos 𝑥2 = 16 2𝑥1 + 𝑢1 = 16
𝑥2 = 2𝑥1 + 𝑢1 1
𝑥1 = 8 − 𝑢1
2
Remplazando 𝑥1 en el funcional
𝐽1 {𝑥1 } = 𝑚𝑖𝑛[(8 − 0.5𝑢1 − 10)2 + 𝑢1 − 11]
1
𝑥1 = 8 − (−6) 𝑥1 = 11
2
62
Remplazando 𝑢1 en el funcional:
𝐽1 {𝑥1 } = 𝑚𝑖𝑛[(2 + 0.5𝑢1 )2 + 𝑢1 − 11]
Sabemos 𝑥1 = 11 11 = 12 + 𝑢0
𝑥1 = 2𝑥0 + 𝑢0 𝑢0 = 11 − 12
11 = 2(6) + 𝑢0 𝑢0 = −1
Incorporando 𝑢0 en 𝐽0 {𝑥0 }
𝐽0 {𝑥0 } = 𝑚𝑖𝑛[𝑢0 − 16] 𝐽0 {𝑥0 } = [−1 − 16] = −17
𝑢0 = −1 𝑢1 = −6 𝑢2 = −12
20
16
11
-1 1 2 3 t
-6
-12
63
𝐽 = (𝑥1 − 10)2 + (𝑥2 − 15)2 + 𝑢0 + 𝑢1 + 𝑢2
𝐽 = 1 + 1 − 1 − 6 − 12 = −17
Ejercicio:
Hallar la secuencia optima de la variable de estado y de control que
permita minimizar el siguiente funcional:
3
𝑀𝑖𝑛 ∑[𝑥𝑡 2 + 𝑢𝑡 2 ]
𝑡=0
Sujeto a: 𝑥𝑡+1 = 𝑥𝑡 + 𝑢𝑡 ; 𝑡 = 0; 1; 2; 3
𝑥4 = 8 𝑥3 = 8 − 𝑢3
𝑑 2 [(8 − 𝑢3 )2 + 𝑢3 2 ]
=4
𝑑𝑢3 2
64
El 4 > 0 por lo que se corrobora que se está minimizando.
Si 𝑢3 = 4 𝑥3 = 8 − 𝑢3
𝑥3 = 8 − 4 𝑥3 = 4
Remplazando 𝑢3 en el funcional:
𝐽3 {𝑥3 } = 𝑚𝑖𝑛 [(8 − 𝑢3 )2 + 𝑢3 2 ] 𝐽3 {𝑥3 } = [(8 − 4)2 + 42 ] = 32
𝑥3 = 4 𝑥2 = 4 − 𝑢2
𝑥2 = 4 − 2 𝑥2 = 2
Remplazando 𝑢2 en el funcional:
𝐽2 {𝑥2 } = 𝑚𝑖𝑛[(4 − 𝑢2 )2 + 𝑢2 2 + 32] 𝐽2 {𝑥2 } = [(4 − 2)2 + 22 + 32] = 40
65
Observe según la ecuación de movimiento:
𝑥2 = 𝑥1 + 𝑢1 𝑥1 + 𝑢1 = 2
𝑥2 = 2 𝑥1 = 2 − 𝑢1
𝑥1 = 2 − 1 𝑥1 = 1
Remplazando 𝑢1 en el funcional:
𝐽1 {𝑥1 } = 𝑚𝑖𝑛[(2 − 𝑢1 )2 + 𝑢1 2 + 40] 𝐽1 {𝑥1 } = [(2 − 1)2 + 12 + 40] = 42
Si: 𝑥1 = 1 ˄ 𝑥0 = 0 𝑢0 = 1
Remplazando 𝑢0 𝑦 𝑥0 en el funcional:
𝐽0 {𝑥0 } = [02 + 12 + 42] = 43
𝑥0 = 0 𝑢0 = 1 𝐽0 {𝑥0 } = 43
𝑥1 = 2 𝑢1 = 1 𝐽1 {𝑥1 } = 42
66
𝑥2 = 2 𝑢2 = 2 𝐽2 {𝑥2 } = 40
𝑥3 = 4 𝑢3 = 4 𝐽3 {𝑥3 } = 32
𝑥4 = 8
𝑢0 𝑢1 𝑢2 𝑢3
67
𝑥0 𝑥1 𝑥2 𝑥3 𝑥4
Periodo 1 Periodo 2 Periodo 3 Periodo 4
𝑡=0 𝑡=1 𝑡=2 𝑡=3
Figura 6.5 Ejemplo con cuatro periodos
Sujeto a : 𝑥𝑡+1 = 𝑥𝑡 − 𝑢𝑡 ,
Con: 𝑥0 = 80,
𝑢𝑡 ∈ [0,10,20], 𝑝𝑎𝑟𝑎 𝑡 = 0,1,2,3.
𝑢𝑡 ≤ 𝑥𝑡 , 𝑝𝑎𝑟𝑎 𝑡 = 0,1,2,3.
68
𝑥3 ∈ {20,30,40,50,60,70,80}
La ecuación de Bellman correspondiente a este periodo será:
𝑚𝑎𝑥
𝐽3∗ [𝑥3 ] = 𝑢 ∈ {0,10,20}[𝜋{𝑥3 , 𝑢3 } + 𝐽4∗ {𝑥3 − 𝑢3 }]
3
Por tanto, las funciones 𝑢3∗ y 𝐽3∗ , están definida en la tabla 6.13, en función
de 𝑥3 :
𝑥3 𝑢3∗ 𝐽3∗ {𝑥3 }
80 20 40
70 20 30
60 10 15
50 10 5
40 10 0
30 0 -5
20 0 -5
Tabla 6.13 Funciones 𝑢3∗ y 𝐽3∗ {𝑥3 }
69
Periodo 3: sea 𝑥2 dado.
Por tanto, las funciones 𝑢2∗ y 𝐽3∗ están definidas en la tabla 6.15, en
función de 𝑥2
𝑥2 𝑢2∗ 𝐽3∗ 𝑥2
80 10 o 20 55
70 10 o 20 35
60 10 20
50 10 5
40 10 -5
Tabla 6.15 Funciones 𝑢2∗ y 𝐽3∗ 𝑥2
Las funciones 𝑢1∗ y 𝐽1∗ están definidas en la Tabla 6.17, en función de 𝑥1:
𝑥1 𝑢1∗ 𝐽1∗ 𝑥1
80 10 o 20 60
70 10 40
60 10 20
Tabla 6.17 Funciones 𝑢1∗ y 𝐽1∗ 𝑥1
72
73
74
Bibliografía:
Bonifaz, José Luis. y Lama, Ruy. (I999). Optimización dinámica y teoría
económica. Lima: Centro de investigación de la Universidad Del
Pacifico
Cerda, Emilio.(2001).Optimización dinámica. Prentice Hall. Madrid.
Yépez, Sara Gabriela.(2014). Carpeta de trabajo del curso de economía
matemática IV. Puno: Universidad Nacional Del Altiplano
75