Documentos de Académico
Documentos de Profesional
Documentos de Cultura
A diferencia del control óptimo, no es tan sencillo hallar una solución analítica de un problema de
programación dinámica. Dadas unas condiciones llamadas de primer orden, se pueden obtener
características cualitativas sobre el proceso de optimización intertemporal que enfrentan los agentes.
Si se tiene formas funcionales específicas de la ecuación de movimiento y la función de retorno, se
tendrán soluciones analíticas simples del problema (1), caso contrario las trayectorias de las
variables de control y de estado se obtienen mediante métodos numéricos y computacionales.
𝑚𝑎𝑥𝑖𝑚𝑖𝑧𝑎𝑟 − ∑ 𝑢𝑘2
𝑘=0
𝑇
∑ 𝑢𝑘 = 𝐶
𝑠𝑢𝑗𝑒𝑡𝑜 𝑎 , 𝑘 = 0, … , 𝑇
𝑘=0
𝑢𝑘 ≥ 0
Para expresar el problema en la forma (9) definamos:
𝑇
𝑦𝑡 = ∑ 𝑢𝑘
𝑘=𝑡
𝑚𝑎𝑥𝑖𝑚𝑖𝑧𝑎𝑟 − ∑ 𝑢𝑘2
𝑘=0
𝑦𝑡+1 = 𝑦𝑡 − 𝑢𝑡
𝑠𝑢𝑗𝑒𝑡𝑜 𝑎 𝑦0 = 𝑐
𝑦𝑇+1 = 0
La ecuación de Bellman de este problema es:
𝑉𝑡 (𝑦𝑡 ) = 𝑚𝑎𝑥𝑖𝑚𝑖𝑧𝑎𝑟[−𝑢𝑡2 + 𝑉𝑡+1 (𝑦𝑡+1 )]
𝑦𝑡+1 = 𝑦𝑡 − 𝑢𝑡
𝑦0 = 𝐶, 𝑦𝑇+1 = 0
𝑠𝑢𝑗𝑒𝑡𝑜 𝑎 𝑦𝑇 𝑑𝑎𝑑𝑜
𝑢𝑡 ≥ 0
La ecuación de Euler es:
′
−2𝑢𝑡 − 𝑉𝑡+1 (𝑦𝑡+1 ) = 0
Las otras condiciones son las siguientes:
𝑉𝑡′ (𝑦𝑡 ) = 𝑉𝑡+1
′
(𝑦𝑡+1 )
𝑦𝑡+1 = 𝑦𝑡 − 𝑢𝑡
Usando la primera y la segunda ecuación, tenemos:
𝑉𝑡′ (𝑦𝑡 ) = −2𝑢𝑡
Tomando un período futuro:
′ (
𝑉𝑡+1 𝑦𝑡+1 ) = −2𝑢𝑡+1
Usando la segunda ecuación, tenemos:
𝑢𝑡 = 𝑢𝑡+1
𝑦𝑡+1 = 𝑦𝑡 − 𝑢𝑡
Tenemos un sistema de ecuaciones en diferencias, el cual lo vamos a escribir como una ecuación en
diferencias de 2º orden. Construimos la ecuación
𝑦𝑡+2 = 𝑦𝑡+1 − 𝑢𝑡
Restando estas dos últimas ecuaciones tenemos:
𝑦𝑡+2 − 2𝑦𝑡+1 + 𝑦𝑡 = 0
La ecuación característica de esta ecuación homogénea es:
𝜆2 − 2𝜆 + 1 = 0 ⇔ (𝜆 − 1)2 = 0
Tenemos una raíz doble 𝜆 = 1. La solución general de la ecuación es:
𝑦𝑡 = 𝑐1 + 𝑐2 𝑡
Usando las condiciones inicial y terminal:
𝐶 = 𝑦0 = 𝑐1
0 = 𝑦𝑇+1 = 𝐶 + 𝑐2 (𝑇 + 1)
𝐶
𝑐2 = −
𝑇+1
De este modo,
𝐶
𝑦𝑡 = 𝐶 − 𝑡
𝑇+1
Además,
𝐶
0 = 𝑦𝑇+1 = 𝑦𝑇 − 𝑢 𝑇 = 𝐶 − 𝑇 − 𝑢𝑇
𝑇+1
Por tanto,
𝐶
𝑢𝑇 = = 𝑢 𝑇−1 = ⋯ = 𝑢0
𝑇+1
Ejemplo:
Una compañía minera desea maximizar el valor presente de sus ganancias netas a lo largo del
período de tiempo 𝑡 = 0, … , 𝑇 + 1. El precio de mercado del mineral extraído está dado por p.
Denotando por 𝑢𝑡 la producción (extracción) y 𝑦𝑡 la reservas restantes en el período t, el costo de
extracción está dado por:
2𝑢𝑡2
𝑐𝑡 =
𝑦𝑡
y las reservas iniciales son 𝑦0 = 600 toneladas. Suponiendo que no hay descuento temporal,
plantear el problema como un problema de programación dinámica y resolverlo.
Solución:
El problema se plantea como sigue:
𝑇
2𝑢𝑡2
𝑀𝑎𝑥𝑖𝑚𝑖𝑧𝑎𝑟 ∑ (𝑝𝑢𝑡 − )
𝑦𝑡
𝑡=0
𝑦𝑡+1 = 𝑦𝑡 − 𝑢𝑡
𝑠𝑢𝑗𝑒𝑡𝑜 𝑎 𝑦0 = 600
La ecuación de Bellman está dada por:
2𝑢𝑡2
𝑉𝑡 (𝑦𝑡 ) = max {(𝑝𝑢𝑡 − ) + 𝑉𝑡+1 (𝑦𝑡+1 )}
𝑦𝑡
𝑠𝑢𝑗𝑒𝑡𝑜 𝑎 𝑦𝑡 = 𝑦𝑡 − 𝑢𝑡 , 𝑦0 = 600
La ecuación de Euler es:
4𝑢𝑡 ′ (
𝑝− − 𝑉𝑡+1 𝑦𝑡+1 ) = 0 (𝑎)
𝑦𝑡
Además,
2𝑢𝑡2
𝑉𝑡′ ′
= 2 + 𝑉𝑡+1 (𝑦𝑡+1 ) (𝑏)
𝑦𝑡
′ (
𝑉𝑇+1 𝑦𝑇+1 ) = 0 (𝑐)
pues en el último período 𝑦𝑇+1 = 𝑦𝑇 − 𝑢 𝑇
Supongamos que 𝑇 = 2, entonces la firma suspende su producción en 𝑇 = 3 y se tiene que 𝑉3′ = 0
Sustituyendo en la ecuación de (a) para 𝑡 = 2:
4𝑢2 𝑢2 𝑝
𝑝− =0⇒ =
𝑦2 𝑦2 4
Sustituyendo en la ecuación (b) para 𝑡 = 2:
2𝑢22 𝑝2 𝑝2
𝑉2′ = 2 = 2( ) =
𝑦2 16 8
𝑢1 8𝑝−𝑝2
Como = , reemplazamos 𝑦1 y despejamos 𝑢1 :
𝑦1 32
2
8𝑝 − 𝑝2 8𝑝 − 𝑝2 𝑝2
𝑢1 = [ ] {600 − 150 [𝑝 − 2 ( ) − ]}
32 32 8
2
𝑝 8𝑝 − 𝑝2 𝑝2 8𝑝 − 𝑝2
𝑢2 = {600 − 150 [𝑝 − 2 ( ) − ]} [1 − ]
4 32 8 32
Como 𝑦𝑡+1 = 𝑦𝑡 − 𝑢𝑡 , sustituimos para 𝑡 = 2:
2
8𝑝 − 𝑝2 𝑝2 8𝑝 − 𝑝2 𝑝
[𝑝
𝑦3 = {600 − 150 − 2 ( ) − ]} [1 − ] [1 − ]
32 8 32 4
′
1
𝑉𝑡+1 = (∗)
𝛼𝛽𝑐𝑡
A partir de la segunda ecuación:
1 1
𝑉𝑡′ = 𝛼𝛽 ( )=
𝛼𝛽𝑐𝑡 𝑐𝑡
Adelantando un período:
′
1
𝑉𝑡+1 = (#)
𝑐𝑡+1
Igualando las ecuaciones (*) y (#):
1 1
− 𝛼𝛽 = 0 ⇒ 𝑐𝑡+1 − 𝛼𝛽𝑐𝑡 = 0
𝑐𝑡 𝑐𝑡+1
Tenemos el sistema de ecuaciones en diferencias:
𝑐𝑡+1 − 𝛼𝛽𝑐𝑡 = 0
𝑠𝑡+1 − 𝛼𝑠𝑡 = −𝛼𝑐𝑡
La ecuación característica de la primera ecuación es:
𝑟 − 𝛼𝛽 = 0 ⇒ 𝑟 = 𝛼𝛽
La solución general de la primera ecuación es:
𝑐𝑡 = 𝑐1 (𝛼𝛽 )𝑡
La segunda ecuación queda:
𝑠𝑡+1 − 𝛼𝑠𝑡 = −𝛼𝑐1 (𝛼𝛽 )𝑡
La ecuación característica de la ecuación homogénea es:
𝑟−𝛼 = 0⇒𝑟 =𝛼
La solución general de la ecuación homogénea es:
𝑠𝑡 = 𝑐2 (𝛼 )𝑡
Una ecuación particular para la segunda ecuación es: 𝑠̅𝑡 = 𝐴(𝛼𝛽 )𝑡
Reemplazando en la ecuación:
𝐴(𝛼𝛽 )𝑡+1 − 𝛼𝐴(𝛼𝛽 )𝑡 = −𝛼𝑐1 (𝛼𝛽 )𝑡
𝐴(𝛼𝛽 ) − 𝛼𝐴 = −𝛼𝑐1
𝐴𝛽 − 𝐴 = −𝑐1
𝑐1
𝐴=
1−𝛽
La solución general es:
𝑐1
𝑠𝑡 = 𝑐2 𝛼 𝑡 + (𝛼𝛽 )𝑡
1−𝛽