Cálculo de Variaciones
Por: Humberto Calizaya Coila
El cálculo de variaciones tuvo sus orígenes en el siglo XVII, con los trabajos realizados de
Isaac Newton (Principia, 1687) y John Bernoulli (1696); sin embargo, su aplicación en el
campo económico recién se inició a partir de la década de los años 20 del siglo pasado
con los trabajos de Evans (1924), Ramsey (1928) y Hotelling (1931).
El cálculo de variaciones es una técnica para resolver problemas de optimización
dinámica en tiempo continuo, analizando trayectorias dinámicas de un tipo de variable,
la denominada variable de estado.
Las ideas principales del cálculo de variaciones se entenderán mediante el desarrollo del
siguiente caso:
Distancia entre dos puntos
Lo que se entiende hoy en día por Cálculo de Variaciones, nació con Johann Bernoulli, en
1696, a partir del problema de la braquistócrona. Si un pequeño objeto se desliza, por
acción de la gravedad, desde un punto A del plano, hasta otro punto B, a través de alguna
curva, entonces el tiempo empleado para ir desde A hasta B dependerá de la curva
elegida ¿cuál es la curva con el tiempo mínimo?
Para ilustrar esta idea, consideremos los puntos; 𝐴 = (2, 5) y 𝐵 = (7, 12) ¿Cuál será la
distancia mínima entre los dos puntos?1
Veamos la representación gráfica del problema:
1
Asumiendo que la superficie sea plana, la distancia mínima que une los puntos 𝐴 y 𝐵
será la longitud de una recta que los une, cuyo valor estará determinado por el
Teorema de Pitágoras:
𝐷 = √52 + 72 ≅ 8.6
y
12 𝑩
10
4 𝑨
t
0 1 2 3 4 5 6 7
El problema consiste en hallar una función 𝑦(𝑡) que una los puntos A y B; y muestre la
menor distancia entre ellas. Existirán innumerables funciones que cumplen las
condiciones inicial y final del problema, de las cuales solo se han mostrado tres de ellas.
Si asumimos que la trayectoria óptima sea la curva siguiente, entonces podemos elegir
un tramo de dicho recorrido.
y
12 𝑩
10
4 𝑨
t
0 1 2 3 4 5 6 7
Expandiendo este pequeño tramo para el análisis, se podrá identificar los siguientes
elementos:
𝑏
𝒅𝒏 𝒅𝒚
𝑎
𝒅𝒕
Las expresiones 𝑑𝑦 y 𝑑𝑡 representan las longitudes2 de los catetos y 𝑑𝑛 la distancia
aproximada del arco 𝑎𝑏. Cuanto más pequeño sea la longitud 𝑑𝑛, mas superpuesto estará
la longitud a la curva azul.
La distancia total 𝐷 que une los puntos 𝐴 y 𝐵 será el resultado de la sumatoria de las
“pequeñas” distancias 𝑑𝑛, dado que, en el análisis infinitesimal, el arco 𝑎𝑏 se
superpondrá a 𝑑𝑛.
¿Cuál es la distancia de 𝑑𝑛?
Según el teorema de Pitágoras podemos calcular 𝑑𝑛:
(𝑑𝑛)2 = (𝑑𝑦)2 + (𝑑𝑡)2
Dividiendo por (𝑑𝑡)2
𝑑𝑛 2 𝑑𝑦 𝑑𝑡
( ) = ( )2 + ( )2
𝑑𝑡 𝑑𝑡 𝑑𝑡
Y despejando 𝑑𝑛
1
𝑑𝑛 = (1 + 𝑦̇ 2 )2 𝑑𝑡
Luego, la distancia total 𝐷 que une los puntos 𝐴 y 𝐵 corresponde a la integral siguiente:
7 1
𝐷 = ∫ (1 + 𝑦̇ 2 )2 𝑑𝑡
2
Dado que se pretende hallar la distancia mínima total que une los puntos 𝐴 y 𝐵, el
problema de cálculo de variaciones quedara planteado de la siguiente manera:
7 1
𝑀𝑖𝑛𝑖𝑚𝑖𝑧á𝑟 𝐷 = ∫ (1 + 𝑦̇ 2 )2 𝑑𝑡
2
𝑆𝑢𝑗𝑒𝑡𝑜 𝑎: 𝑦(2) = 5
𝑦(7) = 12
La técnica de cálculo de variaciones permitirá hallar la función dinámica 𝑦(𝑡) y el valor de
la distancia mínima 𝐷.
2
El termino 𝑑𝑦 muestra el diferencial de la variable 𝑦, es decir la variación existente entre dos valores
distintos de la variable 𝑦, por ejemplo; si 𝑦1 = 3 y 𝑦2 = 4 entonces 𝑑𝑦 = 𝑦2 − 𝑦1 = 1. De manera
similar debe interpretarse los términos 𝑑𝑡 y 𝑑𝑛.
Ejemplo 2.1
Los ingresos 𝐼 y costos 𝐶 de una empresa, dependen de la producción 𝑄 y de la tasa de
variación de producción 𝑄̇ de la forma siguiente:
𝐼(𝑄, 𝑄̇ ) = 𝑄 + 0.5𝑄̇ 2
𝐶(𝑄, 𝑄̇ ) = 0.5𝑄 + 2𝑄̇ 2
La empresa maximiza el valor presente de las ganancias totales obtenidas en el periodo
de operación, utilizando una tasa de descuento del 10% y además la producción en el año
10, debe ser igual a 5. Se pide formular el problema de cálculo de variaciones para la
empresa.
Solución
La función de beneficios, en valor presente, para cada instante del tiempo 𝑡 es:
𝑒 −𝜌𝑡 𝜋(𝑄, 𝑄̇ ) = 𝑒 −𝜌𝑡 [𝐼(𝑄, 𝑄̇ ) − 𝐶(𝑄, 𝑄̇ )] = 𝑒 −𝜌𝑡 (0.5𝑄 − 1.5𝑄̇ 2)
El periodo de análisis comprende desde 𝑡 = 0 hasta 𝑡 = 10, por lo tanto, los beneficios
acumulados en valor presente resultan de la sumatoria de los beneficios actualizados en
cada momento durante el horizonte temporal de operación de la empresa.
10
Π[𝑄] = ∫ 𝑒 −𝜌𝑡 𝜋(𝑄, 𝑄̇ ) 𝑑𝑡
0
10
Π[𝑄] = ∫ 𝑒 −0.1𝑡 (0.5𝑄 − 1.5𝑄̇ 2 ) 𝑑𝑡
0
Además; en el instante 𝑡 = 0 la producción es nula, y en el instante 𝑡 = 10 será 5
unidades.
La empresa pretende maximizar los beneficios actuales, por lo que tendrá que resolver
el problema siguiente:
10
Maximizar Π[𝑄] = ∫ 𝑒 −0.1𝑡 (0.5𝑄 − 1.5𝑄̇ 2 ) 𝑑𝑡
0
Sujeto a ∶ 𝑄(0) = 0
𝑄(10) = 5
En el problema planteado es necesario distinguir tres conceptos muy importantes:
a) La función intermedia
𝑒 −𝜌𝑡 𝜋(𝑄, 𝑄̇ ) = 𝑒 −0.1𝑡 (0.5𝑄 − 1.5𝑄̇ 2 )
Representa el beneficio, en valor presente, que obtiene la empresa en cada instante
del periodo de operación.
𝑒 −𝜌𝑡 𝜋(𝑄, 𝑄̇ )
b) El funcional
Representa el beneficio total, en valor presente, que obtiene la empresa durante el
periodo de operación.
10
∫ 𝑒 −0.1𝑡 (0.5𝑄 − 1.5𝑄̇ 2 ) 𝑑𝑡
0
c) La variable de estado
Es la producción del bien 𝑄 que obtiene la empresa en cada instante del tiempo:
𝑄 = 𝑄(𝑡)
El problema del Cálculo de Variaciones
Para entender los elementos básicos del problema de cálculo de variaciones,
consideremos un horizonte temporal de análisis 𝑡 ∈ [0, 𝑇] y las condiciones iniciales (el
punto de partida) y final (el punto de llegada). Se busca encontrar una función dinámica
para la variable de estado 𝑦(𝑡) que optimice el valor del funcional 𝑉[𝑦].
La formulación matemática, consiste en optimizar (maximizar o minimizar) un funcional
sujeto a restricciones constituidas por las condiciones inicial y final.
𝑇
𝑂𝑝𝑡𝑖𝑚𝑖𝑧𝑎𝑟 𝑉[𝑦] = ∫ 𝑓(𝑦̇ , 𝑦, 𝑡) 𝑑𝑡
0
𝑆𝑢𝑗𝑒𝑡𝑜 𝑎 𝑦(0) = 𝑦0 ; (𝑦0 𝑑𝑎𝑑𝑜)
𝑦 (𝑇 ) = 𝑦 𝑇
Donde; 𝑉[𝑦] es el funcional, 𝑓(𝑦̇ , 𝑦, 𝑡) la función intermedia, 𝑦 = 𝑦(𝑡) la variable de
𝑑𝑦(𝑡)
estado, 𝑦̇ = la tasa de cambio de la variable de estado, 𝑡 el tiempo, [0, 𝑇] el periodo
𝑑𝑡
de análisis, 𝑇 el período final de dicho horizonte temporal, 𝑦(0) = 𝑦0 la condición inicial
y 𝑦(𝑇) = 𝑦𝑇 la condición final.
Planteado así el problema de cálculo de variaciones, puede resolverse utilizando la
metodología siguiente:
Paso I : Ecuación de Euler, como condición de primer orden.
Paso II : Condición de transversalidad
Paso III : Condiciones inicial y final.
Paso IV : Condiciones de segundo orden.
La Ecuación de Euler-Lagrange
Es la condición de primer orden, o también denominada condición necesaria de
optimalidad, que se utiliza para seleccionar el conjunto factible de trayectorias dinámicas
de estado. Cada trayectoria, del espacio factible, es considerada una candidata a resolver
el problema de cálculo de variaciones. La aplicación de la “Ecuación de Euler-Lagrange”
requiere del conocimiento previo de la función intermedia.
𝑓 = 𝑓(𝑦̇ , 𝑦, 𝑡)
Se define la ecuación de Euler-Lagrange en los términos siguientes:
𝑑
𝑓𝑦 = (𝑓 )
𝑑𝑡 𝑦̇
¿Cuáles son las características de la ecuación de Euler?
Analizaremos las características de la ecuación de Euler. Al derivar parcialmente, la
función intermedia con respecto a 𝑦 e 𝑦̇ se obtiene:
𝜕𝑓
= 𝑓𝑦 = 𝑓𝑦 (𝑦̇ , 𝑦, 𝑡)
𝜕𝑦
𝜕𝑓
= 𝑓𝑦̇ = 𝑓𝑦̇ (𝑦̇ , 𝑦, 𝑡)
𝜕𝑦̇
Ahora derivamos totalmente la función 𝑓𝑦̇ con respecto al tiempo 𝑡.
𝑑 𝜕𝑓𝑦̇ 𝜕𝑦̇ 𝜕𝑓𝑦̇ 𝜕𝑦 𝜕𝑓𝑦̇ 𝜕𝑡
(𝑓𝑦̇ ) = + +
𝑑𝑡 𝜕𝑦̇ 𝜕𝑡 𝜕𝑦 𝜕𝑡 𝜕𝑡 𝜕𝑡
Y denotamos de la forma siguiente:
𝑑
(𝑓 ) = 𝑓𝑦̇ 𝑦̇ 𝑦̈ + 𝑓𝑦̇ 𝑦 𝑦̇ + 𝑓𝑦̇ 𝑡
𝑑𝑡 𝑦̇
Incorporamos los resultados en la ecuación de Euler, para obtener una versión
desarrollada del siguiente tipo:
𝑓𝑦 = 𝑓𝑦̇ 𝑦̇ 𝑦̈ + 𝑓𝑦̇ 𝑦 𝑦̇ + 𝑓𝑦̇ 𝑡
La estructura matemática presenta el termino 𝑦̈ , que resulta ser la segunda derivada
parcial de la variable 𝑦 con respecto a 𝑡; además los términos 𝑦̇ e 𝑦̈ son de grado uno.
Estas observaciones muestran que la ecuación de Euler, es una ecuación diferencial lineal
de segundo orden, cuya solución será la función 𝑦 = 𝑦(𝑡). Además, observando los
términos 𝑓𝑦̇ 𝑦̇ y 𝑦̈ podemos deducir que la función intermedia y la variable de estado
deben ser doblemente diferenciables.
Ejemplo 1
Dado el problema de cálculo de variaciones:
2
𝑂𝑝𝑡𝑖𝑚𝑖𝑧𝑎𝑟 𝑉 [𝑦] = ∫ 𝑒 −0.5𝑡 (𝑦 − 𝑦 2 − 2𝑦̇ 2 )𝑑𝑡
0
𝑆𝑢𝑗𝑒𝑡𝑜 𝑎 𝑦(0) = 0
𝑦(2) = 5
La función intermedia es
𝑓 = 𝑒 −0.5𝑡 (𝑦 − 𝑦 2 − 2𝑦̇ 2 )
La condición de primer orden (ecuación de Euler) relevante es la siguiente:
𝑑
𝑓𝑦 = (𝑓 )
𝑑𝑡 𝑦̇
De la función intermedia se obtienen los componentes de la ecuación de Euler:
𝑓𝑦 = 𝑒 −0.5𝑡 (1 − 2𝑦)
𝑓𝑦̇ = 𝑒 −0.5𝑡 (−4𝑦̇ )
𝑑
(𝑓 ) = −0.5𝑒 −0.5𝑡 (−4𝑦̇ ) + 𝑒 −0.5𝑡 (−4𝑦̈ )
𝑑𝑡 𝑦̇
Sustituimos en la ecuación de Euler
𝑒 −0.5𝑡 (1 − 2𝑦) = −0.5𝑒 −0.5𝑡 (−4𝑦̇ ) + 𝑒 −0.5𝑡 (−4𝑦̈ )
Simplificando
4𝑦̈ − 2𝑦̇ − 2𝑦 = −1
La ecuación de Euler es una ecuación diferencial de segundo orden, cuya solución es la
función dinámica
𝑦(𝑡) = 0.5 + 𝐴𝑒 −0.5𝑡 + 𝐵𝑒 𝑡
Aplicamos la condición inicial:
𝑦(0) = 0 → 𝐴 + 𝐵 = −0.5
Y la condición final:
𝑦(2) = 5 → 𝐴𝑒 −1 + 𝐵𝑒 2 = 4.5
Es necesario resolver de manera simultáneamente ambas ecuaciones obtenidas para
encontrar los valores de las constantes.
𝐴 ≅ −1.17
𝐵 ≅ 0.67
Los resultados muestran que la trayectoria de estado óptima será
𝑦(𝑡) = −1.17𝑒 −0.5𝑡 + 0.67𝑒 𝑡 + 0.5
El valor óptimo del funcional se consigue, utilizando la integral definida:
2
𝑉 [𝑦] = ∫ 𝑒 −0.5𝑡 (𝑦 − 𝑦 2 − 2𝑦̇ 2 )𝑑𝑡
0
2
𝑉[𝑦] = ∫ 𝑒 −0.5𝑡 ((−1.17𝑒 −0.5𝑡 + 0.67𝑒 𝑡 + 0.5) − (−1.17𝑒 −0.5𝑡 + 0.67𝑒 𝑡 + 0.5)2
0
− 2(0.585𝑒 −0.5𝑡 + 0.67𝑒 𝑡 )2 )𝑑𝑡
𝑉[𝑦] = −18.79
En el horizonte temporal de análisis 𝑡 ∈ [0,2] la mejor trayectoria de la variable de estado
es la función 𝑦(𝑡) = −1.17𝑒 −0.5𝑡 + 0.67𝑒 𝑡 + 0.5 que permite alcanzar un valor optimo
del funcional de 𝑉[𝑦] = −18.79
Ejemplo 2
Resolver
1
𝑀𝑎𝑥𝑖𝑚𝑖𝑧𝑎𝑟 𝑉[𝑦] = ∫ (𝑦̇ 2 − 2𝑦𝑦̇ + 10𝑡𝑦)𝑑𝑡
0
𝑆𝑢𝑗𝑒𝑡𝑜 𝑎 𝑦(0) = 1
𝑦(1) = 2
La función intermedia de este problema es
𝑓 = 𝑦̇ 2 − 2𝑦𝑦̇ + 10𝑡𝑦
Luego procedemos a encontrar las expresiones que conforman la ecuación de Euler
𝑓𝑦 = −2𝑦̇ + 10𝑡
𝑓𝑦̇ = 2𝑦̇ − 2𝑦
𝑑
(𝑓 ) = 2𝑦̈ − 2𝑦̇
𝑑𝑡 𝑦̇
De esta manera, l ecuación de Euler resulta
𝑑
𝑓𝑦 = (𝑓 )
𝑑𝑡 𝑦̇
−2𝑦̇ + 10𝑡 = 2𝑦̈ − 2𝑦̇
Simplificando
𝑦̈ = 5𝑡
Resolviendo
5
𝑦̇ = 𝑡 2 + 𝑏
2
5
𝑦 = 𝑡 3 + 𝑏𝑡 + 𝑎
6
La trayectoria de estado se expresa por la función
5
𝑦(𝑡) = 𝑎 + 𝑏𝑡 + 𝑡 3
6
Incorporando la condición inicial
𝑦(0) = 1 → 𝑎=1
Incorporando la condición final
5 1
𝑦(1) = 2 → 1+𝑏+ =2 → 𝑏=
6 6
La trayectoria óptima que maximiza el funcional es:
1 5
𝑦 (𝑡 ) = 1 + 𝑡 + 𝑡 3
6 6
El máximo valor asociado al funcional para la trayectoria óptima resulta
1
52
𝑉 [𝑦] = ∫ (𝑦̇ 2 − 2𝑦𝑦̇ + 10𝑡𝑦)𝑑𝑡 =
0 9
Donde:
1 5
𝑦 = 1 + 𝑡 + 𝑡3
6 6
5 1
𝑦̇ = 𝑡 2 +
2 6