Está en la página 1de 12

Introduccion a la Investigacion en Matematicas

UNA BREVE INTRODUCCI

ON AL C

ALCULO DE
VARIACIONES
EDUARDO MART

INEZ
Resumen. El objetivo de estas notas es proporcionar un introducci on al calcu-
lo de variaciones, de manera que uno pueda intuir las ideas que hay detras del
Principio del Maximo de Pontryagin.
1. C alculo de Variaciones
Historicamente, el Calculo de Variaciones tuvo una gran relevancia en el desa-
rrollo del Calculo en el siglo XVIII. El primer problema relacionado con el calculo
variacional fue propuesto y resuelto por Newton en 1694. Se trata de determinar
la forma mas aerodinamica posible de una supercie de revolucion, es decir la que
presenta menor resistencia al movimiento.
Quizas el problema mas famoso es el de la braquistocrona, que fue propuesto por
Jean Bernoulli en 1696, como reto a otros matematicos de la epoca, y en particular
a su hermano Jacques. Tanto ambos hermanos Bernoulli como Newton, LHospital
y Leibnitz encontraron la solucion correcta, y todas ellas fueron publicadas en mayo
de 1697. Este problema, as como el de la catenaria y el de las geodesicas del plano,
que tuvieron gran importancia en su epoca, se presentan a continuacion.
La braquistocrona. Conectamos dos puntos del plano mediante un alambre de forma
curva. Insertamos una cuenta en el alambre y la colocamos en el punto inicial. Al
soltarla, la cuenta empieza a bajar y llega al otro punto en un cierto tiempo. Es
claro que dicho tiempo depende de la forma que demos al alambre. Buscamos la
forma del alambre que hace que el tiempo empleado por la cuenta para recorrerla
sea mnimo.
Denotemos, como antes, los puntos considerados por (x
0
, y
0
) y (x
1
, y
1
). Si con-
sideramos la longitud del arco del alambre y denotamos por v(s) la velocidad de la
cuenta cuando hemos recorrido s unidades de longitud sobre el alambre, entonces
el tiempo empleado es
T(y) =

L
0
ds
v(s)
.
Si parametrizamos la curva por la variable x, y = y(x), entonces el elemento de
arco es ds =

1 +y

(x)
2
dx y la velocidad podemos relacionarla con la altura por
medio de la energa
c =
1
2
mv(x)
2
+mgy(x),
donde la constante c = mgy
0
, es la energa inicial (suponiendo que soltamos la
cuenta en x
0
con velocidad inicial v(x
0
) nula). Despejando, obtenemos
v(x) =

2g

c
mg
y(x) =
1

2g

y
0
y(x)
Date: Febrero 2008.
2000 Mathematics Subject Classication. 49S05, 49K15, 58D15, 70H25, 49J15.
Key words and phrases. Sistemas de Control, Calculo variacional, Control

Optimo.
http://andres.unizar.es/
~
emf.
1
2 EDUARDO MART

INEZ
y sustituyendo llegamos a
T(y) =
1

2g

x
1
x
0

1 +y

(x)
2
y
0
y(x)
dx
Igual que en los otros casos la funcion y debe satisfacer la condicion de extremos
jos y(x
0
) = y
0
e y(x
1
) = y
1
.
Deniendo la funcion u(x) = y
0
y(x) podemos reescribir la funcion a minimizar
como

T(u) =

x
1
x
0

1 +u

(x)
2
u(x)
dx
siendo

T(u) =

2gT(y). La funcion u debe satisfacer las condiciones de contorno
u(x
0
) = 0 y u(x
1
) = y
0
y
1
.
Geodesicas del plano. Consideremos dos puntos del plano y buscamos la curva que
conecta dichos puntos y tiene longitud mnima. Si las coordenadas de dichos puntos
son (x
0
, y
0
) y (x
1
, y
1
) y parametrizamos la curva por la variable x, y = y(x) entonces
queremos minimizar
L(y) =

x
1
x
0

1 +y

(x)
2
dx
entre todas las curvas y = y(x) con extremos jos y(x
0
) = y
0
e y(x
1
) = y
1
.
Ecuaciones de Euler. Todos los problemas considerados anteriormente tienen la
forma general que se expone a continuacion. Sean (x
0
, y
0
) y (x
1
, y
1
) dos puntos
del plano. De entre todas las funciones y = y(x) que satisfacen una condicion de
extremos jos, y(x
0
) = y
0
e y(x
1
) = y
1
, hallar aquellas que minimizan el funcional
J(y) =

x
1
x
0
(x, y, y

) dx,
donde es una funcion conocida. Encontraremos condiciones necesarias que debe
satisfacer una funcion para ser una solucion.
El metodo empleado es similar al que se usa en el calculo diferencial para en-
contrar mnimos de funciones: si F(x) tiene un mnimo en x
0
, entonces para cada
direccion v la funcion F(x
0
+ v) tiene un mnimo en = 0, por lo que
F

(x
0
; v) =
d
d
F(x
0
+ v)[
=0
= 0, es decir la derivada direccional de F en x
0
en
cualquier direccion v debe ser nula.
Supongamos que y =
0
(x) es una funcion que satisface las condicion de extremos
jos y que minimiza el funcional
J() =

x
1
x
0
(x, (x),

(x)) dx,
Tomamos una funcion w(x) tal que w(x
0
) = w(x
1
) = 0, de forma que

(x) =

0
(x) + w(x), tambien satisface la condicion de extremos jos. Si evaluamos el
funcional en y =

y derivamos con respecto a


d
d
J(
0
+w)

=0
,
CALCULO DE VARIACIONES 3
obtenemos
0 =
d
d

=0

x
1
x
0
(x,
0
+w,

0
+w

) dx
=

x
1
x
0
d
d
(x,
0
+w,

0
+w

=0
dx
=

x
1
x
0

y
w +

y

dx
=

x
1
x
0

y
w +
d
dx

d
dx

dx
=

x
1
x
0

y
w
d
dx

dx +

x
1
x
0
=

x
1
x
0

y

d
dx

wdx,
donde todas las derivadas parciales de estan evaluadas en (x,
0
,

0
), y donde
hemos integrado por partes para tener en cuenta la ligadura de extremos jos. Dado
que la funcion w es arbitraria (salvo por la condicion en los extremos), si suponemos
que tanto como
0
son sucientemente regulares (C
2
es suciente), se puede
deducir (ver mas adelante) que la funcion que multiplica a w en el integrando debe
anularse. Esta condicion es la ecuacion de Euler-Lagrange para nuestro funcional:
d
dx

=

y
.
Notese que esta es una ecuacion diferencial de segundo orden, que explcitamente
se escribe

y
2
y

+

2

yy

+

2

xy



y
= 0.
Resolucion de los ejemplos. Antes de fundamentar los calculos realizados, podemos
resolver los ejemplos que se han expuesto anteriormente.
Geodesicas del plano. El funcional a minimizar es
J(y) =

x
1
x
0

1 +y

(x)
2
dx,
es decir (x, y, y

) =

1 +y
2
. La ecuacion de Euler-Lagrange son
0 =
d
dx



y
=
d
dx
y

1 +y
2
0.
Por tanto y

1 +y
2
es una constante k < 1
y

1 +y
2
= k.
Elevando al cuadrado y
2
= k(1 +y
2
), y despejando obtenemos y

= m, con m una
constate dada por m
2
= k/(1 k). Finalmente, integrando obtenemos y = mx+n,
es decir una recta. Los valores de n y m los hallamos imponiendo los valores en los
extremos:
y
0
= mx
0
+n y y
1
= mx
1
+n,
de donde nalmente, la solucion de nuestro problema es
y =
y
1
y
0
x
1
x
0
(x x
1
) +y
1
,
que es la solucion que todos conocemos y esperabamos.
4 EDUARDO MART

INEZ
Ejercicio 1: Que ocurre si x
1
= x
0
con y
1
= y
0
? Es que no hay rectas uniendo
dichos puntos?.
Ejercicio 2: La propiedad que ha hecho sencillo resolver el problema ha sido que
y

1+y
2
es constante. Cual es la causa de dicha propiedad? como puede generali-
zarse?
La braquistocrona. El funcional a minimizar es
J(u) =

x
1
x
0

1 +u

(x)
2
u(x)
dx,
es decir (x, u, u

) =

1+u
2
u
. La ecuaciones de Euler-Lagrange son
0 =
d
dx



u
=
1
2
u
2
+ 2uu

+ 1
[u(1 +u
2
)]
3/2
es decir,
u
2
+ 2uu

+ 1 = 0.
Para encontrar la solucion, es mejor considerar la funcion
C(u, u

) = u(1 +u
2
),
que es una constante de movimiento
u(1 +u
2
) = 2a.
La solucion de esta ecuacion es mas facil si introducimos como parametro el angulo
de la (tangente a la) curva con el eje x, o mejor todava = t/2, es decir u

=
tan(t/2), de donde
u =
2a
1 +u
2
= 2a cos
2
(t/2) = a(1 + cos t).
De aqu du = a sin t dt y sustituyendo obtenemos
dx =
1
tan(t/2)
du = 2a cos
2
(t/2) dt = a(1 + cos(t)),
e integrando
x = b a(t + sin t).
En resumen, la solucion se escribe parametricamente en la forma
x(t) = b a(t + sin t)
u(t) = a(1 + cos t)
que son las ecuaciones parametricas de una cicloide (curva descrita por un punto
del borde una rueda que gira sin deslizar). En terminos de la variable y = y
0
u
obtenemos una cicloide invertida. Por tanto, la braquistocrona no es sino un arco
de cicloide invertida.
CALCULO DE VARIACIONES 5
2
1.5
1
0.5
0
2 4 6 8 10 12
Christiaan Huygens llamo a esta curva la tautocrona, debido a la siguiente pro-
piedad que el mismo descubrio: el tiempo para llegar al suelo (y = 0) no depende
del punto inicial desde el que se lanza la cuenta.
Ejercicio 3: Probar que lo anterior es cierto, y que dicho tiempo es igual a
2

2a/g.
Por otro lado, la propiedad de isocrona unida al hecho de que la envolvente
de una cicloide es otra cicloide, permitio a Huygens construir un reloj de pendulo
cicloidal, mas exacto que el reloj de pendulo clasico, ya que el periodo de oscilacion
no depende de la amplitud del movimiento.
2. Ecuaciones de Euler-Lagrange
En el caso de las geodesicas del plano (por ejemplo) en vez de buscar y = y(x)
podemos buscar la curva con otra parametrizacion. Entonces x = x(t), y = y(t) y
el funcional a minimizar (la longitud total) es
S(x, y) =

t
1
t
0

x(t)
2
+ y(t)
2
dt,
donde t
0
y t
1
son los valores del parametro t para los que alcanzamos los extremos,
es decir, (x, y)(t
0
) = (x
0
, y
0
) y (x, y)(t
1
) = (x
1
, y
1
).
Igualmente en el caso de la braquistocrona, hemos usado un parametro t, que ha
simplicado el problema, proporcionando las ecuaciones parametricas de la cicloide.
Es conveniente, por tanto, considerar el caso mas general de un funcional que
depende de n variables dependientes x
i
y sus derivadas primeras x
i
con respecto
a un parametro t, y as el integrando sera de la forma L(t, x
1
, . . . , x
n
, x
1
, . . . , x
n
).
Supondremos ademas que L es una funcion de clase C
2
en un abierto de R
2n+1
.
Notese el cambio de notacion: variable independiente t, variables dependientes
x
i
, mas acorde con nuestra notacion en el resto de la asignatura.
Dada una curva : [t
0
, t
1
] R
n
con derivada segunda continua, denimos el
funcional J por medio de
J() =

t
1
t
0
L(t, (t), (t)) dt.
6 EDUARDO MART

INEZ
Queremos minimizar J sobre el subespacio afn A C
2
([t
0
, t
1
], R
n
) de curvas con
extremos jos m
0
y m
1
, es decir
A =

C
2
([t
0
, t
1
], R
n
)

(t
0
) = m
0
y (t
1
) = m
1

.
Este espacio es una variedad lineal de Banach, es decir, el espacio vectorial asociado
V =

W C
2
([t
0
, t
1
], R
n
)

W(t
0
) = 0 y W(t
1
) = 0

,
es un espacio de Banach con la norma C
1
[[W[[ = sup
t[t
0
,t
1
]
[W(t)[ + sup
t[t
0
,t
1
]
[

W(t)[.
Por tanto, podemos hacer calculo diferencial sin problemas.
Proposici on 1 (Lema fundamental del Calculo de Variaciones): Sea F : [t
0
, t
1
]
R
n
una funcion continua tal que

t
1
t
0
' F(t), W(t) ` dt = 0
para todo W V. Entonces F(t) = 0 para todo t [t
0
, t
1
].
Proof. Es suciente probarlo para n = 1. Si existiera un punto [t
0
, t
1
] tal que
F() = 0, entonces por la continuidad de F, existira un entorno o semientorno de
en el que F(t) = 0. Sin perder generalidad podemos suponer (t
0
, t
1
) y que
F(t) > 0 en dicho entorno ( , +). Como ademas podemos elegir W positiva,
de clase C
2
y cuyo soporte este contenido en dicho entorno, se deduce que

t
1
t
0
F(t)W(t) dt =

F(t)W(t) dt > 0
ya que F(t)W(t) es una funcion continua, no nula y no negativa. Por tanto llegamos
a una contradiccion.
Un calculo similar al realizado antes muestra que la derivada direccional de J en
la direccion de W V es
J

(; W) =

t
1
t
0
' L(t), W(t) ` dt,
donde L(t) es la funcion con valores en R
n
cuyas componentes son
[L(t)]
i
=
L
x
i

d
dt

L
x
i

.
En efecto, si A es la solucion buscada, tomamos la curva

= +W A
para W V, es decir,

(t) = (t) +W(t). Derivando con respecto a , obtenemos


J

(; W) =
d
d
J( +W)

=0
=

t
1
t
0
d
d
L(t, (t) +W(t), (t) +

W(t))

=0
dt
=

t
1
t
0

'
L
q
, W ` + '
L
v
,

W `

dt
=

t
1
t
0

L
q

d
dt

L
v

, W

dt + '
L
v
, W `

t
1
t
0
=

t
1
t
0
' L(t), W(t) ` dt,
donde hemos usado
d
dt
'
L
v
, W ` = '
d
dt

L
v

, W ` + '
L
v
,

W `,
CALCULO DE VARIACIONES 7
y tambien que W(t
0
) = W(t
1
) = 0.
Utilizando el lema fundamental del Calculo de Variaciones obtenemos las ecua-
ciones de Euler-Lagrange L = 0, es decir
d
dt

L
x
i

=
L
x
i
.
Lagrange obtuvo (a los 19 a nos!) las ecuaciones anteriores de forma general
para n variables independientes, utilizando metodos analticos (esencialmente las
mismas ideas que nosotros). Previamente, Euler haba obtenido ya las ecuaciones
para problemas con una variable dependiente, utilizando argumentos geometricos.
Ejercicio 4: Probar que si L es C
2
entonces J es diferenciable. Su diferencial es
por tanto DJ() : W J

(; W).
Nota 1: Se puede ver que en el caso todava mas general de que la funcion L
dependa de derivadas de orden superior L(t, x, x
(1)
, . . . , x
(r)
), las ecuaciones de
Euler-Lagrange son
0 =
r

k=0
(1)
k
d
k
dt
k

L
x
(k)

Por supuesto hay que exigir la regularidad suciente tanto a x(t) como a L.
En el caso de que nuestras curvas esten constre nidas a permanecer en una cierta
subvariedad la cosas se complican. Se puede generalizar lo hecho aqu para va-
riedades diferenciables Banach, llegando a un resultado facilmente expresable en
terminos de multiplicadores de Lagrange.
Por ejemplo, para hallar la ecuacion de las geodesicas en una supercie de re-
volucion podemos proceder de dos maneras diferentes: (1) utilizando coordenadas
en la supercie y minimizando la longitud de arco (o mejor su cuadrado), o (2)
minimizar la longitud del arco en R
3
(o mejor su cuadrado) donde las curvas estan
constre nidas a satisfacer la ecuacion de la supercie. Estas ultimas ecuaciones tienen
una interpretacion geometrica clara.
Finalmente, notemos que solo hemos encontrado condiciones de primer orden, es
decir condiciones de punto crtico. Bajo condiciones adecuadas de regularidad, se
puede calcular la diferencial segunda de J y encontrar condiciones sucientes para
que una punto crtico sea un mnimo. Para todas estas cuestiones, vease el libro de
Van Brunt.
3. Problemas con ligaduras
Consideremos ahora un problema con ligaduras, es decir, al igual que antes bus-
camos extremos de un funcional J sobre un conjunto de curvas con extremos jos,
pero ahora a dichas curvas le imponemos que satisfagan alguna condicion adicional
(longitud constante, permanecer en una supercie, ...). A las soluciones de este tipo
de problemas las denominamos extremos condicionados.
Si dicha ligadura se representa por la anulacion de una funcion () = 0, donde
: A R
m
es una aplicacion que suponemos diferenciable, entonces el problema
se expresa en la forma mn J[

1
(0)
.
Para resolver el problema tomamos el funcional J = (J, ): A R R
m
. Si
es un extremo condicionado entonces DJ() no puede ser sobreyectiva. En efecto,
si lo fuera, la imagen de un abierto en torno a debe ser un entorno de J().
En particular, dicho entorno contendra al intervalo (J() , J() + ) ()), o
con otras palabras el intervalo anterior esta contenido en la imagen de J, lo que
contradice el hecho de que en tengamos un extremo.
8 EDUARDO MART

INEZ
Por tanto, debe existir un vector (, p) RR
m
no nulo tal que ' (, p), DJ() ` =
0, es decir, tal que
DJ() + ' p, D() ` = 0.
Las componentes p
1
, p
2
, . . . , p
m
del vector p se denominan multiplicadores de
Lagrange. El n umero real se llama multiplicador de anormalidad, aunque es
ocasiones tambien se le llama multiplicador de Lagrange.
La regla anterior se puede reexpresar en terminos del funcional extendido

J =
J + ' p, `, de forma que , p y deben satisfacer la ecuacion D

J() = 0.
La catenaria. Consideremos un cable no de longitud
1
L, homogeneo y exible (pero
no extensible) suspendido entre dos puntos. Queremos determinar su posicion de
equilibrio. Esta se consigue en el punto en el que sus energa potencial es mnima.
Si m denota la masa por unidad de longitud del cable y g es la aceleracion de la
gravedad, entonces dicha energa potencial es
V (y) =

L
0
mgy(s) ds,
donde hemos parametrizado la curva por el arco. Si (x
0
, y
0
) y (x
1
, y
1
) son las coor-
denadas de los puntos de donde esta suspendido el cable y parametrizamos la curva
por la variable x, entonces ds =

1 +y

(x)
2
dx y los valores s = 0, L corresponden
a x = x
0
, x
1
, respectivamente, por lo que
V (y) = mg

x
1
x
0
y(x)

1 +y

(x)
2
dx.
Por tanto, queremos encontrar la funcion y = y(x) que hace mnimo el valor de V
de entre todas las curvas con extremos jos y(x
0
) = y
0
e y(x
1
) = y
1
, y que ademas
satisfacen la ligadura L =

x
1
x
0

1 +y

(x)
2
dx,
Supondremos en primer lugar = 0, que podemos reescalar a = 1. El funcional
a minimizar es (salvo constantes)
J(y) =

x
1
x
0
y(x)

1 +y

(x)
2
dx,
es decir (x, y, y

) = y

1 +y
2
, y por tanto el funcional extendido corresponde al
integrando

(x, y, y

) = y

1 +y
2
p

1 +y
2
= (y p)

1 +y
2
.
Podemos hacer el cambio de variable u = yp, de forma que el funcional extendido
queda igual que el funcional original, pero en la variable u:

(x, u, u

) = u

1 +u

(x)
2
.
La ecuaciones de Euler-Lagrange son
0 =
d
dx

y
=
1
2

u
2uu

u
2
1
(1 +u
2
)
3/2
es decir,
2uu

u
2
1 = 0.
Para resolver es mejor considerar la funcion E
E(y, y

) =
u

1 +u
2
,
que es constante de movimiento
u

1 +u
2
= a,
1
Volvemos en esta seccion a la notacion del principio. En particular L es la longitud del cable
CALCULO DE VARIACIONES 9
de donde se llega a
u

(u/a)
2
1.
Haciendo el cambio u = a cosh(v), se tiene

(u/a)
2
1 = sinh(v) e u

= a sinh(v)v

por lo que a sinh(v)v

= sinh(v), y as v(x) = (x b)/a para alguna constante b.


Por tanto u = a cosh
xb
a
, y nalmente
y = p +a cosh
x b
a
.
que es la ecuacion de la catenaria. La interpretacion geometrica de p es la altura
de la catenaria en el punto mas bajo, que corresponde a x = b.
Para = 0 tenemos el funcional extendido

= p

1 +y

(x)
2
, que salvo la
constante multiplicativa no nula p es el funcional de las geodesicas del plano. Por
tanto, en este caso la solucion es una recta y = mx + n, para ciertas constantes
m, n R.
Ejercicio 5: Para determinar las constantes a y b (o m y n) debemos imponer
las condiciones de contorno y(x
0
) = y
0
e y(x
1
) = y
1
. Hay siempre solucion? Es
unica? Razona el resultado e interpretalo geometricamente.
4. El principio del m aximo de Pontryagin
La teora de control optimo constituye una generalizacion natural del calculo de
variaciones. Existen multitud de formas asociadas a problemas de control optimo,
y nosotros consideraremos la que sigue. Sean T R
+
, x
0
, x
1
R
n
dados. Considera-
mos el conjunto de controles admisibles W= : [0, T] U [ acotada y medible .
Para cada control W encontramos la solucion : [0, T] R
n
del problema de
valor inicial

x = f(x, (t))
x(0) = x
0
.
De entre todos estos controles u = (t) seleccionamos aquellos en los cuales la
solucion x = (t) esta denida en todo el intervalo [0, T] y ademas (T) = x
1
. En
este conjunto de controles, queremos minimizar el funcional
J(u) =

T
0
L(x, u) dt,
o mas explcitamente
J() =

T
0
L((t), (t)) dt.
Daremos un conjunto de condiciones necesarias (no sucientes en general) que las
expresaremos en terminos de la funcion Hamiltoniano de Pontryagin,
H(x, p, , u) = ' p , f(x, u) ` L(x, u).
Teorema 1 (Principio del maximo de Pontryagin): Supongamos que las de-
rivadas parciales de L y f con respecto a x son funciones continuas con respecto
a todas las variables. Sean u = (t) un control admisible y x = (t) la correspon-
diente trayectoria del sistema de control. Si ((t), (t)) es optimal, entonces existen
una constante 0, 1, una funcion absolutamente continua : [0, T] R
n
tales
que (, (t)) = (0, 0) para todo t [0, T], tales que
1. La curva p = (t) satisface

i
=
H
x
i
((t), (t), , (t)),
para casi todo t [0, T].
10 EDUARDO MART

INEZ
2. El control u = (t) maximiza el Hamiltoniano, es decir,
max
uU
H((t), (t), , u) = H((t), (t), , (t)),
para casi todo t [0, T].
3. El Hamiltoniano es constante a lo largo de dicha solucion
H((t), (t), , (t)) = constante.
En lo que sigue daremos un argumento (que no una demostracion) que nos permi-
ta intuir de donde proceden las condiciones del principio del maximo. Supondremos
que U es un abierto de R
m
y que las funciones L y f son de clase C
1
, y probaremos
solamente que u es un punto crtico de u H(x, p, , ), es decir, que H/u = 0,
y no que es un punto de maximo como asegura el principio. Mas adelante supon-
dremos que se cumplen unas cuantas condiciones adicionales, que en la mayora de
los casos no se dan, como por ejemplo que el conjunto de los controles satisfaciendo
las condiciones anteriores tiene una estructura razonablemente buena.
Seguiremos pasos analogos a los dados en el caso del calculo variacional para
encontrar las ecuaciones de Euler-Lagrange. Consideremos un control que mini-
miza el funcional J y sea la correspondiente trayectoria en el espacio de estados.
Tomamos una variacion del control
s
= + sZ con Z W y sea
s
la co-
rrespondiente trayectoria
2
. Dado que
s
satisface
s
= f(
s
, + sZ), junto con

s
(0) = x
0
y
s
(T) = x
1
, se tiene que el vector de variacion de las variables de
estado W(t) =
x
s
(t)
s
[
s=0
satisface

W =
f
x
W +
f
u
Z
W(0) = 0
W(T) = 0.
Evaluando J en
s
y derivando, tenemos que
0 =
d
ds
J(
s
)

s=0
=

T
0

s
L(
s
(t), (t) +sZ(t))

s=0
dt
=

T
0

L
x
W +
L
u
Z

dt
donde las derivadas parciales estan evaluadas en ((t), (t)).
Debemos ahora utilizar ahora ambas relaciones para obtener las condiciones
que debe satisfacer nuestra solucion. Para ello, y motivados por la regla de los
multiplicadores de Lagrange, podemos multiplicar la ecuacion variacional por una
funcion : [0, T] R
n
derivable y sumarla al integrando, obteniendo
0 =

T
0

L
x
W +
L
u
Z + ' ,

W
f
x
W
f
u
Z `

dt
=

T
0

'
L
x

f
x
, W ` + '
L
u

f
u
, Z `

dt.
Para pasar a la segunda igualdad, hemos integrado por partes el termino ' ,

W ` y
hemos tenido en cuenta que W se anula en ambos extremos. Dado que la variacion
Z de los controles es libre, pero la variacion de las variables de estado x no lo es,
debemos elegir adecuadamente el valor de los multiplicadores . Esto se consigue
haciendo que el termino que multiplica a W se anule, es decir, si elegimos p = (t)
como una solucion de la ecuaci on diferencial
p =
L
x
p
f
x
,
2
Se supone que existe tal variacion
CALCULO DE VARIACIONES 11
entonces la derivada de J en es
0 =

T
0
'
L
u

f
u
, Z ` dt,
y como Z es libre
3
, se obtiene ademas la condicion
L
u

f
u
= 0.
En terminos del Hamiltoniano de Pontryagin,
H = ' p , f ` L,
ambas ecuaciones se escriben en la forma
p =
H
x
0 =
H
u
.
Ademas la ecuacion x = f(x, u), se puede expresar tambien en la forma
x =
H
p
.
En la obtencion de las condiciones anteriores, hemos supuesto que el conjunto
de controles admisibles (que hacen que la solucion satisfaga las condiciones de
contorno) admite variaciones Z que en cada punto generan todo R
m
. Esto en general
no sera cierto. Por ejemplo, pueden existir controles que no admitan variaciones
genericas o de ning un tipo. Por ejemplo, si en alguna topologa dicho control es
un punto aislado, entonces en dicho punto no podemos calcular la derivada de J, y
estos puntos habra que considerarlos por separado como candidatos a optimo. Como
la condicion de ser puntos aislados no depende del la funcion a optimizar, podemos
utilizar cualquiera, por ejemplo L = 0. De ah que tengamos que considerar no
solamente la funcion de coste original 1 L sino tambien el coste 0, esto es, 0 L. En
otras palabras hay que considerar L, con 0, 1, por lo que el Hamiltoniano
es
H(x, p, , u) = ' p , f(x, u) ` L.
Finalmente, veamos que H es constante a lo largo de cada trayectoria optimal.
En efecto
4
d
dt
H((t), p(t), , (t)) =
H
x
+
H
p
p +
H
u
= p + p 0 = 0.
Notese que hay muchos puntos acos en la argumentacion dada. El problema
principal reside en que no conocemos la estructura del conjunto de controles tales
que la trayectoria asociada cumple las condiciones de contorno, y en general, dicho
conjunto no sera una variedad de Banach. Si lo fuera, todos los calculos que hemos
realizado son facilmente justicables. Es mas, en este caso, uno puede suponer que
= 1.
Eduardo Martnez: Departamento de Matem atica Aplicada and IUMA, Facultad de
Ciencias, Universidad de Zaragoza, 50009 Zaragoza, Spain
E-mail address: emf@unizar.es
3
Se supone que Z puede tomar valores arbitrarios en cada punto. Esto en general no es cierto.
4
Aqu suponemos que u tiene derivada.
12 EDUARDO MART

INEZ

Indice
1. Calculo de Variaciones 1
2. Ecuaciones de Euler-Lagrange 5
3. Problemas con ligaduras 7
4. El principio del maximo de Pontryagin 9

También podría gustarte