Documentos de Académico
Documentos de Profesional
Documentos de Cultura
on a la Investigaci
on en Matem
aticas
DE CONTROL OPTIMO
EDUARDO MARTINEZ
1.
Sistemas de control
y
F2
x
(b) Simplified model
F1
Hay muchsimos m
as en biologa, ecologa, etcetera.
Figure 2.3: Vectored thrust aircraft. The Harrier AV-8B military aircraft (a)
its engine
downwardpor
so that
it can
En los dos ejemplos anteriores tenemos un redirects
sistema
fsicothrust
descrito
una
se-hover above the ground.
Some air from the engine is diverted to the wing tips to be used for maneuvering.
rie de variables x que satisfacen una ecuacion diferencial,
lanet
cual
adem
s
As shown in (b), the
thrustdepende
on the aircraft
can beadecomposed
into a horizontal
force F1 and a vertical force F2 acting at a distance r from the center of mass.
de ciertas variables u que est
an a nuestra disposici
on y podemos cambiarlas a lo
largo de la evoluci
on del sistema. Las variables x describen el estado del sistema
It is also possible to choose the weights such that only a given subset of
y consecuentemente se denominan variablesvariable
de estado,
mientras que las variaare considered in the cost function. Let z = Hx be the output you
bles u representan la acci
on que se ejerce sobre
sistema
para
want toel
keep
small and
verifypoder
that (A,controlar
H) is observable. Then we can use a
cost function
of the forminputs. En general
su comportamiento, y se denominan variables
de control,
= H T Habierto
Qu =de
I.
supondremos que las variables de estado toman valores en unQxcierto
n
R , aunque no es difcil imaginar situacionesThe
en constant
las que dichas
allows usvariables
to trade off describen
!z!2 versus !u!2 .
We illustrate
the various
choices
through
una variedad diferenciable. Igualmente las variables
de control
toman
valores
enanunexample application.
m
cierto subconjunto U R que puede o no ser
un abierto.
Example
2.5 Thrust vectored aircraft
the thrust vectored aircraft example introduced in
AM08, Exam n 1: Un sistema de control es unConsider
Definicio
sistema
ecuaciones
AM08. The
ple 2.9. Thedescrito
system is por
shownunas
in Figure
2.3, reproduced from
diferenciales de la forma x = f (x, u) con f : O
Uquadratic
Rn regulator
Rm problem
Rm . was illustrated in Example 6.8, where
linear
the weights were chosen as Q = I and Q = I. Figure 2.4 reproduces the
x
u
En problemas concretos es necesario adem
as especificar la clase de
controles
que
step response for this case.x
A more physically
weighted
can be
se admiten: funciones constantes a trozos, continuas
a trozos,motivated
medibles
acotadas,
computing by specifying
the comparable errors in each of the states and adjusting the weights accordingly. Suppose, for example that we consider a 1 cm error in x, a 10 cm
error in y and a 5 error in to be equivalently bad. In addition, we wish
Date: Febrero 2008.
to penalize the forces in the sidewards direction since these results in a loss
2000 Mathematics Subject Classification. 49S05, in
49K15,
70H25,
efficiency.
This49J15.
can be accounted for in the LQR weights be choosing
6
6
Qx = 6
6
6
4
2/9
7
7
7,
7
7
5
Qu = 0.1
1
0
0
.
10
EDUARDO MARTINEZ
son algunas de las clases que se usan con frecuencia. En nuestro caso, optaremos
por los siguientes.
n 2: Un control es una funcion : [0, T ] U acotada y medible. Una
Definicio
trayectoria de un sistema de control, correspondiente a un control u = (t)
definido en el intervalo [0, T ], es una curva : [0, T ] O absolutamente continua y
que satisface (t)
Por ejemplo:
Tiempo final no fijado: en el problema anterior se supuso que el tiempo final
est
a fijado de antemano. Podemos tambien considerar que dicho tiempo es
libre y minimizamos entre todas las trayectorias que llegan al punto x1 en
alg
un instante final T . La integral se hace entre 0 y dicho tiempo final T ,
que depende de la curva sobre la que se integra.
Punto final no determinado: en muchas ocasiones, el punto final x1 no es
conocido, sino que se da un subconjunto F de puntos al cual debe pertenecer
el punto final x(T ) F.
Punto inicial no determinado: igualmente, puede especificarse un conjunto
I al cual debe pertenecer el punto inicial, x(0) I.
Coste final: en ocasiones se penaliza la posicion final por medio de un coste
final, a
nadiendo a la integral un termino de la forma (x(T )), siendo una
cierta funci
on real definida en O.
En lo que sigue en estas notas, supondremos la siguiente condicion de regularidad:
[H] El conjunto O Rn es un abierto y el conjunto U Rm es un conjunto
medible. Las funciones f y L tienen derivadas parciales continuas,
aunque hay que destacar que muchos de los resultados que mencionaremos pueden
ser probados bajo condiciones mas generales.
2.
ximo de Pontryagin
El principio del ma
El principio del m
aximo de Pontryagin establece un conjunto de condiciones
necesarias para que una curva sea la solucion de nuestro problema de control optimo.
El citado principio se expresa de forma sencilla en terminos de la siguiente funci
on, que se conoce como Hamiltoniano de Pontryagin
H(x, p, , u) =
n
X
i=1
CONTROL OPTIMO
H
((t), (t), , (t)),
xi
H
pi
pi =
H
xi
o m
as explcitamente
H
(x(t), (t), , u(t))
pi
H
pi (t) =
(x(t), (t), , u(t))
pi
x i (t) =
Nota 2: La pareja (p, ) est
a definida salvo un factor multiplicativo constante. En
efecto, si ((t), (t), , (t)) es una solucion optima junto con sus correspondientes
multiplicadores, entonces tambien lo es ((t), (t), , (t)), cualquiera que sea
la constante 6= 0. Por tanto, podemos limitarnos a considerar los casos = 0 y
= 1. Los extremales ((t), (t)) a los que corresponden soluciones con = 1 se
llaman extremales normales, mientras que los que corresponden a soluciones con
= 0 se denominan extremales anormales. Notese que pueden existir extremales
que sean a la vez normales y anormales.
Nota 3: Si el conjunto U es un abierto, entonces la condicion de maximizacion
implica que H
u = 0, es decir,
0=
para casi todo t [0, T ].
Las ecuaciones
H
q =
p
H
((t), (t), , (t)) = 0,
uA
p =
H
q
and
0=
H
,
u
se denominan ecuaciones crticas, y a sus soluciones curvas crticas. Evidentemente (si U es abierto) las trayectorias optimales corresponden a curvas crticas.
Casos especiales y generalizaciones.
EDUARDO MARTINEZ
Ligadura final. Si en vez de fijar el punto final, se da una ligadura que debe satisfacer
dicho punto, x(T ) F, con F una subvariedad de Rn , entonces el valor final de p
debe satisfacer la condici
on de transversalidad
h p(T ) , v i = 0,
para todo vector v tangente a F en x(T ).
Ligadura inicial. Si en vez de fijar el punto inicial, se da una ligadura que debe
satisfacer dicho punto, x(0) I, con I una subvariedad de Rn , entonces el valor
inicial de p debe satisfacer la condicion
h p(0) , v i = 0,
para todo vector v tangente a I en x(T ).
En los casos anteriores de ligaduras en el punto inicial y/o final, las variedades I
o F suelen venir dadas como el conjunto de ceros de una cierta funcion. Por ejemplo,
en el caso de ligaduras finales F suele venir dada como
F = 1 (0) = { x Rn | (x) = 0 } .
En este caso, n
otese que el espacio tangente a F en un punto x es simplemente
Tx F = Ker D(x).
Lo mismo sirve cuando I es el conjunto de nivel cero de una funcion.
Coste terminal. En el llamado problema o forma de Bolza, se a
nade al funcional de
coste una penalizaci
on terminal (x(T )), es decir, el objetivo a minimizar es
Z T
J=
L(x(t), u(t) dt + (x(T )),
0
dejando libre ademas el punto final. En este caso ademas de las condiciones expresada en el principio del m
aximo, se tiene que el valor final de p queda fijado por la
condici
on
p(T ) = ((T )).
Coste terminal y ligadura final. Con mas generalidad, si se considera un problema
de Bolza como el anterior pero se restringe el valor final por una condicion de la
forma x(T ) F, con F una subvariedad de Rn , entonces el valor final de p debe
satisfacer la condici
on de transversalidad
h p(T ) , v i = h ((T )) , v i,
para todo vector v tangente a F en x(T ).
3.
Ejemplos
Veamos a continuaci
on algunos ejemplos sencillos de aplicacion del principio del
m
aximo de Pontryagin.
CONTROL OPTIMO
x = u1
y = u2
z = yu1 xu2
H
= p2 p3 x u2 = 0,
u2
adem
as de las ecuaciones
x = u1
p1 = p3 u2
y = u2
p2 = p3 u1
z = yu1 xu2
p3 = 0
x = x + iy,
EDUARDO MARTINEZ
T u0 2int/T
(e
1).
2n
|u0 |2
<(1 e2int/T ),
2n
de donde obtenemos que n 0 y que |u0 | = 2na/T , por lo que podemos poner
2na i
u0 =
e
T
para alg
un R.
Para determinar el mnimo, integramos
Z
Z
Z
1 T 2
1 T
1 T
2n
(u1 + u22 ) dt =
|u|2 dt =
|u0 |2 dt = T |u0 |2 =
a
2 0
2 0
2 0
T
que es mnimo para n = 1 (recordar n Z {0} y n 0).
Finalmente, veamos que no existen soluciones anormales. Si tomamos = 0,
entonces el Hamiltoniano no esta acotado salvo que p1 = p3 y y p2 = p3 x. En
este caso, sustituyendo en la ecuacion diferencial de p1 y p2 obtenemos p3 u1 = 0
y p3 u2 =0., de donde p1 y p2 , ademas de p3 , son constantes. En t = 0 como y = 0
se tiene que p1 = p3 y = 0, e igualmente, como en t = 0 es x = 0, tenemos
p2 = p3 x = 0. Por tanto p3 6= 0 (ya que no pueden ser todos nulos), de donde
u1 = 0 y u2 = 0. En definitiva x e y son constantes, y por tanto nulas, de donde z
es tambien constante y no puede tomar los valores 0 en t = 0 y a > 0 en t = T .
Por tanto la soluci
on de nuestro problema es
r
a
x(t) =
sin(2t/T )
2
r
a
y(t) =
(cos(2t/T ) 1)
2
a
T
z(t) =
t+
(cos(2t/T ) 1)
T
2
que se obtiene con el control
2a
u1 (t) =
cos(2t/T )
T
2a
u2 (t) =
sin(2t/T )
T
as como cualquiera que se obtenga de estas por un giro de angulo y eje z.
CONTROL OPTIMO
1 dt,
p2 = p1 .
p = 0
x = u2 ,
cuya soluci
on general es
p = constante
u=
1
2p
x(t) = c +
1
t+c
4p2
EDUARDO MARTINEZ
p = 0
x = u2 .
entre las trayectorias del sistema que comienzan en x(0) = x0 , sin restriccion alguna
en el punto final, es decir F = Rn . Supondremos que Q R(n,n) y R R(m,m)
son matrices simetricas con R definida positiva. Ademas supondremos que no hay
controles redundantes, es decir, que B R(n,m) tiene rango maximo m < n.
Probaremos que la trayectoria optimal se obtiene como la solucion del sistema
de ecuaciones diferenciales
x = Ax + BR1 B T p
p = Qx AT p
con condiciones de frontera
x(0) = x0 ,
p(T ) = 0,
estando el control
optimo dado por
u = R1 B T p.
En efecto, consideremos primero las soluciones normales, con = 1. El Hamiltoniano de Pontryagin es
1
H(x, p, , u) = pT (Ax + Bu) (xT Qx + uT Ru).
2
Siendo R definida positiva, el Hamiltoniano solo tiene un maximo, que se obtiene
en el punto donde la derivada parcial con respecto a u se anula, esto es, donde
B T p = Ru, de donde obtenemos
u = R1 B T p.
As, sustituyendo la expresi
on anterior en la ecuacion de control obtenemos
x = Ax + Bu = Ax + BR1 B T p
Por otro lado, calculando la derivada parcial con respecto a x, obtenemos
H
p =
= Qx AT p.
x
Como el punto final es libre, se tiene ademas que p(T ) = 0, ya que F = (Rn ) =
{0}. Recordemos tambien que el punto inicial esta dado x(0) = x0 .
CONTROL OPTIMO
10
EDUARDO MARTINEZ
Indice
1. Sistemas de control
2. El principio del m
aximo de Pontryagin
Casos especiales y generalizaciones
3. Ejemplos
Sistema de Heisemberg
Sistema con controles acotados
Soluciones anormales
Problemas LQ
Referencias
1
2
3
4
5
7
7
8
9