Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Control Optimo en Grupos de Lie
Control Optimo en Grupos de Lie
en
grupos de Lie
Indice general
1. El grupo de rotaciones de R3 , SO(3)
1.1. Definicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.7. Apendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2. El cuerpo rgido
12
12
13
15
20
20
21
23
25
26
2
26
26
27
27
29
30
32
. . . . . . . . . . . . . .
32
33
34
34
36
37
38
39
41
Lecci
on 1
1.1.
Definici
on
T
0 = R(0)R(0)
+ R(0)R(0)
= A(0)
+ A(0)
[E2 , E3 ] = E1 ,
[E3 , E1 ] = E2
0 0
E1 =
0 0 1 ,
0 1 0
0 1
E2 =
0 0 0 ,
1 0 0
0 1 0
E3 =
1
0
0
0
0
.
0
3
X
ijk Ek
k=1
donde ijk = 0 si alguno de los subndices coincide; ijk = 1 si (ijk) es una permutaci
on par
de (123); y ijk = 1 si (ijk) es una permutaci
on impar.
1.2.
La aplicaci
on exponencial
A2
An
+ ... +
+ ...
2!
n!
X
1 T n X 1
(A ) =
(A)n = exp(A) = (exp A)1 .
n!
n!
n=0
n=0
Por tanto exp A O(3). Como exp 0 = I y exp es continua deducimos que exp A SO(3)
2.
F
ormula de Rodrigues. Para cualquier matriz de so(3),
A=
a3
a2
a3
0
a1
a2
a1
p
no nula, es decir (a1 , a2 , a3 ) 6= (0, 0, 0), si denotamos por r = a21 + a22 + a23 se tiene que el
polinomio caracterstico:
a a
3
2
3
2
p() = a3
a1 = r = 0
a2 a1
Entonces A3 = r2 A (Teorema de Cayley-Hamilton). Deducimos que:
A2n+1 = (1)n r2n A
A2n+2 = (1)n r2n A2 ,
n0
X
1 n
A
n!
n=0
= I+
I+
X
n=0
X
n=0
X
1
1
A2n+1 +
A2n+2
(2n + 1)!
(2n + 2)!
n=0
X
(1)n 2n 2
2n
r A+
r A
(2n + 1)!
(2n + 2)!
(1)n
n=0
sen r
1 cos r 2
= I+
A+
A
r
r
recordando que
sen x =
cos x =
X
(1)n 2n+1
x
(2n + 1)!
n=0
n=0
(1)n 2n
x
(2n)!
d
d
t2 A2
tn An
exp (tA) =
I + tA +
+ ... +
+ ...
dt
dt
2!
n!
t2 A3
tn An+1
= A + tA2 +
+ ... +
+ ...
2!
n!
= exp (tA)A.
d
exp (tA) = A.
En particular, dt
t=0
1.3.
X
1 n
A .
n!
n=0
sin r
1 cos r 2
A+
A ,
r
r2
r
(R RT ) y
2 sin r
r2
(R + RT 2I).
2(1 cos r)
r2
(2traza (R) 6),
2(1 cos r)
1
1
r = acos ( Tr(R) ),
2
2
0
R=I
log(R) =
(R) (R RT ) R 6= I
2 sin (R)
1.4.
La m
etrica de Killing
(2)
traza(A) = traza(A),
(3)
trazaAT = trazaA,
(4)
(5)
si B es invertible.2
1
kAk2k = k(A, A) = traza
a3
2
a2
y es 0 u
nicamente cuando A = 0.
a3
0
a1
a2
2
2
2
a1
= a1 + a2 + a3 0
0
2
A so(3)
Para todo A, B, C so(3) se verifica que k([C, A], B) + k(A, [C, B]) = 0. (Recuerdese
que [A, B] = AB BA).
Prueba: Es una consecuencia directa de la cuarta propiedad de la traza.
Dados B, C so(3) y la curva R(t) = exp (tC) (recuerdese que R(0) = I y R(0)
= C)
calculemos en primer lugar
d
Ad
B
=
exp
(tC)
dt t=0
d
1
exp
(tC)B(exp
(tC))
dt t=0
d
=
R(t)BR(t)1
t=0
dt
d
=
R(t)BR(t)1
t=0
dt
d
1
= R(0)BR(0)
+ R(0)B t=0 (R(t)1 )
dt
d
1
dt t=0 (R(t) )
= C.
As
adC B =
d
Ad exp
dt t=0
(tC) B
= CB BC = [C, B]
Sera u
til la siguiente formula et adA B = etA BetA
Prueba:
Considera la aplicacion (t) : so(3) so(3) definida por (t)(B) = etA BetA con
A, B so(3) y A fijado.
Entonces 0 (0) : so(3) so(3) es igual a 0 (0)(B) = [A, B] = adA (B). As, etadA B =
etA BetA .
2.
1.5.
Identificaci
on con R3
i
a3
a2
a3 a2
0
a1
= (a1 , a2 , a3 ) = a
a1
0
Observese que i(E1 ) = (1, 0, 0), i(E2 ) = (0, 1, 0) e i(E3 ) = (0, 0, 1).
Veamos algunas propiedades de la aplicacion i:
i es una isometra de (so(3), k) en (R3 , ( , )).
P
P
Prueba: Para A = 3i=1 ai Ei y B = 3i=1 bi Ei tenemos que
k(A, B) = a1 b1 + a2 b2 + a3 b3 = ((a1 , a2 , a3 ), (b1 , b2 , b3 )) = a b .
i es un isomorfismo del algebra de Lie (so(3), [ , ]) con el algebra de Lie (R3 , ), donde
denota el producto vectorial en R3 .
i([A, B]) = i(
3
X
i,j,k=1
ijk ai bj Ek ) =
3
X
i,j,k=1
.
Frecuentemente denotaremos i1 (a) = a
b entonces para
Veamos la propiedad anterior usando esta notacion. Como a b = a
3
todos a, b, c R se verifica que
(b
a)c
[
a, b]c
= (
ab)c
c)
(b c) b(a
= a
= a (b c) b (a c)
\
= (a b) c = a
bc
i intercambia la accion adjunta de SO(3) en so(3) con la accion usual de SO(3) en
R3 .
Prueba: Sea R SO(3) y define la aplicacion R : R3 R3 por x i(AdR i1 (x)) =
). Se verifica para todo y R3 que
i(AdR x
R (x) y = (R
xR1 )y = R
x(R1 y)
= R(x R1 y)
= (Rx) y
aplicando que el producto vectorial es invariante por rotaciones (vease apendice al
final del captulo).
1.6.
Teorema de Euler
Rv = v.
Tenemos que, al estar R SO(3),
k Rv k2 =k v k2 ,
Como
2 k v k2 .
k v k2 =k Rv k2 =
As, si los tres autovalores son reales deben ser 1, 1, 1 o 1, 1, 1 pues det R = 1. En el caso
de que haya races complejas {1, ,
}.
2.
Teorema de Euler. Cada elemento de SO(3) es una rotacion de angulo sobre el eje
v.
Prueba: Por el lema anterior existe un autovector v tal que Rv = v. El subespacio
generado por v tambien es R-invariante.
1 0 0
R=
0 a1 a2 .
0 a3 a4
Como la matriz
R=
a1 a2
a3 a4
0
.
R=
0
cos
sen
0 sen
cos
1.7.
Ap
endice
Teorema
Sea R SO(3). Entonces para cualesquiera vectores u, v en R3 ,
R(u v) = (Ru) (Rv).
Prueba. Fijemos una base ortonormal orientada a derecha en R3 . Sean {u1 , u2 , u3 } y
{v1 , v2 , v3 } las componentes de u y v en dicha base. En esa misma base denota las componentes de R por Rij . Como R es una rotacion, entonces Rij Rkj = ik P
donde ik es la delta
de Kronecker. La i-esima coordenada de u v sera igual a(u v)i = 3i,j=1 ijk uj vk . Para
la k-esima coordenada de (R u) (R v) se tiene que
((R u) (R v))k = imk Rij Rmn uj vn
= iml kl Rij Rmn uj vn
= iml Rkr Rlr Rij Rmn uj vn
= jnr det R Rkr uj vn .
10
11
Lecci
on 2
El cuerpo rgido
En esta leccion analizaremos en detalle un ejemplo de sistema mecanico cuyo espacio de
fases es el algebra de Lie so(3) del grupo de Lie SO(3). Este sistema describe el movimiento
de un cuerpo rgido sobre un punto fijo sin la accion de ninguna fuerza externa; entendiendo por cuerpo rgido un sistema de partculas donde las distancias entre ellas permanece
invariable. Al final de la leccion estudiaremos la dinamica, deduciendo las ecuaciones del
movimiento aplicando un principio variacional adecuado.
2.1.
13
fijo en el origen. Toda isometra de R3 que deja fijo el origen es un elemento del grupo
ortogonal. Por tanto,
xt (X) = R(t)X
En coordenadas, xi (t) = Rij (t)Xj donde (Rij ) es la matriz de R relativa a las bases
(E1 , E2 , E3 ) y (e1 , e2 , e3 ).
La dinamica se supone que es continua y R(0) es la identidad, entoces det R(t) = 1 y,
por lo tanto, R(t) SO(3).
De lo que conclumos que:
El espacio de configuraci
on del cuerpo rgido es SO(3), su espacio de fases de
velocidades es T SO(3) y el espacio de fases de momentos es T SO(3).
Hay un tercer tipo de coordenadas que seran de interes, las coordenadas en el cuerpo o
coordenadas convectivas. Son coordenadas asociadas a una referencia que se mueve con el
cuerpo. Consideremos la base dependiente del tiempo:
i = R(t)Ei ,
i = 1, 2, 3
2.2.
(X, t) = R(t)X
t
Definici
on: Velocidad euleriana o velocidad espacial:
1
Definici
on: Velocidad convectiva o velocidad en el cuerpo:
X
1
= R(t)1 R(t)X
V(X, t) =
= R(t)1 V (X, t)
= R(t)1 v(x, t)
Supongamos que la distribucion de masa en el cuerpo esta descrita por una densidad
0 d3 X en la configuracion de referencia.
14
=
0 (X)kR(t)Xk
d X
2 B
Como R(t) SO(3), entonces diferenciando con respecto a t, R(t)T R(t) = I y R(t)R(t)T =
1 est
y R(t)R(t)
a en so(3). Definen, en particular, la velocidad
I, llegamos a que R(t)1 R(t)
3
angular espacial (t) R :
1
b (t) = R(t)R(t)
y la velocidad angular convectiva (t) R3 :
b = R(t)1 R(t)
(t)
d = (t) x y V(X, t) = (t)X
d = (t) X.
Observese que v(x, t) = (t)x
Como
b 1 = AdR
b
b = RR
entonces = R.
Veamos que el lagrangiano L : T SO(3) R es invariante a izquierda por SO(3). As,
= L(BR, BR):
L(BR, BR) =
0 (X)kBR(t)X)k
d X
2 B
Z
1
2 3
=
0 (X)kR(t)X)k
d X
2 B
= L(R, R)
pues B es ortogonal.
= L(R1 R, R1 R)
= L(I, )
= l()
De este modo L(R, R)
Estudiemos distintas expresiones mas manejables del lagrangiano del cuerpo rgido (libre):
Z
1
L =
0 (X)kV (X, t)k2 d3 X
2 B
Z
1
2 3
0 (X)kRXk
d X
=
2 B
Z
1
2 3
=
0 (X)kR1 RXk
d X
2 B
Z
1
2 d3 X
0 (X)kXk
=
2 B
Z
1
=
0 (X)k Xk2 d3 X
2 B
15
0 (X)(a X, b X)d3 X
As,
1
,
2
Construye el isomorfismo lineal II : R3 R3 definido por
l() =
(IIa, b) = a, b ,
para todo a, b R3 .
Por definicion, (IIa, b) = (a, IIb). Entonces II es simetrica y, ademas, definida positiva (bajo
adecuadas hipotesis iniciales). Como II es simetrica, puede ser diagonalizada. Si escogemos
un base ortonormal (E1 , E2 , E3 ) para la que II es diagonal entonces
l() =
1
1
1
, = (II, ) = (I1 21 + I2 22 + I3 23 ).
2
2
2
1 21 22 23
+
+
H() =
2 I1
I2
I3
2.3.
Ecuaciones de Euler-Poincar
e
L(R, R)
verifica las ecuaciones de Euler:
= II .
II
Demostraci
on:
Sabemos por calculo de variaciones que L satisface las ecuaciones de Euler-Lagrange si y
solo si
Z
L dt = 0
Consideremos l : so(3) R definido por l() = 21 (II, ).
Tomando una variacion R (t) de la curva R(t) tendremos una variaci
on de la curva
[
(t) en el algebra de Lie so(3). Si llamamos
d
R(t) =
R (t)
d =0
d
(t) =
(t)
d =0
16
=
b obtenemos:
Derivando con respecto a la relacion R1 R
c
+ R1 ( R)
= .
R1 (R)R1 R
b
Define la matriz antisimetrica :
b = R1 R
b de R3 .
y el vector = i()
Observese que:
1 R + R1 ( R)
b = R1 RR
Luego
b + R1 R
b
R1 R
por lo tanto,
c
b
b +
b +
b
b =
es decir,
c =
b + [,
b ]
b
o, lo que es lo mismo,
= +
l dt = 0
R t1
t0
L dt = 0 en T SO(3)
t0
t1
t1
l dt =
t0
(II, ) dt
t0
Z t1
=
t0
Z t1
=
t0
t1
Z
=
+ ) dt
(II,
h
i
) + (II, ) dt
(II ,
+ II ), dt
(II
t0
donde hemos integrando por partes y usado las condiciones (t0 ) = 0 y (t1 ) = 0. Al ser
arbitrario llegamos a que:
+ II = 0
II
17
L(R(t), R(t))
dt
Z
() 7
l((t)) dt
18
Z
l
=
( + ad ) dt
Z
d l
l
=
+ ad
dt
dt
2
Si escogemos un base {E1 , . . . En } de g tal que
k
[Ei , Ej ] = Cij
Ek
d
l
k j l
= Cji
dt i
k
En la siguiente leccion veremos la formulaci
on hamiltoniana de las ecuaciones de EulerPoincare. Observese que si llamamos
=
l
g ,
l
= + h,
ih ,
i=
19
Lecci
on 3
3.1.
R(0) = R0 ,
RG
tiene una u
nica solucion R(t) = R0 exp (tA) (ver propiedades de la exponencial).
Analicemos a continuacion cual es el espacio tangente a G en R.
Proposici
on:
Dado R G se verifica que:
TR G = {RA | A g} = Rg = TI lR (g).
Prueba: El espacio tangente a en R a G es:
TR G = {R(0)
| R(t) G, R(0) = R}
20
21
Y (0) = R1 (0)R(0)
g.
R(0)
= RA
As, deducimos que TR G Rg. Como ambos tienen la misma dimension entonces TR G =
Rg.
2.
3.2.
Trivializaci
on del fibrado cotangente a un grupo de Lie
Definici
on:
Sea E un espacio vectorial con dim E = dim Q. Una trivializacion del fibrado cotangente
de una variedad diferenciable M es un difeomorfismo
T Q
: Q E T Q
tal que
1. (q, e) Tq Q, con (q, e) Q E,
2. (q, .) : E Tq Q es un isomorfismo de espacios vectoriales para cada q Q.
Para todo punto (q, e) tenemos las siguientes identificaciones:
T(e,q) (E Q)
= Te E Tq Q
= E Tq Q
T
(E Q) = T E T Q
= E T Q
(e,q)
L : G g T G,
(R, ) 7 R = TR
LR1
g
es decir,
hR , RAi = h, Ai
con A g. Asimismo, podemos identificar G g con T G con la correspondencia (R, A) 7
RA.
e =
Veamos como se reescribe la 1-forma de Liouville 1 T G como una 1-forma
e
L (G g ). De un modo similar tenemos la 2-forma
e = d = L , donde es la
forma simplectica canonica de T G.
22
: G g G g
(R, ) (R exp tA, + t)
(A,)
d
(A,)
(R, )
L t
dt t=0
d
R exp tA = RA
dt t=0
e
De este modo, ya podemos calcular :
e (R,) , (RA, )i = hL(R,) , T(R,) L(RA, )i
h
= hR , T(R,) ( L)(RA, )i
= hR , RAi = h, Ai = (A).
Para calcular la 2-forma
e utilizaremos la formula
e (A,) , X (B,) ) =
d(X
e + X (B,) yd X (A,) y
e + [X (A,) , X (B,) ]y
e
X (A,) yd X (B,) y
Calculemos cada uno de los terminos por separado. En primer lugar,
d
(A,)
(B,) e
=
(
)
X
y
(R, )
dt t=0 t
d
e
h(R
exp tA, + t), X (B,) (R exp tA, + t)i
=
dt t=0
d
e
=
h(R
exp tA, + t), (R exp (tA)B, )i
dt t=0
d
( + t)(B) = (B)
=
dt t=0
El segundo termino se calcula de un modo similar.
Para calcular el tercer termino observese que
d (B,)
(A,)
(B,)
(A,)
(R, )
t
t
t
dt t=0 t
d
(R exp tA exp tB exp tA exp tB, )
=
t=0
dt
= (R[A, B], 0)
23
As,
(A,)
e
e
([X
, X (B,) ])(R, ) = (R,
)(R[A, B], 0) = ([A, B])
En definitiva,
3.3.
Ecuaciones de Euler-Arnold
f
R
f
R
Entonces
f
R (R, )
G y
TR
f
(R, )
(g ) = g.
H
H
(R, )RB +
(R, )
R
H
H
(R, )TI LR B + (
(R, ))
R
24
dH(R, )(RB, ) =
e (R, ) (RX(R, ), (R, )), (RB, )
para todo B g y g . De otro modo,
dH(R, )(RB, ) = (R, )(B) + (X(R, )) + ([X(R, ), B])
Si hacemos B = 0 llegamos a que
(
H
(R, )) = (X(R, ))
H
(R, )
Si hacemos = 0, entonces,
H
(R, )RB = (R, )B + ([X(R, ), B])
R
o lo que es lo mismo,
H
(R, )TI LR B = (R, )B + (adX )(B)
R
para todo B g. Por tanto,
(R, ) = (TI LR )
H
(R, ) + adH/
R
H
= (TI LR )
(R, ) + adH/
R
En el caso en que el hamiltoniano H es invariante a izquierda entonces
ecuaciones de Euler-Arnold se escriben:
= TI LR H ()
R
= adH/
H
R
= 0 y las
25
3.4.
Podemos identificar so(3) con R3 por medio del producto escalar usual de R3 , as, si
so(3) , lo identificamos con el elemento
R3 de modo que
(
a) = (
, a), para todo a R3
Consideremos como hamiltoniano H : SO(3) so(3) R definido por
2
2
1 1 2 3
H(R,
) =
+
+
2 I1
I2
I3
el clasico Hamiltoniano del cuerpo rgido.
Como
=
=
=
=
H
, A]i
h, [
H\
(i(
) i(A))
H
(
, i(
) i(A))
H
), i(A))
(
i(
1 2 3
Luego como i( H
ltima
) = ( I1 , I2 , I3 ) las ecuaciones de Euler-Arnold (en este caso, la u
se llama de Lie-Poisson) son:
0
I33 I22
1
= R 3
R
0
I3
I1
2
1
I2
0
I1
1,
2,
3 ) = (1 , 2 , 3 ) (
(
1 2 3
,
,
).
I1 I2 I3
La u
ltima ecuacion se puede escribir de forma expandida como:
1 = I2 I3 2 3
I2 I3
I
I1
3
2 =
1 3
I1 I3
3 = I1 I2 1 2 .
I1 I2
Lecci
on 4
4.1.
Motivaci
on: aparcamiento de un vehculo
4.2.
m
X
ui Bi | u = (u1 , . . . , um ) U Rm },
i=1
m
X
ui RBi , con R G
i=1
26
27
4.3.
Accesibilidad y Controlabilidad
Definici
on: Una trayectoria de un sistema de control invariante a izquierda en G
es una curva continua R(t) en G definida en un intervalo [t0 , T ] R tal que existe una
particion
t0 < t1 < . . . < tN = T
y elementos,
A1 , . . . , AN
tal que la restriccion de R(t) a cada intervalo abierto (ti1 , ti ) es diferenciable y
R(t)
= R(t)Ai ,
i = 1, . . . , N.
Definici
on: Para cada T 0 y cada R G, el conjunto accesible a tiempo T desde R
del sistema de control invariante a izquierda g es el conjunto
A (R, T ) = {R(T ) | R(t) trayectoria de , R(0) = R},
(conjuntos de elementos de G accesibles desde R a tiempo T ).
Definici
on: El conjunto accesible a tiempo menor o igual que T se define como
[
A (R, T ) =
A (R, t).
0tT
Definici
on: El conjunto accesible se define como
[
A (R) =
A (R, T ).
T 0
Definici
on: El sistema g es controlable si para cada par de puntos R0 y R1 en G:
R1 A (R0 )
4.4.
R(t0 ) = R0
A1 , . . . , AN g
28
tal que
R(T ) = R0 exp (1 A1 ) exp (N AN )
y T t 0 = 1 + . . . + N .
Prueba: Por la definicion de trayectoria existe una particion
t0 < t1 < . . . < tN = T
y elementos,
A1 , . . . , AN ,
tal que la restriccion de R(t) a cada intervalo abierto (ti1 , ti ) es diferenciable y
R(t)
= R(t)Ai ,
i = 1, . . . , N.
= RA1 ,
R
R(t0 ) = R0 .
Por tanto,
R(t) = R0 exp ((t t0 )A1 ),
luego para
R(t) = R0 exp ((t1 t0 )A1 )exp ((t t1 )A2 ),
y
R(t2 ) = R0 exp ((t1 t0 )A1 ) exp ((t2 t1 )A2 ),
Llamando 1 = t1 t0 y 2 = t2 t0 se tiene que
R(t2 ) = R0 exp (1 A1 ) exp (2 A2 ),
Procediendo de este modo
R(tN ) = R(T ) = R0 exp (1 A1 ) exp (N AN )
con 1 = ti ti1 , i = 1, . . . , N y N + . . . + 1 = T .
De este lema deducimos facilmente que
A (R) = {R exp (t1 A1 ) exp (tN AN ) | Ai , ti > 0, N 0}
A (R) = RA (I)
A (R) es arco-conexo.
29
Por tanto, es facil deducir que O (I) es un subgrupo de Lie de G con algebra de Lie
asociada Lie .
Teorema: Un sistema de control g es controlable si y solamente si
1. G es conexo;
2. Lie = g;
3. A (I) es un subgrupo de G
Prueba:
La necesidad es trivial. Probaremos la suficiencia.
Si A (I) es un subgrupo de G, entonces para todo R A (I) tenemos que R1 A (I)
Como (exp (ti Ai ))1 = exp (ti Ai ) se deduce que A (I) = O (I). Por tanto, O (I) es
un subgrupo de Lie conexo con algebra de Lie g. Por tanto A (I) = G.
2.
Veanse mas caracterizaciones en:
Y.L. Sachkov: Control Theory on Lie groups, Lecures given in SISSA, Trieste,
Italy, January-February 2006.
http://digitallibrary.sissa.it/retrieve/1131/15-2006M.pdf
4.5.
Control
optimo
Todos los vehculos tripulados o no requieren un control si queremos que sigan un comportamiento adecuado o una planificacion prefijada. En el caso de un vehculo con ruedas
los controles nos permiten frenarlo, acelerarlo, llevarlo por la direccion requerida... Estos
controles se activan manualmente, por radio control o automaticamente, o los dise
na nuestro sistema (va feedback). Pueden actuar llevando nuestro sistema de un punto a otro o
evitando desviaciones de la trayectoria que queremos seguir. En muchos casos el sistema es
inestable y necesitamos introducir controles para evitar grandes perturbaciones del sistema.
30
4.6.
Principio del m
aximo de Pontryaguin
= f (x(t), u(t)),
x(t0 ) = x0 ,
x(t1 ) = x1
x M, u U Rm
t1
minimizar
L(x(t), u(t)) dt
t0
31
Lecci
on 5
Control
optimo de la posici
on de un cuerpo rgido
32
33
5.1.1.
R(t)
= R(t)(t)
0
3 (t) 2 (t)
= R(t)
0
1 (t)
3 (t)
2 (t) 1 (t)
0
(5.1.1)
R(t)
= R(t)(1 (t)E1 + 2 (t)E2 + 3 (t)E3 ),
34
definida por:
+ (c1 1 (t)p1 + c2 2 (t)p2 + c3 3 (t)p3 )
H(R, R , ) = hR , Ri
2
o
= 1 H1 + 2 H2 + 3 H3 ((c1 p11 + c2 p22 + c3 p33 )
2
donde Hi : T SO(3) R definida por Hi (R, ) = (Ei ), i = 1, 2, 3.
Supongamos que el control optimo este dado por funciones t 7 (1 (t), 2 (t), 3 (t))
entonces la trayectoria t 7 (t) T SO(3) verificar
a aplicando el principio del maximo
de Pontryagin que
(t) = 1 (t)XH1 ( (t)) + 2 (t)XH2 ( (t)) + 3 (t)XH3 ( (t))
5.1.2.
(5.1.2)
Supongamos que el parametro = 0 y que existe una solucion del problema de control
optimo. Entonces como
H( (t), (t)) H( (t), ),
para todo R3
es decir,
1 (t)H1 ( (t)) + 2 (t)H2 ( (t)) + 3 (t)H3 ( (t))
1 H1 ( (t)) + 2 H2 ( (t)) + 3 H3 ( (t))
para todo = (1 , 2 , 3 ) R3 .
De aqu facilmente se deduce que Hi ( (t)) = 0. Si denotamos por (R (t), (t))
SO(3) so(3) la trayectoria tal que L(R (t), (t)) = (t) entonces
0 = Hi ( (t)) = (t)(Ei ),
i = 1, 2, 3
5.1.3.
Tomamos el valor = 1.
Partimos de las ecuaciones
H
( (t)) = 0, i = 1, 2, 3, es decir
i
Hi ( (t)) = ci pi i (t)qi
35
1/q1
H2 ( (t)) 1/q2
H3 ( (t)) 1/q3
(t) = H1 ( (t))
XH1 ( (t))+
XH2 ( (t))+
XH3 ( (t))
c1 p1
c2 p2
c3 p3
que son las ecuaciones de Hamilton para el hamiltoniano
H0 =
3
X
j=1
qj
p /q
Hj j j
1/q
j
pj (cj pj )
3
X
j=1
Como
qj
p /q
j j j
1/q
pj (cj pj ) j
H
1
1/q
=
j
j
(cj pj )1/qj j
1
1
1
1/q1
1/q2
1/q3
(1 , 2 , 3 ) = (1 , 2 , 3 )
(c1 p1 )1/q1 1
(c2 p2 )1/q2 2
(c3 p3 )1/q3 3
Operando y reescribiendo las ecuaciones en terminos de los controles llegamos a que:
c1 p1 q1 q11 1 1 = c2 p2 3 q22 c3 p3 2 q33
c2 p2 q2 q22 1 2 = c3 p3 1 q33 c1 p1 3 q11
c3 p3 q3 q33 1 3 = c1 p1 2 q11 c2 p2 1 q22
Observese que si p1 = p2 = p3 = 2 entonces el funcional a minimizar es:
Z t1
minimizar
(c1 1 (t)2 + c2 2 (t)2 + c3 3 (t)2 ) dt
t0
en este caso las ecuaciones que describen los controles son precisamente las ecuaciones del
cuerpo rgido:
1 = c2 3 2 c3 2 3
c1
2 = c3 1 3 c1 3 1
c2
3 = c1 2 1 c2 1 2
c3
En el caso c1 = c2 = c3 , se tiene que las u
nicas soluciones son i (t) = i = constante.
As, debemos encontrar una curva R(t) verificando:
R(t)
= R(t)(1 E1 + 2 E2 + 3 E3 ),
36
o, lo que es lo mismo:
Llamando r =
sen(t1 t0 )r 1 cos(t1 t0 )r 2
R(t1 )R(t0 )1 = I +
+
(t1 t0 )r
(t1 t0 )2 r2
1 0 0
0
3 2
sen(t1 t0 )r
= 0 1 0 +
3
0
1
(t1 t0 )r
0 0 1
2 1
0
22 + 23 1 2 1 3
1 cos(t1 t0 )r
1 2 2 + 2 2 3
1
3
(t1 t0 )2 r2
1 3 2 3 21 + 22
5.2.
Vamos a calcular el camino mas corto entre dos puntos fijos R0 y R1 en SO(3), pero
U I .
37
R SO(3) U U,
R(0) = R0 ,
R(1) = R1
Z 1
minimizar
kU (t)k2k dt
fijos
(R , U ) 7 hR , Rui + kU k2k
2
o, trivializando,
H : SO(3) so(3) U
(R, , U ) 7 h, U i + kU k2k
2
o, si se prefiere, identificando so(3) por medio del producto escalar (vease Seccion 3.4))
H : SO(3) R3 Ue R
(R,
, u) 7 (
, u) + 2 (u, u)
donde u R3 con i(U ) = u. Asmismo, si b = i(B) entoncesUe = {}.
5.2.1.
Supongamos que = 0.
Tenemos que buscar maximoub (
, u).
Descomponiendo
=
k +
con
k kb y
b con la metrica eucldea estandar.
El probelma es equivalente a buscar maximou k(
, u) lo que equivale a que
= 0.
Se deduce que (t)
= (t)b con (t) 6= 0.
De las ecuaciones de Lie-Poisson para el cuerpo rgido (vease Leccion 3) se llega a que:
H
=
u
38
= (t)b u
con lo que se tiene que (b u)kb. Pero al ser u b se deduce que tambien (b u, b) = 0,
es decir que b u = 0. As se llega a que bku, pero de las hipotesis iniciales tenamos que
b u. As, u = 0 o expresado de otro modo u
= 0.
= R
Sustituyendo en las ecuaciones de control deducimos que R
u = 0; es decir, R(t) =
constante, que son las u
nicas soluciones abnormales o singulares.
5.2.2.
Tomamos = 1
De la condicion:
(
, u) + (u, u) m
aximoub
2
se llega a que el control optimo debe verificar:
u=
=
(
(b,
)b)
= (b,
)b
Observese que
d
(b,
) = (b,
) = (b,
)(b, b
) = 0.
dt
luego
(b,
(t)) = (b,
(0)).
Reescribiendo de nuevo las ecuaciones de Lie-Poisson como:
= (b,
(0))b
o llamando C = i1 ((b,
(0))b):
= C
39
con solucion
(t) = etC
(0)
Luego los controles buscados son:
u = etC
(0) (b, etC
(0))b
Dados estos controles ya solamente restara resolver la ecuacion:
= R
R
u,
con R(0) y R(1) fijos.
5.3.
Problema de control
optimo de una bola rodando en un
plano
i = 1, 2, 3.
OP = OO0 + O0 P
P(t) = X(t) + Q(t)
por tanto,
P(t)
= X(t)
+ Q(t)
= X(t)
+ qR(t)
40
R(t)
= R(t) (1 (t)E1 + 2 (t)E2 + 3 (t)E3 )
y, por tanto,
dQ
dt
La condicion de que la esfera rueda sin deslizamiento significa que la velocidad del punto
de contacto con el plano es cero con respecto a la referencia fija, es decir P = 0. Como ese
punto es Q = (0, 0, 1). Por tanto,
0 = (x,
y,
0) + (0, 0, 1) (1 , 2 , 3 )
Luego
x = 2
y = 1
Lamando u1 = 2 y u2 = 1 entonces llegamos al siguiente sistema de control:
x = u1
y = u2
= R u3
R
u1
u3 u1
0
u2
u2
En algunos ejemplos interesantes se supone que la bola rueda de tal modo que su velocidad angular es siempre paralela al plano horizontal, es decir u3 = 0, con lo que el sistema
de control queda:
x = u1
y = u2
u1
= R 0 0 u2
R
u1 u2
0
41
5.3.1.
An
alisis de la controlabilidad
Para expresarlo de un modo en que nos resulte mas sencillo aplicar las condiciones de
la Leccion 4 escribamos las siguientes matrices
R
0
10x
X= 0 01y
00 1
0
A = 0 00 00 cb
000
E1 0
1 =
,
E
0 0
0
0
0 0
4 =
E
0 0 0
0 0
E2 0
2 =
,
E
0 0
5 =
E
,
0
0
3 =
E
E3 0
0
0 0 1
0 0 0
0 0 0
2 , E
3 ] = E
1 ,
[E
3 , E
1 ] = E
2 ,
[E
4 , E
i ] = 0,
[E
5 , E
i ] = 0,
[E
con i = 1, . . . , 5.
Nuestro sistema de control se escribira
= R
R
0 0 u1
0 0 u2
u1 u2 0
0
!
0
0 0 u
1
0 0 u2
00 0
4 E
2 ) + u2 (E
5 + E
1 )
= R u1 (E
Tenemos un sistema de control invariante a izquierda donde es:
4 E
2 , E
5 + E
1 }
= {E
Es facil comprobar que Lie() = g y, por tanto, el sistema es controlable.
En breve, en estas notas, el interesante estudio del control optimo de este ejemplo.
Bibliografa
A.M. Bloch: Nonholonomic Mechanics and Control, Interdisciplinary Applied Mathematics, 24. Systems and Control. Springer-Verlag, New York, 2003.
Richard H. Cushman, Larry Bates: Global Aspects of Classical Integrable Systems, ,
Birkhauser, 1997.
V. Jurdjevic: Geometric Control Theory, Cambridge Studies in Advances Mathematics
51, Cambridge University Press, 1997.
Andrew Lewis, Course on Pontryagins Maximum Principle, course offered to graduate
students at Universitat Polit`ecnica de Catalunya
http://penelope.mast.queensu.ca/MP-course/
J. Marsden, T. Ratiu: Introduction to Mechanics and Symmetry, Springer-Verlag 1994
Y.L. Sachkov: Control Theory on Lie groups, Lecures given in SISSA, Trieste, Italy,
January-February 2006.
http://digitallibrary.sissa.it/retrieve/1131/15-2006M.pdf
Spindler, K. Optimal attitude control of a rigid body. Appl. Math. Optim. 34 (1996),
no. 1, 7990
42