Está en la página 1de 46

Control Optimo

en
grupos de Lie

David Martn de Diego


8-11 de mayo de 2007, UPC (Version del 23-05-2007)

Indice general
1. El grupo de rotaciones de R3 , SO(3)

1.1. Definicion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2. La aplicacion exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3. El Logaritmo Matricial en SO(3) . . . . . . . . . . . . . . . . . . . . . . . .

1.4. La metrica de Killing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.5. Identificacion con R3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.6. Teorema de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.7. Apendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2. El cuerpo rgido

12

2.1. Coordenadas espaciales, materiales y en el cuerpo . . . . . . . . . . . . . . .

12

2.2. El Lagrangiano del cuerpo rgido . . . . . . . . . . . . . . . . . . . . . . . .

13

2.3. Ecuaciones de Euler-Poincare . . . . . . . . . . . . . . . . . . . . . . . . . .

15

3. Sistemas Hamiltonianos en grupos de Lie

20

3.1. Campos invariantes a la izquierda . . . . . . . . . . . . . . . . . . . . . . . .

20

3.2. Trivializacion del fibrado cotangente a un grupo de Lie . . . . . . . . . . . .

21

3.3. Ecuaciones de Euler-Arnold . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

3.4. Ecuaciones de Euler-Arnold para el cuerpo rgido . . . . . . . . . . . . . . .

25

4. Control en grupos de Lie

26
2

4.1. Motivacion: aparcamiento de un vehculo . . . . . . . . . . . . . . . . . . . .

26

4.2. Sistemas de control invariantes a izquierda . . . . . . . . . . . . . . . . . . .

26

4.3. Accesibilidad y Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . .

27

4.4. Propiedades del conjunto accesible . . . . . . . . . . . . . . . . . . . . . . .

27

4.5. Control optimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

29

4.6. Principio del maximo de Pontryaguin . . . . . . . . . . . . . . . . . . . . . .

30

5. Ejemplos de problemas de control


optimo en grupos de Lie
5.1. Control optimo de la posicion de un cuerpo rgido

32

. . . . . . . . . . . . . .

32

5.1.1. Ecuaciones de control del cuerpo rgido . . . . . . . . . . . . . . . .

33

5.1.2. Estudio de las soluciones singulares o abnormales . . . . . . . . . . .

34

5.1.3. Estudio de las soluciones regulares . . . . . . . . . . . . . . . . . . .

34

5.2. Problema subriemanniano en SO(3) . . . . . . . . . . . . . . . . . . . . . .

36

5.2.1. Estudio de las soluciones singulares o abnormales . . . . . . . . . . .

37

5.2.2. Estudio de las soluciones regulares . . . . . . . . . . . . . . . . . . .

38

5.3. Problema de control optimo de una bola rodando en un plano . . . . . . . .

39

5.3.1. Analisis de la controlabilidad . . . . . . . . . . . . . . . . . . . . . .

41

Lecci
on 1

El grupo de rotaciones de R3, SO(3)


En esta leccion introductoria expondremos algunos resultados tecnicos sobre el grupo
de rotaciones SO(3).

1.1.

Definici
on

Consideremos el espacio eucldeo R3 con su producto escalar usual ( , ):


((x1 , x2 , x3 ), (y1 , y2 , y3 )) = x1 y1 + x2 y2 + x3 y3 .
Tambien denotaremos el producto escalar como (x, y) = x y donde x = (x1 , x2 , x3 ) e
y = (y1 , y2 , y3 ).
El grupo ortogonal O(3) esta formado por el conjunto de las transformaciones lineales de
que preservan el producto escalar usual. Es decir, si denotamos por M (3) L(R3 , R3 )
al conjunto de las matrices reales:
R3

M (3) = {R = (Rij ) | Rij R, i, j = 1, 2, 3}


entonces R O(3) si se verifica que
(Rx, Ry) = (x, y).
Por tanto,
O(3) = {R M (3) | RRT = I},
donde RT denota la matriz transpuesta de R e I es la matriz identidad. Como det(RRT ) =
(det R)2 = 1 entonces det R = 1, lo que divide al grupo ortogonal O(3) en dos componentes conexas.
El grupo de rotaciones SO(3) es la componente conexa de O(3) que contiene la identidad
I; es decir,
SO(3) = {R M (3) | RRT = I , det R = 1}.
1

SO(3) es un grupo de Lie compacto y conexo.


El algebra de Lie so(3) de SO(3) es

so(3) = TI SO(3) = {R(0)


| R(t) SO(3), R(0) = I} = {A M (3) | A es antisimetrica}.
(Idea de la demostraci
on: Tenemos que R(t)R(t)T = I y, entonces,
T
T

T
0 = R(0)R(0)
+ R(0)R(0)
= A(0)
+ A(0)

Si denotamos por A = R(0)


obtenemos que A + AT = 0.)
Por tanto, un matriz A so(3) si y solo si es una matriz real 3 3 antisimetrica, o, lo
que es lo mismo,
(Ax, y) + (x, Ay) = 0
El algebra de Lie so(3) tiene un corchete de Lie [ , ] determinado por las relaciones:
[E1 , E2 ] = E1 E2 E2 E1 = E3 ,

[E2 , E3 ] = E1 ,

[E3 , E1 ] = E2

donde {E1 , E2 , E3 } es la base estandar de so(3):

0 0

E1 =
0 0 1 ,
0 1 0

0 1

E2 =
0 0 0 ,
1 0 0

0 1 0

E3 =
1
0

0
0

0
.
0

De una forma mas breve escribiremos


[Ei , Ej ] =

3
X

ijk Ek

k=1

donde ijk = 0 si alguno de los subndices coincide; ijk = 1 si (ijk) es una permutaci
on par
de (123); y ijk = 1 si (ijk) es una permutaci
on impar.

1.2.

La aplicaci
on exponencial

Para cada A so(3) definimos:


exp A = eA = I + A +

A2
An
+ ... +
+ ...
2!
n!

Veamos en primer lugar que exp A SO(3)


Prueba: Como A es antisimetrica:
(exp A)T =

X
1 T n X 1
(A ) =
(A)n = exp(A) = (exp A)1 .
n!
n!

n=0

n=0

Por tanto exp A O(3). Como exp 0 = I y exp es continua deducimos que exp A SO(3)
2.
F
ormula de Rodrigues. Para cualquier matriz de so(3),

A=
a3
a2

a3
0
a1

a2

a1

p
no nula, es decir (a1 , a2 , a3 ) 6= (0, 0, 0), si denotamos por r = a21 + a22 + a23 se tiene que el
polinomio caracterstico:

a a
3
2

3
2
p() = a3
a1 = r = 0

a2 a1

Entonces A3 = r2 A (Teorema de Cayley-Hamilton). Deducimos que:
A2n+1 = (1)n r2n A
A2n+2 = (1)n r2n A2 ,

n0

De la expresion de la exponencial de la matriz A se llega a que


exp A =

X
1 n
A
n!

n=0

= I+
I+

X
n=0

X
n=0

X
1
1
A2n+1 +
A2n+2
(2n + 1)!
(2n + 2)!
n=0

X
(1)n 2n 2
2n
r A+
r A
(2n + 1)!
(2n + 2)!

(1)n

n=0

sen r
1 cos r 2
= I+
A+
A
r
r
recordando que
sen x =
cos x =

X
(1)n 2n+1
x
(2n + 1)!

n=0

n=0

(1)n 2n
x
(2n)!

La siguiente propiedad de la exponencial sera u


til en lo sucesivo:

d
d
t2 A2
tn An
exp (tA) =
I + tA +
+ ... +
+ ...
dt
dt
2!
n!
t2 A3
tn An+1
= A + tA2 +
+ ... +
+ ...
2!
n!
= exp (tA)A.

d
exp (tA) = A.
En particular, dt
t=0

1.3.

El Logaritmo Matricial en SO(3)

Sea A so(3) una matriz antisimetrica y denotemos por R su exponencial, es decir:


R = exp(A) =

X
1 n
A .
n!

n=0

Por la formula de Rodrigues, tenemos:


R=I+

sin r
1 cos r 2
A+
A ,
r
r2

donde r = kki(A)kk = kkakk, con a


= A. Descomponiendo R I en parte simetrica y
antisimetrica, obtenemos:
1
1
R = I + (R RT ) + (R + RT 2I).
2
2
Luego, por la unicidad de la descomposicion,
A=

r
(R RT ) y
2 sin r

r2
(R + RT 2I).
2(1 cos r)

Aplicando la traza a la segunda igualdad, deducimos que


2r2 = traza (A2 ) =
y por tanto,

r2
(2traza (R) 6),
2(1 cos r)

1
1
r = acos ( Tr(R) ),
2
2

siempre y cuando 0 < r < .


Theorem: La exponencial matricial es un difeomormismo analtico de {A so(3) :
0 kki(A)kk < } en {R SO(3) : traza (R) 6= 1}. Su inversa log : SO(3) so(3)
viene dada por:

0
R=I
log(R) =
(R) (R RT ) R 6= I
2 sin (R)

donde (R) = acos ( 12 traza (R) 12 ).


Prueba: La demostracion de que log es efectivamente la inversa de la exponencial
matricial exp se deduce de la discusion anterior. Para la analiticidad, basta observar que
las aplicaciones que entran en juego en la deficion del logartmo matricial son analticas.
Comentario: El resultado anterior, deja entrever que la exponencial matricial no es in\
yectiva, al igual que ocurre con la exponencial compleja. Baste observar que exp (2k,
0, 0) =
I para todo k Z (formula de Rodrigues).

1.4.

La m
etrica de Killing

En so(3) hay un producto escalar


k : so(3) so(3) R
llamado la metrica de Killing y definida por
1
1
k(A, B) = traza AB = traza AB T
2
2
Comentario:
Se
nalaremos a continuacion algunas de las propiedades de la traza que pueden resultar
de interes en el futuro. As, para A, B, C M (n) (matrices cuadradas de orden n) y R,
se verifica que
(1)

traza(A + B) = trazaA + trazaB,

(2)

traza(A) = traza(A),

(3)

trazaAT = trazaA,

(4)

traza(ABC) = traza(CAB) = traza(BCA),

(5)

traza A = traza(B 1 AB),

si B es invertible.2

La metrica de Killing verifica las siguientes propiedades:


k es definida positiva
P
Prueba: Sea A = 3i=1 xi Ei , then

1
kAk2k = k(A, A) = traza
a3
2
a2
y es 0 u
nicamente cuando A = 0.

a3
0
a1

a2

2
2
2
a1
= a1 + a2 + a3 0
0
2

Si R SO(3), sea AdR A = RAR1 so(3), entonces k es AdR invariante, es decir,


para todo A, B so(3) se tiene que
k(AdR A, AdR B) = k(A, B)
Prueba:
1
1
k(AdR A, AdR B) = traza(RABR1 ) = traza(AB) = k(A, B)
2
2

Para cada R SO(3) se tiene que


AdR1 = k ] AdR k [
Prueba: La aplicacion k ] : so(3) so(3) esta definida por k ] (A)(B) = k(A, B) y
k [ = (k ] )1 .
Para todo A, B so(3), como k es Ad-invariante, tenemos que
k(AdR A, B) = k(A, AdR1 B)
De otro modo
k ] (AdR A)(B) = k ] (A)(AdR1 B) = (AdR1 k ] (A)(B)
para todo B so(3). Deducimos que
k ] AdR (A) = AdR1 k ] (A),
de lo que se deduce la propiedad buscada.

A so(3)

Para todo A, B, C so(3) se verifica que k([C, A], B) + k(A, [C, B]) = 0. (Recuerdese
que [A, B] = AB BA).
Prueba: Es una consecuencia directa de la cuarta propiedad de la traza.

Dados B, C so(3) y la curva R(t) = exp (tC) (recuerdese que R(0) = I y R(0)
= C)
calculemos en primer lugar

d
Ad
B
=
exp
(tC)
dt t=0

d
1
exp
(tC)B(exp
(tC))
dt t=0

d
=
R(t)BR(t)1
t=0
dt

d
=
R(t)BR(t)1
t=0
dt
d
1

= R(0)BR(0)
+ R(0)B t=0 (R(t)1 )
dt

Pero diferenciando R(t)R(t)1 = I deducimos que


d
1

(R(t)1 ) = R(t)1 R(t)R(t)


dt t=0
Por tanto,

d
1
dt t=0 (R(t) )

= C.

As
adC B =

d
Ad exp
dt t=0

(tC) B

= CB BC = [C, B]

Sera u
til la siguiente formula et adA B = etA BetA
Prueba:
Considera la aplicacion (t) : so(3) so(3) definida por (t)(B) = etA BetA con
A, B so(3) y A fijado.
Entonces 0 (0) : so(3) so(3) es igual a 0 (0)(B) = [A, B] = adA (B). As, etadA B =
etA BetA .
2.

1.5.

Identificaci
on con R3

Considera la aplicacion lineal

i
a3
a2

i : so(3) R3 definida por

a3 a2

0
a1
= (a1 , a2 , a3 ) = a
a1
0

Observese que i(E1 ) = (1, 0, 0), i(E2 ) = (0, 1, 0) e i(E3 ) = (0, 0, 1).
Veamos algunas propiedades de la aplicacion i:
i es una isometra de (so(3), k) en (R3 , ( , )).
P
P
Prueba: Para A = 3i=1 ai Ei y B = 3i=1 bi Ei tenemos que
k(A, B) = a1 b1 + a2 b2 + a3 b3 = ((a1 , a2 , a3 ), (b1 , b2 , b3 )) = a b .

i es un isomorfismo del algebra de Lie (so(3), [ , ]) con el algebra de Lie (R3 , ), donde
denota el producto vectorial en R3 .

i([A, B]) = i(

3
X

i,j,k=1

ijk ai bj Ek ) =

3
X
i,j,k=1

.
Frecuentemente denotaremos i1 (a) = a

ijk ai bj = a b = i(A) i(B) = Ab

b entonces para
Veamos la propiedad anterior usando esta notacion. Como a b = a
3
todos a, b, c R se verifica que

(b
a)c
[
a, b]c
= (
ab)c
c)
(b c) b(a
= a
= a (b c) b (a c)
\
= (a b) c = a
bc
i intercambia la accion adjunta de SO(3) en so(3) con la accion usual de SO(3) en
R3 .
Prueba: Sea R SO(3) y define la aplicacion R : R3 R3 por x i(AdR i1 (x)) =
). Se verifica para todo y R3 que
i(AdR x
R (x) y = (R
xR1 )y = R
x(R1 y)
= R(x R1 y)
= (Rx) y
aplicando que el producto vectorial es invariante por rotaciones (vease apendice al
final del captulo).

1.6.

Teorema de Euler

Lema. Cada R SO(3) tiene un autovalor igual a 1.


Prueba: Los autovalores de R viene dados por las races de la ecuacion de tercer grado
el autovalor real y v un vector
det(R I) = 0; luego al menos un autovalor es real. Sea
propio no nulo

Rv = v.
Tenemos que, al estar R SO(3),
k Rv k2 =k v k2 ,
Como

2 k v k2 .
k v k2 =k Rv k2 =

As, si los tres autovalores son reales deben ser 1, 1, 1 o 1, 1, 1 pues det R = 1. En el caso
de que haya races complejas {1, ,
}.
2.
Teorema de Euler. Cada elemento de SO(3) es una rotacion de angulo sobre el eje
v.
Prueba: Por el lema anterior existe un autovector v tal que Rv = v. El subespacio
generado por v tambien es R-invariante.

Considerese el plano perpendicular P a v, es decir,


P = {y |(v, y) = 0}
Como R SO(3), se verifica para todo y P
0 = (y, v) = (Ry, Rv) = (Ry, v)
luego se deduce que RP = P . Sea {e1 , e2 } una base ortogonal en P . Relativa a {v, e1 , e2 },
la matriz R se escribira

1 0 0

R=
0 a1 a2 .
0 a3 a4
Como la matriz

R=

esta en SO(2), se deduce

a1 a2

a3 a4
0

.
R=
0
cos

sen

0 sen
cos

1.7.

Ap
endice

Teorema
Sea R SO(3). Entonces para cualesquiera vectores u, v en R3 ,
R(u v) = (Ru) (Rv).
Prueba. Fijemos una base ortonormal orientada a derecha en R3 . Sean {u1 , u2 , u3 } y
{v1 , v2 , v3 } las componentes de u y v en dicha base. En esa misma base denota las componentes de R por Rij . Como R es una rotacion, entonces Rij Rkj = ik P
donde ik es la delta
de Kronecker. La i-esima coordenada de u v sera igual a(u v)i = 3i,j=1 ijk uj vk . Para
la k-esima coordenada de (R u) (R v) se tiene que
((R u) (R v))k = imk Rij Rmn uj vn
= iml kl Rij Rmn uj vn
= iml Rkr Rlr Rij Rmn uj vn
= jnr det R Rkr uj vn .

10

entendiendo suma cuando aparecen ndices repetidos. En la u


ltima lnea hemos usado que
im
jn
kr
i1
j2
k3
ijk R R R = mnr ijk R R R = mnr det R. Como det R = 1, se sigue que
((R u) (R v))k = Rkr jnr uj v n
= Rkr (u v)r
= (R u v)k .
2

11

Lecci
on 2

El cuerpo rgido
En esta leccion analizaremos en detalle un ejemplo de sistema mecanico cuyo espacio de
fases es el algebra de Lie so(3) del grupo de Lie SO(3). Este sistema describe el movimiento
de un cuerpo rgido sobre un punto fijo sin la accion de ninguna fuerza externa; entendiendo por cuerpo rgido un sistema de partculas donde las distancias entre ellas permanece
invariable. Al final de la leccion estudiaremos la dinamica, deduciendo las ecuaciones del
movimiento aplicando un principio variacional adecuado.

2.1.

Coordenadas espaciales, materiales y en el cuerpo

Considerese un cuerpo rgido moviendose libremente en el espacio eucldeo R3 .


Una configuraci
on de referencia B consiste en fijar un compacto, clausura de un abierto
3
de R con frontera diferenciable.
Fijada una referencia ortonormal (E1 , E2 , E3 ), entonces un punto X B (punto material ) tendra coordenadas X = (X1 , X2 , X3 ) llamadas coordenadas materiales.
Una configuraci
on en B es una aplicacion : B R3 que es C 1 , preservando orientaci
on
e invertible en su imagen.
Fijada una referencia ortonormal (e1 , e2 , e3 ) en R3 , entonces un punto x = (X) (punto
espacial ) tendra coordenadas x = (x1 , x2 , x3 ) llamadas coordenadas espaciales.
Un movimiento de B es una familia dependiente del tiempo de configuraciones. Usaremos
indistintamente las siguientes notaciones
x = (t, X) = t (X) = x(t, X) = xt (X)
Identificamos x(0, X) X.
Un cuerpo rgido es una coleccion de partculas de modo que la distancia entre cualesquiera dos partculas permanece fija independientemente del movimiento del cuerpo o las
fuerzas ejercidas en el cuerpo. Supongamos que el cuerpo rgido tiene el centro de masas
12

13

fijo en el origen. Toda isometra de R3 que deja fijo el origen es un elemento del grupo
ortogonal. Por tanto,
xt (X) = R(t)X
En coordenadas, xi (t) = Rij (t)Xj donde (Rij ) es la matriz de R relativa a las bases
(E1 , E2 , E3 ) y (e1 , e2 , e3 ).
La dinamica se supone que es continua y R(0) es la identidad, entoces det R(t) = 1 y,
por lo tanto, R(t) SO(3).
De lo que conclumos que:
El espacio de configuraci
on del cuerpo rgido es SO(3), su espacio de fases de
velocidades es T SO(3) y el espacio de fases de momentos es T SO(3).
Hay un tercer tipo de coordenadas que seran de interes, las coordenadas en el cuerpo o
coordenadas convectivas. Son coordenadas asociadas a una referencia que se mueve con el
cuerpo. Consideremos la base dependiente del tiempo:
i = R(t)Ei ,

i = 1, 2, 3

Las coordenadas en el cuerpo de un elemento de R3 son sus coordenadas respecto a la base


{1 , 2 , 3 }.

2.2.

El Lagrangiano del cuerpo rgido

La trayectoria de un punto material X B es x(t) = R(t)X con R(t) SO(3).


Definici
on: Velocidad lagrangiana o velocidad material :
V (X, t) =

(X, t) = R(t)X
t

Definici
on: Velocidad euleriana o velocidad espacial:
1

v(x, t) = V (X, t) = R(t)R(t)


x

Definici
on: Velocidad convectiva o velocidad en el cuerpo:
X
1

(x, t) = R(t)1 R(t)R(t)


x
t

= R(t)1 R(t)X

V(X, t) =

= R(t)1 V (X, t)
= R(t)1 v(x, t)
Supongamos que la distribucion de masa en el cuerpo esta descrita por una densidad
0 d3 X en la configuracion de referencia.

14

El Lagrangiano cinetico vendr


a dado por la siguiente expresion:
Z
1
0 (X)kV (X, t)k2 d3 X
L =
2 B
Z
1
2 3

=
0 (X)kR(t)Xk
d X
2 B
Como R(t) SO(3), entonces diferenciando con respecto a t, R(t)T R(t) = I y R(t)R(t)T =
1 est

y R(t)R(t)
a en so(3). Definen, en particular, la velocidad
I, llegamos a que R(t)1 R(t)
3
angular espacial (t) R :
1

b (t) = R(t)R(t)
y la velocidad angular convectiva (t) R3 :

b = R(t)1 R(t)
(t)
d = (t) x y V(X, t) = (t)X
d = (t) X.
Observese que v(x, t) = (t)x
Como

b 1 = AdR
b

b = RR

entonces = R.
Veamos que el lagrangiano L : T SO(3) R es invariante a izquierda por SO(3). As,
= L(BR, BR):

si B SO(3) comprobemos que L(R, R)


Z
1
2 3

L(BR, BR) =
0 (X)kBR(t)X)k
d X
2 B
Z
1
2 3

=
0 (X)kR(t)X)k
d X
2 B

= L(R, R)
pues B es ortogonal.
= L(R1 R, R1 R)
= L(I, )
= l()
De este modo L(R, R)
Estudiemos distintas expresiones mas manejables del lagrangiano del cuerpo rgido (libre):
Z
1
L =
0 (X)kV (X, t)k2 d3 X
2 B
Z
1
2 3

0 (X)kRXk
d X
=
2 B
Z
1
2 3

=
0 (X)kR1 RXk
d X
2 B
Z
1
2 d3 X
0 (X)kXk
=
2 B
Z
1
=
0 (X)k Xk2 d3 X
2 B

15

Introduce el producto escalar en R3 :


Z
a, b =
B

0 (X)(a X, b X)d3 X

As,

1
,
2
Construye el isomorfismo lineal II : R3 R3 definido por
l() =

(IIa, b) = a, b ,

para todo a, b R3 .

Por definicion, (IIa, b) = (a, IIb). Entonces II es simetrica y, ademas, definida positiva (bajo
adecuadas hipotesis iniciales). Como II es simetrica, puede ser diagonalizada. Si escogemos
un base ortonormal (E1 , E2 , E3 ) para la que II es diagonal entonces
l() =

1
1
1
, = (II, ) = (I1 21 + I2 22 + I3 23 ).
2
2
2

Si denotamos por = II entonces tendremos la funcion:

1 21 22 23
+
+
H() =
2 I1
I2
I3

2.3.

Ecuaciones de Euler-Poincar
e

En la siguiente seccion vamos a probar la relacion siguiente:


Teorema: La curva R(t) SO(3) verifica las ecuaciones de Euler-Lagrange para
si y solo si (t) = i(R(t)1 R(t))

L(R, R)
verifica las ecuaciones de Euler:
= II .
II
Demostraci
on:
Sabemos por calculo de variaciones que L satisface las ecuaciones de Euler-Lagrange si y
solo si
Z
L dt = 0
Consideremos l : so(3) R definido por l() = 21 (II, ).
Tomando una variacion R (t) de la curva R(t) tendremos una variaci
on de la curva
[
(t) en el algebra de Lie so(3). Si llamamos
d
R(t) =
R (t)
d =0
d
(t) =
(t)
d =0

16

=
b obtenemos:
Derivando con respecto a la relacion R1 R
c
+ R1 ( R)
= .
R1 (R)R1 R
b
Define la matriz antisimetrica :

b = R1 R

b de R3 .
y el vector = i()
Observese que:

1 R + R1 ( R)

b = R1 RR

Luego

b + R1 R
b
R1 R

por lo tanto,

c
b
b +
b +
b
b =

es decir,

c =
b + [,
b ]
b

o, lo que es lo mismo,

= +

En definitiva hemos probado que que las ecuaciones variacionales


son equivalentes al principio variacional reducido
Z t1

l dt = 0

R t1
t0

L dt = 0 en T SO(3)

t0

+ con (t0 ) = 0 y (t1 ) = 0.


en R3 donde las variaciones son de la forma =
1
En nuestro caso como l() = 2 (II, ) entonces
Z

t1

t1

l dt =
t0

(II, ) dt
t0
Z t1

=
t0
Z t1

=
t0
t1

Z
=

+ ) dt
(II,
h
i
) + (II, ) dt
(II ,

+ II ), dt
(II

t0

donde hemos integrando por partes y usado las condiciones (t0 ) = 0 y (t1 ) = 0. Al ser
arbitrario llegamos a que:
+ II = 0
II

17

que son las ecuaciones de Euler para el cuerpo rgido:


1 = (I2 I3 )2 3
I1
2 = (I3 I1 )1 3
I2
3 = (I1 I2 )1 2
I3
El resultado anterior se puede generalizar para un grupo de matrices arbitrario distinto
de SO(3).
Teorema
Sea G un grupo de Lie de matrices y L : T G R un Lagrangiano G-invariante a
izquierda. Sea l : g R su restriccion a la identidad. Para una curva R(t) G, sea

(t) = TR(t) LR(t)1 R(t).


Entonces son equivalentes:
(i) R(t) satisface las ecuaciones de Euler-Lagrange para L;
(ii) R(t) extremiza el funcional
Z
R() 7

L(R(t), R(t))
dt

para variaciones con puntos inicial y final fijados.


(iii) Se verifican las ecuaciones de Euler-Poincare:
l
d l
= ad
.
dt

(iv) (t) extremiza

Z
() 7

l((t)) dt

para variaciones de la forma


= + [, ]
Prueba:
Suponemos conocida por el alumno la equivalencia de (i) e (ii).
Veamos que (ii) e (iv) son equivalentes. Para ello vamos a calcular las variaciones infini Si llamamos R = dR /d en = 0 para variaciones R de
tesimales donde = R1 R.
R. Procediendo del mismo modo que en el teorema anterior llegamos a que si = R1 R
entonces
= [, ]
con lo que se deduce facilmente la equivalencia.

18

Para finalizar comprobemos la equivalencia entre (iii) y (iv):


Z
Z
l
l() dt =
dt

Z
l
=
( + ad ) dt

Z
d l
l
=

+ ad
dt
dt

2
Si escogemos un base {E1 , . . . En } de g tal que
k
[Ei , Ej ] = Cij
Ek

entonces todo elemento = i Ei . En estas coordenadas, las ecuaciones de Euler-Poincare se


escriben del siguiente modo:

d
l
k j l
= Cji

dt i
k
En la siguiente leccion veremos la formulaci
on hamiltoniana de las ecuaciones de EulerPoincare. Observese que si llamamos
=

l
g ,

y suponemos que = () utilizando la expresion anterior. As, se define


h() = h, i l() .
Entonces

l
= + h,
ih ,
i=

Luego podemos escribir las ecuaciones del movimiento como:


= adh/
que se conocen como ecuaciones de Lie-Poisson.

19

Lecci
on 3

Sistemas Hamiltonianos en grupos


de Lie
La siguiente leccion practicamente consistira en un ejercicio de geometra simplectica.
Las ecuaciones obtenidas constituyen uno de los pilares de la mecanica: las ecuaciones
de Euler-Arnold y de Lie-Poisson. Ademas los resultados obtenidos seran cruciales para
analizar las soluciones de los problemas de control optimo en grupos de Lie.

3.1.

Campos invariantes a la izquierda

Sea G un grupo de Lie y g su algebra de Lie.


Recordemos que dado A g la ecuacion diferencial
= RA,
R

R(0) = R0 ,

RG

tiene una u
nica solucion R(t) = R0 exp (tA) (ver propiedades de la exponencial).
Analicemos a continuacion cual es el espacio tangente a G en R.
Proposici
on:
Dado R G se verifica que:
TR G = {RA | A g} = Rg = TI lR (g).
Prueba: El espacio tangente a en R a G es:

TR G = {R(0)
| R(t) G, R(0) = R}
20

21

Podemos pasar de esta curva comenzando en R a una curva comenzando en la identidad I:


Y (t) = R1 (0)R(t)
Entonces

Y (0) = R1 (0)R(0)
g.

Si denotamos A = Y (0) entonces

R(0)
= RA

As, deducimos que TR G Rg. Como ambos tienen la misma dimension entonces TR G =
Rg.
2.

3.2.

Trivializaci
on del fibrado cotangente a un grupo de Lie

Definici
on:
Sea E un espacio vectorial con dim E = dim Q. Una trivializacion del fibrado cotangente
de una variedad diferenciable M es un difeomorfismo

T Q

: Q E T Q
tal que
1. (q, e) Tq Q, con (q, e) Q E,
2. (q, .) : E Tq Q es un isomorfismo de espacios vectoriales para cada q Q.
Para todo punto (q, e) tenemos las siguientes identificaciones:
T(e,q) (E Q)
= Te E Tq Q
= E Tq Q

T
(E Q) = T E T Q
= E T Q
(e,q)

Supongamos ahora que T Q es el fibrado cotangente T G de un grupo de Lie G y sea


el dual de su algebra de Lie g. Denotaremos : T G G, R 7 R a la proyecci
on
canonica. Es claro que T G admite una trivializacion (usando, por ejemplo, la translacion
a izquierda):

L : G g T G,
(R, ) 7 R = TR
LR1
g

es decir,
hR , RAi = h, Ai
con A g. Asimismo, podemos identificar G g con T G con la correspondencia (R, A) 7
RA.
e =
Veamos como se reescribe la 1-forma de Liouville 1 T G como una 1-forma

e
L (G g ). De un modo similar tenemos la 2-forma
e = d = L , donde es la
forma simplectica canonica de T G.

22

Para calcular estas formas, veamos quien es primero la aplicacion tangente de L.


Dados A g y g consideremos la aplicacion
(A,)

: G g G g
(R, ) (R exp tA, + t)

(A,)

es el flujo del campo de vectores X (A,) en G g definido por


X (A,) (R, ) = (RA, )

Por tanto, la aplicacion tangente de L es:


T(R,) ( L)(RA, ) =
=

d
(A,)
(R, )
L t
dt t=0
d
R exp tA = RA
dt t=0

e
De este modo, ya podemos calcular :
e (R,) , (RA, )i = hL(R,) , T(R,) L(RA, )i
h
= hR , T(R,) ( L)(RA, )i
= hR , RAi = h, Ai = (A).
Para calcular la 2-forma
e utilizaremos la formula
e (A,) , X (B,) ) =
d(X

e + X (B,) yd X (A,) y
e + [X (A,) , X (B,) ]y
e
X (A,) yd X (B,) y
Calculemos cada uno de los terminos por separado. En primer lugar,

e (R, ) = L (A,) X (B,) y


e (R, )
X (A,) yd X (B,) y
X

d
(A,)
(B,) e
=
(
)
X
y

(R, )
dt t=0 t
d
e
h(R
exp tA, + t), X (B,) (R exp tA, + t)i
=
dt t=0
d
e
=
h(R
exp tA, + t), (R exp (tA)B, )i
dt t=0
d
( + t)(B) = (B)
=
dt t=0
El segundo termino se calcula de un modo similar.
Para calcular el tercer termino observese que

d (B,)
(A,)
(B,)
(A,)

[X (A,) , X (B,) ](R, ) =

(R, )
t
t
t
dt t=0 t

d
(R exp tA exp tB exp tA exp tB, )
=
t=0
dt
= (R[A, B], 0)

23

As,
(A,)
e
e
([X
, X (B,) ])(R, ) = (R,
)(R[A, B], 0) = ([A, B])

En definitiva,

e (R, )((RA, ), (RB, )) = (B) + (A) + ([A, B])

3.3.

Ecuaciones de Euler-Arnold

En esta seccion vamos a encontrar las ecuaciones de Hamilton en el fibrado cotangente


de un grupo de Lie, que ha sido trivializado usando translaciones a izquierda.
Supongamos que H : T G R es una funcion diferenciable. El campo de vectores
hamiltoniano XH en la variedad simplectica (T G, ) esta definido por las ecuaciones
iXH = dH
Consideremos el hamiltoniano H : G g R definido por H(R, ) = H(L(R, )) =
H(R ). De este modo podemos encontrar el campo de vectores
iXH
e = dH
Vamos a encontrar las ecuaciones de Hamilton; es decir, las ecuaciones de las curvas integrales de del campo de vectores XH en G g . En este contexto, a estas ecuaciones se las
conoce como ecuaciones de Euler-Arnold.
Para cada funcion f : G g R denotaremos por
de f ; es decir

f
R

las derivadas parciales

f
R

es la diferencial de la restriccion de f a valores = constante,

es la diferencial de la restriccion de f a valores R = constante.

Entonces

f
R (R, )

G y
TR

f
(R, )

(g ) = g.

As, deducimos que


dH(R, )(RB, ) =
=

H
H
(R, )RB +
(R, )
R

H
H
(R, )TI LR B + (
(R, ))
R

Como XH (R, ) TR G g entonces, existiran X(R, ) g y (R, ) g de modo


que
XH (R, ) = (RX(R, ), (R, )) = (TI LR (X(R, )), (R, ))

24

Pero por definicion de XH :

dH(R, )(RB, ) =
e (R, ) (RX(R, ), (R, )), (RB, )
para todo B g y g . De otro modo,
dH(R, )(RB, ) = (R, )(B) + (X(R, )) + ([X(R, ), B])
Si hacemos B = 0 llegamos a que
(

H
(R, )) = (X(R, ))

para todo g . Por tanto,


X(R, ) =

H
(R, )

Si hacemos = 0, entonces,
H
(R, )RB = (R, )B + ([X(R, ), B])
R
o lo que es lo mismo,
H
(R, )TI LR B = (R, )B + (adX )(B)
R
para todo B g. Por tanto,
(R, ) = (TI LR )

H
(R, ) + adH/
R

Luego las ecuaciones de Euler-Arnold son:


= TI LR H (R, ) = R H
R

H
= (TI LR )
(R, ) + adH/
R
En el caso en que el hamiltoniano H es invariante a izquierda entonces
ecuaciones de Euler-Arnold se escriben:
= TI LR H ()
R

= adH/

H
R

= 0 y las

25

3.4.

Ecuaciones de Euler-Arnold para el cuerpo rgido

Podemos identificar so(3) con R3 por medio del producto escalar usual de R3 , as, si
so(3) , lo identificamos con el elemento
R3 de modo que
(
a) = (
, a), para todo a R3
Consideremos como hamiltoniano H : SO(3) so(3) R definido por

1 ((E1 ))2 ((E2 ))2 ((E3 ))2


H(R, ) =
+
+
2
I1
I2
I3
que expresado como un hamiltoniano H : SO(3) R3 R si
= (1 , 2 , 3 ) entonces
2

2
2
1 1 2 3
H(R,
) =
+
+
2 I1
I2
I3
el clasico Hamiltoniano del cuerpo rgido.
Como

so(3) entonces para todo A so(3) se tiene que


hadH , Ai = h, ad H Ai

=
=
=
=

H
, A]i
h, [

H\
(i(
) i(A))

H
(
, i(
) i(A))

H
), i(A))
(
i(

1 2 3
Luego como i( H
ltima
) = ( I1 , I2 , I3 ) las ecuaciones de Euler-Arnold (en este caso, la u
se llama de Lie-Poisson) son:

0
I33 I22

1
= R 3
R
0
I3
I1
2
1
I2
0
I1

1,
2,
3 ) = (1 , 2 , 3 ) (
(

1 2 3
,
,
).
I1 I2 I3

La u
ltima ecuacion se puede escribir de forma expandida como:
1 = I2 I3 2 3

I2 I3
I
I1
3
2 =

1 3
I1 I3
3 = I1 I2 1 2 .

I1 I2

Lecci
on 4

Control en grupos de Lie


Los resultados que vamos a exponer a continuaci
on son validos para cualquier subgrupo
de Lie de GL(n, R) (grupo de los isomorfismos de Rn ).

4.1.

Motivaci
on: aparcamiento de un vehculo

4.2.

Sistemas de control invariantes a izquierda

Sea G un grupo de Lie y g su algebra de Lie.


Definici
on: Un sistema de control invariante a izquierda en un grupo de Lie G es un
subconjunto del algebra de Lie g:
g.
Los ejemplos mas tpicos seran los casos de sistemas de control afines
= {A +

m
X

ui Bi | u = (u1 , . . . , um ) U Rm },

i=1

donde A, B1 , . . . , Bm son elementos de g. Clasicamente, el sistema de control se escribira:


= RA +
R

m
X

ui RBi , con R G

i=1

26

27

4.3.

Accesibilidad y Controlabilidad

Definici
on: Una trayectoria de un sistema de control invariante a izquierda en G
es una curva continua R(t) en G definida en un intervalo [t0 , T ] R tal que existe una
particion
t0 < t1 < . . . < tN = T
y elementos,
A1 , . . . , AN
tal que la restriccion de R(t) a cada intervalo abierto (ti1 , ti ) es diferenciable y

R(t)
= R(t)Ai ,

i = 1, . . . , N.

Definici
on: Para cada T 0 y cada R G, el conjunto accesible a tiempo T desde R
del sistema de control invariante a izquierda g es el conjunto
A (R, T ) = {R(T ) | R(t) trayectoria de , R(0) = R},
(conjuntos de elementos de G accesibles desde R a tiempo T ).
Definici
on: El conjunto accesible a tiempo menor o igual que T se define como
[
A (R, T ) =
A (R, t).
0tT

Definici
on: El conjunto accesible se define como
[
A (R) =
A (R, T ).
T 0

Definici
on: El sistema g es controlable si para cada par de puntos R0 y R1 en G:
R1 A (R0 )

4.4.

Propiedades del conjunto accesible

En primer lugar, observemos que para todo A g y R0 G el problema de Cauchy


= RA,
R

R(t0 ) = R0

tiene como solucion R(t) = R0 exp ((t t0 )A).


Lema: Sea R(t), t [t0 , T ] una trayectoria de un sistema de control invariante a izquierda g con R(0) = R0 . Entonces existe N N y
1 , . . . , N > 0,

A1 , . . . , AN g

28

tal que
R(T ) = R0 exp (1 A1 ) exp (N AN )
y T t 0 = 1 + . . . + N .
Prueba: Por la definicion de trayectoria existe una particion
t0 < t1 < . . . < tN = T
y elementos,
A1 , . . . , AN ,
tal que la restriccion de R(t) a cada intervalo abierto (ti1 , ti ) es diferenciable y

R(t)
= R(t)Ai ,

i = 1, . . . , N.

En el primer intervalo tenemos que:


t (t0 , t1 ) ,

= RA1 ,
R

R(t0 ) = R0 .

Por tanto,
R(t) = R0 exp ((t t0 )A1 ),

R(t1 ) = R0 exp ((t1 t0 )A1 ),

En el siguiente intervalo (t1 , t2 ):


= RA2 ,
R

R(t1 ) = R0 exp ((t1 t0 )A1 )

luego para
R(t) = R0 exp ((t1 t0 )A1 )exp ((t t1 )A2 ),
y
R(t2 ) = R0 exp ((t1 t0 )A1 ) exp ((t2 t1 )A2 ),
Llamando 1 = t1 t0 y 2 = t2 t0 se tiene que
R(t2 ) = R0 exp (1 A1 ) exp (2 A2 ),
Procediendo de este modo
R(tN ) = R(T ) = R0 exp (1 A1 ) exp (N AN )
con 1 = ti ti1 , i = 1, . . . , N y N + . . . + 1 = T .
De este lema deducimos facilmente que
A (R) = {R exp (t1 A1 ) exp (tN AN ) | Ai , ti > 0, N 0}
A (R) = RA (I)
A (R) es arco-conexo.

29

As, el sistema de control es controlable si y solo si A (I) = G.


Definici
on: La
orbita de en un punto R G es el conjunto:
O (R) = {Rexp (t1 A1 ) exp (tN AN ) | Ai , ti R, N 0}
Obviamente,
O (R) = RO (I).
Denotemos por Lie el algebra de Lie generada por .
Teorema de Hermann-Nagano: Se verifica que O (I) G es una subvariedad diferenciable de G con espacio tangente TI O (I) = Lie .
(Vease demostracion en Jurdjevic).

Por tanto, es facil deducir que O (I) es un subgrupo de Lie de G con algebra de Lie
asociada Lie .
Teorema: Un sistema de control g es controlable si y solamente si
1. G es conexo;
2. Lie = g;
3. A (I) es un subgrupo de G
Prueba:
La necesidad es trivial. Probaremos la suficiencia.
Si A (I) es un subgrupo de G, entonces para todo R A (I) tenemos que R1 A (I)
Como (exp (ti Ai ))1 = exp (ti Ai ) se deduce que A (I) = O (I). Por tanto, O (I) es
un subgrupo de Lie conexo con algebra de Lie g. Por tanto A (I) = G.
2.
Veanse mas caracterizaciones en:
Y.L. Sachkov: Control Theory on Lie groups, Lecures given in SISSA, Trieste,
Italy, January-February 2006.
http://digitallibrary.sissa.it/retrieve/1131/15-2006M.pdf

4.5.

Control
optimo

Todos los vehculos tripulados o no requieren un control si queremos que sigan un comportamiento adecuado o una planificacion prefijada. En el caso de un vehculo con ruedas
los controles nos permiten frenarlo, acelerarlo, llevarlo por la direccion requerida... Estos
controles se activan manualmente, por radio control o automaticamente, o los dise
na nuestro sistema (va feedback). Pueden actuar llevando nuestro sistema de un punto a otro o
evitando desviaciones de la trayectoria que queremos seguir. En muchos casos el sistema es
inestable y necesitamos introducir controles para evitar grandes perturbaciones del sistema.

30

La aplicacion no se reduce a problemas de mecanica si no que tienen un ambito mayor


de aplicacion: teoras del crecimiento economico, ecologa, planificacion comercial, medicina,
robotica...
En este captulo nos centraremos mas en detalle en utilizar aquel control que sea mas
beneficioso para nosotros: nos permita llegar en mnimo tiempo, nos resulte mas barato,
consuma menos combustible, mas saludable... En este caso elegiremos entre los controles
admisibles (si estos existen) aquel que minimice o maximice un cierto funcional. En definitiva
debemos utilizar el control que consideramos optimo.
Leibniz utilizo la palabra optimo basandode en la palabra latina optimusque significa lo mejor. La palabra latina deriva del nombre de la diosa romana Ops, diosa de la
abundancia agrcola (de su nombre se deriva la palabra opulencia, operaciones, operador...).
En tiempos imperiales, el templo de esta diosa contena el tesoro romano y, ademas, a los
ricos aristocratas de Roma se les conoca como optimates. El 25 de agosto se celebraba la
Opiconsivia, cuando el grano era recogido y almacenado y el 17 de diciembre el festival de
Opalia, cuando los graneros se abran.
La teora del control optimo surgo ante la dificultad que se encontr
o para aplicar el
calculo de variaciones tradicional cuando los controles estan restringidos a tomar valores en
un cierto conjunto (incluso cerrado) y se les permite ser funciones continuas a trozos. La
culminacion de la nueva teora la lograron Pontryaguin y sus colaboradores a finales de los
a
nos cincuenta del siglo XX.

4.6.

Principio del m
aximo de Pontryaguin

Consideremos el problema de control


x(t)

= f (x(t), u(t)),
x(t0 ) = x0 ,

x(t1 ) = x1

x M, u U Rm

t1

minimizar

L(x(t), u(t)) dt
t0

en una variedad diferenciable M , f y L funciones diferenciables y u(t) funcones medibles


acotadas en un conjunto arbitrario U Rm .
Se define el Hamiltoniano de Pontryaguin, H : T M U R definido por
H((x, p); u) = L(x, u) + hp, f (x, u)i
umero real no nulo menor que cero
donde x M , p Tx M , u U y donde es cero o un n
(por ejemplo, = 1).
El principio del m
aximo de Pontryaguin asegura que si u : [t0 , t1 ] U es un control
optimo, entonces la correspondiente trayectoria x : [t0 , t1 ] M puede ser levantada a
una curva : [t0 , t1 ] T M , (t) = (x(t), p(t)) tal que (, p(t)) 6= (0, 0) y verificando las
siguientes condiciones:

31

(A) (t) = XH ( (t), u (t));


(B) H( (t), u (t)) H( (t), u), para todo u U y casi todo t [t0 , t1 ];
(C) La funcion t 7 H( (t), u (t)) es constante (siendo cero si el tiempo t1 es libre).
Las funciones t 7 x (t) que satisfacen el principio de Pontryaguin con 6= 0 se llaman
soluciones regulares y soluciones singulares o abnormales si = 0.
Este curso sera enfocado en utilizar el principio del maximo de Pontryaguin en sistema
de control invariantes a izquierda, dejando de lado su demostracion. Para ello vease las
notas:
Andrew Lewis, Course on Pontryagins Maximum Principle, course offered to
graduate students at Universitat Polit`ecnica de Catalunya
http://penelope.mast.queensu.ca/MP-course/

Lecci
on 5

Ejemplos de problemas de control

optimo en grupos de Lie


5.1.

Control
optimo de la posici
on de un cuerpo rgido

En este captulo desarrollaremos un ejemplo de control optimo en SO(3) basandonos en


el artculo:
Spindler, K. Optimal attitude control of a rigid body. Appl. Math. Optim. 34
(1996), no. 1, 7990
Motivados por el control de satelites, vamos a estudiar el problema de la maniobra de
un cuerpo rgido de una posicion inicial a una posicion final deseada en un tiempo fijado y
minimizando una funcion de coste.
Trabajando directamente en SO(3) evitaremos los problemas de trabajar con angulos
de Euler (singularidades y ambig
uedades en la descripcion).

32

33

5.1.1.

Ecuaciones de control del cuerpo rgido

Recordemos las ecuaciones del cuerpo rgido:


d

R(t)
= R(t)(t)

0
3 (t) 2 (t)

= R(t)
0
1 (t)
3 (t)
2 (t) 1 (t)
0

= R(t)(1 (t)E1 + 2 (t)E2 + 3 (t)E3 ),


donde las velocidades angulares (1 (t), 2 (t), 3 (t)) verifica las ecuaciones de Euler :
1 (t) = (I2 I3 )2 (t)3 (t) + T1 (t)
I1
2 (t) = (I3 I1 )3 (t)1 (t) + T2 (t)
I2
3 (t) = (I1 I2 )1 (t)2 (t) + T3 (t)
I3

(5.1.1)

Recordemos que I1 , I2 , I3 son momentos de inercia y T1 , T2 y T3 pares que ejercemos en el


cuerpo y que nos permiten controlarlo.
Suponemos que debemos pasar de la matriz R(t0 ) para un tiempo t0 a una matriz R(t1 )
a un tiempo t1 eligiendo una sucesion de pares adecuada. La funcion a minimizar es:
Z t1
(c1 1 (t)p1 + c2 2 (t)p2 + c3 3 (t)p3 ) dt
t0

con c1 , c2 , c3 > 0 and p1 , p2 , p3 N.


En el problema que vamos a plantear, vamos a elegir las velocidades angulares (1 , 2 , 3 )
como controles, en vez de los pares (T1 , T2 , T3 ). Utilizando las ecuaciones (5.1.1) deduciremos
los pares que debemos emplear a partir de las velocidades angulares.
As pues, el problema de control
optimo que tenemos es:
Z t1
minimizar
(c1 1 (t)p1 + c2 2 (t)p2 + c3 3 (t)p3 ) dt
t0

con ecuaciones de control:

R(t)
= R(t)(1 (t)E1 + 2 (t)E2 + 3 (t)E3 ),

(1 (t), 2 (t), 3 (t)) R3

y condiciones R(t0 ) = R0 y R(t1 ) = R1 fijadas.


El Hamiltoniano de Pontryagin ser
a una funcion:
H : T SO(3) R3 R

34

definida por:
+ (c1 1 (t)p1 + c2 2 (t)p2 + c3 3 (t)p3 )
H(R, R , ) = hR , Ri
2

= h, i + (c1 1 (t)p1 + c2 2 (t)p2 + c3 3 (t)p3 )


2

o
= 1 H1 + 2 H2 + 3 H3 ((c1 p11 + c2 p22 + c3 p33 )
2
donde Hi : T SO(3) R definida por Hi (R, ) = (Ei ), i = 1, 2, 3.
Supongamos que el control optimo este dado por funciones t 7 (1 (t), 2 (t), 3 (t))
entonces la trayectoria t 7 (t) T SO(3) verificar
a aplicando el principio del maximo
de Pontryagin que
(t) = 1 (t)XH1 ( (t)) + 2 (t)XH2 ( (t)) + 3 (t)XH3 ( (t))

5.1.2.

(5.1.2)

Estudio de las soluciones singulares o abnormales

Supongamos que el parametro = 0 y que existe una solucion del problema de control
optimo. Entonces como
H( (t), (t)) H( (t), ),

para todo R3

es decir,
1 (t)H1 ( (t)) + 2 (t)H2 ( (t)) + 3 (t)H3 ( (t))
1 H1 ( (t)) + 2 H2 ( (t)) + 3 H3 ( (t))
para todo = (1 , 2 , 3 ) R3 .
De aqu facilmente se deduce que Hi ( (t)) = 0. Si denotamos por (R (t), (t))
SO(3) so(3) la trayectoria tal que L(R (t), (t)) = (t) entonces
0 = Hi ( (t)) = (t)(Ei ),

i = 1, 2, 3

con lo cual (t) = 0 y llegamos contradicci


on.
Por tanto, no hay soluciones singulares.

5.1.3.

Estudio de las soluciones regulares

Tomamos el valor = 1.
Partimos de las ecuaciones

H
( (t)) = 0, i = 1, 2, 3, es decir
i
Hi ( (t)) = ci pi i (t)qi

35

donde qi = pi 1. Entonces eliminando los controles de la ecuacion (5.1.2) obtenemos:

1/q1

H2 ( (t)) 1/q2
H3 ( (t)) 1/q3

(t) = H1 ( (t))
XH1 ( (t))+
XH2 ( (t))+
XH3 ( (t))
c1 p1
c2 p2
c3 p3
que son las ecuaciones de Hamilton para el hamiltoniano
H0 =

3
X
j=1

qj
p /q
Hj j j
1/q
j
pj (cj pj )

Obviamente este lagrangiano es invariante a izquierda.


Trivializando llegamos a que el hamiltoniano en SO(3) R3 se escribe como:
H0 (R, ) =

3
X
j=1

Como

qj
p /q
j j j
1/q
pj (cj pj ) j

H
1
1/q
=
j
j
(cj pj )1/qj j

Las ecuaciones de Lie-Poisson son (vease Leccion 3):

1
1
1
1/q1
1/q2
1/q3

(1 , 2 , 3 ) = (1 , 2 , 3 )

(c1 p1 )1/q1 1
(c2 p2 )1/q2 2
(c3 p3 )1/q3 3
Operando y reescribiendo las ecuaciones en terminos de los controles llegamos a que:
c1 p1 q1 q11 1 1 = c2 p2 3 q22 c3 p3 2 q33
c2 p2 q2 q22 1 2 = c3 p3 1 q33 c1 p1 3 q11
c3 p3 q3 q33 1 3 = c1 p1 2 q11 c2 p2 1 q22
Observese que si p1 = p2 = p3 = 2 entonces el funcional a minimizar es:
Z t1
minimizar
(c1 1 (t)2 + c2 2 (t)2 + c3 3 (t)2 ) dt
t0

en este caso las ecuaciones que describen los controles son precisamente las ecuaciones del
cuerpo rgido:
1 = c2 3 2 c3 2 3
c1
2 = c3 1 3 c1 3 1
c2
3 = c1 2 1 c2 1 2
c3
En el caso c1 = c2 = c3 , se tiene que las u
nicas soluciones son i (t) = i = constante.
As, debemos encontrar una curva R(t) verificando:

R(t)
= R(t)(1 E1 + 2 E2 + 3 E3 ),

R(t0 ), R(t1 ) fijados

36

o, lo que es lo mismo:

R(t) = R(t0 )e(tt0 )


con

R(t1 ) = R(t0 )e(t1 t0 )


As,

Llamando r =

R(t0 )1 R(t1 ) = e(t1 t0 )


21 + 22 + 23

sen(t1 t0 )r 1 cos(t1 t0 )r 2
R(t1 )R(t0 )1 = I +
+

(t1 t0 )r
(t1 t0 )2 r2

1 0 0
0
3 2
sen(t1 t0 )r

= 0 1 0 +
3
0
1
(t1 t0 )r
0 0 1
2 1
0

22 + 23 1 2 1 3
1 cos(t1 t0 )r
1 2 2 + 2 2 3

1
3
(t1 t0 )2 r2
1 3 2 3 21 + 22

que puede ser resuelta numericamente.

5.2.

Problema subriemanniano en SO(3)


Y.L. Sachkov: Control Theory on Lie groups, Lecures given in SISSA, Trieste,
Italy, January-February 2006.
http://digitallibrary.sissa.it/retrieve/1131/15-2006M.pdf

Vamos a calcular el camino mas corto entre dos puntos fijos R0 y R1 en SO(3), pero

debe ser ser


suponiendo que las velocidades R(t)
no son libres pues suponemos que R
tangente a una distribucion invariante por la izquierda (de codimension 1): R TR SO(3),
para todo R SO(3).
Como es invariante a izquierda, elige un elemento B so(3) con kBkk = 1 tal que
I = U = B = {U so(3) | k(U, B) = 0}
Entonces R = RI o de otro modo:
= RU,
R

U I .

37

Planteamos el siguiente problema de control optimo:


= RU,
R

R SO(3) U U,

R(0) = R0 ,
R(1) = R1
Z 1
minimizar
kU (t)k2k dt

fijos

El sistema de control U = B = L{A1 , A2 }, donde A1 y A2 son elementos de so(3)


generando U . Claramente,
[A1 , A2 ]
/ generado{A1 , A2 }
Por tanto el sistema es controlable.
El hamiltoniano de Pontryagin es:
H : T SO(3) U

(R , U ) 7 hR , Rui + kU k2k
2

o, trivializando,
H : SO(3) so(3) U

(R, , U ) 7 h, U i + kU k2k
2

o, si se prefiere, identificando so(3) por medio del producto escalar (vease Seccion 3.4))
H : SO(3) R3 Ue R
(R,
, u) 7 (
, u) + 2 (u, u)
donde u R3 con i(U ) = u. Asmismo, si b = i(B) entoncesUe = {}.

5.2.1.

Estudio de las soluciones singulares o abnormales

Supongamos que = 0.
Tenemos que buscar maximoub (
, u).
Descomponiendo
=
k +
con
k kb y
b con la metrica eucldea estandar.
El probelma es equivalente a buscar maximou k(
, u) lo que equivale a que
= 0.
Se deduce que (t)
= (t)b con (t) 6= 0.
De las ecuaciones de Lie-Poisson para el cuerpo rgido (vease Leccion 3) se llega a que:
H

=
u

38

Por tanto, sustituyendo el valor de ,


se llega a que
(t)b

= (t)b u
con lo que se tiene que (b u)kb. Pero al ser u b se deduce que tambien (b u, b) = 0,
es decir que b u = 0. As se llega a que bku, pero de las hipotesis iniciales tenamos que
b u. As, u = 0 o expresado de otro modo u
= 0.
= R
Sustituyendo en las ecuaciones de control deducimos que R
u = 0; es decir, R(t) =
constante, que son las u
nicas soluciones abnormales o singulares.

5.2.2.

Estudio de las soluciones regulares

Tomamos = 1
De la condicion:

(
, u) + (u, u) m
aximoub
2
se llega a que el control optimo debe verificar:
u=

Como por hipotesis kbk = 1 podemos reescribir la condicion anterior como:


u=
(b,
)b,
Observese tambien que k = (b,
)b.
Por tanto de las ecuaciones de Lie-Poisson seran:

=
(
(b,
)b)
= (b,
)b

Observese que

d
(b,
) = (b,
) = (b,
)(b, b
) = 0.
dt

luego
(b,
(t)) = (b,
(0)).
Reescribiendo de nuevo las ecuaciones de Lie-Poisson como:

= (b,
(0))b

o llamando C = i1 ((b,
(0))b):

= C

39

con solucion

(t) = etC
(0)
Luego los controles buscados son:
u = etC
(0) (b, etC
(0))b
Dados estos controles ya solamente restara resolver la ecuacion:
= R
R
u,
con R(0) y R(1) fijos.

5.3.

Problema de control
optimo de una bola rodando en un
plano

Imaginemos una bola rodando sin deslizar en un plano horizontal en R3 . El producto


eucldeo nos permite expresar la cinematica de la rotacion de la esfera en terminos de un
sistema de referencia ortonormal situado en la esfera.
Sea (E1 , E2 , E3 ) un sistema ortonormal fijo en R3 de modo que el plano en el que rueda
la esfera esta generado por {E1 , E2 }.
Sea (1 , 2 , 3 ) un sistema ortonormal situado en la esfera
= REi ,

i = 1, 2, 3.

Si denotamos por Q las coordenadas de un punto en el sistema de referencia (E1 , E2 , E3 ) y


q sus coordenadas en la base (1 , 2 , 3 ) entonces
Q = qR
El movimiento de la esfera esta descrito por el movimiento de sus centro y el del sistema
de referencia (rotacion). Por tanto, el espacio de configuracion es M = R2 SO(3).
Sea O un origen fijo y O0 origen del sistema en movimiento y P un punto arbitrario de
la esfera. Entonces

OP = OO0 + O0 P
P(t) = X(t) + Q(t)
por tanto,

P(t)
= X(t)
+ Q(t)

= X(t)
+ qR(t)

40

Sabemos que R(t)


= R(t)A(t) con A(t) so(3) o

R(t)
= R(t) (1 (t)E1 + 2 (t)E2 + 3 (t)E3 )
y, por tanto,
dQ
dt

= qR(t) (1 (t)E1 + 2 (t)E2 + 3 (t)E3 )


= Q(t) (1 (t)E1 + 2 (t)E2 + 3 (t)E3 )

La condicion de que la esfera rueda sin deslizamiento significa que la velocidad del punto
de contacto con el plano es cero con respecto a la referencia fija, es decir P = 0. Como ese
punto es Q = (0, 0, 1). Por tanto,
0 = (x,
y,
0) + (0, 0, 1) (1 , 2 , 3 )
Luego
x = 2
y = 1
Lamando u1 = 2 y u2 = 1 entonces llegamos al siguiente sistema de control:
x = u1
y = u2

= R u3
R

u1

u3 u1
0
u2

u2

En algunos ejemplos interesantes se supone que la bola rueda de tal modo que su velocidad angular es siempre paralela al plano horizontal, es decir u3 = 0, con lo que el sistema
de control queda:
x = u1
y = u2

u1

= R 0 0 u2
R

u1 u2
0

41

5.3.1.

An
alisis de la controlabilidad

Para expresarlo de un modo en que nos resulte mas sencillo aplicar las condiciones de
la Leccion 4 escribamos las siguientes matrices
R

 0 
10x
X= 0 01y
00 1

Es facil comprobar que el conjunto G de estas matrices es un grupo de Lie. Su algebra de


Lie g estara formada por las matrices:
A

 0 
A = 0 00 00 cb
000

Un base del algebra de Lie vendr


a

E1 0
1 =
,
E
0 0

0
0

0 0
4 =
E

0 0 0

0 0

dada por las matrices:

E2 0
2 =
,
E
0 0

5 =
E
,

0
0

3 =
E

E3 0
0


0 0 1


0 0 0
0 0 0

Es facil comprobar que:


1 , E
2 ] = E
3 ,
[E

2 , E
3 ] = E
1 ,
[E

3 , E
1 ] = E
2 ,
[E

4 , E
i ] = 0,
[E

5 , E
i ] = 0,
[E

con i = 1, . . . , 5.
Nuestro sistema de control se escribira

= R
R

0 0 u1
0 0 u2
u1 u2 0
0

!
0

0 0 u 
1
0 0 u2
00 0

4 E
2 ) + u2 (E
5 + E
1 )
= R u1 (E
Tenemos un sistema de control invariante a izquierda donde es:
4 E
2 , E
5 + E
1 }
= {E
Es facil comprobar que Lie() = g y, por tanto, el sistema es controlable.
En breve, en estas notas, el interesante estudio del control optimo de este ejemplo.

Bibliografa
A.M. Bloch: Nonholonomic Mechanics and Control, Interdisciplinary Applied Mathematics, 24. Systems and Control. Springer-Verlag, New York, 2003.
Richard H. Cushman, Larry Bates: Global Aspects of Classical Integrable Systems, ,
Birkhauser, 1997.
V. Jurdjevic: Geometric Control Theory, Cambridge Studies in Advances Mathematics
51, Cambridge University Press, 1997.
Andrew Lewis, Course on Pontryagins Maximum Principle, course offered to graduate
students at Universitat Polit`ecnica de Catalunya
http://penelope.mast.queensu.ca/MP-course/
J. Marsden, T. Ratiu: Introduction to Mechanics and Symmetry, Springer-Verlag 1994
Y.L. Sachkov: Control Theory on Lie groups, Lecures given in SISSA, Trieste, Italy,
January-February 2006.
http://digitallibrary.sissa.it/retrieve/1131/15-2006M.pdf
Spindler, K. Optimal attitude control of a rigid body. Appl. Math. Optim. 34 (1996),
no. 1, 7990

42

También podría gustarte