Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Isaac A. García
ISBN: 978-84-8409-422-7
Maquetación:
Servei de Publicacions (UdL)
Diseño cubierta:
cat & cas
Impresión:
Cargraphics
La reproducción total o parcial de esta obra por cualquier procedimiento, incluidos la repro-
grafía y el tratamiento informático, y la distribución de ejemplares mediante alquiler o présta-
mo público, queda rigurosamente prohibida sin la autorización de los titulares del copyright, y
será sometida a las sanciones establecidas por la ley.
Prólogo IX
1. Introducción y Ejemplos 1
1.1. Breve historia de control automático . . . . . . . . . . . . . . . . 1
1.2. Algunos ejemplos fı́sicos . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.1. Partı́cula en movimiento unidimensional . . . . . . . . . . 3
1.2.2. Termostato y transferencia de calor . . . . . . . . . . . . . 3
5. Observabilidad 37
5.1. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.2. Problemas resueltos . . . . . . . . . . . . . . . . . . . . . . . . . 40
6. Realimentación Lineal 43
6.1. Definición y preliminares . . . . . . . . . . . . . . . . . . . . . . . 43
6.1.1. Realimentación y función de transferencia . . . . . . . . . 46
6.2. Realimentación frente a control precalculado . . . . . . . . . . . . 46
6.2.1. Sensibilidad a las condiciones iniciales . . . . . . . . . . . 48
VII
VIII ÍNDICE GENERAL
Prólogo
Introducción y Ejemplos
1
2 Introducción y Ejemplos
En 1877, E.J. Routh muestra una técnica numérica para determinar cuando
una ecuación caracterı́stica tiene raı́ces estables. Ese mismo an̄o, I.I. Vishnegrad-
sky analizó la estabilidad de los reguladores usando ecuaciones diferenciales.
Sin embargo esta teorı́a de control clásica es difı́cil de aplicar a sistemas con
varias entradas y múltiples salidas. La teorı́a de control moderna es fundamen-
talmente una teorı́a de disen̄o en el dominio temporal (a diferencial de la clásica
que es en el dominio frecuencial). Se requiere un modelo en el espacio de estados
del sistema que se desea controlar. Esta visión moderna es la que se dará en este
libro.
1.2 Algunos ejemplos fı́sicos 3
El objetivo puede ser analizar un controlador que regule, mediante una válvu-
la por ejemplo, la cantidad de calor u(t) que se debe suministrar dependiendo
de la temperatura que marquen los termómetros.
Capı́tulo 2
Control Clásico y
Transformada de Laplace
5
6 Control Clásico y Transformada de Laplace
Derivación:
L{z (j) (t)} = sj z̄ − sj−1 z(0) − sj−2 z (1) (0) − · · · − sz (j−2) (0) − z (j−1) (0) .
(2.3)
Tomando transformadas de Laplace en ambos miembros de la ecuación (2.1)
y teniendo en cuenta la propiedad (2.3) se tiene k(s)z̄(s) = β(s)ū(s), siendo los
polinomios
siendo
β(s)
g(s) = , (2.7)
k(s)
una función racional conocida como función de transferencia.
Solución de Sistemas
Lineales
1 Esta no es una restricción fuerte en los sistemas que aparecen en las aplicaciones reales
puesto que una pequen̄a perturbación en los coeficientes aij de la matriz A es suficiente para
separar las raı́ces iguales del polinomio caracterı́stico de A. Recordemos que, habitualmente
dichos coeficientes provienen de medidas experimentales y son, por lo tanto, conocidos hasta
un cierto grado de precisión.
7
8 Solución de Sistemas Lineales
Sin embargo, interesa dar la solución x(t) en función de x(0). Para ello, defi-
namos la matriz
W = [w1 , . . . , wn ] ∈ Mn (R)
cuyas columnas son los vectores wi . Sea W −1 la matriz inversa de W , que
siempre existe puesto que rangW = n, y definamos sus filas como los vectores
fila vi con i = 1, . . . , n, es decir,
⎡ ⎤
v1
⎢ ⎥
W −1 = ⎣ ... ⎦ ∈ Mn (R) .
vn
con lo cual
d
exp(At) = A exp(At) ,
dt
de modo que podemos concluir que (3.4) representa la solución de (3.1).
ẋ = Ax , x(t0 ) = x0 , (3.6)
donde
Φ(t, t0 ) = exp[A(t − t0 )] , (3.8)
es una matriz cuadrada de orden n llamada matriz de transición de estados. Es
fácil demostrar que dicha matriz verifica las siguientes propiedades:
d
Φ(t, t0 ) = AΦ(t, t0 ) , (3.9)
dt
Φ(t, t) = In , (3.10)
Φ(t0 , t) = Φ−1 (t, t0 ), (3.11)
Φ(t, t0 ) = Φ(t, t1 )Φ(t1 , t0 ). (3.12)
siendo
n
A − λj In
Zk = , (3.15)
j=1
λk − λj
j=k
r(λi ) = exp(λi t) , i = 1, . . . , n .
k
pi (λ)
1
= ,
k(λ) i=1
(λ − λi )mi
k
In = pi (A)qi (A) .
i=1
ecuación (3.18) por la izquierda por pi (A), sumando para todo i desde 1 has-
ta k y teniendo en cuenta (3.17) se obtiene la siguiente expresión de la matriz
exponencial
⎡ ⎤
k
m
i −1 j
⎣exp(λi t)pi (A)qi (A) t (A − λi In )j ⎦
exp(At) = . (3.19)
i=1 j=0
j!
ẋ = Ax + Bu , x(0) = x0 , (3.20)
d
[exp(−At)] = −A exp(−At) ,
dt
se llega a que
d
[exp(−At)x] = exp(−At)Bu .
dt
Integrando dicha ecuación respecto de t y teniendo en cuenta (3.13) se tiene
t
x(t) = exp(At) x0 + exp(−Aτ )Bu(τ ) dτ . (3.21)
0
w1 = z , w2 = ż , . . . , wn = z (n−1) , (3.24)
ẇ = Cw + du , (3.25)
trolable”.
14 Solución de Sistemas Lineales
Hemos visto que la ecuación escalar (3.23) se puede escribir en forma matri-
cial con las variables de estado. Es natural preguntarse si el inverso es siempre
posible, es decir, nos preguntamos si cualquier sistema lineal ẋ = Ax + bu(t)
con u escalar se puede escribir en la forma clásica (3.23) mediante un cambio
de variables lineal. La respuesta la contiene el siguiente resultado.
ẇ = T AT −1 w + T bu . (3.28)
Veamos que es posible construir la matriz T de modo que la ecuación (3.28) sea
(3.25). Impongamos la siguiente forma de dicha T
⎡ ⎤
ξ
⎢ ξA ⎥
⎢ ⎥
⎢ ξA2 ⎥
T =⎢ ⎥ ∈ Mn (R) , (3.29)
⎢ .. ⎥
⎣ . ⎦
ξAn−1
Comparando los coeficientes de esta matriz con los coeficientes que se obtienen
de la identidad T T −1 = In , es decir,
⎛ ⎞
ξs1 ξs2 ··· ··· ξsn
⎜ ξAs1 ξAs2 ··· ··· ξAsn ⎟
⎜ ⎟
⎜ .. .. .. .. .. ⎟ = In ,
⎝ . . . . . ⎠
ξAn−1 s1 ξAn−1 s2 · · · · · · ξAn−1 sn
λ1 = −1 , λ2 = −2 .
(ii) Como todos los valores propios λi de A son distintos, se puede utilizar
la fórmula de Sylvester (3.14) dada por
n
exp(At) = Zk exp(λk t) ,
k=1
siendo
n
A − λj In
Zk = ,
j=1
λk − λj
j=k
exp(At) = r(A)
con r(λ) un polinomio de grado menor o igual que 1 cuyos coeficientes son
funciones del tiempo t obtenidos de la forma
r(λi ) = exp(λi t) , i = 1, 2 .
cuya solución es
sx̄(s) − x0 = Ax̄(s) ,
3.4 Problemas resueltos 19
4. Sea u(t) la fuerza total por unidad de masa que actúa sobre una partı́cula.
Demostrar que la posición en función del tiempo x(t) viene dada por
t
x(t) = x(0) + ẋ(0)t + (t − τ )u(τ ) dτ .
0
siendo z(0) = z0 .
Realizamos ahora un paréntesis para calcular la matriz exp(−Aτ ). Un
simple cálculo por cualquiera de los métodos explicados en teorı́a muestra
que
1 t
exp(At) = I2 + At = . (3.33)
0 1
Finalmente, se tiene
ξ 1 −1 1
T = = .
ξA 8 3 5
ẇ = T AT −1 w + T bu ,
4.1. Introducción
En este capı́tulo abordaremos algunos de los problemas propios del control.
Consideremos el sistema lineal controlado
ẋ = Ax + Bu , (4.1)
con A ∈ Mn (R) y B ∈ Mn×m (R) matrices constantes, x(t) ∈ R y u(t) ∈ Rm . n
4.2. Controlabilidad
Definición 8. El sistema (4.1) se dice que es completamente controlable si,
para cualquier t0 , cualquier estado inicial x(t0 ) = x0 y cualquier estado final xf ,
existe un tiempo finito t1 con t1 > t0 y un control u(t) definido para t0 ≤ t ≤ t1
tal que x(t1 ) = xf .
El término “completamente”significa que la anterior definición se satisface
“para todo”x0 y xf .
Nota 9. Es habitual suponer que el control u(t) es cotinuo a trozos, es decir,
continuo excepto en un número finito de tiempos del intervalo [t0 , t1 ].
Nota 10. En la Definición 8 se puede tomar el estado final xf = 0 sin pérdida
de generalidad. Además, puesto que A y B son matrices constantes (no dependen
del tiempo) también se puede elegir el origen de tiempos de modo que t0 = 0.
La Nota 10 es debida a que, la solución x(t) de (4.1) viene dada por (3.22),
es decir,
t
x(t) = Φ(t, t0 ) x0 + Φ(t0 , τ )Bu(τ ) dτ .
t0
De este modo se tiene
t1
xf = Φ(t1 , t0 ) x0 + Φ(t0 , τ )Bu(τ ) dτ ,
t0
23
24 Sistemas de Control Lineal
Uk = [B, AB, A2 B, . . . , Ak B] , k = 0, 1, 2, . . .
Nota 15. Debido al Teorema 14, el sistema clásico (3.25) se suele decir que
está en la forma canónica controlable.
Observemos que el Teorema 11 es puramente existencial, es decir, a partir
de él se sabe que existe un vector control u(t) de modo que el sistema es com-
pletamente controlable. Sin embargo no determina cual es dicho control. Para
responder a esta pregunta se dispone del siguiente resultado.
Teorema 16. El sistema ẋ = Ax + Bu es completamente controlable si y sólo
si la matriz de controlabilidad simétrica
t1
U (t0 , t1 ) = Φ(t0 , τ )BB T ΦT (t0 , τ ) dτ ∈ Mn (R) (4.7)
t0
como se querı́a ver. Hemos tenido en cuenta que Φ(t1 , t0 )Φ(t0 , t1 ) = In y que
además, la expresión encerrada entre llaves {.} es justo la definición de U (t0 , t1 ).
De este modo
t1 t1
2 T T T T
α̂ = α̂ α̂ = − û (τ )B Φ(t0 , τ ) α̂ dτ = − ûT (τ )β̂(τ, t0 ) dτ = 0 ,
t0 t0
contradiciendo la hipótesis α̂ = 0.
se llega a
t1
0= [x0 − Φ(t0 , t1 )xf ]T [U −1 (t0 , t1 )]T Φ(t0 , τ )B [û(τ ) − u(τ )] dτ .
t0
Teniendo en cuenta que u(τ ) es el control (4.8), es claro que la expresión dentro
de las llaves {.} es justo −uT (τ ) de modo que
t1
0= uT (τ )[û(τ ) − u(τ )] dτ . (4.11)
t0
Por otra parte, utilizando las propiedades del producto escalar y de la norma
se tiene que (u − û)T (u − û) = u2 + û2 − 2uT û. Entonces,
t1 t1
u(τ ) − û(τ )2 dτ = [(u(τ ) − û(τ ))T (u(τ ) − û(τ ))T ] dτ
t0 t0
t1
= [u(τ )2 + û(τ )2 − 2uT (τ )û(τ )] dτ
t0
t1
= [û(τ )2 − u(τ )2 ] dτ ,
t0
que hay ciertos estados finales xf que no pueden ser alcanzados con ningún
control. Para caracterizar si un estado final xf es alcanzable con algún control,
independientemente de si el sistema es completamente controlable o no y además
conocer qué control u(t) es admisible se tiene el siguiente resultado.
Teorema 19. Si, para un cierto estado final xf , existe un vector columna cons-
tante ξ ∈ Rn tal que
U (t0 , t1 )ξ = x0 − Φ(t0 , t1 )xf , (4.12)
entonces el control
u(t) = −B T Φ(t0 , t)ξ , (4.13)
transfiere el sistema ẋ = Ax + Bu desde el estado inicial x(t0 ) = x0 al estado
final x(t1 ) = xf .
Demostración. La solución del sistema ẋ = Ax + Bu con la condición inicial
x(t0 ) = x0 viene dada por (3.22), es decir,
t
x(t) = Φ(t, t0 ) x0 + Φ(t0 , τ )Bu(τ ) dτ .
t0
 = P AP −1 , B̂ = P B . (4.14)
Identificando los anteriores términos con los de x̂˙ = Âx̂ + B̂u se obtiene el
resultado.
Efectivamente,
˙
Φ̂(t, t0 ) = P Φ̇(t, t0 )P −1 = P AΦ(t, t0 )P −1 = (P AP −1 )(P Φ(t, t0 )P −1 ) = ÂΦ̂(t, t0 ) ,
Φ̂(t0 , t0 ) = P Φ(t0 , t0 )P −1 = P P −1 = In ,
x = sin θ + u ,
ẋ = θ̇ cos θ + u̇ ≈ θ̇ + u̇ ,
ẍ ≈ θ̈ + ü .
ẍ = w2 (x − u) ,
c 2ṙθ̇ 1
r̈ = rθ̇2 − + ur , θ̈ = − + uθ ,
r2 r r
siendo c un parámetro de la órbita y ur y uθ las componentes radial y
angular de la fuerza u ejercida por el motor del satélite que son tomadas
como variables de control. Notar que si se para el motor, es decir, ur =
uθ = 0, entonces es posible una órbita circular uniforme (ypor lo tanto
con ṙ = θ̈ = 0) de radio R y velocidad angular θ̇ = w = c/R3 . Si la
4.4 Problemas resueltos 35
Observabilidad
ẋ = Ax + Bu , (5.1)
y = Cx , (5.2)
5.1. Observabilidad
La idea de observabilidad para un sistema controlable consiste en determinar,
si es posible, el estado x(t) de un sistema conociendo únicamente la salida y(t).
De forma más precisa se tiene la siguiente definición.
37
38 Observabilidad
Nota 31. Como se observa de la demostración del Teorema 29, cuando u(t) ≡ 0,
el estado inicial x0 dado por (5.4) es independiente del tiempo final t1 . Sólo se
requiere t1 > t0 .
El siguiente resultado es muy útil ya que permite deducir a partir de resul-
tados de controlabilidad el correspondiente de observabilidad y viceversa.
Teorema 32 (Dualidad). El sistema ẋ = Ax + Bu, y = Cx es completamente
controlable si y sólo si el sistema dual
ẋ = −AT x + C T u , y = B T x (5.5)
es completamente observable.
Demostración. Es fácil demostrar que, si Φ(t, t0 ) es la matriz de transición de
estados para el sistema ẋ = Ax, entonces ΦT (t, t0 ) es la matriz de transición de
estados para el sistema ẋ = −AT x. De este modo, comparando las expresiones
(4.7) y (5.3) de las matrices de controlabilidad U (t0 , t1 ) y de observabilidad
V (t0 , t1 ), es decir,
t1
U (t0 , t1 ) = Φ(t0 , τ )BB T ΦT (t0 , τ ) dτ
t0
y t1
V (t0 , t1 ) = ΦT (τ, t0 )C T CΦ(τ, t0 ) dτ ,
t0
Como
1 1
det U = 2 2
− 2 ,
R LC L C
se tiene que si R= L/C entonces det U = 0 y rang U = 1. Por el
contrario, si R = L/C entonces det U = 0 y rang U = 2, de modo que,
aplicando el Teorema 11, se concluye que el sistema es completamente
controlable.
La matriz de observabilidad V es
C −1 0
V = = 2 ,
CA RC − C1
(ii) Para resolver esta cuestión aplicaremos el Teorema 19. Nos situamos
en el caso no completamente controlable, es decir, tomamos R = L/C.
Es fácil calcular la matriz de transición de estados Φ(0, t) = exp(−At),
siendo esta
⎛ √ ⎞
L+ L/Ct t
L/Ct ⎝ L −
√C ⎠ .
Φ(0, t) = exp
L t L− L/Ct
L L
donde la salida viene dada por y(t) = x1 (t) + 2x2 (t). ¿Es posible ha-
llar el estado inicial del sistema x(0) sabiendo que la salida es y(t) =
−20 exp(−3t) + 21 exp(−2t)? En caso de respuesta positiva, hallar x(0).
Solución. Se tiene el sistema ẋ = Ax con salida y = Cx, siendo C = (1, 2).
La matriz de observabilidad V asociada al sistema es
C 1 2
V = = ,
CA 3 −9
42 Observabilidad
donde el tiempo final t1 no juega ningún papel esencial (ver la Nota 31)
de modo que, se toma t1 = 1 sin pérdida de generalidad. Aquı́, la matriz
de observabilidad V (0, 1) viene dada, según (5.3), por
1
V (0, 1) = ΦT (τ, 0)C T CΦ(τ, 0) dτ ,
0
Realimentación Lineal
El siguiente resultado, cuya demostración general data del an̄o 1967 [13],
proporciona una nueva vı́a de investigación en control mediante el uso de reali-
mentación lineal en términos de variables de estado.
Nota 37. Sabemos que, la solución del sistema lineal de lazo cerrado ẋ = (A +
BK)x depende de los valores propios de la matriz A+BK. Por lo tanto, si el par
[A, B] es completamente controlable, del Teorema 36 se desprende que, usando
realimentación lineal, es posible ejercer una gran influencia sobre la evolución
temporal de las soluciones del sistema lineal de lazo cerrado.
43
44 Realimentación Lineal
Demostración del Teorema 36 con una única variable de control (m = 1). Como
el sistema ẋ = Ax + bu con A ∈ Mn (R) matriz constante, b ∈ Rn vector colum-
na y u(t) ∈ R es completamente controlable, por el Teorema 14, existe cambio
lineal de variables w = T x con T ∈ Mn (R) no singular que lo transforma en la
forma canónica controlable (3.25), es decir, ẇ = Cw + du con C = T AT −1 y
d = T b. En concreto d = (0, . . . , 0, 1)T y
⎛ ⎞
0 1 0 . . . 0
⎜ 0 0 1 . . . . ⎟
⎜ ⎟
⎜ . ⎟
C=⎜ . . . . . . ⎟ ∈ Mn (R) .
⎝ . . . . . . . ⎠
−kn −kn−1 −kn−2 . . . −k1
Aquı́, ki son los coeficientes del polinomio caracterı́stico de A, es decir,
det(λIn − A) = λn + k1 λn−1 + · · · + kn .
Por otra parte, la realimentación lineal en el caso m = 1 que nos ocupa se
escribe de la forma u = κw, con el vector fila κ = (κn , κn−1 , . . . , κ1 ) ∈ Rn . De
este modo, el sistema en lazo cerrado que se obtiene es ẇ = (C + dκ)w, siendo
la matriz
⎛ ⎞
0 1 0 . . . 0
⎜ 0 0 1 . . . . ⎟
⎜ ⎟
C + dκ = ⎜ . ⎜ . . . . . . ⎟ ⎟+
⎝ . . . . . . . ⎠
−kn −kn−1 −kn−2 . . . −k1
⎛ ⎞
0
⎜ 0 ⎟
⎜ ⎟
⎜ .. ⎟
⎜ . ⎟ (κn , κn−1 , . . . , κ1 )
⎜ ⎟
⎝ 0 ⎠
1
⎛ ⎞
0 1 0 . . . 0
⎜ 0 0 1 . . . . ⎟
⎜ ⎟
= ⎜ ⎜ . . . . . . . ⎟ ⎟+
⎝ . . . . . . . ⎠
−kn −kn−1 −kn−2 . . . −k1
⎛ ⎞
0 0 0 . . . 0
⎜ 0 0 0 . . . 0 ⎟
⎜ ⎟
⎜ . . . . . . . ⎟
⎜ ⎟
⎝ . . . . . . . ⎠
κn κn−1 κn−2 . . . κ1
⎛ ⎞
0 1 0 . . . 0
⎜ 0 0 1 . . . . ⎟
⎜ ⎟
⎜
= ⎜ . . . . . . . ⎟ ⎟ ,
⎝ . . . . . . . ⎠
−γn −γn−1 −γn−2 . . . −γ1
6.1 Definición y preliminares 45
siendo
κi = ki − γi , i = 1, . . . , n . (6.3)
Notemos que la matriz C + dκ tiene la misma forma que la matriz C excepto la
última fila.
Puesto que los sistemas de lazo cerrado inicial ẋ = (A + bK)x y final ẇ =
(C + dκ)w son algebraicamente equivalentes mediante la transformación lineal
w = T x, se tiene que C + dκ = T (A + bK)T −1 , de donde κ = KT −1 y por lo
tanto la matriz de ganancia K que se busca es
K = κT , (6.4)
donde los elementos de κ están definidos por (6.3) y los elementos γi se calculan
imponiendo que los valores propios de la matriz A + bK (que son los mismos
que los de la matriz C + dκ) sean justo el conjunto Λn , es decir,
n
λn + γ1 λn−1 + · · · + γn = (λ − ρi ) ,
i=1
ẋ = Cx + du , y = β̂x .
Nota 43. El Teorema 42 no es cierto si m > 1, puesto que en este caso los
ceros de la función de transferencia son afectados también por la realimentación
lineal.
ϕ̈ − ϕ = u(t) . (6.8)
Se pretende disen̄ar una estrategia de control u(t) de modo que, para val-
ores iniciales (ϕ(0), ϕ̇(0)) no nulos pero pequen̄os, el sistema evolucione hacia
(ϕ, ϕ̇) = (0, 0).
con α > 1 y β > 0 también cumple nuestro propósito, es decir, las solu-
ciones de (6.8) con condiciones iniciales (ϕ(0), ϕ̇(0)) suficientemente cer-
canas a (0, 0) verifican (ϕ(t), ϕ̇(t)) → (0, 0) cuando t → ∞.
La demostración de este hecho proviene del análisis del sistema en lazo
cerrado ϕ̈+β ϕ̇+(α−1)ϕ = 0,con ecuación caracterı́stica λ2 +βλ+α−1 = 0
cuyas raı́ces son λ± = [−β ± β 2 − 4(α − 1)]/2. Es obvio que la parte real
(λ± ) < 0 de modo que (ϕ(t), ϕ̇(t)) → (0, 0) cuando t → ∞.
De una forma similar se puede demostrar que, si se toma por control u(t)
la realimentación (6.11), es decir, u(t) = −αϕ(t) − β ϕ̇(t) con α > 1 y
β > 0, entonces la solución de (6.13) no sólo no diverege sino que todavı́a
mantiene la propiedad asintótica deseada (ϕ(t), ϕ̇(t)) → (0, 0) cuando t →
∞.
det(λI2 − A) = λ2 + k1 λ + k2 = λ2 + 5λ + 6 ,
de modo que
k1 = 5 , k2 = 6 .
κ1 = 5 − 9 = −4 , κ2 = 6 − 20 = −14 ,
donde ξ verifica
ξ[b, Ab] = dT .
En nuestro problema, despejando ξ de la anterior ecuación se tiene
−1
T −1 1 −4
ξ = d [b, Ab] = (0, 1)
3 −10
−5 2 1
= (0, 1) = (−3, 1) .
−3/2 1/2 2
Finalmente, se tiene
ξ 1 −3 1
T = = .
ξA 2 5 −1
Para comprobar que todo es correcto se puede ver que los valores propios
de la matriz
10 −6
A + bK =
35 −19
asociada al sistema en lazo cerrado son ρ1 = −4 y ρ2 = −5.
Capı́tulo 7
Estabilidad
53
54 Estabilidad
(i) 0 es estable si para todo
> 0 existe un δ > 0 tal que x(t0 ) < δ implica
x(t) <
para todo t ≥ t0 .
(i) 0 es inestable si no es estable, es decir, existe un
> 0 tal que para todo
δ > 0 existe un x(t0 ) verificando x(t0 ) < δ y x(t1 ) ≥
para algún
t1 > t0 . Si además esto sucede para todo x(t0 ) con x(t0 ) < δ entonces 0
se llama completamente inestable.
con la condición inicial x(0) = (x1 (0), x2 (0)) tiene por solución general (uti-
lizando los métodos anteriormente estudiados)
√ " √ "
t 15 3 15
x1 (t) = x1 (0) exp cos t + √ sin t −
2 2 15 2
√ "
6 t 15
√ x2 (0) exp sin t ,
15 2 2
con una expresión similar para x2 (t). Obviamente, debido al término exponen-
cial, lı́mt→∞ x1 (t) = ∞ para cualquier valor inicial x(0) de modo que el origen
del sistema lineal es inestable.
Sin embargo, excepto para sistemas lineales y algún otro tipo simple, no se
conocerá a priori la solución general x(t) del sistema de modo que este método
no es de gran aplicación.
ẋ = Ax , (7.2)
7.2 Estabilidad en sistemas lineales 55
Supongamos que (λk ) < 0 para todo k. Entonces, de (7.4) se deduce que
exp(At) → 0 cuando t → ∞. Finalmente, teniendo en cuenta (7.3), se con-
cluye que x(t) → 0 cuando t → ∞ y por lo tanto el sistema (7.2) es asintótica-
mente estable.
56 Estabilidad
Nota 50. Observar que tras el Teorema 49, los casos difı́ciles en el estudio de
la estabilidad del sistema (7.2) son aquellos en los que algún valor propio λj de
A sea o bien nulo o bien imaginario puro, es decir, (λj ) = 0.
Es fácil demostrar el siguiente resultado de gran utilidad en aplicaciones.
Proposición 51. Sea el polinomio k(λ) = λ3 + aλ2 + bλ + c ∈ R3 [λ]. Todas
las raı́ces de k(λ) tienen parte real negativa si y sólo si a > 0, b > 0, c > 0 y
ab > c.
Nota 53. Nótese que, dada una solución x(t) del sistema (7.5), se tiene
dV (x(t))
V̇ (x(t)) = .
dt
Definición 54. La función V : D ⊂ Rn → R con x∗ = 0 ∈ D es una función
de Liapunov para el sistema (7.5) si verifica lo siguiente:
(i) V ∈ C 1 (D).
(ii) V es definida positiva, es decir, V (0) = 0 y V (x) > 0 para todo x ∈ D con
x = 0.
(iii) V̇ es semidefinida negativa, es decir, V̇ (0) = 0 y V̇ (x) ≤ 0 para todo
x ∈ D.
V −1 (c) = {x ∈ R2 | V (x) = c}
siendo θ el ángulo formado por los vectores ∇V (x) y f (x). Recordemos que el
vector ∇V (x) es perpendicular a la curva de nivel de V que pasa por x y con
el sentido de máxima variación de V . De este modo, si V̇ (x) < 0, entonces el
ángulo θ es obtuso con lo cual la órbita del sistema que pasa por x corta a la
curva de nivel desde la parte del plano no acotada (exterior de la curva de nivel)
hacia la parte acotada por la curva de nivel (interior de la curva de nivel). De
forma similar, si V̇ (x) > 0, la órbita del sistema que pasa por x corta a la curva
de nivel de V que pasa por x desde su interior hacia su exterior; si V̇ (x) = 0 la
órbita del sistema que pasa por x toca a la curva de nivel tangencialmente en
x.
Por supuesto, una de las principales dificultades que uno se encuentra cuando
quiere utilizar la teorı́a de estabilidad de Liapunov consiste en buscar la fun-
ción de Liapunov. Una situación simple consiste en buscar formas cuadráticas
definidas positivas como funciones de Liapunov.
Lema 56. Una forma cuadrática V (x1 , x2 ) = ax21 + 2bx1 x2 + cx22 con a, b, c ∈ R
es definida positiva si y sólo si a > 0 y ac − b2 > 0.
ẋ = Ax , (7.6)
V = xT P x , (7.7)
Es fácil ver que Q es una matriz simétrica puesto que P lo es. Esto es debido a
que
Los siguientes teoremas son una herramienta teórica con grandes aplicaciones
en la teorı́a de control óptimo como veremos en capı́tulos posteriores.
(i) La ecuación (7.8) tiene una única solución P simétrica para cada Q simétri-
ca fijada si y sólo si para cada par de valores propios λi y λj de A se verifica
λi + λj = 0.
(ii) Si A es una matriz de estabilidad, para cada Q definida positiva existe una
única solución de (7.8) que es definida positiva y viene dada de forma
explı́cita por ∞
P = exp(AT t)Q exp(At) dt . (7.10)
0
Nota 58. La fórmula (7.10) tiene interés teórico puesto que en muchas oca-
siones es más simple resolver la ecuación matricial de Liapunov (7.8) direc-
tamenete que calcular mediante (7.10).
ẋ = Df (x∗ )x , (7.12)
Df T (0)P + P Df (0) = −Q ,
V̇ = −xT Qx + 2g T P x .
ẋ = Ax + Bu , (7.13)
y = Cx , (7.14)
Teniendo en cuenta que la entrada de control está acotada, es decir u(t) <
c1 , de las ecuaciones (7.15) y (7.16) se deduce la siguiente cota
t
y(t) ≤ C Kx0 + c1 B exp[A(t − τ )] dτ
0
t
≤ C Kx0 + c1 BK exp[−α(t − τ )] dτ
0
1
= KC x0 + c1 B [1 − exp(−αt)]
α
1
≤ KC x0 + c1 B para todo t ≥ 0 .
α
En definitiva, y(t) está acotada y por lo tanto el sistema es b.i.b.o estable.
7.4 Estabilidad y control 63
ẋ = f (x, u) , (7.17)
en un entorno del punto (x∗ , u∗ ) = (x∗1 , . . . , x∗n , u∗1 , . . . , u∗m ) y truncando a primer
orden se tiene
n m
∂fi ∗ ∗ ∂fi ∗ ∗
ẋi ≈ fi (x∗ , u∗ )+ (x , u )(xj −x∗j )+ (x , u )(uj −u∗j ) , i = 1, . . . , n .
j=1
∂xj j=1
∂u j
n m
∂fi ∗ ∗ ∂fi ∗ ∗
∆ẋi = (x , u )∆xj + (x , u )∆uj , i = 1, . . . , n .
j=1
∂xj j=1
∂uj
θ̈ + 2cθ̇ + Ω2 sin θ = 0 ,
Los puntos singulares del sistema en el plano de fases son (θ, w) = (nπ, 0),
con n ∈ Z.
ẋ = y + αx(x2 + y 2 ) , ẏ = −x + αy(x2 + y 2 ) ,
(ii) Sea (x(t), y(t)) una solución del sistema. Utilizar la función (x(t), y(t)2
para estudiar la estabilidad del origen del sistema.
(i) ¿Es posible estudiar la estabilidad del origen (θ, θ̇) = (0, 0) del sistema
por linearización?
(ii) ¿Es posible utilizar la función V (θ, θ̇) = θ2 + θ̇2 como función de
Liapunov en un entorno del origen?
(iii) ¿Es posible utilizar la función energı́a E(θ, θ̇) = 12 m2 θ̇2 + mg(1 −
cos θ) como función de Liapunov en un entorno del origen?
7.5 Problemas resueltos 67
Solución.
(i) Usando el cambio de variables habitual θ̇ = w se tiene el sistema
g
θ̇ = w , ẇ = − sin θ .
Los puntos singulares del sistema en el plano de fases son (θ, w) = (nπ, 0),
con n ∈ Z.
(iii) Observar que la función E(θ, θ̇) = 12 m2 θ̇2 +mg(1−cos θ) es definida
positiva en un entorno suficientemente pequen̄o del origen puesto que , m
y g son constantes positivas. Además, la derivada orbital Ė ≡ 0. Entonces,
E es una función de Liapunov para el sistema y, aplicando la parte (i) del
Teorema 55, el origen es estable.
4. Considerar un oscilador amortiguado, es decir, un sistema del tipo
mẍ + cẋ + kx = 0 ,
con c > 0 y k > 0 las constantes de rozamiento y elástica respectiva-
mente. Demostrar, utilizando la energı́a mecánica total como función de
Liapunov, que el punto crı́tico (x, ẋ) = (0, 0) es estable.
ẋ = −2xy , ẏ = x2 − y 3 ,
0 = −2xy , 0 = x2 − y 3 ,
es (x, y) = (0, 0). Por lo tanto el origen es el único punto singular del
sistema.
La derivada orbital de V es
∂V ∂V
V̇ = ẋ + ẏ = 2max2m−1 (−2xy) + 2nby 2n−1 (x2 − y 3 )
∂x ∂y
= [−4max2m y + 2nbx2 y 2n−1 ] − 2nby 2n+2 .
Teniendo en cuenta la Proposición 51, todas las raı́ces del polinomio k(λ)
tienen parte real negativa si y sólo si
o, equivalentemente
La matriz de controlabilidad es
⎛ ⎞
1 0 −3 −1 7 3
U = [B, AB, A2 B] = ⎝ 2 1 11 5 18 9 ⎠ ∈ M3×6 (R)
7 3 28 14 63 30
La matriz de observabilidad V es
⎡ ⎤ ⎛ ⎞
C 1 5 2
V = ⎣ CA ⎦ = ⎝ −2 −6 16 ⎠ .
CA2 −30 18 36
En concreto se obtiene
⎛ ⎞
0 1 0 0
⎜
⎜ −4k2 /5 0 3(k1 − g)/5 0 ⎟⎟ ∈ M4 (R) ,
 = ⎝ 0 0 0 1 ⎠
3k2 /5 0 6(g − k1 )/5 0
⎛ ⎞
0
⎜ 4/5 ⎟
b̂ = ⎜ ⎟ ∈ R4 .
⎝ 0 ⎠
−3/5
Capı́tulo 8
Cálculo de Variaciones
75
76 Cálculo de Variaciones
de modo que v 2 = 2g(hA − h). Con el sistema de referencia tomado está claro
que x = hA − h, de modo que, la ecuación diferencial que rige el movimiento de
la masa m es
ds
v := = 2gx ,
dt
siendo v el módulo de la velocidad que tiene la partı́cula cuando se encuentra en
un punto con coordenada
(x, y(x)) y ds el elemento de longitud de la trayectoria.
Sabemos que, ds = 1 + y (x)2 dx, de modo que se obtiene
1 + y (x)2 dx
dt = √ .
2gx
1 1
x(t) = (1 − cos t) , y(t) = 2 (t − sin t) ,
k2 k
siendo k una constante adecuada, ver el Problema 1 de este capı́tulo.
-x
y
1 2 3 4 5 6
-0.5
-1
-1.5
-2
8.2. Introducción
Sea E un espacio de funciones x(t) ∈ Rn de clase C 1 [ta , tb ]. Consideremos el
funcional J : E → R, definido de la forma
tb
J(x) = F (x(t), ẋ(t); t) dt , (8.1)
ta
Lema 67. Sean ta < tb constantes reales fijas y f (t) ∈ C[ta , tb ] una función
dada. Si
tb
η(t)f (t) dt = 0 , (8.2)
ta
Obviamente, una condición necesaria para que x∗ (t) sea un extremo del fun-
cional J es que
dJ
=0.
d
=0
Como
dx(t) dẋ(t) ˙ ,
= ξ(t) , = ξ(t)
d
d
se tiene que, aplicando la regla de la cadena,
dF
= ∇x F (x∗ (t) +
ξ(t), ẋ∗ (t) +
ξ(t);
˙ t) ξ(t)
d
+∇ẋ F (x∗ (t) +
ξ(t), ẋ∗ (t) +
ξ(t);
˙ ˙ ,
t) ξ(t)
8.3 Ecuaciones de Euler–Lagrange 79
se obtiene que
!tb tb
dJ d(∇ẋ F )
= ∇ẋ F ξ(t) + ∇x F − ξ(t) dt = 0 , (8.4)
d
=0 ta ta dt
donde los gradientes están evaluados sobre la curva x∗ (t). Se tiene a partir de
ahora dos casos diferenciados:
(i) Los puntos inicial y final son fijos: Supongamos que el conjunto E donde
buscamos soluciones sea el espacio de funciones x(t) de clase C 1 [ta , tb ] que
además toman valores fijos en los extremos, es decir, x(ta ) = xa , x(tb ) = xb
con xa , xb ∈ Rn fijos.
Por supuesto en este caso se debe tener ξ(ta ) = ξ(tb ) = 0 de modo que
(8.4) adopta la forma
tb
d(∇ẋ F )
∇x F − ξ(t) dt = 0 ,
ta dt
d(∇ẋ F )
− ∇x F = 0 ,
dt
o, de forma escalar equivalente
d ∂F ∂F
− = 0 , j = 1, . . . , n. (8.5)
dt ∂ ẋj ∂xj
Para demostrar este hecho, notar que ahora sólo se tiene ξ(ta ) = 0, de
modo que (8.4) adopta la forma
tb
d(∇ẋ F )
∇ẋ F t=t ξ(tb ) + ∇x F − ξ(t) dt = 0 . (8.7)
b
ta dt
Esta ecuación debe ser válida para ξ verificando ξ(ta ) = 0. En particular
debe ser cierta también para aquellas ξ que además verifiquen ξ(tb ) = 0.
Para estas segundas ξ, aplicando el Lema Fundamental del Cálculo de
Variaciones, la ecuación (8.7) reduce a las ecuaciones de Euler–Lagrange
(8.5). De este modo, a partir de ahora, (8.7) reduce sólo a su primer
término, es decir
∇ẋ F t=t ξ(tb ) = 0 .
b
d ∂F
[ẋ(t) ∇ẋ F − F ] + =0.
dt ∂t
Por supuesto de aquı́ se deduce que, si F no depende explı́citamente de t, en-
tonces se verifica (8.9).
d
[∇ẋ (F + λG)] − ∇x (F + λG) = 0 . (8.12)
dt
Restricciones no integrales: x(t) ha de verificar
d
[∇ẋ (F + λ(t)G)] − ∇x (F + λ(t)G) = 0 . (8.14)
dt
Este tipo de problemas de optimización con restricciones no integrales es fun-
damental en el capı́tulo siguiente.
Esto implica que los vectores ∇f (x0 ) y ṙ(t0 ) son ortogonales. Como además,
por las propiedades del vector gradiente, los vectores ∇g(x0 ) y ṙ(t0 ) también
son ortogonales, se deduce que los vectores ∇f (x0 ) y ∇g(x0 ) son paralelos, es
decir, existe un λ ∈ R tal que ∇f (x0 ) = λ∇g(x0 ).
Nota 69. El Teorema 68 implica que los extremos de f (x) sujetos a la re-
stricción g(x) = c son los extremos de la función F (x, λ) = f (x) + λg(x) sin
restricciones.
Nota 70. El Teorema 68 se puede generalizar de modo que los extremos de f (x)
sujetos a las restricciones gi (x) = ci con ci consantes reales mpara i = 1, . . . , m
son los extremos de la función F (x, λ1 , . . . , λm ) = f (x) + i=1 λi gi (x) sin res-
tricciones.
pero ahora, la función x(t) ∈ C 1 [ta , tb ] además de tener los extremos fijos, es
decir, x(ta ) = xa y x(tb ) = xb con xa y xb fijos, está sujeta a la restricción
tb
K(x) = G(x(t), ẋ(t); t) dt = k , (8.16)
ta
Sea x∗ (t) ∈ C 1 [ta , tb ] una función con x∗ (ta ) = xa y x∗ (tb ) = xb que ex-
tremiza a J con la restricción K(x∗ ) = k. Consideremos la siguiente familia
biparamétrica de funciones
x(t) = x∗ (t) +
1 ξ1 (t) +
2 ξ2 (t) ,
con
i ∈ R parámetros y ξi ∈ C 1 [ta , tb ]. Como los puntos inicial y final son fijos,
se debe tener ξi (ta ) = ξi (tb ) = 0 para i = 1, 2.
Para resolver el problema, utilizamos el método de los multiplicadores de
Lagrange, es decir, definimos la función
tb
F(
1 ,
2 ; λ) = J(x) + λK(x) = F (x(t), ẋ(t); t) + λG(x(t), ẋ(t); t) dt ,
ta
se tiene que
!tb tb
∂F d(∇ẋ F )
= ∇ẋ F ξi (t) + ∇x F − ξi (t) dt +
∂
i ta ta dt
!tb tb *
d(∇ẋ G)
λ ∇ẋ G ξi (t) + ∇x G − ξi (t) dt .
ta ta dt
para toda ξi (t) admisible y donde los gradientes están evaluados sobre la curva
x∗ (t). Entonces, por el Lema Fundamental del Cálculo de Variaciones, se debe
verificar la ecuación
d(∇ẋ (F + λG))
− ∇x (F + λG) = 0 ,
dt
como se querı́a demostrar.
sujeto a la restricción
t1
P (x, y) = ẋ2 + ẏ 2 dt = p .
t0
Se puede demostrar con las técnicas utilizadas en este capı́tulo que la solución
es una circunferencia de perı́metro p.
se tiene
∂L ∂L ∂V
= mẋj , =− .
∂ ẋj ∂xj ∂xj
Entonces, las ecuaciones de Euler–Lagrange adoptan la forma
∂V
mẍj = − ,
∂xj
86 Cálculo de Variaciones
siendo &
1 + y (x)2
F (y(x), y (x); x) = .
x
Notar que F es independiente de y(x) de modo que se verificará (8.9), es
decir, la ecuación de Euler-Lagrange reduce a
∂F
=c,
∂y
siendo c ∈ R una constante. En nuestro caso se tiene
y (x)
=c,
x(1 + y (x)2 )
para todo x ∈ (0, x1 ). Despejando se llega a
c2 x
y (x)2 = .
1 − c2 x
Una forma simple de resolver esta ecuación diferencial consiste en usar la
parametrización
1
x(t) = (1 − cos t) , η(t) := y(x(t)) .
2c2
Entonces, η(t) debe satisfacer
siendo F (y, y ; x) = y 1 + y 2 . Como F no depende de x explı́citamente,
entonces se verifica (8.9), es decir,
∂F
F − y =c,
∂y
Simplificando se llega a
y
=c. (8.17)
1 + y 2
La forma más sencilla de integrar esta ecuación consiste en realizar el cam-
bio y = sinh ξ, de modo que, teniendo en cuenta la relación fundamental
de la trigonometrı́a hiperbólica cosh2 ξ − sinh2 ξ = 1, (8.17) se reescribe
como y = c cosh ξ. Se tiene pues
dy c sinh ξ dξ
dx = = = c dξ ,
y sinh ξ
x(ξ) = cξ + c1 ,
4. Considerar todas las curvas planas que pasan por los puntos (0, 0) y (2, 0)
y que tengan longitud π. Hallar la ecuación de la curva que encierra ma-
yor área con el eje de abscisas.
y
1
0.8
0.6
0.4
0.2
x
0.5 1 1.5 2
dy dy dx
= = cot ξ(−λ sin ξ) = −λ cos ξ ,
dξ dx dξ
que integrando da lugar a
π = −λ[ξ1 − ξ0 ] ,
2 = −λ[cos ξ0 − cos ξ1 ] ,
sin ξ0 = sin ξ1 ,
con la restricción
ẋ = αx(t) + u(t) , (8.22)
siendo x(t) ∈ R verificando x(t0 ) = x0 con x0 dado pero x(tf ) no está re-
stringido a ningún valor. Aquı́, α, β ∈ R son parámetros constantes.
siendo F (u, x, u̇, ẋ; t) = u2 (t) + βx2 (t) y G(u, x, u̇, ẋ; t) = ẋ − αx(t) − u(t).
Las ecuaciones de Euler–Lagrange (8.14) son
d ∂ ∂
(F + λ(t)G) − (F + λ(t)G) = 0 ,
dt ∂ ẋ ∂x
d ∂ ∂
(F + λ(t)G) − (F + λ(t)G) = 0 ,
dt ∂ u̇ ∂u
que, en nuestro caso dan lugar a
λ̇ − 2βx + λα = 0, (8.23)
2u − λ = 0. (8.24)
siendo F (u, x1 , x2 , u̇, ẋ1 , ẋ2 ; t) = x21 (t) + 4u2 (t), G1 (u, x1 , x2 , u̇, ẋ1 , ẋ2 ; t) =
ẋ1 − x2 (t) y G2 (u, x1 , x2 , u̇, ẋ1 , ẋ2 ; t) = ẋ2 + x2 (t) − u(t).
Las ecuaciones de Euler–Lagrange (8.14) son, para j = 1, 2,
d ∂ ∂
(F + λ1 (t)G1 + λ2 (t)G2 ) − (F + λ1 (t)G1 + λ2 (t)G2 ) = 0,
dt ∂ ẋj ∂xj
d ∂ ∂
(F + λ1 (t)G1 + λ2 (t)G2 ) − (F + λ1 (t)G1 + λ2 (t)G2 ) = 0,
dt ∂ u̇ ∂u
que, en nuestro caso dan lugar a
λ̇1 (t) − 2x1 (t) = 0 , (8.27)
λ̇2 (t) + λ1 (t) − λ2 (t) = 0 , (8.28)
8u(t) − λ2 (t) = 0 . (8.29)
Eliminando de este sistema los multiplicadores de Lagrange λ1 (t) y λ2 (t)
y recordando que x1 (t) = x(t) se llega a
4ü = 4u̇ − x .
8.6 Problemas resueltos 93
Esta ecuación junto con (8.26) resulta un sistema lineal resoluble. Reali-
zando el procedimiento habitual de resolución se obtiene
√ √ √ √
x(t) = A exp(−t/ 2) + Bt exp(−t/ 2) + C exp(t/ 2) + Dt exp(t/ 2) .
Control Óptimo
9.1. Introducción
En este capı́tulo se describirá cómo controlar un sistema de forma que se
comporte de la “mejor forma posible”. Por supuesto, la estrategia del control
utilizado dependerá de cómo se entienda “mejor”.
95
96 Control Óptimo
o bien t1
J(u) = uT (t)M u(t) dt , (9.5)
t0
siendo M ∈ Mn (R) simétrica y definida positiva.
Servomecanismos y reguladores: Si el control u(t) se elige de modo que el
objetivo es que el sistema siga lo más cerca posible a un cierto estado de
referencia r(t) durante un cierto intervalo de tiempo t0 ≤ t ≤ t1 entonces
se habla de un servomecanismo. Un posible ı́ndice de actuación puede ser
t1
J(x) = ∆T (t)M ∆(t) dt , (9.6)
t0
siendo F(x(t), u(t), λ(t), ẋ(t); t) = F (x(t), u(t), t)+λ(t) [ẋ−f (x, u, t)], donde el
punto indica el producto escalar ordinario en Rn . Hemos de hallar un extremo
del funcional Jλ (u, x), pero antes de hallar las ecuaciones de Euler–Lagrange,
definiremos el Hamiltoniano
H(x, u, λ, t) = λ(t) f (x, u, t) − F (x, u, t) ,
de modo que el funcional Jλ (u, x) se puede reescribir de la forma
t1
Jλ (u, x) = λ(t) ẋ − H(x, u, λ, t) dt .
t0
ẋ = Ax + Bu , (9.15)
Ṗ = P BR−1 B T P − AT P − P A − Q ,
Ru∗ + B T λ = 0 ,
de modo que, puesto que R es invertible por ser definida positiva, el control
óptimo viene dado por
u∗ (t) = −R−1 B T λ(t) . (9.17)
100 Control Óptimo
λ̇ = −Qx∗ − AT λ . (9.18)
Se tiene además la condición de contorno λ(t1 ) = (∇x φ)t=t1 , ver la Nota 77.
Como en nuestro caso φ = 12 xT M x, dicha condición de contorno da lugar a
Utilizamos ahora la fórmula (3.7) que nos da la solución del sistema (9.19) con
la condición inicial colocada en tiempo t1 , es decir,
∗ ∗
x (t) x (t1 )
= Φ(t, t1 ) .
λ(t) λ(t1 )
siendo Φ(t, t1 ) = (φij ) ∈ M2n (R) la matriz de transición de estados del sistema
(9.19). Aquı́ se utiliza la notación por bloques φij (t) ∈ Mn (R) con i, j = 1, 2.
Se tiene pues que
donde se ha definido la matriz P (t) = (φ21 +φ22 M )(φ11 +φ12 M )−1 . Nótese que,
se puede demostrar que la matriz φ11 + φ12 M es invertible para todo t ≥ t0 .
En definitiva se ha demostrado que el control óptimo u∗ (t) viene dado por una
realimentación lineal del tipo
donde la matriz P (t) verifica una ecuación que a continuación deducimos. Derivan-
do (9.21) respecto del tiempo t se tiene
Ṗ x∗ + P ẋ∗ − λ̇∗ = 0 .
9.4 Teorı́a de Pontryagin 101
Como esta ecuación ha de ser cierta para todo t0 ≤ t ≤ t1 se tiene que P (t)
debe verificar la llamada ecuación diferencial matricial de Riccati
Ṗ = P BR−1 B T P − AT P − P A − Q , (9.23)
sujeto al sistema lineal (9.15) se minimiza mediante un control óptimo por real-
imentación u∗ (t) = −R−1 B T P x∗ (t), donde P es la única matriz real simétrica
y definida positiva que satisface la ecuación matricial algebraica de Riccati
P BR−1 B T P − AT P − P A − Q = 0 .
de modo que, para cada control dado u(t) definido para t0 ≤ t ≤ t1 , se tiene
J(u, x) bien definido y tomando un valor real fijado.
Fijados el estado inicial x0 y final xf del sistema, supongamos que existen
varios controles u(t) que transfieren el sistema desde el estado inicial x(t0 ) = x0
hasta el estado final x(t1 ) = xf en tiempo t1 − t0 . Nos preguntamos si, de
entre esos controles, existe uno u∗ tal que se minimize el funcional (9.26). Dicho
control u∗ (t) es llamado control óptimo y la solución x∗ (t) de (9.25) asociado al
control u∗ una trayectoria óptima.
Notemos que, en el problema planteado, los valores de t0 y de t1 no están
en general fijados. Lo único que se pide es que para tiempo t0 el sistema se
encuentre en el estado x0 y para tiempo t1 en el estado xf .
Es importante notar que, en los problemas aplicados, muy a menudo se tiene
que las variables de control ui no pueden tomar valores arbitrarios si no que están
acotadas y además pueden ser discontinuas. Entonces, sólo tiene sentido tomar
controles u pertenecientes a un cierto dominio U ⊂ Rm .
Ası́, diremos que el control u(t) es admisible si u(t) ∈ U para todo t0 ≤ t ≤ t1
y además es continuo a trozos en dicho intervalo. Dicho de otro modo, pueden
existir tiempos si con t0 < s1 < s2 < · · · < sn < t1 que corresponden a
discontinuidades de primera especie de u(t).
Un caso muy habitual de conjunto de controles admisibles U es el hipercubo
de Rm siguiente
λ̇ = 2x∗ + aλ , (9.32)
−2u∗ + λ = 0 . (9.33)
104 Control Óptimo
λ(T ) = 0 .
ẋ = y , ẏ = u(t) , (9.35)
9.5 Problemas resueltos 105
3. Hallar un control u(t) por realimentación lineal que haga mı́nimo el fun-
cional ∞
2 1 2
y + u dt ,
0 10
sujeto a ẋ = −x + u(t), ẏ = x.
Solución. Utilizaremos la Proposición 82 para solucionar el problema
planteado. El sistema lineal viene definido por
ẋ x
=A + bu ,
ẏ y
siendo
−1 0 1
A= , B= .
1 0 0
El funcional a minimizar se puede escribir de la forma
∞
x T
(x, y)Q + u Ru dt ,
0 y
con las matrices simétricas
0 0 1
Q= , R= .
0 1 10
Utilizando la Proposición 82, el control óptimo por realimentación lineal
es
x
u∗ (t) = −R−1 B T P ,
y
siendo la matriz simétrica
p11 p12
P = ,
p12 p22
solución de la ecuación matricial algebraica de Riccati
P BR−1 B T P − AT P − P A − Q = 0 .
Es fácil comprobar que dicha ecuación es
2[p11 + 5p211 − p12 ] p12 + 10p11 p12 − p22 0 0
= ,
p12 + 10p11 p12 − p22 −1 + 10p212 0 0
dando lugar a la solución
⎛
1
√ ! ⎞
−1 + 1 + 2 10 √1
⎜ 10 & 10
. ⎟
P =⎝ ⎠ .
√1 1
+ 2
10 10 5
ẋ = y , ẏ = u(t) . (9.38)
H = λ 1 y + λ2 u , (9.39)
λ1 (t) = c1 , λ2 (t) = c2 − c1 t ,
x = −y 2 /2 + β , (9.43)
H = λ1 y + λ2 (−x + u) , (9.45)
λ2 (t) = A sin(t − φ) ,
o de forma equivalente
∗ −1 si (2k + 1)π ≤ t − φ ≤ (2k + 2)π , k ∈ N ∪ {0} ,
u (t) =
1 si 2kπ ≤ t − φ ≤ (2k + 1)π , k ∈ N ∪ {0} .
(9.47)
Se tiene pues un control u∗ (t) de tipo bang–bang donde las discontinuidades
tienen lugar cada intervalo de tiempo π.
0.5
X
0.5 1 1.5 2
-0.5
-1
(x, y) = (1, 0). Además, es fácil ver que las circunferencias (9.48) son
recorridas (según avanza el tiempo) en el sentido de las agujas del
reloj con un periodo de 2π. En particular, una semicircunferencia se
recorre en el tiempo π, ver Figura 9.7.
De forma totalmente análoga al caso anterior, si u(t) = −1, el sistema
(9.44) es ẋ = y, ẏ = −x + −1, es decir, dx/dy = y/(−x − 1) de modo
que las trayectorias del sistema vienen dadas por
(x + 1)2 + y 2 = R2 , (9.49)
0.5
X
-2 -1.5 -1 -0.5
-0.5
-1
X
-3 -2 -1 1 2
-1
-2
-3
-4
Figura 9.9: Una trayectoria óptima con el control final u = 1, compuesta de tres
arcos de circunferencias
114 Control Óptimo
X
-1 1 2 3
-1
-2
Figura 9.10: Una trayectoria óptima con el control final u = −1, compuesta de
tres arcos de circunferencias
Capı́tulo 10
Prácticas
Tc es la temperatura de la cámara.
Ta es la temperatura ambiente.
115
116 Prácticas
VHg − Vcr
h= .
Acr
La fuerza Fm ejercida por los motores. Esta será la variable de control.
118 Prácticas
Aplicando las leyes de la dinámica clásica de Newton, la fuerza inercial Fin viene
dada por
2 " 2
d2r d2 r dθ d θ dr dθ
m 2 =m −r er + m r 2 + 2 eθ ,
dt dt2 dt dt dt dt
siendo m la masa del satélite. Por otra parte, la fuerza gravitacional Fg es
m
Fg = −k 2 er ,
r
siendo k = 4 × 104 m3 /s2 el producto de la masa de la Tierra y la constante de
gravitación universal. Además, definimos
Fp = pr er + pθ eθ , Fm = ur er + uθ eθ ,
siendo ur y uθ las variables de control. En el sistema de referencia no inercial
solidario al satélite la fuerza total que actúa sobre el satélite es nula de manera
que
2 " 2
d2 r dθ d θ dr dθ m
m − r
e r + m r + 2 eθ + k 2 er = Fm + Fp .
dt2 dt dt2 dt dt r
Figura 10.3: (a) El péndulo cónico con su masa realizando una trayectoria cir-
cular uniforme. (b) Otra trayectoria cercana a la anterior.
1 2 2 ˙ 2 sin2 θ] ,
K = m [θ̇ + phi
2
U = mg[1 − cos θ] .
122 Prácticas
Tomemos las siguientes coordenadas del sistema grúa con dos grados de
libertad:
x(t) ∈ R posición en función del tiempo de la masa m1 a lo largo de un
eje horizontal.
θ(t) será el ángulo respecto de la vertical en función del tiempo que forma
el péndulo.
Utilizando el Lagrangiano del sistema grúa L = K − U , siendo K y U la
energı́a cinética y potencial del sistema respectivamente, es fácil mostrar que
1 1
L(x, ẋ, θ, θ̇) = (m1 + m2 )ẋ2 + m2 2 θ̇2 cos2 θ + m2 ẋθ̇ cos θ + m2 g cos θ .
2 2
Mediante las ecuaciones de Euler-Lagrange
d ∂L ∂L d ∂L ∂L
− = u(t) , − =0,
dt ∂ ẋ ∂x dt ∂ θ̇ ∂θ
siendo u(t) la fuerza horizontal aplicada a la masa m1 , se obtienen las siguientes
ecuaciones del movimento de la grúa
siendo µ := m2 /(m1 + m2 ).
4. A la vista de los resultados del apartado anterior, dar las gráficas del
control óptimo u∗ (t), la de las superposiciones de la posición x(t) y la
velocidad ẋ(t) de m1 con la sen̄al de referencia z(t) y ż(t) y finalmemte la
del ángulo θ(t).
5. Según las gráficas del apartado anterior, decir si son verdaderas o falsas
las siguientes afirmaciones:
[3] E.J. Davison & S.H. Wang. I.E.E.E. Trans. Autom. Control, 20, 516.
[4] L. Elsgoltz. Ecuaciones diferenciales y cálculo variacional. Ed. Mir,
Moscou, 1992.
[5] B.C. Kuo. Sistemas de control automático. Prentice Hall, 1996.
[10] B. Porter & R. Crossley. Modal control. Taylor and Francis, London,
1972.
129