Está en la página 1de 36

Capı́tulo 6

Controlabilidad y Observabilidad.
Estabilización

6.1. Controlabilidad: definiciones


Vamos a comenzar con una definición muy general del concepto de controlabili-
dad para abarcar todo tipo de sistemas de control. En la Lección 4 vimos que para
definir un sistema de control necesitamos:
1. Un conjunto de tiempos T que puede ser continuo o discreto.
2. Un conjunto U en el que las funciones de entrada toma sus valores: up¨q : T Ñ
U.
3. Un conjunto U que define el espacio de funciones de entrada: up¨q P U.
4. El espacio de estados X: conjunto en el que están definidos los estados del
sistema.
5. El conjunto Y que define el espacio donde las salidas están definidas: yp¨q :
T ÑY
6. La función de transición de estados
ψ : T ˆ T ˆ X ˆ U ÝÑ X
pt, t0 , x, up¨qq Ñ xptq “ ψpt; t0 , x, up¨qq

123
124 Controlabilidad y Observabilidad. Estabilización

7. La función de salidas: yptq “ ηpt, xptq, uptqq, t P T .

Ası́ pues, identificaremos cada sistema con la 7-upla Σ “ pT , U, U, X, Y, ψ, ηq y nos


referiremos a ella como el sistema Σ. Al conjunto T ˆ X lo llamaremos el espacio
de eventos (o fases ,[4]) y hablaremos del evento o fase pt, xq P T ˆ X para indicar
que x es el estado del sistema en el instante t.
Con estos conceptos ya introducidos podemos dar una definición del concep-
to de controlabilidad. Más adelante lo concretaremos para sistemas definidos por
ecuaciones diferenciales.

Definición 6.1 Dado un sistema de control Σ “ pT , U, U, X, Y, ψ, ηq, sea pt0 , x0 q P


T ˆ X un evento dado.
(a) El evento pt, xq P T ˆ X es alcanzable desde el evento pt0 , x0 q P T ˆ X si
existe un control up¨q P U definido en rt0 , ts tal que ψpt; t0 , x0 , up¨qq “ x; es
decir, si, siendo el estado del sistema x0 en el instante t0 , existe un control
definido en rt0 , ts tal que el estado del sistema en t es x. También se dice que
pt0 , x0 q puede controlarse hasta pt, xq.

(b) Σ se dice que es controlable en el intervalo rt0 , t1 s si para cualquier par de


estados x0 , x1 P X el evento pt0 , x0 q es controlable hasta el evento pt1 , x1 q.

(c) Si x0 , x1 P X, T P T , (t ě 0) y existen t0 , t1 P T tales que t1 ´ t0 “ T y pt1 , x1 q


es alcanzable desde pt0 , x0 q entonces se dice que el estado x1 es alcanzable desde
el estado x0 en tiempo T . También se dice que x0 es controlable hasta x1 en
tiempo T . Si cualquier estado x1 P X es alcanzable desde (controlable hasta)
cualquier otro estado x2 P X en tiempo T entonces se dice que el sistema Σ
es alcanzable (controlable) en tiempo T .

(d) El estado x1 es alcanzable desde el estado x0 (o x0 es controlable hasta x1 )


si existe T P T tal que x1 es alcanzable desde x0 en tiempo T ( o x0 es
controlable hasta x1 en tiempo T ). Si cualquier estado x1 P X es alcanzable
desde (controlable hasta) cualquier otro estado x2 P X entonces se dice que el
sistema Σ es alcanzable (controlable).

Un conjunto que juega un papel muy importante en la teorı́a de control es el


conjunto de alcanzabilidad (o controlabilidad)

Definición 6.2 Sea x P X y T P T . Al conjunto

RT pxq :“ tz P X : z es alcanzable desde x en tiempo T u.


6.1 Controlabilidad: definiciones 125

se le llama conjunto de estados alcanzables desde x en tiempo T . Y el con-


junto de alcanzabilidad desde x se define como

Rpxq :“ tz P X : z es alcanzabe desde x en algún tiempo u.

Por lo tanto, el conjunto de alcanzabilidad desde x es:


ď
Rpxq “ RT pxq.
T PT

Una consecuencia inmediata de estas definiciones es

Proposición 6.3 El sistema Σ es alcanzable/controlable (en tiempo T ) si y sólo si


Rpxq “ X (respectivamente RT pxq “ X) para todo x P X.

Para sistemas diferenciales: T Ă R, U Ă Rm , X Ă Rn , Y Ă Rp son conjuntos


abiertos, U “ P CpT , Xq es el conjunto de funciones continuas a trozos, η : T ˆ X ˆ
U Ñ Y es una función continua y xptq “ ψpt; t0 , x0 , up¨qq es la solución del sistema

9
xptq “ f pt, xptq, uptqq, t P T , t ě t0 (6.1)

que cumple la condición inicial xpt0 q “ x0 . Teniendo en cuenta la Definición 6.1


podemos dar la siguiente definición de controlabilidad/alcanzabilidad de los sistemas
diferenciales.

Definición 6.4 Sea x0 P X y t0 P T .


(i) Un estado x1 P X se dice que es alcanzable/controlable desde x0 en tiempo T
si existe un control up¨q P P Cprt0 , t0 ` T s, Xq tal que la solución del sistema
(6.1) con la condición inicial xpt0 q “ x0 está definita en rt0 , t0 ` T s y cumple
xpt0 ` T q “ x1 .

(ii) Un estado x1 P X se dice que es alcanzable/controlable desde x0 si es alcanza-


ble/controlable para algún tiempo T .

(iii) El sistema (6.1) se dice que es alcanzable/controlable desde x0 en rt0 , tf s si


cualquier estado x1 P X es alcanzable/controlable desde x0 en tiempo T “
tf ´ t0 .

El sistema (6.1) se dice que es alcanzable/controlable controlable en rt0 , tf s si para


cualquier par de estados x0 , x1 P X la solución del sistema (6.1) con la condición
inicial xpt0 q “ x0 cumple que xpt1 q “ x1 .
126 Controlabilidad y Observabilidad. Estabilización

Los sistemas diferenciales son reversibles en el siguiente sentido: x1 “ xpt1 q es el


valor en t “ t1 de la solución del sistema (6.1) con la condición inicial xpt0 q “ x0 si
y sólo si x0 “ xpt0 q es la solución en t “ t0 del sistema (6.1) con la condición inicial
xpt1 q “ x1 , siempre que rt0 , t1 s Ă T . Por lo tanto, los conceptos de controlabilidad
y alcanzabilidad son equivalentes para los sistemas diferenciales. No pasa lo mismo
con los sistemas en diferencias finitas. Dado que desarrollaremos la teorı́a casi exclu-
sivamente para los sistemas diferenciales, en lo sucesivo hablaremos indistintamente
de alcanzabilidad o de controlabilidad.
La estructura de los conjuntos de alcanzabilidad para los sistemas diferenciales
no lineales no tiene por qué ser, en general, simple; y desde luego para los sistemas
no lineales casi nunca es un subespacio vectorial incluso cuando X “ Rn y U “ Rm .
Por ejemplo, para el sistema
"
x9 1 ptq “ u1 ptq2
x9 2 ptq “ u2 ptq2

con U “ R2 , el conjunto de alcanzabilidad desde el origen es el primer cuadrante


del plano:

Rpp0, 0qq “ R` ˆ R` “ tpx1 , x2 q P R2 : x1 ě 0, x2 ě 0u.

Veremos que, sin embargo, para los sistemas lineales los conjuntos de alcanzabilidad
son subespacios vectoriales.
Terminamos esta sección con la siguiente definición que completa la noción de
controlabilidad/estabilidad:

Definición 6.5 Se dice que el sistema (6.1) es accesible desde x si su conjunto de


alcanzabilidad desde x, Rpxq, tiene interior no vacı́o. Y se dice que fuertemente
accesible desde x si RT pxq tiene interior no vacı́o para todo T ą 0.

6.2. Controlabilidad de los sistemas lineales


Para los sistemas lineales hay criterios que permiten detectar con cierta facilidad
cuándo son controlables. En primer lugar, para los sistemas lineales el conjunto
RT pxq de los estados alcanzables desde x en tiempo T tiene una estructura muy
deseable. La demostración se puede dar para los sistemas lineales más generales sin
más que hacer uso de las propiedades vistas en la Lección 4.

Proposición 6.6 Si Σ “ pT , U, U, X, Y, ψ, ηq es un sistema de control lineal y x0 P


X entonces Rt px0 q es un subespacio vectorial para todo t P T .
6.2 Controlabilidad de los sistemas lineales 127

Demostración.- Recordemos que x P Rt px0 q si existen t0 , t1 P T y up¨q P U definida


en rt0 , ts tales que x “ ψpt; t0 , x0 , up¨qq. Supongamos ahora que x, y P Rt px0 q y
α, β P K (un cuerpo arbitrario). Como X es un espacio vectorial sobre K, y x, y P X
tenemos que αx ` βy P X. Ahora bien, como x, y P Rt px0 q:

xptq “ ψpt; t0 , x0 , up¨qq, yptq “ ψpt; t0 , x0 , vp¨qq, up¨q, vp¨q P U,

y entonces, como U es también un espacio vectorial sobre K, wp¨q “ αup¨q`βvp¨q P U


y

αxptq ` βyptq “ αψpt; t0 , x0 , up¨qq ` βψpt; t0 , x0 , vp¨qq “ ψpt; t0 , x0 , αup¨q ` βvp¨qq “


“ ψpt; t0 , x0 , wp¨qq.

porque ψpt; t0 , ¨, ¨q : X ˆ U Ñ X es una aplicación lineal. Además, si up¨q y vp¨q


están definidas en rt0 , ts también wp¨q está definida en este intervalo. En consecuencia
αxptq ` βyptq P Rt px0 q y ası́, Rt px0 q es un subespacio vectorial de X.

Nos centramos ahora en los sistemas diferenciales lineales. Dado que la controla-
bilidad sólo afecta a la relación entre los estados y los controles o entradas, podemos
considerar sólo la ecuación de estados

9
xptq “ Aptqxptq ` Bptquptq t P T , (6.2)

que con la condición inicial xpt0 q “ x0 , t0 P T , tiene como única solución:


żt
0 0
xptq “ ψpt; t0 , x , up¨qq “ Φpt, t0 qx ` Φpt, sqBpsqupsqds. (6.3)
t0

Denotamos con
"ż tf *
Rptf , t0 q “ Φptf , sqBpsqupsqds : up¨q P U (6.4)
t0

que es el subespacio de los estados alcanzables en tiempo tf ´ t0 desde el estado


x0 “ 0 en t0 . Em efecto, la forma de las soluciones (6.3) implica que

xptf q “ x1 ô x1 ´ Φpt, t0 qx0 P Rptf , t0 q

En otras palabras, el estado del sistema en el instante tf es x1 si y sólo si el vector


x1 ´ Φpt, t0 qx0 está en el subespacio Rptf , t0 q. Ahora bien, por la Definición 6.4, el
sistema (6.2) es controlable en rt0 , tf s si para cualesquiera estados x0 , x1 P Rn se
tiene que xpt0 q “ x0 y xptf q “ x1 . En consecuencia

Proposición 6.7 El sistema (6.2) es controlable en rt0 , tf s Ă T si y sólo si Rptf , t0 q “


Rn .
128 Controlabilidad y Observabilidad. Estabilización

El subespacio vectorial Rptf , t0 q admite una caracterización algebraica indepen-


diente de los controles. Esto es muy útil para saber cuándo un sistema es controlable
pero es, al mismo, tiempo una propiedad muy especial de los sistemas lineales. Co-
menzamos definiendo una aplicación lineal cuya imagen es Rptf , t0 q:

Lr : P Cprt0 , tf s, Rn q ÝÑ Rn
ż tf
(6.5)
up¨q Ñ Φptf , sqBpsqupsqds
t0

Para lo que sigue puede consultarse [4, Sec. A7]. El conjunto P Cprt0 , t1 s, Rn q es un
espacio de Hilbert con el producto escalar definido por
ż tf
ă u, v ą2 “ uptqT vptqdt, u, v P P Cprt0 , t1 s, Rn q,
t0

y Lr es una aplicación lineal continua. La aplicación adjunta se define como L˚r :


Rn ÝÑ P Cprt0 , tf s, Rq tal que:

ă z, Lr u ą“ă L˚r z, u ą2 , z P Rn , u P P Cprt0 , tf s, Rn q,

donde ă ¨, ¨ ą es el producto escalar habitual en Rn :

ă x, y ą“ xT y, , x, y P Rn .

En nuestro caso concreto:


ż tf ż tf
T
` ˘T
ă z, Lr u ą“ z Φptf , sqBpsqupsqds “ BpsqT Φptf , sqT z upsqds.
t0 t0

Y ż tf
ă L˚r z, u ą2 “ pL˚r psqqT upsqds.
t0

Por lo tanto, si
L˚r : Rn ÝÑ P Cprt0 , tf s, Rn q
(6.6)
z Ñ Bp¨qT Φptf , ¨qT z
se cumple ă z, Lr u ą“ă L˚r z, u ą2 .
Ahora bien, para operadores de rango finito tenemos el siguiente resultado ([4,
Sec. A.7.4])

Lema 6.8 Sea F “ R o C. Sea H un espacio de Hilbert sobre F y A : H Ñ Fm una


aplicación lineal continua con A˚ : Fm Ñ H como aplicación adjunta. Entonces,
(i) A˚ , AA˚ y A˚ A son aplicaciones lineales continuas.
6.2 Controlabilidad de los sistemas lineales 129

(ii) H “ Im A˚ ‘ Ker A, Fm “ Im A ‘ Ker A˚ .

(iii) KerpAA˚ q “ Ker A˚ , ImpAA˚ q “ Im A.

(iv) KerpA˚ Aq “ Ker A, ImpA˚ Aq “ Im A˚ .

Como consecuencia de este Lema tenemos que L˚r es una aplicación lineal continua
y Im Lr L˚r “ Im Lr . Ahora bien, Im Lr “ Rptf , t0 q y
ˆż tf ˙
˚ T T
Im Lr Lr “ Im Φptf , tqBptqBptq Φptf , tq dt .
t0

Se denota ż tf
W ptf , t0 q “ Φptf , tqBptqBptqT Φptf , tqT dt (6.7)
t0

y se le llama matriz grammiana del sistema (6.2). Obsérvese que esta matriz es
simétrica (hermı́tica si trabajáramos con sistemas de ecuaciones con coeficientes en
C). Además, para cualquier x P Rn se tiene
ż tf
T
x W ptf , t0 qx “ xT Φptf , tqBptqBptqT Φptf , tqT xdt “
żtt0f
› ›
“ ›BptqT Φptf , tqT x› dt ě 0.
2
t0

Esto significa que la matriz W ptf , t0 q ě 0; i.e., es semidefinida positiva (o definida no


negativa). Por lo tanto, los valores propios de W ptf , t0 q son números reales (incluso
en el caso complejo) no negativos. Y son todos positivos si y sólo si det W ptf , t0 q ‰ 0
porque el determinante de una matriz es el producto de sus valores propios.
Toda esta discusión y la Proposición 6.7 nos permite concluir:

Teorema 6.9 Con las notaciones introducidas se tiene:


(i) Rptf , t0 q “ Im W ptf , t0 q.

(ii) El sistema (6.2) es controlable en rt0 , tf s Ă T si y sólo si det W ptf , t0 q ‰ 0.

(iii) El sistema (6.2) es controlable en rt0 , tf s Ă T si y sólo si W ptf , t0 q es definida


positiva.

Este importante Teorema nos dice que la controlabilidad de los sistemas lineales no
depende de los controles que se puedan escoger: el sistema es o no controlable en
rt0 , tf s independientemente up¨q; sólo depende de la matriz de transición de estados
9
(es decir, de las soluciones del sistema autónomo xptq “ Aptqxptq) y de la matriz de
controles o entradas Bptq. Por esto la siguiente definición tiene sentido
130 Controlabilidad y Observabilidad. Estabilización

Definición 6.10 Dadas dos matrices Ap¨q P P Cprt0 , tf s, Rnˆn q, Bp¨q P P Cprt0 , tf s, Rnˆm q,
diremos que el par pAp¨q, Bp¨qq es controlable si el sistema (6.2) es controlable en
rt0 , tf s.

Hay otra observación importante que conviene tener presente. La matriz gram-
miana depende del intervalo rt0 , tf s. Es perfectamente posible que sea definida posi-
tiva en este intervalo (y, por lo tanto, el sistema controlable en rt0 , tf s) y no lo sea
en algún intervalo más peqeño (y, por lo tanto, el sistema no puede controlarse en
un intervalo de tiempo menor). Y del mismo modo puede no ser definida positiva
en rt0 , tf s y serlo en rt0 , t1f s con t1f ą tf . Respecto a t0 se pueden hacer comentarios
similares.
El Teorema 6.9 nos proporciona una caracterización de la controlabilidad de un
sistema pero no nos da una función de control que nos permita llevar el estado x0 en
el instante t0 a cualquier otro x1 en el instante t1 . Ese es nuestro siguiente cometido.
En realidad, vamos a encontrar un control que nos sirve para controlar el sistema
(6.2) en rt0 , tf s con un coste (o “energı́a”) mı́nimo en el sentido que se explica a
continuación. Para una función up¨q P P Cprt0 , tf s, Rq definimos su coste como
ż tf ż tf
T
ă up¨q, up¨q ą2 “ uptq uptqdt “ }uptq}22 dt “ }up¨q}22 (6.8)
t0 t0

Obsérvese que estamos usando el mismo sı́mbolo para la norma euclı́dea (la que
está dentro de la integral) y la norma L2 de la función up¨q, pero no hay peligro de
confusión.
Primero tenemos

Proposición 6.11 Si el sistema (6.2) es controlable y x0 , x1 P Rn entonces la fun-


ción
pptq “ BptqT Φptf , tqT W ptf , t0 q´1 px1 ´ Φptf , t0 qx0 q
u (6.9)
hace que la solución del sistema xptq cumpla xpt0 q “ x0 y xptf q “ x1 .

Demostración.- El problema de condiciones iniciales


"
9
xptq “ Aptqxptq ` Bptqp
uptq
t P rt0 , tf s (6.10)
xpt0 q “ x0

tiene una única solución:


żt
0 0
pp¨qq “ Φpt, t0 qx `
ψpt; t0 , x , u upsqds.
Φptf , sqBpsqp
t0
6.2 Controlabilidad de los sistemas lineales 131

Debemos comprobar que ψptf ; t0 , x0 , up¨qq “ x1 . En efecto,


ψptf ; t0 , x0 , u
pp¨qq “
ż tf
0
“ Φptf , t0 qx ` Φptf , sqBpsqBpsqT Φptf , sqT W ptf , t0 q´1 px1 ´ Φptf , t0 qx0 qds “
„tż0 tf 
0
“ Φptf , t0 qx ` Φptf , sqBpsqBpsq Φptf , sq ds W ptf , t0 q´1 px1 ´ Φptf , t0 qx0 q “
T T
t0
“ Φptf , t0 qx0 ` px1 ´ Φptf , t0 qx0 q “ x1 .

El control u pp¨q de (6.9) transfiere el evento pt0 , x0 q al evento pt1 , x1 q pero no


es el único posible control que lo hace. De hecho, si vp¨q P Ker Lr donde Lr es la
aplicación lineal de (6.5) entonces u rp¨q “ upp¨q ` vp¨q también transfiere el estado
0 1
x en el instante t0 al estado x en el instante tf . En otras palabras, tal conjunto
de controles es la variedad lineal (subespacio afı́n) u pp¨q ` Ker Lr Ă P Cprt0 , tf s, Rn q.
Nuestro objetivo ahora es probar que la función de u pp¨q ` Ker Lr de menor coste
(6.8) es precisamente la función u pp¨q de (6.9).

Proposición 6.12 Sean x0 , x1 P Rn y sea up¨q P P Cprt0 , tf s, Rn q una función tal


que el problema "
9
xptq “ Aptqxptq ` Bptquptq
t P rt0 , tf s (6.11)
xpt0 q “ x0
cumple xptf q “ x1 . Y sea u
pp¨q la función de (6.9). Entonces
up¨q}2 ď }up¨q}2
}p (6.12)
pptq “ uptq para casi todo t P rt0 , tf s.
con igualdad si y sólo si u

Demostración.- Sea vp¨q :“ up¨q ´ u pp¨q y sean x pptq “ ψpt; t0 , x0 , u


pp¨qq y xptq “
0
ψpt; t0 , x , up¨qq las soluciones de (6.10) y (6.11), respectivamente. Entonces
ż tf ż tf ż tf
Φptf , tqBpsqvptqdt “ Φptf , tqBpsquptqdt ´ Φptf , tqBpsqp uptqdt “
t0 t0 t0
“ pxptf q ´ Φptf , t0 qx0 q ´ pp
xptf q ´ ´Φptf , t0 qx0 q.
Commo xptf q “ x1 “ x
pptf q,
ż tf
Φptf , tqBpsqvptqdt “ 0. (6.13)
t0

Ahora
ż tf ż tf
}up¨q}22 “ T
uptq uptqdt “ uptq ` vptqqT pp
pp uptq ` vptqqdt “
żtt0f ż tf t0 ż tf (6.14)
2 2
“ uptq} dt `
}p }vptq} dt ` 2 pptqT vptqdt.
u
t0 t0 t0
132 Controlabilidad y Observabilidad. Estabilización

Pero por (6.9), teniendo en cuenta que W ptf , t0 qT “ W ptf , t0 q por ser simétrica,
ż tf ż tf
T
“ 1 ‰
0 T ´1
pptq vptqdt “ px ´ Φptf , t0 qx
u W ptf , t0 q Φptf , tqBptqvptqdt.
t0 t0
ż tf
De (6.13) obtenemos pptqT vptqdt “ 0; y ası́
u
t0

}up¨q}22 “ }p
up¨q}22 ` }vp¨q}22 (6.15)
De aquı́ se sigue (6.12) y }up¨q}22 “ }p
up¨q}22 si y sólo si
ż tf ż tf
2
}uptq}2 dt “ uptq}22 dt,
}p
t0 t0

lo cual equivale a que }uptq}2 “ }p


uptq}2 para casi todo t P rt0 , tf s tal y como se
deseaba demostrar.

ż tf Obsérvese que la condición (6.15) es el teorema de Pitágoras debido a que


pptqT vptqdt “ 0 significa que u
u pp¨q y vp¨q son ortogonales. En realidad, la fun-
t0
rp¨q de la variedad u
ción u pp¨q ` Ker Lr de coste mı́n }up¨q} es, por definición,
up¨q`Im Lr q
up¨qPpr
aquella que está a menor distancia de la función 0 P P Cprt0 , tf s, Rn q. La teorı́a ge-
neral nos dice que tal función debe estar en el subespacio ortogonal a Ker Lr . Pero
pKer Lr qK “ Im L˚r por lo que u pp¨q “ L˚r ξ para algún ξ P Rn . Recordando la defi-
nición de Lr en (6.5), vemos que la función u pp¨q en (6.9) tiene esta precisa forma.
La Proposición 6.12 nos dice que es en la función u pp¨q donde se alcanza el mı́nimo
coste.
La condición de controlabilidad a través de la matriz grammiana exige conocer
la matriz de transición de estados. Cuando las matrices Aptq y Bptq son de clase
C 8 en rt0 , tf s ; es decir, son diferenciables infinitamente, se puede dar un criterio
para saber si un sistema es controlable en términos de las matrices Aptq y Bptq del
sistema. Como preparación para ello vamos a construir una sucesión de matrices de
la siguiente forma: Para t P rt0 , tf s:
"
K0 ptq :“ Bptq
(6.16)
Kj ptq :“ ´AptqKj´1 ptq ` K9 j´1 ptq, j “ 1, 2, . . .

Lema 6.13 Si las matrices Aptq y Bptq del sistema (6.2) son infinitamente dife-
renciables en un intervalo I Ă R y Φpt, t0 q es su matriz de transición de estados
correspondiente a la condición inicial xpt0 q “ x0 , se tiene
Bj
pΦpt, sqBpsqq “ Φpt, sqKj psq, j “ 0, 1, 2, . . . (6.17)
Bsj
6.2 Controlabilidad de los sistemas lineales 133

Obsérvese que si Aptq y Bptq son infinitamente diferenciables en I, Φpt, t0 q tam-


bién lo es.
Demostración.- Lo haremos por inducción sobre j “ 0, 1, 2, . . .. Si j “ 0 no
hay nada que demostrar porque K0 psq “ Bpsq. Supongamos entonces que (6.17) es
verdadero hasta j y calculemos
ˆ j ˙
B j`1 B B B
pΦpt, sqBpsqq “ pΦpt, sqBpsqq “ pΦpt, sqKj psqq.
Bs j`1 Bs Bs j Bs

Como Φpt, sq´1 “ Φps, tq, y recordando que para cualquier matriz invertible Xptq se
d 9
tiene Xptq´1 “ ´Xptq´1 XptqXptq ´1
:
dt
B j`1 B
pΦpt, sqBpsqq “ pΦps, tq´1 Kj psqq “
Bs j`1 Bs
B 9
“ ´Φps, tq´1 pΦps, tqqΦps, tq´1 Kj psq ` Φps, tq´1 Kpsq
Bs
9
Por ser Φps, tq la matriz de transición de estados del sistema xptq “ Aptqxptq, es
9 B
solución del sistema diferencial matricial Xptq “ AptqXptq. Es decir, pΦps, tqq “
Bs
ApsqΦps, tq. Por lo tanto,

B j`1 9
pΦpt, sqBpsqq “ ´Φps, tq´1 ApsqΦps, tqΦps, tq´1 Kj psq ` Φps, tq´1 Kpsq “
Bsj`1
9
“ ´Φpt, sqApsqKj psq ` Φpt, sqKpsq “
9
“ Φpt, sqp´ApsqKj psq ` Kpsqq “ Φpt, sqKj`1 psq

tal y como se deseaba demostrar.

Una consecuencia de (6.17) es que


„ j 
B
Kj ptq “ pΦpt, sqBpsqq
Bsj s“t

porque al ser Φpt, tq “ In tenemos


„ j 
B
pΦpt, sqBpsqq “ Φpt, tqKj ptq “ Kj ptq.
Bsj s“t

En lo que sigue usaremos la siguiente notación: Para t P T y q ě 0 entero


“ ‰
Mq ptq “ K0 ptq K1 ptq ¨ ¨ ¨ Kq ptq . (6.18)
134 Controlabilidad y Observabilidad. Estabilización

Teorema 6.14 Supongamos que las matrices Aptq P Fnˆn y Bptq P Fnˆm del sistema
(6.2) son infinitamente diferenciables en un intervalo I Ă R y sea rt0 , tf s Ă I. Si
existen tc P rt0 , tf s y un entero q ě 0 tal que rang Mq ptc q “ n entonces el sistema
(6.2) es controlable en rt0 , tf s.

Demostración.- Si el sistema (6.2) no es controlable en rt0 , tf s entonces la


matriz grammiana del sistema W ptf , t0 q en (6.7) no es invertible. Esto implica que
existe un vector y P Rn , y ‰ 0 tal que W ptf , t0 qy “ 0. Y también y T W ptf , t0 qy “ 0.
Entonces
ż tf ż tf
T T T T
0 “ y W ptf , t0 qy “ y Φptf , tqBptqBptq Φptf , tq ydt “ }BptqT Φptf , tqT y}22 dt
t0 t0

y por lo tanto y T Φptf , tqBptq “ 0 para todo t P rt0 , tf s. Sea tc P rt0 , tf s cualquiera
y z “ Φptf , tc qT y. Entonces z ‰ 0 porque y ‰ 0 y Φptf , tc q es invertible. Además
y T “ z T Φptf , tc q´1 “ z T Φptc , tf q y
0 “ y T Φptf , tqBptq “ z T Φptc , tf qΦptf , tqBptq “ z T Φptc , tqBptq, @t P rt0 , tf s.
En particular, para t “ tc tenemos que Φptc , tc q “ In y por lo tanto
0 “ z T Φptc , tc qBptc q “ z T Bptc q “ z T K0 ptc q.
Ahora, derivando sucesivamente z T Φptc , tqBptq “ 0 respecto de t tenemos que, por
el Lema 6.13, para j “ 1, 2, . . .
Bj T
0“ pz Φptc , tqBptqq “ z T Φptc , tqKj ptq.
Btj

Para t “ tc obtenemos
0 “ z T Kj ptc q, j “ 1, 2 . . .
En definitiva para todo q ě 0
“ ‰
0 “ z T K0 ptc q K1 ptc q ¨ ¨ ¨ Kq ptc q “ z T Mq ptc q,
lo que implica que para todo q ě 0 y todo tc P rt0 , tf s, rang Mq ptc q ă n. Llegamos
ası́ a una contradicción.

Debe observarse que si se cumple rang Mq ptc q “ n para algún tc P I y q ě 0


entonces el sistema es controlable en cualquier intervalo que contenga a tc y esté
contenido en I.
Por otra parte, la condición suficiente rang Mq ptc q “ n para algún tc P rt0 , tf s y
algún entero q ě 0 no es, en general, necesaria para que el sistema lineal (6.2) sea
controlable. Un ejemplo de sistema controlable que no cumple esta condición puede
verse en [5, pag. 11]. Sin embrago, tenemos:
6.2 Controlabilidad de los sistemas lineales 135

Teorema 6.15 Si Aptq y Bptq son funciones matriciales analı́ticas en un intervalo


I Ă R entonces la condición rang Mq ptc q “ n para algún tc P rt0 , tf s Ă I y algún
entero q ě 0 es necesaria y suficiente para que el sistema (6.2) sea controlable en
rt0 , tf s.

Demostración.- Recordemos que una función es analı́tica en un punto si es


desarrollable en serie de potencias en un entorno de ese punto. Recordemos también
que en el caso complejo ser analı́tica y diferenciable es lo mismo.
Ya sabemos que la condición rang Mq ptc q “ n para algún tc P rt0 , tf s Ă I y algún
entero q ě 0 es suficiente para que (6.2) sea controlable. Veamos que también es
suficiente. Para ello supongamos que el sistema (6.2) es controlable en rt0 , tf s y que
Aptq, Bptq son funciones matriciales analı́ticas en I Ą rt0 , tf s. Supongamos que, sin
embargo, para todo t P rt0 , tf s y todo entero q ě 0, rang Mq ptq ă n. Sean tc P rt0 , tf s
y q ě 0, y para este tc y q definamos

Pq “ tz P Rn : z T Mq ptc q “ 0u

Como rang Mq ptc q ă n, tenemos que Pq ‰ t0u para todo q ě 0. Es claro que Pq es
un subespacio vectorial de R para cada q ě 0 y que se cumple

P0 Ě P 1 Ě P2 Ě ¨ ¨ ¨

Las dimensiones de estos subespacios forman un sucesión no creciente de modo que


debe haber un ı́ndice r tal que t0u ‰ Pr “ Pr`1 “ ¨ ¨ ¨ . Escojamos un vector z P Pr
de modo que z T Mj ptc q “ 0 para j “ 0, 1, 2, . . .. En particular,

z T Bptc q “ z T K0 ptc q “ z T M0 ptc q “ 0.

Y si y “ Φpt0 , tc qT z entonces y T Φpt0 , tc qBptc q “ 0. Ahora bien, si Aptq y Bptq son


analı́ticas en I también Φpt0 , tq lo es. Por lo tanto, si definimos F ptq “ Φpt0 , tqBptq
tenemos que F ptq es analı́tica en I. Pero z T F ptc q “ „0. Teniendo  en cuenta que
j
d
z T Mj ptc q “ 0 para j “ 0, 1, 2, . . . se puede ver que z T F ptq “ 0 de modo
dtj t“tc
que por ser F ptq analı́tica concluı́mos que z T F ptq “ 0 para todo t en un entorno de
tc . Como esto sucede para todo tc P rt0 , tf s, por continuación analı́tica, llegamos a
que z T F ptq “ 0 para todo t P rt0 , tf s. Es decir, z T Φpt0 , tqBptq “ 0 para t P rt0 , tf s.
Ahora, como el sistema es controlable en rt0 , tf s, existe un control up¨q que lleva
el sistema en el estado xpt0 q “ z al estado xptf q “ 0. Es decir
ż tf
0 “ Φptf , t0 qz ` Φptf , sqBpsqupsqds.
t0
136 Controlabilidad y Observabilidad. Estabilización

Despejando z:
ż tf ż tf
´1
z “ ´ Φptf , t0 q Φptf , sqBpsqupsqds “ ´ Φpt0 , tf qΦptf , sqBpsqupsqds “
żtt0f t0

“ ´ Φpt0 , sqBpsqupsqds.
t0

Teniendo en cuenta que z t Φpt0 , tqBptq “ 0 para t P rt0 , tf s,


ż tf
T
z z“´ z T Φpt0 , sqBpsqupsqds “ 0.
t0

En conclusión, }z}22 “ z T z “ 0, que implica z “ 0; llegando a una contradicción.

Para los sistemas invariantes en el tiempo

9
xptq “ Axptq ` Buptq, tPT (6.19)

con A P Rnˆn y B P Rnˆm , podemos aplicar directamente la condición rang Mq ptc q “


n directamente para obtener una caracterización de la controlabilidad especialmente
sencilla de expresar.

Teorema 6.16 El sistema (6.19) es controlable en rt0 , tf s Ă T si y sólo si


“ ‰
rang B AB A2 B ¨ ¨ ¨ An´1 B “ n (6.20)

A la matriz “ ‰
CpA, Bq “ B AB A2 B ¨ ¨ ¨ An´1 B
se le llama matriz de controlabilidad del sistema (6.19) o del par pA, Bq.
Demostración.- Por una parte, para todo t P T , K0 ptq “ B, y por inducción es
fácil ver que Kj ptq “ p´1qj Aj B, j “ 1, 2, . . .. Entonces, la condición rang Mq ptc q “ n
para algún tc P rt0 , tf s Ă I y algún entero q ě 0 es equivalente a que
“ ‰
rang B AB A2 B ¨ ¨ ¨ Aq B “ n

para algún entero q ě 0. Ahora bien, para j “ 0, 1, 2, . . .


“ ‰ “ ‰
rang B AB A2 B ¨ ¨ ¨ Aj B ď rang B AB A2 B ¨ ¨ ¨ Aj`1 B ,

de modo que si q ă n,
“ ‰ “ ‰
rang B AB A2 B ¨ ¨ ¨ Aq B “ n ô rang B AB A2 B ¨ ¨ ¨ An´1 B “ n.
6.2 Controlabilidad de los sistemas lineales 137

Y si q ě n entonces, por el Teorema de Cayley-Hamilton1 , An “ α0 In ` α1 A ` ¨ ¨ ¨ `


αn´1 An´1 . En consecuencia,
“ ‰ “ ‰
rang B AB A2 B ¨ ¨ ¨ Aq B “ rang B AB A2 B ¨ ¨ ¨ An´1 B .
Es decir, el sistema (6.19) (o el par pA, Bq) es controlable si y sólo si rang CpA, Bq “
n.
La controlabilidad de los sistemas invariantes en el tiempo es independiente del
intervalo concreto. Por eso, se suele decir que el sistema es controlable sin referencia
a ningún intervalo.

Ejemplo 6.17 Consideremos el sistema


x9 1 “ x2 , x9 2 “ u
 „
´1
Sea T ą 0. Calcúlese el control de coste mı́nimo que lleva el sistema de xp0q “
0
a xpT q “ 0; y hállese el estado del sistema par dicho control en todo instante t.
„ 
0 1
Observamos, en primer lugar, que el sistema es controlable porque A “ ,
„  0 0
0
b“ y
1 „ 
0 1
CpA, bq “
1 0
que es una matriz de rango 2.
Calculamos ahora
„ una
 matriz fundamental de soluciones. Como A está en forma
At 1 t
de Jordan, e “ . Entonces,
0 1
„ 
0 Apt´t0 q 0 1 t ´ t0
Φpt, t0 qx “ e x “
0 1
La matriz grammiana para t0 “ 0 y tf “ T serı́a:
żT„ „  „  żT„ 2  „ 3 
1 s 0 “ ‰ 1 0 s s T {3 T 2 {2
W pT, 0q “ 0 1 ds “ ds “ .
0 0 1 1 s 1 0 s 1 T 2 {2 T
Ahora
ˆ„  „ ˙ ˆ ˙
T T ´1 0 ´1 12 T
pptq “ Bptq ΦpT, tq W pT, 0q
u ´ ΦpT, 0q “ 3 ´t
0 0 T 2
1
El teorema de Hamilton-Cayley establece que toda matriz satisface su polinomio caracterı́stico;
es decir, si detpλIn ´Aq “ λn `an´1 λn´1 `¨ ¨ ¨`a1 λ`a0 entonces An `an´1 An´1 `¨ ¨ ¨`a1 A`a0 In “
0
138 Controlabilidad y Observabilidad. Estabilización

Finalmente, usando la fórmula de variación de las constantes:


żt
xptq “ e x ` eAs bupsqds “
At 0

„ „ 0  ż t„ „  ˆ ˙
1 t ´1 1 s 0 12 T
“ ` ´ s ds “
»0 1 0ˆ 0 0˙fi1 1 T3 2
12 T t3
— ´1 ` t ´
T 3 4 6 ffi
“ — – 12 T
ˆ ˙ ffi .
fl
t2
t ´
T3 2 22

Obteniendo ası́ la fórmula de los estados del sistema para t P r0, T s.

Ejemplo 6.18 Vimos en el Ejemplo 5.18 que las ecuaciones del sistema que se
obtiene al linealizar el sistema que rige el movimiento de un satélite en órbita al-
rededor de la Tierra en torno a la órbita estacionaria son de la forma (ver (5.34))
9
xptq “ Axptq ` Buptq con
» fi » fi
0 1 0 0 0 0
—3Ω2 0 0 2R0 Ωffi —1 0 ffi
— ffi — ffi
A“— 0— 0 0 1 ffi , B “ —0 0 ffi
ffi –
– 2Ω fl 1 fl
0 ´ 0 0 0
R0 R0

siendo R0 la distancia a la órbita geoestacionaria y Ω la velocidad angular de la


Tierra. El vector de controles está formado por las fuerzas que mediante propulsores
se puede ejercer desde el satélite en las direcciones radial y tangencial con el obje-
tivo de compensar las perturbaciones que pudieran desviar el satélite de su órbita
estacionaria: uptq “ pFr ptq, Fθ ptqq.
En este ejemplo, se puede calcular “a mano” la matriz de controllabilidad del
sistema:
» fi
0 0 1 0 0 2Ω ´Ω2 0
— 1 0 0 2 Ω ´Ω2 0 0 ´2 Ω3 ffi
— ffi
— 1 2 Ω 4 Ω 2 ffi
CpA, Bq “ —— 0 0 0 ´ 0 0 ´ ffi
ffi
— R 0 R 0 R 0 ffi
– 1 2Ω 2
4Ω 2Ω 3 fl
0 ´ 0 0 ´ 0
R0 R0 R0 R0

pudiéndose comprobar que las cuatro primeras columnas son linealmente indepen-
dientes. Es decir, rang CpA, Bq “ 4 y por lo tanto el sistema linealizado es con-
trolable. Calcular su matriz grammiana o el control de coste mı́nimo que permite
6.2 Controlabilidad de los sistemas lineales 139

controlarlo en todo momento es una tarea en la que la ayuda de software se hace


imprescindible. En la función de MATLAB controlsatelite.m, que se puede en-
contrar en la página web del curso, se calcula la función de control de coste mı́nimo
“ ‰T
que lleva el sistema desde el reposo en t “ 0 al estado x “ 0 0 1 0 en t “ 1.
También se explora lo que sucederı́a si alguno de los dos propulsores del satélite
dejaran de funcionar (¿serı́a el sistema linealizado controlable?).

6.2.1. La descomposición de Kalman y el test PBH


Para los sistemas lineales invariantes en el tiempo, el text del rango (6.20) es
muy atractivo por su aparente sencillez. Sin embargo adolece de un defecto práctico:
las columnas de la matriz de controlabilidad tienden a ser cada vez más linealmente
dependientes. Esto es debido a que para cualquier vector x P Rn la sucesión de
subespacios ă Ak x ą tiende a un subespacio ă y ą que es A-invariante; es decir, tal
que Ay “ αy. Por lo tanto, cerca de la convergencia Ak x está, aproximadamente, en
la misma dirección que Ak`1 x. Por supuesto, el valor de k para el que esto vaya a
suceder puede ser muy grande pero hay matrices (mal condicionadas por lo general)
para las que el test del rango puede fallar. Consideremos, por ejemplo, el siguiente
código de MATLAB:

>> P=hilb(7); D=diag(10.^(-7:-1)); A=P^(-1)*D*P;


>> b=rand(7,1);C=b;
>> for j=1:6
C=[C A*C(:,j)];
end
>> rank(C)
ans =
6

En él se define P como una matriz de Hilbert. Se sabe que estas matrices son
invertibles pero muy mal condicionadas. En aritmética exacta los valores propios de
A son los de D: 10´7 , 10´6 ,. . . , 10´1 . La matriz A es, por lo tanto, no derogatoria.
Esto significa que para casi todo vector x P Fn , x ‰ 0, los vectores x, Ax,. . . , A6 x
son linealmente independientes. Ası́ pues, el rango de la matriz de controlabilidad
de pA, bq deberı́a ser 7 para cualquier b ‰ 0 escogido aleatoriamente. Sin embargo,
el valor que devuelve MATLAB es 6.
Este problema puede ser difı́cilmente evitable cuando la matriz A está muy mal
condicionada pero hay otra forma de caracterizar la controlabilidad de pA, Bq que
puede ser, en ocasiones, más efectiva. Para demostrar su validez haremos uso de la
llamada descomposición de Kalman. El objetivo de esta descomposición es separar,
140 Controlabilidad y Observabilidad. Estabilización

para los sistemas que no son controlables, los estados controlables de los que no lo
son.
En esta sección consideraremos sistemas lineales invariantes en el tiempo:
"
9
xptq “ Axptq ` Buptq
, t P T “ R, (6.21)
yptq “ Cxptq ` Duptq

con A P Rnˆn , B P Rnˆm , C P Rpˆn , D P Rpˆm .

Teorema 6.19 (Descomposición de Kalman) Sea r “ rang CpA, Bq el rango de


la matriz de controlabilidad del sistema (6.21). Existe una matriz invertible T P Rnˆn
tal que „  „ 
´1 A1 A2 ´1 B1
T AT “ , T B“ (6.22)
0 A3 0
donde A1 P Rrˆr , B1 P Rrˆm y pA1 , B1 q es controlable.

Demostración.- Consideremos la matriz de controlabilidad del sistema (6.21):


“ ‰
CpA, Bq “ B AB ¨ ¨ ¨ An´1 B .
Como esta matriz tiene rango r, hay r columnas en ella que son linealmente indepen-
dientes. Escojamos en CpA, Bq r columnas linealmente independientes y formemos
con ellas una matriz T1 P Rnˆr . Las columnas de T1 forman un sistema libre de
vectores de Rn que puede ampliarse hasta una base de Rn . Sea T2 P“ Rnˆpn´rq ‰ la
matriz cuyas columnas sean los vectores añadidos de forma que T “ T1 T2 sea
una matriz invertible.
Observemos lo siguiente: si tj es la j-ésima columna de T1 entonces es de la
forma tj “ Ak bi para algunos enteros i “ 1, . . . , m y k “ 0, 1, . . . , n ´ 1 siendo bi
la i-ésima columna de B. Por lo tanto, Atj “ Ak`1 bi . Si k ` 1 ď n ´ 1 entonces
Atj es una columna de CpA, Bq y, en consecuencia, es una combinación lineal de
las columnas de T1 . Y si k ` 1 “ n, por el teorema de Hamilton-Cayley, Ak`1 “
An “ α0 In ` α1 A ` . . . ` αn´1 An´1 , de modo que Atj “ An bi es una combinación
lineal de las columnas de CpA, Bq y, ası́, una combinación lineal de las columnas de
T1 . En definitiva, Atj es una combinación
“ ‰lineal de las columnas de T1 . Es decir,
Atj “ T1 aj , 1 ď j ď r. Si A “ a1 ¨ ¨ ¨ ar entonces,
„ 
“ ‰ “ ‰ “ ‰ A1 A2
A T1 T2 “ AT1 AT2 “ T1 T2 .
0 A3
Además, como las columnas de B son combinaciones lineales de las de T1 :
„ 
“ ‰ B1
B “ T1 T2 .
0
6.2 Controlabilidad de los sistemas lineales 141

Esto prueba (6.21). Además:

r “ rang CpA,
„ Bq “ rangpT ´1 CpA, Bqq
 “ rang
„ CpT ´1 AT, T ´1 Bq “ 
B1 A1 B1 ¨ ¨ ¨ A1n´1 B1 B1 A1 B1 ¨ ¨ ¨ A1r´1 B1
“ rang “ rang ,
0 0 ¨¨¨ 0 0 0 ¨¨¨ 0

donde, en la última igualdad, hemos usado de nevo el Teorema de Hamilton-Cayley.


Ası́ pues rang CpA1 , B1 q “ r y por consiguiente pA1 , B1 q es controlable.

El resultado de este teorema se puede interpretar de la siguiente forma: existe


un cambio reversible de las variables de estado:

z “ T ´1 x

de modo que, respecto de estas nuevas variables el sistema (6.21) se escribe como
sigue: $
& z91 ptq “ A1 z1 ptq ` A2 z2 ptq ` B1 uptq
z92 ptq “ A3 z2 ptq (6.23)
%
yptq “ C1 z1 ptq ` C2 z2 ptq ` Duptq
“ ‰
con C1 C2 “ CT . Tal y como muestra la Figura 6.1 mediante este cambio de
variable hemos extraı́do un subsistema de orden n ´ r al que no le afecta el control
u y, que por lo tanto, es completamente incontrolable (sólo tiene componente de
movimiento libre). A la matriz de este sistema (en la nueva base) A3 la llamaremos
parte incontrolable del sistema.

uptq pz1 q C1 z1 yptq


`
pA1 , B1 , C1 , 0q `

A2 z2

pz2 q C2 z2
pA3 , 0, C2 , 0q

Figura 6.1: Extracción de la parte incontrolable

Nótese que el sistema (6.23) también puede verse „como un sistema controlable
z ptq
en los estados z1 ptq en los que la función de control es 2 con matriz de control
“ ‰ “ ‰ uptq
A2 B1 y con matrices de salida C1 y C2 D , siendo z2 p¨q la solución del sistema
libre z92 ptq “ A3 z2 ptq.
142 Controlabilidad y Observabilidad. Estabilización

La descomposición de Kalman es la base de la demostración del siguiente resul-


tado que caracteriza la controlabilidad de los sistemas lineales sin hacer uso de la
matriz de controlabilidad.

Teorema 6.20 (Test PBH2 ) El sistema (6.21) es controlable si y sólo si para todo
λ P ΛpAq (el conjunto de los valores propios de A) se tiene
“ ‰
rang λIn ´ A B “ n. (6.24)

Demostración.- Veamos que si no se cumple la condición (6.24) entonces la


matriz de controlabilidad no“ tiene rango ‰completo. En efecto, supongamos que para
algún λ P ΛpAq el rango de λIn ´ A B no es n. Esto significa que las filas de esta
matriz son linealmente dependientes; es decir, existe un vector v P Rnˆ1 tal que
“ ‰
v T λIn ´ A B “ 0.

Entonces v t pλIn ´ Aq “ 0 y v T B “ 0 simultáneamente. Es decir,

v T A “ λv T y v T B “ 0.

Pero entonces v T AB “ λv T B “ 0 e inductivamente v T Ak B “ pv T AqAk´1 B “


λv T Ak´1 B “ 0. Esto implica que
“ ‰
v T B AB ¨ ¨ ¨ An´1 B “ 0,

y por lo tanto, las filas de la matriz de controlabilidad son linealmente dependientes.


De aquı́ se deduce que rang CpA, Bq ă n y el sistema no es controlable.
Recı́procamente, si el sistema no fuera controlable, por el Teorema de la Des-
composición de Kalman, existirı́a una matriz invertible T para la que se verificar{ıa
la condición (6.22). Como A y „ 
A1 A2
0 A3
son semejantes, ambas matrices tienen los mismos valores propios. Sea λ0 P ΛpA3 q
un valor propio de A3 . Entonces detpλ0 In´r ´ A3 “ 0 siendo r “ rang CpA, Bq. Como
las filas de λ0 In´r ´ A3 son linealmente dependientes, existe un vector v1 P Rpn´rqˆ1
“ ‰T
tal que v1T pλ0 In´r ´ A3 q “ 0. Si ponemos v “ 0 v1 P Rnˆ1 tenemos que
„ 
T λ0 Ir ´ A1 ´A2 B1
v “ 0.
0 λ0 In´r ´ A3 0
2
Popov-Belevitch-Hautus
6.3 Observabilidad de los sistemas lineales 143

Por consiguiente,
„ 
λ0 Ir ´ A1 ´A2 B1
rang ă n.
0 λ0 In´r ´ A3 0
Y como
„  „ 
´1
“ ‰ T 0 λ0 Ir ´ A1 ´A2 B1
T λ0 In ´ A B “ ,
0 Im 0 λ0 In´r ´ A3 0
tenemos que
„ 
“ ‰ λ0 Ir ´ A1 ´A2 B1
rang λ0 In ´ A B “ rang .
0 λ0 In´r ´ A3 0
“ ‰
Es decir, rang λ0 In ´ A B ă n. Pero los valores propios de A3 son valores propios
de A porque detpλIn ´Aq “ detpλIr ´A1 q detpλn´r ´A3 q. En definitiva,
“ si pA, Bq‰ no es
controlable, hay al menos un valor propio, λ0 , de A tal que rang λ0 In ´ A B ă n;
en contradicción con (6.24).

Una consecuencia interesante del test PBH, que se estudia en la relación de


problemas, es que permite determinar el mı́nimo número de controles necesarios
para controlar un sistema lineal invariante en el tiempo.

6.3. Observabilidad de los sistemas lineales


El concepto de observabilidad está relacionado con la capacidad de determinar
el estado del sistema a partir de las salidas (conocido el control). Con precisión:

Definición 6.21 El sistema


"
9
xptq “ Aptqxptq ` Buptq,
tPT (6.25)
yptq “ Cptqxptq ` Dptquptq

se dice que es observable en rt0 , tf s si para cualquier entrada up¨q P P Cprt0 , tf s, Rm q


el estado inicial del sistema xpt0 q “ x0 está determinado de manera única por la
salida yptq en rt0 , tf s.

Un par de observaciones:

Una vez conocido el estado inicial del sistema, el estado del mismo queda
determinado de forma única en rt0 , tf s porque la solución del problema de
9
condiciones iniciales xptq “ Aptqxptq ` Buptq, xpt0 q “ x0 tiene solución única.
144 Controlabilidad y Observabilidad. Estabilización

La respuesta del sistema es


żt
0
yptq “ CΦpt, t0 qx ` CΦptf , sqBpsqupsqds ` Dptquptq (6.26)
t0
żt
El segundo término yr ptq “ CΦptf , sqBpsqupsqds ` Dptquptq es la respuesta
t0
forzada del sistema y, conocidas las matrices del sistema y la entrada, se puede
“calcular” independientemente de x0 . Por lo tanto, una vez obtenida yr la
relación entre yptq y x0 queda determinada por la respuesta del sistema a una
entrada cero. Es decir, podemos centrarnoss sin pérdida de generalidad en :

yptq “ CptqΦpt, t0 qx0 , para t P rt0 , tf s. (6.27)

De la misma forma que el subespacio de estados alcanzables Rpt0 , tf q ((6.4)) jugaba


un papel fundamental en el estudio de la controlabilidad de (6.25), y lo caracte-
rizábamos como la imagen de la aplicación lineal Lr definida en (6.5), también para
la observabilidad tenemos un subespacio y aplicación lineal que juegan un papel
similar. Especı́ficamente, definimos

Lo : Rn ÝÑ P Cprt0 , tf s, Rp q
(6.28)
x0 Ñ Cp¨qΦp¨, t0 qx0|rt0 ,tf s

donde Cp¨qΦp¨, t0 qx0|rt0 ,tf s representa la restricción de Cp¨qΦp¨, t0 qx0 al intervalo rt0 , tf s.

Definición 6.22 El estado x0 se dice que es inobservable en rt0 , tf s si la respuesta


del sistema a la entrada 0 con la condición inicial xpt0 q “ x0 es cero en rt0 , tf s. En
otras palabras, si

yptq “ CptqΦpt, t0 qx0 “ 0 para t P rt0 , tf s.

Decir que x0 es inobservable en rt0 , tf s equivale a decir que x0 P Ker Lo ; en otras


palabras, el conjunto de estados inobservables en rt0 , tf s es el subespacio Ker Lo . En
consecuencia tenemos

Proposición 6.23 El sistema (6.25) es observable en rt0 , tf s si y sólo si Ker Lo “


t0u.

ż tf Ahora bien, vimos que para la aplicación lineal Lr definida en (6.5) por Lr pup¨qq “
Φptf , sqBpsqupsqds, su aplicación adjunta es ( ver (6.6)): L˚r pzq “ Bp¨qT Φptf , ¨qT z.
t0
6.3 Observabilidad de los sistemas lineales 145

Como para aplicaciones lineales continuas definidas en espacios de Hilbert se tiene


que la adjunta de la adjunta de una aplicación lineal es la propia aplicación lineal
([4, Sec. A.7.3]) tenemos que

L˚o : P Cprt0 , tf s, Rp q ÝÑ Rn
ż tf
(6.29)
vp¨q Ñ Φpt, t0 qT CptqT vptqdt
t0

Por otra parte, por el Lema 6.8, Ker L˚o Lo “ Ker Lo , Im L˚o Lo “ Im L˚o y también
Im Lo ‘ Ker Lo “ Rn . Observemos finalmente que
ˆż tf ˙
˚ T T
Im Lo Lo “ Im Φpt, t0 q Cptq CptqΦpt, t0 qdt .
t0

Se denota con ż tf
M ptf , t0 q “ Φpt, t0 qT CptqT CptqΦpt, t0 qdt (6.30)
t0

y se le llama matriz grammiana de observabilidad. Su parecido con la matriz gram-


miana de controlabilidad W ptf , t0 q es más que evidente. Como W ptf , t0 q, M ptf , t0 q es
una matriz simétrica semidefinida positiva, y es definida positiva (det M ptf , t0 q ‰ 0)
si y sólo si Im L˚o L0 “ Rn . En consecuencia,

Teorema 6.24 El sistema (6.25) es observable en rt0 , tf s si y sólo si det M ptf , t0 q ‰


0.

Es destacable, de nuevo, el gran parecido de las caracterizaciones de controlabi-


lidad del Teorema 6.9 y de observabilidad del Teorema 6.24. Diremos más sobre ello
más adelante.

Corolario 6.25 Supongamos que el sistema (6.25) es observable en rt0 , tf s.


(i) Si yp¨q es la respuesta del sistema a una entrada nula en rt0 , tf s con la condición
inicial xpt0 q “ x0 entonces
T
}yp¨q}2 “ x0 M ptf , t0 qx0 .

(ii) Si yp¨q es la respuesta del sistema a una entrada nula en rt0 , tf s entonces
ż tf
0
x “ pL˚o Lo q´1 L˚o yp¨q “ M ptf , t0 q ´1
Φpt, t0 qT CptqT yptqdt.
t0
146 Controlabilidad y Observabilidad. Estabilización

Demostración.- (i) Para t P rt0 , tf s, yptq “ CptqΦpt, t0 qx0 de modo que


ż tf ż tf
T
}yp¨q}22 “ T
yptq yptqdt “ x0 Φpt, t0 qT CptqT CptqΦpt, t0 qx0 dt “
t0 ˆż t0 ˙
tf
0T T
“ x Φpt, t0 q Cptq CptqΦpt, t0 qdt x0 “ x0 M ptf , t0 qx0 .
T T
t0

(ii) Teniendo en cuenta la definición de Lo en (6.28), tenemos

yp¨q “ Lo x0 en rt0 , tf s.

Dado que el sistema es observable, por la Proposición 6.23, L˚o Lo es un isomorfismo


en Rn y como
L˚o yp¨q “ L˚o Lo x0 ,
ż tf
0 ˚ ´1 ˚ ˚
obtenemos x “ pLo Lo q Lo yp¨q. Ahora bien, Lo yp¨q “ Φpt, t0 qT CptqT yptqdt y
t0
M ptf , t0 q es la matriz de L˚o Lo en las bases canónicas. En consecuencia
ż tf
0 ´1
x “ M ptf , t0 q Φpt, t0 qT CptqT yptqdt (6.31)
t0

tal como se deseaba demostrar.

Recordando que Ker Lo˚ Lo “ Ker Lo y que, la matriz de L˚o Lo en las bases
canónicas de Rn es la matriz grammiana M ptf , t0 q, tenemos

Corolario 6.26 El subespacio de estados inobservables en rt0 , tf s es Ker M ptf , t0 q.

Al igual que para los sistemas controlables hay criterios basados en rangos de
matrices que sirven para saber si un sistema dado es observable. Los siguientes
resultados se dan sin demostración porque son muy parecidas a las de los correspon-
dientes resultados para sistema controlables. Definimos, como en (6.16), la siguiente
sucesión de matrices para t P rt0 , tf s:
"
L0 ptq “ Cptq
(6.32)
Lj ptq “ Lj´1 ptqAptq ` L9 j´1 ptq, j “ 1, 2 . . .

Se demuestra por inducción que


„ j 
B
Lj ptq “ pCpsqΦps, tqq , j “ 1, 2, . . .
Bsj s“t
6.3 Observabilidad de los sistemas lineales 147

Teorema 6.27 Supongamos que las matrices Aptq y Cptq del sistema (6.25) son
infinitamente diferenciables en un intervalo I Ă R y sea rt0 , tf s P I. Si existen
ta P rt0 , tf s y un entero q ě 0 tal que
» fi
L0 pta q
—L1 pta qffi
— ffi
rang — .. ffi “ n, (6.33)
– . fl
Lq pta q

entonces el sistema (6.25) es observable en rt0 , tf s.

Al igual que en el caso controlable, si se cumple (6.33) para algún ta P I y alqún


entero q ě 0 entonces el sistema es observable en cualquier intervalo que contenga
a ta y esté contenido en I.
De nuevo, la condición (6.33) no es necesaria, en general, para la observabilidad
del sistema pero sı́ lo es si Aptq y Cptq son analı́ticas en I. La demostración es la
misma que para la controlabilidad.
Finalmente, para los sistemas invariantes en el tiempo
"
9
xptq “ Axptq ` Buptq
tPT “R (6.34)
yptq “ Cxptq ` Duptq

tenemos el siguiente criterio cuya demostración sigue las mismas pautas que en el
caso de sistemas controlables.

Teorema 6.28 El sistema (6.34) es observable en rt0 , tf s Ă T si y sólo si


» fi
C
— CA ffi
— ffi
rang — .. ffi “ n. (6.35)
– . fl
CAn´1

A la matriz » fi
C
— ffi
CA
— ffi
OpA, Cq “ — ffi
..
– fl
.
n´1
CA
se le llama matriz de observabilidad del sistema (6.34) o del para pA, Cq y se de-
muestra que el subespacio de inobservabilidad es Ker OpA, Cq.
148 Controlabilidad y Observabilidad. Estabilización

Al igual que con los sistemas controlables, la observabilidad de los sistemas


invariantes en el tiempo es independiente del intervalo concreto. Por eso, se suele
decir que el sistema es observable sin referencia a ningún intervalo.
Comparando los Teoremas 6.16 y 6.28 enseguida vemos que el sistema
9
xptq “ Axptq ` Buptq
es controlable si y sólo si el sistema
"
9 “ AT zptq
zptq
yptq “ B T zptq
es observable. Esto permite una rápida traslación entre los resultados de controla-
bildad y observabilidad de los sistemas invariantes en el tiempo.
Los siguientes resultados se obtienen directamente dualizando los correspondien-
tes resultados sobre controlabilidad de la Sección 6.2.1

Teorema 6.29 (Descomposición de Kalman de observabilidad) Sea r “


rang OpA, Cq el rango de la matriz de observabilidad del sistema (6.34). Existe una
matriz invertible T P Rnˆn tal que
„ 
´1 A1 0 “ ‰
T AT “ , CT “ C1 0 (6.36)
A2 A3
donde A1 P Rrˆr , C1 P Rpˆr y pA1 , C1 q es controlable.

Teorema 6.30 (Test PBH de observabilidad) El sistema (6.34) es observable


si y sólo si para todo λ P ΛpAq (el conjunto de los valores propios de A) se tiene
„ 
λIn ´ A
rang “ n. (6.37)
C

La dualidad de los sistemas lineales invariantes en el tiempo, que permiten tras-


ladar resultados de los sistemas controlables a los observables y al revés, se extiende,
sin demasiada dificultad, a los sistemas lineales no invariantes en el tiempo pero este
problema no lo abordaremos aquı́.

Ejemplo 6.31 Retomamos el Ejemplo 6.18 sobre el sistema linealizado en torno


a la órbita geoestacionaria del Ejemplo 4.4. Las ecuaciones del sistema linealizado
en torno al punto de equilibrio xe “ pR0 , 0, 0, 0q a control cero son (ver (5.34))
(incluı́mos ahora las ecuaciones de salida):
"
9
xptq “ Axptq ` Buptq
yptq “ Cxptq
6.3 Observabilidad de los sistemas lineales 149

con
» fi » fi
0 1 0 0 0 0
—3Ω2 0 0 2R0 Ωffi —1 0 ffi „ 
— ffi — ffi 1 0 0 0
A“—
— 0 0 0 1 ffi
ffi , B “ —0 0 ffi , C“
– 0 0 1 0
– 2Ω fl 1 fl
0 ´ 0 0 0
R0 R0
siendo R0 la distancia a la órbita geoestacionaria y Ω la velocidad angular de la
Tierra. Vamos a estudiar si el sistema es observable respecto de cada ecuación de
salida independiente.
En primer lugar suponemos que sólo se mide la distancia radial a la posición del
satélite: “ ‰
y1 ptq “ 1 0 0 0 xptq “ x1 ptq “ rptq
La matriz de observabilidad en este caso es:
» fi » fi
c1 1 0 0 0
— c1 A ffi — 0 1 0 0 ffi
OpA, c1 q “ — ffi —
–c1 A2 fl “ –3Ω2
ffi
0 0 2R0 Ωfl
3
c1 A 0 ´Ω2 0 0
que, claramente, tiene rango 3. Por lo tanto el sistema no es observable y el espacio
de inobservabilidad es
“ ‰T
Ker OpA, c1 q “ t 0 0 x 0 : x P Ru.
En otras palabras, que la observación sólo de la posición radial del satélite en cual-
quier intervalo de tiempo rt0 , tf s no nos permite saber cuál era el desplazamiento
angular del satélite en el instante t0 .
Por otra parte, si suponemos que sólo se mide el desplazamiento angular
“ ‰
y2 ptq “ 0 0 1 0 xptq “ x3 ptq “ θptq ´ pθ0 ` Ωtq,
la matriz de observabilidad del sistema serı́a:
» fi
» fi 0 0 1 0
c2 — 0 0 0 1 ffi
— c2 A ffi —— 2Ω
ffi
ffi
OpA, c2 q “ — ffi
–c2 A2 fl “ — 0 ´ 0 0 ffi
— R0 ffi
– 6Ω3 fl
c2 A3
´ 0 0 ´4Ω2
R0
que tiene rango 4 y por lo tanto, sólo midiendo el desplazamiento angular en cada
intervalo de tiempo rt0 , tf s podemos conocer los estados del sistema en t0 y, en
consecuencia, en todo el intervalo.
150 Controlabilidad y Observabilidad. Estabilización

6.4. Estabilización de los sistemas lineales por feed-


back de estados
Un buen número de problemas de control son consecuencia de nuestro deseo de
modificar las caracterı́sticas del sistema para que se comporte de una forma deter-
minada. Una de las herramientas comúnmente usadas es el diseño de controladores
de “feedback” ; es decir, construir sistemas que tomando como entradas las salidas
del sistema original produzcan en éste el comportamiento deseado (realimentamos el
sistema original a partir de la información proporcionada por el mismo). En la Figu-
ra 6.2 se presenta un esquema de realimentación (feedback ): las salidas del sistema Σ
(planta)se usan para producir, a través del sistema Γ (controlador ), nuevas entradas
para el sistema original Σ. El sistema Γ se diseña de modo las entradas en la planta
Σ permitan controlar (de ahı́ el nombre) el comportamiento dinámico de ésta. En
ocasiones se utiliza además una señal externa, vptq,que puede ser la referencia para
la salida o una entrada par ayudar al control.

Planta
vptq uptq
R `
` Σ
wptq yptq

Γ
Controlador

Figura 6.2: Realimentación del sistema Σ

Supongamos entonces que las ecuaciones de Σ en el modelo de espacio-estado


son las habituales (supondremos D “ 0 para simplificar la notación):
"
9
xptq “ Axptq ` Buptq
. (6.38)
yptq “ Cxptq

Supongamos también que las ecuaciones para el sistema Γ son


"
9 “ Kzptq ` Lyptq
zptq
(6.39)
uptq “ M zptq ` F yptq ` Rvptq
6.4 Estabilización de los sistemas lineales por feedback de estados 151

dptq

Controlador Planta

`
uptq 9
xptq “ Axptq ` Buptq
vptq K ` ` yptq
`
yptq “ Cxptq ` Duptq

xptq
´F

Figura 6.3: Sistema de control con unfeedback de estados

Las ecuaciones del sistema conectado se obtienen sustituyendo los valores corres-
pondientes de cada sistema en el otro:

9
xptq “ Axptq ` BM zptq ` BF Cxptq ` BRvptq “ pA ` BF Cqxptq ` BM zptq ` BRvptq,

y
9 “ Kzptq ` LCxptq
zptq
Ası́, las ecuaciones del sistema conectado (llamado también, por razones obvias,
sistema en lazo cerrado) son:
„  „ „  „ 
9
xptq A ` BF C BM xptq BR
“ ` vptq. (6.40)
9
zptq K LC zptq 0

La conexión más simple consiste en suponer que las únicas matrices no nulas en
el sistema Γ son F y R. En este caso, las ecuaciones del sistema en lazo cerrado se
reducen a
9
xptq “ pA ` BF Cqx ` BRvptq. (6.41)
Se dice entonces que se ha realizado un feedback de salidas sobre el sistema (6.38) y
que el sistema resultante (6.41) es el sistema en lazo cerrado por dicho feedback de
salidas.
El análisis del comportamiento del sistema en lazo cerrado por un feedback de
salidas es un problema, en general, difı́cil. Más simple es el análisis del comporta-
miento del sistema cuando el feedback se puede hacer desde los estados; cosa que es
implementable fı́sicamente cuando estos pueden ser medidos. En tal caso, un diagra-
ma de un sistema tı́pico de control en el que se usa un feedback de estados es el que
se presenta en la Figura 6.3. El sistema completo está compuesto por: la planta de-
finida por un sistema de ecuaciones (lineales en este caso) que determina el proceso
152 Controlabilidad y Observabilidad. Estabilización

dinámico, el controlador compuesto por los elementos F y K, la señal de referencia


(o señal de control) v y unas perturbaciones que se han reunido en la función d.
El controlador usa el estado del sistema x y la señal de referencia v para definir la
entrada al sistema dinámico y controlar ası́ el proceso. El objetivo del controlador
de feedback es regular la salida del sistema yptq para que siga la señal de referencia
de entrada en presencia de perturbaciones y, quizá, incertidumbres.
Una faceta importante en el diseño de control es especificar el tipo de compor-
tamiento que se requiere del sistema. El comportamiento básico es que sea estable.
Es decir, que en ausencia de perturbaciones, el estado de equilibrio del sistema sea
asintóticamente estable. Otras especificaciones más sofisticadas pueden ser que la
respuesta a un salto o la respuesta de frecuencia tengan propiedades tales como
que el tiempo de subida, la sobreelongación o el tiempo de ajuste tengan valores
predeterminados.
Dado que estamos suponiendo que se pueden medir los estados y que el co-
nocimiento del estado en el instante t contiene toda la información necesaria para
predecir el comportamiento futuro del sistema, el controlador podrı́a diseñarse para
producir una ley de control que sea una función general del estado y de la señal de
referencia:
u “ αpx, vq.
En el diagrama de la Figura 6.3 se ha supuesto que esta ley es una función lineal en
x y v:
uptq “ ´F xptq ` Kvptq, t P R. (6.42)
El signo menos es una convención para indicar que un feedback negativo es la situa-
ción habitual.
La ecuaciones del sistema en lazo cerrado serı́an entonces (la ecuación de salidas
no se verı́a afectada):
9
xptq “ pA ´ BF qxptq ` BKvptq (6.43)

Dado que un objetivo básico de diseño para el controlador es que el sistema


en lazo cerrado sea asintóticamente estable el problema fundamental que queremos
resolver es el de la estabilización de los sistemas lineales mediante un feedback de
estados. Ahora bien, la estabilidad de los sistemas lineales depende de la posición
en el plano complejo de los valores propios de la matriz de estados. Como, a su vez,
los valores propios de una matriz son las raı́ces de su polinomio caracterı́stico, el
problema que se trata de resolver es: dado un polinomio de grado n:
ppsq “ sn ` pn´1 sn´1 ` ¨ ¨ ¨ ` p1 s ` p0 ,
encontrar una matriz de feedback F tal que el polinomio caracterı́stico de la matriz
en lazo cerrado A´BF sea ppsq. Este problema se conoce con el nombre de problema
6.4 Estabilización de los sistemas lineales por feedback de estados 153

de asignación de valores propios o problema de asignación de polos. Esta última


denominación tiene que ver con el hecho de que los polos de la matriz de transferencia
del sistema son valores propios de la matriz de estados (todos, de hecho, cuando el
sistema es controlable y observable). Veremos que el problema de asignación de
valores propios siempre tiene solución si y sólo si el sistema pA, Bq es controlable.
La demostración la haremos para sistemas con un sólo control aunque es verdad
para sistemas con cualquier número de controles.
Antes de enunciar y demostrar el teorema de asignación de valores propios con-
viene observar que la matriz K no afecta a la estabilidad interna del sistema que
queda determinada por los valores propios de A ´ BF , pero afecta a la solución en
estado estacionario. En efecto, suponiendo que el sistema es de una sola entrada y
una sola salida (la generalización al caso multivariable es inmediata) y que la señal
de referencia es constante (vptq “ v para todo t P R), la solución de equilibrio del
sistema (6.43) es
xe “ ´pA ´ BF q´1 BKv,
y la salida para este estado de equilibrio es

ye “ Cxe ` Due “ Cxe ` DpF xe ` Kvq “ pC ` DF qxe ` DKv.

Si el objetivo de control es que ye siga la señal de referencia, debe ser ye “ v. Ası́


pues, si D “ 0 (que es, como ya se ha dicho, el caso más habitual):

v “ Cxe “ ´CpA ´ BF q´1 BKv ñ 1 “ ´CpA ´ BF q´1 BK ñ


1
ñ K“
CpA ´ BF q´1 B

Obsérvese que K es exactamente el inverso de la ganancia de frecuencia cero del


sistema en lazo cerrado (también el inverso de la matriz de respuesta a un impulso).
En consecuencia, usando K y v se puede controlar la dinámica del sistema en lazo
cerrado para alcanzar el comportamiento deseado. El Ejemplo 6.4 de [1] es una
buena muestra de como utilizar los resultados obtenidos.
Como ya se ha anunciado, nuestro último objetivo en esta sección es probar que
controlabilidad equivale a asignabilidad en el caso monovariable (m “ 1). Es decir,

Teorema 6.32 Consideremos el sistema (6.38) con m “ 1. Este sistema es contro-


lable si y sólo si para cualquier polinomio de grado n

ppsq “ sn ` pn´1 sn´1 ` ¨ ¨ ¨ ` p1 s ` p0 , (6.44)

existe una matriz f P Rnˆ1 tal que el polinomio caracterı́stico de A ´ bf T es ppsq.


154 Controlabilidad y Observabilidad. Estabilización

Demostración.- Supongamos primero que el sistema pA, bq no es controlable.


Por el Teorema de Descomposición de Kalman (Teorema 6.19) existe una matriz
invertible T P Rnˆn tal que
„  „ 
´1 A A b
Ap “ T AT “ 1 2
, pb “ T b “ 1 .
´1
0 A3 0
donde A1 P Rrˆr y A3 P Rpn´rqˆpn´rq siendo r “ rang CpA, bq.
Sea ppsq cualquier polinomio mónico (i.e., con coeficiente principal 1) de grado
n cuyo conjunto de raı́ces es disjunto con ΛpA3 q. Y sea f P Rnˆ1 cualquier matriz.
Pongamos fpT “ f T T y observemos que
„ T T

´1 T p ´ pbfp “
T A 1 ´ b 1 f A2 ´ b 1 f
T pA ´ bf qT “ A 1 2
0 A3
donde f1 y f2 son las submatrices de fp formadas por los r primeros elementos de fp
y los últimos n ´ r elementos de fp, respectivamente. Como A ´ bf T y A p ´ pbfpT son
semejantes, tienen el mismo polinomio caracterı́stico. Ahora bien, ppsq no puede ser
p ´ pbfpT porque los valores propios de A3 siempre son
el polinomio caracterı́stico de A
raı́ces de éste. En consecuencia ppsq no es el polinomio caracterı́stico de A ´ bf T
cualquiera que sea f . Esto demuestra la parte “sólo si” del teorema.
Recı́procamente, supongamos ahora que pA, bq es controlable y sea ppsq “ sn `
pn´1 sn´1 `¨ ¨ ¨`p1 s`p0 un polinomio mónico de grado n. Como pA, bqes controlobale,
la matriz de controlabilidad
“ ‰
CpA, bq “ b Ab ¨ ¨ ¨ An´1 b
tiene rango n y es, por tanto, invertible. Sea S “ CpA, bq´1 y denotemos con sT su
última fila. Con este vector fila construı́mos la matriz
» fi
sT
— sT A ffi
— ffi
T “ — .. ffi . (6.45)
– . fl
sT An´1
Obsérvese que por ser sT la última fila de CpA, bq´1 y CpA, bq´1 CpA, bq “ In tenemos
que " T k
s A b“0 k “ 0, 1, . . . , n ´ 2
T n´1 (6.46)
s A b “ 1.
Por lo tanto » fi
0 ¨¨¨ 0 1
—0 ¨ ¨ ¨ 1 ‹ffi
— ffi
T CpA, bq “ — .. . . .. .. ffi
–. . . . fl
1 ¨¨¨ ‹ ‹
6.4 Estabilización de los sistemas lineales por feedback de estados 155

donde ‹ representa elementos indeterminados. Ası́ pues, T es una matriz invertible.


Además, por el Teorema de Hamilton-Cayley se tiene que si
pA psq “ sn ` an´1 sn´1 ` ¨ ¨ ¨ ` a1 s ` a0
es el polinomio caracterı́stico de A entonces An “ ´a0 In ´ a1 A ´ ¨ ¨ ¨ ´ an´1 An´1 .
Por lo tanto
» fi
» T fi 0 1 0 ¨¨¨ 0 » fi
s A — 0 ffi sT
— sT A2 ffi — 0 1 ¨¨¨ 0 ffi — ffi
— ffi — .. . .. ... .. ffi — sT A
ffi
T A “ — .. ffi “ — . .
. . . ffi — ffi.. (6.47)
– . fl — ffi – fl .
– 0 0 0 ¨¨¨ 1 fl T n´1
sT A n s A
´a0 ´a1 ´a2 ¨ ¨ ¨ ´an´1
A la matriz » fi
0 1 0 ¨¨¨ 0
— 0 0 ffi
1 ¨¨¨ 0
— ffi
— .. .. ffi
.. .. ..
Ac “ — . . ffi
. . .
— ffi
– 0 0 0 ¨¨¨ 1 fl
´a0 ´a1 ´a2 ¨ ¨ ¨ ´an´1
se le llama matriz compañera de pA psq y (6.47) muestra que T AT ´1 “ Ac siendo T
la matriz de (6.45). Más aún, de (6.46) se tiene
» fi
0
— .. ffi
— ffi
bc “ T b “ — . ffi .
–0fl
1
Por consiguiente pA, bq y pAc , bc q son sistemas semejantes. De hecho, se puede ver que
pAc , bc q es una forma canónica para la semejanza de sistemas controlables cuando
m “ 1. Se dice que pAc , bc q es un sistema en forma canónica de controlabilidad. Para
el sistema pAc , bc q es muy fácil encontrar un vector fc P Rnˆ1 tal que Ac ´ bc fcT tiene
el polinomio ppsq “ sn ` pn´1 sn´1 ` ¨ ¨ ¨ ` p1 s ` p0 como polinomio caracterı́stico. En
efecto, basta tomar
“ ‰
fcT “ p0 ´ a0 p1 ´ a1 ¨ ¨ ¨ pn´1 ´ an´1 .
Con este vector tenemos:
» fi
0 1 0 ¨¨¨ 0
— 0 0 1 ¨¨¨ 0 ffi
— ffi
T — .. .. .. ... .. ffi
Ac ´ bc fc “ — . . . . ffi
— ffi
– 0 0 0 ¨¨¨ 1 fl
´p0 ´p1 ´p2 ¨ ¨ ¨ ´pn´1
156 Controlabilidad y Observabilidad. Estabilización

Definiendo “ ‰
f T “ fcT T “ p0 ´ a0 p1 ´ a1 ¨ ¨ ¨ pn´1 ´ an´1 T (6.48)
se obtiene
Ac ´ bc fcT “ T pA ´ bf T qT ´1 ,
lo que demuestra que A ´ bf T es semejante a la matriz compañera del polinomio
ppsq. Es decir, ppsq es el polinomio caracterı́stico de A ´ bf T tal y como se querı́a
demostrar.

La segunda parte de la demostración del Teorema 6.32 proporciona un método


para calcular el vector de feedback f con el que A ´ bf T tiene el polinomio que se
desee como polinomio caracterı́tico.

Procedimiento para calcular la matriz de feedback

Dado el sistema controlable pA, bq y el polinomio ppsq “ sn ` pn´1 sn´1 ` ¨ ¨ ¨ `


p1 s ` p 0 :

1. Fórmese la matriz de controlabilidad del sistema CpA, bq.

2. Calcúlese su inversa CpA, bq´1 .

3. Extráigase la última fila sT de CpA, bq´1 .

4. Fórmese la matriz T de (6.45).

5. Calcúlese el polinomio caracterı́stico de A: pa psq “ sn `an´1 sn´1 `¨ ¨ ¨`a1 s`a0


(por ejemplo, mediante la fórmula T AT ´1 si T está bien condicionada).

6. La matriz de feedback requerida es (véase (6.48)):


“ ‰
f T “ p0 ´ a0 p1 ´ a1 ¨ ¨ ¨ pn´1 ´ an´1 T.

Para sistemas con múltiples entradas el Teorema 6.32 sigue siendo válido: El
sistema (6.38) es controlable si y sólo si para cualquier polinomio mónico de grado
n existe una matriz F P Rmˆn tal que el polinomio caracterı́stico de A ´ BF es ppsq.
La demostración precisa de algunos resultados técnicos que alargarı́an mucho esta
exposición.
El Teorema 6.32 establece que si el sistema no es controlable entonces no se
puede asignar cualquier polinomio de grado n como polinomio caracterı́stico para
los sistemas en lazo cerrado. Una pregunta natural es la de saber cuánta libertad
se tiene en la asignación; es decir, qué polinomios se pueden asignar y cuáles no.
La respuesta es una consecuencia inmediata del Teorema 6.32 y el Teorema de
6.4 Estabilización de los sistemas lineales por feedback de estados 157

Descomposición de Kalman (Teorema 6.19). Recordemos que este teorema establece


que si el sistema pA, Bq no es controlable entonces es semejante a un sistema de la
forma ˆ„  „ ˙
A1 A2 B
, 1
0 A3 0
donde A3 representa la parte incontrolable del sistema y pA1 , B1 q es controlable.

Corolario 6.33 Dado el sistema (6.38) que puede ser no controlable, sea ppsq un
polinomio mónico de grado n y qpsq el polinomio caracterı́stico de la parte incontro-
lable del sistema. Entonces existe una matriz de feedback F P Rmˆn tal que A ´ BF
tiene ppsq como polinomio caracterı́stico si y sólo si qpsq divide a ppsq.

Demostración.- Podemos suponer sin pérdida de generalidad que


„  „ 
A1 A2 B1
A“ , B“ .
0 A3 0
“ ‰
Entonces si escribimos F “ F1 F2 con r el tamaño de A1 :
„ 
A1 ´ B1 F1 A2 ´ B1 F2
Af “ A ´ BF “ .
0 A3
Por lo tanto, existe F tal que A ´ BF tiene ppsq como polinomio caracterı́stico si
y sólo si ppsq es el polinomio caracterı́stico de Af . Pero el polinomio caracterı́stico
de esta matriz es el producto de los polinomios caracterı́sticos de A1 ´ B1 F1 y A3 .
En definitiva, ppsq es el polinomio caracterı́stico de A ´ BF si y sólo si qpsq divide
a ppsq.

Definición 6.34 El sistema (6.38) se dice estabilizable por feedback de estados si


existe una matriz F P Rmˆn tal que la matriz de estados del sistema en lazo cerrado
A ´ BF es asintóticamente estable.

Del Teorema 6.32 se deduce directamente que si el sistema es controlable enton-


ces es estabilizable por feedback de estados. En efecto, se pueden escoger n números
complejos con parte real negativa (conjugados a pares) y formar un polinomio móni-
co real de grado n que los tenga como raı́ces. Para este polinomio existe F tal que
A ´ BF tiene dicho polinomio como polinomio caracterı́stico. El sistema en lazo
cerrado es, por tanto, asintóticamente estable.
La demostración del siguiente corolario es consecuencia del Corolario 6.33

Corolario 6.35 El sistema (6.38) es estabilizable por feedback de estados si y sólo


si los valores propios de la parte incontrolable están en el semiplano Re s ă 0.
158 Controlabilidad y Observabilidad. Estabilización