Está en la página 1de 25

5 Retroalimentación de estado

5.
5.1 Asignación del polinomio característico
del sistema
Sea el sistema (escalar)
⎧⎪ •
( A, b, c) ⎨ x(t ) = Ax(t ) + bu (t )
⎪⎩ y (t ) = cx(t ).
cuyo
y polinomio
p característico es
a ( s ) = det( sI − A) = s n + a1s n−1 + " + an .

1
Se ddesea modificar
S difi ell sistema
it (A,b,c)
(A b ) por medio
di de
d la
l
retroalimentación de estado
u (t ) = − kx
k (t ) + v(t )
donde k = [k1 k 2 " k n ] es un vector fila y v(t) es una
nueva entrada, a fin de obtener un sistema en lazo cerrado
con polinomio característico deseado
α ( s ) = s n + α1s n−1 + " + α n .

Esto significa que buscamos reubicar los modos del sistema


(y por consiguiente, los polos del mismo) mediante
retroalimentación de estado.
estado

2
La retroalimentación de estado se muestra esquemáticamente
en la siguiente figura.

3
Aplicando la retroalimentación de estado u (t ) = − kx(t ) + v(t )
al sistema (A,b,c), obtenemos el sistema en lazo cerrado

x(t ) = ( A − bk ) x(t ) + bv
b (t )
y (t ) = cx(t )
cuyo polinomio característico es
ak ( s ) = det( sI − A + bk ).

Entonces, el problema es averiguar bajo qué condiciones existe


u (t ) = − kx(t ) + v(t ) tal que α ( s ) = ak ( s ), y cómo calcular el
vector k.

4
Tenemos que
α ( s ) = ak ( s ) = det( sI − A + bk )
= det{( sI − A)[ I n + ( sI − A) −1 bk ]}
= det( sI − A) det[ I n + ( sI − A) −1 bk ].

Lema 5.1. Sean L y N matrices de dimensiones nxm y mxn


respectivamente. Entonces se cumple que
det( I n − LN ) = det( I m − NL)).

5
Utilizando el lema anterior en det[ I n + ( sI − A) −1 bk ],
] con
L = −( sI − A) −1 b, N = k , y m = 1, tenemos que

det[ I n + ( sI − A) −1 bk ] = det[1 + k ( sI − A) −1 b]
= 1 + k ( sI − A) −1 b.

Por lo tanto
α ( s ) = a ( s )[1 + k ( sI − A) −1 b],
de donde
α ( s ) − a ( s ) = a ( s )k ( sI − A) −1 b.

6
Como tenemos en la ecuación anterior polinomios en “s”,
s , el
vector k puede encontrarse igualando los coeficientes
correspondientes de las potencias de “s”.
Para ello utilizamos la expresión
−1 1
( sI − A) = [ Is n−1 + ( A + a1 I ) s n−2 + ( A2 + a1 A + a2 I ) s n−3
a( s)
+ " + ( An−1 + a1 An−2 + " + an−1 I )].
)]

7
Por lo tanto
( s n + α1s n−1 + " + α n ) − ( s n + a1s n−1 + " + an )
I n−1 + ( A + a1 I ) s n−2 + ( A2 + a1 A + a2 I ) s n−3 + "]b.
= k[ Is

Examinando p
por ppotencias de “s” la ecuación anterior, tenemos
que
α1 − a1 = kb
α 2 − a2 = kAb + a1kb
α 3 − a3 = kA2b + a1kAb + a2 kb
#

8
Las relaciones anteriores se pueden escribir como
α − a = kCT
d d
donde
α = [α1 α 2 " α n ]

a = [a1 a2 " an ]

C = [b Ab " An−1b]

⎡ 1 a1 a2 " an−1 ⎤
⎢ 0 1 a1 an − 2 ⎥
⎢ ⎥
T =⎢ 0 1 # ⎥.
⎢ # % a1 ⎥
⎢ ⎥
⎢⎣ 0 " 0 1 ⎥⎦
9
De la ecuación anterior, puede verse que un polinomio
cualquiera α (s ) puede ser asignado mediante
retroalimentación de estado como polinomio característico
del sistema en lazo cerrado si y solo si la matriz de
controlabilidad del sistema es no singular, es decir, si y solo
si el sistema es controlable
controlable.
Si el sistema es controlable, el vector de retroalimentación k
que asigna
i i α (s
ell polinomio
li ( ) estáá dado
d d por
k = (α − a )T −1C −1 (5.1)
la cual se conoce como fórmula de Bass-Gura.

10
Observe que para la forma canónica controlador tenemos que
−1
⎡ 1 a1 a2 " an−1 ⎤
⎢ 0 1 a1 an − 2 ⎥
⎢ ⎥
C c= ⎢ 0 1 # ⎥ = T −1.
⎢ # % a1 ⎥
⎢ ⎥
⎣⎢ 0 " 0 1 ⎥⎦

Es decir, que para un sistema en forma canónica controlador, el


vector k puede obtenerse como
k = α − a.

11
Alternativamente, el vector de retroalimentación puede
también calcularse mediante la fórmula
k = [0 " 0 1] C −1α ( A) (5 2)
(5.2)
conocida como fórmula de Ackermann, donde α (s ) es el
polinomio característico deseado y [0 " 0 1]C −1 es la
última fila de C −1.

12
55.2
2 Efecto de la retroalimentación sobre:
ceros del sistema, controlabilidad y
observabilidad

Efecto de retroalimentación sobre ceros del sistema


Sea
Y ( s) b( s )
H (s) = = c( sI − A) −1 b =
U ( s) a( s)
la función de transferencia del sistema (A,b,c).

Suponiendo que a(s) y b(s) son coprimos, los ceros del


sistema son las raíces de b(s) y los polos del sistema son las
raíces
í de
d a(s).
()
13
Para la retroalimentación de estado
u (t ) = − kx(t ) + v(t )
tenemos que (condiciones iniciales iguales a cero)
U ( s ) = − kX ( s ) + V ( s ) = −k ( sI − A) −1 bU ( s ) + V ( s )
de donde
U ((ss ) 1
= −1
.
V ( s ) 1 + k ( sI − A) b

14
Entonces, la función de transferencia del sistema en lazo
Entonces
cerrado estará dada por
Y ( s ) Y ( s ) U ( s ) b( s ) ⎡ 1 ⎤
c( sI − A + bk ) −1 b = = ⋅ =
V ( s ) U ( s ) V ( s ) a ( s ) ⎢⎣1 + k ( sI − A) −1 b ⎥⎦

b( s ) ⎡ a ( s ) ⎤ b( s )
= =
a ( s ) ⎢⎣ a ( s ) + g ( s ) ⎥⎦ a ( s ) + g ( s )

donde g ( s ) := k Adj( sI − A)b.

15
De lo anterior puede verse que:
1. El polinomio característico del sistema en lazo cerrado es
a ( s ) + g ( s ) = α ( s ).

2 Los ceros del sistema no son afectados por retroalimentación


2.
en el sentido de que no se pueden reubicar. Sin embargo, los
ceros se pueden cancelar si α (s ) y b(s) tienen raíces
comunes.

16
Efecto de retroalimentación sobre controlabilidad
Considere que tenemos un sistema controlable, dado en la
f
forma canónica
ó i controlador
t l d ( Ac , bc , cc ).
)
Se puede ver que con la retroalimentación de estado ( A − b k , b , c )
u (t ) = − kx
k (t ) + v(t ) ell sistema
i retroalimentado
li d
c c c c

sigue estando en la forma canónica controlador, y


por lo tanto sigue siendo controlable.
controlable
Si el sistema no es controlable, el sistema retroalimentado
tampoco es controlable
controlable.
Entonces, la retroalimentación de estado no afecta la
controlabilidad
l bilid d del
d l sistema.
i

17
Efecto de retroalimentación sobre observabilidad
Para analizar la observabilidad, suponga que el sistema
(A b ) es controlable
(A,b,c) t l bl y observable.
b bl Como
C se vio i
anteriormente, la función de transferencia del sistema
retroalimentado es
−1 b( s ) b( s )
c( sI − A + bk ) b = = .
a( s) + g ( s) α ( s)

Entonces el sistema ( A − bk , b, c)), el cual sigue


g siendo
controlable, será observable si y solo si b(s) y α (s ) son
coprimos, esto es si y solo si los modos del sistema en lazo
cerrado
d no coinciden
i id con los l ceros del d l sistema.
i Por
P lol tanto,
la observabilidad puede ser afectada por retroalimentación de
estado
estado.
18
5 3 Seguimiento
5.3 S i i t ded referencia
f i constante
t t

Sea (A,b,c) controlable, y suponga que al tiempo t0 = 0 se


presenta una perturbación de manera tal que x(0) = x0 ≠ 0, y
que se desea
d usar la
l retroalimentación
t li t ió de t d u (t ) = − kx
d estado k (t )
para llevar x0 a cero.
Entonces, si el sistema no es estable, o si se desea por ejemplo
hacer que tenga una dinámica más rápida (o más lenta), se
debe calcular el vector k para ubicar los modos del sistema en
lazo cerrado en posiciones adecuadas en la parte izquierda del
plano complejo.
p p j La velocidad con queq x0 tienda a cero
dependerá de los modos del sistema en lazo cerrado, es decir,
de los valores propios de la matriz ( A − bk ).
19
Suponga que en lugar de llevar el estado del sistema a cero,
cero se
quiere llevar a un estado dado, tal que la salida del sistema
tienda a un valor constante deseado,, es decir
y (t ) = cx(t ) → yd .

A este problema
bl le
l llamaremos
ll seguimiento de referencia
constante.
Utilizando la retroalimentación de estado u (t ) = − kx(t ) + vd ,
tenemos que

x(t ) = ( A − bk ) xd + bvd = 0
de donde
xd = −( A − bk ) −1 bvd .

20
E t
Entonces
yd = cxd = −c( A − bk ) −1 bvd .

Sea H k ( s ) = c( sI − A + bk ) −1 b la función de transferencia del


sistema en lazo cerrado.
Entonces tenemos que
y d = H k ( 0) v d
de donde
yd
vd = .
H k ( 0)

21
Por lo tanto, para una función de transferencia en lazo cerrado
H k (s ) dada, existe una entrada vd tal que y (t ) → yd
si H k (0) ≠ 0, es decir, si H k (s ) no tiene ceros en s=0.
Dado que los ceros de H k (s ) corresponden a los ceros de H(s),
entonces existe vd si H (0) = −cA−1b ≠ 0.
Observe que la velocidad con que la salida tienda al valor
deseado depende de los modos del sistema en lazo cerrado.

22
5.4 Rechazo de perturbaciones constantes

Sea el sistema

x(t ) = Ax(t ) + bu (t ) + w
y (t ) = cx(t )
donde w es una perturbación constante desconocida (vector), y
suponga que se quiere llevar la salida del sistema a cero, aún
en presencia de esta perturbación
perturbación.

23
Utilizando la retroalimentación de estado u(t)=-kx(t)
u(t)= kx(t) se puede
estabilizar el sistema, pero tendremos valores en estado
estacionario ppara la salida diferentes de cero.
Para rechazar la perturbación w (es decir, para hacer que la
salida tienda a cero sin importar el valor de w), además de
retroalimentación de estado, vamos a utilizar retroalimentación
dinámica de la salida.

Sea q (t ) = y (t ), y defínase
u (t ) = − k1 x(t ) − k 2 q (t )
es decir, la entrada u(t) es una combinación de retroalimentación
de estado con retroalimentación dinámica de la salida.
salida

24
Entonces, tenemos el sistema aumentado
⎡ x• (t ) ⎤ ⎡ A − bk ⎤
− bk 2 ⎥ ⎡⎢ x(t ) ⎤⎥ ⎡ w⎤
⎢• ⎥ = ⎢ 1
+ ⎢ ⎥.
⎢⎣q (t )⎥⎦ ⎢ c 0 ⎥⎦ ⎢⎣q (t )⎥⎦ ⎢⎣ 0 ⎥⎦

Si k1 y k 2 se asignan de manera tal que el sistema


aumentado anterior sea estable, entonces tendremos que
0 = cx(∞) = y (∞)
es decir
decir, la salida del sistema tenderá a cero sin importar el
valor de la perturbación w.

25