Está en la página 1de 11

Universidad Nacional de Ingenierı́a - Facultad de Ingenierı́a Mecánica

Departamento Académico de Ingenierı́a Aplicada


CONTROL MODERNO Y ÓPTIMO (MT 227C)
Clase 05-03 Elizabeth Villota Cerna
Semestre 2009 I - UNI 15/05/2009

En lo que sigue discutiremos métodos para el diseño de controladores por realimentación para el caso
de sistemas lineales. El proceso de diseño involucra tres pasos. En el primer paso asumimos que todos los
estados están disponibles y procedemos con el diseño de leyes de control por realimentación de estados.
Luego procedemos con el segundo paso; que corresponde al diseño del estimador, también denominado como
el observador del vector de estados. El último paso consiste en combinar los dos pasos anteriores tal que la
ley de control, diseñada en el primer paso, usa el estimador de estados en vez de el vector de estados real. El
resultado de este paso es un compensador combinado controlador-estimador. A continuación discutiremos el
controlador por realimentación de estados.

1. Control por realimentación de estados


El estado de un sistema dinámico es una colección de variables que permiten la predicción del desarrollo
de un sistema a futuro. A continuación exploraremos la idea de diseñar la dinámica de un sistema a través
de realimentación de estados. La ley de control por realimentación será desarrollada paso a paso usando una
única idea: la ubicación de los autovalores del sistema en lazo cerrado en posiciones deseadas.

1.1. Estructura del controlador

La Fig. 1 muestra un diagrama de un sistema de control por realimentación de estados tı́pico. El sistema
completo consiste del proceso dinámico (planta), que es considerado lineal, los elementos del controlador K
y kr , la entrada de referencia (o señal de comando) r y procesos de disturbio d. El objetivo del controlador
por realimentación es regular la salida del sistema z tal que rastree la señal de referencia aún en la presencia
de disturbios y también incerteza en el proceso.

d
Controller Process

u ẋ = Ax + Bu
r kr 6 6 y
y = C x + Du

−K
x

Figure 6.5: A feedback control system with state feedback. The controller uses the system
Figura 1: Sistema de control por realimentación de estados. El controlador usa el estado del sistema x y la
entrada de referencia r para comandar el proceso (planta) a través de su entrada u. El disturbio es modelado
a través de una entrada aditiva d.

Un elemento importante del diseño de control es la especificación de desempeño. La especificación más


simple de desempeño es la de estabilidad: en la ausencia de disturbios, nuestro objetivo es hacer que el
punto de equilibrio del sistema sea asintóticamente estable. A menudo, especificaciones de desempeño más
sofisticadas dotan de propiedades deseadas a una respuesta al escalón o a la respuesta en frecuencia del
sistema, tales como tiempo de levantamiento, sobreimpulso y tiempo de establecimiento de la respuesta al
escalón. Adicionalmente, una preocupación frecuente es que el sistema posea propiedades de atenuación de
disturbios. Considerando un sistema descrito por la ecuación diferencial lineal:

ẋ(t) = Ax(t) + Bu(t), x(0) = xo


z(t) = Cx(t) + Du(t), ,
y(t) = In x(t)

donde hemos ignorado el disturbio d por ahora. Nuestro objetivo es llevar la salida z a una referencia deseada
r y mantenerla alli.
CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

1.2. Estabilización por realimentación de estados

Asumiendo que todos los componentes del vector de estados pueden ser medidos. Dado que el estado en
el tiempo t contiene toda la información necesaria para predecir el comportamiento futuro del sistema, la
ley de control invariante en el tiempo más general es una función del estado y de la entrada de referencia:
u = α(x, r).
Si la ley de control por realimentación de estados es asumida lineal, entonces la realimentación se puede
escribir como una combinación lineal de todas las variables de estado, incluyendo la referencia:
u = −Kx + kr r,
donde K ∈ Rm×n es una matriz constante y r es el valor de referencia, asumido por ahora constante. El
sistema en lazo cerrado es entonces:
ẋ = Ax + B(−Kx + kr r), x(0) = xo
ẋ = (A − BK)x + Bkr r, x(0) = xo
Los polos del sistema en lazo cerrado son las raices de la ecuación caracterı́stica:
det(sIn − A + BK) = 0.
La ley de control por realimentación de estados consiste en seleccionar ganancias:
kij , i = 1, 2, ..., m, j = 1, 2, .., n,
tal que las raices de la ecuación caracterı́stica del sistema en lazo cerrado:
det(sIn − A + BK) = 0,
esten en las ubicaciones deseadas en el plano complejo. Si asumimos que el diseñador ha hecho una selección de
los polos deseados del sistema en lazo cerrado, y ellos son: p1 , p2 , ..., pn . Los polos (del sistema en lazo cerrado)
deseados pueden ser reales o complejos. Si son complejos, ellos deben estar en pares complejos conjugados.
Esto es debido al uso de ganancias reales kij . Una vez que definimos los polos deseados, podemos formar el
polinomio caracterı́stico en lazo cerrado deseado,
αc (s) = (s − p1 )(s − p2 )...(s − pn )
αc (s) = sn + αn−1 sn−1 + ... + α1 s + αo .
Nuestro objetivo es seleccionar una matriz de realimentación K tal que:
det(sIn − A + BK) = sn + αn−1 sn−1 + ... + α1 s + αo .
El problema arriba presentado es también llamado problema de ubicación de polos o problema de asignación
de autovalores. Primero discutiremos el problema de ubicación de polos para una planta con una entrada.

1.2.1. Ubicación de polos para sistemas de una entrada

En este caso, K = k ∈ R1×n . La solución de este problema se obtiene fácilmente si el sistema ẋ(t) =
Ax(t) + bu(t) ya está en la forma canónica controlable. En tal caso tenemos:
 
0 1 0 ... 0 0
 0 0 1 ... 0 0 
. ..
 
A − bk = 
 .. . .

 
 0 0 0 ... 0 1 
−ao − k1 −a1 − k2 −a2 − k3 ... −an−2 − kn−1 −an−1 − kn
Entonces, las ganancias deseadas son:
k1 = αo − ao ,
k2 = α1 − a1 ,
.. .
.
kn = αn−1 − an−1

Clase 05-03, pág. 2


CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

Si el sistema ẋ(t) = Ax(t)+bu(t) no está en la forma canónica controlable, primero transformamos el sistema
en la forma canónica y luego calculamos el vector de ganancias k̃ tal que:
det(sIn − Ã + b̃k̃) = sn + αn−1 sn−1 + ... + α1 s + αo .
Entonces,  
k̃ = αo − ao α1 − a1 ... αn−1 − an−1 .
Luego:
k = k̃T,
donde T es la transformación que lleva al sistema ẋ(t) = Ax(t) + bu(t) a la forma canónica controlable.

Podemos representar la fórmula de arriba para la matriz de ganancias en una forma alternativa. Para
esto, nótese que:  
q1
 q1 A 

 
k̃T = αo − ao α1 − a1 ... αn−1 − an−1  .. .
 . 
q1 An−1
k̃T = q1 (αo In + α1 A + ... + αn−1 An−1 ) − q1 (ao In + a1 A + ... + an−1 An−1 ).
Por el teorema de Cayley-Hamilton, tenemos:
An = −(ao In + a1 A + ... + an−1 An−1 ).
Entonces:
k = q1 αc (A).
La expresión para el vector fila de ganancias fue propuesto por Ackerman en 1972 y ahora se conoce como
Fórmula de Ackerman para ubicación de polos.

1.2.2. Ejemplo, sistema de una entrada

Para el sistema dinámico lineal:


   
1 −1 2
ẋ = x+ u,
1 −2 1
usaremos la fórmula de Ackerman para diseñar el controlador por realimentación de estados, u = −Kx, tal
que los polos en lazo cerrado esten localizados en {−1, −2}.

Para usar la fórmula de Ackerman, primero formamos la matriz de controlabilidad del sistema ẋ(t) =
Ax(t) + bu(t) y luego encontramos la última fila de su inversa, denotada por q1 . La matriz de controlabilidad
es:  
  2 1
b Ab = .
1 0
La inversa de la matriz arriba es:  
0 1
.
1 −2
 
Entonces, q1 = 1 −2 . El polinomio caracterı́stico del sistema en lazo cerrado deseado es:

αc (s) = (s + 1)(s + 2) = s2 + 3s + 2.
Luego,
k = q1 αc (A)
2
= q1 (A
 + 3A + 2I2 )     
1 −1 1 −1 1 −1 1 0
= q1 +3 +2
 1 −2  1 −2   1 −2  0 1
0 1 3 −3 2 0
= q1 + +
−1 3 3 −6 0 2
  5 −2
= 1 −2
  2 −1
= 1 0

Clase 05-03, pág. 3


CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

1.2.3. Ubicación de polos para sistemas de múltiples entrada

Si el sistema ẋ(t) = Ax(t) + Bu(t) ya se encuentra en la forma canónica controlable, procedemos como
a continuación. Primero representamos la matriz B como:
0 0 ... 0 0 0 0 ... 0 0
   
 0 0 ... 0 0   0 0 ... 0 0 
 .. ..   .. .. 
   
 . .   . . 
   
 1 x x x x   1 0 0 0 0 
   
 0 0 ... 0 0   0 0 ... 0 0   1 x x x x 
   
 0 0 ... 0 0   0 0 ... 0 0   0 1 x x x 
 .. ..   .. ..  
   
 .. ..  = B̂Γ

B= . . = . .  ..
  
 .
 . . 
 0 1 x x x   0 1 0 0 0  
    0 0 ... 1 x 

 . ..   . .. 
 .. .   . 0 0 0 0 1
   . .  
 0 0 ... 0 0   0 0 ... 0 0 
   
 0 0 ... 0 0   0 0 ... 0 0 
   
 . ..   . .. 
 .. .   .
. . 
0 0 0 0 1 0 0 0 0 1
donde la matriz Γ es no singular y cuadrada que consiste de filas de B diferentes de cero. Luego, sea:
K̂ = ΓK.

Nótese que:  
0 0 ... 0 0
 0 0 ... 0 0 
.. ..
 
 

 . . 

 k̂ k̂12 ... k̂1n−1 k̂1n 
 11 
 0 0 ... 0 0 
 
 0 0 ... 0 0 
 
 . ..
B̂ K̂ =  ..

 . ;

 k̂21 k̂22 ... k̂2n−1 k̂2n
 

 . .. 
 .
 . .


 
 0 0 ... 0 0 
 
 0 0 ... 0 0 
 .. ..
 

 . . 
k̂m1 k̂m2 ... k̂mn−1 k̂mn
esto es, las filas no ceros en el producto B̂ K̂ coinciden con las filas no ceros de la matriz A en su forma
canónica controlable. Si seleccionamos, por ejemplo, las ganancias kij , i = 1, 2, ..., m y j = 1, 2, ..., n, tal que:
 
0 1 0 ... 0 0
 0 0 1 ... 0 0 
 .. ..  ;
 
A − BK = A − B̂ K̂ =  . . 
 
 0 0 0 ... 0 1 
−αo −α1 α2 ... αn−2 αn−1
donde:
K = Γ−1 K̂.
Si el sistema ẋ(t) = Ax(t) + Bu(t) no está en la forma canónica controlable, primero lo llevaremos a esa
forma y luego calcularemos la matriz de ganancias que ubica los polos del sistema en lazo cerrado en las
posiciones deseada para el sistema ẋ(t) = Ax(t) + Bu(t) en la forma canónica controlable. la matriz de
ganancias que ubica los polos del sistema en lazo cerrado en las posiciones pre-especificadas para el sistema
ẋ(t) = Ax(t) + Bu(t) en sus coordinadas originales es entonces dado por:
K = Γ−1 K̂T.

Clase 05-03, pág. 4


CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

donde T es la matriz de transformación que lleva al sistema ẋ(t) = Ax(t) + Bu(t) a la forma canónica
controlable.

1.2.4. Ejemplo, múltiples entradas

Para el sistema dinámico lineal:


   
0 0 1 0 1 0
 1 0 2 0   0 0 
ẋ = 
 0
x +   u,
1 3 0   0 0 
0 0 −21 5 0 1

usaremos su forma canónica controlable para encontrar la matriz K ∈ R2×4 tal que los polos en lazo cerrado
esten ubicados en:
−2, −3 + −3 + i, −3 − i, −4.
Primero transformamos ẋ(t) = Ax(t) + Bu(t) a la forma canónica controlable. Para eso, formamos la matriz
de controlabilidad:
 
1 0 0 0 0 ...
0 0 1 0 0 ... 
b1 b2 Ab1 Ab2 A2 b1 ... = 
  
.
 0 0 0 0 1 ... 
0 1 0 5 0 ...

Entonces seleccionamos, procediendo de izquierda a derecha, las primeras cuatro columnas linealmente in-
dependientes de la matriz de controlabilidad. Obtenemos:

b1 b2 Ab1 A2 b1 .
 

Entonces, los ı́ndices de controlabilidad son d1 = 3 y d2 = 1. Rearreglamos las columnas y formamos la


matriz L de la forma:
L = b1 Ab1 A2 b1 b2 = I4 = L−1 .
 

Las últimas filas que necesitamos para la construcción de la matriz de transformación son:
   
q1 = 0 0 1 0 and q2 = 0 0 0 1 .

La matriz de transformación es:


 
0 0 1 0
  0 1 3 0 
q1 A q1 A2

T = q1 q2 = 
 1
.
3 11 0 
0 0 0 1

Y el sistema ẋ(t) = Ax(t) + Bu(t) en el nuevo sistema coordenado tiene la forma:


   
0 1 0 0 0 0
 0 0 1 0   0 0 
à = T AT −1 = 
 1
 and B̃ = T B =  .
2 3 0   1 0 
−21 0 0 5 0 1

El polinomio caracterı́stico del sistema en lazo cerrado es:

αc (s) = (s + 2)(s + 3 − i)(s + 3 + i)(s + 4) = s4 + 12s3 + 54s2 + 108s + 80.

Una posible elección de la matriz de ganancias K̃, dentro de tantas, que funciona para el caso es K̃ tal que:
 
0 1 0 0
 0 0 1 0 
à − B̃ K̃ = 
 0
.
0 0 1 
−80 −108 −54 −12

Clase 05-03, pág. 5


CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

Nótese que Γ = I2 . Entonces:  


1 2 3 −1
K̃ = ,
59 108 54 17
y luego:  
3 11 40 −1
K = K̃T = .
54 270 977 17

El algoritmo aqui presentado para ubicación de polos para sistemas de múltiples entradas presenta más
un valor teórico antes que práctico. EL algoritmo presenta problemas de implementación numérica porque la
transformación del sistema ẋ(t) = Ax(t)+Bu(t) a la forma canónica controlable sufre de propiedades numéri-
cas pobres. Existen otros algoritmos más robustos, como los implementados en MATLAB, especificamente
en la función place.

La solución del problema de ubicación de polos para un sistema de múltiples entradas no es única.
Entonces, los grados de libertad restantes pueden ser usados para alcanzar objetivos secundarios. En la
semanas siguientes discutiremos un método para construir una ley de control lineal por realimentación de
estados que ubica los polos del sistema en lazo cerrado en posiciones pre-especificadas y al mismo tiempo
minimiza un ı́ndice de desempeño cuadrático.

Como resultado de la discusión en esta parte, enunciaremos un teorema fundamental de sistemas lineales:

Teorema El problema de ubicación de polos tiene solución para todas las elecciones de los n polos en
lazo cerrado, simétricos con respecto al eje real, si y sólo si el sistema ẋ(t) = Ax(t) + Bu(t) es controlable. ⋄

1.3. Control para la solución en estado estacionario

Nótese que kr no afecta la estabilidad del sistema (que es determinado por los autovalores de A − BK)
pero si afecta la solución en estado estacionario. En particular, el punto de equilibrio y la salida del sistema
en lazo cerrado estan dados por:
ẋe = 0 = (A − BK)xe + Bkr r,
xe = −(A − BK)−1 Bkr r,
ze = Cxe + Due
entonces kr debe ser elegido tal que ze = r (el valor deseado de la salida). Asumiendo que D = 0 (el caso
más común), entonces:
ze = r = −C(A − BK)−1 Bkr r,
luego para cuando kr sea un escalar (sistema de una entrada y una salida) tenemos:

kr = −1/(C(A − BK)−1 B).

Nótese que kr es exactamente la inversa de la ganancia en la frecuencia cero del sistema en lazo cerrado.

1.4. Diseño del control por realimentación de estados

La ubicación de los autovalores determina el comportamiento de la dinámica en lazo cerrado, y como


consecuencia, la decisión más importante es donde ubicaremos los autovalores. Como en todos los casos
de diseño de sistemas de control, existe una concesión mutua entre la magnitud de la entrada de control,
la robustez del sistema a las perturbaciones y el desempeño del sistema en lazo cerrado. En esta sección
revisaremos brevemente estas concesiones mutuas con el caso especial de sistemas de segunda orden.

1.4.1. Sistema de segunda orden

El sistema de segunda orden es una clase de sistema que ocurre frecuentemente en el análisis y diseño de
sistemas de relimentación.

Clase 05-03, pág. 6


CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

Un sistema de segunda orden se puede escribir como:

q̈ + 2ζωo q̇ + ωo2 q = kωo2 u, y = q.

En la forma de espacio de estados, el sistema se escribe como:


   
dx 0 ωo 0  
= x+ u, y= 1 0 x.
dt −ωo −2ζωo kωo
Los autovalores del sistema están dados por:
p
λ = −ζωo ± ωo2 (ζ 2 − 1),

y observamos que el origen es un punto de equilibrio estable si ωo > 0 y ζ > 0. Nótese que los autovalores
son complejos si ζ < 1 y reales en caso contrario.

La forma de la solución depende del valor de ζ, el cual se denomina factor de amortiguamiento del sistema.
Si ζ > 1, decimos que el sistema es sobreamortiguado, y la respuesta natural (u = 0) del sistema está dado
por:
βx1o + x2o −αt αx1o + x2o −βt
y(t) = e − e ,
β−α β−α
p p
donde α = ωo (ζ + ζ 2 − 1) y β = ωo (ζ − ζ 2 − 1). Vemos que la respuesta consiste en la suma de dos
señales que decaen exponencialmente. Si ζ = 1, entonces el sistema es criticamente amortiguado y la solución
resulta:
y(t) = e−ζωo t (x1o + (x2o + ζωo x1o )t).
Nótese que la respuesta es aún asintóticamente estable mientras que ωo > 0, a pesar que el segundo término
en la solución este creciendo con el tiempo (pero más lento que el término exponencial decayente que lo
multiplica).

Finalmente, si 0 < ζ < 1, entonces la solución es oscilatoria y se dice que el sistema es subamortiguado.
El parámetro ωo es conocido como la frecuencia natural del sistema. La respuesta natural del sistema esta
dado por:  
ζωo 1
y(t) = e−ζωo t (x1o cos ωd t + x1o + x2o sin ωd t),
ωd ωd
p
donde ωd = ωo 1 − ζ 2 es llamada la frecuencia amortiguada.

Debido a la forma simple de un sistema de segunda orden, es posible resolver el sistema en forma analı́tica
para una entrada del tipo escalón. Para este caso, la solución depende de ζ:
!
−ζωo t ζ −ζωo t
y(t) = k 1 − e cos ωd t + p e sin ωd t , ζ < 1
1 − ζ2

y(t) = k 1 − e−ζωo t (1 + ωo t) , ζ = 1


√ √
!
1 ζ −ζωo t(ζ− ζ 2 −1) 1 ζ −ζωo t(ζ+ ζ 2 −1)
y(t) = k 1 − ( p + 1)e + (p − 1)e , ζ > 1,
2 1 − ζ2 2 1 − ζ2
donde hemos tomado x(0) = 0.

La Fig. 2 muestra respuestas de un sistema de 2da orden a una entrada del tipo escalón con k = 1 y
para diferentes valores de ζ. La forma de la respuesta es determinado por ζ, y la velocidad de la respuesta
es determinada por ωo : la respuesta es más rápida si ωo es grande.

Adicionalmente también podemos calcular las propiedades de la respuesta al escalón. Por ejemplo, para
un sistema subamortiguado:
!
ζ −ζωo t
y(t) = k 1 − p e sin(ωd t + ϕ) ,
1 − ζ2

donde ϕ = arccosζ. El sobreimpulso máximo ocurrirá por primera vez cuando la derivada de y sea cero, que
se puede mostrar que es: √ 2
Mp = eπζ/ 1−ζ .

Clase 05-03, pág. 7


CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

Im 2
ζ = 0.4 ζ =0
ζ = 0.7 1.5
ζ =1 Re
y
1

ζ = 1.2 ζ
0.5

0
0 5 10 15
Normalized time ω0 t
(a) Eigenvalues (b) Step responses

Figure 6.8: Step response for a second-order system. Normalized step responses h for the

Figura 2: Respuestas de un sistema de 2da orden a una entrada del tipo escalón unitario


Property Value ζ = 0.5 ζ = 1/ 2 ζ =1
Steady-state value k k k k
ϕ/ tan ϕ
Rise time Tr = 1/ω0 · e 1.8/ω0 2.2/ω0 2.7/ω0

2
Overshoot M p = e−π ζ / 1−ζ 16% 4% 0%
Settling time (2%) Ts ≈ 4/ζ ω0 8.0/ω0 5.9/ω0 5.8/ω0

Figura 3: Propiedades de la respuesta al escalón para un sistema de 2do orden con 0 < ζ < 1.

De la misma forma se pueden calcular otras caracterı́sticas de la respuesta al escalón, Cuadro 3.

La respuesta en la frecuencia también puede ser calculada explı́citamente y está dada por:

kωo2 kωo2
M eiθ = =
(iω)2 + 2ζωo (iω) + ωo2 ωo2 + 2iζωo ω + −ω 2

Una ilustración gráfica de la respuesta en frecuencia está dada en la Fig. 4. Nótese que el pico de la resonancia
aumenta a medida que crece ζ.

ζ = 0.08 2
Im ζ ≈ 0 10
ζ = 0.2
Gain

ζ = 0.5 0
ζ
10
−2
ζ =1 10
Re
0
Phase [deg]

ζ
−90

−180 −1 0 1
10 10 10
Normalized frequency ω/ω0
(a) Eigenvalues (b) Frequency responses

Figura 4: Respuesta en frecuencia de un sistema de 2do orden.

1.4.2. Sistema de orden alto

Para sistemas de orden alto, la ubicación de polos es considerablemente más dificil, especialmente cuando
tratamos de considerar las múltiples concesiones mutuas presentes en el diseño de control por realimentación.

Una de las razones por las que los sistemas de segundo orden son tan importantes en los sistemas
de realimentación es que aún para sistemas complicados la respuesta es a menudo caracterizada por los

Clase 05-03, pág. 8


CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

autovalores dominantes. Para definir los autovalores dominantes, consideremos el sistema con autovalores λj
j = 1, ..., n. Definimos el factor de amortiguamiento para el autovalor complejo como:
−Reλ
ζ= .
kλk
Decimos que el par de autovalores complejos conjugados λ, λ∗ es un par dominante si tiene el menor factor
de amortiguamiento comparado con los otros autovalores del sistema. Por consiguiente, se puede decir que el
par dominante de autovalores será el factor principal en la respuesta del sistema después que los transientes
debido a otros términos (autovalores) hayan desaparecido. A pesar de que esto último no siempre se cumple,
a menudo el caso de los autovalores dominantes determinana la respuesta (al escalón) del sistema.

El único requerimiento formal en la asignación de autovalores es que el sistema sea controlable. En la


práctia existen otras restricciones porque la selección de autovalores tiene un gran efecto en la magnitud
y la variación del cambio de la señal de control. Autovalores grandes requerirán por lo general grandes
señales de actuación ası́ como también rápidos cambios de estas señales. La capacidad de los actuadores
impondrá restricciones en la posible ubicación de los autovalores del sistema en lazo cerrado.

A continuación, usaremos las ganancias K y kr para diseñar la dinámica del sistema en lazo cerrado
y satisfacer nuestro objetivo. Los ejemplos a seguir pretender ilustrar y proveer mayor intuición en como
construir tal ley de control por realimentación de estados.

1.5. Ejemplo, sistema de balance

Considerando el sistema de la Fig. 5, recordemos que este sistema es un modelo para una clase de sistemas
en los que el centro de masa es balanceado sobre un punto pivote.

1.5.1. MODELO DEL SISTEMA - puede ser NO LINEAL

Las ecuaciones (no lineales) de movimiento del sistema estan dados por:

cṗ + ml sin θθ̇2


      
(M + m) −ml cos θ p̈ F
+ = .
−ml cos θ (J + ml2 ) θ̈ γ θ̇ − mgl sin θ 0

Por simplicidad tomamos c = γ = 0.

1.5.2. PUNTO DE EQUILIBRIO PARA LINEALIZACIÓN - LINEALIZACIÓN

Linealizando en torno al punto de equilibrio xe = (p, 0, 0, 0), la matriz dinámica y la matriz de control
son:    
0 0 1 0 0
 0 0 0 1   0 
A=  0 m2 l2 g/µ
, B =  ,
0 0   Jt /µ 
0 Mt mgl/µ 0 0 lm/µ
donde µ = Mt Jt − m2 l2 , Mt = M + m y Jt = J + ml2 .

1.5.3. ANÁLISIS DE SISTEMA

CONTROLABILIDAD

La matriz de controlabilidad es:


gl3 m3 /µ2
 
0 Jt /µ 0
0 lm/µ 0 gl2 m2 (M + m)/µ2 
A2 B A3 B = 
  
Wc = B AB .
 Jt /µ 0 gl3 m3 g/µ2 0 
lm/µ 0 g l m (M + m)/µ2
2 2 2
0

Clase 05-03, pág. 9


CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

El determinante de la matriz es:


g 2 l 4 m4
det(Wc ) = 6= 0,
µ4
y concluimos que el sistema es controlable. Esto significa que podemos mover el sistema desde una condición
inicial hasta un estado fina y, en particular, que siempre podemos encontrar una entrada que lleve el sistema
desde una condición inicial hasta el punto de equilibrio.

m
θ

F
M

p
(a) Segway (b) Cart-pendulum system

Figura 5: Sistema de balance.

POLOS EN LAZO ABIERTO

Usando los siguiente parámetos para el sistema (correspondiente, a groso modo, a un humano siendo
balanceado por un carro de estabilización): M = 10 kg, m = 80kg, c = 0,1N/m/s, γ = 0,01N/rad/sec,
l = 1m y J = 100kgm2 , g = 9,8m/m2 .

Los autovalores de la dinámica del sistema en lazo cerrado están dados por λ = 0, 4,7, −1,9 ± 2,7i

1.5.4. DISEÑO DEL CONTROL

POLOS EN LAZO CERRADO Para decidir donde ubicar los autovalores del sistema en lazo cerrado,
primero notamos que, a groso modo, la dinámica del sistema en lazo cerrado tendrá dos componentes: la
dinámica rápida que estabiliza el péndulo en la posición invertida y la dinámica lenta que controla la posición
del carrito. Parapla dinámica rápida, la dinámica natural del péndulo (cuando cuelga hacia abajo) esta
dada por ωo = mgl/(J + ml2 ) ∼ 2,1rad/s. Para proveer una respuesta rápida escogemos un factor de
amortiguamiento de ζ = 0,5, luego tratamos depubicar el primer par de autovalores en λ1,2 ∼ −ζωo ± ωo ∼
−1 ± 2i, donde hemos usado la aproximación ζ 2 − 1 ∼ 1. Para la dinámica lenta, escogemos una factor
de amortiguamiento igual a 0.5 para obtener un tiempo de subida de aproximadamente 5s. Esto resulta en
autovalores λ3,4 = −0,35 ± 0,35i.

Luego el polinomio caracterı́stico del sistema en lazo cerrado serı́a:

αc (s) = (s + 1 − i)(s + 1 + i)(s + 0,35 − 0,35i)(s + 0,35 + 0,35i)

ESTABILIZACIÓN POR REALIMENTACIÓN DE ESTADOS

Cálculando la inversa de la matriz de controlabilidad para encontrar q1 .

Usando la fórmula de Ackerman:


K = q1 αc (A),
obtenemos:  
K= −18,8 4500 597 −876 .
Esta matriz de ganancias K también se puede obtener usando la función place en MATLAB.

Clase 05-03, pág. 10


CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES

CONTROLADOR POR ALIMENTACIÓN ANTICIPADA

La ganancia por alimentación anticipada kr es:

kr = −1/(C(A − BK)−1 B) = −15,5

1.5.5. SIMULACIONES

La respuesta a una entrada escalón para el controlador aplicado en el sistema linealizado está dado en
la Fig. 6 (parte izquierda). Observamos que la fuerza de entrada es excesivamente grande, casi tres veces la
fuerza de gravedad en su pico.

Para proveer una fuerza más realista rediseñamos el controlador para que presenta una dinámica contro-
lada un poco más lenta. Para la dinámica del péndulo variamos la frecuencia natural por un factor de tres
y mantenemos el factor de amortiguamiento. La dinámica del carrito también la desaceleramos, el factor de
amortiguamiento permanece en 0.7 pero la frecuencia natural cambia a 1 (correspondiente a un tiempo de
subida de 10s). Luego, los polos deseados resultan:

λ = {−0,33 ± 0,66i, −0,18 ± 0,18i}.

El desempeño del controlador es mostrado en la Fig. 6.

2 2
Position p [m]
Position p [m]

1 1

0 0
0 5 10 15 0 10 20 30 40

30 30
Input force F [N]
Input force F [N]

20 20
10 10
0 0
−10 −10
0 5 10 15 0 10 20 30 40
Time t [s] Time t [s]
(a) λ1,2 = −1 ± 2i (b) λ1,2 = −0.33 ± 0.66i

Figura 6: Control por realimentación de estados para un sistema de balance.

Fuente: Capı́tulo 3 del libro Systems and Control de Stanislaw H. Zak (2002).

Fuente: Capı́tulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J.
Åström y Richard M. Murray.

Clase 05-03, pág. 11

También podría gustarte