Clase05 03

Universidad Nacional de Ingenierı́a - Facultad de Ingenierı́a Mecánica
Departamento Académico de Ingenierı́a Aplicada

CONTROL MODERNO Y ÓPTIMO (MT 227C)
Clase 05-03 Elizabeth Villota Cerna
Semestre 2009 I - UNI 15/05/2009
En lo que sigue discutiremos métodos para el diseño de controladores por realimentación para el caso
de sistemas lineales. El proceso de diseño involucra tres pasos. En el primer paso asumimos que todos los
estados están disponibles y procedemos con el diseño de leyes de control por realimentación de estados.
Luego procedemos con el segundo paso; que corresponde al diseño del estimador, también denominado como
el observador del vector de estados. El último paso consiste en combinar los dos pasos anteriores tal que la
ley de control, diseñada en el primer paso, usa el estimador de estados en vez de el vector de estados real. El
resultado de este paso es un compensador combinado controlador-estimador. A continuación discutiremos el
controlador por realimentación de estados.
1. Control por realimentación de estados

El estado de un sistema dinámico es una colección de variables que permiten la predicción del desarrollo
de un sistema a futuro. A continuación exploraremos la idea de diseñar la dinámica de un sistema a través
de realimentación de estados. La ley de control por realimentación será desarrollada paso a paso usando una
única idea: la ubicación de los autovalores del sistema en lazo cerrado en posiciones deseadas.
1.1. Estructura del controlador
La Fig. 1 muestra un diagrama de un sistema de control por realimentación de estados tı́pico. El sistema
completo consiste del proceso dinámico (planta), que es considerado lineal, los elementos del controlador K
y kr , la entrada de referencia (o señal de comando) r y procesos de disturbio d. El objetivo del controlador
por realimentación es regular la salida del sistema z tal que rastree la señal de referencia aún en la presencia
de disturbios y también incerteza en el proceso.
d
Controller Process
u ẋ = Ax + Bu
r kr 6 6 y
y = C x + Du
−K
x
Figure 6.5: A feedback control system with state feedback. The controller uses the system
Figura 1: Sistema de control por realimentación de estados. El controlador usa el estado del sistema x y la
entrada de referencia r para comandar el proceso (planta) a través de su entrada u. El disturbio es modelado
a través de una entrada aditiva d.
Un elemento importante del diseño de control es la especificación de desempeño. La especificación más

simple de desempeño es la de estabilidad: en la ausencia de disturbios, nuestro objetivo es hacer que el
punto de equilibrio del sistema sea asintóticamente estable. A menudo, especificaciones de desempeño más
sofisticadas dotan de propiedades deseadas a una respuesta al escalón o a la respuesta en frecuencia del
sistema, tales como tiempo de levantamiento, sobreimpulso y tiempo de establecimiento de la respuesta al
escalón. Adicionalmente, una preocupación frecuente es que el sistema posea propiedades de atenuación de
disturbios. Considerando un sistema descrito por la ecuación diferencial lineal:
ẋ(t) = Ax(t) + Bu(t), x(0) = xo

z(t) = Cx(t) + Du(t), ,
y(t) = In x(t)
donde hemos ignorado el disturbio d por ahora. Nuestro objetivo es llevar la salida z a una referencia deseada
r y mantenerla alli.
CONTROL POR REALIMENTACIÓN DE ESTADOS/DISEÑO DE CONTROLADORES
1.2. Estabilización por realimentación de estados
Asumiendo que todos los componentes del vector de estados pueden ser medidos. Dado que el estado en
el tiempo t contiene toda la información necesaria para predecir el comportamiento futuro del sistema, la
ley de control invariante en el tiempo más general es una función del estado y de la entrada de referencia:
u = α(x, r).
Si la ley de control por realimentación de estados es asumida lineal, entonces la realimentación se puede
escribir como una combinación lineal de todas las variables de estado, incluyendo la referencia:
u = −Kx + kr r,
donde K ∈ Rm×n es una matriz constante y r es el valor de referencia, asumido por ahora constante. El
sistema en lazo cerrado es entonces:
ẋ = Ax + B(−Kx + kr r), x(0) = xo
ẋ = (A − BK)x + Bkr r, x(0) = xo
Los polos del sistema en lazo cerrado son las raices de la ecuación caracterı́stica:
det(sIn − A + BK) = 0.
La ley de control por realimentación de estados consiste en seleccionar ganancias:
kij , i = 1, 2, ..., m, j = 1, 2, .., n,
tal que las raices de la ecuación caracterı́stica del sistema en lazo cerrado:
det(sIn − A + BK) = 0,
esten en las ubicaciones deseadas en el plano complejo. Si asumimos que el diseñador ha hecho una selección de
los polos deseados del sistema en lazo cerrado, y ellos son: p1 , p2 , ..., pn . Los polos (del sistema en lazo cerrado)
deseados pueden ser reales o complejos. Si son complejos, ellos deben estar en pares complejos conjugados.
Esto es debido al uso de ganancias reales kij . Una vez que definimos los polos deseados, podemos formar el
polinomio caracterı́stico en lazo cerrado deseado,
αc (s) = (s − p1 )(s − p2 )...(s − pn )
αc (s) = sn + αn−1 sn−1 + ... + α1 s + αo .
Nuestro objetivo es seleccionar una matriz de realimentación K tal que:
det(sIn − A + BK) = sn + αn−1 sn−1 + ... + α1 s + αo .
El problema arriba presentado es también llamado problema de ubicación de polos o problema de asignación
de autovalores. Primero discutiremos el problema de ubicación de polos para una planta con una entrada.
1.2.1. Ubicación de polos para sistemas de una entrada
En este caso, K = k ∈ R1×n . La solución de este problema se obtiene fácilmente si el sistema ẋ(t) =
Ax(t) + bu(t) ya está en la forma canónica controlable. En tal caso tenemos:
 
0 1 0 ... 0 0
 0 0 1 ... 0 0 
. ..
 
A − bk = 
 .. . .

 
 0 0 0 ... 0 1 
−ao − k1 −a1 − k2 −a2 − k3 ... −an−2 − kn−1 −an−1 − kn
Entonces, las ganancias deseadas son:
k1 = αo − ao ,
k2 = α1 − a1 ,
.. .
.
kn = αn−1 − an−1
Clase 05-03, pág. 2

Si el sistema ẋ(t) = Ax(t)+bu(t) no está en la forma canónica controlable, primero transformamos el sistema
en la forma canónica y luego calculamos el vector de ganancias k̃ tal que:
det(sIn − Ã + b̃k̃) = sn + αn−1 sn−1 + ... + α1 s + αo .
Entonces,
k̃ = αo − ao α1 − a1 ... αn−1 − an−1 .
Luego:
k = k̃T,
donde T es la transformación que lleva al sistema ẋ(t) = Ax(t) + bu(t) a la forma canónica controlable.
Podemos representar la fórmula de arriba para la matriz de ganancias en una forma alternativa. Para
esto, nótese que:  
q1
 q1 A 


k̃T = αo − ao α1 − a1 ... αn−1 − an−1  .. .
 . 
q1 An−1
k̃T = q1 (αo In + α1 A + ... + αn−1 An−1 ) − q1 (ao In + a1 A + ... + an−1 An−1 ).
Por el teorema de Cayley-Hamilton, tenemos:
An = −(ao In + a1 A + ... + an−1 An−1 ).
Entonces:
k = q1 αc (A).
La expresión para el vector fila de ganancias fue propuesto por Ackerman en 1972 y ahora se conoce como
Fórmula de Ackerman para ubicación de polos.
1.2.2. Ejemplo, sistema de una entrada
Para el sistema dinámico lineal:

1 −1 2
ẋ = x+ u,
1 −2 1
usaremos la fórmula de Ackerman para diseñar el controlador por realimentación de estados, u = −Kx, tal
que los polos en lazo cerrado esten localizados en {−1, −2}.
Para usar la fórmula de Ackerman, primero formamos la matriz de controlabilidad del sistema ẋ(t) =
Ax(t) + bu(t) y luego encontramos la última fila de su inversa, denotada por q1 . La matriz de controlabilidad
es:
2 1
b Ab = .
1 0
La inversa de la matriz arriba es:
0 1
.
1 −2

Entonces, q1 = 1 −2 . El polinomio caracterı́stico del sistema en lazo cerrado deseado es:
αc (s) = (s + 1)(s + 2) = s2 + 3s + 2.
Luego,
k = q1 αc (A)
2
= q1 (A
+ 3A + 2I2 )
1 −1 1 −1 1 −1 1 0
= q1 +3 +2
1 −2 1 −2 1 −2 0 1
0 1 3 −3 2 0
= q1 + +
−1 3 3 −6 0 2
5 −2
= 1 −2
2 −1
= 1 0

1.2.3. Ubicación de polos para sistemas de múltiples entrada
Si el sistema ẋ(t) = Ax(t) + Bu(t) ya se encuentra en la forma canónica controlable, procedemos como
a continuación. Primero representamos la matriz B como:
0 0 ... 0 0 0 0 ... 0 0
   
 0 0 ... 0 0   0 0 ... 0 0 
 .. ..   .. .. 
   
 . .   . . 
   
 1 x x x x   1 0 0 0 0 
   
 0 0 ... 0 0   0 0 ... 0 0   1 x x x x 
   
 0 0 ... 0 0   0 0 ... 0 0   0 1 x x x 
 .. ..   .. ..  
   
 .. ..  = B̂Γ

B= . . = . .  ..
  
 .
 . . 
 0 1 x x x   0 1 0 0 0  
    0 0 ... 1 x 

 . ..   . .. 
 .. .   . 0 0 0 0 1
   . .  
 0 0 ... 0 0   0 0 ... 0 0 
   
 0 0 ... 0 0   0 0 ... 0 0 
   
 . ..   . .. 
 .. .   .
. . 
0 0 0 0 1 0 0 0 0 1
donde la matriz Γ es no singular y cuadrada que consiste de filas de B diferentes de cero. Luego, sea:
K̂ = ΓK.
Nótese que:  
0 0 ... 0 0
 0 0 ... 0 0 
.. ..
 
 

 . . 

 k̂ k̂12 ... k̂1n−1 k̂1n 
 11 
 0 0 ... 0 0 
 
 0 0 ... 0 0 
 
 . ..
B̂ K̂ =  ..

 . ;

 k̂21 k̂22 ... k̂2n−1 k̂2n
 

 . .. 
 .
 . .


 
 0 0 ... 0 0 
 
 0 0 ... 0 0 
 .. ..
 

 . . 
k̂m1 k̂m2 ... k̂mn−1 k̂mn
esto es, las filas no ceros en el producto B̂ K̂ coinciden con las filas no ceros de la matriz A en su forma
canónica controlable. Si seleccionamos, por ejemplo, las ganancias kij , i = 1, 2, ..., m y j = 1, 2, ..., n, tal que:
 
0 1 0 ... 0 0
 0 0 1 ... 0 0 
 .. ..  ;
 
A − BK = A − B̂ K̂ =  . . 
 
 0 0 0 ... 0 1 
−αo −α1 α2 ... αn−2 αn−1
donde:
K = Γ−1 K̂.
Si el sistema ẋ(t) = Ax(t) + Bu(t) no está en la forma canónica controlable, primero lo llevaremos a esa
forma y luego calcularemos la matriz de ganancias que ubica los polos del sistema en lazo cerrado en las
posiciones deseada para el sistema ẋ(t) = Ax(t) + Bu(t) en la forma canónica controlable. la matriz de
ganancias que ubica los polos del sistema en lazo cerrado en las posiciones pre-especificadas para el sistema
ẋ(t) = Ax(t) + Bu(t) en sus coordinadas originales es entonces dado por:
K = Γ−1 K̂T.

donde T es la matriz de transformación que lleva al sistema ẋ(t) = Ax(t) + Bu(t) a la forma canónica
controlable.
1.2.4. Ejemplo, múltiples entradas
Para el sistema dinámico lineal:

   
0 0 1 0 1 0
 1 0 2 0   0 0 
ẋ = 
 0
x +   u,
1 3 0   0 0 
0 0 −21 5 0 1
usaremos su forma canónica controlable para encontrar la matriz K ∈ R2×4 tal que los polos en lazo cerrado
esten ubicados en:
−2, −3 + −3 + i, −3 − i, −4.
Primero transformamos ẋ(t) = Ax(t) + Bu(t) a la forma canónica controlable. Para eso, formamos la matriz
de controlabilidad:
 
1 0 0 0 0 ...
0 0 1 0 0 ... 
b1 b2 Ab1 Ab2 A2 b1 ... = 

.
 0 0 0 0 1 ... 
0 1 0 5 0 ...
Entonces seleccionamos, procediendo de izquierda a derecha, las primeras cuatro columnas linealmente in-
dependientes de la matriz de controlabilidad. Obtenemos:
b1 b2 Ab1 A2 b1 .

Entonces, los ı́ndices de controlabilidad son d1 = 3 y d2 = 1. Rearreglamos las columnas y formamos la

matriz L de la forma:
L = b1 Ab1 A2 b1 b2 = I4 = L−1 .

Las últimas filas que necesitamos para la construcción de la matriz de transformación son:

q1 = 0 0 1 0 and q2 = 0 0 0 1 .
La matriz de transformación es:

 
0 0 1 0
 0 1 3 0 
q1 A q1 A2

T = q1 q2 = 
 1
.
3 11 0 
0 0 0 1
Y el sistema ẋ(t) = Ax(t) + Bu(t) en el nuevo sistema coordenado tiene la forma:

   
0 1 0 0 0 0
 0 0 1 0   0 0 
Ã = T AT −1 = 
 1
 and B̃ = T B =  .
2 3 0   1 0 
−21 0 0 5 0 1
El polinomio caracterı́stico del sistema en lazo cerrado es:
αc (s) = (s + 2)(s + 3 − i)(s + 3 + i)(s + 4) = s4 + 12s3 + 54s2 + 108s + 80.
Una posible elección de la matriz de ganancias K̃, dentro de tantas, que funciona para el caso es K̃ tal que:
 
0 1 0 0
 0 0 1 0 
Ã − B̃ K̃ = 
 0
.
0 0 1 
−80 −108 −54 −12

Nótese que Γ = I2 . Entonces:

1 2 3 −1
K̃ = ,
59 108 54 17
y luego:
3 11 40 −1
K = K̃T = .
54 270 977 17
El algoritmo aqui presentado para ubicación de polos para sistemas de múltiples entradas presenta más
un valor teórico antes que práctico. EL algoritmo presenta problemas de implementación numérica porque la
transformación del sistema ẋ(t) = Ax(t)+Bu(t) a la forma canónica controlable sufre de propiedades numéri-
cas pobres. Existen otros algoritmos más robustos, como los implementados en MATLAB, especificamente
en la función place.
La solución del problema de ubicación de polos para un sistema de múltiples entradas no es única.
Entonces, los grados de libertad restantes pueden ser usados para alcanzar objetivos secundarios. En la
semanas siguientes discutiremos un método para construir una ley de control lineal por realimentación de
estados que ubica los polos del sistema en lazo cerrado en posiciones pre-especificadas y al mismo tiempo
minimiza un ı́ndice de desempeño cuadrático.
Como resultado de la discusión en esta parte, enunciaremos un teorema fundamental de sistemas lineales:
Teorema El problema de ubicación de polos tiene solución para todas las elecciones de los n polos en
lazo cerrado, simétricos con respecto al eje real, si y sólo si el sistema ẋ(t) = Ax(t) + Bu(t) es controlable. ⋄
1.3. Control para la solución en estado estacionario
Nótese que kr no afecta la estabilidad del sistema (que es determinado por los autovalores de A − BK)
pero si afecta la solución en estado estacionario. En particular, el punto de equilibrio y la salida del sistema
en lazo cerrado estan dados por:
ẋe = 0 = (A − BK)xe + Bkr r,
xe = −(A − BK)−1 Bkr r,
ze = Cxe + Due
entonces kr debe ser elegido tal que ze = r (el valor deseado de la salida). Asumiendo que D = 0 (el caso
más común), entonces:
ze = r = −C(A − BK)−1 Bkr r,
luego para cuando kr sea un escalar (sistema de una entrada y una salida) tenemos:
kr = −1/(C(A − BK)−1 B).
Nótese que kr es exactamente la inversa de la ganancia en la frecuencia cero del sistema en lazo cerrado.
1.4. Diseño del control por realimentación de estados
La ubicación de los autovalores determina el comportamiento de la dinámica en lazo cerrado, y como

consecuencia, la decisión más importante es donde ubicaremos los autovalores. Como en todos los casos
de diseño de sistemas de control, existe una concesión mutua entre la magnitud de la entrada de control,
la robustez del sistema a las perturbaciones y el desempeño del sistema en lazo cerrado. En esta sección
revisaremos brevemente estas concesiones mutuas con el caso especial de sistemas de segunda orden.
1.4.1. Sistema de segunda orden
El sistema de segunda orden es una clase de sistema que ocurre frecuentemente en el análisis y diseño de
sistemas de relimentación.

Un sistema de segunda orden se puede escribir como:
q̈ + 2ζωo q̇ + ωo2 q = kωo2 u, y = q.
En la forma de espacio de estados, el sistema se escribe como:

dx 0 ωo 0
= x+ u, y= 1 0 x.
dt −ωo −2ζωo kωo
Los autovalores del sistema están dados por:
p
λ = −ζωo ± ωo2 (ζ 2 − 1),
y observamos que el origen es un punto de equilibrio estable si ωo > 0 y ζ > 0. Nótese que los autovalores
son complejos si ζ < 1 y reales en caso contrario.
La forma de la solución depende del valor de ζ, el cual se denomina factor de amortiguamiento del sistema.
Si ζ > 1, decimos que el sistema es sobreamortiguado, y la respuesta natural (u = 0) del sistema está dado
por:
βx1o + x2o −αt αx1o + x2o −βt
y(t) = e − e ,
β−α β−α
p p
donde α = ωo (ζ + ζ 2 − 1) y β = ωo (ζ − ζ 2 − 1). Vemos que la respuesta consiste en la suma de dos
señales que decaen exponencialmente. Si ζ = 1, entonces el sistema es criticamente amortiguado y la solución
resulta:
y(t) = e−ζωo t (x1o + (x2o + ζωo x1o )t).
Nótese que la respuesta es aún asintóticamente estable mientras que ωo > 0, a pesar que el segundo término
en la solución este creciendo con el tiempo (pero más lento que el término exponencial decayente que lo
multiplica).
Finalmente, si 0 < ζ < 1, entonces la solución es oscilatoria y se dice que el sistema es subamortiguado.
El parámetro ωo es conocido como la frecuencia natural del sistema. La respuesta natural del sistema esta
dado por:
ζωo 1
y(t) = e−ζωo t (x1o cos ωd t + x1o + x2o sin ωd t),
ωd ωd
p
donde ωd = ωo 1 − ζ 2 es llamada la frecuencia amortiguada.
Debido a la forma simple de un sistema de segunda orden, es posible resolver el sistema en forma analı́tica
para una entrada del tipo escalón. Para este caso, la solución depende de ζ:
!
−ζωo t ζ −ζωo t
y(t) = k 1 − e cos ωd t + p e sin ωd t , ζ < 1
1 − ζ2
y(t) = k 1 − e−ζωo t (1 + ωo t) , ζ = 1

√ √
!
1 ζ −ζωo t(ζ− ζ 2 −1) 1 ζ −ζωo t(ζ+ ζ 2 −1)
y(t) = k 1 − ( p + 1)e + (p − 1)e , ζ > 1,
2 1 − ζ2 2 1 − ζ2
donde hemos tomado x(0) = 0.
La Fig. 2 muestra respuestas de un sistema de 2da orden a una entrada del tipo escalón con k = 1 y
para diferentes valores de ζ. La forma de la respuesta es determinado por ζ, y la velocidad de la respuesta
es determinada por ωo : la respuesta es más rápida si ωo es grande.
Adicionalmente también podemos calcular las propiedades de la respuesta al escalón. Por ejemplo, para
un sistema subamortiguado:
!
ζ −ζωo t
y(t) = k 1 − p e sin(ωd t + ϕ) ,
1 − ζ2
donde ϕ = arccosζ. El sobreimpulso máximo ocurrirá por primera vez cuando la derivada de y sea cero, que
se puede mostrar que es: √ 2
Mp = eπζ/ 1−ζ .

Im 2
ζ = 0.4 ζ =0
ζ = 0.7 1.5
ζ =1 Re
y
1
ζ = 1.2 ζ
0.5
0
0 5 10 15
Normalized time ω0 t
(a) Eigenvalues (b) Step responses
Figure 6.8: Step response for a second-order system. Normalized step responses h for the
Figura 2: Respuestas de un sistema de 2da orden a una entrada del tipo escalón unitario
√
Property Value ζ = 0.5 ζ = 1/ 2 ζ =1
Steady-state value k k k k
ϕ/ tan ϕ
Rise time Tr = 1/ω0 · e 1.8/ω0 2.2/ω0 2.7/ω0
√
2
Overshoot M p = e−π ζ / 1−ζ 16% 4% 0%
Settling time (2%) Ts ≈ 4/ζ ω0 8.0/ω0 5.9/ω0 5.8/ω0
Figura 3: Propiedades de la respuesta al escalón para un sistema de 2do orden con 0 < ζ < 1.
De la misma forma se pueden calcular otras caracterı́sticas de la respuesta al escalón, Cuadro 3.
La respuesta en la frecuencia también puede ser calculada explı́citamente y está dada por:
kωo2 kωo2
M eiθ = =
(iω)2 + 2ζωo (iω) + ωo2 ωo2 + 2iζωo ω + −ω 2
Una ilustración gráfica de la respuesta en frecuencia está dada en la Fig. 4. Nótese que el pico de la resonancia
aumenta a medida que crece ζ.
ζ = 0.08 2
Im ζ ≈ 0 10
ζ = 0.2
Gain
ζ = 0.5 0
ζ
10
−2
ζ =1 10
Re
0
Phase [deg]
ζ
−90
−180 −1 0 1
10 10 10
Normalized frequency ω/ω0
(a) Eigenvalues (b) Frequency responses
Figura 4: Respuesta en frecuencia de un sistema de 2do orden.
1.4.2. Sistema de orden alto
Para sistemas de orden alto, la ubicación de polos es considerablemente más dificil, especialmente cuando
tratamos de considerar las múltiples concesiones mutuas presentes en el diseño de control por realimentación.
Una de las razones por las que los sistemas de segundo orden son tan importantes en los sistemas
de realimentación es que aún para sistemas complicados la respuesta es a menudo caracterizada por los

autovalores dominantes. Para definir los autovalores dominantes, consideremos el sistema con autovalores λj
j = 1, ..., n. Definimos el factor de amortiguamiento para el autovalor complejo como:
−Reλ
ζ= .
kλk
Decimos que el par de autovalores complejos conjugados λ, λ∗ es un par dominante si tiene el menor factor
de amortiguamiento comparado con los otros autovalores del sistema. Por consiguiente, se puede decir que el
par dominante de autovalores será el factor principal en la respuesta del sistema después que los transientes
debido a otros términos (autovalores) hayan desaparecido. A pesar de que esto último no siempre se cumple,
a menudo el caso de los autovalores dominantes determinana la respuesta (al escalón) del sistema.
El único requerimiento formal en la asignación de autovalores es que el sistema sea controlable. En la

práctia existen otras restricciones porque la selección de autovalores tiene un gran efecto en la magnitud
y la variación del cambio de la señal de control. Autovalores grandes requerirán por lo general grandes
señales de actuación ası́ como también rápidos cambios de estas señales. La capacidad de los actuadores
impondrá restricciones en la posible ubicación de los autovalores del sistema en lazo cerrado.
A continuación, usaremos las ganancias K y kr para diseñar la dinámica del sistema en lazo cerrado
y satisfacer nuestro objetivo. Los ejemplos a seguir pretender ilustrar y proveer mayor intuición en como
construir tal ley de control por realimentación de estados.
1.5. Ejemplo, sistema de balance
Considerando el sistema de la Fig. 5, recordemos que este sistema es un modelo para una clase de sistemas
en los que el centro de masa es balanceado sobre un punto pivote.
1.5.1. MODELO DEL SISTEMA - puede ser NO LINEAL
Las ecuaciones (no lineales) de movimiento del sistema estan dados por:
cṗ + ml sin θθ̇2

(M + m) −ml cos θ p̈ F
+ = .
−ml cos θ (J + ml2 ) θ̈ γ θ̇ − mgl sin θ 0
Por simplicidad tomamos c = γ = 0.
1.5.2. PUNTO DE EQUILIBRIO PARA LINEALIZACIÓN - LINEALIZACIÓN
Linealizando en torno al punto de equilibrio xe = (p, 0, 0, 0), la matriz dinámica y la matriz de control
son:    
0 0 1 0 0
 0 0 0 1   0 
A=  0 m2 l2 g/µ
, B =  ,
0 0   Jt /µ 
0 Mt mgl/µ 0 0 lm/µ
donde µ = Mt Jt − m2 l2 , Mt = M + m y Jt = J + ml2 .
1.5.3. ANÁLISIS DE SISTEMA
CONTROLABILIDAD
La matriz de controlabilidad es:

gl3 m3 /µ2
 
0 Jt /µ 0
0 lm/µ 0 gl2 m2 (M + m)/µ2 
A2 B A3 B = 

Wc = B AB .
 Jt /µ 0 gl3 m3 g/µ2 0 
lm/µ 0 g l m (M + m)/µ2
2 2 2
0

El determinante de la matriz es:

g 2 l 4 m4
det(Wc ) = 6= 0,
µ4
y concluimos que el sistema es controlable. Esto significa que podemos mover el sistema desde una condición
inicial hasta un estado fina y, en particular, que siempre podemos encontrar una entrada que lleve el sistema
desde una condición inicial hasta el punto de equilibrio.
m
θ
F
M
p
(a) Segway (b) Cart-pendulum system
Figura 5: Sistema de balance.
POLOS EN LAZO ABIERTO
Usando los siguiente parámetos para el sistema (correspondiente, a groso modo, a un humano siendo
balanceado por un carro de estabilización): M = 10 kg, m = 80kg, c = 0,1N/m/s, γ = 0,01N/rad/sec,
l = 1m y J = 100kgm2 , g = 9,8m/m2 .
Los autovalores de la dinámica del sistema en lazo cerrado están dados por λ = 0, 4,7, −1,9 ± 2,7i
1.5.4. DISEÑO DEL CONTROL
POLOS EN LAZO CERRADO Para decidir donde ubicar los autovalores del sistema en lazo cerrado,
primero notamos que, a groso modo, la dinámica del sistema en lazo cerrado tendrá dos componentes: la
dinámica rápida que estabiliza el péndulo en la posición invertida y la dinámica lenta que controla la posición
del carrito. Parapla dinámica rápida, la dinámica natural del péndulo (cuando cuelga hacia abajo) esta
dada por ωo = mgl/(J + ml2 ) ∼ 2,1rad/s. Para proveer una respuesta rápida escogemos un factor de
amortiguamiento de ζ = 0,5, luego tratamos depubicar el primer par de autovalores en λ1,2 ∼ −ζωo ± ωo ∼
−1 ± 2i, donde hemos usado la aproximación ζ 2 − 1 ∼ 1. Para la dinámica lenta, escogemos una factor
de amortiguamiento igual a 0.5 para obtener un tiempo de subida de aproximadamente 5s. Esto resulta en
autovalores λ3,4 = −0,35 ± 0,35i.
Luego el polinomio caracterı́stico del sistema en lazo cerrado serı́a:
αc (s) = (s + 1 − i)(s + 1 + i)(s + 0,35 − 0,35i)(s + 0,35 + 0,35i)
ESTABILIZACIÓN POR REALIMENTACIÓN DE ESTADOS
Cálculando la inversa de la matriz de controlabilidad para encontrar q1 .
Usando la fórmula de Ackerman:

K = q1 αc (A),
obtenemos:
K= −18,8 4500 597 −876 .
Esta matriz de ganancias K también se puede obtener usando la función place en MATLAB.
Clase 05-03, pág. 10

CONTROLADOR POR ALIMENTACIÓN ANTICIPADA
La ganancia por alimentación anticipada kr es:
kr = −1/(C(A − BK)−1 B) = −15,5
1.5.5. SIMULACIONES
La respuesta a una entrada escalón para el controlador aplicado en el sistema linealizado está dado en
la Fig. 6 (parte izquierda). Observamos que la fuerza de entrada es excesivamente grande, casi tres veces la
fuerza de gravedad en su pico.
Para proveer una fuerza más realista rediseñamos el controlador para que presenta una dinámica contro-
lada un poco más lenta. Para la dinámica del péndulo variamos la frecuencia natural por un factor de tres
y mantenemos el factor de amortiguamiento. La dinámica del carrito también la desaceleramos, el factor de
amortiguamiento permanece en 0.7 pero la frecuencia natural cambia a 1 (correspondiente a un tiempo de
subida de 10s). Luego, los polos deseados resultan:
λ = {−0,33 ± 0,66i, −0,18 ± 0,18i}.
El desempeño del controlador es mostrado en la Fig. 6.
2 2
Position p [m]
Position p [m]
1 1
0 0
0 5 10 15 0 10 20 30 40
30 30
Input force F [N]
Input force F [N]
20 20
10 10
0 0
−10 −10
0 5 10 15 0 10 20 30 40
Time t [s] Time t [s]
(a) λ1,2 = −1 ± 2i (b) λ1,2 = −0.33 ± 0.66i
Figura 6: Control por realimentación de estados para un sistema de balance.
Fuente: Capı́tulo 3 del libro Systems and Control de Stanislaw H. Zak (2002).
Fuente: Capı́tulo 6 del libro Feedback Systems: An Introduction for Scientists and Engineers, de Karl J.
Åström y Richard M. Murray.
Clase 05-03, pág. 11

Clase05 03

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Clase05 03

Cargado por

Copyright:

Formatos disponibles

Universidad Nacional de Ingenierı́a - Facultad de Ingenierı́a Mecánica

Departamento Académico de Ingenierı́a Aplicada

1. Control por realimentación de estados

1.1. Estructura del controlador

Un elemento importante del diseño de control es la especificación de desempeño. La especificación más

ẋ(t) = Ax(t) + Bu(t), x(0) = xo

1.2. Estabilización por realimentación de estados

1.2.1. Ubicación de polos para sistemas de una entrada

Clase 05-03, pág. 2

1.2.2. Ejemplo, sistema de una entrada

Para el sistema dinámico lineal:

Clase 05-03, pág. 3

1.2.3. Ubicación de polos para sistemas de múltiples entrada

Clase 05-03, pág. 4

1.2.4. Ejemplo, múltiples entradas

Para el sistema dinámico lineal:

Entonces, los ı́ndices de controlabilidad son d1 = 3 y d2 = 1. Rearreglamos las columnas y formamos la

La matriz de transformación es:

Y el sistema ẋ(t) = Ax(t) + Bu(t) en el nuevo sistema coordenado tiene la forma:

El polinomio caracterı́stico del sistema en lazo cerrado es:

αc (s) = (s + 2)(s + 3 − i)(s + 3 + i)(s + 4) = s4 + 12s3 + 54s2 + 108s + 80.

Clase 05-03, pág. 5

Nótese que Γ = I2 . Entonces:  

1.3. Control para la solución en estado estacionario

kr = −1/(C(A − BK)−1 B).

1.4. Diseño del control por realimentación de estados

La ubicación de los autovalores determina el comportamiento de la dinámica en lazo cerrado, y como

1.4.1. Sistema de segunda orden

Clase 05-03, pág. 6

Un sistema de segunda orden se puede escribir como:

q̈ + 2ζωo q̇ + ωo2 q = kωo2 u, y = q.

En la forma de espacio de estados, el sistema se escribe como:

Clase 05-03, pág. 7

De la misma forma se pueden calcular otras caracterı́sticas de la respuesta al escalón, Cuadro 3.

Figura 4: Respuesta en frecuencia de un sistema de 2do orden.

1.4.2. Sistema de orden alto

Clase 05-03, pág. 8

El único requerimiento formal en la asignación de autovalores es que el sistema sea controlable. En la

1.5. Ejemplo, sistema de balance

1.5.1. MODELO DEL SISTEMA - puede ser NO LINEAL

cṗ + ml sin θθ̇2

Por simplicidad tomamos c = γ = 0.

1.5.2. PUNTO DE EQUILIBRIO PARA LINEALIZACIÓN - LINEALIZACIÓN

1.5.3. ANÁLISIS DE SISTEMA

La matriz de controlabilidad es:

Clase 05-03, pág. 9

El determinante de la matriz es:

Figura 5: Sistema de balance.

POLOS EN LAZO ABIERTO

1.5.4. DISEÑO DEL CONTROL

Luego el polinomio caracterı́stico del sistema en lazo cerrado serı́a:

αc (s) = (s + 1 − i)(s + 1 + i)(s + 0,35 − 0,35i)(s + 0,35 + 0,35i)

ESTABILIZACIÓN POR REALIMENTACIÓN DE ESTADOS

Cálculando la inversa de la matriz de controlabilidad para encontrar q1 .

Usando la fórmula de Ackerman:

Clase 05-03, pág. 10

CONTROLADOR POR ALIMENTACIÓN ANTICIPADA

La ganancia por alimentación anticipada kr es:

kr = −1/(C(A − BK)−1 B) = −15,5

λ = {−0,33 ± 0,66i, −0,18 ± 0,18i}.

El desempeño del controlador es mostrado en la Fig. 6.

Figura 6: Control por realimentación de estados para un sistema de balance.

Clase 05-03, pág. 11

Nótese que Γ = I2 . Entonces: