Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estabilizacindeunpnduloinvertidousando MPCy LQR
Estabilizacindeunpnduloinvertidousando MPCy LQR
net/publication/281035776
CITATIONS READS
0 3,314
1 author:
David Jaramillo
CORPORACION ELECTRICA DEL ECUADOR
2 PUBLICATIONS 0 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Waste-To-Energy Technologies: an opportunity of energy recovery from Municipal Solid Waste, using Quito - Ecuador as case study View project
ScienceDirect ScienceDirect Waste-To-Energy Technologies: an opportunity of energy recovery from Municipal Solid Waste, using Quito-Ecuador as case study View
project
All content following this page was uploaded by David Jaramillo on 17 August 2015.
Resumen: La estabilización del péndulo invertido es una de las más frecuentes demostraciones del uso de control
realimentado con la finalidad de estabilizar un sistema de lazo abierto inestable y no lineal. El presente trabajo aborda
este sistema de control no lineal aplicando las metodologías de control: PID (proporcional-integral-derivativo), MPC
(control predictivo basado en el modelo) y Control óptimo. La siguiente tarea nos llevó, en base a los resultados, a
realizar un análisis comparativo de la calidad de control obtenida luego de emplear cada metodología. El trabajo
concluye con una perspectiva de eficacia versus factibilidad de los sistemas de control aplicados a este sistema, que
mejorará la forma que tenemos actualmente de cómo abordar sistemas no lineales similares, escalando hacia
problemas reales. Considérese entonces a este trabajo como una útil guía académica, para los interesados en el campo
de la ingeniería de control, en el descubrimiento de las variables y comportamiento de sistemas no lineales inestables.
Palabras clave: Péndulo, MPC, Óptimo, PID, LQR, Matlab, Establecimiento, estados, función de transferencia.
Abstract: Inverted pendulum model is a popular show the use of feedback control in order to stabilize an unstable system and
nonlinear loop open. Therefore it has been widely used to study various control methods and model behavior. This paper addresses
this nonlinear control system using control methodologies: PID (proportional-integral-derivative), MPC (predictive control model)
and optimal control. The next task took, based on the results, a comparative analysis of the quality control then obtained using
each methodology. The paper concludes with a perspective of efficiency versus feasibility of the control systems applied to this
system, which will improve the way we present how to address similar nonlinear systems, scaling to real problems. Then consider
this work as a useful academic guidance, for those interested in the field of control engineering, the discovery of variables and
unstable behavior of nonlinear systems.
Keywords: Pendulum, MPC, Optimal, PID, LQR, Matlab, States, transfer function.
1
Revista Politécnica-Julio 2014, Vol. 34, No. 1, Páginas 1-5
Loya H.*; Arroyo S.*; Rodríguez L.*; Jaramillo D.*
_______________________________________________________________________________________________________________________________
péndulo invertido mediante el modelo matemático por función Para un óptimo modelado del sistema, se realiza el análisis de
de transferencia y variables de estado. En la sección 3 se los cuerpos por separado mediante el diagrama de cuerpo libre
describe el diseño del controlador PID y se muestra la de las masas que constituyen el péndulo.
respuesta del sistema en lazo abierto. En la sección 4 se diseña
el controlador LQR. En la sección 5, el diseño del controlador
MPC. La sección 6 por su parte muestra el análisis y la
comparación de resultados obtenidos por cada una de las
estrategias de control mediante graficas que permiten
interpretar de manera gráfica la eficiencia de cada controlador.
Finalmente en le sección 7 se añaden conclusiones y
bibliografía empleada en el desarrollo del trabajo.
∑ 𝐹𝑖 = 𝑚𝑎𝑖 (2.1)
∑ 𝐹𝑗 = 𝑚𝑎𝑗 (2.2)
∑ 𝐹𝐺 = 𝐼 ∝𝑔 (2.3)
Para obtener analíticamente la función de transferencia de la El vector x determina el estado del sistema y consta de 4
planta, se aplica la Transformada de Laplace de las ecuaciones elementos: posición del carro, velocidad del carro, posición del
de movimiento del sistema: ángulo y velocidad angular.
(𝐼+𝑚𝑙2 ) 𝑔 (𝐼+𝑚𝑙2 ) 𝑔 𝑥1 𝑟
(𝑀 + 𝑚) [ + ] Φ(𝑠)𝑠 2 + 𝑏 [ + ] Φ(𝑠)𝑠 − 𝑥1
𝑚𝑙 𝑠 𝑚𝑙 𝑠 𝑥2 Φ
𝑚𝑙Φ(𝑠)𝑠 2 = 𝑈(𝑠) 𝑥= [ ]=[ ] 𝑦 = [𝑥2 ]
(2.15) 𝑥3 𝑟̇ 𝑥3
𝑥4 Φ̇
𝑥̇ = 𝑓(𝑥, 𝑢) (2.18)
𝑞 = [(𝑀 + 𝑚)(𝐼 + 𝑚𝑙 2 ) − (𝑚𝑙)2 ] (2.16)
3
Revista Politécnica-Julio 2014, Vol. 34, No. 1, Páginas 1-5
Loya H.*; Arroyo S.*; Rodríguez L.*; Jaramillo D.*
_______________________________________________________________________________________________________________________________
Entonces: 0 1 0 0
𝑥̇ −(𝐼+𝑚𝑙 2 )𝑏 𝑚2 𝑔𝑙 2 𝑥̇
𝑥̈ 0 0 𝑥̈
𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2 𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2
[ ̇]= [ ]+
Φ 0 0 0 1 Φ̇
𝑥̇1 = 𝑓1 (𝑥, 𝑢) = 𝑥3 (2.19) Φ̈ −𝑚𝑙𝑏 𝑚𝑔𝑙(𝑀+𝑚)
0] Φ̈
[0 𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2 𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2
0
𝑥̇ 2 = 𝑓2 (𝑥, 𝑢) = 𝑥4 (2.20) 𝐼+𝑚𝑙 2
𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2
(2.30)
Si 𝛼 = 𝑀1 𝑙𝑠 : 0
𝑚𝑙
[𝐼(𝑀+𝑚)+𝑀𝑚𝑙2]
𝛼𝑥̇ 4 𝑐𝑜𝑠𝑥2 −𝛼𝑥4 2 𝑠𝑒𝑛𝑥2 − 𝐹𝑟 𝑥3 +𝑢
𝑥̇ 3 = 𝑀
(2.21)
1 0 0 0
𝛼𝑥̇ 3 𝑐𝑜𝑠𝑥2 + 𝛼𝑔𝑠𝑒𝑛𝑥2 − 𝐶𝑥4 𝑦= [ ]
𝑥̇ 4 = Θ
(2.22) 0 0 1 0
𝛽 = Θ𝑀 − 𝛼 2 Se obtiene:
𝜕𝑓3 (𝑥,𝑢)
𝑎31 = | =0 (2.25)
𝜕𝑥1 𝑥=0,𝑢=0
𝜕𝑓3 (𝑥,𝑢) 𝛼2𝑔
𝑎32 = | = (2.26)
𝜕𝑥2 𝑥=0,𝑢=0 𝛽
𝜕𝑓3 (𝑥,𝑢) Θ𝐹𝑟
𝑎33 = | = (2.27)
𝜕𝑥3 𝑥=0,𝑢=0 𝛽
𝜕𝑓3 (𝑥,𝑢) αC Figura 3. Respuesta del sistema ante una señal impulso.
𝑎34 = | =− (2.28)
𝜕𝑥1 𝑥=0,𝑢=0 𝛽
𝜕𝑓3 (𝑥,𝑢) Θ
𝑏3 = | =− (2.29)
𝜕𝑢 𝑥=0,𝑢=0 𝛽 Puede notarse en la figura 3, que el ángulo del péndulo nunca
podrá estabilizarse y mantenerse en cero como es el objetivo.
Entonces, ya se pueden determinar los coeficientes de A y B.
Después de obtener las constantes iniciales y aplicarlas al
sistema se obtiene los valores finales siguientes:
0 0 1 0 0 kd = 20;
0 0 0 1 0
𝐴=[ ] 𝐵=[ ] kp = 100;
0 𝑎32 𝑎33 𝑎34 𝑏3
0 𝑎42 𝑎43 𝑎44 𝑏4 ki = 1;
Por último, la ecuación en variables de estado sería: La ecuación final del sistema que controlada el ángulo
añadiendo el PID diseñado se obtiene a continuación:
𝑋̇𝑛 = 𝐴𝑛 𝑥𝑛 + 𝐵𝑛 𝑢
4.545∗𝑠 2
𝑌𝑛 = 𝐶𝑥𝑛 𝐺𝑇 = (3.1)
𝑠 4 +91.09∗𝑠 3 +423.4∗𝑠 2 +0.090091∗𝑠
1.818∗𝑠 3 −44.55∗𝑠
𝐺𝑇1 = (3.2)
𝑠 5 +91.09∗𝑠 4 +423.4∗𝑠 3 +0.090091∗𝑠 2 Q=C’*C (4.6)
𝐵𝑐 = [𝐵] (4.10)
𝐶𝑐 = [𝐶] (4.11)
𝐷𝑐 = [𝐷] (4.12)
Figura 4. Esquema del Regulador LQR. Con lo cual se obtienen los valores de las nuevas matrices Ac,
Bc, Cc y Dc a los que se aplicará la entrada impulsiva y se
obtendrá la respuesta del sistema estabilizada en posición y
La matriz K retroalimenta el estado para obtener la señal de ángulo.
control. La ley de control está determinada por K para lo cual
se utiliza el control óptimo LQR.
5. DISEÑO CONTROLADOR MPC [10] [11]
J es la función de costo que se asocia con la energía del
sistema. El controlador MPC tiene por estrategia de control la
representada en la figura 5. El sistema del péndulo invertido es
𝐽 = ∑𝑁 𝑇 𝑇
𝑘=0[𝑋𝑛 (𝑘)𝑄𝑋𝑛 (𝑘) + 𝑢 (𝑘)𝑅𝑢(𝑘)] (4.1) considerado como un sistema SISO, la entrada del sistema es
El controlador optimo busca minimiza esta energía. la fuerza empleada sobre el carro mientras que la salida del
sistema es la posición del carro. El objetivo de control es
La energía aportada por cada estado es: mover el carro de acuerdo a la referencia de una trayectoria
𝑋𝑛𝑇 (𝑘)𝑄𝑋𝑛 (𝑘) (4.2) predefinida, el ángulo es una limitante ya que tiene que ser
cercano a cero durante el proceso de control.
La ley de control variante en el tiempo estará representada
por:
𝑢(𝑘) = −𝐾(𝑘)𝑋𝑛 (𝑘) (4.3)
5
Revista Politécnica-Julio 2014, Vol. 34, No. 1, Páginas 1-5
Loya H.*; Arroyo S.*; Rodríguez L.*; Jaramillo D.*
_______________________________________________________________________________________________________________________________
∆𝑈 = [∆𝑢(𝑘𝑖 ), ∆𝑢(𝑘𝑖 + 1), … , ∆𝑢(𝑘𝑖 + 𝑁𝑐 − 1)]𝑇 Analizando la gráfica anterior podemos se puede claramente
(5.6) notar que para la estabilización del péndulo, el controlador
LQR presenta la mejor respuesta en cuanto al pico y el tiempo
Además se indican las variables de estado futuras por: de estabilidad. El controlador PID cumple esta tarea de manera
𝑋 = [∆𝑥(𝑘𝑖 + 1/𝑘𝑖 ), ∆𝑥(𝑘𝑖 + 2/𝑘𝑖 ), . . , ∆𝑥(𝑘𝑖 + 𝑁𝑝/𝑘𝑖 )]𝑇 satisfactoria con un mayor sobre pico y un tiempo de
estabilización casi similar al LQR.
(5.7) En cuanto al MPC, puede observarse que la respuesta en sobre
pico es mejor al PID pero toma más tiempo en lograr la
Donde 𝑁𝑐 es el horizonte de control, parámetros para adquirir
estabilidad deseada.
el control de la trayectoria futura y 𝑁𝑝 es el horizonte de
REFERENCIAS
[1] Lozano, R., Fantoni, I., Block, D. J., 2000. Stabilization on
the inverted pendulum around its homoclinic orbit. System
& Control letters 40 (1), 197–204.
En cuanto a la respuesta del carro que lleva el péndulo, puedo [5] Pathak, K., Franch, J., Agrawal, S. K., 2005. Velocity and
notarse que el controlador LQR lo estabiliza en una posición position control of a wheeled inverted pendulum by partial
más cercana que lo que hace un control MPC. feedback linearization. IEEE Transactions on robotics 21
En cuanto al control PID, puede notarse que pese a que se pudo (3), 505–513
estabilizar en ángulo del péndulo, la posición del carro varía
por lo cual se nota que el carro se mueve a velocidad constante [6] Viguria, A., Prieto, A., Fiacchini, M., Cano, R., Rubio, F.
hacia un lado. R., Aracil, J., Canudas de Wit, C., 2006. Desarrollo y
experimentación de un vehículo basado en péndulo
7. CONCLUSIONES invertido (ppcar). Revista iberoamericana de automática e
informática industrial (RIAI) 3 (4), 54–63
El controlador PID es capaz de estabilizar el ángulo del
péndulo pero la posición del carro cambia y se desplaza a una [7] Jeong, S., Takahashi, T., 2008. Wheeled inverted
velocidad constante por lo cual con este tipo de controlador no pendulum type assistant robot: design concept and mobile
se consigue el objetivo planteado. control. Intelligent Service Robotics 1, 313–320
El péndulo invertido es una planta en donde se pueden [8] Huang, J., Zhi-Hong Guan, Matsuno, T., Fukuda, T.,
implementar varios tipos de controladores, y discriminar las Sekiyama, K., 2010. Sliding-mode velocity control of
ventajas de uno contra otro, como en los tiempos de respuesta, mobile-wheeled inverted-pendulum systems. IEEE
si bien uno de los controladores MPC tiene un tiempo mayor Transactions on robotics 26 (4), 750–758
para estabilizarse no quiere decir que no sea el mejor ya que
al no forzar un cambio brusco al carro mantiene sus [9] Nawawi, S. W., Ahmad, M. N., Osman, J. H. S., 2008.
componentes haciéndolo más robustos en comparación al resto Real-time control of a two-wheeled inverted pendulum
de controladores propuestos PID y LQR. mobile robot. International Journal of Computer and
Information Engineering 2 (1), 70–76.
Para obtener un mejor control del péndulo tanto en términos
de velocidad de respuesta como en magnitud de movimiento [10] Harchita Joshi, Nimmy Paulose, 2013, “Discrete time
lineal es recomendable utilizar un arreglo entre un controlador model predictive control aproach for inverted pendulum
PID y un regulador LQR. system with input constraints”, International Journal of
Electrical and Electronics Engineering (IJEEE) ISSN
El modelado y control de este sistema ha permitido establecer (PRINT):2231-5284 Volume-3, Issue-1,2013.
un horizonte para futuros trabajos con sistemas no lineales. La
implementación de estos deberá ir de la mano de las [11]Petr Chalupa and Vladimir Bobal, “Modelling and
posibilidades en cuanto a hardware (sensores y actuadores) y Predictive Control of Inverted Pendulum”, Proceedings
software existente. La experiencia ganada en el control de 22nd European Conference on Modelling and Simulation
sistemas mecánicos no lineales ha sido importante, así como ISBN: 978-0-9553018-5-8 / ISBN: 978-0-9553018-6-5
el criterio para poder reducirlos sin afectar la naturaleza y (CD)
comportamiento del sistema.
7
Revista Politécnica-Julio 2014, Vol. 34, No. 1, Páginas 1-5