Estabilizacindeunpnduloinvertidousando MPCy LQR

See discussions, stats, and author profiles for this publication at: https://www.researchgate.
net/publication/281035776
Estabilización de un Péndulo Invertido aplicando MPC y LQR
Article · September 2015
CITATIONS READS
0 3,314
1 author:
David Jaramillo
CORPORACION ELECTRICA DEL ECUADOR
2 PUBLICATIONS 0 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Waste-To-Energy Technologies: an opportunity of energy recovery from Municipal Solid Waste, using Quito - Ecuador as case study View project
ScienceDirect ScienceDirect Waste-To-Energy Technologies: an opportunity of energy recovery from Municipal Solid Waste, using Quito-Ecuador as case study View
project
All content following this page was uploaded by David Jaramillo on 17 August 2015.
The user has requested enhancement of the downloaded file.

Preparación de Artículos para la Revista Politécnica
_________________________________________________________________________________________________________________________
Estabilización de un Péndulo Invertido aplicando MPC y LQR

Loya H.*; Arroyo S.*; Rodríguez L.*; Jaramillo D. *

*Escuela Politécnica Nacional, Facultad de Ingeniería Eléctrica y Electrónica, Quito, Ecuador
e-mail: giomh_1107@hotmail.com; danny_r_2@hotmail.com;sarroyoxg@hotmail.com; dajar1984@gmail.com
Resumen: La estabilización del péndulo invertido es una de las más frecuentes demostraciones del uso de control
realimentado con la finalidad de estabilizar un sistema de lazo abierto inestable y no lineal. El presente trabajo aborda
este sistema de control no lineal aplicando las metodologías de control: PID (proporcional-integral-derivativo), MPC
(control predictivo basado en el modelo) y Control óptimo. La siguiente tarea nos llevó, en base a los resultados, a
realizar un análisis comparativo de la calidad de control obtenida luego de emplear cada metodología. El trabajo
concluye con una perspectiva de eficacia versus factibilidad de los sistemas de control aplicados a este sistema, que
mejorará la forma que tenemos actualmente de cómo abordar sistemas no lineales similares, escalando hacia
problemas reales. Considérese entonces a este trabajo como una útil guía académica, para los interesados en el campo
de la ingeniería de control, en el descubrimiento de las variables y comportamiento de sistemas no lineales inestables.
Palabras clave: Péndulo, MPC, Óptimo, PID, LQR, Matlab, Establecimiento, estados, función de transferencia.
Abstract: Inverted pendulum model is a popular show the use of feedback control in order to stabilize an unstable system and
nonlinear loop open. Therefore it has been widely used to study various control methods and model behavior. This paper addresses
this nonlinear control system using control methodologies: PID (proportional-integral-derivative), MPC (predictive control model)
and optimal control. The next task took, based on the results, a comparative analysis of the quality control then obtained using
each methodology. The paper concludes with a perspective of efficiency versus feasibility of the control systems applied to this
system, which will improve the way we present how to address similar nonlinear systems, scaling to real problems. Then consider
this work as a useful academic guidance, for those interested in the field of control engineering, the discovery of variables and
unstable behavior of nonlinear systems.
Keywords: Pendulum, MPC, Optimal, PID, LQR, Matlab, States, transfer function.
de prueba y desarrollo de diversos tipos de controladores ya

que aún no se encuentra una solución general para la
1. INTRODUCCIÓN
estabilización de este tipo de sistemas. El péndulo invertido
El péndulo invertido constituye uno de los sistemas no lineales está compuesto por un carro que se desplaza libremente en
más utilizados para la experimentación de distintas estrategias dirección horizontal en el cual se encuentra un vástago vertical
de control [1][2][3][4]. Este sistema ha dado lugar al desarrollo llamado péndulo con libertad para rotar. Entre el carro y el
de varios trabajos que buscan aplicar diversas técnicas para su péndulo existe un par giratorio binario, formándose así una
control. En [5] se realiza el análisis dinámico desde la cadena cinemática abierta. El objetivo de este sistema, es
perspectiva de controlabilidad y linealización para obtener en mantener en posición vertical el péndulo y las ruedas del carro
primera instancia un controlador de posición y en segundo en reposo.
lugar el de velocidad. En [6] especifican el desarrollo de un En este artículo se modelan tres tipos de controladores: PID,
vehículo que maneja la lógica de estabilización de un péndulo LQR y MPC cuyas respuestas se las compara para de esta
invertido implementando para ello dos leyes de control: lineal manera determinar cuál es el sistema de control más
y no lineal en el cual se podrán estudiar otros tipos de conveniente desde diferentes puntos de vista al momento de
controladores. En [7] se muestra la aplicación de un robot intentar implementarlo en la vida real, sin llegar a realizar
basado en el péndulo móvil para asistencia del ser humano en esfuerzos innecesarios en elaborar sistemas de control tan
algunas tareas. Y es así también el caso de [8] en donde se complejos.
realiza un control por modos deslizantes y [9] mediante control El trabajo se organiza de la siguiente manera: La sección 1
lineal. Como puede verse este sistema es utilizado como planta corresponde a la introducción, El sección 2, la descripción del
1
Revista Politécnica-Julio 2014, Vol. 34, No. 1, Páginas 1-5
Loya H.*; Arroyo S.*; Rodríguez L.*; Jaramillo D.*
_______________________________________________________________________________________________________________________________
péndulo invertido mediante el modelo matemático por función Para un óptimo modelado del sistema, se realiza el análisis de
de transferencia y variables de estado. En la sección 3 se los cuerpos por separado mediante el diagrama de cuerpo libre
describe el diseño del controlador PID y se muestra la de las masas que constituyen el péndulo.
respuesta del sistema en lazo abierto. En la sección 4 se diseña
el controlador LQR. En la sección 5, el diseño del controlador
MPC. La sección 6 por su parte muestra el análisis y la
comparación de resultados obtenidos por cada una de las
estrategias de control mediante graficas que permiten
interpretar de manera gráfica la eficiencia de cada controlador.
Finalmente en le sección 7 se añaden conclusiones y
bibliografía empleada en el desarrollo del trabajo.
2. DESCRICPCIÓN DEL PÉNDULO INVERTIDO
Figura 2. Diagramas de cuerpo libre.

2.1 Modelo matemático:
Para modelar la planta del péndulo invertido, se obtiene el

modelo a través de principios físicos de la planta obteniendo El péndulo invertido es un cuerpo rígido que tiene movimiento
de esta manera una función de transferencia en primera en 2 ejes o 2 dimensiones y las siguientes ecuaciones
instancia y como segundo paso obtener su modelo mediante fundamentales definen el movimiento plano de un cuerpo
variables de estado. rígido:
∑ 𝐹𝑖 = 𝑚𝑎𝑖 (2.1)
∑ 𝐹𝑗 = 𝑚𝑎𝑗 (2.2)
∑ 𝐹𝐺 = 𝐼 ∝𝑔 (2.3)
Mediante la sumatoria de fuerzas en el diagrama de cuerpo

libre del carro en dirección horizontal, se obtiene la siguiente
ecuación de movimiento:
𝑀𝑥̈ + 𝑏𝑥̇ + 𝑁 = 𝐹 (2.4)
Aplicando la sumatoria de fuerzas en el diagrama de cuerpo

libre del péndulo, se obtiene la siguiente ecuación:
𝑁 = 𝑚𝑥̈ + 𝑚𝑙𝜃̈ 𝑐𝑜𝑠𝜃 − 𝑚𝑙𝜃̇ 2 𝑠𝑖𝑛𝜃 (2.5)

Figura 1. Esquema del péndulo invertido.
Reemplazando la ecuación del diagrama de cuerpo libre del
péndulo, se obtiene la primera ecuación de movimiento del
Tabla 1. Descripción de parámetros físicos del péndulo invertido sistema:
PARÁMETROS DESCRIPCIÓN
M Masa del carro (𝑀 + 𝑚)𝑥̈ + 𝑏𝑥̇ + 𝑚𝑙𝜃̈𝑐𝑜𝑠𝜃 − 𝑚𝑙𝜃̇ 2 𝑠𝑖𝑛𝜃 = 𝐹 (2.6)
m Masa del péndulo
b Fricción del carro
l Longitud del centro de masa
I Inercia del péndulo Para obtener la segunda ecuación de movimiento, es
F Fuerza aplicada al carro imprescindible realizar la sumatoria de fuerzas a lo largo del
x Coordenadas de posición del carro eje perpendicular al péndulo.
theta Ángulo del péndulo respecto a la vertical
𝑃𝑠𝑖𝑛𝜃 + 𝑁𝑐𝑜𝑠𝜃 − 𝑚𝑔𝑠𝑖𝑛𝜃 = 𝑚𝑙𝜃̈ + 𝑚𝑥̈ 𝑐𝑜𝑠𝜃 (2.7)

2.2 Análisis de fuerzas:
2 Revista Politécnica-Julio 2014, Vol. 34, No. 1, Páginas 1-5

_________________________________________________________________________________________________________________________
Podemos dejar ésta expresión en función de los momentos de

Inercia sobre el centroide del péndulo, obteniendo de esta De la función de transferencia se observa que existe un polo y
forma la segunda ecuación dinámica. un cero en el origen, anulando los polos se obtiene finalmente
la función de transferencia de la planta péndulo invertido.
−𝑃𝑙𝑠𝑖𝑛𝜃 − 𝑁𝑙𝑐𝑜𝑠𝜃 = 𝐼𝜃̈ (2.8)
(𝐼 + 𝑚𝑙 2 )𝜃̈ + 𝑚𝑔𝑙𝑠𝑖𝑛𝜃 = −𝑚𝑙𝑥̈ 𝑐𝑜𝑠𝜃 (2.9) 𝑚𝑙
Φ(𝑠) 𝑠
𝑞
=
𝑈(𝑠) 𝑏(𝐼 + 𝑚𝑙 2 ) 2 (𝑀 + 𝑚)𝑚𝑔𝑙 𝑠 𝑏𝑚𝑔𝑙
𝑠3 + 𝑠 − 𝑠 −
Para trabajar solo con funciones lineales, se asume que 𝜃 = 𝑞 𝑞 𝑞
𝜋 + ∅, donde ∅ es el ángulo con respecto al eje vertical, por
tanto las ecuaciones de movimiento son: 𝑞 = [(𝑀 + 𝑚)(𝐼 + 𝑚𝑙 2 ) − (𝑚𝑙)2 ] (2.17)
(𝐼 + 𝑚𝑙 2 )∅̈ − 𝑚𝑔𝑙∅ = 𝑚𝑙𝑥̈ (2.10)

2.4 Ecuación en Variables de Estado:
(𝑀 + 𝑚)𝑥̈ + 𝑏𝑥̈ − 𝑚𝑙∅̈ = 𝑢 (2.11)
Este el otro método que nos permite modelar matemáticamente
un sistema físico mediante un conjunto de entradas y salidas
2.3 Función de Transferencia:
relacionadas con ecuaciones diferenciales de primer orden que
se combinan en una ecuación matricial de primer orden, la
La función de transferencia de un sistema nos permite conocer
forma general de expresar la dinámica de un sistema lineal es:
el comportamiento del sistema ante una determinada señal de
entrada.
𝑥 = 𝐴𝑥 + 𝐵𝑢
𝑌(𝑠)
𝐻(𝑠) = (2.12) 𝑦 = 𝐶𝑥 + 𝐷𝑢
𝑈(𝑠)
Donde x es el vector de estado del sistema, u es el vector de

Donde H(s) (o G(s)) representa la función de transferencia que entrada, y es el vector de salida. A, es la matriz del sistema, B
no es más que la relación entre la salida (Y(s)) y la entrada es la matriz de entrada, C es la matriz de salida y por último la
(U(s)). matriz D.
Para obtener analíticamente la función de transferencia de la El vector x determina el estado del sistema y consta de 4
planta, se aplica la Transformada de Laplace de las ecuaciones elementos: posición del carro, velocidad del carro, posición del
de movimiento del sistema: ángulo y velocidad angular.
(𝐼 + 𝑚𝑙 2 )Φ(𝑠)𝑠 2 − 𝑚𝑔𝑙Φ(𝑠) = 𝑚𝑙𝑋(𝑠)𝑠 2 (2.13) El vector y está constituido de 3 sensores:

(𝑀 + 𝑚)𝑋(𝑠)𝑠 2 + 𝑏𝑋(𝑠)𝑠 − 𝑚𝑙Φ(𝑠)𝑠 2 = 𝑈(𝑠) (2.14) 1. Posición del carro r.
2. ÁnguloΦ.
3. Velocidad del carro 𝑟̇ .
Despejando X(s) de la ecuación (2.13) y sustituyendo en la Donde D = 0;

ecuación (2.14) tenemos:
(𝐼+𝑚𝑙2 ) 𝑔 (𝐼+𝑚𝑙2 ) 𝑔 𝑥1 𝑟
(𝑀 + 𝑚) [ + ] Φ(𝑠)𝑠 2 + 𝑏 [ + ] Φ(𝑠)𝑠 − 𝑥1
𝑚𝑙 𝑠 𝑚𝑙 𝑠 𝑥2 Φ
𝑚𝑙Φ(𝑠)𝑠 2 = 𝑈(𝑠) 𝑥= [ ]=[ ] 𝑦 = [𝑥2 ]
(2.15) 𝑥3 𝑟̇ 𝑥3
𝑥4 Φ̇
Organizando la función de transferencia: 1 0 0 0

𝐶 = [0 1 0 0] 𝑢=𝐹
𝑚𝑙 2 0 0 1 0
Φ(𝑠) 𝑠
𝑞
= Para obtener A y B es necesario expresar al vector x con su
𝑈(𝑠) 𝑏(𝐼 + 𝑚𝑙 2 ) 3 (𝑀 + 𝑚)𝑚𝑔𝑙 2 𝑏𝑚𝑔𝑙
𝑠4 + 𝑠 − 𝑠 − 𝑠 derivada en función de x, u:
𝑞 𝑞 𝑞
𝑥̇ = 𝑓(𝑥, 𝑢) (2.18)
𝑞 = [(𝑀 + 𝑚)(𝐼 + 𝑚𝑙 2 ) − (𝑚𝑙)2 ] (2.16)
3
_______________________________________________________________________________________________________________________________
Entonces: 0 1 0 0
𝑥̇ −(𝐼+𝑚𝑙 2 )𝑏 𝑚2 𝑔𝑙 2 𝑥̇
𝑥̈ 0 0 𝑥̈
𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2 𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2
[ ̇]= [ ]+
Φ 0 0 0 1 Φ̇
𝑥̇1 = 𝑓1 (𝑥, 𝑢) = 𝑥3 (2.19) Φ̈ −𝑚𝑙𝑏 𝑚𝑔𝑙(𝑀+𝑚)
0] Φ̈
[0 𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2 𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2
0
𝑥̇ 2 = 𝑓2 (𝑥, 𝑢) = 𝑥4 (2.20) 𝐼+𝑚𝑙 2
𝐼(𝑀+𝑚)+𝑀𝑚𝑙 2
(2.30)
Si 𝛼 = 𝑀1 𝑙𝑠 : 0
𝑚𝑙
[𝐼(𝑀+𝑚)+𝑀𝑚𝑙2]
𝛼𝑥̇ 4 𝑐𝑜𝑠𝑥2 −𝛼𝑥4 2 𝑠𝑒𝑛𝑥2 − 𝐹𝑟 𝑥3 +𝑢
𝑥̇ 3 = 𝑀
(2.21)
1 0 0 0
𝛼𝑥̇ 3 𝑐𝑜𝑠𝑥2 + 𝛼𝑔𝑠𝑒𝑛𝑥2 − 𝐶𝑥4 𝑦= [ ]
𝑥̇ 4 = Θ
(2.22) 0 0 1 0
Sustituyendo la ecuación de 𝑥̇ 3 se obtiene una ecuación

resultante que no es lineal, para poder linealizar ésta ecuación, 3. DISEÑO DEL CONTROLADOR PID
debe tener la siguiente forma:
De las ecuaciones obtenidas se procede al diseño del
controlador PID para estabilidad del ángulo y la posición.
𝑥̇ 𝑖 = ∑𝑛𝑗=1 𝑎𝑖𝑗 𝑥𝑗 + 𝑏𝑖 𝑢 (2.23) Antes de diseñar el controlador se somete el sistema en lazo
abierto a una señal impulso de donde se obtiene:
Donde 𝑎𝑖𝑗 y 𝑏𝑖 son constantes. Para linealizar se puede
expresar 𝑓3 (𝑥, 𝑢) como una serie de Tylor y utilizar solo el
primer término.
𝜕𝑓3 (𝑥,𝑢) 𝜕𝑓3 (𝑥,𝑢)

𝑥̇ 3 ≈ ∑4𝑖=1 [ | ∆𝑥𝑖 ] + | ∆𝑢 (2.24)
𝜕𝑥𝑖 𝑥=0,𝑢=0 𝜕𝑢 𝑥=0,𝑢=0
Al calcular las derivadas parciales y reemplazando
𝛽 = Θ𝑀 − 𝛼 2 Se obtiene:
𝜕𝑓3 (𝑥,𝑢)
𝑎31 = | =0 (2.25)
𝜕𝑥1 𝑥=0,𝑢=0
𝜕𝑓3 (𝑥,𝑢) 𝛼2𝑔
𝑎32 = | = (2.26)
𝜕𝑥2 𝑥=0,𝑢=0 𝛽
𝜕𝑓3 (𝑥,𝑢) Θ𝐹𝑟
𝑎33 = | = (2.27)
𝜕𝑥3 𝑥=0,𝑢=0 𝛽
𝜕𝑓3 (𝑥,𝑢) αC Figura 3. Respuesta del sistema ante una señal impulso.
𝑎34 = | =− (2.28)
𝜕𝑥1 𝑥=0,𝑢=0 𝛽
𝜕𝑓3 (𝑥,𝑢) Θ
𝑏3 = | =− (2.29)
𝜕𝑢 𝑥=0,𝑢=0 𝛽 Puede notarse en la figura 3, que el ángulo del péndulo nunca
podrá estabilizarse y mantenerse en cero como es el objetivo.
Entonces, ya se pueden determinar los coeficientes de A y B.
Después de obtener las constantes iniciales y aplicarlas al
sistema se obtiene los valores finales siguientes:
0 0 1 0 0 kd = 20;
0 0 0 1 0
𝐴=[ ] 𝐵=[ ] kp = 100;
0 𝑎32 𝑎33 𝑎34 𝑏3
0 𝑎42 𝑎43 𝑎44 𝑏4 ki = 1;
Por último, la ecuación en variables de estado sería: La ecuación final del sistema que controlada el ángulo
añadiendo el PID diseñado se obtiene a continuación:
𝑋̇𝑛 = 𝐴𝑛 𝑥𝑛 + 𝐵𝑛 𝑢
4.545∗𝑠 2
𝑌𝑛 = 𝐶𝑥𝑛 𝐺𝑇 = (3.1)
𝑠 4 +91.09∗𝑠 3 +423.4∗𝑠 2 +0.090091∗𝑠

_________________________________________________________________________________________________________________________
La función de trasferencia mostrada anteriormente está

relacionada directamente con una salida que en este caso Se deberá encontrar K que asegure que la energía del Sistema
corresponde solo al ángulo medido respecto a la vertical. se minimice al máximo.
Para obtener la respuesta del sistema en cuanto a la posición,
𝐾(𝑘) = 𝐾 (4.4)
se obtiene en primera instancia la función de transferencia que
Se considera:
relaciona la entrada y la salida (posición del carro) utilizando
la herramienta Matlab. De esto, se obtiene la siguiente función
𝑅=1 (4.5)
de transferencia de planta junto al controlador PID diseñado:
Y de aquí se encontrara Q.
1.818∗𝑠 3 −44.55∗𝑠
𝐺𝑇1 = (3.2)
𝑠 5 +91.09∗𝑠 4 +423.4∗𝑠 3 +0.090091∗𝑠 2 Q=C’*C (4.6)
La respuesta del sistema con el controlador PID añadido se

Por lo tanto la matriz Q obtenida es:
mostrará más adelante.
𝑥 0 0 0
0 0 0 0
𝑄=[ ] (4.7)
4. DISEÑO DEL CONTROLADOR LQR 0 0 𝑦 0
0 0 0 0
Como se tiene el sistema representado en espacio de estados,
el diseño del controlador LQR será más sencillo. Para ello
analizaremos los elementos que intervienen en el controlador En donde el elemento 𝑥 se usará para ir mejorando el
para su diseño e implementación. comportamiento del controlador en cuanto a tiempo de
Asumiendo que todos los estados son medibles, se realizara establecimiento y el elemento 𝑦 permite reducir el movimiento
una retroalimentación completa mediante una combinación angular del péndulo.
lineal de las variables de estado. Se plantea el siguiente Inicialmente, 𝑥 = 1 y 𝑦 = 1. Empleando la herramienta
esquema: matemática Matlab se podrá realizer el calculo correpondiente.
𝐾 = 𝑙𝑞𝑟(𝐴, 𝐵, 𝑄, 𝑅) (4.8)
𝐴𝑐 = [(𝐴 − 𝐵 ∗ 𝐾)] (4.9)
𝐵𝑐 = [𝐵] (4.10)
𝐶𝑐 = [𝐶] (4.11)
𝐷𝑐 = [𝐷] (4.12)
Figura 4. Esquema del Regulador LQR. Con lo cual se obtienen los valores de las nuevas matrices Ac,
Bc, Cc y Dc a los que se aplicará la entrada impulsiva y se
obtendrá la respuesta del sistema estabilizada en posición y
La matriz K retroalimenta el estado para obtener la señal de ángulo.
control. La ley de control está determinada por K para lo cual
se utiliza el control óptimo LQR.
5. DISEÑO CONTROLADOR MPC [10] [11]
J es la función de costo que se asocia con la energía del
sistema. El controlador MPC tiene por estrategia de control la
representada en la figura 5. El sistema del péndulo invertido es
𝐽 = ∑𝑁 𝑇 𝑇
𝑘=0[𝑋𝑛 (𝑘)𝑄𝑋𝑛 (𝑘) + 𝑢 (𝑘)𝑅𝑢(𝑘)] (4.1) considerado como un sistema SISO, la entrada del sistema es
El controlador optimo busca minimiza esta energía. la fuerza empleada sobre el carro mientras que la salida del
sistema es la posición del carro. El objetivo de control es
La energía aportada por cada estado es: mover el carro de acuerdo a la referencia de una trayectoria
𝑋𝑛𝑇 (𝑘)𝑄𝑋𝑛 (𝑘) (4.2) predefinida, el ángulo es una limitante ya que tiene que ser
cercano a cero durante el proceso de control.
La ley de control variante en el tiempo estará representada
por:
𝑢(𝑘) = −𝐾(𝑘)𝑋𝑛 (𝑘) (4.3)
5
_______________________________________________________________________________________________________________________________
predicción, el horizonte de control siempre es menor que el

horizonte de predicción.
Las variables de salida predichas son:
𝑌 = [𝑦(𝑘𝑖 + 1/𝑘𝑖 ), 𝑦(𝑘𝑖 + 2/𝑘𝑖 ), . . , 𝑦(𝑘𝑖 + 𝑁𝑝/𝑘𝑖 )]𝑇
(5.8)
La trayectoria futura de control está relacionada con la variable
de salida predicha Y según la siguiente ecuación.
𝑌 = 𝐹𝑥(𝑘𝑖 ) + ∅∆𝑈 (5.9)
Donde
𝐶𝐴 𝐶𝐵 0 0 . . 0
𝐶𝐴2 𝐶𝐴𝐵 𝐶𝐵 0 . . 0
3 2
𝐹 = 𝐶𝐴 , 𝐶𝐴. 𝐵 𝐶𝐴𝐵 . 𝐶𝐵 . .. .. . 0
Figura 5. Estrategia de control MPC .. . . . . . .
4.1 Estructura del modelo [𝐶𝐴𝑁𝑝 ] [𝐶𝐴𝑁𝑝−1 𝐵 𝐶𝐴𝑁𝑝−2 . . . 𝐶𝐴𝑁𝑝−𝑁𝑐 𝐵]
El modelo en variables de estado del sistema linealizado se (5.10)
describe como:
𝑥𝑚 (𝑘 + 1) = 𝐴𝑚 𝑥𝑚 (𝑘) + 𝐵𝑚 𝑢(𝑘) (5.1) 6. ANÁLISIS Y COMPARACION DE
𝑦(𝑘) = 𝐶𝑚 𝑥𝑚 (𝑘) + 𝐷𝑚 𝑢(𝑘) (5.2) RESULTADOS
Para realizar el control MPC es necesario el conocimiento de A continuación se presentan los resultados obtenidos con cada
la información actual de la planta para la predicción, por lo uno de los controladores diseñados. En primera instancia se
tanto se asume que la entrada 𝑢(𝑘) no le afecta a la salida compara la respuesta y la estabilización del ángulo del péndulo
𝑦(𝑘) al mismo tiempo, por lo que 𝐷𝑚 = 0 en el modelo de la con respecto a la vertical.
planta.
y(k) = Cm xm (k) (5.3)
Se representa en modelo de variables de estado
∆𝑥𝑚 (𝑘 + 1) 𝐴 0𝑇𝑚 ∆𝑥𝑚 (𝑘) 𝐵
| |=| 𝑚 || | + | 𝑚 | ∆𝑢(𝑘)
𝑦(𝑘 + 1) 𝐶𝑚 𝐴𝑚 1 𝑦(𝑘) 𝐶𝑚 𝐵𝑚
(5.4)
∆𝑥𝑚 (𝑘)
𝑦(𝑘) = |0𝑚 1| | |
𝑦(𝑘)
(5.5)
donde 0𝑚 = |0 0 . . 0|
4.2 Predicción de variables estado y salida

Del criterio de control MPC, se puede denotar la trayectoria Figura 6. Comparación de estabilización de ángulo Phi entre los tres
futura por: controladores diseñados.
∆𝑈 = [∆𝑢(𝑘𝑖 ), ∆𝑢(𝑘𝑖 + 1), … , ∆𝑢(𝑘𝑖 + 𝑁𝑐 − 1)]𝑇 Analizando la gráfica anterior podemos se puede claramente
(5.6) notar que para la estabilización del péndulo, el controlador
LQR presenta la mejor respuesta en cuanto al pico y el tiempo
Además se indican las variables de estado futuras por: de estabilidad. El controlador PID cumple esta tarea de manera
𝑋 = [∆𝑥(𝑘𝑖 + 1/𝑘𝑖 ), ∆𝑥(𝑘𝑖 + 2/𝑘𝑖 ), . . , ∆𝑥(𝑘𝑖 + 𝑁𝑝/𝑘𝑖 )]𝑇 satisfactoria con un mayor sobre pico y un tiempo de
estabilización casi similar al LQR.
(5.7) En cuanto al MPC, puede observarse que la respuesta en sobre
pico es mejor al PID pero toma más tiempo en lograr la
Donde 𝑁𝑐 es el horizonte de control, parámetros para adquirir
estabilidad deseada.
el control de la trayectoria futura y 𝑁𝑝 es el horizonte de

_________________________________________________________________________________________________________________________
REFERENCIAS
[1] Lozano, R., Fantoni, I., Block, D. J., 2000. Stabilization on
the inverted pendulum around its homoclinic orbit. System
& Control letters 40 (1), 197–204.
[2] Aguilar-Ibañez, C., Gutierrez-Frıas, O. Suarez, M., 2005.

Lyapunov-BasedController for the Inverted Pendulum
Cart System. Nonlinear Dynamics 40 (4), 367–374.
[3] Bloch, A. M., Leonard, N. E., Marsden, J., 2000.

Controlled lagrangians and the stabilization of mechanical
systems i. the first matching theorem. IEEE Transactions
on Automatic Control 45 (12), 2253–2270
[4] Shiriaev, A., Ludvigsen, H., Egeland, O., 2004. Swinging

Figura 7. Compararación de estabilización de posición entre los
up the spherical pen-dulum via stabilization of its first
controladores diseñados. integrals. Automatica 40, 73–85
En cuanto a la respuesta del carro que lleva el péndulo, puedo [5] Pathak, K., Franch, J., Agrawal, S. K., 2005. Velocity and
notarse que el controlador LQR lo estabiliza en una posición position control of a wheeled inverted pendulum by partial
más cercana que lo que hace un control MPC. feedback linearization. IEEE Transactions on robotics 21
En cuanto al control PID, puede notarse que pese a que se pudo (3), 505–513
estabilizar en ángulo del péndulo, la posición del carro varía
por lo cual se nota que el carro se mueve a velocidad constante [6] Viguria, A., Prieto, A., Fiacchini, M., Cano, R., Rubio, F.
hacia un lado. R., Aracil, J., Canudas de Wit, C., 2006. Desarrollo y
experimentación de un vehículo basado en péndulo
7. CONCLUSIONES invertido (ppcar). Revista iberoamericana de automática e
informática industrial (RIAI) 3 (4), 54–63
El controlador PID es capaz de estabilizar el ángulo del
péndulo pero la posición del carro cambia y se desplaza a una [7] Jeong, S., Takahashi, T., 2008. Wheeled inverted
velocidad constante por lo cual con este tipo de controlador no pendulum type assistant robot: design concept and mobile
se consigue el objetivo planteado. control. Intelligent Service Robotics 1, 313–320
El péndulo invertido es una planta en donde se pueden [8] Huang, J., Zhi-Hong Guan, Matsuno, T., Fukuda, T.,
implementar varios tipos de controladores, y discriminar las Sekiyama, K., 2010. Sliding-mode velocity control of
ventajas de uno contra otro, como en los tiempos de respuesta, mobile-wheeled inverted-pendulum systems. IEEE
si bien uno de los controladores MPC tiene un tiempo mayor Transactions on robotics 26 (4), 750–758
para estabilizarse no quiere decir que no sea el mejor ya que
al no forzar un cambio brusco al carro mantiene sus [9] Nawawi, S. W., Ahmad, M. N., Osman, J. H. S., 2008.
componentes haciéndolo más robustos en comparación al resto Real-time control of a two-wheeled inverted pendulum
de controladores propuestos PID y LQR. mobile robot. International Journal of Computer and
Information Engineering 2 (1), 70–76.
Para obtener un mejor control del péndulo tanto en términos
de velocidad de respuesta como en magnitud de movimiento [10] Harchita Joshi, Nimmy Paulose, 2013, “Discrete time
lineal es recomendable utilizar un arreglo entre un controlador model predictive control aproach for inverted pendulum
PID y un regulador LQR. system with input constraints”, International Journal of
Electrical and Electronics Engineering (IJEEE) ISSN
El modelado y control de este sistema ha permitido establecer (PRINT):2231-5284 Volume-3, Issue-1,2013.
un horizonte para futuros trabajos con sistemas no lineales. La
implementación de estos deberá ir de la mano de las [11]Petr Chalupa and Vladimir Bobal, “Modelling and
posibilidades en cuanto a hardware (sensores y actuadores) y Predictive Control of Inverted Pendulum”, Proceedings
software existente. La experiencia ganada en el control de 22nd European Conference on Modelling and Simulation
sistemas mecánicos no lineales ha sido importante, así como ISBN: 978-0-9553018-5-8 / ISBN: 978-0-9553018-6-5
el criterio para poder reducirlos sin afectar la naturaleza y (CD)
comportamiento del sistema.
7
View publication stats

Estabilizacindeunpnduloinvertidousando MPCy LQR

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estabilizacindeunpnduloinvertidousando MPCy LQR

Cargado por

Copyright:

Formatos disponibles

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

Estabilización de un Péndulo Invertido aplicando MPC y LQR

Article · September 2015

The user has requested enhancement of the downloaded file.

Estabilización de un Péndulo Invertido aplicando MPC y LQR

de prueba y desarrollo de diversos tipos de controladores ya

2. DESCRICPCIÓN DEL PÉNDULO INVERTIDO

Figura 2. Diagramas de cuerpo libre.

Para modelar la planta del péndulo invertido, se obtiene el

Mediante la sumatoria de fuerzas en el diagrama de cuerpo

𝑀𝑥̈ + 𝑏𝑥̇ + 𝑁 = 𝐹 (2.4)

Aplicando la sumatoria de fuerzas en el diagrama de cuerpo

𝑁 = 𝑚𝑥̈ + 𝑚𝑙𝜃̈ 𝑐𝑜𝑠𝜃 − 𝑚𝑙𝜃̇ 2 𝑠𝑖𝑛𝜃 (2.5)

𝑃𝑠𝑖𝑛𝜃 + 𝑁𝑐𝑜𝑠𝜃 − 𝑚𝑔𝑠𝑖𝑛𝜃 = 𝑚𝑙𝜃̈ + 𝑚𝑥̈ 𝑐𝑜𝑠𝜃 (2.7)

2 Revista Politécnica-Julio 2014, Vol. 34, No. 1, Páginas 1-5

Podemos dejar ésta expresión en función de los momentos de

(𝐼 + 𝑚𝑙 2 )∅̈ − 𝑚𝑔𝑙∅ = 𝑚𝑙𝑥̈ (2.10)

Donde x es el vector de estado del sistema, u es el vector de

(𝐼 + 𝑚𝑙 2 )Φ(𝑠)𝑠 2 − 𝑚𝑔𝑙Φ(𝑠) = 𝑚𝑙𝑋(𝑠)𝑠 2 (2.13) El vector y está constituido de 3 sensores:

Despejando X(s) de la ecuación (2.13) y sustituyendo en la Donde D = 0;

Organizando la función de transferencia: 1 0 0 0

Sustituyendo la ecuación de 𝑥̇ 3 se obtiene una ecuación

𝜕𝑓3 (𝑥,𝑢) 𝜕𝑓3 (𝑥,𝑢)

Al calcular las derivadas parciales y reemplazando

4 Revista Politécnica-Julio 2014, Vol. 34, No. 1, Páginas 1-5

La función de trasferencia mostrada anteriormente está

La respuesta del sistema con el controlador PID añadido se

𝐴𝑐 = [(𝐴 − 𝐵 ∗ 𝐾)] (4.9)

predicción, el horizonte de control siempre es menor que el

4.2 Predicción de variables estado y salida

6 Revista Politécnica-Julio 2014, Vol. 34, No. 1, Páginas 1-5

[2] Aguilar-Ibañez, C., Gutierrez-Frıas, O. Suarez, M., 2005.

[3] Bloch, A. M., Leonard, N. E., Marsden, J., 2000.

[4] Shiriaev, A., Ludvigsen, H., Egeland, O., 2004. Swinging

View publication stats

También podría gustarte