Está en la página 1de 6

Minimum Time Swing-Up Controller applied to a

Rotary Inverted Pendulum


Claudio Alarcón Carlos M uñoz
Doctorate in Sciences Engineering Department of Electrical Engineering
with specialization in Bioprocesses University of La Frontera
University of La Frontera Temuco, Chile
Temuco, Chile carlos.munoz@ufrontera.cl
claudio.alarcon@ufrontera.cl

Abstract—This work presents the results of a swing-up controller invertida. La acción del controlador de inversión finaliza s i se
applied to a Quanser rotary inverted pendulum simulated in cumple que el péndulo alcanza la zona de estabilización la cual
Matlab. The objectives were to invert the pendulum in minimum ha sido definida en algunos trabajos como el intervalo angular
time and to obtain a final position and velocity that could be dado por ±30° , ±25° , o ±20°, medidos desde el punto inestable
stabilized in the inverted position. The controller's parameters vertical [6], [7]. No obstante, no existe un criterio uniforme en
were tuned using a genetic algorithm specially designed for this cuanto a la velocidad que debe poseer el péndulo para considerar
task. During the simulation tests, the pendulum was inverted with que se inicia la etapa de estabilización. Conseguir el control de la
just one swing, completed in 0.42[s], and stabilized with a voltage inversión del péndulo a partir de movimientos de balanceo es
smaller than |1|[V]. These results show a smoother inversion complejo ya que requiere que el péndulo alcance en el menor
completed in less time than the results obtained in related works. tiempo posible y con una baja velocidad final la vecindad de la
posición invertida. Por lo tanto dependiendo de la posición del
Keywords— S wing-up Controller, Non-linear S ystems, Rotary
péndulo, los controladores buscarán balancear el péndulo u
Inverted Pendulum, Genetic Algorithm.
estabilizarlo.
I. INT RODUCCIÓN

E quilibrar un lápiz sobre un dedo es difícil. Para lograrlo se


requiere del movimiento preciso del brazo y la mano. Existe
un sistema mecatrónico que estudia un problema similar, en el
cual se requiere equilibrar una barra sobre otra que puede ser
manipulada mediante un motor eléctrico. Este sistema es el
Péndulo Rotatorio, el cual es ampliamente empleado en el
estudio del control automático, con aplicaciones en el control de
balanceo de vehículos autónomos Segway, sistemas robóticos, e
incluso control de misiles [1]–[3].
El péndulo rotatorio invertido consiste en dos barras (Ver Fig.
1). La barra que gira en el plano horizontal es llamada brazo. La
segunda barra, es llamada péndulo, y rota libremente en torno al
punto de unión entre ambas barras, el cual es conocido como
pivote. El problema de equilibrar el péndulo puede ser aún más
desafiante si se requiere que la condición inicial de éste sea
cercana al reposo. Este problema típicamente se ha dividirlo en
dos partes. La primera parte consiste en acercar el péndulo a la
posición invertida mediante balanceos generados por un
controlador de inversión. La segunda etapa consiste en mantener Fig. 1. Representación de ángulos de péndulo para etapa de inversión y etapa
de estabilización sobre Péndulo rotatorio Quanser.
estable el péndulo invertido, lo cual se logra al emplear un
controlador de estabilización. El controlador de estabilización El péndulo rotatorio Quanser es una implementación
considera como condiciones iniciales a las condiciones finales comercial del sistema péndulo rotatorio invertido. En la Tabla I
del control de inversión. Debido a esto, el control del péndulo se presentan los resultados de inversión recopilados
rotatorio puede considerarse como un proceso de tipo batch. El exclusivamente sobre el sistema real y simulación del péndulo
control de inversión se caracteriza por poseer mayores Quanser. Entre los resultados presentados, el menor número de
requerimientos de potencia| en comparación al control de balanceos requeridos para invertir el péndulo fueron 2 para el
estabilización, por lo tanto, es deseable reducir al mínimo el sistema Quanser real y 4 sobre simulación [6].
tiempo empleado en la inversión [4], [5]. Existe una relación
entre la cantidad de balanceos requeridos para invertir el péndulo
y el tiempo empleado en este proceso. Dependiendo de las
constantes físicas del sistema, varios movimientos de balanceo
son necesarios antes de lograr una posición cercana a la posición

978-1-5386-3123-2/17/$31.00 ©2017 IEEE

Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
TABLA I. RESULTADOS P ÉNDULO ROTATORIO QUANSER

Tipo de sistema Balanceos


Tipo de control ador Referencia
controlado Inversión

Sistema Real PD 5 [5]

Simulación PD 5 [4]

Simulación Energía 5 [8]

Sistema Real Energía 13 [9]

Sistema Real Superficie deslizantes 2 [6]

Simulación Superficie deslizantes 4 [6]


Fig. 2. Descripción física de péndulo rotatorio invertido, base, brazo, péndulo
y variables para describir posición de brazo y péndulo
Sistema Real Difuso 5 [10]
El fabricante del péndulo rotatorio Quanser indica que el
máximo voltaje que puede ser aplicado debe cumplir con
En el presente trabajo se desarrolló un controlador de |𝑢| < 10[𝑉] . Una condición de riesgo es |𝑢| ≥ 15[𝑉] , pues
inversión en simulación para el péndulo rotatorio Quanser, con puede generarse un daño al motor. Las variables de salida
el fin de poner a prueba un controlador basado en reglas y corresponden a ángulo de péndulo α y de brazo θ. Para facilitar
comparar su desempeño con la literatura. El controlador debe
la notación se considera 𝜃 = 𝑥1 y 𝛼 = 𝑥 2 . Las ecuaciones del
lograr tres objetivos, invertir el péndulo, lograr esto con una
modelo se presentan a continuación:
cantidad mínima de balanceos y por último, reducir al mínimo el
voltaje máximo necesario para la posterior etapa de
estabilización. 𝑥̇ 1 𝑥 (1)
[ ] = [ 3]
𝑥̇ 2 𝑥4
Este trabajo se encuentra organizado de la siguiente manera.
En la sección II se describen los métodos y materiales utilizados . 𝑥̇ 3 𝑥 0
[ ] = 𝐴−1 (𝑥) {𝐵 (𝑥) [ 3 ] + [ ] − [𝑑 11 ] 𝑢} (2)
En la sección II.A se describe el modelo del sistema utilizado. En 𝑥̇ 4 𝑥4 𝑐21 0
la sección II.B se describe el controlador basado en reglas
𝑥1 (3)
propuesto. En la sección II.C. se describe la sintonización del 𝐵𝑦 = [𝑥 ]
controlador a partir de un algoritmo genético. En la sección III se 2
muestran los resultados obtenidos de la aplicación del Donde:
controlador. En la sección IV se realiza la discusión de los 𝑚𝑙 2 (1 − 𝑐(𝑥 2 ))
resultados y la obtención de conclusiones. 𝐽+ + 𝑚𝑟 2 −𝑚𝑙𝑟𝑐(𝑥 2 )
𝐴(𝑥) = 4 (4)
𝑚𝑙𝑟𝑐(𝑥 2 ) 𝑚𝑙 2
[ − 𝐽𝑝 + ]
II. M AT ERIALES Y MÉT ODOS 2 4

𝑚𝑙 2 𝑐(𝑥 2 )𝑠(𝑥 2 )𝑥 3 𝑚𝑙𝑟𝑠(𝑥 2 )𝑥 3


A. Modelo de péndulo rotatorio 𝐵𝑟 + +𝐾
𝐵 (𝑥) = 2 2 (5)
𝑚𝑙 2 𝑐(𝑥 2 )𝑠(𝑥 2 )𝑥4
El péndulo rotatorio es un sistema que posee dos grados de [ − 𝐵𝑝 ]
4
libertad, correspondientes a los planos perpendiculares capaces
de ser recorridos por el brazo y el péndulo del sistema. El péndulo 𝑚𝑔𝑙𝑠(𝑥2 )
de este sistema posee un punto de equilibrio estable, o posición (6)
𝑐21 = −
de reposo, que se logra cuando éste se encuentra suspendido 2
𝑛𝑔 𝑘𝑔 𝑛𝑚 𝑘𝑡 (7)
libremente. En este punto, el péndulo y brazo poseen un ángulo 𝑑 11 = −
y velocidad de valor cero. En la Fig. 2, α corresponde al ángulo 𝑅𝑚
del péndulo medido desde la posición invertida vertical. Por otra Donde
parte, θ corresponde al ángulo del brazo. El ángulo 0° o 0 [rad]
corresponde a la posición vertical invertida del péndulo. La 𝐾 = 𝑛𝑔 𝑘𝑔2 𝑛𝑚 𝑘𝑡 𝑘𝑚 𝑅𝑚
−1 (8)
posición estable de péndulo se encontrará en el ángulo ±180° o
±π[𝑟𝑎𝑑] debido a la fuerza que ejerce la gravedad. El modelo (9)
𝑥̇ = 𝑓(𝑥, 𝑢) utilizado para describir al péndulo rotatorio 𝑐 (𝑥 2 ) = cos(𝑥 2 )
invertido es obtenido a partir del método Euler-Lagrange [11].
La variable de entrada 𝑢, corresponde al voltaje aplicado al motor 𝑠( 𝑥 2 ) = sen(𝑥 2 ) (10)
del sistema. Este voltaje permite obtener torque y mover el brazo
directamente.

Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
Las constantes utilizadas por el modelo son proporcionadas
𝑢 = CBR(𝑥 2 , 𝑥 4 , 𝑉𝑚𝑎𝑥 ) (11)
por el fabricante (Ver Tabla II) [11].

TABLA II. CONSTANTES DEL MODELO DEL P ÉNDULO QUANSER

Constante Descripción Valor Unidad

m Masa del péndulo 0.127 Kg

r Largo del Brazo 0.26 m


p Largo del péndulo 0.337 m

J Momento de inercia del


r 9.98·10−4 Kg  m2
brazo

Jp Momento de inercia del


0.0012 Kg  m2
péndulo

ng Eficiencia de la caja de
1
engranaje de la base
Fig. 3. Plano perpendicular al movimiento del brazo, en el cual se observan 5
kg Constante proporcional 70 cuadrantes para el desarrollo del controlador.

nm Eficiencia del motor 0.8


Para diseñar la ley de control, el recorrido del péndulo se
kt Constante de torque 0.01 N m/ A dividió en 5 cuadrantes (Ver Fig. 3). El controlador propuesto
Oposición a la fuerza considera que mientras el péndulo se balancee, el voltaje aplicado
km 0.01 V  s / rad al sistema dependerá del cuadrante en el cual se encuentre el
electromotriz
péndulo y del signo de la velocidad de este. Cada uno de estos
Coeficiente de roce viscoso voltajes aplicados se conserva constante mientras el péndulo
br 0.0024 Nm /  rad / s 
del brazo
mantenga su posición dentro del mismo intervalo y no ocurra un
Coeficiente de roce viscoso cambio de sentido en el balanceo. Sobre el intervalo “𝑉” (Ver
bp 0.002 Nm /  rad / s 
del péndulo Fig. 3) no se aplicará señal de control de inversión, pues sobre
este intervalo actúa el controlador de estabilización. Por lo tanto
rm Resistencia de la caja del se obtienen ocho posibles combinaciones de voltajes entre los
1 
motor
intervalos I, II, III, IV, y ambos signos de velocidad de péndulo.
g Gravedad 9.81 m / s2

𝑉1 𝑠𝑖 𝑥 2 ∈ [ 𝐼] ∧ 𝑥 4 > 0
B. Controlador de Inversión 𝑉2 𝑠𝑖 𝑥 2 ∈ [ 𝐼] ∧ 𝑥 4 ≤ 0
𝑉3 𝑠𝑖 𝑥2 ∈ [ 𝐼𝐼] ∧ 𝑥 4 > 0
El problema estudiado considera como condición de partida 𝑉4 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝐼] ∧ 𝑥 4 ≤ 0
para el controlador de inversión, al péndulo en un estado muy 𝑉 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝐼𝐼] ∧ 𝑥 4 > 0 (12)
cercano al reposo. En 𝑡 = 0 se cumple que 𝑥 1 = 0, 𝑥 2 = ±𝜋 ± 𝐶𝐵𝑅 (𝑥, 𝑉) = 5
𝑉6 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝐼𝐼] ∧ 𝑥 4 ≤ 0
£, 𝑥 3 = 0, 𝑥 4 = 0 , donde £ es un coeficiente de error con 𝑉7 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝑉] ∧ 𝑥 4 > 0
respecto al reposo. En este trabajo £ fue definido con el valor
±0.01[𝑟𝑎𝑑]. El controlador de inversión operará siguiendo una 𝑉8 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝑉] ∧ 𝑥 4 ≤ 0
ley de control basada en reglas en , 𝑡 ∈ [ 0, 𝑡𝑓 ] donde 𝑡𝑓 es el 0 𝑠𝑖 𝑥2 ∈ [𝑉]
{ 0 𝑠𝑖 𝑥 2 = ±90°, ±180°
instante en el cual el péndulo ingresa al intervalo angular de
estabilización, el cual en este trabajo es definido como ±25°
respecto al punto invertido vertical, o el tiempo máximo de C. Sintonía del controlador de inversión
prueba, definido como 𝑡 = 5[𝑠].
La entrada al sistema 𝑢 corresponderá a la salida del El controlador de inversión posee 8 parámetros de diseño
controlador de inversión cuando el péndulo se encuentre en la correspondientes los valores de voltajes que deben ser aplicados
zona de inversión. El controlador de inversión propuesto al sistema según las reglas anteriormente definidas . Estos
𝐶𝐵𝑅(𝑥 2 , 𝑥 4 , 𝑉𝑚𝑎𝑥 ) se compone de un conjunto finito de reglas parámetros deben ser sintonizados buscando que el controlador
basadas en el intervalo angular en el cual se encuentre el péndulo, logre una inversión efectiva del péndulo, criterio que es
en el signo de la velocidad angular del péndulo y el esfuerzo representado mediante la función de evaluación 𝐹𝑖𝑡𝑛𝑒𝑠𝑠. Por lo
máximo de control 𝑉𝑚𝑎𝑥 . tanto se requiere encontrar una solución al siguiente problema de
optimización.

Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
𝐹𝑖𝑡𝑛𝑒𝑠𝑠 es definida por separado para cada uno de los casos
min 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 anteriormente descritos. En este trabajo se consideró que un buen
𝑠. 𝑎. 𝑥̇ = 𝑓 (𝑥, 𝑢) , 𝑡 ∈ [ 0, 𝑡𝑓 ] (13) desempeño de inversión es aquel que permite invertir el péndulo
𝑢 = 𝐶𝐵𝑅(𝑥, 𝑉), V ≤ V𝑚𝑎𝑥 en la menor cantidad de balanceos, obteniendo una condición
final que facilite la posterior operación del controlador de
Para sintonizar los parámetros de los controladores de estabilización. Para el caso a, la evaluación considera la cantidad
estabilización se utilizó un algoritmo genético especialmente de balanceos empleados en invertir el péndulo. La cantidad de
adaptado al problema. La codificación de los parámetros del balanceos w( x) queda definida como la cantidad de veces que el
controlador utilizó números reales. El vector de voltajes 𝑉 que péndulo alcanza la posición ±𝜋 para 𝑡 ∈ [ 0, 𝑡𝑓 ] . Para evaluar la
emplea el controlador 𝐶𝐵𝑅(𝑥, 𝑉) corresponde bajo este esquema dificultad o facilidad que plantea la condición final del
a un cromosoma. Cada uno de los 8 valores de voltaje es llamado controlador de inversión al controlador de estabilización, se
gen. evaluaron los máximos valores de esfuerzo de control requeridos
en el proceso de estabilización. Para utilizar esta medida de
1) Población Inicial: evaluación se relacionó la velocidad de ingreso del péndulo con
el voltaje máximo necesario para estabilizar el péndulo 𝑣.
La población total de individuos existentes para cada 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 = 𝑤(𝑥) + 𝑘𝑣
generación 𝑛 se definió como Γ(𝑛 ) . La cantidad máxima de 𝑠. 𝑎. 𝑥̇ = 𝑓 (𝑥, 𝑢) , 𝑡 ∈ [ 0, 𝑡𝑓 ] (16)
individuos 𝑗 por cada generación se definió como 50. Por lo tanto
en cada generación existirán 50 vectores 𝑉 con 8 valores de 𝑢 (𝑥, 𝑉) = 𝐶𝐵𝑅 (𝑥, 𝑉) , V ≤ V𝑚𝑎𝑥 
voltajes puestos a prueba.
En esta función 𝜅 corresponde a una constante de diseño que
propone una relación de compromiso entre la cantidad de
Γ(𝑛) = {𝑉(𝑗)}, 𝑗 = 1, … ,50 (14)
balanceos 𝑤 (x) con el voltaje máximo de estabilización. La
constante 𝜅 debe tomar un valor positivo. Para este trabajo se
La población inicial Γ(0) se poblará inicialmente con un utilizó el valor 𝜅 = 0.1 . Para el caso a) el valor 𝐹𝑖𝑡𝑛𝑒𝑠𝑠
conjunto aleatorio de valores de voltaje, limitados al máximo obtendrá valores en el intervalo [1.1, 49.9].
valor de esfuerzo de control, para cada uno de los elementos del
vector de voltajes. La función 𝑟𝑎𝑛𝑑 genera un valor aleatorio en Se propuse otra expresión que permita evaluar
el intervalo [0,1] adecuadamente las situaciones en las cuales el controlador no
logra invertir el péndulo en 𝑡 ∈ [0, 𝑡𝑓 ] (caso b). Para discriminar
(15) a las mejores soluciones se propone entregar un valor de
Γ (0) = {𝑉 (𝑗) = 𝑉𝑚𝑎𝑥 (2𝑟𝑎𝑛𝑑 − 1)}, 𝑗 = 1, … ,50
evaluación más alto a aquellos controladores que logren
acercarse más a la zona de estabilización. La expresión propuesta
2) Función de evaluación
para estos casos corresponde a:
La función 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 debe permitir obtener un valor de |max ( 𝑥1 ) − 𝜋|
evaluación para cada uno de los posibles resultados de la 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 = 𝜉 − max ( | )
min( 𝑥 1 ) + 𝜋| (17)
aplicación de controladores de inversión al modelo. Se
distinguen tres posibles resultados: 𝑠. 𝑎. 𝑥̇ = 𝑓 (𝑥, 𝑢) , 𝑡 ∈ [ 0, 𝑡𝑓 ]
𝑢 (𝑥, 𝑉) = 𝐶𝐵𝑅(𝑥, 𝑉)
a) El controlador permite invertir el péndulo, con una
condición final capaz de ser estabilizada por un controlador de
estabilización. Esta situación es evaluada con el valor de Se escogió 𝜉 = 50. Esta expresión garantiza que el rango de
evaluación más bajo. la función se encuentra en el intervalo [47.3, 50].

b) El controlador se acerca a la zona de estabilización sin Si el péndulo alcanza la zona de estabilización con una
lograr invertir el péndulo. Este caso representa un resultado peor velocidad en valor absoluto superior a |0.9𝑉𝑚𝑎𝑥 |, se considera
que el caso anterior, por lo tanto es evaluado con un valor que el péndulo no es estabilizable (caso c), penalizando su valor
𝐹𝑖𝑡𝑛𝑒𝑠𝑠 mayor. 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 con un valor dado por:

c) El controlador invierte el péndulo, con una condición final 𝐹 (𝑥, 𝑉) = 𝜉 (18)


imposible de ser estabilizada por el controlador de estabilización.
Esta condición corresponde al peor resultado de sintonización De esta manera se garantiza discriminar numéricamente cada
debido a que genera comportamientos que podrían causar daños uno de los casos posibles en las pruebas de inversión, entregando
al implementar estos parámetros sobre un controlador aplicado a mejores valores de evaluación en orden decreciente para los
un sistema real. Estos casos son penalizados con el valor de casos a, b y c.
evaluación más alto.
La función de evaluación requiere que se identifique a cuál
de los tres casos corresponde cada uno de los resultados de 𝐹𝑖𝑡𝑛𝑒𝑠𝑠𝑐𝑎𝑠𝑜 𝑎 < 𝐹𝑖𝑡𝑛𝑒𝑠 𝑠𝑐𝑎𝑠𝑜 𝑏 < 𝐹𝑖𝑡𝑛𝑒𝑠 𝑠𝑐𝑎𝑠𝑜 𝑐
(19)
pruebas de sintonización de controladores . La identificación del
caso se realiza una vez alcanzada la condición 𝑡 = 𝑡𝑓 . La función

Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
3) Cruzamiento y Mutación invirtió el péndulo en 2 balanceos obteniendo una velocidad final
capaz de ser estabilizada con 𝑉𝑚𝑎𝑥 ≤ |1|[𝑉].
Cada uno de los 50 individuos de la población Γ(𝑛 ) es
aplicado sobre el sistema y evaluado. A continuación los TABLA III. VOLTAJES DE CONTROLADOR Y RESULTADOS
individuos son ordenados a partir de su valor de evaluación en
orden descendente. Los individuos con mejor evaluación se Voltajes Vmax=2.5 Vmax=5 Vmax=9.99
encontrarán en la cima de la tabla de resultados. Se consideró un
elitismo del 20% el cual corresponde al porcentaje de soluciones V1 2.5 2.6 0.3
provenientes de la generación anterior que se conservan en el
V2 -1.5 -1.7 -6.9
conjunto de soluciones. El método de cruzamiento obtendrá dos
individuos descendientes a partir de una combinación lineal de V3 1.1 -5 6.7
las siguientes expresiones presentadas en la matriz [12]–[14].
V4 -2.2 -0.5 -9.99

𝑎 − |𝑎 − 𝑏|𝑘 V5 -0.1 3.4 -9.8


𝑎
𝑎 + |𝑎 + 𝑏|𝑘 V6 2.5 3.3 -9.7
(20)
𝑏 − |𝑎 − 𝑏|𝑘 
V7 -2.1 -4.6 -8.2
𝑏
(𝑏 + |𝑎 − 𝑏|𝑘 ) V8 -1.6 0.5 7.2

En esta matriz, 𝑎 y 𝑏 representan al conjunto completo de Fitness 5.1 2.1 1.1


cromosomas de dos progenitores con valor de evaluación
adyacente. El parámetro 𝑘 de diseño fue definido como 0.25. Si
los valores de los genes obtenidos durante el cruzamiento para Al disminuir el voltaje máximo de la etapa de inversión a
los nuevos individuos superan el límite impuesto por el máximo 𝑉𝑚𝑎𝑥 = |2.5|[𝑉], el valor de evaluación aumentó a 5.1, valor que
voltaje para la etapa de inversión, los valores de los genes serán indica que fue posible invertir el péndulo en un mínimo de 5
reemplazados por el valor límite más cercano. De esta manera se balanceos. Esta solución también alcanza una velocidad final
garantiza que los voltajes aplicados se encuentren en el capaz de ser estabilizada utilizando 𝑉𝑚𝑎𝑥 ≤ |1|[𝑉] durante la
intervalo [−𝑉𝑚𝑎𝑥 , 𝑉𝑚𝑎𝑥 ]. Se utilizó una mutación al azar en uno estabilización. Todos los resultados logran invertir el péndulo,
de los valores del cromosoma con una probabilidad de un 1%. El reducir la cantidad de balanceos necesarios y reducir el voltaje de
voltaje modificado por el operador de mutación corresponde a un estabilización a un valor mínimo. Todos los voltajes obtenidos
número aleatorio obtenido dentro de los límites máximos de son menores o iguales al valor 𝑉𝑚𝑎𝑥 correspondiente a cada caso.
voltaje. No parece haber relación entre los valores de voltaje encontrados.
El algoritmo diseñado se aplicó iterativamente durante 10 En la Fig. 4 se observan los resultados de aplicar el
generaciones. El individuo con menor valor de la función controlador sintonizado para cada caso de
𝐹𝑖𝑡𝑛𝑒𝑠𝑠 en Γ (10) corresponde al vector 𝑉 de voltajes que define 𝑉𝑚𝑎𝑥 = [ 9.99 5 2.5 ] [𝑉]. En la Fig.4.a se observa la posición
al controlador óptimo. del brazo con respecto al tiempo t medido en segundos . El ángulo
de brazo para cada uno de los casos alcanza un ángulo menor a
Debido a que las aceleraciones capaces de ser logradas por el
un giro completo medido desde la posición de partida. En la
péndulo dependen de la magnitud del voltaje aplicado al sistema,
Fig.4.b se observa la posición angular del péndulo con respecto
se realizaron pruebas considerando tres valores de voltaje
al tiempo. Para la prueba 𝑉𝑚𝑎𝑥 = |9.99|[𝑉] se logró invertir el
máximo diferentes, correspondientes a:
péndulo con 1 balanceo en un tiempo de 0.42[s]. Para
(21) 𝑉𝑚𝑎𝑥 = |5|[𝑉] se requieren 2 balanceos completados en 1.02 [s].
𝑉𝑚𝑎𝑥 = [ 9.99 5 2.5 ] [𝑉] Para 𝑉𝑚𝑎𝑥 = |2.5|[𝑉] se requieren 5 balanceos logrados en
2.5[𝑠]. En la Fig.4.c) se observa la velocidad alcanzada por el
III. RESULT ADOS péndulo en la etapa de inversión, la cual en todos los casos
corresponde a valores capaces de ser estabilizados con
A continuación se presentan los resultados comparados de la 𝑉𝑚𝑎𝑥 ≤ |1|[𝑉]. En la Fig.4.d se observan los voltajes aplicados
aplicación del controlador de inversión para distintos casos de al sistema, los cuales se encuentran dentro de los límites
valor del esfuerzo de control máximo.
establecidos para cada una de las pruebas . De la Fig. 4 se puede
En la Tabla III se indican los valores de voltajes 𝑉 del observar que la correcta aplicación de los voltajes de control
individuo con mejor valor de evaluación en la función 𝐹𝑖𝑡𝑛𝑒𝑠𝑠. permite disminuir la cantidad de balanceos y el tiempo empleado
Para el caso 𝑉𝑚𝑎𝑥 = |9.99|[𝑉] se obtuvo un vector 𝑉 con valor en invertir el péndulo a medida que aumenta el voltaje máximo
𝐹𝑖𝑡𝑛𝑒𝑠𝑠 = 1.1, que indica que fue posible invertir el péndulo de la prueba.
utilizando 1 balanceo, requiriendo un voltaje de estabilización
menor a 1 [𝑉]. Al reducir el esfuerzo de control a 𝑉𝑚𝑎𝑥 = |5|[𝑉]
se obtuvo un valor de evaluación de 2.1 lo que muestra que se

Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
REFERENCIAS

[1] O. Boubaker, “T he inverted Pendulum : A fundamentalBenchmark in


Control Theory and Robotics.”
[2] N. Methew, K. Rao, and N. Sivakumaran, “ Swing Up and
Stabilization Control of a Rotary Inverted Pendulum,” in 10th IFAC
International Symposium on Dynamics and Control of Process
Systems, 2013, pp. 654–659.
[3] O. Boubaker, “T he inverted pendulum: A fundamental benchmark in
control theory and robotics,” 2012 Int. Conf. Educ.e-Learning Innov.
ICEELI 2012, 2012.
[4] P. M. Mary and N. S. Marimuthu, “Minimum T ime Swing Up and
Stabilization of Rotary Inverted Pendulum Using PulseStep Control,”
vol. 6, no. 3, pp. 1–15, 2009.
[5] Z. W. Z. Wang, Y. C. Y. Chen, and N. F. N. Fang, “ Minimum -time
swing-up of a rotary inverted pendulum by iterative impulsive
control,” Proc. 2004 Am. Control Conf., vol. 2,pp.1335–1340,2004.
[6] S. Kurode, A. Chalanga, and B. Bandyopadhyay, “ Swing-Up and
Stabilization of Rotary Inverted Pendulum using Sliding Modes,” in
18th World Congres, 2011, pp. 10685–10690.
[7] V. Sirisha and A. S. Junghare, “A Comparative study of controllers
for stabilizing a Rotary Inverted Pendulum,” vol. 3, no. 1, pp.1–13,
2014.
[8] S. T anaka, X. Xin, and T . Yamasaki, “New Results of Energy -Based
Swing-up Control for a Rotational Pendulum,” SICE J.Control.Meas.
Syst. Integr., vol. 4, no. 6, pp. 394–400, 2011.
[9] A. Al-jodah and H. Zargarzadeh, “Experimental Verification and
Comparison of Different Stabilizing Controllers for aRotary Inverted
Pendulum,” pp. 417–423, 2013.
[10] M. F. Hamza, H. J. Yap, and I. A. Choudhury, “Genetic Algorithm
and Particle Swarm Optimization Based Cascade Interval T ype 2
Fuzzy PD Controller for Rotary Inverted Pendulum System,” Math.
Probl. Eng., vol. 2015, 2015.
[11] Quanser Inc., Workbook: Rotary Pendulum, InstructorVersion.2011.
[12] R. A. Rahman and R. Ramli, “Average Concept of Crossover Operator
in Real Coded Genetic Algorithm,” Int. Proc. Econ. Dev. Res., vol.
Fig. 4. Respuesta en el tiempo para inversión de péndulo. a) ángulo de brazo, 63, pp. 73–77, 2013.
b) ángulo de péndulo, c) velocidad de péndulo, d) voltaje aplicado al [13] F. Herrera, M. Lozano, and A. M. Sa, “A T axonomy for theCrossover
sistema. Operator for Real-Coded Genetic Algorithms : An Experimental
Study,” Int. J. Intell. Syst., vol. 18, no. 3, pp. 309–338, 2003.
IV. DISCUSIÓN Y CONCLUSIONES [14] N. P. Belfiore and A. Esposito, “T heoretical and ExperimentalStudy
of Crossover Operators of Genetic Algorithms,” vol. 99, no. 2, pp.
271–302, 1998.
Con respecto al resultado de la optimización de los
parámetros de controladores de inversión, los resultados
obtenidos muestran que fue posible invertir el péndulo rotatorio
bajo simulación con una mínima cantidad de balanceos y con una
condición final que facilita la etapa de estabilización posterior. El
controlador de inversión obtuvo mejores resultados que los
encontrados en la literatura, en términos de reducción de
balanceos requeridos y voltaje máximo de estabilización
requerido. Sobre simulación del sistema fue posible mejorar los
resultados presentados por Kurode en el cual la inversión
requiere de 4 balanceos completados en alrededor de 2[s]. El
trabajo desarrollado permitió avanzar en la tarea de controlar y
evaluar controladores de inversión aplicados sobre el sistema
péndulo rotatorio invertido. Entre las posibles aplicaciones de
esta técnica de control se encuentra el control de otros sistemas
subactuados sobre los cuales un controlador basado en reglas
permitiría por su simplicidad lograr el control a partir de un
conocimiento básico sobre la dinámica de funcionamiento del
sistema. Se plantea como trabajo futuro, el estudio de las causas
de los inferiores desempeños de los controladores PD, por modos
deslizante y basados en energía de los trabajos relacionados. Se
plantea también la tarea de aplicar este controlador sobre un
péndulo rotatorio real y su comparación con resultados
experimentales obtenidos a partir de otras técnicas de control.

Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.

También podría gustarte