Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Abstract—This work presents the results of a swing-up controller invertida. La acción del controlador de inversión finaliza s i se
applied to a Quanser rotary inverted pendulum simulated in cumple que el péndulo alcanza la zona de estabilización la cual
Matlab. The objectives were to invert the pendulum in minimum ha sido definida en algunos trabajos como el intervalo angular
time and to obtain a final position and velocity that could be dado por ±30° , ±25° , o ±20°, medidos desde el punto inestable
stabilized in the inverted position. The controller's parameters vertical [6], [7]. No obstante, no existe un criterio uniforme en
were tuned using a genetic algorithm specially designed for this cuanto a la velocidad que debe poseer el péndulo para considerar
task. During the simulation tests, the pendulum was inverted with que se inicia la etapa de estabilización. Conseguir el control de la
just one swing, completed in 0.42[s], and stabilized with a voltage inversión del péndulo a partir de movimientos de balanceo es
smaller than |1|[V]. These results show a smoother inversion complejo ya que requiere que el péndulo alcance en el menor
completed in less time than the results obtained in related works. tiempo posible y con una baja velocidad final la vecindad de la
posición invertida. Por lo tanto dependiendo de la posición del
Keywords— S wing-up Controller, Non-linear S ystems, Rotary
péndulo, los controladores buscarán balancear el péndulo u
Inverted Pendulum, Genetic Algorithm.
estabilizarlo.
I. INT RODUCCIÓN
Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
TABLA I. RESULTADOS P ÉNDULO ROTATORIO QUANSER
Simulación PD 5 [4]
Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
Las constantes utilizadas por el modelo son proporcionadas
𝑢 = CBR(𝑥 2 , 𝑥 4 , 𝑉𝑚𝑎𝑥 ) (11)
por el fabricante (Ver Tabla II) [11].
ng Eficiencia de la caja de
1
engranaje de la base
Fig. 3. Plano perpendicular al movimiento del brazo, en el cual se observan 5
kg Constante proporcional 70 cuadrantes para el desarrollo del controlador.
𝑉1 𝑠𝑖 𝑥 2 ∈ [ 𝐼] ∧ 𝑥 4 > 0
B. Controlador de Inversión 𝑉2 𝑠𝑖 𝑥 2 ∈ [ 𝐼] ∧ 𝑥 4 ≤ 0
𝑉3 𝑠𝑖 𝑥2 ∈ [ 𝐼𝐼] ∧ 𝑥 4 > 0
El problema estudiado considera como condición de partida 𝑉4 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝐼] ∧ 𝑥 4 ≤ 0
para el controlador de inversión, al péndulo en un estado muy 𝑉 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝐼𝐼] ∧ 𝑥 4 > 0 (12)
cercano al reposo. En 𝑡 = 0 se cumple que 𝑥 1 = 0, 𝑥 2 = ±𝜋 ± 𝐶𝐵𝑅 (𝑥, 𝑉) = 5
𝑉6 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝐼𝐼] ∧ 𝑥 4 ≤ 0
£, 𝑥 3 = 0, 𝑥 4 = 0 , donde £ es un coeficiente de error con 𝑉7 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝑉] ∧ 𝑥 4 > 0
respecto al reposo. En este trabajo £ fue definido con el valor
±0.01[𝑟𝑎𝑑]. El controlador de inversión operará siguiendo una 𝑉8 𝑠𝑖 𝑥 2 ∈ [ 𝐼𝑉] ∧ 𝑥 4 ≤ 0
ley de control basada en reglas en , 𝑡 ∈ [ 0, 𝑡𝑓 ] donde 𝑡𝑓 es el 0 𝑠𝑖 𝑥2 ∈ [𝑉]
{ 0 𝑠𝑖 𝑥 2 = ±90°, ±180°
instante en el cual el péndulo ingresa al intervalo angular de
estabilización, el cual en este trabajo es definido como ±25°
respecto al punto invertido vertical, o el tiempo máximo de C. Sintonía del controlador de inversión
prueba, definido como 𝑡 = 5[𝑠].
La entrada al sistema 𝑢 corresponderá a la salida del El controlador de inversión posee 8 parámetros de diseño
controlador de inversión cuando el péndulo se encuentre en la correspondientes los valores de voltajes que deben ser aplicados
zona de inversión. El controlador de inversión propuesto al sistema según las reglas anteriormente definidas . Estos
𝐶𝐵𝑅(𝑥 2 , 𝑥 4 , 𝑉𝑚𝑎𝑥 ) se compone de un conjunto finito de reglas parámetros deben ser sintonizados buscando que el controlador
basadas en el intervalo angular en el cual se encuentre el péndulo, logre una inversión efectiva del péndulo, criterio que es
en el signo de la velocidad angular del péndulo y el esfuerzo representado mediante la función de evaluación 𝐹𝑖𝑡𝑛𝑒𝑠𝑠. Por lo
máximo de control 𝑉𝑚𝑎𝑥 . tanto se requiere encontrar una solución al siguiente problema de
optimización.
Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
𝐹𝑖𝑡𝑛𝑒𝑠𝑠 es definida por separado para cada uno de los casos
min 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 anteriormente descritos. En este trabajo se consideró que un buen
𝑠. 𝑎. 𝑥̇ = 𝑓 (𝑥, 𝑢) , 𝑡 ∈ [ 0, 𝑡𝑓 ] (13) desempeño de inversión es aquel que permite invertir el péndulo
𝑢 = 𝐶𝐵𝑅(𝑥, 𝑉), V ≤ V𝑚𝑎𝑥 en la menor cantidad de balanceos, obteniendo una condición
final que facilite la posterior operación del controlador de
Para sintonizar los parámetros de los controladores de estabilización. Para el caso a, la evaluación considera la cantidad
estabilización se utilizó un algoritmo genético especialmente de balanceos empleados en invertir el péndulo. La cantidad de
adaptado al problema. La codificación de los parámetros del balanceos w( x) queda definida como la cantidad de veces que el
controlador utilizó números reales. El vector de voltajes 𝑉 que péndulo alcanza la posición ±𝜋 para 𝑡 ∈ [ 0, 𝑡𝑓 ] . Para evaluar la
emplea el controlador 𝐶𝐵𝑅(𝑥, 𝑉) corresponde bajo este esquema dificultad o facilidad que plantea la condición final del
a un cromosoma. Cada uno de los 8 valores de voltaje es llamado controlador de inversión al controlador de estabilización, se
gen. evaluaron los máximos valores de esfuerzo de control requeridos
en el proceso de estabilización. Para utilizar esta medida de
1) Población Inicial: evaluación se relacionó la velocidad de ingreso del péndulo con
el voltaje máximo necesario para estabilizar el péndulo 𝑣.
La población total de individuos existentes para cada 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 = 𝑤(𝑥) + 𝑘𝑣
generación 𝑛 se definió como Γ(𝑛 ) . La cantidad máxima de 𝑠. 𝑎. 𝑥̇ = 𝑓 (𝑥, 𝑢) , 𝑡 ∈ [ 0, 𝑡𝑓 ] (16)
individuos 𝑗 por cada generación se definió como 50. Por lo tanto
en cada generación existirán 50 vectores 𝑉 con 8 valores de 𝑢 (𝑥, 𝑉) = 𝐶𝐵𝑅 (𝑥, 𝑉) , V ≤ V𝑚𝑎𝑥
voltajes puestos a prueba.
En esta función 𝜅 corresponde a una constante de diseño que
propone una relación de compromiso entre la cantidad de
Γ(𝑛) = {𝑉(𝑗)}, 𝑗 = 1, … ,50 (14)
balanceos 𝑤 (x) con el voltaje máximo de estabilización. La
constante 𝜅 debe tomar un valor positivo. Para este trabajo se
La población inicial Γ(0) se poblará inicialmente con un utilizó el valor 𝜅 = 0.1 . Para el caso a) el valor 𝐹𝑖𝑡𝑛𝑒𝑠𝑠
conjunto aleatorio de valores de voltaje, limitados al máximo obtendrá valores en el intervalo [1.1, 49.9].
valor de esfuerzo de control, para cada uno de los elementos del
vector de voltajes. La función 𝑟𝑎𝑛𝑑 genera un valor aleatorio en Se propuse otra expresión que permita evaluar
el intervalo [0,1] adecuadamente las situaciones en las cuales el controlador no
logra invertir el péndulo en 𝑡 ∈ [0, 𝑡𝑓 ] (caso b). Para discriminar
(15) a las mejores soluciones se propone entregar un valor de
Γ (0) = {𝑉 (𝑗) = 𝑉𝑚𝑎𝑥 (2𝑟𝑎𝑛𝑑 − 1)}, 𝑗 = 1, … ,50
evaluación más alto a aquellos controladores que logren
acercarse más a la zona de estabilización. La expresión propuesta
2) Función de evaluación
para estos casos corresponde a:
La función 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 debe permitir obtener un valor de |max ( 𝑥1 ) − 𝜋|
evaluación para cada uno de los posibles resultados de la 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 = 𝜉 − max ( | )
min( 𝑥 1 ) + 𝜋| (17)
aplicación de controladores de inversión al modelo. Se
distinguen tres posibles resultados: 𝑠. 𝑎. 𝑥̇ = 𝑓 (𝑥, 𝑢) , 𝑡 ∈ [ 0, 𝑡𝑓 ]
𝑢 (𝑥, 𝑉) = 𝐶𝐵𝑅(𝑥, 𝑉)
a) El controlador permite invertir el péndulo, con una
condición final capaz de ser estabilizada por un controlador de
estabilización. Esta situación es evaluada con el valor de Se escogió 𝜉 = 50. Esta expresión garantiza que el rango de
evaluación más bajo. la función se encuentra en el intervalo [47.3, 50].
b) El controlador se acerca a la zona de estabilización sin Si el péndulo alcanza la zona de estabilización con una
lograr invertir el péndulo. Este caso representa un resultado peor velocidad en valor absoluto superior a |0.9𝑉𝑚𝑎𝑥 |, se considera
que el caso anterior, por lo tanto es evaluado con un valor que el péndulo no es estabilizable (caso c), penalizando su valor
𝐹𝑖𝑡𝑛𝑒𝑠𝑠 mayor. 𝐹𝑖𝑡𝑛𝑒𝑠𝑠 con un valor dado por:
Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
3) Cruzamiento y Mutación invirtió el péndulo en 2 balanceos obteniendo una velocidad final
capaz de ser estabilizada con 𝑉𝑚𝑎𝑥 ≤ |1|[𝑉].
Cada uno de los 50 individuos de la población Γ(𝑛 ) es
aplicado sobre el sistema y evaluado. A continuación los TABLA III. VOLTAJES DE CONTROLADOR Y RESULTADOS
individuos son ordenados a partir de su valor de evaluación en
orden descendente. Los individuos con mejor evaluación se Voltajes Vmax=2.5 Vmax=5 Vmax=9.99
encontrarán en la cima de la tabla de resultados. Se consideró un
elitismo del 20% el cual corresponde al porcentaje de soluciones V1 2.5 2.6 0.3
provenientes de la generación anterior que se conservan en el
V2 -1.5 -1.7 -6.9
conjunto de soluciones. El método de cruzamiento obtendrá dos
individuos descendientes a partir de una combinación lineal de V3 1.1 -5 6.7
las siguientes expresiones presentadas en la matriz [12]–[14].
V4 -2.2 -0.5 -9.99
Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.
REFERENCIAS
Authorized licensed use limited to: Universidad Nacional Autonoma De Mexico (UNAM). Downloaded on March 22,2023 at 01:20:39 UTC from IEEE Xplore. Restrictions apply.