Control Difuso Del Péndulo Invertido Con Rueda de Reacción Usando Seguimiento de Trayectoria

TecnoLógicas
ISSN-e 2256-5337
Vol. 20, No. 39
Mayo - agosto de 2017
Control difuso del péndulo invertido

con rueda de reacción usando
seguimiento de trayectoria
Fuzzy control of an inverted pendulum

Driven by a reaction wheel using a trajectory
tracking scheme
Víctor Daniel Correa-Ramírez1, Didier Giraldo-

Buitrago2 y Andrés Escobar-Mejía3
Recibido: 18 de agosto de 2016,

Aceptado: 15 de marzo de 2017
Cómo citar / How to cite

V .D. Correa-Ramírez, D. Giraldo-Buitrago y A. Escobar-Mejía, “Control
difuso del péndulo invertido con rueda de reacción usando seguimiento
de trayectoria”, TecnoLógicas, vol. 20, no. 39, mayo – agosto, 2017.
1 MSc en Ingeniería Eléctrica, Facultad de Ingenierías Eléctrica,

Electrónica, Física y Ciencias de la Computación, Programa de
Ingeniería Eléctrica, Universidad Tecnológica de Pereira, Pereira-
Colombia, victordc@utp.edu.co
© Copyright 2015 por
autores y Tecno Lógicas
2 MSc en Ingeniería Eléctrica, Facultad de Ingenierías Eléctrica,
Este trabajo está licenciado bajo una Electrónica, Física y Ciencias de la Computación, Programa de
Licencia Internacional Creative Ingeniería Eléctrica, Universidad Tecnológica de Pereira, Pereira-
Commons Atribución (CC BY) Colombia, dgiraldo@utp.edu.co
3 PhD en Ingeniería Eléctrica, Facultad de Ingenierías Eléctrica,
Electrónica, Física y Ciencias de la Computación, Programa de
Ingeniería Eléctrica, Universidad Tecnológica de Pereira, Pereira-
Colombia, andreses1@utp.edu.co
Control difuso del péndulo invertido con rueda de reacción usando seguimiento de trayectoria
Resumen
En este trabajo se presenta el diseño de un controlador difuso Takagi-Sugeno (T-S),
con un esquema de seguimiento de trayectoria para el sistema conocido como péndulo con
rueda de reacción. A partir del modelo de estados no lineal, se definen los puntos de
operación donde el sistema funcionará y se aplica la técnica de linealización por no
linealidad sectorial con el fin de implementar reguladores lineales locales. Con los
modelos linealizados reducidos y con base en las características dinámicas deseadas de
lazo cerrado, se diseñan los reguladores locales que, al ser combinados, usando las
funciones de pertenencia del modelo difuso, generan la señal de control global que
contiene dos términos: el regulador y el seguimiento simple de la referencia.
El controlador difuso propuesto logra llevar el péndulo desde su posición de equilibrio
natural a la posición invertida de forma gradual, con oscilaciones de amplitud creciente y
con mínimo error de seguimiento. Cuando el péndulo alcanza la posición deseada
invertida, se usa un regulador sobre el modelo linealizado completo alrededor del punto
de operación. Los resultados de simulación muestran el seguimiento de la trayectoria
angular (del péndulo) y el desempeño del controlador ante pequeñas perturbaciones. La
señal de control y la velocidad angular de la rueda son presentadas con el fin de verificar
que se mantienen dentro de los límites de operación establecidos. Si bien se presenta
saturación en la señal de control, se obtiene un error de seguimiento menor a 0,22
radianes.
Palabras clave
Péndulo con rueda de reacción, no-linealidad sectorial, control difuso Takagi-
Sugeno, compensación distribuida paralela, seguimiento de trayectoria.
Abstract
In this work, the design of a Takagi-Sugeno Fuzzy controller with a trajectory-
tracking scheme for the reaction wheel pendulum is presented. By using the nonlinear
state-space model, the system’s operating points are defined, then, the sector
nonlinearity method is applied to obtain a linearized model of the system in order to
implement linear local regulators. Once the reduced linearized models are obtained, and
based on the desired closed loop response, local regulators are designed to generate the
global control signal. This signal comprises two terms: The regulator and the reference
tracking term.
The proposed Fuzzy controller allows the pendulum to reach the upright position
from its natural state by swinging it up with minimum tracking error. Once the upright
position is reached, a regulator is implemented to operate over the linearized model
around the operating point (i.e., upright position). Simulation results present both, the
tracking of the angular trajectory and the controller behavior during small
perturbations. It is shown that the control signal and the wheel speed remain within
their boundaries. Although the control signal saturates, a tracking error less than 0.22
radians is observed.
Keywords
Reaction wheel pendulum, sector nonlinearity, Takagi-Sugeno fuzzy control,
parallel distributed compensation, trajectory tracking.
TecnoLógicas, ISSN-e 2256-5337, Vol. 20, No. 39, mayo - agosto de 2017
1. INTRODUCCIÓN Debido a la naturaleza altamente no li-

neal de estos sistemas, las estrategias de
Los sistemas mecánicos tipo péndulo control lineal convencionales solo son efec-
invertido son ampliamente empleados tivas cuando el sistema empieza a operar
como prototipos de prueba para validar la alrededor de valores cercanos a su punto
funcionalidad de diversas estrategias de de operación y cuando solo suceden peque-
control lineales y no lineales. Entre sus ñas perturbaciones alrededor de los puntos
diferentes variantes se encuentran el mode equilibrio. Al ser sistemas subactuados
delo clásico de péndulo sobre un carro con (i.e., el número de entradas de control es
desplazamiento lineal, el péndulo con base inferior a sus grados de libertad), no es
rotacional de Furuta, modelos con dos y posible mantener la barra (o barras) en
tres barras, Pendubot, Acrobot, etc. [1]. posiciones diferentes a la vertical, lo que
Aplicaciones prácticas como los robots implica que los ángulos solo pueden ser
caminantes, los cohetes y el dispositivo de llevados a los valores de equilibrio estable
transporte personal Segway, entre otros, o inestable en estado estacionario. La tarea
tienen dinámicas similares a la del péndulo de llevar automáticamente un péndulo
invertido. Algunos trabajos, como [1] y [2], desde su posición de equilibrio natural
han propuesto un tratamiento integrado de (θ1 = ±𝜋) a la posición invertida (θ1 =
dichos sistemas. 0, ± 2𝜋 …), implica el uso de técnicas no
El péndulo con rueda de reacción consta lineales, debido a que las variables del
de una barra que puede girar libremente sistema toman valores en rangos amplios y
alrededor del punto de apoyo (pivote) en no alrededor de un punto de operación. En
uno de sus extremos, como se muestra en la mayoría de implementaciones, las limi-
la Fig. 1. El motor acoplado al extremo taciones prácticas (valores límite de la
opuesto del pivote actúa sobre una rueda señal de control, torque máximo del motor,
de inercia con la cual se controlan las osci- etc.) hacen que no sea posible llevar el
laciones de la barra, debido al torque de péndulo desde su posición de equilibrio
reacción. El ángulo θ1 del péndulo (respec- natural a la posición invertida de forma
to a la vertical) y el ángulo ϕ entre el pén- directa, a menos que se haga manualmen-
dulo y la rueda se miden con sensores ubi- te. Entre las estrategias más usadas para
cados en ambos ejes de giro. La rueda de lograr una subida gradual con oscilaciones
inercia forma con la vertical un ángulo de amplitud creciente, se encuentran el
(absoluto) θ2 que se obtiene como θ2 = ϕ + seguimiento de trayectoria [3], [4] (donde
θ1 . El torque 𝜏 se obtiene de la acción di- los autores implementan la técnica de li-
recta del motor sobre la rueda. nealización parcial por realimentación) y la
regulación de energía, como en [5]. En
contraste, en el presente trabajo se propo-
ne un método alterno de linealización, la
no linealidad sectorial, y se usa un modelo
difuso tipo T-S para combinar los diferen-
tes reguladores lineales que permiten al-
canzar la posición invertida de manera
gradual. El control difuso para el péndulo
invertido ha sido ampliamente implemen-
tado con resultados satisfactorios, tanto
simulados como prácticos, recientemente,
para el péndulo con rueda de reacción se
Fig. 1. Representación esquemática del péndulo con rueda
pueden mencionar trabajos como [6], en el
de reacción. Fuente: [3] que los autores implementan un controla-
dor difuso local con base en el error y la péndulo, con esto se evita el uso de vecto-
derivada del error en el ángulo del péndulo res necesario cuando se aplica la mecánica
(desviación de la posición cero), la señal de newtoniana. Las ecuaciones dinámicas que
control se define con base en una memoria se obtienen según lo desarrollado en [3]
asociativa difusa. En [7] se consideran son:
varios modelos del sistema y dentro de las
estrategias de control local implementadas 𝜃̈1 = 𝑎 sen 𝜃1 − 𝑏𝑢 (1)
los autores muestran resultados experi-
mentales y de simulación de un controla- 𝜃̈2 = 𝑐𝑢 (2)
dor difuso. Se puede resaltar del actual
trabajo la idea de seguir una trayectoria en En donde las constantes a, b y c, de-
todo el rango de operación, con lo que el penden de los parámetros físicos del siste-
control no es local. Un análisis histórico y ma, tales como las masas, inercias, longi-
del estado del arte para el control del pén- tudes, parámetros del motor, etc. La señal
dulo de Furuta y otros modelos, incluyendo de control u se establece como un valor
el péndulo con rueda de reacción se puede proporcional a la corriente aplicada al
observar en [8]. motor. No se incluye la fricción en los ejes
En este artículo se presentan el modelo de rotación, ya que normalmente es muy
de la planta y la estrategia de control difu- baja y puede despreciarse para simplificar
so implementada en la sección 2 (Metodo- el modelo. La rueda de inercia es simétrica
logía). Posteriormente en la sección 3 se con respecto a su eje y por tanto el valor
muestran y analizan los resultados obteni- del ángulo θ2 no tiene efecto sobre la di-
dos, finalmente se establecen las conclu- námica del sistema o sus condiciones de
siones con base en dichos resultados en la equilibrio. Este hecho permite proponer un
sección 4. modelo de estados de orden tres con las
variables x1 = θ1 (ángulo del péndulo),
𝑥 2 = 𝜃1̇ (velocidad angular del péndulo) y
2. METODOLOGÍA x3 = θ̇2 (velocidad angular de la rueda). Al
derivar estas variables y usando (1) y (2) se
El esquema de control que se propone obtiene el modelo no lineal de estados para
se basa en el modelo no lineal del sistema, el péndulo con rueda de reacción:
del cual se obtienen linealizaciones alrede-
dor de distintos puntos de operación con el 𝑥̇ 1 = 𝑥2 (3)
enfoque de no linealidad sectorial (sector 𝑥̇ 2 = 𝑎 sen 𝑥1 − 𝑏𝑢 (4)
nonlinearity) propuesto en [9]. El objetivo
𝑥̇ 3 = 𝑐𝑢 (5)
de generar modelos de estado lineales loca-
les es aprovechar la relativa facilidad con
que se diseñan reguladores de la forma 𝑢 = Se observa además que (3) y (4) están
−𝐾𝑥 [10], [11], siendo 𝐾 un vector fila de desacopladas de (5) con respecto a las va-
ganancias. Estos reguladores tienen tam- riables de estado, este hecho se usa poste-
bién una validez local, pero su combinación riormente para diseñar reguladores redu-
difusa resulta en un controlador para todo cidos. La representación vectorial del ante-
el rango de operación establecido. rior modelo se escribe de la forma:
2.1 Modelo del sistema 𝑥̇ = 𝑓 (𝑥) + 𝛽𝑢 (6)
En la literatura analizada, los autores Cuando un sistema admite este tipo de

usan la mecánica de Lagrange para obte- modelo se dice que es lineal en el control o
ner modelos de los diferentes sistemas tipo “afín” [12], [13]. En (6), x es el vector de
estados, 𝑓(𝑥) es una función no lineal de x las no linealidades con respecto a x y u

(debido al término 𝑠𝑒𝑛 𝑥1) y 𝛽 un vector evaluadas en el punto de operación.
constante. Entonces: En este trabajo se usa el enfoque alter-
nativo propuesto en [9], en el cual el hiper-
𝑥1 𝑥2 0 plano usado pasa por el punto de operación
𝑥 = [𝑥2 ] ; 𝑓 (𝑥) = [𝑎 sen 𝑥1] ; 𝛽 = [−𝑏 ] (7)
𝑥3 0 𝑐 deseado y por el origen, con base en el
sector que ocupan las no linealidades del
De manera intuitiva se puede estable- modelo. Como ilustración, considere la
cer que los puntos de equilibrio del péndulo función 𝑧 (𝑥1 ) = 𝑠𝑒𝑛 𝑥1 en 0 ≤ 𝑥1 ≤ 𝜋/2.
son su posición natural abajo ( θ1 = ± 𝜋) y Tomando las rectas 𝐿1 (𝑥1 ) = 𝑥1 (que es
su posición invertida (𝜃1 = 0, ± 2𝜋 ) siendo tangente a 𝑧 (𝑥1 ) en el origen), y 𝐿2 (𝑥1 ) =
la primera estable y la segunda inestable 2𝑥1 /𝜋 (que pasa por el origen y el punto (
respectivamente. El procedimiento para 𝜋/2, 1)), se puede comprobar, como lo ilus-
obtener estos puntos consiste en resolver tra la Fig. 2, que en el intervalo establecido
(como se expone en [13]): se cumple la desigualdad:
𝐿2 (𝑥1) ≤ 𝑧(𝑥1 ) ≤ 𝐿1 (𝑥1) (11)
𝑓 (𝑥) = 0 (8)
Para obtener una aproximación difusa
ya que con una señal de entrada nula de 𝑧(𝑥1 ) con las rectas L1 y L2, se definen
(𝑢 = 0), esta condición será, según (6), las etiquetas “x1 es cercano a cero” y “x1 es
equivalente a 𝑥̇ = 0 , lo que implica que los cercano a 𝜋/2 ” con funciones de pertenen-
estados tendrán un valor fijo. Las solucio- cia 𝜇1 (𝑥1 ) y 𝜇 2 (𝑥1 ) respectivamente, las
nes de (8) para la función 𝑓 (𝑥) de (7) son cuales deben cumplir las condiciones que
las dadas en (9): se establecen en:
𝑥2 = 0 𝜋
{ (9) 𝜇 1(0) = 1, 𝜇 1 ( ) = 0
𝑥1 = 𝑘𝜋, 𝑘 ∈ ℤ 2
𝜋
𝜇 2(0) = 0, 𝜇2 ( ) = 1 (12)
2
Con estos resultados y revisando la Fig. 𝜋
𝜇 ( 𝑥 ) + 𝜇 ( 𝑥 ) = 1, 0 ≤ 𝑥1 ≤
1, se concluye que los puntos de equilibrio { 1 1 2 1
2
del péndulo son exactamente las dos posi-
ciones verticales (natural e invertida). Estas funciones pueden definirse de di-
versas formas, por simplicidad se usaron
2.2 Método de linealización y modelo difuso rectas y sus ecuaciones se obtienen de (12),
las cuales se presentan en (13), con un
La linealización clásica usando el poli- rango de validez 0 ≤ 𝑥1 ≤ 𝜋/2 .
nomio de Taylor de primer orden (hiper- 2 2
plano tangente) [10], genera modelos váli- 𝜇 1(𝑥1) = 1 − 𝑥 , 𝜇2(𝑥1) = 𝑥 (13)
𝜋 1 𝜋 1
dos alrededor de un punto de operación con
expresiones como:
Δ𝑥̇ = 𝐴𝑥̇ + 𝛽Δ𝑢 (10)
En las que Δ𝑥 = 𝑥 − 𝑥 0 y Δ𝑢 = 𝑢 − 𝑢0,

son las desviaciones de los estados y de la
señal de control de sus valores en el punto
de operación respectivamente. La matriz A
el vector β contienen las sensibilidades de
Fig. 2. Sector de no linealidad de 𝑧( 𝑥1) = sen 𝑥1
en 0 ≤ 𝑥1 ≤ 𝜋/2. Fuente: [3]
Las reglas para el modelo difuso se Del modelo de estados (3), (4) y (5), se
plantean como: puede observar que las dos primeras ecua-
ciones son independientes de 𝑥 3 . Este
Regla 1 : 𝑆𝑖 𝑥1𝑒𝑠 𝜇 1𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑧(𝑥1) 𝑒𝑠 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑎 𝑎 𝐿1. hecho es utilizado para implementar el
Regla 2: 𝑆𝑖 𝑥1𝑒𝑠 𝜇 2𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑧(𝑥1) 𝑒𝑠 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑎 𝑎 𝐿2. seguimiento de trayectoria, con base en (3)
y (4), para el levantamiento del péndulo.
Cuando este haya alcanzado la posición
El modelo T-S resultante para aproxi-
invertida, se utiliza regulación lineal sobre
mar la función no lineal 𝑧(𝑥1 ) = 𝑠𝑒𝑛 𝑥1, con
todas las variables de estado. Para cada
una defusificación tipo suma de productos,
uno de los cinco puntos de operación defi-
se expresa como:
nidos, se obtienen los modelos de estado
(14)
lineales reducidos (para las variables 𝑥1 y
𝑧(𝑥1) ≈ 𝜇 1(𝑥1)𝐿1 (𝑥1) + 𝜇 2(𝑥1)𝐿2 (𝑥1 )
𝑥 2) que tienen la forma general dada:
2 2 2 (15)
𝑧(𝑥1) ≈ (1 − 𝑥1) 𝑥1 + ( 𝑥1 ) 𝑥1
𝜋 𝜋 𝜋 𝑥̇ 𝑥
[ 1] = 𝐴 𝑖 [𝑥1 ] + 𝛽1 𝑢, 𝑖 = 1, 2, … 5. (17)
𝑥̇2 2
En la Fig. 3 se presentan las funciones
de pertenencia 𝜇1 (𝑥1) y 𝜇 2(𝑥1 ) definidas en El vector 𝛽1 = [0 −𝑏]𝑇 es común a to-
(13), así como la comparación entre la fun- dos los modelos, las matrices Ai asociadas
ción sen x1 y la aproximación propuesta en a los puntos de operación se presentan en
(15). Aunque el nivel de aproximación es la Tabla 1, donde también se especifican
aceptable, es posible mejorarlo definiendo las aproximaciones correspondientes a la
rectas y funciones de pertenencia interme- no linealidad.
dias en el rango de trabajo 0 ≤ 𝑥1 ≤ 𝜋/2. El modelo de estados global aproximado
El enfoque de seguimiento de trayecto- resulta de la combinación difusa de los
ria que se propone más adelante, requiere cinco modelos anteriores, como se presenta
un rango amplio de operación ( 0 ≤ 𝑥1 ≤ 2𝜋 en [9]:
o incluso ángulos negativos), por lo cual se
aplica el método de linealización descrito 𝑥̇
5
𝑥
[ 1] = ∑𝜇 𝑖 (𝑥1)𝐴 𝑖 [𝑥1 ] + 𝛽1𝑢 (18)
en los ángulos cuadrantales, es decir, en 𝑥̇2 2
los valores 𝑥10 = 0, 𝜋/2, 𝜋, 3𝜋/2, 2𝜋. Alre- 𝑖=1
dedor de cada ángulo, la función seno se En la cual las funciones de pertenencia

aproxima por una recta que pasa por (0,0) 𝜇 𝑖 (𝑥1 ) tienen la etiqueta “ 𝑥1 es cercana a
y el punto (𝑥10 , 𝑠𝑒𝑛 𝑥10 ). En 𝑥10 = 0 se usa la
(𝑖 − 1)𝜋/2”, 𝑖 = 1, 2, … 5. El conjunto de
recta tangente y la aproximación general
reglas para la construcción de los modelos
se obtiene con la combinación difusa de las
tiene la siguiente forma general:
anteriores. La Fig. 4 presenta la función
seno y las rectas de aproximación en el Regla 𝒊:
rango 0 ≤ 𝑥1 ≤ 2𝜋. Las ecuaciones de di- 𝑠𝑖 𝑥1 𝑒𝑠 𝜇𝑖 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 sen 𝑥1 𝑒𝑠 𝑎𝑝𝑟𝑜𝑥𝑖𝑚𝑎𝑑𝑎 𝑎 𝐿𝑖, 𝑖 =
chas rectas se especifican como: 1,2,3,4,5 .
𝐿1(𝑥1 ) = 𝑥1
2 Las funciones 𝜇 𝑖 (𝑥1 ) usadas tienen for-
𝐿2 (𝑥1) = 𝑥1 ma triangular simétrica, como se ilustra en
𝜋
𝐿3 (𝑥1 ) = 0 (16) la Fig. 5, con base 𝛥𝑥1 = 𝜋 y están centra-
2
𝐿4 (𝑥1 ) = − 𝑥 das en los diferentes puntos de linealiza-
3𝜋 1 ción, 𝜇1 y 𝜇 5 son solo mitades de triángulo
(
{ 𝐿5 𝑥1 = 0 )
por estar en los extremos del intervalo de
trabajo 0 ≤ 𝑥1 ≤ 2𝜋.
Fig. 3. Funciones de pertenencia lineales y aproximación difusa de la función seno con (15). Fuente: [3].
Fig. 4. Función seno y las cinco rectas de aproximación (16). Fuente: Autores
Tabla 1. Matrices Ai de los Modelos Linealizados. Fuente: Autores, [3].

Punto de operación Aproximación Matriz Ai
0 1]
𝑥1 = 0 sen 𝑥1 ≈ 𝐿1 (𝑥1 ) = 𝑥1 𝐴1 = [
𝑎 0
𝜋 0 1
2𝑥1
𝑥1 = sen 𝑥1 ≈ 𝐿2 (𝑥1 ) = 𝐴2 = [2𝑎 ]
2 𝜋 0
𝜋
0 1]
𝑥1 = 𝜋 sen 𝑥1 ≈ 𝐿3 (𝑥1 ) = 0 𝐴3 = [
0 0
0 1
3𝜋 2𝑥1
𝑥1 = sen 𝑥1 ≈ 𝐿4 (𝑥1 ) = − 𝐴4 = [−2𝑎 ]
2 3𝜋 0
3𝜋
0 1]
𝑥1 = 2𝜋 sen 𝑥1 ≈ 𝐿5 (𝑥1 ) = 0 𝐴5 = [
0 0
2.3 Compensación distribuida paralela En la cual 𝑊𝑖 = [𝛽1 𝐴 𝑖 𝛽1 ] es la matriz

de controlabilidad de cada modelo y 𝛥(𝑠) es
Por simplicidad, se definieron polos de el polinomio deseado de lazo cerrado.
lazo cerrado comunes a todos los modelos Usando las funciones de pertenencia des-
representados en (17), con base en paráme- critas en la Fig. 5, la expresión global para
tros de sobrepaso (𝑀𝑝) y tiempo de estable- la señal de control puede escribirse como
cimiento (𝑡𝑠 ) ajustados en la etapa de dise- en (20), donde se realiza la defusificación
ño. De igual forma, se trata de mantener la por suma de productos.
señal de control dentro de sus valore lími- La componente 𝐺𝑖 𝜃𝑟𝑒𝑓 se incluye como
tes garantizando siempre una respuesta un esquema simple de seguimiento de la
aceptable. Para cada uno de los modelos en trayectoria 𝜃𝑟𝑒𝑓 que se especifica en el
(17), se calculan las ganancias de los regu- siguiente apartado. El valor de las ganan-
ladores 𝑢𝑖 = −𝐾𝑖 [𝑥1 𝑥 2 ]𝑇 (con base en los cias 𝐺𝑖 , que permiten seguir sin error una
polos deseados) usando la fórmula de referencia constante, se obtienen como en
Ackerman [10], que para el caso de segun- (21) según [10].
do orden tiene la expresión (19): Aunque en este caso el ángulo de refe-
rencia no es constante, estas ganancias
permiten su seguimiento con un grado de
𝐾𝑖 = [0 1 ]𝑊𝑖−1𝛥(𝐴 𝑖) (19) error aceptable. Para los diferentes mode-
los lineales se obtiene el mismo valor 𝐺 si
se definen polos de lazo cerrado comunes.
5 5
𝑢 = 𝐺𝑖 𝜃𝑟𝑒𝑓 − ∑ 𝜇 𝑖 (𝑥1 )𝑢 𝑖 = 𝐺𝑖 𝜃𝑟𝑒𝑓 − ∑ 𝜇 𝑖 (𝑥 1 )𝐾𝑖 [𝑥1 𝑥 2] 𝑇 (20)

𝑖=1 𝑖=1
1
𝐺𝑖 = ; 𝑖 = 1,2, ⋯ ,5 (21)
𝐶 ( 𝐴𝑖 − 𝛽1 𝐾𝑖 ) −1 𝛽1
Fig. 5. Funciones de pertenencia para el rango de trabajo definido. Fuente: Autores.
2.4 Diseño de la trayectoria En la Fig. 7 se presenta la trayectoria de

referencia obtenida.
En teoría, el regulador difuso lleva los Dado que dicha trayectoria se obtiene
estados del sistema desde una condición con base en el modelo del sistema y consi-
inicial dada a cero de forma directa. En la derando sus limitaciones (que serán defi-
práctica, dado que la señal de control tiene nidas en la sección siguiente), se espera
limitaciones en sus valores extremos, en que el péndulo logre seguirla con un error
este trabajo se implementa un seguimiento aceptable, aunque se presente cierto nivel
de trayectoria. En el modelo propuesto, se de saturación en la señal de control.
toma la posición invertida (θ1 = 0 ) como
referencia para la medida del ángulo del
péndulo. La posición de equilibrio natural 3. RESULTADOS Y DISCUSIÓN
se establece como 𝜃1 = ±𝜋 o de forma gene-
ral 𝜃1 = (2𝑛 − 1)𝜋; 𝑛 ∈ ℤ. Se realizaron simulaciones en el domi-
Considerando la posición inicial 𝜃1 = 𝜋 nio de tiempo, con el fin de validar la efec-
(equilibrio natural), se genera mediante tividad del controlador sobre el sistema no
simulación la trayectoria a seguir teniendo lineal estudiado. El esquema de control
en cuenta que es posible hacer oscilar, el descrito anteriormente es simulado en el
péndulo con una amplitud creciente si se entorno Matlab, asignando a los coeficien-
aplica una señal de control constante y tes a, b y c los valores correspondientes a
cuyo signo depende de la velocidad de la los parámetros físicos del sistema de prue-
barra [14]. Esta entrada se aplica al siste- ba presentado en [3] (Mechatronics Control
ma en una vecindad de tamaño ajustable Kit). Dichos valores son: 𝑎 = 78,4 𝑟𝑎𝑑/𝑠 2;
𝛥𝜃 alrededor del ángulo inicial. La entrada 𝑏 = 1,08 𝑟𝑎𝑑/𝑠 2; 𝑐 = 198 𝑟𝑎𝑑/𝑠 2. La señal
de control que permite dicha oscilación, de control se debe limitar al rango norma-
según la descripción anterior, tiene la ex- lizado −10 ≤ 𝑢 ≤ 10 UI (unidades de inge-
presión (22): niería), que luego de la etapa de amplifica-
ción corresponde al rango de voltajes apli-
𝑈 𝑠𝑔𝑛(𝜃̇1), |𝜃1 − 𝜋| ≤ 𝛥𝜃 cado al motor.
𝑢 (𝑡 ) = { 0 (22)
0 , 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Con los valores asignados a los coefi-
cientes, se diseñaron reguladores Ki para
Siendo 𝑈0 una constante menor al má-
cada uno de los modelos lineales (17) y la
ximo valor posible de la señal de control y
ganancia común G para el seguimiento. Se
𝑠𝑔𝑛(⋅) la función signo. Ajustando el tama-
definieron los parámetros de respuesta
ño 𝛥𝜃 de la zona de aplicación de la entra- deseada 𝑡𝑠 = 0,15 𝑠 (tiempo de estableci-
da (𝜋 − 𝛥𝜃 ≤ 𝜃 ≤ 𝜋 + 𝛥𝜃), que se presenta miento) y 𝑀𝑝 = 5% (sobrepaso), de los cua-
sombreada en la Fig. 6, se puede variar el
les resultan los polos de lazo cerrado 𝑠1,2 =
tiempo que el péndulo tarda en alcanzar la
−26,7 ± 𝑗27,2 (raíces del polinomio caracte-
posición invertida (zonas más amplias
rístico típico 𝛥 (𝑠) = 𝑠 2 + 2𝜁𝜔𝑛 𝑠 + 𝜔2𝑛). Las
reducen el tiempo de subida). Este proceso
es necesario ya que para lograr una subida ganancias obtenidas usando (19) con estos
directa se requieren valores muy elevados polos y cada uno de los modelos de la Tabla
de la señal de control. Cuando el péndulo 1 se presentan en (23)
llega a puntos suficientemente cercanos al 𝐾1 = −[ 1416,3 49,4 ]
equilibrio inestable, un controlador (regu- 𝐾2 = −[1390,0 49,4 ]
lador) lineal se encarga de llevar al sistema 𝐾3 = −[1343,8 49,4 ] (23)
hasta esa posición (𝑥1 = 0) y mantenerlo 𝐾4 = −[1328,3 49,4 ]
allí, regulando pequeñas perturbaciones. 𝐾5 = −[1343,7 49,4 ]
Fig. 6. Zona de aplicación de la señal de control (22). Fuente: [3].
Fig. 7. Trayectoria diseñada para alcanzar la posición invertida. Fuente: [3].
Usando (21) y los parámetros descritos, controlador (20) por un regulador local que
el valor de la ganancia de seguimiento realimenta las tres variables de estado,
resulta ser 𝐺 = −1343,7 (común a todos los 𝑢𝑢𝑝 = −𝐾𝑢𝑝 𝑥 , siendo x el vector de estados
modelos). Con las ganancias (23) y G se completo; 𝐾𝑢𝑝 = [𝐾𝑢𝑝1 𝐾𝑢𝑝2 𝐾𝑢𝑝3 ] es el
puede implementar el regulador (19), que vector de ganancias de dicho regulador. La
actúa sobre las variables de estado 𝑥1 = 𝜃1 señal de control global implementada se
y 𝑥 2 = 𝜃1̇ . La tercera variable de estado, presenta en (24)
𝑥 2 = 𝜃̇2 , no se realimenta, corriendo el
riesgo de que se presente un aumento pro- 5
𝐺𝜃𝑟𝑒𝑓 − ∑ 𝜇 𝑖 𝐾𝑖 [𝑥1 𝑥2 ]𝑇 , 𝜃1 > 𝜖

gresivo de la velocidad de giro de la rueda 𝑢 ={ (24)
𝑖=1
de reacción al alcanzar la posición inverti- −𝐾𝑢𝑝 𝑥, 𝜃1 ≤ 𝜖
da (en la etapa de subida del péndulo esta
velocidad es oscilante y dicho inconvenien- El ángulo 𝜖 debe ser menor a 5° con el
te no se presenta). Una forma de resolver fin de evitar cambios bruscos en la señal de
este inconveniente es la siguiente: al detec- control en el instante de conmutación. Para
tar que el ángulo θ1 es cercano a cero (po- el regulador 𝐾𝑢𝑝 se definieron los polos de
sición invertida, inestable), se cambia el
lazo cerrado 𝑠1,2 = −4 ± 𝑗4,1 y 𝑠3 = −11,4. En la Fig. 9 se muestran los resultados

Con estos polos y el modelo linealizado de simulación. Se observa que hay satura-
alrededor de 𝑥1 = 𝜃1 = 0 se obtuvo el vector ción en la señal de control, pero aun así se
de ganancias presentado en (25) logra el seguimiento de la referencia con
un grado de desfase aceptable. Debido a
𝐾𝑢𝑝 = −[187,5 22,4 0,024] (25) dicha saturación, resulta muy difícil redu-
cir el tiempo de subida a un valor menor al
El esquema completo de lazo cerrado se obtenido (𝑡𝑢𝑝 ≈ 4,5 s). Se incluye el efecto
ilustra en la Fig. 8. En la etapa de levan- de una perturbación de tres grados ( 3°) en
tamiento del péndulo, la señal de control el ángulo del péndulo aplicada durante
resulta de la combinación difusa de los 𝛥𝑡 = 0,2 s en el instante 𝑡 = 6,5 s. Se obser-
reguladores lineales obtenidos para los va cómo el regulador elimina dicha desvia-
modelos reducidos. Cuando se detecta que ción. En la Fig. 10 se presenta en detalle el
la barra se encuentra cerca de la posición efecto sobre la variable de estado x1 debida
invertida (|𝜃1 | ≤ 𝜖) se realiza la conmuta- a la perturbación. Finalmente, la velocidad
ción al regulador del vector de variables de angular de la rueda se presenta en la Fig.
estado completo (𝑢 = −𝐾𝑢𝑝 𝑥), como se des- 11.
cribe en (24).
Fig.8. Esquema completo de lazo cerrado. Fuente: Autores.
Fig. 9. Resultados del seguimiento de trayectoria propuesto. Ángulo del péndulo y señal de control.
Fuente: Autores.
Fig. 10. Regulación de la perturbación. Fuente: Autores.
Fig. 11. Velocidad de la rueda de reacción durante el proceso. Fuente: Autores.
4. CONCLUSIONES regulador para atenuar pequeñas pertur-

baciones alrededor la posición invertida.
Se presentaron de forma detallada el La validez de la técnica de linealización
diseño del controlador y los resultados de usada (no-linealidad sectorial), quedó esta-
simulación para llevar el péndulo desde su blecida gracias a la respuesta satisfactoria
posición natural de equilibrio a la posición del sistema ante la técnica de control que
invertida. Los reguladores locales obteni- se implementó, ya que los parámetros del
dos actúan alrededor de los puntos de ope- controlador fueron calculados con base en
ración para los cuales fueron diseñados, y los modelos lineales obtenidos.
la señal de control global resultó de la La estrategia de control difuso con base
combinación difusa de dichos reguladores. en modelos T-S, permitió el uso de las téc-
Aunque se presentó saturación de la señal nicas conocidas de control por realimenta-
de control, fue posible el seguimiento de la ción lineal de las variables de estado. Aun-
trayectoria con lo cual el péndulo alcanzó que los reguladores locales son en efecto
su posición invertida con oscilaciones de lineales, su combinación difusa usando las
amplitud creciente en un tiempo cercano a funciones de pertenencia definidas, genera
4,5s y con error de seguimiento menor a un controlador global no lineal.
0,22 rad. Se comprobó la capacidad del
6. REFERENCIAS [7] B. Bapiraju, K. N. Srinivas, P. Kumar P, and

L. Behera, “On balancing control strategies
for a reaction wheel pendulum,” in
[1] O. O. Gutiérrez-Frías, “Diseño de
Proceedings of the IEEE INDICON 2004.
Controladores para Sistemas Subactuados
First India Annual Conference, 2004., 2004,
del Tipo Péndulo Invertido,” Instituto
pp. 199–204.
Politécnico Nacional, 2010.
[8] R. J. M. Triana García Giovanni , Buitrago
[2] R. Olfati-Saber, “Nonlinear control of
José Tomás, “Control de un péndulo de
underactuated mechanical systems with
furuta. Una revisión del estado del arte.,”
application to robotics and aerospace
Sci. Tech., vol. 20, no. 4, pp. 326–334, 2015.
vehicles,” MASSACHUSETTS INSTITUTE
[9] K. Tanaka and H. O. Wang, Fuzzy Control
OF TECHNOLOGY, 2000.
Systems Design and Analysis: A Linear
[3] V . D. Correa-Ramírez, “Control de un
Matrix Inequality Approach, 1st ed. New
sistema no lineal usando técnicas
York, USA: John Wiley & Sons, Inc., 2001.
inteligentes. El péndulo con rueda de
[10] D. Giraldo-Buitrago and E. Giraldo-Suárez,
reacción,” Universidad Tecnológica de
Teoría de Control Análogo. Universidad
Pereira, 2016.
Tecnológica de Pereira, 2010.
[4] A. Molina, D. Buitrago, and V . Correa,
[11] W. J. Terrell, “Some Fundamental Control
“Control global para el péndulo con rueda de
Theory I: Controllability, Observability, and
reacción,” Sci. Tech., pp. 95–99, 2007.
Duality,” Am. Math. Mon., vol. 106, no. 8, p.
[5] O. D. Montoya Giraldo, L. F. Grisales
705, Oct. 1999.
Noreña, V . D. Correa Ramírez, and D.
[12] A. Isidori, Nonlinear Control Systems, 2nd
Giraldo Buitrago, “Control global del péndulo
ed. Berlin, Heidelberg: Springer Berlin
con rueda de reacción mediante regulación
Heidelberg, 1989.
de energía y linealización extendida de las
[13] Jean Jacques, E. Slotine and, and L.
variables de estado,” Tecno Lógicas, vol. 17,
Weiping, Applied nonlinear control, 1st ed.,
no. 32, pp. 33–46, 2014.
vol. 199, no. 1. Englewood Cliffs, New Jersey
[6] J. G. V . V alenzuela-Hernández, O. D.
07632: prentice-Hall Englewood Cliffs, NJ,
Montoya-Giraldo, and D. Giraldo-Buitrago,
1991.
“Lógica Difusa Aplicada al Control Local del
[14] V . M. Hernández and H. Sira-Ramírez,
Péndulo Invertido con Rueda de Reacción,”
“Generalized PI control for swinging up and
Sci. Tech., vol. 18, no. 4, pp. 623–632, 2013.
balancing the inertia wheel pendulum,” in
Proceedings of the 2003 American Control
Conference, 2003., 2003, vol. 4, pp. 2809–
2814.

Control Difuso Del Péndulo Invertido Con Rueda de Reacción Usando Seguimiento de Trayectoria

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Control Difuso Del Péndulo Invertido Con Rueda de Reacción Usando Seguimiento de Trayectoria

Cargado por

Copyright:

Formatos disponibles

TecnoLógicas

Control difuso del péndulo invertido

Fuzzy control of an inverted pendulum

Víctor Daniel Correa-Ramírez1, Didier Giraldo-

Recibido: 18 de agosto de 2016,

Cómo citar / How to cite

1 MSc en Ingeniería Eléctrica, Facultad de Ingenierías Eléctrica,

1. INTRODUCCIÓN Debido a la naturaleza altamente no li-

2.1 Modelo del sistema 𝑥̇ = 𝑓 (𝑥) + 𝛽𝑢 (6)

En la literatura analizada, los autores Cuando un sistema admite este tipo de

estados, 𝑓(𝑥) es una función no lineal de x las no linealidades con respecto a x y u

Δ𝑥̇ = 𝐴𝑥̇ + 𝛽Δ𝑢 (10)

En las que Δ𝑥 = 𝑥 − 𝑥 0 y Δ𝑢 = 𝑢 − 𝑢0,

dedor de cada ángulo, la función seno se En la cual las funciones de pertenencia

Tabla 1. Matrices Ai de los Modelos Linealizados. Fuente: Autores, [3].

2.3 Compensación distribuida paralela En la cual 𝑊𝑖 = [𝛽1 𝐴 𝑖 𝛽1 ] es la matriz

𝑢 = 𝐺𝑖 𝜃𝑟𝑒𝑓 − ∑ 𝜇 𝑖 (𝑥1 )𝑢 𝑖 = 𝐺𝑖 𝜃𝑟𝑒𝑓 − ∑ 𝜇 𝑖 (𝑥 1 )𝐾𝑖 [𝑥1 𝑥 2] 𝑇 (20)

Fig. 5. Funciones de pertenencia para el rango de trabajo definido. Fuente: Autores.

2.4 Diseño de la trayectoria En la Fig. 7 se presenta la trayectoria de

Fig. 6. Zona de aplicación de la señal de control (22). Fuente: [3].

Fig. 7. Trayectoria diseñada para alcanzar la posición invertida. Fuente: [3].

𝐺𝜃𝑟𝑒𝑓 − ∑ 𝜇 𝑖 𝐾𝑖 [𝑥1 𝑥2 ]𝑇 , 𝜃1 > 𝜖

lazo cerrado 𝑠1,2 = −4 ± 𝑗4,1 y 𝑠3 = −11,4. En la Fig. 9 se muestran los resultados

Fig.8. Esquema completo de lazo cerrado. Fuente: Autores.

Fig. 10. Regulación de la perturbación. Fuente: Autores.

Fig. 11. Velocidad de la rueda de reacción durante el proceso. Fuente: Autores.

4. CONCLUSIONES regulador para atenuar pequeñas pertur-

6. REFERENCIAS [7] B. Bapiraju, K. N. Srinivas, P. Kumar P, and

También podría gustarte