Documentos de Académico
Documentos de Profesional
Documentos de Cultura
discussions, stats, and author profiles for this publication at: https://www.researchgate.net/publication/28141862
CITATIONS READS
16 699
2 authors:
All content following this page was uploaded by Aracil José on 08 December 2016.
The user has requested enhancement of the downloaded file. All in-text references underlined in blue are added to the original document
and are linked to publications on ResearchGate, letting you access and read them immediately.
ISSN: 1697-7912. Vol. 2, Núm. 2, Abril 2005, pp. 8-19
J. Aracil ∗ F. Gordillo ∗
∗
Escuela Superior de Ingenieros, Universidad de Sevilla.
Camino de los Descubrimientos s/n. Sevilla-41092. Spain
E-mail: {aracil,gordillo}@esi.us.es
adoptada consiste en inyectar energı́a al sistema en donde J es la inercia de la varilla del péndulo
cuando se encuentra en la cuenca de atracción girando sobre un extremo, m y l son la masa y
de un equilibrio no deseado y amortiguar el la longitud de la varilla respectivamente, x1 es
sistema cuando está en la cuenca del equilibrio el ángulo que forma el péndulo con la vertical
deseado. Esta estrategia combinando inyección de superior y u es la señal de control (fuerza sobre
energı́a y amortiguamiento (pumping-damping) es el carro). La energı́a del péndulo viene dada por
innovadora y es distinta de la usual de moldeo 1
de energı́a seguido exclusivamente por inyección E= J x22 + mgl(cos x1 − 1),
2
de amortiguamiento (Ortega et al., 2001). En el
presente artı́culo la estrategia conduce a una ley donde x2 representa la velocidad angular del
de control en la que aparece una conmutación. péndulo. La forma geométrica de esta función de
Trabajos más recientes permiten obtener una energı́a se tiene en la figura 3. Además se tiene
estrategia similar mediante un controlador suave que
sin necesidad de conmutación (Åström et al.,
2005).
La utilización del péndulo invertido como banco 8
energı́a correspondiente a la del punto superior, el que las ecuaciones normalizadas del péndulo
péndulo no tiene necesariamente que permanecer (despreciando la dinámica del soporte) vienen
en esta posición sino que puede evolucionar por dadas por
una curva de energı́a constante (que es, en
realidad, una órbita homoclina 2 ). Para estabilizar ẋ1 = x2
(4)
el sistema en esa posición se requiere conmutar ẋ2 = sin x1 − cos x1 u.
a una ley de control local que determine que el
péndulo se estabiliza en la posición deseada. De El objetivo de los métodos de moldeo de energı́a
este modo mediante una combinación de inyección es cambiar, mediante la introducción de una ley
de energı́a, mediante el controlador (3), y una de control u, la forma de la energı́a del sistema de
ley de control local en torno a la posición de manera que el mı́nimo de la misma se encuentre
equilibrio se consigue el objetivo propuesto. Esta en el punto que se desea estabilizar. Con tal fin,
ley de control es enormemente eficiente y se debe se puede moldear la energı́a potencial del sistema
a Aström y Furuta y sus respectivos grupos de (4) proponiendo como energı́a deseada la función
investigación (Åström y Furuta, 2000; Wiklund et hamiltoniana
al., 1993). x22
Hd (x1 , x2 ) = Vd (x1 ) + . (5)
La ley de control, como se recordaba más arriba, 2
está basada en considerar únicamente el modelo
(1) de dimensión 2 despreciando el comportamien- Es decir, en bucle cerrado se pretende tener un
to dinámico del soporte en el que va montado sistema cuya forma hamiltoniana generalizada
(carro o brazo del péndulo). Ello equivale a (van der Schaft, 2000) sea
despreciar los pares de reacción del péndulo al
ẋ1 0 1 Dx1 Hd
soporte, lo que es razonable bajo ciertas hipótesis. = , (6)
ẋ2 −1 −σ Dx2 Hd
A ello se debe, en gran medida, la eficiencia del
controlador formado por la ley de control (3) y
donde σ, que puede ser una función, define
una ley lineal en torno al equilibrio. Es notable que
el amortiguamiento. De (5) y (6) se obtiene
esta ley de control es válida tanto para el péndulo
fácilmente que el sistema deseado viene dado por
en un carro como para el de Furuta.
Sin embargo, el modelo completo del sistema, ẋ1 = x2
(7)
sin despreciar la dinámica del soporte, es con- ẋ2 = −Vd′ (x1 ) − σx2 .
siderablemente más complejo que el (3). Para el
sistema de Furuta,o su versión más simplificada en que para σ = 0 es un sistema conservativo.
el caso del péndulo en un carro, se pueden obtener La energı́a potencial deseada Vd más simple que
leyes de control semejantes a las obtenidas para el podemos concebir es
sistema de dimensión 2 (Acosta, 2004; Gordillo
et al., 2003; Lozano et al., 2000; Pagano, 1999). Vd = − cos x1 . (8)
Para la determinación de la ley de control en
caso de dimensión 3 se emplea una generalización
del procedimiento obtenido para determinar la ley
(3), debida a Fradkov. Se puede demostrar que las 6
leyes de control obtenidas para el modelo comple- 5
to tienden a las del correspondiente sistema de
4
dimensión 2 bajo ciertas circunstancias (Gordillo
et al., 2003), por ejemplo que el radio del brazo 3
Vd
la (9). −1.5
1
x2 −5
−1 −0.5 0 0.5
se tiene x1 /π
última figura se ven los lı́mites de los pozos a los sustenta) esta ley seguirá inyectándole energı́a por
que se acaba de aludir. Los pozos grandes son debajo de la horizontal aunque atenúe por encima
indeseados mientras que el pequeño es deseado. de ella. Ello da lugar a problemas oscilatorios
Estas consideraciones sugieren intuitivamente que innecesarios y de muy difı́cil solución. Además
la solución del problema va a consistir en inyectar Hd no es función de Liapunov lo que dificulta
energı́a al péndulo cuando se encuentre en un la demostración de estabilidad (de hecho, para
pozo indeseado y amortiguarlo cuando esté fuera ciertas condiciones iniciales el sistema no se
de ellos. Vamos a ver a continuación como se comporta adecuadamente). Parece más razonable
sustancia esta propuesta. inyectar energı́a sólo cuando sea estrictamente
2.5
necesario, que es lo que se va a hacer en la
estrategia que se propone en el apartado siguiente.
2
1.5
4. UNA ESTRATEGIA BASADA EN EL
1
AMORTIGUAMIENTO Y LA INYECCIÓN DE
0.5
ENERGÍA
x2
−0.5
La idea básica de esta estrategia ya ha sido es-
bozada más arriba y consiste en inyectar energı́a al
−1
péndulo solamente cuando su estado se encuentra
−1.5 en el interior de un pozo indeseado. Recordemos
−2
el hamiltoniano deseado
1
−2.5
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2 Hd (x1 , x2 ) = cos x1 − a cos2 x1 + x22 . (18)
x1 /π 2
x2
0
y, al no tener ϕ un signo constante, Hd no es
−0.5
función de Liapunov. Considérese la siguiente
candidata a función de Liapunov −1
1 2 1 −1.5
V = ϕ(x1 , x2 ) cos x1 − a cos2 x1 + x − . (22)
2 2 4a
−2
0
1
−k si H d ≤ + ε −2
4a
△ ! −1.5 −1 −0.5
ϕε (x1 , x2 ) = 1 x10/π 0.5 1 1.5
5
y cos x1 <
2a
x1
0
k en otro caso,
con lo que la nueva ley de control es −5
0 10 20 30 40 50
5 Tiempo [s]
u = 2a sin x1 + ϕε (x1 , x2 )x2 cos x1 , (23)
| {z } | {z }
u
uc ud 0
−5
y la función de Liapunov 0 10 20 30 40 50
Tiempo [s]
1
V = ϕε (x1 , x2 ) Hd − −ε .
4a Figura 9. Resultados de una simulación con a = 1,
ε = 0.25 y k = 0.2. Condiciones iniciales:
En (Gordillo et al., 2004c) se demuestra la
posición colgante en reposo.
estabilidad del sistema resultante. Sin embargo
se siguen produciendo modos deslizantes debido En las figuras 9, 10 y 11 se muestran los resultados
a la discontinuidad a lo largo de la curva de de la aplicación de la ley para distintos valores
1
nivel Hd = 4a + ε. Si se desea evitar la del parámetro k. En estas figuras se pone de
existencia de modos deslizantes se puede modificar manifiesto como la trayectoria abandona el pozo
la función de conmutación ϕε de modo que sea indeseado, debido a la inyección de energı́a, y
igual a cero en los dos lados de la curva de entra en el deseado de manera que finalmente
conmutación. Multiplicando la función ϕε por alcanza el origen.
J. Aracil, F. Gordillo 15
2
carro. No se va a tratar de llevar el carro a una
posición deseada por lo que el problema se puede
x2
0
considerar de dimensión 3.
−2
Vamos a considerar, en primer lugar, la ley de
−1.5 −1 −0.5
x10/π 0.5 1 1.5
−2
0 2 4 6 8 10 12 14 16 18 20
que aplicada a (25) conduce a
Tiempo [s]
ż = h(ξ) + g1 (ξ)v
(30)
40
ξ˙ = f (ξ) + g2 (ξ)v,
30
desarrollando esta expresión y sustituyendo los (31) que no en todos los casos es posible. Es lo
valores correspondientes de (25) se tiene que sucede cuando se aplica la ley de control (24)
determinada en el apartado anterior. En efecto, si
se aplica esta ley de control, a la que se suma una
∂ν ∂ν ∂ν señal adicional v se tiene
V̇ = αν x2 − sin x1 +2 tan x1 +
∂x1 ∂x2 ∂x3
∂ν ∂ν u = 2a sin x1 + ϕ
eε x2 cos x1 + v, (36)
v −x2 cos x1 + αν cos x1 + .
∂x2 ∂x3
El primer sumando se puede anular haciendo que que aplicada a (25) da
ν satisfaga la ecuación en derivadas parciales
∂ν ∂ν ∂ν ẋ1 = x2
x2 − sin x1 +2 tan x1 = 0, (31)
∂x1 ∂x2 ∂x3 ẋ2 = sin x1 − 2a sin x1 cos x1
(37)
−ϕeε x2 cos2 x1 − cos x1 v
es decir, ν debe ser invariante para v = 0. ẋ3 = 2a sin x1 + ϕeε x2 cos x1 + v.
Resolviendo esta ecuación en derivadas parciales
se tiene
En este caso la aplicación del método conven-
cional de forwarding conduce a una ecuación
en derivadas parciales que aparentemente no
ν1 = x3 + M (x1 , x2 ) si E < 0 (32)
r tiene solución. Afortunadamente para casos como
2 x2 este se dispone del control con señales acotadas
ν2 = x3 − 2 arctanh √ si E > 0(33)
E 2E propuesto originalmente por Teel (Teel, 1992a;
con Teel, 1992b; Teel, 1996). Este método ha sido
modificado recientemente por Kaliora y Astolfi
x2
4 arctan √−2E (Kaliora y Astolfi, 2001; Kaliora, 2002; Kaliora y
M (x1 , x2 ) = √ , (34) Astolfi, 2004). De esta propuesta se sugiere, para
−2E el caso que nos ocupa, una ley de control de la
forma
x2
y donde E = 22 − cos x1 es la energı́a del
subsistema formado por el péndulo. La primera de λx3
estas soluciones, ν1 , es la que está bien definida en v = −ε2 sat , (38)
ε2
el entorno del origen.
Para que se cumpla V̇ ≤ 0 se hace
en donde la función de saturación está definida
por sat(y) = sgn(y) mı́n{|y|, 1} y 0 < ε2 ≪ 1. De
este modo la ley de control a aplicar es
∂ν ∂ν
v = − −x2 cos x1 + αν cos x1 +
∂x2 ∂x3
λx3
en donde sustituyendo la expresión de ν1 obtenida u = 2a sin x1 + ϕ
eε x2 cos x1 − ε2 σ . (39)
ε2
en (32) se tiene la ley de control
2
x2
−2
−1.5 −1 −0.5
5
x10/π 0.5 1 1.5
x1
−5
0 20 40 60 80 100
10 Tiempo [s]
5
x3
−5
0 20 40 60 80 100 Figura 13. Función de energı́a deseada para la
Tiempo [s]
generación de oscilaciones.
Figura 12. Resultados de una simulación con a = que aplicada al péndulo (4) lo hace oscilar
1, k = 0.5, λ = 0.1, ε = 0.25 y ε2 = 0.1. periódicamente en un ciclo lı́mite dado por x21 +
Condiciones iniciales: posición colgante en x22 = µ. Debido al término cos x1 en el denom-
reposo. inador la ley de control (42) está restringida al
dominio |x1 | < π/2. En la figura 14 se muestra
6. GENERACIÓN AUTÓNOMA DE
una simulación del sistema.
OSCILACIONES EN EL PÉNDULO
INVERTIDO 1
x2
0
ra este objetivo se sustituye por el de conseguir
que el péndulo oscile alrededor de la posición −1
superior con una determinada amplitud deseada. 0 5 10 15 20
Tiempo [s]
25 30 35 40
2
En otras palabras, se pretende generar un ciclo
lı́mite estable alrededor del origen. Para resolver
u
0
este problema se puede emplear un método
semejante al propuesto en (Aracil et al., 2002). −2
0 5 10 15 20 25 30 35 40
Se propone como sistema deseado Tiempo [s]
∂Γ
1 Γ Figura 14. Resultados de simulación en el
ẋ1 0 Γ ∂x1 , problema de generación de oscilaciones.
= 1 (40)
ẋ2
− −k ∂Γ
Γ Γ
∂x2 Hasta aquı́ se ha considerado únicamente la
actuación sobre el péndulo. Si se pretende actuar
en dónde Γ = 0 es una curva cerrada que también sobre el soporte entonces el problema
representa al ciclo lı́mite. En el caso más sencillo es sensiblemente más complicado. Como sucedı́a
se adopta Γ = (x21 + x22 − µ), donde µ2 es el radio anteriormente en el apartado 5, con relación a los
de una circunferencia ciclo lı́mite. En ese caso las anteriores. El espacio concedido en este artı́culo
ecuaciones (40) se convierten en no permite tratarlo. Una solución a este problema
ẋ1 = x2 puede verse en (Aracil et al., 2005) en donde se
(41) ha aplicado el método de Fradkov.
ẋ2 = −x1 − kΓx2 .
moldeo de energı́a para el diseño de controladores. Åström, K.J. y K. Furuta (2000). Swinging up
También se ha recurrido al forwarding para a pendulum by energy control. Automatica
determinar el controlador del sistema formado por 36, 287–295.
el péndulo invertido y el soporte que lo arrastra, Bloch, A. M., N. E. Leonard y J. E. Marsden
sistema que presenta la estructura en cascada o (1999). Stabilization of the pendulum on a
triangular a la que se puede aplicar ese método. rotor arm by the method of controlled La-
Asimismo se ha empleado, aunque en el artı́culo grangians. En: Proc. of the 1999 IEEE ICRA.
sólo se ha aludido someramente a ello, el método pp. 500 –505.
de Fradkov para resolver problemas relacionados Furuta, K. (2003). Control of pendulum: From
con el péndulo invertido. super mechano-system to human adaptive
Por otra parte, se ha puesto de manifiesto cómo en mechatronics. En: Proceedings of the 42nd
el péndulo invertido aparecen los problemas más IEEE CDC. pp. 1498–1507.
notables que justifican lo especı́fico del estudio de Gómez-Estern, Fabio (2003). Control de sistemas
los sistemas no lineales. Las dos caracterı́sticas no lineales basado en la estructura Hamilto-
radicales de los sistemas no lineales, con relación niana. Tesis doctoral. Universidad de Sevilla.
a los lineales, son la presencia de múltiples Gordillo, F., D. Pagano y J. Aracil (2004a). Au-
equilibrios y los comportamientos oscilatorios. tonomous oscillation generation in electronic
Ambos han aparecido en el estudio que se ha converters. En: Proceedings of the 2004 Inter-
hecho del péndulo invertido. Además, y aunque no national Workshop on Electronics and Sys-
se haya podido tratar aquı́ en detalle por razones tem Analysis, IWESA’04. pp. 57–65.
de espacio, se ha puesto de manifiesto la dificultad Gordillo, F., F. Salas y J. Aracil (2004b). A
del control de un sistema inestable (trivial en forwarding controller for the pendulum on
el caso lineal) no lineal. En el caso del péndulo a cart. En: Proceedings of CONTROLO’04.
de Furuta pueden aparecer incluso problemas de pp. 79–84.
tiempo de escape finito que, como se sabe, son de Gordillo, F., J. Aracil y J.A. Acosta (2004c). A
extrema complejidad. control strategy for the cart-pendulum sys-
tem. En: Proceedings of the Sixth CONTRO-
LO. pp. 214–219.
Agradecimientos Gordillo, F., J.A. Acosta y J. Aracil (2003). A
new swing-up law for the Furuta pendulum.
Los autores desean expresar su agradecimiento International Journal of Control 76(8), 836–
al profesor Sebastián Dormido por sus valiosos 844.
comentarios y sugerencias y al doctor José Ángel Hale, J. K. y H. Koçak (1991). Dynamics and
Acosta por la preparación de las Figuras 1 y 2. Bifurcations. Springer-Verlag.
Este trabajo ha sido financiado por el proyecto Kaliora, G. y A. Astolfi (2001). A simple design
MCYT-FEDER DPI2003–00429. for the stabilization of a class of cascaded
nonlinear systems with bounded control. En:
Proceedings of the 40th IEEE Conference on
REFERENCIAS Decision and Control. pp. 3784–3789.
Acosta, José Ángel (2004). Control no lineal de Kaliora, G. y A. Astolfi (2004). Nonlinear con-
sistemas subactuados. Tesis doctoral. Univer- trol of feedforward systems with bounded
sidad de Sevilla. control. IEEE Trans. on Automatic Control
Angeli, D. (2001). Almost global stabilization of 49(11), 1975–1990.
the inverted pendulum via continous state Kaliora, Georgia (2002). Control of nonlinear sys-
feedback. Automatica 37, 1103–1108. tems with bounded signals. Tesis doctoral.
Aracil, J., A. Fradkov y F. Gordillo (2005). Imperial College of Sicnece, Technology and
Speed-gradient algorithms for underactuat- Medicine. London.
ed nonlinear systems. En: 2005 IFAC World Lozano, R., I. Fantoni y D.J. Block (2000). Stabi-
Congress. lization of the inverted pendulum around its
Aracil, J., F. Gordillo y J.A. Acosta (2002). Sta- homoclinic orbit. Systems and Control Letters
bilization of oscillations in the inverted pen- 40(3), 197–204.
dulum. En: XV IFAC World Congress. Marichal, R., J. Aracil y F. Gordillo. (2004).
Aracil, J. y F. Gordillo (2002). On the control of Estudio de la técnica forwarding mod{Lg V}
oscillations in DC-AC converters. En: Proc. en los sistemas mecánicos. En: XXV Jornadas
IECON’02. Sevilla, Spain. de Automática. Ciudad Real, España.
Åström, K.J., J. Aracil y F. Gordillo (2005). A Mazenc, F. y L. Praly (1996). Adding integra-
new family of smooth strategies for swing- tions, saturated controls, and stabilization for
ing up a pendulum. En: 16th IFAC World feeforward systems. IEEE Trans. on Autom.
Congress. Prague. Control 41(11), 1559 – 1578.
J. Aracil, F. Gordillo 19
Ortega, R., A. J. Van Der Schaft, I. Mareels Zhao, J. y M. W. Spong (2001). Hybrid control
y B. Maschke (2001). Putting energy back for global stabilization of the cart-pendulum
in control. IEEE Control Systems Magazine system. Automatica 37, 1941–1951.
21(1), 18–33.
Pagano, D. J., J. Aracil y F. Gordillo (2005). Au-
tonomous oscillation generation in the boost
converter. En: 16th IFAC World Congress.
Pagano, Daniel J. (1999). Bifurcaciones en sis-
temas de control no lineales. Tesis doctoral.
Universidad de Sevilla.
Rantzer, Anders y Francesca Ceragioli (2001).
Smooth blending of nonlinear controllers us-
ing density functions. En: Proceedings of Eu-
ropean Control Conference.
Sepulchre, R., M. Jankovic y P. Kokotovic (1997).
Constructive Nonlinear Control. Springer-
Verlag.
Shiriaev, A.S., O. Egeland, H. Ludvigsen y A.L.
Fradkov (2001). VSS–version of energy based
control for swinging up a pendulum. Syst. &
Contr. Lett. 44(1), 41–56.
Spong, M.W. (1995). The swing up control prob-
lem for the acrobot. IEEE Control Systems
Magazine 15(1), 49–55.
Spong, M.W. (1996). Energy based control of
a class of underatuated mechanical systems.
En: 13th IFAC World Congress. pp. 431–435.
Srinivasan, B., P. Huguenin, K. Guemghar y
D. Bonvin (2002). A global stabilization
strategy for an inverted pendulum. En: 15th
IFAC World Congress.
Stein, G. (1989). Respect the unstable. En: 28th
Conf. Decision and Control. Bode Lecture.
Stein, G. (2003). Respect the unstable. IEEE
Control Systems Magazine 23(4), 12–25.
Teel, A. R. (1992a). Feedback stabilization: Non-
linear solutions to inherently nonlinear prob-
lems. Tesis doctoral. University of California
at Berkeley.
Teel, A. R. (1992b). Global stabilization and re-
stricted tracking for multiple integrators with
bounded control. Systems and Control Letters
18(3), 165–171.
Teel, A. R. (1996). A nonlinear small gain theo-
rem for the analysis of control systems with
saturation. IEEE Transactions on Automatic
Control 41(9), 1256–1270.
Utkin, V.I., D.S. Chen y H.C. Chang (2000).
Block control principle for mechanical sys-
tems. Journal of Dynamic Systems, Measure-
ment and Control 122, 1–10.
van der Schaft, A. (2000). L2 -Gain and Pas-
sivity Techniques in Nonlinear Control. Sec-
ond revised and enlarged edition. Commu-
nications and Control Engineering Series.
Springer-Verlag.
Wiklund, M., A. Kristenson y K. J. Åström
(1993). A new strategy for swinging up an in-
verted pendulum. En: Proc. IFAC 12th World
Congress. Vol. 9. pp. 151–154.