Está en la página 1de 11

Control de un péndulo mediante

realimentación de estados
Sergio Hernández, Juan Zuluaga, Sebastián Mariño
Bogotá, Colombia
sergio_hernadez@javeriana.edu.co
zuluaga_jp@javeriana.edu.co
marino_sebastian@javeriana.edu.co

Abstract— Este documento presentará el II. DESARROLLO DE CONTENIDOS


diseño de control mediante realimentación de
estados para un péndulo invertido sobre un A. Planteamiento del problema
carro, se tratará el diseño mediante
linealización alrededor de un punto de trabajo
del Angulo del sistema, se presentan
diferentes simulaciones alrededor de este
diseño y sus respectivas conclusiones.

Nota: Anexos a este documento se encuentran


los archivos de código y simulación, a lo largo
de este informe se referirá a algunos
comandos y códigos usados para el desarrollo
de esta práctica, si desea verlos solo debe
buscar el titulo de lo que se busca en el código
y ver su respectivo comentado de desarrollo.
Proyecto_ controles corresponde a la primera
parte del informe y el extrabono a
cartpolesystem.m
Figura 1. Sistema por controlar.
I. INTRODUCCIÓN Para el sistema de la figura 1 se quiere
desarrollar un sistema de control por
El estado de un sistema dinámico es una
realimentación de estados
colección de variables que permiten la
El sistema cuenta con los siguientes
predicción del desarrollo de un sistema a
parámetros:
futuro. En este proyecto de investigación, se
explora la idea la idea de diseñar la Masa del carro M =0.5
dinámica de un sistema a través de Masa del péndulo m=0.2
realimentación de estados. La ley de control Largo del péndulo L=0.3
por realimentación sería desarrollada paso a Constante de gravedad g=9.81
paso usando una única idea: la ubicación de Fricción del carro K=0
los auto valores del sistema en lazo cerrado
Fricción del péndulo P=0
en posiciones deseadas.
Fuerza aplicada al carro
F=0.1
Momento de inercia del péndulo
1
I= ∙ m∙ L2
12
Teniendo en cuenta el siguiente modelo
dinámico, siendo θ el ángulo del péndulo y
X el desplazamiento del carro, estas son las
dos ecuaciones que describen el
comportamiento dinámico del sistema:
1
θ̈= [ Lm ( gsin ( θ )− ẍ cos ( θ ) ) −p θ̇ ]
1+ L2 ∙m
Ecuación 1. Para encontrar la matriz de estados se hace la
1 matriz Jacobiana respecto a las variables del
ẍ= [ F−Lm ( θ̈ cos ( θ )−θ̇2 sin (θ ) ) ]
−K ẋ para cada posición como lo explica la
sistema
M+m siguiente figura:
Ecuación 2.
Donde las variables del sistema son:
θ , ω , xy v
Para linealizar primero se tienen que
encontrar los valores promedio de las
variables de estado:
Para esto se deben igualar a 0 todas las
derivadas de las ecuaciones 1 y 2. Figura 2. Matriz Jacobiana que describe los
1 estados del sistema.
Lmgsin ( θ́ )=0
1+ L2 ∙ m Para encontrar todas las derivadas de la
Ecuación 3. matriz Jacobiana, se utilizó el siguiente
Despejando θ de la ecuación 3 da que el código en la herramienta de cómputo
promedio de esta variable debería ser igual a Matlab, donde la variable ‘a’ que se define
0. en el código es igual a ẇ y la variable ‘y’ es
v̇ ,la variable θ en el código se expresa
F́ como ‘x’, para derivar simplemente se
=0 configura la función diff() en su primera
M+m
Ecuación 4. posición se debe poner la función a derivar
y en la segunda respecto a qué variable .
Despejando F de la ecuación 4 da que el syms x;
promedio de esta variable debería ser igual a syms F;
0. syms w;
y=(30.18537*sin(x)4.4*F*cos(x)
Se puede decir que el promedio de todas +0.264*w^2*sin(x)*cos(x))/(1-
las variables debe ser igual a 0, debido a que 0.264*cos(x)*cos(x));
ώ es la derivada de θ́ y da igual a 0, x́ no g=diff(y,F);
subs(g,0)
está presente en la ecuación 1 y 2 así que
a=((1.43*F) -(2.589*cos(x)*sin(x))-
debe ser igual a 0 y v́ es la derivada de x́ .
0.0858*w*w*sin(x))/(1-(0.264*cos(x)*cos(x)));
x́=0 z=diff(a,F);
θ́=0 subs(z,0)
ώ=0
v́=0 Las siguientes derivadas fueron las que se
realizaron con la herramienta de cómputo
F́=0 Matlab.
d ẇ
Al resolver el sistema de ecuaciones 2x2 =0.35 w 2+ 41.0127
de las ecuaciones 1 y 2 se expresan las dθ
variables de la siguiente manera d ẇ
=0
θ̇=w dw
d v̇
−4.4 ∙ F ∙ cos ( θ ) +30.181 sin ( θ ) +ω 2 ∙ 0.264dθ =−0.1165
∙ sin w2−3.5176
⁡(θ)∙ cos ⁡(θ)
ẇ=
1−0.264 cos2 (θ) d v̇
=0

ẋ=v Para la matriz B, se realizó el mismo proceso,
pero ahora con respecto a la entrada:
−0.0858∙ ω ∙ sin ( θ )−2.59 ∙ sin (θ ) ∙ cos ( θ )+1.43 Fd ẇ =−5.978
2
v̇= dF
1−0.264 cos2 ( θ )
d v̇ d v̇ −2.59
=1.943 = =−3.519
dF dθ 1−0.264
Al reemplazar las variables por su promedio d v̇ −2 w ∙ 0.0858θ
se encontraron la siguiente matriz: = =0
dw 1−0.264
θ̇ 0 1 0 0 θ

[ ][ ][ ]
d v̇˙ 1.43
ω̇ 41.0127 0 0 0 ∙ ω = =1.94
= + dF 1−0.264
ẋ 0 0 0 1 x
v̇ −3.52 0 0 0 v Como se evidencia la aproximación realizada es
totalmente valida debido a que los valores
0 hallados sin aproximar son prácticamente iguales

[ ]
−5.978 ∙ ⌈ F ⌉
0
1.943
a los hallados con la aproximación de pequeño
Angulo.

Polos del sistema


Debido a que la salida es el Angulo, la
Para encontrar los polos del sistema con las
ecuación de estados de salida es:
características de un tiempo de
θ

[]
estabilización de 10s y respuesta
[ y ] =[ 1 0 0 0 ] ∙ ω críticamente amortiguada se encontró que la
ecuación de salida ante una entrada paso de
x
v dicha respuesta está dada por:
t t
Otra forma para encontrar los valores de las t
y ( t ) =ku ( t )∗(1−e − e τ )
τ

matrices es igualando sin ( θ )=θ y τ


Para despejar el valor de τ, se debe
cos ( θ )=1, debido a que θ va a tener una
reemplazar el tiempo por 10s debido a que
variación muy pequeña se puede hacer dicha
aproximación, de modo que las ecuaciones se quiere que se estabilice en ese tiempo, ya
quedan del siguiente modo: que la amplitud del escalón unitario no
interfiere con el resultado de τ, se optó por
−4.4 ∙ F+ 30.181θ+ ω2 ∙ 0.264 θ
ẇ= reemplazar k=1, se decidió un criterio del
1−0.264 2% de tiempo de estabilización, por tanto y
(10) =0.98, así que la ecuación quedo del
Al derivar con respecto a cada variable para siguiente modo:
las posiciones de la segunda fila y reemplazando
las variables por su promedio:
10 10
d ẇ 30.181 10
=
dθ 1−0.264
=41,0067 (
0.98= 1−e − e τ t ≥ 0
τ
τ
)
Al despejar tao, se llegó a la siguiente
d ẇ 2 w ∙0.264 θ expresión:
= =0
dw 1−0.264 τ =1.714
Al tener tao se pueden encontrar los polos
d ẇ −4.4 que actuaran para que el sistema tenga estas
= =−5.97 características:
dF 1−0.264
−1
S1,2= =−0.5834
Ahora con la ecuación de la derivada de la τ
velocidad se realizó el mismo proceso: Ya que el sistema es de cuarto orden se
deben poner otros dos polos lo
−0.0858∙ ω 2 θ−2.59 ∙θ+1.43 F suficientemente lejanos como para tomar los
v̇=
1−0.264 hallados como dominantes, por tanto, se
multiplico este polo por 15 para que estén
por lo menos 1 década alejados entre sí:
S3,4 =−8.751
Teóricamente Diseñe el Sistema 1 ¿−5.97 k 2+1.94 k 4=18.6688
Con el criterio del 2% 2 ¿ 1.94 k 3−5.97 k 1−41.01=97.3417
S1,2=-0.5834 S3,4=-8.751 3 ¿−58.55 k 4=95.31054
0 1 0 0 4 ¿ 58.55 k 3=26.0644
A=
[
41.0127
0
−3.52
0
0
0
0
0
0
0
1
0
] Despejando se obtuvieron los siguientes
valores de k

k 1=−23.319; k 2=−3.6561 ; k 3=−0.445 ;


0 k 4=−1.6278
B=
[ ]
−5.978
0
1.943
Diseño del sistema mediante Matlab
Para realizar el diseño mediante Matlab se
definieron las matrices A y B, mediante el
comando acker y definiendo los polos
deseados se obtiene el vector de ganancias
K= [k1 k2 k3 k4] k; en la figura 3 se puede observar el código
utilizado en Matlab y en la figura 4 el vector
A-B*K= de ganancias resultante
0 1 0 0 0 0 0 0

[ 41
0
−3
0
0
0
0
0
0 0
][
0 − −5.9 k 1 −5.9 k 2 −5.9 k 3 −5.9 k 4
1 0
1.9 k 1
0
1.9 k 2
0
1.9 k 3
1
1.9 k 4
]
Figura 3. Código Para encontrar las K
A-B*K=Ac=
0 0 0 0

[ 41.0127+5.94 k 1 5.97 k 2
0 0
5.97 k 3 5.97 k 4
0
]
Figura 14. Resultados de K
−3.52−1.94 k 1 −1.94 k 2 −1.94 k 3 1.94 k 4
Se observa que las k encontradas
teóricamente son iguales a las encontradas
det (sI – Ac) =
con Matlab, lo que convierte a esta
det
herramienta a un recurso confiable, para ver
s −1 0 código y la0 constante puede referirse al
este

[ −41.0127−5.94 k 1 s−5.97 k 2
0
3.52+1.94 k 1
0
1.94 k 2
−5.97
s
k 3 −5.97
archivo
junto
1.94 k 3
a este
k4
documento.
−1
s+1.94 k 4
Arquitectura en
]
proyectocontroles.m adjuntado

Simulink sistema
Para sacar este determinante se utilizó la linealizado
herramienta de computo de Matlab, el
resultado que se obtuvo fue:
s4 −s3 ( 5.97 k 2−1.94 k 4 )+ s 2 ( 1.94 k 3−5.97 k 1−41.01 )+ s (−k 4∗58.55 )

Por lo tanto, se va a igualar respecto a los


polos ya establecidos previamente
( s+0.5834 )2∗( s+8.751 )2
s4 + 18.6688 s3 +97.3417 s2 +95.31054 s+ 26.0644

Al igualar las ecuaciones se obtienen 4 Figura 5. Arquitectura linealizada


ecuaciones y 4 incógnitas
En la figura 5 se puede observar la
arquitectura del sistema linealizado en
simulink que es igual a u=-kx, donde u
representa la salida del sistema, esta consta
del bloque state que está definido como se
puede observar en la figura 6, se introdujo
una condición inicial al Angulo para ver el
control sobre el sistema; además tiene un
vector con las ganancias k1, k2, k3 y k4 ya
encontradas previamente, y conformado con
otro bloque de ganancia con el cual está
conformado por 1 y 0, poniendo en 1 la
posición de la salida que se quiere observar.

Figura 7. Salida de estados

Simulación Acción de control sistema


linealizado

Figura 6. Bloque Matriz de Estados

Simulación estados del sistema linealizado

En la figura 7 se puede observar la gráfica


de las cuatro salidas del sistema respecto al Figura 8. Acción de control
tiempo, como se puede apreciar en el cursor,
aproximadamente en 10 segundo el sistema En la figura 8 se puede observar la acción
se estabiliza lo cual era lo esperado según el de control, esta es la respuesta del
diseño realizado. controlador ante la perturbación de un
El ángulo tiene una condición inicial de Angulo diferente de 0 que el sistema vuelva
pi/40 lo cual es aproximadamente 0.08, la la posición estable definida al hacer la
línea correspondiente al ángulo es la azul la linealización, la acción de control se
cual se puede apreciar que empieza en 0.08 encuentra entre el nodo del bloque state-
aproximadamente; la línea de color rojo es space y el bloque de ganancia -1, ya que la
la velocidad angular, la línea de color acción de control es -kx.
amarillo es la posición y por último la línea Arquitectura en Simulink sistema no
de color morado es la velocidad. Todas linealizado
estabilizándose aproximadamente en 10
segundos con el criterio del 2% propuesto,
como ya se había mencionado anteriormente
ẋ=vθ̇=w
Donde F es la entrada; en la figura 12 se
puede observar cómo son representadas
estas ecuaciones mediante bloques.

Figura 9. Arquitectura sistema no lineal

En la figura 9 se pude observar el


esquemático en simulink del sistema no
lineal, consta de un sistema con una
realimentación negativa, donde el bloque
“Gain 2” es un vector con las ganancias k1,
k2, k3 y k4 ya encontradas previamente en Figura 12. Sistema no lineal
el apartado “Teóricamente diseñé el
sistema” como se puede
observar en la figura 10

Figura 10. Bloque ganancias.

El bloque “Gain 3” es un vector que se usa


para ver solo una salida ya que el sistema Figura 13. Comparación no lineal vs no
consta con 4; esta salida se escoge con un lineal
vector de 4 posiciones poniendo un 1 en la
que se quiere observar, en la figura 11se En la figura 13 se aprecia la respuesta del
ajusta ese vector para ver θ Angulo con el sistema lineal y no lineal,
como se puede ver las respuestas son
iguales, esto se debe a que se está
trabajando con ángulos iniciales pequeños,
cercanos a 0°, esto demuestra que la
linealización es válida y que se desarrolló
correctamente, antes ángulos iniciales más
grandes el controlador no es capaz de
ejercer la acción de control necesaria para
estabilizar el sistema, se ve que el sistema
Figura 11. Bloque K*uvec
logra estabilizarse en 10s como se había
La parte principal de esta arquitectura es el planteado.
bloque “subsystem”, en la figura se puede LQR (Linear-Quadratic Regulator):
observar el diseño al interior de este bloque, la teoría del control óptimo se preocupa por
que representa las ecuaciones: operar sistemas dinámicos a un costo
mínimo. En el caso de que un sistema
ẇ=30.18537∗sin ( θ )−3.077 cos ( θ )∗ v̇ dinámico esté descrito por una serie de
ecuaciones
2 lineales diferenciales y el costo
v̇=1.43 F−0.0858 cos ( θ )∗ ẇ−0.0858∗w ∗sin ( θ )
está definido por una función cuadrática, a algoritmo encontrará una configuración
esto se le define como un problema LQ óptima para el controlador que minimiza las
(lineal cuadrático). Una de las soluciones en variaciones indeseadas. La magnitud del
la teoría de control está dada por el control está incluida en la función de costo.
regulador linear-cuadrático (LQR), un El algoritmo LQR reduce la cantidad de
controlador realimentado que está descrito trabajo hecho por el controlador a propósito
por las siguientes ecuaciones, LQR es parte de optimizarlo. Sin embargo, el ingeniero
de la solución del regulador lineal- aún necesita especificar los parámetros de la
Gaussiano, el cual es uno de los problemas función de costo y comparar los resultados
fundamentales de la teoría del control. con los que el sistema desearía tener,
Para un sistema continuo, finito y lineal en Frecuentemente esto significa que la
el tiempo descrito por: construcción del controlador será un
ẋ= Ax+ Bu proceso iterativo donde el usuario juzga
Con una función de costo cuadrática dada cuál sería un valor óptimo para que el
por: controlador ajuste los parámetros para
t1 producir un sistema consistente con metas
T T T T de diseño.
J=x ( t 1 ) xF ( t 1 ) + ( x Qx +u Ru+2 x Nu ) dt

t0 El algoritmo LQR esencialmente es una
Simplificado por la ley de control como: manera automatizada de buscar un
u=−Kx controlador apropiado de realimentación de
estados. En ingeniería también se puede
Donde K está dado por:
escoger completamente la realimentación de
K= R−1 ( Bt P ( t ) + N T ) estados, también conocido como la
P se encuentra resolviendo la ecuación ubicación de los polos, donde se encuentra
diferencial en tiempo contínuo de Ricatti: una clara relación entre los parámetros del
− Ṗ t =Q−(B P t + N ) R (P t B+ Ncontrolador y su comportamiento. Encontrar
T T −1
( ) ( ) ( ) )
T los factores de ponderación correctos
+AP(t) + A P(t )
limitan el uso de este algoritmo.[1]
Con la condición: Controlador swing up:
P ( t 1 ) =F ( t 1 ) Un controlador Swing up del sistema de un
Las condiciones de primer orden son: péndulo invertido debe divergir el péndulo
1) Ecuación de estados: desde su posición estable, posición donde
ẋ= Ax+ Bu está colgando hasta su posición inestable,
2) Co-ecuación de estados donde se tiene que mantener. Por lo tanto,
T un controlador
−λ=Qx+ Nu+ A λ swing-up y el
3) Ecuación estacionaria controlador de
T T
0=Ru+ N x+ B λ estabilización
4) Condiciones de borde tienen que ser
x ( t 0 ) =x 0 diseñados
individualmente
λ ( t 1 )=F (t 1) x( t 1 ) en el caso de
Las configuraciones de un control regulador estar utilizando
para los procesos de una máquina o sistema una técnica
dinámico (como un avión o un reactor basada en el
químico) son encontrados por algoritmos modelo lineal, como, por ejemplo, la teoría
matemáticos que minimizan la función de del control óptimo.
costo con factores de ponderación Hay diferentes enfoques en el control
proporcionados por un humano (ingeniero). swing-up uno de ellos es realimentación
Frecuentemente la función de costo está positiva bang-bang control, esta técnica es
definida como la suma de las desviaciones bastante sensible al error y ruido del sistema
en las medidas de un sistema, como por debido a la naturaleza de realimentación,
ejemplo la altitud, temperatura o inclinación debido a que no es una técnica muy
comparados con los valores deseados de confiable. El segundo enfoque utiliza
estas medidas, con esta información el realimentación negativa bang-bang control,
la cual ha sido comprobada ya en brazos ‘Tustin’ tal como se hizo teóricamente, y se
robóticos, en este caso no es tan sensible al discretizo con el mismo comando la planta,
ruido, se puede decir que es confiable y pero esta vez con ‘Zoh’ para poder observar
robusta. El mayor propósito del controlador la acción de control del controlador
swing up es seguir la vibración natural de discretizado, en Fig.16, se observa el
un péndulo, busca gradualmente pasar de controlador discretizado con Matlab y se
amortiguar la vibración a vibrar respecto a evidencia que los resultados teóricos son
su frecuencia de resonancia de una manera iguales a los hallados mediante el comando
controlada, esto hará que el péndulo sé “C2d”.
columpie más y más, hasta que cuando se
encuentre cerca a la vertical, la
realimentación por estados tomará el control
del sistema y estabilizará el sistema
completo, incluido el péndulo invertido. [2]
BONO
Para discretizar el controlador PID de la
práctica anterior, se optó por utilizar el
método “Tostin” de este modo todas las “s”
se reemplazan por:
2
∗z−1 Figura 14 Continua vs discreta
Ts
s=
z +1
Teniendo en cuenta la función de
transferencia de un controlador PID la cual
es:
Ki
PID ( s )=Kp+ + Kd∗s
s
Realizando el desarrollo matemático se
obtiene:
Ki∗Ts Kd∗z−1
∗( z+ 1 ) ∗2
2 z +1
Kp+ +
z −1 Ts

Ki∗Ts Kd∗2
∗( z+ 1 )2+ ∗( z−1 )2
2 Ts
Kp+
(z−1)(z+1)

Ki∗Ts 2 Kd KiTs Kd∗2 KiTs 2 Kd


(
z2 Kp+
2
+
Ts
+2 z ) (
2

Ts
+(
2
+
Ts )
−1)
2
z −1
Ahora reemplazando Kp por 1.093, Ki por
2.4624 y Kd por 0.12139 y Ts=0.002s, este
tiempo se escogió ya que se quería una
frecuencia de muestreo grande para cumplir
con Nyquist, se obtiene:
122.48 z 2−242.77 z +120.39
z 2−1

Mediante el comando “C2d” en Matlab se


discretizo el controlador con la técnica
Figura 15. Discretización

En la figura 14 se muestra la respuesta paso


del sistema discreto realimentado vs el
sistema continúo realimentado también,
donde se ve una clara fidelidad del sistema
muestreado ante el inicial o continuo, lo que Figura 17. Estabilidad
demuestra que la discretización fue
desarrollada debidamente, en la figura 15 se Con el fin de observar la importancia del
ve el acercamiento a estas dos graficas para tiempo de muestreo se procede a discretizar
poder notar mas la diferencia entre el el controlador mediante Matlab con un
continuo y el discreto. tiempo de muestreo de 0.02 segundos, el
resultado se muestra en la figura 18, como
se ve las características del PID cambian
debido al número de muestras que se toman
por segundo, siendo más fiel la
discretización con tiempos de muestreo más
pequeños.
Figura 16. Función Discreta con Ts=0.002s

Para ver la estabilidad del sistema


realimentado ya discretizado mediante el
comando en Matlab “pzplot” se graficaron
los polos y los zeros de la siguiente función
de transferencia discreta:

0.039 z 7 −0.12 z 6 +0.04 z 5 +0.19 z 4−0.19 z 3−0.04 z2 +0.11 z−0.4


z 8−4 z 7+ 4 z 6 +4 z5 −9.8 z 4 +4 z3 + 4 z 2−3.88 z+ 0.96

En la figura 17 se ve un acercamiento a los


polos y zeros, ya que a la derecha y a la Figura 18. Respuesta discretizada 0.02s
izquierda existe simetría solo toma un lado
y se confirma que el sistema es estable, Aunque sea el mismo controlador, el tiempo
aunque algunos polos se encuentren el de muestreo puede afectar mucho en su
borde del circulo unitario. respuesta y así generando más error.
III. Extra-Bono del bloque “swing up controller function”,
esta ecuación representa el control swing-
up, en donde hay una oscilación causada por
una energía inyectada que esta representada
por E-Eo.

u=F =( M +m)¿

Donde Eo=0.1
θ̇ 2
E=( M + m) gL 0.5
[ ( ) ωo
+ cos ( θ )−1
]
mgL
Figura 19. Esquema LQR-SWING UP

La figura 19 corresponde al esquemático de


Donde ωo=
√ 4I

simulink del archivo anexo En la figura 21 se ve el control del ángulo si


“cartpole_system”, el cual corresponde al se le aplica un ángulo inicial de pi(3.1416
esquema LQR-SWING UP, en el bloque rad), como el ángulo es pequeño y la
switch controller se puso una condición de energía inyectada es grande, se opto por
pi/6 debido a que se desea que cuando el igualar la contante 0.4 para poder observar
ángulo fuera igual a 30° luego de empezar las oscilaciones del swing-up, como se
con el proceso de la parte del SWING-UP,el había mencionado antes, cuando el ángulo
sistema dejara de lado el SWING-UP, y es 30°(0.519 rad) mientras se está
operara con el control tipo LQR y en el ejerciendo el control swing-up el sistema
bloque, en el bloque “LQR vector “ se cambia al control LQR para estabilizar el
digitaron las constantes halladas mediante el ángulo en 0°, en dicha figura se observa que
código LQR, para ver este código referirse el control swing-up actúa durante 6.57s y
al archivo anexo .m y buscar el título LQR, luego de este el LQR toma acción.
estas contantes encontradas fueron:
[-18.0104 -2.9239 -1.0 -1.5073], estas
constantes se encontraron con las matrices
hallados luego de linealizar el sistema como
parámetros de entrada al comando “LQR”.
En el bloque “modelo no lineal del péndulo”
se encuentra lo enunciado en la figura 12.
En el bloque “Condición del switch de
controladores”, se conecto teta con el
enable, ya que para este ejemplo se quiere
probar solo con un ángulo positivo.

Figura 21. Angulo Control SWING_UP-LQR

Figura 20. Esquema swing-up controller

En la figura 20 se puede observar la


siguiente ecuación representada en bloques
en simulink, que fue implementada dentro
 El controlador diseñado cumple
con las especificaciones
propuestas, lo que evidencia que su
diseño fue llevado a cabo
correctamente.
 La estabilización del sistema
siempre va a depender de los datos
definidos en la etapa de
linealización.

REFERENCIAS

[1] Linear–quadratic regulator. (2020). Retrieved


Figura 22. Posición Control SWING_UP- 18 May 2020, from
LQR https://en.wikipedia.org/wiki/Linear
%E2%80%93quadratic_regulator
En la figura 22 se observa la posición
mientras se ejerce el control, se ve que [2] (2020). Retrieved 18 May 2020, from
durante los primeros 6 segundo se ejerce el https://pdfs.semanticscholar.org/47ef/ea6c73ef
96ae933a378d4bf7ff3245a8584d.pdf
control swing-up y luego actúa el LQR, se
ve que el control mueve el carro hacia
adelanta y atrás mientras avanza para lograr
llegar al ángulo 30°.
Si desea ver las simulaciones de este
controlador diríjase al archivo anexo
“cartpolesystem” y ábralo en simulink.

IV.CONCLUSIONES
 Al discretizar, entre más tiempo de
muestreo se le aplique al sistema,
más va a conservar las
características originales del
controlador.
 El control swing-up es un control
que necesita linealizar el sistema
para un correcto funcionamiento,
pero no logra estabilizar el sistema,
la parte de control del LQR
necesita un ángulo pequeño ya que
se calculó con el sistema lineal, por
tanto, la unión de estos dos
controles logra un control muy
robusto debido a que, aunque el
ángulo inicial sea muy grande el
control Swing up reducirá el
ángulo y en ese momento el
control LQR actuara para
estabilizar dicho ángulo.
 La linealización es un proceso muy
eficiente ya que, si se ingresan
valores cercanos al punto de
linealización, el control diseñado
con el sistema lineal funcionara
con el modelo no lineal,
controlando perfectamente como se
quiere los parámetros del sistema.

También podría gustarte