Está en la página 1de 7

CONTROL DE ANDAR DE ROBOT BÍPEDO

TIPO COMPÁS
1ro Caceres Huaman, Sebastian 2do Mendoza Choquemamani, Jorch
Universidad nacional de San Agustı́n Universidad nacional de San Agustı́n
Ingenierı́a Electrónica Ingenierı́a Electrónica
Arequipa, Perú Arequipa, Perú
scaceresh@unsa.edu.pe jmendozach@unsa.edu.pe

Abstract—This research project proposes a method to control paso iguale al anterior [1].
the gait of a bipedal robot. To achieve this, mathematical and En [7] se analiza dos modelos de un robot bı́pedo tipo compás
dynamic models have to be developed, using the Euler-Lagrange en donde se concluyen con los modelos dinámicos de cada
equations for this.
It will be solved with the LQG Optimal Control method, with the uno. Se observa que la dinámica del robot se dio mediante un
design of a Compensator that includes a controller and a Kalman análisis en sus energı́as de cada articulación, para ası́ realizar el
Filter Observer, also the tests in limit cycle for each step, in both método de “Lagrange” (diferencia de energı́as) en la obtención
joints of the legs. In this Report, they present simulation results de las ecuaciones dinámicas del robot bı́pedo.
on a compass-type bipedal robot model to validate the results. Debido a que se analizó en [7] dos modelos distintos de la
dinámica del robot bı́pedo; este realiza finalmente una relación
keywords: Compass-type bipedal robot, Control LQG, Lin-
de ambos modelos para llegar a una forma más practica en el
earization, Limit Cycles.
control del robot; que es lo que se busca.
I. INTRODUCCI ÓN
A. OBTENCIÓN DEL MODELO DINÁMICO
Una caracterı́stica principal del ser humano es el poder de-
splazarse en su entorno, a esto se le llama locomoción bı́peda. Se obtuvieron dos modelos dinámicos para un mismo robot,
En un robot bı́pedo, imitar estos movimientos es muy difı́cil y la diferencia entre ellos, es la selección de las coordenadas
debido a las grandes diferencias cinemáticas y dinámicas entre generalizadas. Se observa que el modelo obtenido con las
el ser humano y un robot. Al estudiar la locomoción bı́peda, coordenadas Absolutas, es más simple en comparación con
se entra en un campo extenso que permite entender mejor la el modelo obtenido con coordenadas relativas.
marcha humana y las estrategias de control, con la finalidad de En (1), muestra el Modelo Dinámico que se utiliza, junto a
vincular estos conocimientos en aplicaciones médicas, como los valores internos de la misma.
lo puede ser para el diseño de prótesis, exoesqueletos para M (θ)θ̈ + C(θ, θ̇)θ̇ + g(θ) = τ (1)
rehabilitación muscular o de uso cotidiano; también en un
ambiente lúdico (juguetes educativos, o animaciones virtuales 
ma2 + ml2 + mc l2 mblcos(θs − θns )

M̃ (θ) = (2)
para videojuegos o cine); de desarrollo cientı́fico o civil, para −mblcos(θs − θns ) mb 2

propiciar el acceso en áreas de riesgo para el humano; o en  


0 −mlbsin(θs − θns )θ̇ns
su defecto, en el área militar. C̃(θ, θ̇) = (3)
mlbsin(θs − θns )θ̇s 0
La principal ventaja de los robots bı́pedos sobre otro tipo
−mga sin(θ ) − mgl sin(θ ) + m gl sin(θ )
de robot móvil es que pueden desenvolverse en superficies g̃(θ) =
s s c s
(4)
irregulares, escaleras, etc., sin embargo, la complejidad en el mgb cos(θns )
diseño y control aumenta considerablemente por lo que en la
actualidad son un desafı́o de ingenierı́a.
B. LINEALIZACIÓN DEL SISTEMA
II. METODOLOG ÍA Una vez definida la Ecuación Dinámica del sistema (1),
El robot bı́pedo tipo compás es el modelo más simple, este el objetivo es obtener la planta linealizada en un punto de
consta de un par de piernas rı́gidas, ası́ como una articulación equilibro. En (5), se observa la forma en espacio de estados.
en la cadera y otra en el pie de soporte. Este robot se puede
analizar en ausencia de sus pares que propicien la locomoción, ẋ = Ax + Bu, (5)
en su condición pasiva; colocándose ası́ sobre una pendiente y = Cx,
(en este caso Á, debido a la ganancia de energı́a en cada paso,
a razón de cambio en el potencial de la pendiente, al final cada Los puntos de Equilibrio de los estados, serán [0;0;0;0], en
impacto con la superficie disipará energı́a extra para ası́ cada base a esto la nueva planta linealizada, se muestra en (6).
Se diagonalizan los valores de la Tabla 1, y se aplican de

0 0 1 0
 la siguiente forma.
0 0 0 1
A= (6)
 
0.2859189 0.2457041 −0.0000441 0.0003075
−21.014031 1.4703107 −0.003998 0.0000441 AP = sx∗ A∗ sx−1 (12)


0 0

BP = sx∗ B ∗ su−1 (13)
0 0
B= (7)
 
0.0616361 0.0088429
0.0088429 0.8012687 CP = sx∗ C ∗ sx−1 (14)

1

0 0 0
 DP = sx∗ D∗ su−1 (15)
0 1 0 0
C= (8) Se forman los nuevos valores de la matriz Escalonada para su
0 0 1 0
0 0 0 1 posterior adición de un Integrador.
0 0 1 0
 
0 0
 
0 0 0 1
Ap =  (16)
 
0 0 0.2859189 0.0676275 −0.0000441 0.0000846
D= (9)
0 0 −76.348094 1.47003107 −0.0145256 0.0000441
0 0

0 0
 
C. CONTROLABILIDAD Y OBSERVABILIDAD
 0 0 
Bp =  (17)
Como se Observa en (8), se están considerando todos los 0.2023 0.101 
0.1055 33.383
estados de la Planta, de esta manera, se procede a reducir
solo a los estados de posición angular de las 2 piernas.
R. Kalman en 1960 presentó dos conceptos previos a 
1 0 0 0

implementar; controlabilidad y observabilidad [3]. Cp = (18)
0 0.2752398 0 0

La Matriz de Controlabilidad según [3] esta dada por:


 
M = B A ∗ B ... An−1 ∗ B 0 0
 
(10) Dp = (19)
0 0
De la ecuación (6) y (7), tenemos que las matrices [A,B],
forman una matriz de Controlabilidad de Rango 4. El objetivo de añadirle un integrador a nuestra planta es para
reducir el error en régimen permanente y ası́ obtener una
La Matriz de Observabilidad se puede obtener de la forma: mejor respuesta.
  Utilizando la referencia [4] se incrementa el tamaño de la
C planta quedando de la siguiente manera.
 C ∗A 
O=  (11)
 ...   
0 0 1 0 0 0
C ∗ An−1  0 0 0 1 0 0 
 0.28591 0.067627 −0.000044 0.0000484 0.200239 0.10140
 
De la ecuación (6) y (8), tenemos que las matrices [A,C], Ap = 
−76.3480 1.47003 −0.014525 0.00004 0.10550 33.3837

forman una matriz de Observabilidad de Rango 4.  0 0 0 0 0 0 
Al ser ambas matrices del mismo rango, se concluye que 0 0 0 0 0 0
(20)
todos los modos inestables en el sistema son controlables y
observables.
 
0 0
0 0
D. ESCALONAMIENTO E INTRODUCCIÓN DE INTE- 0 0
 
Bp =  (21)
GRADOR EN LA PLANTA 0 0

1 0
Para mejorar la respuesta a diferentes frecuencias, se 0 1
realiza un escalonamiento a la planta, los valores asignados
son los que se muestran en la Tabla 1.  
1 0 0 0 0 0
Cp (22)
0 0.2752398 0 0 0 0
TABLA 1: Valores de Escalonamiento
DESCRIPCIÓN VALORES  
Escalonamiento de Entrada [0.9614, 0.2753] 0 0
Dp (23)
0 0
Escalonamiento de Estado [3.157, 11.47, 3.157, 11.47]
Escalonamiento de Salida [3.157 3.157]
E. CALCULO DEL LQG Donde:
Debido a su notable optimización de control, se propuso
como candidato principal el Control LQG. El Control Ξ=I
Cuadrático Gausseano, se trata en realidad de un compensador
que es ampliamente usado en cuanto ”optimización de Θ = µI
recursos” y sencillez. Siendo (31) el valor de ganancia del observador H.
A continuación, se detallará el diseño del Controlador,
−0.5636807
 
10.230774
Observador y Compensador para una planta ya dada en el −2.0479627 53.993822 
punto Anterior.  2.4932348 −5.7530009
 
H1 =  (31)
−30.485741 220.12515 

−14.933319 −23.719563
1) CONTROLADOR LQR: Se da el control en (24). 19.920749 11.504356

u = −Gx(t) (24) 3) COMPENSADOR KS: Obtenidas la ganancia G de la


ecuación de Riccati y H del filtro de Kalman, se procede a
Esta matriz de ganancia G se resuelve calculando la Ecuación
calcular el Compensador Ks donde sus nuevos estados ahora
Algebraica de Ricatti; teóricamente se tiene de [4] y se reduce
son:Ak ,Bk ,Ck ,Dk.
a calcular.

G = R−1 B T X (25) 
−10.230774 0.1551474 1.

 2.0479627 −14.861247 0. 1. 
Donde:  −2.207316

1.6510821 −0.0000441 0.0000846 

−45.862353 −59.116881 −0.0145256 0.0000441 
 
AS =  ...
0 = −XA − AT X − C T C + XBR−1 X (26) −31701.094 68.083769 −3411.489 9.4470674 
 17.396811
 −8712.5152 1.1779374 −262.88208
 31716.028 −61.555202 3411.489 −9.4470674
−37.31756 8709.3487 −1.1779374 262.88208
Para Scilab existe la función “riccati” que nos da como  
0. 0. 0. 0.
resultado nuestra unica variable desconocida ”X” con un  0. 0. 0. 0.
despeje matricial calculamos la ganancia G del controlador.  0.2023976

0.1014057 0. 0.

 0.1055002 33.38377 0. 0.
 
Es necesario obtener previamente la matriz de ponderación ... 
 −37.13278 −0.3423116 0. 0.
 (32)
del estado y una matriz de ponderación de control. −0.3423116
 −132.48258 0. 0.

 37.13278 0.3423116 0. 0.
0.3423116 132.48258 0. 0.
Para la matriz de ponderacion es necesario crear la variable
“rho” que nos servirá para la recuperación del control barato;
 10.230774 −0.5636807
esta variable debe ser pequeña 10−9 . De donde se calcula: −2.0479627 53.993822 
 2.4932348
 −5.7530009
−30.485741 220.12515 
BS = 
−14.933319
 (33)
R=ρ∗I (27)  −23.719563
 19.920749 11.504356 
0. 0.
 
0. 0.
Obteniendose finalmente la matriz G.
 
0. 0. 0. 0. 0. 0. 1. 0.
CS = (34)
0. 0. 0. 0. 0. 0. 0. 1.
−37.132783 −T
 
31716.028
−61.555202 8709.3487 
 3411.489 1.1779374 
 
G1 =  (28) 
0. 0.

−9.4470674 262.88208 
 DS = (35)
 37.132783 0.3423116  0. 0.
0.3423116 132.48258

2) OBSERVADOR FILTRO DE KALMAN: Se conoce F. SENSIBILIDADES S y T


perfectamente que un sistema es perturbado por ruido en los
estados y por ruidos en la medida. El Observador de Kalman Las normas de Sensibilidad y Sensibilidad complementaria
nos ayuda a reducir estos ruidos creando una variable “mu”, nos aseguran una muy buena estabilidad robusta. Calculados
el cual define la calidad del sensor. los nuevos estados de la malla del compensador y la planta
El filtro de Kalman para hallar el valor de la matriz H se en bucle abierto se grafican las sensibilidades de nuestro
calcula de forma parecida al control LQR, donde se tiene de sistema con las siguientes Ecuaciones.
[4] lo siguiente:

H T = ΣC T Θ−1 (29) S(s) ' [I + G(s)K(s)]−1 (36)

0 = −AΣ − AT Σ − LΞLT + ΞC T Θ−1 CΣ (30) T (s) ' G(s)K(s)[I + G(s)K(s)]−1 (37)


G. CICLO LIMITE
Una trayectoria cerrada en el plano de fase tal que otras
trayectorias no cerradas tienden en espiral hacia ella, desde el
interior o desde el exterior, cuando el tiempo tiende a infinito,
se conoce como ciclo lı́mite.
El ciclo limite muestras si las trayectorias tienden a converger
o divergir a la curva cerrada, en ella se muestra en el eje
horizontal, el Grado de la Articulación de la Pierna, mientras
que en el eje vertical, se muestra la Velocidad Angular de la
Articulación.
En este paper, se muestra en resultados, los ciclos limite para
ambas piernas. Fig. 3: Curvas del sistema a Condiciones Iniciales [60*pi/180
0 -0.6 -0.2]
III. RESULTADOS
A. SIMULACIÓN DE ECUACIONES DINÁMICAS 3) RESPUESTA SIN CONTROL, CASO 3: En el caso 3,
las condiciones iniciales, son las que se tendrı́a en cualquier
momento con un control de andar, pero que ahora, se prueban
sin control. La Fig 4. muestra los estados de la respuesta del
sistema.

Fig. 1: Respuesta de todos los estados sin control.

1) RESPUESTA SIN CONTROL, CASO 1: En el caso 1,


se tiene al bipedo inclinado 3 grados una pierna respecto a
de la otra, esto da un leve impulso de energia que inicia el
movimiento.
Fig. 4: Curvas del sistema a Condiciones Iniciales [0.2318
En la Fig. 2, se observa la respuesta del sistema en sus 4
-0.3366 -1.3323 -0.3556].
estados, a lo largo de 1 segundo.

B. VALORES SINGULARES DE LA PLANTA ESCALONADA


CON INTEGRADORES
Al desarrollarse el escalonamiento en la planta y realizar
su gráfica de valores singulares, se concluye que esta obtiene
una mayor ganancia considerable con la planta normal.
En la fig. 5 se obtiene una gráfica de valores singulares de
la última planta pero añadiéndole un integrador. Se observa
claramente una mayor ganancia con respecto a la planta
escalonada y que respeta las barreras de anti-disturbios y
anti-ruido.

Fig. 2: Curvas del sistema a Condiciones Iniciales [3*pi/180


0 0 0] C. VALORES SINGULARES DEL COMPENSADOR KS
Armado el Compensador con los parámetros ”G” Y ”H”
2) RESPUESTA SIN CONTROL, CASO 2: En el caso 2, obtenidos, la fig. 6 nos muestra el comportamiento máximo y
se inicia el movimiento con una pierna levantada 60 grados, mı́nimo del compensador Ks de nuestro sistema. Este mismo
respecto a la otra. Esto le da al bı́pedo, un gran desbalance, respeta lo lı́mites de estabilidad y desempeño en baja y alta
en la Fig 3. se observa la respuesta del sistema en 1 segundo frecuencia.
de tiempo.
Fig. 5: Valores Singulares de Planta Escalonada con Inte- Fig. 8: Sensibilidad Complementaria del Sistema
gradores

E. DIAGRAMA DE BLOQUES DE LA SIMULACIÓN


En la Fig.9, se muestra la estructura del control bastante
resumido, con 2 entradas, una senoidal de amplitud 4, y
frecuencia 0.5 Hz, y un Step de Valor 0, También se esta
contando con un bloque compensador, en donde se introduce
las matrices Ak, Bk, Ck, Dk y condiciones iniciales 0, y el
bloque de la planta escalonada sin integradores, esta sin em-
bargo si lleva condiciones iniciales, que significan la posición
de inicio de grados articulares y sus velocidades angulares.
Tambien se añade bloques Scope, para visualizar las entradas
y salidas de las etapas.
El sistema se simula en lazo cerrado, realimentando la salida
con el compensador.
Fig. 6: Valores Singulares del Compensador Ks

D. SENSIBILIDAD S y T
Las normas de Sensibilidad y Sensibilidad complementaria
nos aseguran una buena estabilidad robusta.
Calculados los nuevos estados de la malla del compensador
y la planta en bucle abierto se grafican las sensibilidades de
nuestro sistema en Fig. 7 y Fig. 8, donde se aprecia que la
linea azul, respeta la ponderación establecida.

Fig. 9: Diagrama de Bloques de la Simulación

De la Fig. 9, tambien se observa en la salida, un DEMUX,


que separa las 2 salidas de cada articulacion, esto para encon-
trar el ciclo limite de cada uno de ellos.
F. RESPUESTA DEL COMPENSADOR EN LAZO CERRADO
Dado que las dimensiones y peso del robot, son consider-
ables (1 metro, 20 Kg), la fuerza que aplica el compensador
para llevarlo al equilibrio en un tiempo rápido, es Óptima,
debido a que los pasos del andar no son mayores a 1 segundo.

Fig. 7: Sensibilidad S del Sistema


2) PARA CASO 2: Se coloca la Condición Inicial con
una pierna levantada, con la intención de observar cual es el
comportamiento en el ciclo limite del control, esta Sección es
utilizando las condiciones iniciales de la Figura 3.

Fig. 10: Respuesta del Compensador Ks

G. RESPUESTA DEL SISTEMA EN LAZO CERRADO


En la Fig. 11, se observa que las condiciones iniciales em-
piezan en diferentes puntos, pero que el sistema las estabiliza,
ya para el segundo 1. (a) Pierna con Movimiento Ac-(b) Pierna con Movimiento Pa-
Se le dio una entrada senoidal, representando la oscilación tuado sivo
que hace la pierna para hacer andar al bı́pedo, el tracking es Fig. 13: Ciclo Limite para Condiciones Iniciales Caso 2.
preciso y se obtiene un buen resultado.
3) PARA CASO 3: Se añade un ligero impulso, al insertar
un desbalance de 3 grados en la posicion de una pierna con
la otra, esto genera que el robot empiece a andar.
Se observa en la Figura XX, como rapidamente se coloca en
estabilidad, utilizando un minimo gasto de energia.

Fig. 11: Respuesta del Sistema en Lazo Cerrado

H. CICLO LIMITE
1) PARA CASO 1: Esta configuración es representa lo que (a) Pierna con Movimiento Ac-(b) Pierna con Movimiento Pa-
en las Curvas de la Figura 2 se muestra, con la diferencia que tuado sivo
ahora existe un Control.
Fig. 14: Ciclo Limite para Condiciones Iniciales Caso 3.

IV. CONCLUSIONES
El Andar en un Robot Bipedo, esta dado por oscilaciones
estables en los grados de las caderas, rodillas y pies, ya sea
en cualquier punto de Inicio, el control debe llevar a este
al equilibrio. Para este trabajo, se desarrollo un control para
un bipedo tipo Compas, con un tiempo de estabilidadmenor
a 1 segundo, como se demostro en la simulacion. El gasto
Energetico del Compensador es elevado para los primeros
(a) Pierna con Movimiento Ac-(b) Pierna con Movimiento Pa- milisegundos, pero esta dentro de la etiqueta de Control
tuado sivo Optimo.
Fig. 12: Ciclo Limite para Condiciones Iniciales Caso 1. REFERENCIAS
[1] MCGEER T., “ Passive dynamic walking, International Journal of
Robotics Research,”Vol. 9, No. 2, 1990.

[2] DE LEÓN GÓMEZ V.,”Control de robots bı́pedos, ”Tesis Doctoral,


Tecnológico Nacional de México-Instituto Tecnológico de la Laguna,
Torreón, Coahuila, México, 2014.
[3] KATSUHIKO OGATA, ”Ingenieria de ControlModerna”, 5ta Edición,
PEARSON EDUCACIÓN S.A., MADRID, 2010; cap. 9.
[4] JUAN CARLOS CUTIPA LUQUE,TEMA 14 Y 15, ”Observador de
Kalman y Control LQR”, Diapositivas de Apoyo para curso SCA, pag.
34 ec.106.
[5] DANIEL ARMANDO HIRALES VALLES,“Modelado y Control de un
Robot Bipedo Basado en Conceptos de Energia”, Instituto Tecnologico
de la Paz Division de Estudios de Posgrado e Investigacion, Tesis para el
Grado deMaestro en Sistemas Computacionales,Mexico Diciembre 2017.
[6] MICHAEL ATHANS, ”A tutorial on the LQR/LTR method”, 1986.
[7] V. GOMEZ, V. SANTIBAÑEZ, J. MORENO, ”A procedure to find
equivalences among dynamic models of planar biped robots.”
[8] Enlace de los archivos usados en el Proyecto.
https://github.com/jorchmch/SCA-BIPEDO
[9] Enlace del Informe del Proyecto.
https://www.overleaf.com/read/nvngtshwmvdy

También podría gustarte