Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Design
Design
Mecatrónica
página de inicio de la revista:
www.elsevier.com/locate/mechatronics
aRTicLe info ab s T r a c T
Palabras clave:
Robótica blanda En este trabajo presentamos un brazo robótico suave esférico hecho de tela. El
Actuador de fuelle brazo inflable tiene una masa pequeña y se acciona neumáticamente. Se emplea
neumático una configuración con solo tres actuadores que controlan los dos grados de libertad de
Fabricación rotación de una junta esférica. Esto difiere de los pares antagónicos comúnmente
Modelado empleados, incluidos cuatro actuadores para dos grados de freedom. El
basado en procedimiento de fabricación del sistema ligero y compatible se discute en detalle
datos Control y utiliza materiales y herramientas comúnmente disponibles. La capacidad del brazo
de robótico para ajustar la rigidez de la articulación en función de las presiones del
aprendizaje actuador se investiga y se caracteriza por diferentes direcciones de deflexión. El mapeo
estático desde las presiones del actuador hasta la orientación del brazo robótico se
identifica a partir de los datos y el mapeo inverse emplea en un controlador de posición.
El modelado y la derivación del controlador se realizan para tres niveles de rigidez
diferentes que demuestran la capacidad del brazo robótico esférico para cambiar la
rigidez de la articulación independientemente del control. el position. El rendimiento
del seguimiento de la posición se evalúa experimentalmente mediante el seguimiento de
una trayectoria cuadrada. Una comparación del rendimiento de seguimiento para los
diferentes niveles de rigidez muestra que el seguimiento preciso es más desafiante
para la rigidez articular más pequeña. Un modelo gris-bo X que captura las
interacciones de los dos grados de libertad se utiliza en un esquema de
aprendizaje que se aplica para el nivel de rigidez más pequeño. El enfoque de
aprendizaje reduce las interacciones entre los dos grados de libertad y demuestra
el rendimiento de control alcanzable con el sistema desarrollado.
https://doi.org/10.1016/j.mechatronics.2020.102369
Recibido el 19 de septiembre de 2019; Recibido en forma revisada el 16 de abril de 2020; Aceptado 23 Abril 2020
Disponible en línea el 18 de mayo de 2020
0957-4158/© 2020 Autor(es). Publicado por Elsevier Ltd. Este es un artículo de acceso abierto bajo la licencia CC BY.
(http://creativecommons.org/licenses/by/4.0/)
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
parecido al sistemadiscutido en [22].
En términos de modelado de sistemas inflables basados en
telas, un enfoque geométrico para un actuador de alto
desplazamiento se describe en [23]. Los modelos basados en
la identificación desistemastradicionales se presentan en
[8,24]. Las técnicas de modelado no lineal basadas en redes
neuronales se discuten en [21,25]. En [26] para el Bionic
Handling Assistant se presenta un modelo híbrido que consiste
en cinemática continua combinada con un modelo basado en
datos.
Se han investigado diferentes enfoques para el control de
sistemas blandos accionados neumáticamente. El control de
bucle abierto se describe en [27,28] y un enfoque basado
en el modo deslizante y el control difuso es
2. Diseño y fabricación
2.2. Manufactura
Figura 4. Imágenes de los diferentes componentes del brazo blando a base de tela (el triplete actuador se muestra en
M. Hofer y R. D'Andrea
detalle en la Fig. 5). De izquierda a derecha: (A): La cubierta exterior de tela del eslabón estático Mecatrónica 68 (2020)
con correas
102369
Velcro
en el lateral para fijar los actuadores y la parte impresa en 3D en la parte superior para montar la parte de la unión. El
eslabón inflado tiene un diámetro de 10 cm y una longitud de 30 cm (medido desde la placa base hasta el punto de
pivote). (B): La vejiga interna hermética del enlace estático, que es ligeramente más grande que la cubierta externa para
ocupar completamente el volumen disponible. La parte superior está redondeada para que coincida mejor con la forma de la
carcasa exterior. El tubo está conectado por una válvula de conexión angular (Carmo, tipo 09-002) pegada a la vejiga. (C):
Placa base para montar el enlace estático en el suelo. La cubierta exterior del eslabón estático (parte A) se tira sobre la
parte cónica yse asegura con elanillo, que luego se fiXed a la parte cónica con cuatro tornillos. Se integra un tubo para
presurizar la vejiga interna del enlace estático (parte B). (D): piezas de unión impresas en 3D antes de que se unan a las
carcasas de tela. Las partes triangulares superior y bottom están pegadas a las carcasas de tela de ambos enlaces. La
parte interior alberga la rótula y los fits en las partes triangulares superior e inferior. Se asegura con tres
tornillos. La primera capa de tela (respectivamente última) del actuador (denominada triángulo de conexión) se
sujeta entre la parte triangular inferior (respectivamente superior) y la parte interior que aloja la rótula. El rango
limitado de la rótula empleada actualmente también limita el rango de actuación del brazo robótico a deflexiones angulares
de 45∘. (E): El eslabón móvil ensamblado (inflado) que consiste, de manera similar al enlace estático, en la cubierta
exterior de la tela, el bladder interior y dos partes triangulares en ambos extremos. De manera similar al enlace
estático, Velcro correas están unidas a los actuadores. El tubo (SMC, tubo de plástico de 4 mm) que presuriza la
vejiga interna se puede ver en la parte inferior y el marcador reflectante para el sistema de captura de movimiento está
conectado en la parte superior. El eslabón móvil, cuando se infla, tiene un diámetro de 10 cm y una longitud de 30 cm
(medido desde el punto de pivote hasta el marcador de captura de movimiento). La masa total del eslabón móvil es
de 126 g. Las piezas finales impresas en 3D representan 1/5 de la masa.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
Figura 5. El actuador triplica con un actuador inflado a diferentes elongaciones (aumentando de izquierda a derecha). La parte
de la junta que alberga la rótula está cerrada y protegida por el triplete del actuador suave. Cada actuador consta de diez
cojines individuales conectados entre sí a través de una costura interior. El volumen de un solo actuador es
approXimately 0.35L. Tres tubos están unidos a cada actuador. Dos están conectados a las válvulas de conmutación
para inflar y desinflar el actuador y uno a un sensor de presión.
3. Modelado
Figura 10. El par de deflexión medido a lo largo de dos direcciones en el plano de α β para un total decuatro niveles de presión
diferentes. Las deflexiones a lo largo de la dirección negativa αse muestran en la gráfica izquierda y las deflexiones along la
dirección positiva β-se muestran en la gráfica derecha, respectivamente. Los actuadores se inflan a cuatro niveles de presión
diferentes p, (1.00, 1.05, 1.10, 1.20bar), correspondientes a las cuatro curvas representadas en cada gráfica, y el eslabón móvil se
desvía de la posición vertical a un ángulo de deflexión máximo de 45∘. Se puede observar en ambas parcelas que la
rigidez aumenta con un aumento del nivel de presión en los actuadores. El par de deflexión es approXimately una función
lineal del ángulo de deflexión. Una deflexión en la dirección βpositiva corresponde a una deflexión en la dirección del actuador A,
lo que resulta en valores de rigidez más altos en comparación con una deflexión en la dirección negativa α, que no se
encuentra directamente en la dirección de un actuador.
entradas a la dinámica del brazo, el sistema está sobre- C, con la presión en el actuador A establecida en el nivel de
accionado. La presión adicional permite controlar la presión más bajo pmin, que es en este caso la presión
rigidez global además de la orien- tación (ver sección ambiental. Las gráficas para las presiones B y C establecidas
2.1). Las diferentes combinaciones de presión que producen la en la presión ambiente, así como los mapas de presión
misma orientación del brazo pueden diferir en la rigidez para niveles de rigidez más altos (casos medios y rígidos) se
articular resultante. Como se muestra en la sección ven similares y no se muestran. Las asignaciones
anterior, la rigidez de la articulación aumenta para un nivel presentadas se utilizan en la Sección 4.2 para controlar
de presión más alto en los tres actuadores. Formalmente, esto la orientación del brazo robótico.
significa que el mapeo entre el espacio de presión y el espacio
de ángulo no es en general inyectivo. Para derivar un mapeo 3.4. Modelo de caja gris
inyectivo del espacio de presión al espacio de ángulo que se
puede invertir fácilmente para el control (por ejemplo, calcular Mientras que el modelo presentado anteriormente solo
las presiones requeridas para ángulos deseados dados) y al captura el comportamiento estático, en esta sección se
mismo tiempo cubrir diferentes niveles de rigidez articular, deriva un modelo de tiempo discreto de primer orden para
se aplica el siguiente procedimiento: capturar la configuración del actuador y las posibles
Se elige un nivel de presión más bajo denotado por pmin interacciones entre los actuadores. Los dos ángulos del brazo
en el intervalo [1.01, 1.10bar](laspresiones a ll en este robótico, (α, β), forman el estado y loscambios en las tres
trabajo se denotan como presiones absolutas). Se aplican presiones, (uA, uB, uC), forman las entradas decontrol. Se
diferentes combinaciones de presión a los actuadores y se supone que ambos ángulos son directamente measurable,
registran los ángulos resultantes. Una de las tres presiones se [ ] [ ]
10 0 lo ques(π∕6) −lo ques(π∕6)
establece en pmin y las otras dos presiones cubren todas x(k + 1) = x(k) + γ u(k),
las combinaciones de diferentes puntos de consigna
mayores o iguales a pmin. El procedimiento se repite para
múltiples inferiores
niveles de presión pmin. Cambiar el nivel de presión mínimo 0 1 −1 sin(𝜋∕6) sin(𝜋∕6)
permite ajustar el nivel de rigidez de la articulación. En este ⏟⏞⏞⏟⏞⏞⏟ ⏟⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞ ⏞ ⏞ ⏞ ⏞
⏞⏞⏞⏞⏞⏞ ⏞ ⏞ ⏞ ⏞ ⏞
trabajo, exploramos tres niveles de rigidez diferentes, que se [ =Ad] ⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞
conocen como suave, medio y rígido. El nivel de presión α(k)
⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞]⏞⏞⏞⏞⏞⏞
más bajo pmin se establece en presión ambiente para el ⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏟
=Bd
⎡𝑢Hofer
M. A(𝑘)y⎤ R. D'Andrea Mecatrónica 68 (2020)
ajuste suave, a 1.05bar para el ajuste medio y a 1.10bar , u(k) = 102369
x(k) (2)
= β(k) ⎢uB(k)⎥
para el ajuste rígido. Además, solo se consideran las ⎢ ⎥
⎣u (k)⎦C
condiciones de estado estacionario.
para la derivación de la cartografía. El procedimiento
presentado puede ser ex-
[ ]
tendía a un número arbitrario de niveles de rigidez. La 10
cobertura resultante del espacio de presión y ángulo se y(k) = x(k). (3)
0 1
representa en la Fig. 11 para los ajustes suaves y rígidos, ⏟⏞⏞⏟⏞⏞
respectivamente. Los resultados para el nivel de rigidez media ⏟
son similares y no se muestran en aras de una mejor =Cd
visibilidad.
El Bd matriX incorpora la geometría de la configu- ración
Para cada caso de rigidez considerado, ambos ángulos α y
del actuador premultiplicada por el parámetro desconocido
β se ajustan individualmente a las presiones mediante un γ. Las entradas de la Bd matriX representan cómo cada
ajuste polinómico de tercer orden. La asignación estática se actuador afecta a cada uno de los dos grados de libertad
puede expresar como, (comparar Fig. 9). El Bd matriX se deriva para el enlace móvil
(α, β) = P M(pA, pB, pC), (1) que está en una orientación vertical. Por lo tanto, el modelo
con PM denotando elmodelo polynomial de tercer orden. Un solo es válido en una vecindad de α = 0 y β = 0. El
ejemplo para una ficha resultante se presenta en la Fig. 12 parámetro γ se identifica para cada nivel de rigidez a partir de
para el nivel de rigidez suave. Ambos ángulos se datos transitorios sobre un salto de punto de consigna. Los
representan en función de las presiones variables en los datos utilizados para
actuadores B y
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
Higo. 12. El figure Ilustra el presión Para ángulo mapa PM, para el suave rigidez ajuste. El firme estado Ángulos α
(izquierda) parcela) y β (derecha parcela) son Mostrado como a función de diferente presión Combinaciones para pB y pC.
Para el datos Mostrado en estos Parcelas el presión pA es poner Para ambiente presión. El medido datos es Mostrado en
negro y el coloreado Superficie Muestra el Tercero orden polinomio fit identificado. A Bajo presión en accionador B y a Alto
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
presión en accionador C Resultados en a grande Negativo valor para α, mientras a Alto presión en accionador
102369
B y a Bajo
presión en C Resultados en a grande Positivo valor para α. El ángulo β tiene en gran parte Negativo valores cuando las
presiones en ambos actuadores B y C están cerca de la presión ambiente. El aumento de las presiones en los actuadores B y C
causa el ángulo β para saturar en general positivo valores (causado por el rígido articulación). Cuando Pressures B y C son
cerrar Para ambiente presión (como es el caso para presión A), el brazo Muestra a Negativo deflexión en el
βdirección. Este comportamiento en condiciones ambientales es causado por imperfecciones de fabricación. Tenga en cuenta que
un ligero aumento en las presiones B y C mueve el brazo a una orientación vertical.
la identificación es la misma que se muestra en la Fig. 16. Los La fuerza ejercida en la punta del eslabón móvil se
valores resultantes son γblando = 1. 55rad∕bar, γmed = 0. mide en su dirección no correcta para diferentes
70rad∕barra y γstiff = 0. 35rad∕bar. El ajuste resultante para orientaciones y presiones. Sin pretender la completitud,
el parámetro γ es menor para valores de rigidez más altos, lo investigamos la fuerza aplicada en una dirección en el
que se debe a las presiones más altas requeridas para una α − β-plano, es decir, en dirección al actuador B (comparar
cierta desfección angular. El modelo de primer orden no Fig. 9). La fuerza de in-teracción se mide en tres posiciones
incluye ninguna fuerza de resorte de los actuadores, diferentes en la dirección de actuación del actuador B. La
amortiguación o fuerzas gravitacionales. El modelo se utilizará orientación en esta dirección se denota por el ángulo φB, con
en el esquema de aprendizaje presentado en la Sección la dirección positiva correspondiente a una extensión
4.3. del actuador B. Las fuerzas se miden para φB ∈ {−40◦, 0◦,
40◦} y five
3.5. Análisis de par de interacción diferentes presiones en el rango de [1.01, 1.20bar]. Las
orientaciones que responden a φB = ±40◦ se eligen para estar
cerca de los límites del rango de actuación (45∘)evitando al
En la sección inicial de este capítulo, investigamos la
mismo tiempo los efectos límite. Se coloca una célula de carga
capacidad del brazo robótico para aplicar fuerzas durante las en la ubicación correspondiente y la fuerza en la dirección
interacciones estáticas con el medio ambiente. La normal del eslabón móvil se mide en la dirección positiva
investigación presentada en esta seccióndebe entenderse φB(actuador expanding). La fuerza medida se convierte en un
como una caracterización del sistema desarrollado. El par multiplicando con la longitud conocida del eslabón móvil.
enfoque de control presentado en el capítulo siguiente no se Los resultados se muestran en la Fig. 13.
basa en los resultados presentados aquí.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
Figura 15. El mapeo inverso desde los ángulos deseados a las presiones requeridas para el caso de rigidez suave. La gráfica de
la izquierda muestra la presión A requerida para lograr una ciertacombinación (α, β ). Las gráficas central y derecha muestran lo
mismo para las presiones B y C. El mapeo inverso solo se muestra para los valores factibles de α y β que se encuentran en el
rango de actuación del brazo robótico. Tenga en cuenta que las superficies de las tres presiones del actuador reflejan la
simetría de la configuración del actuador empleada. Una rotación de la superficie para la presión A por 120∘ a lo largo de la
dirección vertical positiva approXda como resultado la superficie para la presión B y una rotación a lo largo de la dirección vertical
negativa approXda como resultado la superficie para la presión C. Esto corresponde a la configuración del actuador que
se muestra en la Fig. 9. Los mapeos inversos para el caso medio y rígido se ven similares y no se muestran en aras
de la brevedad. La principal diferencia es que las presiones alcanzables más pequeñas son más altas que la presión
ambiental, como es el caso del modo suave.
se másico ṁ
flujoestablece en, cero
el ciclo de trabajo de la válvula de desinflado
y vice −1 P [−] y k Y α ] el proporcional y
Versa. ments y k Pα [−],k Y
oα [s
], k β oβ [s1−
en una tabla de búsqueda. La razón por la que utilizamos el
4.2. Control de posición ajuste polinómico de tercer orden para calcular los ángulos del
modelo y no los datos angulares en bruto directamente es para
El controlador de posición explota el mapeo de presión a obtener un mapeo suave desde los ángulos deseados a las
ángulo de estado estacionario presentado en la Sección 3.3 presiones requeridas. El mapeo inverso obtenido para el caso
utilizando el mapeo numéricamente invertido desde los blando se ilustra en la Fig. 15, y se utiliza para calcular los
ángulos deseados a las presiones requeridas. El enfoque puntos de ajuste de presión para ciertos puntos de ajuste
presentado a continuación se aplica para los tres ajustes de angulares,
rigidez (suave, medio, rígido). En primer lugar, el modelo
polinómico de tercer orden ajustado se evalúa para un (pASP, pBSP, pCSP) = P M−1(αSP, βSP), (8)
conjunto de presiones espaciadas uniformemente para con P M−1 denotando el mapeo inverso. Consiste en una
obtener los ángulos de modelo correspondientes. De este tabla de búsqueda separada para cada presión en función de
modo, una de las tres presiones se establece de nuevo en los dos ángulos deseados. La interpolación de oreja de bilina
pmin,como fue el caso durante la recopilación de datos del se aplica para las presiones dadas los ángulos deseados
mapeo identificado. Para una cuadrícula de ángulos para mejorar la precisión.
espaciados uniformemente,se determina elángulo l de modo Confiar puramente en el mapeo inverso en un sentido de
más cercano y las presiones correspondientes se almacenan avance conduce a un rendimiento de control deficiente debido a
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
la naturaleza estática del mapeo y los efectos dinámicos ganancias integrales para α y β,respectivamente.
102369 Se utilizan
descuidados, como la histéresis y la fricción articular. Por lo diferentes ganancias del controlador en α y βdirección para
tener en cuenta la autoridad decontrol diferente en los dos
iones directos. Añadiendo las salidas de los controladores PI a
tanto, los ángulos de corriente y el puntode consigna los puntos de consigna angulares originales y aplicando la
angular s se alimentan primeroen dos controladores PI asignación inversa se obtienen los puntos de consigna de
desacoplados que calculan puntos de ajuste angulares presión para los tres actuadores,
ajustados,
(pASP, pBSP, pCSP) = P M−1(αSP + uα, βSP + uβ ). (11)
Nótese que el mapeo inverso en principio desacopla los
ángulos en el sentido de que cambiar α, mientras se
mantiene β constante produce un nuevo conjunto de
puntos de ajuste preseguros que no cambian β. Sin
embargo, esto solo es válido en condiciones de estado
estacionario y hasta la precisión del modelado del mapeo de
presión a ángulo. En la siguiente sección se presenta un
enfoque de aprendizaje para compensar las posibles
interacciones entre los ángulos.
El esquema NOILC se ha aplicado previamente aun sistema La iteración se define por la duración del tiempo de una sola
SISO (véase [13]) y se extiende en este trabajo al caso trayectoria y el tiempo de muestreo del esquema de
MIMO. aprendizaje, que se denota por TILC. Basado en el modelo
Si bien la ILC puede aprender a compensar las introducido en (3), se utiliza la representación del sistema
perturbaciones repetitivas, no puede compensar las elevado, con
perturbaciones no repetitivas. Por lo tanto, el enfoque de
aprendizaje se aplica en paralelo con el controlador de
retroalimentación.
presentado en no
perturbaciones la repetitivas
Sección 4.2(como
para tener en cuenta las
esbozado en ⎡ Cd Bd 0 0 0⎤
⎢ ⎥
[35]). P=⎢ ⋮ CB 0 ⎥ ∈ R 2N×3N , (17)
Introducimos
denota el la siguiente notación, donde el índice j 𝑁−1 d
número de iteración y N el número de pasos de tiempo de a ⎣ C A B ⋯ C A BB
soltero( iteración )
⎦ d dd d
parad escribir la dinámica lineal en una sola iteración como,
yj ∶= α (0), β (0), ... , α (N − 1), βj (N − 1) ∈ R2N
j j j d
(12
)
( )
𝑦SP ∶= α𝑗 (0), β𝑗 (0), … , α𝑗 (𝑁 − 1), β𝑗 (𝑁 − 1) ∈ ℝ2𝑁
SP SP SP SP
(13
)
( )
𝑒𝑗 ∶= 𝑒α𝑗 (0), 𝑒𝑗 (0), …α , 𝑒𝑗 (𝑁 − 1), 𝑒𝑗 (𝑁 − 1) ∈ ℝ2𝑁
β β 𝑦𝑗 = P En
𝑗 +
(14 d
)
( )
𝑑 ∶= 𝑑α𝑗 (0), β𝑑𝑗 (0), …α , 𝑑𝑗 (𝑁 −β 1), 𝑑𝑗 (𝑁) ∈ ℝ2𝑁 ej = ySP − yj = ySP − P uj (18)
−d
(15 ej+1 = ySP − P
Enj+1 − d
) (
uj ∶= uj) (0), uj (0), uj (0), ... , uj (N − 1), uj (N − 1), uj = ej − 1 – uj ).
j+
(N − 1) ∈ R3N , Pu(
A B C A B
C (16)
El estado inicial del sistema se trata como una perturbación
repetitiva. El
La entrada de corrección se calcula minimizando una
Dónde αj (k) y α𝑗SP(𝑘) denotar el ángulo y su punto de consigna en
función de costo cuadrática en el error de seguimiento previsto
iteración j y en Hora paso k, 𝑒𝑗 el error en α y 𝑑𝑗 (𝑘) el de la siguiente iteración y el
perturbación en α durante
β. Las señales de compensación de presión se denotan por (uj (k), uj (k), uj (k))
1 T T
para la iteración j y el paso de tiempo k. Los puntos de
consigna angulares yA sonB el sCame SP J (uj+1)
para todas las iteraciones y las perturbaciones en ambos = j+1j+1 + (uj+1 − uj )TS(uj+1 − uj ) + uj+1
T[ej+1 Me
D
2 W Du ] ,
ángulos se supone que (19)
ser repetitivo entre iteraciones. El número de pasos de
tiempo para un solo
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
Figura 16. Comparación del rendimiento de seguimiento para tres valores diferentes de rigidez articular. Las dos gráficas
superiores muestran los ángulos α y β y las tres gráficas inferiores muestran las presiones en los actuadores A, B y C.
Los ángulos y presiones para el nivel de rigidez más pequeño (suave) se muestran en azul (punteado), para el nivel de rigidez
medio (medio) en verde (punteado por guión) y para el valor de rigidez más alto(rígido) en rojo (sólido). Los niveles mínimos de
presión correspondientes a los tres niveles de rigidez se indican mediante la línea discontinua en las gráficas de presión
para cada nivel de rigidez. Los rendimientos de seguimiento para los modos de rigidez baja y media son comparables. El
error de seguimiento RMS del modo rígido se reduce en aproximadamente un 30% con respecto al del modo blando.
El controlador de posición para cada ajuste de rigidez está ajustado para obtener el mejor rendimiento individual. Tenga en
cuenta que el cambio de presión requerido para un cierto cambio en la orientación es mayor para una mayor rigidez
articular.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
donde M, S, W son matrices de costos semi-definidas + (P TMP + S + DTW D)−1 P TMej . (21)
positivas de dimensiones apropiadas y El Marcha atrás en (21) es garantizado Para existir si S es
escogido Para ser Positivo
U B
⎡−I3 I3 ⎤ definido. Las entradas de corrección
n
uj C(k), uj (k), uj (k) se
añaden a la pres- o
⋱
1 (R) ⎥ ∈
3N×3N Puntos de
inversa enconsigna seguros
(11) durante calculados por la asignación
la iteración
𝐷
⎢ = TCIT –I3 I3 j para cada paso de
tiempo k.
⎢
⎣ 03 0 3⎥
5. Resultados
⎡1 0 0⎤ ⎡0 0 0⎤ (20
⎦ ) Resultados de la evaluación experimental de la robótica
esférica
Yo
⎢ = 0⎥ 1 ⎢ 0⎥3 , 0
= 0 0 03
⎢ ⎥ ⎢ ⎥
⎣0 0 1 ⎦ ⎣0 0 0⎦ en esta sección se presentan el brazo y el controlador
propuesto. El
El rendimiento de control para diferentes niveles de rigidez
es una aplicaciónDEla derivada de la señal de corrección, se analiza en la Sección 5.1 y los resultados del
mediante el esquema de diferenciación numérica de primer
experimento de seguimiento de posición para el modo
orden hacia adelante. El primer término en suave después de aplicar un esquema de aprendizaje son
(19) penaliza el error de seguimiento previsto en la siguiente
presentado en la Sección 5.2.
iteración, el segundo término añade un coste a los cambios Los algoritmos de control se implementan en C++ y se
entre la señal de corrección de la iteración actual y la ejecutan en un ordenador portátil (CPU Intel Core i7, 2,8
siguiente iteración y el último término penaliza la derivativa de GHz). Las válvulas y los sensores de seguridad están en
la señal de corrección en la siguiente iteración. La adición de interfaz sobre un dispositivo Labjack T7 Pro. Los controladores
los dos últimos términos mejora el comportamiento de de presión se ejecutan a 200Hz, el controller de posición
aprendizaje transitorio al evitar cambios importantes entre las a50Hz y el esquema NOILC tiene un tiempo de muestreo T ILC
iteraciones (segundo término) y al deshabilitar el aprendizaje a = 1∕50s. La comunicación al hardware, el registro de datos
altas frecuencias (último término), que es una práctica común y los bucles de control internos y externos se implementan
en ILC y también puede abordarse mediante el uso de un en subprocesos separados para una mejor modularidad y
llamado filtro Q (ver [35]). El problema de iones op- timizat perfor- mance. La presión de la fuente se establece en 2bar y
(19) no incluye restricciones en las entradas de corrección, los actuadores se oper- en un rango de presión de [1.0,
de modo que la solución óptima para las entradas de 1.25bar]. Ambos enlaces se inflan a una presión de 1,25bar.
control se pueda poner en forma cerrada. La viabilidad Las válvulas de conmutaciónfuncionaban a una frecuencia
de las entradas de corrección resultantes se garantiza PWM de 200 Hz. Los ángulos del enlace móvil, (α, β),
limitándolas al rango factible en un segundo paso. La solución serecuperan de los datos de posición proporcionados por un
óptima se calcula como, sistema de captura de movimiento infrarrojo que se ejecuta a
uj+1 ⋆ = argmin J (uj+1) 200Hz y proporciona una precisión submilimétrica. Los
uj+1 parámetros
= (P TMP + S + DTW D)−1 (P TMP + S)uj del controlador pressure se eligen como k̄ P = 40s−1 para
el mod suave e y
k̄ P = 20s−1 para los modos medio y rígido (see (7)). El
parámetro de programación de ganancia e se establece en
e63 = 0.005bar y la ganancia integral en k I = 120s−2
para
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
Figura 17. Resultados del brazo robótico esférico que rastrea una trayectoria cuadrada. La gráfica superior muestra el ángulo
α,la segunda traza el ángulo β y las tres gráficas inferiores muestran las presiones en los actuadores A, B y C. Se muestran dos
iteraciones del esquema de aprendizaje. Lascurvas green (punteados por guiones) muestran los ángulos y las presiones durante
la iteración cero (sin aprendizaje) y las curvas azules (sólidas) muestran las variables después de aplicar el esquema de
aprendizaje para la iteración 48. Para las dos gráficas superiores, las curvas rojas (discontinuas) indican los puntos de ajuste de
angular (iguales para todas las iteraciones). Durante las iteraciones cero, el rendimiento de seguimiento en β se ve claramente
afectado por un salto de punto de consigna en α. El esquema de aprendizaje puede compensar la interacción y mejorar el
rendimiento del seguimiento. En las tres gráficas inferiores, el puntode ajuste de presión se representa mediante la curva
roja (discontinua) para la iteración 48. Se puede ver en las gráficas que los puntos de consigna están en general bien rastreados,
excepto durante las fases de deflación, cuando el punto de consigna está cerca de la presión ambiental. Se produce un ligero
parloteo de la válvula y se nota por los picos en las medidasprevias.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
Cuadro 1
Ajuste de los parámetros del controlador de posición para
diferentes saltos de consigna y modos de rigidez. Un salto
de consigna de 20∘ corresponde a los resultados de
experiencia presentadosen la sección 5.1 y un salto de
punto de consigna de 40∘ a los resultados presentados
en la sección 5.2.
salto de punto de rigidez kPα [ − ] kIα [s−1 ] kPβ [ − ] kIβ [s−1 ]
consigna [∘]
20 suave 0.4 0.05 0.8 0.4
20 Medio 0.05 0.05 0.1 0.05
20 tieso 0.05 0.05 0.03 0.05
40 suave 0.3 0.05 0.1 0.05
Referencias