Está en la página 1de 28

Mecatrónica 68 (2020) 102369

Listas de contenidos disponible en ScienceDirect

Mecatrónica
página de inicio de la revista:
www.elsevier.com/locate/mechatronics

Diseño, fabricación, modelado y control de un brazo robótico esférico a base de


tela
Matthias Hofer∗, Raffaello D'Andrea
Institute for Dynamic Systems and Control, Sonneggstrasse 3, 8092 Zúrich, Suiza

aRTicLe info ab s T r a c T

Palabras clave:
Robótica blanda En este trabajo presentamos un brazo robótico suave esférico hecho de tela. El
Actuador de fuelle brazo inflable tiene una masa pequeña y se acciona neumáticamente. Se emplea
neumático una configuración con solo tres actuadores que controlan los dos grados de libertad de
Fabricación rotación de una junta esférica. Esto difiere de los pares antagónicos comúnmente
Modelado empleados, incluidos cuatro actuadores para dos grados de freedom. El
basado en procedimiento de fabricación del sistema ligero y compatible se discute en detalle
datos Control y utiliza materiales y herramientas comúnmente disponibles. La capacidad del brazo
de robótico para ajustar la rigidez de la articulación en función de las presiones del
aprendizaje actuador se investiga y se caracteriza por diferentes direcciones de deflexión. El mapeo
estático desde las presiones del actuador hasta la orientación del brazo robótico se
identifica a partir de los datos y el mapeo inverse emplea en un controlador de posición.
El modelado y la derivación del controlador se realizan para tres niveles de rigidez
diferentes que demuestran la capacidad del brazo robótico esférico para cambiar la
rigidez de la articulación independientemente del control. el position. El rendimiento
del seguimiento de la posición se evalúa experimentalmente mediante el seguimiento de
una trayectoria cuadrada. Una comparación del rendimiento de seguimiento para los
diferentes niveles de rigidez muestra que el seguimiento preciso es más desafiante
para la rigidez articular más pequeña. Un modelo gris-bo X que captura las
interacciones de los dos grados de libertad se utiliza en un esquema de
aprendizaje que se aplica para el nivel de rigidez más pequeño. El enfoque de
aprendizaje reduce las interacciones entre los dos grados de libertad y demuestra
el rendimiento de control alcanzable con el sistema desarrollado.

como resultado una alta relación carga útil/peso que es


1. Introducción
interesante para aplicaciones espaciales [10]. Deconformidad
con otros principios de actuación robótica suave, la actuación
Los sistemas robóticos blandos accionados
neumática permite un accionamiento rápido, como se
neumáticamente están atrayendo una atención consid-erable
demuestra en [11]. Además, la flexibilidad del tejido empleado
debido a sus prometedoras propiedades intrínsecas. Se
hace que estos sistemas sean adecuados para aplicaciones
puede encontrar una descripción detallada del campo en [1–
portátiles, donde, por ejemplo, los actuadores inflables blandos
3]. Los sistemas robóticos blandos basados en telas están
pueden apoyar a los humanos en tareas de elevación [12].
permitiendo diversas aplicaciones que son difíciles de mejorar
Los sistemas basados en tela accionados neumáticamente
con los sistemas robóticos rígidos tradicionales. Debido a su
generalmente se basan en la combinación serial de
bajo peso y comportamiento material conforme, son seguros
articulaciones de un grado de libertad (DoF) para permitir el
para la interacción humana [4–6] y la disposición antagónica
movimiento en un espacio dimensional superior.
de los actuadores inflables blandos al- reduce el control de la
rigidez de la articulación [7,8]. Además, el uso de eslabones
inflables para proporcionar estabilización estructural en
combinación con el accionamiento neumático permite
manipuladores de largo alcance para la inspección [9] y da
actuador. La relación de estado estacionario entre las
En este trabajo presentamos un brazo robótico esférico presiones controladas del actuador y los ángulos resultantes
que combina dos DoF rotacionales en una sola articulación se identifica a partir de datos para tres niveles de rigidez
esférica (ver Fig. 1). Una configuración con tres uators de diferentes denotados como blandos, medios y rígidos. La
acción(conocido como triplete actuador) permite el control de asignación inversa se deriva para los tres niveles y se
los dos DoF, así como la rigidez de la articulación. Por lo utiliza en controladores po sition separados. El control de perfor-
tanto, los periféricos neumáticos, como el número de mance resultante de los diferentes niveles de rigidez se
válvulas y sensores de presión, pueden reducirse. El compara para el seguimiento de la trayectoria del ángulo.
procedimiento de fabricación se presenta endetalle para Se presenta un modelo gris-boX que incorpora la
simplificar la reproducción del brazo robótico presentado o geometría del actuador y las interacciones resultantes que
sistemas similares. La rigidez de la articulación se caracteriza surgen entre los dos DoF. Seaplica un esquema de
experimentalmente para diferentes niveles de presión del aprendizaje basado en el modelo gray-boX para el modo de
actuador y en diferentes direcciones de deflexión. Las rigidez articular más bajo para el cual se realiza un
mediciones de las posibles fuerzas deintervención seguimiento preciso de la posición.
ejercidas por el brazo robótico se realizan para diferentes
elongaciones del actuador y diferentes presiones del

∗ Autor para correspondencia.


Direcciones de correo electrónico: hofermat@ethz.ch (M. Hofer), rdandrea@ethz.ch (R. D'Andrea).

https://doi.org/10.1016/j.mechatronics.2020.102369
Recibido el 19 de septiembre de 2019; Recibido en forma revisada el 16 de abril de 2020; Aceptado 23 Abril 2020
Disponible en línea el 18 de mayo de 2020
0957-4158/© 2020 Autor(es). Publicado por Elsevier Ltd. Este es un artículo de acceso abierto bajo la licencia CC BY.
(http://creativecommons.org/licenses/by/4.0/)
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
parecido al sistemadiscutido en [22].
En términos de modelado de sistemas inflables basados en
telas, un enfoque geométrico para un actuador de alto
desplazamiento se describe en [23]. Los modelos basados en
la identificación desistemastradicionales se presentan en
[8,24]. Las técnicas de modelado no lineal basadas en redes
neuronales se discuten en [21,25]. En [26] para el Bionic
Handling Assistant se presenta un modelo híbrido que consiste
en cinemática continua combinada con un modelo basado en
datos.
Se han investigado diferentes enfoques para el control de
sistemas blandos accionados neumáticamente. El control de
bucle abierto se describe en [27,28] y un enfoque basado
en el modo deslizante y el control difuso es

Figura 1. El brazo robótico blando esférico presentado en


este artículo. El brazo robótico está hecho de tela y consta
de dos eslabones inflables y tres actu- ators tipo fuelle. La
presión en cada actuador se puede controlar de forma
independiente para ajustar su elongación. Una junta rígida de
bal lyzócalo conecta los dos enlaces y restringe las
elongaciones del actuador a dos grados de libertad rotacional.
Se adjunta un marcador de captura de movimiento en la punta
del enlace móvil para proporcionar retroalimentación sensorial.
Ambos eslabones tienen un diámetro de 10cm y una longitud
de 30cm. El eslabón móvil sin actuadores pesa 126 g.

más desafiante. Se ha demostrado que el enfoque de


aprendizaje mejora el rendimiento del control para el
seguimiento de la trayectoria del ángulo.

1.1. Trabajos relacionados

Teniendo en cuenta el diseño de sistemas robóticos


articulados blandos accionados por aire, se preenvió un
sistema DoF basado en actuadores blandos y una columna
vertebral rígida [13,14],mientras que un sistema
completamente blando se muestra en [8]. EXam- ples de
sistemas dimensionales superiorescon unadisposición en serie
de múltiples articulaciones articuladas individuales DoF se
pueden encontrar en [15–17].
La configuración del actuador que empleamos en este
trabajo se ha aplicado previamente a robots continuos
basados en elastómeros (por ejemplo, [18,19]), así como en
el eje de mano articulado de la Asistencia de Manejo Biónico
de Festo [20]. En [21] se presenta un sistema siX DoF que
utiliza cuatro actuadores para cada dos juntas continuas DoF,
que está hecho de materiales más rígidos. Un sistema
basado en tela con múltiples actuadores a lo largo de la
longitud de un enlace inflable que resulta en un continuo
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
actuadores con dos (C1), tres (C2) y cuatro actuadores (C3).
descrito en [29] para un actuador de cámara elástica rotativa. Todas las configuraciones se muestran en el plano x − y. Un
Los enfoques avanzados de control que utilizan el supuesto solo actuador está indicado por el objeto trapezoidal con
de curvatura constante por piezas se presentan en [30] para esquinas redondeadas. La configuración C1 incluye dos
una operación de manipulador de elastómeros fluídicos actuadores dispuestos de manera antagónica y permite el
continuos en el espacio bidimensional y en [18] para un control simultáneo de la posición y la rigidez de un DoF. La
manipulator que opera en el espacio tridimensional. Un configuración C2 tiene tres actuadores dispuestos
controlador de red neuronal adaptativo se discute en [31] alrededor de un único punto de pivote. Se pueden controlar
para el brazo compacto de manejo biónico y se emplea
dos DoF, así como la rigidez total de la articulación. La
un enfoque de aprendizaje de refuerzo en [32], para un
configuración C3 consta de cuatro actuadores dispuestos
tendón y neumático combinados manipulador.
alrededor de un único punto de pivote. Esto permite el control
de dos grados de libertad y el control independiente de la
1.2. Contorno
rigidez de ambos grados de libertad.
El diseño y la fabricación del brazo robótico blando
esférico se pre-envía en la Sección 2. La caracterización de
la rigidez de la articulación, así como un modelo basado
en datos para el mapeo estático desde las presiones del
actuador hasta los ángulos para tres niveles diferentes de
rigidez de la articulación se presentan en la Sección 3. En
esta sección también se analiza un modelo gris-boX que
captura la confianza del actuador y un análisis de los pares
de interacción del brazo robótico. En la Sección 4se analiza
un enfoque de control que explota el mapeo de presión a
ángulo, junto con un esquema de aprendizaje basado en el
modelogray-boX para mejorar el rendimiento del control. Los
resultados de los análisis de ángulo para diferentes niveles
de rigidez articular y después de aplicar un esquema de
aprendizaje se presentan en la sección 5 y se extrae una
conclusión en la sección 6.

2. Diseño y fabricación

En esta sección, primero discutimos diferentes


configuraciones de actuadores y mostramos la motivación
para el diseño elegido y realizado en este trabajo. La
fabricación del brazo robótico se presenta en la
segunda parte de esta sección.

2.1. Configuraciones de actuadores

Sistemas robóticos blandos con una configuración de


actuador antagónico por medio de control simultáneo de
posición y rigidez. Aquí, solo consideramos las
articulaciones con un solo centro de rotación y sin
articulaciones continuas (véase, por ejemplo, [21]). Tres
configuraciones diferentes se representan en la Fig. 2. La
configuración de la izquierda (C1) tiene una junta
pivotante hecha de materiales blandos que está
controlada por dos actuadores y se presenta en [8]. La
disposición en el medio (C2) consiste en una junta de
bola y zócalo controlada por tres actuadores y se realiza
en este trabajo. La configuración de la derecha (C3)
también tiene una junta de bola y zócalo, pero utiliza
cuatro actuadores para el control. Los puntos alcanzables
de la configuración C1 se encuentran en un círculo. Dos DoF
se pueden controlar con la configuración C1 organizando
en serie dos uniones de este tipo, donde una articulación se
gira en 90∘ en relación con la otra articulación (ver [10]).
Los puntos alcanzables de la configuración C2 y C3 son

Figura 2. Vista superior de diferentes configuraciones de


M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

Lafi guración utiliza sólo tres en lugar de cuatro actuadores.


Como consecuencia, el control de rigidez independiente de
ambos DoF no es posible, ya que solo hay tres entradas
de control para dos DoF angulares y dos DoF de rigidez.
Sin embargo, se vuelven a utilizar menos periféricos
neumáticos (válvulas, sensores de presión).

2.2. Manufactura

En esta sección, resumimos los materiales utilizados, el


procedimiento de fabricación aplicado y los conocimientos
adquiridos. El objetivo de esta sección es simplificar la
reproducción del brazo robótico presentado y fomentar la
aplicación de los materiales y métodos mencionados para el
desarrollo de sistemas robóticos similares basados en tejidos.
Figura 3. Vistade eXplosión del brazo robótico esférico que Todos los dibujos de las piezas bidimensionales de tela y
representa los diferentes componentes. El brazo se monta en vejiga, así como los archivos CAD de las piezas impresas en
el suelo por medio de una placa base. El triplete actu- ator 3D se proporcionan en los datos adicionales de este
encierra la parte de la articulación, que incluye la junta de manuscrito.
bola y zócalo, y se monta entre losenlaces s tatic y El brazo robótico está hecho de materiales baratos y
movable. La primera capa del triplete del actuador se sujeta comúnmente disponibles. Las únicas máquinas requeridas
entre la parte de la unión y la parte final del enlace para la fabricación son un cortador láser para preparar las
estático y la última capa entre la parte de la junta y la diferentes piezas de tela y una prensa térmica térmica para
parte final de el enlace móvil. soldarlas entre sí. Las piezas individuales también se
pueden cortar manualmente a costa de un mayor tiempo
de producción.
situado en una esfera. Estas configuraciones tienen la ventaja El brazo blando consiste en un eslabón estático, un eslabón
de que dos DoF se pueden controlar en una sola junta más móvil, el triplete del actuador, la parte de la unión y una placa
compacta. El inconveniente es que la complejidad de la base (ver Fig. 3). El triplete del actuador se monta entre los
articulación aumenta y las posibles interacciones entre dos eslabones y la elongación de los actuadoresindividuales
los actuadores son más pronunciadas. En comparación con hastala presurización se utiliza para controlar el enlace móvil.
C3, el C2 con- El enlace estático está unido al suelo por una placa base
impresa en 3D (fusión de chorro PA 12, como todas las
piezas impresas en 3D). Una junta de bola y zócalo (IGUS
AGRM- 08MS, modificada para aumentar el rango de
operación) está integrada en la pieza de la junta impresa en
3D. El triplete del actuador encierra lateralmente la parte de la
articulación y los dos extremos de la parte de la junta
sobresalen de las capas superior e inferior del triplete del
actuador (ver Fig. 4 y Fig. 5). Estos extremosfi t en

Figura 4. Imágenes de los diferentes componentes del brazo blando a base de tela (el triplete actuador se muestra en
M. Hofer y R. D'Andrea
detalle en la Fig. 5). De izquierda a derecha: (A): La cubierta exterior de tela del eslabón estático Mecatrónica 68 (2020)
con correas
102369
Velcro
en el lateral para fijar los actuadores y la parte impresa en 3D en la parte superior para montar la parte de la unión. El
eslabón inflado tiene un diámetro de 10 cm y una longitud de 30 cm (medido desde la placa base hasta el punto de
pivote). (B): La vejiga interna hermética del enlace estático, que es ligeramente más grande que la cubierta externa para
ocupar completamente el volumen disponible. La parte superior está redondeada para que coincida mejor con la forma de la
carcasa exterior. El tubo está conectado por una válvula de conexión angular (Carmo, tipo 09-002) pegada a la vejiga. (C):
Placa base para montar el enlace estático en el suelo. La cubierta exterior del eslabón estático (parte A) se tira sobre la
parte cónica yse asegura con elanillo, que luego se fiXed a la parte cónica con cuatro tornillos. Se integra un tubo para
presurizar la vejiga interna del enlace estático (parte B). (D): piezas de unión impresas en 3D antes de que se unan a las
carcasas de tela. Las partes triangulares superior y bottom están pegadas a las carcasas de tela de ambos enlaces. La
parte interior alberga la rótula y los fits en las partes triangulares superior e inferior. Se asegura con tres
tornillos. La primera capa de tela (respectivamente última) del actuador (denominada triángulo de conexión) se
sujeta entre la parte triangular inferior (respectivamente superior) y la parte interior que aloja la rótula. El rango
limitado de la rótula empleada actualmente también limita el rango de actuación del brazo robótico a deflexiones angulares
de 45∘. (E): El eslabón móvil ensamblado (inflado) que consiste, de manera similar al enlace estático, en la cubierta
exterior de la tela, el bladder interior y dos partes triangulares en ambos extremos. De manera similar al enlace
estático, Velcro correas están unidas a los actuadores. El tubo (SMC, tubo de plástico de 4 mm) que presuriza la
vejiga interna se puede ver en la parte inferior y el marcador reflectante para el sistema de captura de movimiento está
conectado en la parte superior. El eslabón móvil, cuando se infla, tiene un diámetro de 10 cm y una longitud de 30 cm
(medido desde el punto de pivote hasta el marcador de captura de movimiento). La masa total del eslabón móvil es
de 126 g. Las piezas finales impresas en 3D representan 1/5 de la masa.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

Figura 5. El actuador triplica con un actuador inflado a diferentes elongaciones (aumentando de izquierda a derecha). La parte
de la junta que alberga la rótula está cerrada y protegida por el triplete del actuador suave. Cada actuador consta de diez
cojines individuales conectados entre sí a través de una costura interior. El volumen de un solo actuador es
approXimately 0.35L. Tres tubos están unidos a cada actuador. Dos están conectados a las válvulas de conmutación
para inflar y desinflar el actuador y uno a un sensor de presión.

las partes finales triangulares impresas en 3D de los dos


enlaces. El diseño modular facilita el montaje sencillo y el
acceso a todos los componentes.
El brazo robótico consiste principalmente en tela y se aplica
el procedimiento de fabricación presentado en [23]. Dos
capas de tela de popelina (extremo-textil, poliéster-algodón-
mezcla 65/35) se utilizan en combinación con una capa de
película depoliuretano hermoplástico (TPU) (Perfectex, HM65
ther- adhesivo de fusión en caliente de poliuretano moplástico
0,1 mm) entre las capas de tela de popelín para formar una
estructura sándwich (poplin-película-popelina). Las tres
láminas de materia prima se combinan con una prensa
térmica (Insta, prensa térmica artificial). La capa resultante de
tela procesada es hermética, inexpertensible y más robusta
que la tela de popelina cruda. Es el material primario para el
actuador y la cubierta exterior de los enlaces.

2.2.1. Fabricación de actuadores


Eltriplete act uator consiste en tres actuadores de fuelle
blandos simples ar- range simétricamente alrededor de un
punto de pivote (ver Fig. 2). Un solo actuador de fuelle consta
de diez cojines que están conectados por una costura
interna. La geometría del triplete se muestra en la Fig. 6.
Los actuadores están dispuestos
simétricamente alrededor de un triángulo de conexión en el actuadores se completan con piezas de tela separadas (aún no
medio, que se utiliza para sujetar el triplete del actuador conectadas). El triángulo de conexión se pega en la parte
entre la parte de la unión y los enlaces. superior en un paso posterior, después de que la parte de la
El tejido y las piezas de TPU se preparan con un junta se integra en el triplete del actuador. Finalmente, la
cortador láser (Uni- versal Laser Systems, VersaLaser). Dos tubería (SMC, tubo de plástico de 6 mm) se pega (Loctite 406)
piezas de película de TPU se utilizan para una sola costura. sobre tubos de plástico fl anges (Carmo, tipo 09-219) a las
La razón para usar dos capas de película de TPU es que la aberturas circulares en los actuadores. El triplete del
tela absorbe parte de la película de TPUy, por lo tanto, una actuador externo se muestra en la Fig. 5 con un actuador
sola capa de película no proporciona suficiente resistencia inflado a diferentes longitudes de elongación.
adhesiva. En un primer paso, las piezas de película de TPU se
sueldan a las piezas de tela, que deben combinarse (ver Fig. 2.2.2. Fabricación de enlaces
7 para una explicación detallada del proceso). Este paso Los enlaces consisten en un diseño de dos conchas. La
se repite para todas las piezas del actuador. En un segundo cubierta de tela exterior está hecha de la tela procesada
paso, las piezas de tela que ya incluyen TPU film en la (poplin-film-poplin) y la vejiga hermética interna está hecha
costura se sueldan entre sí. El segundo paso se vuelve a de dos capas de poliuretano film (Rivertex,
aplicar para cada actuador por separado en un proceso de 0,3 mm de poliuretano film) soldado junto con la prensa de
abajo hacia arriba, donde se agregan nuevas piezas de tela a calor. Una hoja de papel pergamino con forma de fit la
la pila ya soldada en la parte superior (suponiendo que la contour interna se coloca entre las capas de film para evitar la
prensa de calor aplique el calor de la placa superior). soldadura sobre el área completa y restringirla a la costura.
Los tres actuadores están conectados en la parte inferior El papel de pergamino se puede quitar después de soldar a
con un piece de tela denotado como el triángulo de conexión través del
y representado en la Fig. 6. En la parte superior, los
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
Figura 6. Dibujo del triplete del actuador que define su
geometría. Todos los números (excepto los ángulos) se
denotan en mm. Tres actuadores están dispuestos
simétricamente alrededor de un triángulo central. Cada
actuador tiene tres orificios para conectar el tubo y una
correa con dos huecos para unir los actuadores con correas
Velcro a los enlaces. Las líneas discontinuas en el actuador
de la derecha indican las partes debajo de la capa superior.
El cuadrado redondeado en el medio especifica la
ubicación de la costura interna que conecta dos cojines.
La ubicación del TPU film que forma la costura se indica
mediante la segunda línea discontinua. La línea discontinua
cerca del contorno exterior especifica la ubicación del
equipo de TPU utilizado para combinar dos capas de tela
para formar un solo cojín. Todas las costuras adhesivas de
fusión en caliente tienen un ancho de 5 mm. La colocación de
la abertura entre dos cojines fueradel centrohacia la mitad del
triplete aumenta el rango de elongación de un solo actuador
y, en consecuencia, el rango de funcionamiento del
eslabón móvil.

apertura para la válvula. El tubo está conectado por una


válvula de conexión angular pegada a la vejiga en un
segundo paso.
Una ventaja de un diseño de dos carcasas es que los
requisitos para el material se pueden dividir. Si bien se
requiere que la vejiga interna sea hermética, la cubierta
externa no lo es, sino que solo necesita restringir la
expansión de la vejiga interna cuando se infla. Por lotanto, la
selección de materiales se simplifica y se puede utilizar
una amplia gama de materiales para la cubierta exterior.
Tenga en cuenta que utilizamos la misma tela procesada
para la carcasa exterior que para el actuador en aras de la
simplicidad. El primer paso para fabricar la carcasa exterior
es soldar Velcro correas (Fasttech, 20 mm) para fiX los
actuadores a las capas de tela pro-cessed de ambos
enlaces. Luego, la carcasa exterior se pega (Loctite 435) a
las piezas finales triangulares impresas en 3D. La costura
longitudinal está pegada para ambos enlaces. Para el enlace
móvil se debe insertar la vejiga internaprimero. Los
diferentes componentes se ilustran en la Fig. 4.

2.2.3. Periférico neumáticocomo


La presión en los actuadores se controla con válvulas
de conmutación rápida (Festo, MHJ10). Estas válvulas solo
tienen un estado binario, es decir, completamente abiertas.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

Figura 7. EX sección empírica de la composición del


actuador en capas. Los TPU films se denotan por S1 y Figura 9. La gráfica de la izquierda muestra la
S2, mientras que las piezas de tela se denotan por F1 y parametrización de orientación del brazo robótico esférico.
F2. Se utilizan dos capas de película de TPU para combinar El punto de pivote se indica por el círculo negro entre
los dos enlaces y la punta del brazo robótico por un círculo
dos capas de material de tela. La ubicación de la película en vacío al final del enlace móvil. Una rotación positiva
el material de la tela se indica mediante la línea discontinua. alrededor del eje x inercial se denota por α y una rotación
La mitad inferior de la figura (F1-S2-S2-F2) muestra una positiva alrededor del eje inercial y se denota por β. El
angular máximo
costura exterior de un solo cojín, mientras que la parte
superior(S1-S1-F1) muestra una parte de la costura interior
que conecta dos cojines. El primer paso del procedimiento de
fabricación incluye la soldadura de dos piezas de TPU film
(S1 y S2) a ambos lados de una pieza de material de
tela (F1). En
un segundo paso, se suelda la pieza de tela preparada la ∘
con TPU film en ambos lados Lodeflexión
inercial es approX± 45 cuando el otro ángulo es cero.
en un proceso de abajo hacia arriba a la pieza de tela usar válvulas de conmutación y válvulas pro-porcionales no
preparada debajo (S2-F2-S1). empleadas comúnmente es que son menos costosas. Una
comparación de precios y un enfoque para unddress las
limitaciones de las válvulas binarias se presentan en [24].
Los transductores de presión (Bürkert, 8230) proporcionan
las mediciones de presión en cada actuador y en la
fuente.

3. Modelado

La parametrización que describe la orientación del eslabón


móvil se introduce en la primera parte de esta sección.
Posteriormente, se presenta una caracterización de la rigidez
articular en función de las presiones del actuador. Luego,
se identifica un mapeo cinemático desde las presiones del
actuador hasta la orientación del brazo a partir de datos para
Figura 8. Diagrama neumático de un solo actuador, que tres niveles diferentes de rigidez de la articulación y se deriva
muestra las cuatro válvulas utilizadas por actuador para un modelo simple que captura la geometría de la configuración
controlar su presión. Las válvulas 1 y 2 se utilizan para del actuador. Finalmente, se discute la capacidad del brazo
inflar el actuador y, por lo tanto, están conectadas a la robótico para ejercer torques de interacción.
presión de la fuente, mientras que las válvulas 3 y 4 se
utilizan para desinflar el actuador y están conectadas
al entorno. El sensor de presión está indicado por el
medidor con flecha. La misma configuración se emplea para
los otros dos actuadores.

o totalmente cerrado. Sin embargo, la aplicación de la


modulación de ancho de pulso (PWM) permite un control
continuo de la masa y, en consecuencia, de la presión en
el actuador. Debido a la pequeña capacidad de flujo del tipo
de válvula em- desplegado, se utilizan cuatro válvulas en total
por actuador. Se utilizan dos válvulas para inflar el actuador
blando y dos para desinflarlo (ver Fig. 8). El mismo ciclo de
trabajo se establece tanto para las válvulas de inflado como
para las dos válvulas de desinflación. La motivación para
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
Eleje z está alineado con el enlace estático del brazo 102369

robótico. El gráfico de la derecha muestra la


configuración del actuador en el marco de coordenadas
inerciales. El eje de simetría del actuador A está alineado
con el eje x inercial, mientras que las orientaciones de
los otros dos actuadores se obtienen girando el

actuador A por ± 120 alrededor del eje z.

3.1. Parametrización de orientación

La orientación del brazo robótico esférico está parametrizada


con dos ángulos extrínsecos de Euler α y β. Los puntos
alcanzables de la punta se encuentran en una tapa esférica,
como se muestra en la Fig. 9. Las rotaciones alrededor del
eje longitudi- nal del enlace móvil no se consideran
debido a la rigidez torsional del triplete del actuador. En
comparación con otras parametrizaciones como las
coordenadas esféricas o los ángulos de Euler intrínsecos, la
parametrización empleada simplifica la derivación del
controlador presentada en la Sección 4.

3.2. Caracterización de la rigidez para diferentes niveles de


presión

En esta sección demostramosque la rigidez del


brazo robótico se puede ajustar cambiando las presiones
del actuador. Con este fin, las preseguros en los tres
actuadores se dividen a un cierto nivel y el eslabón móvil
se desvía manualmente a lo largo de diferentes direcciones
en el plano α β. La fuerza requerida para desviar el eslabón
móvil de la posición vertical se mide por medio de una
célula de carga (ATI, Mini40) sobre el rango de deflexión.
Se utiliza un tope lateral para guiar la deflexión a lo
largo de la dirección negativa α o la dirección β positiva
(comparar Fig. 9). La fuerza medida se convierte en el
par de deflexión multiplicando por la longitud del
eslabón móvil. Los resultados se presentan en la Fig. 10.
Se puede ver que la rigidez es anisotrópica en el plano
α - β.
Utilizandouna aplicación afín de los datos presentados y
comparando la inclinación del ajuste resultante, podemos
concluir que aumentando el nivel de presión en los
actuadores de la presión ambiente a 1,2 bar por-
mits un aumento de la rigidez de 7,67mN ⋅m⋅deg−1 a 38,75mN
⋅m⋅deg−1 en α-dirección negativa (factor de 5,05) y de
2,61 mN ⋅m⋅deg−1 a 53.14mN ⋅m⋅deg−1 en la dirección
positiva β -(factor de 20.34). El rígido-
En principio, la integridad podría aumentar aún más si se
utilizan actuadores con una presión de ruptura más alta
(véase [24]).

3.3. Presión de estado estacionario para mapeo de ángulos

Cada uno de los tres actuadores se expande si se aplica


una presión superior a lapresión. No se investiga la relación
exacta entre la presión interna y el alargamiento del actuador,
pero la atención se centra en la orientación del brazo
robótico en función de las tres presiones del actuador.
Los dos DoF (α, β)∈ R2 se controlan ajustando las tres
presiones del actuador (pA, pB, pC) ∈ R3 . Si las presiones
del actuador se consideran como el
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

Figura 10. El par de deflexión medido a lo largo de dos direcciones en el plano de α β para un total decuatro niveles de presión
diferentes. Las deflexiones a lo largo de la dirección negativa αse muestran en la gráfica izquierda y las deflexiones along la
dirección positiva β-se muestran en la gráfica derecha, respectivamente. Los actuadores se inflan a cuatro niveles de presión
diferentes p, (1.00, 1.05, 1.10, 1.20bar), correspondientes a las cuatro curvas representadas en cada gráfica, y el eslabón móvil se
desvía de la posición vertical a un ángulo de deflexión máximo de 45∘. Se puede observar en ambas parcelas que la
rigidez aumenta con un aumento del nivel de presión en los actuadores. El par de deflexión es approXimately una función
lineal del ángulo de deflexión. Una deflexión en la dirección βpositiva corresponde a una deflexión en la dirección del actuador A,
lo que resulta en valores de rigidez más altos en comparación con una deflexión en la dirección negativa α, que no se
encuentra directamente en la dirección de un actuador.

entradas a la dinámica del brazo, el sistema está sobre- C, con la presión en el actuador A establecida en el nivel de
accionado. La presión adicional permite controlar la presión más bajo pmin, que es en este caso la presión
rigidez global además de la orien- tación (ver sección ambiental. Las gráficas para las presiones B y C establecidas
2.1). Las diferentes combinaciones de presión que producen la en la presión ambiente, así como los mapas de presión
misma orientación del brazo pueden diferir en la rigidez para niveles de rigidez más altos (casos medios y rígidos) se
articular resultante. Como se muestra en la sección ven similares y no se muestran. Las asignaciones
anterior, la rigidez de la articulación aumenta para un nivel presentadas se utilizan en la Sección 4.2 para controlar
de presión más alto en los tres actuadores. Formalmente, esto la orientación del brazo robótico.
significa que el mapeo entre el espacio de presión y el espacio
de ángulo no es en general inyectivo. Para derivar un mapeo 3.4. Modelo de caja gris
inyectivo del espacio de presión al espacio de ángulo que se
puede invertir fácilmente para el control (por ejemplo, calcular Mientras que el modelo presentado anteriormente solo
las presiones requeridas para ángulos deseados dados) y al captura el comportamiento estático, en esta sección se
mismo tiempo cubrir diferentes niveles de rigidez articular, deriva un modelo de tiempo discreto de primer orden para
se aplica el siguiente procedimiento: capturar la configuración del actuador y las posibles
Se elige un nivel de presión más bajo denotado por pmin interacciones entre los actuadores. Los dos ángulos del brazo
en el intervalo [1.01, 1.10bar](laspresiones a ll en este robótico, (α, β), forman el estado y loscambios en las tres
trabajo se denotan como presiones absolutas). Se aplican presiones, (uA, uB, uC), forman las entradas decontrol. Se
diferentes combinaciones de presión a los actuadores y se supone que ambos ángulos son directamente measurable,
registran los ángulos resultantes. Una de las tres presiones se [ ] [ ]
10 0 lo ques(π∕6) −lo ques(π∕6)
establece en pmin y las otras dos presiones cubren todas x(k + 1) = x(k) + γ u(k),
las combinaciones de diferentes puntos de consigna
mayores o iguales a pmin. El procedimiento se repite para
múltiples inferiores
niveles de presión pmin. Cambiar el nivel de presión mínimo 0 1 −1 sin(𝜋∕6) sin(𝜋∕6)
permite ajustar el nivel de rigidez de la articulación. En este ⏟⏞⏞⏟⏞⏞⏟ ⏟⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞ ⏞ ⏞ ⏞ ⏞
⏞⏞⏞⏞⏞⏞ ⏞ ⏞ ⏞ ⏞ ⏞
trabajo, exploramos tres niveles de rigidez diferentes, que se [ =Ad] ⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞
conocen como suave, medio y rígido. El nivel de presión α(k)
⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞]⏞⏞⏞⏞⏞⏞
más bajo pmin se establece en presión ambiente para el ⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏞⏟
=Bd
⎡𝑢Hofer
M. A(𝑘)y⎤ R. D'Andrea Mecatrónica 68 (2020)
ajuste suave, a 1.05bar para el ajuste medio y a 1.10bar , u(k) = 102369
x(k) (2)
= β(k) ⎢uB(k)⎥
para el ajuste rígido. Además, solo se consideran las ⎢ ⎥
⎣u (k)⎦C
condiciones de estado estacionario.
para la derivación de la cartografía. El procedimiento
presentado puede ser ex-
[ ]
tendía a un número arbitrario de niveles de rigidez. La 10
cobertura resultante del espacio de presión y ángulo se y(k) = x(k). (3)
0 1
representa en la Fig. 11 para los ajustes suaves y rígidos, ⏟⏞⏞⏟⏞⏞
respectivamente. Los resultados para el nivel de rigidez media ⏟
son similares y no se muestran en aras de una mejor =Cd
visibilidad.
El Bd matriX incorpora la geometría de la configu- ración
Para cada caso de rigidez considerado, ambos ángulos α y
del actuador premultiplicada por el parámetro desconocido
β se ajustan individualmente a las presiones mediante un γ. Las entradas de la Bd matriX representan cómo cada
ajuste polinómico de tercer orden. La asignación estática se actuador afecta a cada uno de los dos grados de libertad
puede expresar como, (comparar Fig. 9). El Bd matriX se deriva para el enlace móvil
(α, β) = P M(pA, pB, pC), (1) que está en una orientación vertical. Por lo tanto, el modelo
con PM denotando elmodelo polynomial de tercer orden. Un solo es válido en una vecindad de α = 0 y β = 0. El
ejemplo para una ficha resultante se presenta en la Fig. 12 parámetro γ se identifica para cada nivel de rigidez a partir de
para el nivel de rigidez suave. Ambos ángulos se datos transitorios sobre un salto de punto de consigna. Los
representan en función de las presiones variables en los datos utilizados para
actuadores B y
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

Figura 11. El gráfico de la izquierda


muestra la cobertura del espacio de
estado de presión. Los triples de
presión cubiertos para el ajuste
suave (rigidez más baja) se
muestran en azul y los triples de
presión para el ajuste rígido (rigidez
más alta) se muestran en rojo. Para
ambos casos, los triples co-vered
durante la recolección de datos se
encuentran en tres planos
ortológicos (indicados por los planos
azul claro y rojo con líneas de
intersección negras) con una presión
correspondiente a pmin. Los datos
para el caso de rigidez media se
omiten para una mejor visibilidad y
leyenda, se hace referencia al lector a la versión web de este artículo.) todos los datos mostrados se
muestrean a la baja por un factor de
diez para dar una mejor visibilidad.
La gráfica de la derecha muestra
los ángulos resultantes. La
envolvente de los ángulos
alcanzables es approXimately circu-
lar. El área de ángulos alcanzables
es significativamente menor para el
c ase rígido(en rojo), porque las
presiones están limitadas por la
presión máxima posible de los
actuadores. Tenga en cuenta que
el α y
β-ejes se invierten para que
coincidan con el sistema de
coordenadas utilizado a lo largo de
este trabajo. (Para interpre- Tación
de las referencias al color en
esta ficha

Higo. 12. El figure Ilustra el presión Para ángulo mapa PM, para el suave rigidez ajuste. El firme estado Ángulos α
(izquierda) parcela) y β (derecha parcela) son Mostrado como a función de diferente presión Combinaciones para pB y pC.
Para el datos Mostrado en estos Parcelas el presión pA es poner Para ambiente presión. El medido datos es Mostrado en
negro y el coloreado Superficie Muestra el Tercero orden polinomio fit identificado. A Bajo presión en accionador B y a Alto
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
presión en accionador C Resultados en a grande Negativo valor para α, mientras a Alto presión en accionador
102369
B y a Bajo
presión en C Resultados en a grande Positivo valor para α. El ángulo β tiene en gran parte Negativo valores cuando las
presiones en ambos actuadores B y C están cerca de la presión ambiente. El aumento de las presiones en los actuadores B y C
causa el ángulo β para saturar en general positivo valores (causado por el rígido articulación). Cuando Pressures B y C son
cerrar Para ambiente presión (como es el caso para presión A), el brazo Muestra a Negativo deflexión en el
βdirección. Este comportamiento en condiciones ambientales es causado por imperfecciones de fabricación. Tenga en cuenta que
un ligero aumento en las presiones B y C mueve el brazo a una orientación vertical.

la identificación es la misma que se muestra en la Fig. 16. Los La fuerza ejercida en la punta del eslabón móvil se
valores resultantes son γblando = 1. 55rad∕bar, γmed = 0. mide en su dirección no correcta para diferentes
70rad∕barra y γstiff = 0. 35rad∕bar. El ajuste resultante para orientaciones y presiones. Sin pretender la completitud,
el parámetro γ es menor para valores de rigidez más altos, lo investigamos la fuerza aplicada en una dirección en el
que se debe a las presiones más altas requeridas para una α − β-plano, es decir, en dirección al actuador B (comparar
cierta desfección angular. El modelo de primer orden no Fig. 9). La fuerza de in-teracción se mide en tres posiciones
incluye ninguna fuerza de resorte de los actuadores, diferentes en la dirección de actuación del actuador B. La
amortiguación o fuerzas gravitacionales. El modelo se utilizará orientación en esta dirección se denota por el ángulo φB, con
en el esquema de aprendizaje presentado en la Sección la dirección positiva correspondiente a una extensión
4.3. del actuador B. Las fuerzas se miden para φB ∈ {−40◦, 0◦,
40◦} y five
3.5. Análisis de par de interacción diferentes presiones en el rango de [1.01, 1.20bar]. Las
orientaciones que responden a φB = ±40◦ se eligen para estar
cerca de los límites del rango de actuación (45∘)evitando al
En la sección inicial de este capítulo, investigamos la
mismo tiempo los efectos límite. Se coloca una célula de carga
capacidad del brazo robótico para aplicar fuerzas durante las en la ubicación correspondiente y la fuerza en la dirección
interacciones estáticas con el medio ambiente. La normal del eslabón móvil se mide en la dirección positiva
investigación presentada en esta seccióndebe entenderse φB(actuador expanding). La fuerza medida se convierte en un
como una caracterización del sistema desarrollado. El par multiplicando con la longitud conocida del eslabón móvil.
enfoque de control presentado en el capítulo siguiente no se Los resultados se muestran en la Fig. 13.
basa en los resultados presentados aquí.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

El controlador de presión se presenta independientemente del


actuador y de la plementado de forma idéntica para los tres
actuadores. Las válvulas de conmutación pueden solamente
ser controlado Para ser completamente abrir o
completamente cerrado. Continuo control del flujo másico, y
correspondientemente de √ la presión, se logra por ap-
modulación del ancho de pulso. El flujo másico estático del
totalmente abierto válvula 𝑚̇ Fo, es Descrito por el ISO 6358
estándar modelo [33],
⎧ ( 𝑝d )2
√ −𝑏

F E, pd ) = pen √ (1−b) pu
𝑚̇ o (p
Sρn0
⎨ ∕u
T00∕T
pu Sρ0 T 1− Sí pd ≤ b, (4)
Tu pen 2 si ppud >
b
donde pu y pd representan la presión hacia arriba y hacia
abajo, los parámetros
ρ0, T0 denotan densidad y temperatura en el estado de
referencia ISO 6358, b la relación de presión crítica que
determina una condición de flujo asfixiado y S la conductancia
sónica. Ambos parámetros, b y S son proporcionados por el
Figura 13. Pares medidos ejercidos por el brazo robótico en fabricante de la válvula.
función de la pres- seguridad en el actuador B y la
orientación del brazo denotada por φB. Las tres curvas Al aplicar un determinado ciclo de trabajo, dc, la masa
denotan diferentes longitudes de expansión del actuador B. real flow a través de una sola válvula, ṁ , se calcula como el
Los pares más altos se logran si la expansión del actuador es producto del ciclo de trabajo y la masa flow de la válvula
mínima (verde, curva sólida, φB = −40◦) seguido de que el completamente abierta,
enlace móvil esté en posición vertical (azul, curva
discontinua, ṁ = dc ⋅ ṁ fo. (5)
φB = 0◦) y los pares más pequeños se miden para el
actuador B expandido maxi- Dado que se utilizan dos válvulas diferentes para el inflado
mally (rojo, curva punteada por guiones, φB = 40◦). El par y la deflación, el modelo anterior se aplica a ambas válvulas,
máximo de cada curva se alcanza para una presión de 1.2bar siendo la presión aguas arriba y aguas abajo la presión de la
y corresponde a fuerzas normales en la punta del eslabón fuente y la presión del actuador para la válvula de inflado, y la
presión del actuador y la presión ambiental para la válvula de
móvil de 9.8N, 6.3N y 2.7N para las tres orientaciones
desinflación. Una positiva ṁ cresponde aun flujo másico de
consideradas.
la válvula infladora y a una masa negativa a la válvula de
Se puede ver que el par approX sigue una tendencia desinflante.
lineal en la presión del actuador. El par es A partir de la presión actual p y su punto de consigna pSP,
considerablemente mayor cuando el la masadeseada flow se calcula como
( )
ṁ = V ∕(R0 T0 ) ⋅ kP (pSP − p) + kI (pSP − p) dt , (6)

el actuador es el menos expandido en comparación con el
donde V denota el volumen medio de un actuador, R0 la
caso cuando el actuador está casi completamente
constante de gas ideal y T0 la temperatura en el estado de
expandido. referencia ISO 6358. El término constante en (6) se
multiplica por la suma de un término proporcional y un término
4. Control integral en el error de presión. Las ganancias proporcionales e
integrales del con- troller se denominan kP [s−1 ] y kI
En esta sección presentamos el enfoque de control [s−2 ], respectivamente. La ecuación se deriva tomando la
aplicado al brazo robótico esférico. La arquitectura de derivada temporal de la ley del gas ideal y descuidando
control en cascada se descompone en tres bucles internos los cambios en el volumen y la temperatura. La derivada
para controlar la dinámica de presión más rápida y un bucle temporal de la presión es entonces reemplazada por el
externo para la dinámica angular más lenta (ver Fig. 14). término proporcional-integral (nótese las unidades de las
ganancias proporcionales e integrales).
El control de presión se presenta en la primera parte de la
Se emplea un enfoque de programación de ganancia para
sección y el control de ángulo en la segunda parte. el ga proporcional en kP
Finalmente, se presenta un esquema de control de como función del absoluto presión error
aprendizaje para reducir las interacciones no deseadas de los ( )
|
kP = 1 − exp(− pSP − |p ∕e63 ) ⋅ k̄ P (7)
actuadores y mejorar aún más el rendimiento del control.
where k̄ P denota la ganancia proporcional nominal
4.1. Control de presión alcanzadad para errores de presión infinitos y e63 el error
cuando kP toma el 63,2% de su valor máximo. El enfoque
El controlador de presión utilizado en este trabajo está de programación de ganancia garantiza una buena per-
estrechamente relacionado con el enfoque presentado en formancia de seguimiento, al tiempo que reduce el parloteo de
[24], con varios aspectos que se están mejorando. El la válvula para pequeñas desviaciones de presión. Una banda
muerta se produce para ciclos de trabajo pequeños, porque
el tiempo de apertura de la
M. Hofer y R. D'Andrea
directamente Mecatrónica 68 (2020)
en el controlador
102369
de
Figura 14. La arquitectura de posición para la acción de control
control en cascada utilizada para de avance de alimentación no se
controlar el brazo robótico esférico. muestran para en aras de la
Las presiones del actuador se claridad). Se aplica un esquema de
controlan en tres bucles internos aprendizaje iterativo en paralelo con
dependientes. Sobre la base de el controlador de posición para tener
los ángulos actuales y los puntos en cuenta las perturbaciones
de ajuste angulares, el con- troller repetitivas y mejorar el
de posición calcula los puntos de seguimiento de la perfor-
ajuste de presión (los puntos de
consigna an- gulares utilizados
mance. Las señales ujse definen sobre un completo
iteración j. En each tiAm,Be,Cpaso k,
el elemento correspondiente se
agrega a los puntos de ajuste de
presión del controlador de posición.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

Figura 15. El mapeo inverso desde los ángulos deseados a las presiones requeridas para el caso de rigidez suave. La gráfica de
la izquierda muestra la presión A requerida para lograr una ciertacombinación (α, β ). Las gráficas central y derecha muestran lo
mismo para las presiones B y C. El mapeo inverso solo se muestra para los valores factibles de α y β que se encuentran en el
rango de actuación del brazo robótico. Tenga en cuenta que las superficies de las tres presiones del actuador reflejan la
simetría de la configuración del actuador empleada. Una rotación de la superficie para la presión A por 120∘ a lo largo de la
dirección vertical positiva approXda como resultado la superficie para la presión B y una rotación a lo largo de la dirección vertical
negativa approXda como resultado la superficie para la presión C. Esto corresponde a la configuración del actuador que
se muestra en la Fig. 9. Los mapeos inversos para el caso medio y rígido se ven similares y no se muestran en aras
de la brevedad. La principal diferencia es que las presiones alcanzables más pequeñas son más altas que la presión
ambiental, como es el caso del modo suave.

La boquilla de la válvula es demasiado corta para que se a saber


acumule un flujo másico constante. Esta banda muerta fue
identificada en [24] y está ligeramente refinada para este uα = kPα(αSP − α) + kIα (αSP − α) dt (9)

trabajo. Un ciclo de trabajo por debajo de dc min = 0.05 se
establece en cero para evitar el funcionamiento de las uβ = kPβ (βSP − β) + kIβ (βSP − β) dt, (10)

válvulas cuando no es posible el flujo y las válvulas son
propensas al sobrecalentamiento. Finalmente, los ciclos de
trabajo de las válvulas infladoras y desinflantes se calculan
dividiendo el flujo másico deseado en (6) por ṁ fo de la ,donde αSP, βde
u el punto denotan los
SP consigna puntos de consigna angulares, u
ajustar-
β
válvula infladora, si ṁ es positivo o por ṁ fo de la válvula

de desinflación si ṁ es negativo. Para un positivo

se másico ṁ
flujoestablece en, cero
el ciclo de trabajo de la válvula de desinflado
y vice −1 P [−] y k Y α ] el proporcional y
Versa. ments y k Pα [−],k Y
oα [s
], k β oβ [s1−
en una tabla de búsqueda. La razón por la que utilizamos el
4.2. Control de posición ajuste polinómico de tercer orden para calcular los ángulos del
modelo y no los datos angulares en bruto directamente es para
El controlador de posición explota el mapeo de presión a obtener un mapeo suave desde los ángulos deseados a las
ángulo de estado estacionario presentado en la Sección 3.3 presiones requeridas. El mapeo inverso obtenido para el caso
utilizando el mapeo numéricamente invertido desde los blando se ilustra en la Fig. 15, y se utiliza para calcular los
ángulos deseados a las presiones requeridas. El enfoque puntos de ajuste de presión para ciertos puntos de ajuste
presentado a continuación se aplica para los tres ajustes de angulares,
rigidez (suave, medio, rígido). En primer lugar, el modelo
polinómico de tercer orden ajustado se evalúa para un (pASP, pBSP, pCSP) = P M−1(αSP, βSP), (8)
conjunto de presiones espaciadas uniformemente para con P M−1 denotando el mapeo inverso. Consiste en una
obtener los ángulos de modelo correspondientes. De este tabla de búsqueda separada para cada presión en función de
modo, una de las tres presiones se establece de nuevo en los dos ángulos deseados. La interpolación de oreja de bilina
pmin,como fue el caso durante la recopilación de datos del se aplica para las presiones dadas los ángulos deseados
mapeo identificado. Para una cuadrícula de ángulos para mejorar la precisión.
espaciados uniformemente,se determina elángulo l de modo Confiar puramente en el mapeo inverso en un sentido de
más cercano y las presiones correspondientes se almacenan avance conduce a un rendimiento de control deficiente debido a
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
la naturaleza estática del mapeo y los efectos dinámicos ganancias integrales para α y β,respectivamente.
102369 Se utilizan
descuidados, como la histéresis y la fricción articular. Por lo diferentes ganancias del controlador en α y βdirección para
tener en cuenta la autoridad decontrol diferente en los dos
iones directos. Añadiendo las salidas de los controladores PI a
tanto, los ángulos de corriente y el puntode consigna los puntos de consigna angulares originales y aplicando la
angular s se alimentan primeroen dos controladores PI asignación inversa se obtienen los puntos de consigna de
desacoplados que calculan puntos de ajuste angulares presión para los tres actuadores,
ajustados,
(pASP, pBSP, pCSP) = P M−1(αSP + uα, βSP + uβ ). (11)
Nótese que el mapeo inverso en principio desacopla los
ángulos en el sentido de que cambiar α, mientras se
mantiene β constante produce un nuevo conjunto de
puntos de ajuste preseguros que no cambian β. Sin
embargo, esto solo es válido en condiciones de estado
estacionario y hasta la precisión del modelado del mapeo de
presión a ángulo. En la siguiente sección se presenta un
enfoque de aprendizaje para compensar las posibles
interacciones entre los ángulos.

4.3. Control del aprendizaje

Se aplica un enfoque de control de aprendizaje iterativo


(ILC) en paralelo con el enfoque de control en cascada
presentado anteriormente. Esto es para compensar, por un
lado, las interacciones entre los dos ángulos y, por otro
lado, los efectos no modelados, como el
comportamiento de histéresis debido al material empleado
como así como la fricción articular. ILC se aplica para
mejorar el rendimiento de seguimiento de tareas repetitivas. La
idea general es registrar el error de seguimiento en una
iteración y usarlo para mejorar el rendimiento en la
siguiente iteración.
El modelo lineal del sistema, presentado en la Sección
3.4,se utiliza para predecir el comportamiento del sistema en
la siguiente iteración. La señal de corrección para compensar
la disturbancia repetitivase calcula como la solución de un
problema de optimización cuadrática. Este enfoque se conoce
como Norm Optimal Iterative Learning Control (NOILC;
véase [34]). El
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

El esquema NOILC se ha aplicado previamente aun sistema La iteración se define por la duración del tiempo de una sola
SISO (véase [13]) y se extiende en este trabajo al caso trayectoria y el tiempo de muestreo del esquema de
MIMO. aprendizaje, que se denota por TILC. Basado en el modelo
Si bien la ILC puede aprender a compensar las introducido en (3), se utiliza la representación del sistema
perturbaciones repetitivas, no puede compensar las elevado, con
perturbaciones no repetitivas. Por lo tanto, el enfoque de
aprendizaje se aplica en paralelo con el controlador de
retroalimentación.
presentado en no
perturbaciones la repetitivas
Sección 4.2(como
para tener en cuenta las
esbozado en ⎡ Cd Bd 0 0 0⎤
⎢ ⎥
[35]). P=⎢ ⋮ CB 0 ⎥ ∈ R 2N×3N , (17)
Introducimos
denota el la siguiente notación, donde el índice j 𝑁−1 d
número de iteración y N el número de pasos de tiempo de a ⎣ C A B ⋯ C A BB
soltero( iteración )
⎦ d dd d
parad escribir la dinámica lineal en una sola iteración como,
yj ∶= α (0), β (0), ... , α (N − 1), βj (N − 1) ∈ R2N
j j j d

(12
)
( )
𝑦SP ∶= α𝑗 (0), β𝑗 (0), … , α𝑗 (𝑁 − 1), β𝑗 (𝑁 − 1) ∈ ℝ2𝑁
SP SP SP SP
(13
)
( )
𝑒𝑗 ∶= 𝑒α𝑗 (0), 𝑒𝑗 (0), …α , 𝑒𝑗 (𝑁 − 1), 𝑒𝑗 (𝑁 − 1) ∈ ℝ2𝑁
β β 𝑦𝑗 = P En
𝑗 +
(14 d

)
( )
𝑑 ∶= 𝑑α𝑗 (0), β𝑑𝑗 (0), …α , 𝑑𝑗 (𝑁 −β 1), 𝑑𝑗 (𝑁) ∈ ℝ2𝑁 ej = ySP − yj = ySP − P uj (18)
−d
(15 ej+1 = ySP − P
Enj+1 − d
) (
uj ∶= uj) (0), uj (0), uj (0), ... , uj (N − 1), uj (N − 1), uj = ej − 1 – uj ).
j+
(N − 1) ∈ R3N , Pu(
A B C A B
C (16)
El estado inicial del sistema se trata como una perturbación
repetitiva. El
La entrada de corrección se calcula minimizando una
Dónde αj (k) y α𝑗SP(𝑘) denotar el ángulo y su punto de consigna en
función de costo cuadrática en el error de seguimiento previsto
iteración j y en Hora paso k, 𝑒𝑗 el error en α y 𝑑𝑗 (𝑘) el de la siguiente iteración y el
perturbación en α durante

α (k) α siguiente entrada de corrección,


iteración j y en el paso de tiempo k. Las definiciones se aplican en consecuencia para el ángulo

β. Las señales de compensación de presión se denotan por (uj (k), uj (k), uj (k))
1 T T
para la iteración j y el paso de tiempo k. Los puntos de
consigna angulares yA sonB el sCame SP J (uj+1)
para todas las iteraciones y las perturbaciones en ambos = j+1j+1 + (uj+1 − uj )TS(uj+1 − uj ) + uj+1
T[ej+1 Me
D
2 W Du ] ,
ángulos se supone que (19)
ser repetitivo entre iteraciones. El número de pasos de
tiempo para un solo
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

Figura 16. Comparación del rendimiento de seguimiento para tres valores diferentes de rigidez articular. Las dos gráficas
superiores muestran los ángulos α y β y las tres gráficas inferiores muestran las presiones en los actuadores A, B y C.
Los ángulos y presiones para el nivel de rigidez más pequeño (suave) se muestran en azul (punteado), para el nivel de rigidez
medio (medio) en verde (punteado por guión) y para el valor de rigidez más alto(rígido) en rojo (sólido). Los niveles mínimos de
presión correspondientes a los tres niveles de rigidez se indican mediante la línea discontinua en las gráficas de presión
para cada nivel de rigidez. Los rendimientos de seguimiento para los modos de rigidez baja y media son comparables. El
error de seguimiento RMS del modo rígido se reduce en aproximadamente un 30% con respecto al del modo blando.
El controlador de posición para cada ajuste de rigidez está ajustado para obtener el mejor rendimiento individual. Tenga en
cuenta que el cambio de presión requerido para un cierto cambio en la orientación es mayor para una mayor rigidez
articular.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

donde M, S, W son matrices de costos semi-definidas + (P TMP + S + DTW D)−1 P TMej . (21)
positivas de dimensiones apropiadas y El Marcha atrás en (21) es garantizado Para existir si S es
escogido Para ser Positivo
U B
⎡−I3 I3 ⎤ definido. Las entradas de corrección
n
uj C(k), uj (k), uj (k) se
añaden a la pres- o

1 (R) ⎥ ∈
3N×3N Puntos de
inversa enconsigna seguros
(11) durante calculados por la asignación
la iteración
𝐷
⎢ = TCIT –I3 I3 j para cada paso de
tiempo k.

⎣ 03 0 3⎥
5. Resultados
⎡1 0 0⎤ ⎡0 0 0⎤ (20
⎦ ) Resultados de la evaluación experimental de la robótica
esférica
Yo
⎢ = 0⎥ 1 ⎢ 0⎥3 , 0
= 0 0 03
⎢ ⎥ ⎢ ⎥
⎣0 0 1 ⎦ ⎣0 0 0⎦ en esta sección se presentan el brazo y el controlador
propuesto. El
El rendimiento de control para diferentes niveles de rigidez
es una aplicaciónDEla derivada de la señal de corrección, se analiza en la Sección 5.1 y los resultados del
mediante el esquema de diferenciación numérica de primer
experimento de seguimiento de posición para el modo
orden hacia adelante. El primer término en suave después de aplicar un esquema de aprendizaje son
(19) penaliza el error de seguimiento previsto en la siguiente
presentado en la Sección 5.2.
iteración, el segundo término añade un coste a los cambios Los algoritmos de control se implementan en C++ y se
entre la señal de corrección de la iteración actual y la ejecutan en un ordenador portátil (CPU Intel Core i7, 2,8
siguiente iteración y el último término penaliza la derivativa de GHz). Las válvulas y los sensores de seguridad están en
la señal de corrección en la siguiente iteración. La adición de interfaz sobre un dispositivo Labjack T7 Pro. Los controladores
los dos últimos términos mejora el comportamiento de de presión se ejecutan a 200Hz, el controller de posición
aprendizaje transitorio al evitar cambios importantes entre las a50Hz y el esquema NOILC tiene un tiempo de muestreo T ILC
iteraciones (segundo término) y al deshabilitar el aprendizaje a = 1∕50s. La comunicación al hardware, el registro de datos
altas frecuencias (último término), que es una práctica común y los bucles de control internos y externos se implementan
en ILC y también puede abordarse mediante el uso de un en subprocesos separados para una mejor modularidad y
llamado filtro Q (ver [35]). El problema de iones op- timizat perfor- mance. La presión de la fuente se establece en 2bar y
(19) no incluye restricciones en las entradas de corrección, los actuadores se oper- en un rango de presión de [1.0,
de modo que la solución óptima para las entradas de 1.25bar]. Ambos enlaces se inflan a una presión de 1,25bar.
control se pueda poner en forma cerrada. La viabilidad Las válvulas de conmutaciónfuncionaban a una frecuencia
de las entradas de corrección resultantes se garantiza PWM de 200 Hz. Los ángulos del enlace móvil, (α, β),
limitándolas al rango factible en un segundo paso. La solución serecuperan de los datos de posición proporcionados por un
óptima se calcula como, sistema de captura de movimiento infrarrojo que se ejecuta a
uj+1 ⋆ = argmin J (uj+1) 200Hz y proporciona una precisión submilimétrica. Los
uj+1 parámetros
= (P TMP + S + DTW D)−1 (P TMP + S)uj del controlador pressure se eligen como k̄ P = 40s−1 para
el mod suave e y
k̄ P = 20s−1 para los modos medio y rígido (see (7)). El
parámetro de programación de ganancia e se establece en
e63 = 0.005bar y la ganancia integral en k I = 120s−2
para
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

Figura 17. Resultados del brazo robótico esférico que rastrea una trayectoria cuadrada. La gráfica superior muestra el ángulo
α,la segunda traza el ángulo β y las tres gráficas inferiores muestran las presiones en los actuadores A, B y C. Se muestran dos
iteraciones del esquema de aprendizaje. Lascurvas green (punteados por guiones) muestran los ángulos y las presiones durante
la iteración cero (sin aprendizaje) y las curvas azules (sólidas) muestran las variables después de aplicar el esquema de
aprendizaje para la iteración 48. Para las dos gráficas superiores, las curvas rojas (discontinuas) indican los puntos de ajuste de
angular (iguales para todas las iteraciones). Durante las iteraciones cero, el rendimiento de seguimiento en β se ve claramente
afectado por un salto de punto de consigna en α. El esquema de aprendizaje puede compensar la interacción y mejorar el
rendimiento del seguimiento. En las tres gráficas inferiores, el puntode ajuste de presión se representa mediante la curva
roja (discontinua) para la iteración 48. Se puede ver en las gráficas que los puntos de consigna están en general bien rastreados,
excepto durante las fases de deflación, cuando el punto de consigna está cerca de la presión ambiental. Se produce un ligero
parloteo de la válvula y se nota por los picos en las medidasprevias.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

Cuadro 1
Ajuste de los parámetros del controlador de posición para
diferentes saltos de consigna y modos de rigidez. Un salto
de consigna de 20∘ corresponde a los resultados de
experiencia presentadosen la sección 5.1 y un salto de
punto de consigna de 40∘ a los resultados presentados
en la sección 5.2.
salto de punto de rigidez kPα [ − ] kIα [s−1 ] kPβ [ − ] kIβ [s−1 ]
consigna [∘]
20 suave 0.4 0.05 0.8 0.4
20 Medio 0.05 0.05 0.1 0.05
20 tieso 0.05 0.05 0.03 0.05
40 suave 0.3 0.05 0.1 0.05

los tres modos. Las ganancias de PI del controlador de


posición se eligen para obtener el mejor rendimiento individual
y se resumen en la Tabla 1. Las matrices de afinación del
enfoque de control de aprendizaje se eligen como M = 0.01
⋅ I,
S = 5 ⋅ I y W = 0.002 ⋅ I, donde I denota la identidad matriX
de dimensiones ap- propriate.
El rendimiento de seguimiento del brazo robótico esférico se
5.1. Evaluación del controlador para diferentes modos de evalúa en una trayectoria de forma cuadrada que incluye
rigidez
saltos suaves de punto de consigna de 40∘ en ambos
En esta sección presentamos los resultados de un ángulos (con perfiles de velocidad angular continua) y una
análisis de posición para diferentes modos de rigidez duración de
articular. Tres controladores están diseñados como se 10s. Los resultados del experimento de seguimiento se
describe en la Sección 4.2 para tres mods de rigidez muestran en la Fig. 17 como serie temporal y en la Fig. 18
diferentesdenotados como suaves, medios y rígidos. Los en el espacio angular. Se remite al lector al archivo adjunto del
rendimientos de seguimiento resultantes para una trayectoria video para obtener una impresión de los experimentos
de forma cuadrada con saltos de punto de consigna de 20∘( ±
realizados.
10∘) semuestran durante dos iteraciones consecutivas en la
Fig. 16. De la Fig. 17 se puede observar que en la iteración cero del
El rendimiento de seguimiento aumenta para niveles más esquema de aprendizaje (no se aplica el aprendizaje),
altos de rigidez articular. El comportamiento para el modo unsaltoangl e en α provoca un error significativo en β. No
ocurre lo contrario, lo que puede explicarse por la disposición
rígido es generalmente más repetitivo. La mayor rigidez
del actuador que se muestra en la Fig. 9. Un cambio de ángulo en
articular podría dominar otros comportamientos dinámicos
β ocurre a lo largo de la línea de simetría de la configuración del
menos repetitivos, como la fricción articular yel
actuador (es decir, el eje x). Por lo tanto, el ángulo α se ve
comportamiento material no lineal. En la siguiente sección se
menos afectado por un cambio en β. Sin embargo, un cambio
presenta un enfoque para mejorar el rendimiento de
de punto de consigna en la dirección α no se produce a lo
seguimiento para el modo suave.
largo de una línea de simetría de la configuración del actuador
y, por lo tanto, es más probable que perjudique el rendimiento
5.2. Control del aprendizaje
de seguimiento en la dirección β.
Un salto positivo en la dirección αse ordena en t = 6s. Por
En esta sección, investigamos la aplicabilidad del
lo tanto, las presiones en los actuadores A y C se reducen
esquema de aprendizaje para mejorar el rendimiento de
y la presión en B aumenta. El brazo robótico se empuja
seguimiento para el modo suave. La movilidad para
contra el actuador que se desinfla
considerar este modo de rigidez es doble. En primer lugar,
el sistema presentado está diseñado para tener un alto
cumplimiento conjunto. Por lo tanto, creemos que es
beneficioso emplear enfoques de control que preserven el
cumplimiento inherente yno simplemente alteren la dinámica
del sistema para mejorar el rendimiento del seguimiento. Una
discusión detallada de la compensación entre el cumplimiento
y el desempeño del control está más allá del alcance de este
trabajo y se remite al lector [36]. En segundo lugar, a partir de
los resultados presentados en la Sección 5.1,el modo suave
es el modo más desafiantepara lograr un alto rendimiento de
seguimiento. Si se puede demostrar la aplicabilidad del
esquema de aprendizaje para este modo, es
comomejorartambién los modos de rigidez articular más
altos.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
También se han investigado esquemas de aprendizaje más
102369
sencillos, como la ILC de tipo PD (véase [35]). No se
incorporó ningún conocimiento del modelo con estos métodos
y el esquema se ha aplicado en una configuración en
serie con el controlador de posición ajustando los puntos
de consigna angulares. En comparación con el enfoque
NOILC, la mejora del rendimiento de seguimiento con la ILC de
Figura 18. Resultados del experimento de seguimiento tipo PD fue muy limitada. Una corrección en α típicamente
cuadrado representado en el espacio angular. La perjudicó el rendimiento en β y viceversa debido a la falta
trayectoria consiste en saltos de punto de consigna de 40∘ y de conocimiento del modelo.
se rastrea en sentido contrario a las agujas del reloj. El
rendimiento de seguimiento de la iteración cero (sin
aprendizaje, control de retroalimentación puro) se muestra
por la línea verde (punteada por guiones) y la performancia
de seguimiento probada de la iteración 48 por la línea
azul (sólida). El punto de set se representa mediante las
líneas rojas (discontinuas). Las interacciones entre los dos
ángulos se pueden ver claramente en la esquina superior
izquierda del cuadrado. Cuando el brazo se mueve en una
dirección de α positiva, se empuja hacia el actuador C,
haciendo que el brazo se desvíe en una dirección de
βpositiva. El esquema de aprendizaje puede compensar este
efecto y conducir a un mejor rendimiento general de
seguimiento. Tenga en cuenta que el α y
β -ejes se invierten para que coincidan con el sistema
decoordenadas utilizado a lo largo de este trabajo.

C que hace que el brazo se desvíe hacia la dirección positiva


β. El esquema de aprendizaje se ajusta a este error
reduciendo el punto de consigna para la presión C y, por lo
tanto, aumentando la velocidad de deflación. Al mismo
tiempo, la presión en el actuador A aumenta ligeramente en
comparación con la iteración cero y se incrementa en el
actuador B de manera más clara para empujar hacia el
positive
α-dirección y compensar la deflexión en la dirección β.. Este
comportamiento transitorio claramente no es capturado por el
controlador de retroalimentación, que se basa en la
información de estado estacionario del sistema. Sin embargo,
el esquema de aprendizaje que se basa en el conocimiento
del modelo de la configuración del actuador es capaz de
mejorar el rendimiento del seguimiento.
Sin embargo, el rendimiento de seguimiento perfecto no se
logra en la iteración final que se puede ver en la Fig. 18 por
los errores de seguimiento distintos de cero tanto en α como
en β durante la última iteración. Este comportamiento se
puede atribuyer a dos razones. En primer lugar, las
perturbaciones no repetitivas probablemente ocurren debido a
los materiales blandos empleados y la interacción de los
bucles de control de carcasa desubprocesos múltiples.
Dado que el esquema de aprendizaje solo puede abordar
las perturbaciones repetitivas, no puede compensar tales
efectos no repetitivos. En segundo lugar, el objetivo no
solo incluye el error de seguimiento como coste, sino
también dos términos para mejorar el comportamiento de
aprendizaje. El coste de la derivación de la señal de
corrección (tercer término en (19)) conduce a una
supresión del contenido de alta frecuencia en la entrada de
corrección. El efecto se puede ver en la Fig. 17 por las
trayectorias angulares ligeramente suavizadas en relación
con las trayectorias de punto de consigna.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
superior. La capacidad de una sola articulación para
El rendimiento inferior de seguimiento de la presión ajustar su rigidez es un sitio de prerrequido prometedor
durante la deflación cerca de la presión ambiente puede para soportar una carga útil y también limitar las interacciones
explicarse por la pequeña diferencia de presión sobre la posibles e indeseables de múltiples, en serie. juntas
válvula y el flujo másico correspondientemente pequeño a conectadas.
través de la válvula de desinflación (compare (4)). Además, la El enfoque de control actual se basa en la aplicación de un
limitada capacidad de flujo de las válvulas de conmutación esquema de aprendizaje no causal para mejorar el rendimiento
empleó aún más la masa de lamasa. del control. El trabajo futuro debería abordar la identificación
de modelos dinámicos más precisos para el diseño de
6. Conclusión enfoques de control basados en modelos de causa. El modelo
gray-boX utilizado en este trabajo muestra resultados
Este artículo presentó el diseño de un brazo robótico prometedores en combinación con el esquema de aprendizaje.
esférico inflable, basado en una configuración de articulación Sin embargo, el modelo debe extenderse para ser
compacta. Sólo tres adaptadores inflables que están dependiente de la seguridad e incorporar fuerzas de resorte
dispuestos simétricamente alrededor de una articulación en los actuadores, amortiguación y también tener en cuenta la
esférica se vuelven a utilizar para controlar los dos DoF del gravedad. Además, el mapeo identificado desde las presiones
brazo robótico. Se ha presentado un procedimiento de del actuador hasta los ángulosdel brazo solo es válido para un
fabricación detallado con la esperanza de fomentar el diseño y nivelde presión más bajo correspondiente a un nivel de rigidez
el desarrollo de sistemas de robo suave similares basados fiXed. En consecuencia, se ha demostrado que el enfoque de
entelas. La cinemática y la dinámica del sistema se identifican control presentado es aplicable a niveles de rigidez discretos y
mediante dos modelos. El mapeo estático desde las presiones múltiples. Sin embargo, se debe investigar cómo se puede
del actuador hasta la orientación del brazo se identifica para controlar continuamente la rigidez de la articulación.
tres niveles de rigidez diferentes correspondientes a tres La capacidad del brazo robótico para aplicar fuerzas durante
niveles de presión inferiores del actuador. El mapeo inverso se las ininteracciones estáticas con elentorno se ha investigado a
emplea en tres controladores de posición separados para lo largo de una soladirección. Una extensión interesante sería
determinar las pres- seguridades del actuador para una una caracterización completa de las posibles fuerzas de
determinada orientación del brazo. Se evalúa el rendimiento interacción en diferentes orientaciones y en
de seguimiento para cada uno de los tres niveles de rigidez. El
mejor rendimiento de seguimientose logra para el nivel más alto
de rigidez articular. En unenfoque de control de aprendizaje se
desarrolla y utiliza un modelo dinámico de gray-boX que
captura las interacciones de los dos DoF para la con- fidel
actuadordada. El esquema de aprendizaje se aplica almodo
de rigidez lo west y escapaz de compensar las
interacciones entre los dos DoF del sistema ligero y
compatible. Los resultados muestran que se puede
demostrar una perfor- mance de control satisfactoria en una
trayectoria cuadrada que sirve como prueba de concepto
para la configuración del actuador propuesta.
Si bien el diseño presentado es modular debido a las
conexiones rígidas entre los enlaces y el triplete del actuador,
se puede optimizar con re- spect a la parte de la junta y la
presión máxima de ráfaga del actuador. La articulación rígida
de bola y zócalo induce la fricción de la articulación y tiene un
rango limitado que limita el rango de actuación del brazo
robótico. El uso de materiales blandos para la articulación y
también laspartesfinales de los enlaces de identificación de la
plataforma podría aumentar el rango de actuación del brazo
robótico y reduciría aún más su peso. Una mayor presión
máxima de ruptura de los actuadores permitiría inves-
tigar mayores niveles de rigidez de la articulación y también
aumentar elpar máximoimum que el brazo robótico puede
ejercer sobre su entorno. Sin embargo, es importante tener en
cuenta que la presión de explosión limitada de los actuadores
empleados en este trabajo es una consecuencia del método
de fabricación simple. Uso de métodos más elaborados (por
ejemplo, [24]) podría comprometer la simplicidad y
disponibilidad del método de fabricación.
El número de grados de libertad rotacional del brazo
robótico esférico está actualmente limitado a dos. Sin
embargo, múltiples uniones del tipo pre-enviado podrían
conectarse en serie para formar un sistema dimensional
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369
doi:10.1109/IEMBS.2011.6091723.
diferentes direcciones. Esta información podría incorporarse [6] Qi R, Khajepour A, Melek WW, Lam TL, Xu Y.
Diseño, cinemática y control de un brazo inflable
en el controlador de posición para la realización de blando multiarticulo para una interacción segura para
aplicaciones interactivas. el ser humano. IEEE Trans Rob 2017;33(3):594–
609. doi:10.1109/TRO.2016.2647231.
Por último, el sistema propuesto en este trabajo parece [7] Althoefer K. Accionamiento antagónico y control de
prometedor para la investigación y realización de rigidez en robots inflables blandos. Nat
aplicaciones específicas (por ejemplo, aplicaciones pick Rev Mater 2018;3(6):76–7. doi:10.1038/s41578-018-
and place), que serán objeto de trabajos futuros. 0004-0.
[8] Gillespie MT, Mejor CM, Killpack MD. Control
Declaración de interés concurrente simultáneo de posición y rigidez para un robot blando
inflable. En: IEEE International Conference on Robotics
Los autores declaran que no tienen intereses financieros and Automa- tion (ICRA); 2016. p. 1095–101.
doi:10.1109/ICRA.2016.7487240.
en competencia conocidos o relaciones personales que [9] Voisembert S, Mechbal N, Riwan A, Aoussat A. Diseño
podrían haber parecido influir en el trabajo reportado en de un nuevo brazo robótico de largoalcance: fabricación y
evaluación numérica de las articulaciones y actuación.
este artículo. J Mech Robot 2013;5(4):45001.
doi:10.1115/1.4025025.
Declaración de contribución de autoría de CRediT [10] Hyatt P, Kraus D, Sherrod V, Rupert L, Day N,
Killpack MD. Estimación de la configuración
Matthias Hofer: Conceptualización, Metodología, para un control preciso de la posición de robots
blandos a gran escala. IEEE/ASME Trans Mechatron
Software, Validación, Análisis formal, Investigación,
2019;24(1):88–99. doi:10.1109/TMECH.2018.2878228.
Recursos, Curación de datos, Escritura [11] Mosadegh B, Polygerinos P, Keplinger C, Wennstedt S,
- borrador original, Redacción - revisión y edición, Shepherd R, Gupta U, et al. Redes neumáticas para
robótica blanda que actúan rápidamente. Adv Funct
Visualización, Administración de proyectos, Adquisición de Mater 2014;24(15):2163–70.
fondos. Raffaello D'Andrea: Conceptualización, doi:10.1002/adfm.201303288.
Metodología, Recursos, Redacción - revisión y edición, [12] Thalman CM, Lam QP, Nguyen PH, Sridar S, Polygerinos

Supervisión, Administración de proyectos, Adquisición de P. Una novela suave el-


exotraje de arco para complementar la capacidad de
fondos.
elevación del bíceps. En: 2018 IEEE/RSJ Interna-
tional Conference on Intelligent Robots and Systems
Reconocimientos (IROS); 2018. p. 6965–71.
doi:10.1109/IROS.2018.8594403.
Los autores deseanagradecer a Michael Egli, Daniel [13] Hofer M, Spannagl L, D'Andrea R. Control de
Wagner y Matthias Müller por su contribución al desarrollo aprendizaje iterativo para un seguimiento de posición
del prototipo. rápido y preciso con un brazo robótico blando
articulado. En: IEEE International Confer- ence on
Material complementario Intelligent Robots and Systems (IROS); 2019. En
prensa. Preimpresión disponible:
El material complementario asociado con este artículo se http://arxiv.org/abs/1901.10187
puede encontrar, en la versión en línea, en doi:10.1016 /
j.mechatronics.2020.102369.

Referencias

[1] Gaiser I, Wiegand R, Ivlev O, Andrés A, Breitwieser


H, Schulz S, et al. Robótica y automatización
conformes con actuadores fluídicos flexibles y
estructuras inflables. In- Tecnología; 2012.
doi:10.5772/51866.
[2] Polygerinos P, Correll N, Morin SA, Mosadegh B,
Onal CD, Petersen K, et al. Robótica blanda: revisión
de dispositivos intrínsecamente blandos impulsados por
fluid; fabricación, detección, control y aplicaciones
en la interacción humano-robot. Adv Eng Mater
2017;19(12):1700016. doi:10.1002/adem.201700016.
[3] Gorissen B, Reynaerts D, Konishi S, Yoshida K, Kim J-
W, De Volder M. Elástico en-
Flactuadoresables para aplicaciones robóticas
suaves. Adv Mater 2017;29(43):1604977.
doi:10.1002/adma.201604977.
[4] Sanan S, Moidel JB, Atkeson CG. Robots con
eslabones inflables. En: IEEE/RSJ International
Conference on Intelligent Robots and Systems;
2009. p. 4331–6. doi:10.1109/IROS.2009.5354151.
[5] Sanan S, Ornstein MH, Atkeson CG. Interacción física
humana para un ma- inflable
nipulador. En: Conferencia Internacional Anual de la
IEEE Engineering in Medicine and Biology Society;
2011. p. 7401–4.
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
102369

preciso de posición y trayectoria de los actuadores


[14] Ivlev O. Actuadores fluídicos blandos de tipo rotativo
blandos neumáticos para robots de asistencia y
para una interacción físico-máquina segura. En: IEEE
International Conference on Rehabilitation Robotics; dispositivos de terapia de movimiento. En: IEEE
2009. p. 1–5. doi:10.1109/ICORR.2009.5209571. International Conference on Rehabilitation Robotics;
[15] Mejor CM, Wilson JP, Killpack MD. Control de un 2009. p. 663–8. doi:10.1109/ICORR.2009.5209572.
robot humanoide accionado neumáticamente,
totalmente inflable, basado en tela. En: IEEE-RAS
International Confer- ence on Humanoid Robots
(Humanoids); 2015. p. 1133–40. doi:10.1109/HU-
MANOIDS.2015.7363495.
[16] DM corporal, Allen TF, Killpack MD. Optimización del
diseño multiobjetivo de un soft,
robot neumático. In: 2017 IEEE International
Conference on Robotics and Automa- tion (ICRA);
2017. p. 1864–71. doi:10.1109/ICRA.2017.7989218.
[17] Liang X, Cheong H, Sun Y, Guo J, Chui CK,
Yeow C. Diseño, caracterización e implementación
de un brazo robótico blando basado en tela de dos dof.
IEEE Rob Autom Lett 2018;3(3):2702–9.
doi:10.1109/LRA.2018.2831723.
[18] Marchese AD, Rus D. Diseño, cinemática y control de
un spa suave-
Manipulador de elastómeros ídicos. Int J Rob Res
2016;35(7):840–69. doi:10.1177/0278364915587925.
[19] Nguyen PH, Sparks C, Nuthi SG, Vale NM, Polygerinos
P. Extremidades blandas: hacia un nuevo paradigma de
manipulación móvil para las tareas de la vida diaria.
Soft Rob 2019;6 1:38-53. doi:10.1089/soro.2018.0065.
[20] Grzesiak A, Becker R, Verl A. El asistente de
manipulación biónica: un éxito
historia de la fabricación aditiva. Automatización de
ensamblaje 2011;31(4):329–33.
doi:10.1108/01445151111172907.
[21] Hyatt P, Wingate D, Killpack MD. Control basado en
modelos de actuadores blandos utilizando modelos de
tiempo discreto no lineales aprendidos. Fronteras en
robótica e IA 2019;6:22. doi:10.3389/frobt.2019.00022.
[22] Liang X, Yap HK, Guo J, Yeow RCH, Sun Y, Chui
CK. Diseño y caracterización
de un novedoso brazo robótico basado en tela para
futuras aplicaciones robóticas portátiles. En: IEEE
International Conference on Robotics and Biomimetics
(ROBIO); 2017. p. 367–72.
doi:10.1109/ROBIO.2017.8324445.
[23] Yang HD, Asbeck AT. Un nuevo proceso de fabricación
para robots blandos y robots híbridos blandos/rígidos.
En: IEEE International Conference on Intelligent
Robots and Systems (IROS); 2018. p. 8039–46. ISBN
9781538680940. doi:10.1109/IROS.2018.8593688.
[24] Hofer M, D'Andrea R. Diseño, Modelado y Control de un
Brazo Robótico Blando. En: IEEE
Conferencia Internacional sobre Robots y Sistemas
Inteligentes (IROS); 2018. p. 1456-63. ISBN
9781538680940. doi:10.1109/IROS.2018.8594221.
[25] Gillespie MT, Best CM, Townsend EC, Wingate D,
Killpack MD. Aprendizaje de modelos dinámicos nonlin-
ear de robots blandos para el control predictivo de
modelos conredesneurales. En: IEEE International
Conference on Soft Robotics (RoboSoft); 2018. p. 39-
45. doi:10.1109/ROBOSOFT.2018.8404894.
[26] Reinhart RF, Steil JJ. Mejora el modelado mecánico y de
condivede datos híbridos
control cinemático inverso de un robot blando.
Procedia Technol 2016;26:12–19.
doi:10.1016/j.protcy.2016.08.003.
[27] Shepherd RF, Ilievski F, Choi W, Morin SA,
Stokes AA, Mazzeo AD, et al. Robot blando
multigait. Actas de la Academia Nacional de Ciencias
2011;108(51):20400–3.
doi:10.1073/pnas.1116564108.
[28] Tolley MT, Shepherd RF, Mosadegh B, Galloway KC,
Wehner M, Karpel-
hijo M, et al. Un robot blando resistente y sin
ataduras. Soft Rob 2014;1(3):213–23.
doi:10.1089/soro.2014.0008.
[29] Jordan M, Pietrusky D, Mihajlov M, Ivlev O. Control
M. Hofer y R. D'Andrea Mecatrónica 68 (2020)
2007, cofundó Kiva Systems (ahora
102369
[30] Marchese AD, Katzschmann RK, Rus D. Planificación
Amazon Robotics), donde dirigió la
de todo el brazo para un manipulador robótico 2D
suave y altamente compatible. En: IEEE/RSJ arquitectura de sistemas, el diseño de
International Conference on Intel- ligent Robots and robots, la navegación y coordinación de
Systems; 2014. p. 554–60. robots y el desarrollo de algoritmos de
doi:10.1109/IROS.2014.6942614. control. Actualmente es profesor de
[31] Melingui A, Lakhal O, Daachi B, Mbede JB,
Merzouki R. Control de redes neuronales adaptativas Sistemas Dinámicos y Control en ETH
de un brazo compacto de manipulación biónica. Zurich, y presidente de la junta directiva
IEEE/ASME Trans Mechatron 2015;20(6):2862–75.
doi:10.1109/TMECH.2015.2396114. de Verity Studios AG.
[32] Ansari Y, Manti M, Falotico E, Cianchetti M, Laschi
C. Optimización multiobjetivo
para la rigidez y la posición enun módulo de brazo
robótico blando. IEEE Rob Autom Lett
2018;3(1):108–15. doi:10.1109/LRA.2017.2734247.
[33] . Potencia neumática del fluido. Determinación de las
características del caudal de los componentes
utilizando fluidos compresibles. Estándar.
Organización Internacional de Normalización; Año
2013.
[34] Owens D. Control de aprendizaje iterativo: un paradigma
de optimización. Editorial Springer
Empresa; Año 2016.
[35] Bristow DA, Tharayil M, Alleyne AG. Una encuesta
de control de aprendizaje iterativo. IEEE Control
Syst Mag 2006;26(3):96–114.
doi:10.1109/MCS.2006.1636313.
[36] Della Santina C, Bianchi M, Grioli G, Angelini F,

Catalano M, Garabini M, et al. Control de robots


blandos: equilibrio de la retroalimentación y los
elementos de feedforward. IEEE Robotics Automation
Magazine 2017;24(3):75–83.
doi:10.1109/MRA.2016.2636360.

Matthias Hofer recibió el título de B.Sc.


en Ingeniería Mecánica de ETH Zurich,
Zurich, Suiza, en 2013 y el título de
M.Sc. en Robótica, Sistemas y Control
fromETH Zurich, Zurich, Suiza en
2015. Recibió la medalla ETH por su
tesis de maestría sobre el control
predictivo del modelo approXimate de un
vehículo aéreo. Durante sus estudios,
completó un intercambio en KTH
Estocolmo, Estocolmo, Suecia, donde
se centró en la optimización matemática y
la teoría de sistemas lineales.
Actualmente está cursando un
doctorado en el Instituto de Sistemas
Dinámicos y Control en ETH Zurich. Sus
principales intereses de investigación
incluyen el diseño y desarrollo de
sistemas robóticos blandos,identificación
de sistemasblack-boX, control de
aprendizaje y estimación de estado
basada en la visión.

Raffaello D'Andrea recibió el título de


B.Sc. en Ciencias de la Ingeniería de la
Universidad de Toronto en 1991, y el
M.S. y doctorado en Ingeniería
Eléctricapor el Instituto Tecnológico
deCalifornia en 1992 y 1997. Fue
profesor asociado en la Universidad de
Cornell de 1997 a 2007. Mientras
estaba de licencia de Cornell, de 2003 a

También podría gustarte