Está en la página 1de 31

Machine Translated by Google

Computación neuronal y aplicaciones (2022) 34:12527–12557 https://doi.org/10.1007/

s00521­022­07292­4(0123456789().,­volV)(0123456789(). ,­ volV)

REVISAR

Reconocimiento de emociones humanas a partir de una interfaz cerebro­


computadora basada en EEG mediante aprendizaje automático: una revisión exhaustiva

Essam H. Houssein1 • Asmaa Hammad1 • Abdelmgeid A. Ali1

Recibido: 5 de noviembre de 2021 / Aceptado: 11 de abril de 2022 / Publicado en línea: 7 de mayo de 2022
El autor(es) 2022

Abstracto
La computación afectiva, una subcategoría de la inteligencia artificial, detecta, procesa, interpreta e imita las emociones humanas.
Gracias al avance continuo de las tecnologías de sensores humanos portátiles no invasivos, como las interfaces cerebro­computadora (BCI), el
reconocimiento de emociones ha despertado el interés de académicos de una variedad de dominios. Las expresiones faciales, el habla, el
comportamiento (gestos/postura) y las señales fisiológicas se pueden utilizar para identificar las emociones humanas. Sin embargo, los tres primeros
pueden resultar ineficaces porque las personas pueden ocultar sus verdaderas emociones consciente o inconscientemente (el llamado enmascaramiento social).
Las señales fisiológicas pueden proporcionar un reconocimiento de emociones más preciso y objetivo. Las señales de electroencefalograma (EEG)
responden en tiempo real y son más sensibles a cambios en los estados afectivos que las señales neurofisiológicas periféricas. Por tanto, las
señales EEG pueden revelar características importantes de los estados emocionales. Recientemente, se han desarrollado varias técnicas de
reconocimiento de emociones BCI basadas en EEG. Además, los rápidos avances en el aprendizaje automático y profundo han permitido que las
máquinas o computadoras comprendan, reconozcan y analicen las emociones. Este estudio revisa los métodos de reconocimiento de emociones
que se basan en BCI multicanal basados en señales de EEG y proporciona una descripción general de lo que se ha logrado en esta área. También
proporciona una descripción general de los conjuntos de datos y métodos utilizados para provocar estados emocionales. De acuerdo con la ruta
habitual de reconocimiento emocional, revisamos varias extracción de características de EEG, selección/reducción de características, métodos de
aprendizaje automático (por ejemplo, k­vecino más cercano), máquina de vectores de soporte, árbol de decisión, red neuronal artificial, bosque
aleatorio y Bayes ingenuo). y métodos de aprendizaje profundo (por ejemplo, redes neuronales convolucionales y recurrentes con memoria a largo
plazo). Además, se analizan los ritmos EEG que están fuertemente vinculados a las emociones, así como la relación entre distintas áreas del cerebro
y las emociones. También analizamos varios estudios de reconocimiento de emociones humanas, publicados entre 2015 y 2021, que utilizan datos
de EEG y comparan diferentes algoritmos de aprendizaje profundo y automático. Finalmente, esta revisión sugiere varios desafíos y direcciones
futuras de investigación en el reconocimiento y clasificación de estados emocionales humanos mediante EEG.

Palabras clave Interfaz cerebro­computadora (BCI) Computación afectiva (AC) Aprendizaje automático Aprendizaje profundo
Reconocimiento de emociones por electroencefalograma (EEG)

1. Introducción

1.1 Interfaz cerebro­computadora

Una interfaz cerebro­computadora (BCI) es un sistema de comunicación


basado en computadora que analiza las señales producidas por la
y Essam H. Houssein
actividad neuronal del sistema nervioso central. Es una tecnología de
essam.halim@mu.edu.eg
comunicación muy eficaz que no depende de vías neuromusculares o
Asmaa Hammad
musculares para lograr la comunicación, el comando y, por tanto, la
asmaa.hammad@mu.edu.eg
acción. Mientras piensa con intención, el sujeto genera señales
Abdelmgeid A. Ali
cerebrales que se convierten en comandos para un dispositivo de
a.ali@mu.edu.eg
salida. Como resultado, el cerebro dispone de un nuevo canal de salida
1
Facultad de Computación e Información, Universidad Minia, [1, 2]. El
Miniá, Egipto

123
Machine Translated by Google

12528 Aplicaciones y computación neuronal (2022) 34:12527–12557

El objetivo básico de una BCI es detectar y evaluar las características de Se utiliza principalmente en el campo de la informática afectiva y como
las señales en el cerebro del usuario que indican la intención del usuario. forma de asistencia a personas paralizadas. Los sistemas de ortografía,
Estas características luego se transmiten a un dispositivo externo que se la neuroergonomía médica, el control de sillas de ruedas, la realidad
ejecuta para cumplir la intención deseada del usuario [1]. Como se virtual, el control de robots, el monitoreo de la carga de trabajo mental,
muestra en la Fig. 1, para lograr este objetivo, un sistema basado en BCI los juegos, el monitoreo de la fatiga del conductor, la gestión ambiental,
tiene cuatro componentes secuenciales: adquisición de señales, los sistemas biométricos y la detección de emociones se encuentran
preprocesamiento, traducción y retroalimentación o salida del dispositivo. entre los éxitos más significativos de las BCI basadas en EEG . 7].
La adquisición de señales, el primer componente de BCI, es el
principal responsable de recibir y registrar las señales producidas por la 1.2 Reconocimiento de emociones
actividad neuronal, así como de enviar estos datos al componente de
preprocesamiento para mejorar la señal y reducir el ruido. Los métodos En los últimos años, debido a la creciente disponibilidad de diversos
de adquisición de señales cerebrales se pueden clasificar en invasivos y dispositivos electrónicos, las personas pasan más tiempo en las redes
no invasivos. En los métodos invasivos, los electrodos se colocan sociales, jugando videojuegos en línea, comprando en línea y utilizando
neuroquirúrgicamente dentro o en la superficie del cerebro del usuario. otros productos electrónicos. Sin embargo, la mayoría de los sistemas
La actividad cerebral se registra mediante sensores externos con modernos de interacción entre humanos y computadoras (HCI) son
tecnología no invasiva [3]. Después del preprocesamiento, los diferentes incapaces de procesar y comprender datos emocionales y carecen de
caracteres importantes de la señal (como la característica de la señal inteligencia emocional. Son incapaces de reconocer las emociones
relacionada con la intención del usuario) se extraen de datos irrelevantes humanas y utilizar datos emocionales para tomar decisiones y actuar. En
y se presentan de una manera que permite traducirlos en instrucciones los sistemas HCI inteligentes avanzados, resolver la ausencia de relación
de salida. Este componente crea características selectivas para la señal entre humanos y robots es crucial. Cualquier sistema HCI que ignore los
mejorada, reduce el tamaño de los datos que se pueden enviar al estados emocionales humanos no podrá responder adecuadamente a
algoritmo de traducción y luego convierte los caracteres en las esas emociones. Para abordar esta dificultad en los sistemas HCI, las
instrucciones relevantes que el máquinas deben poder comprender e interpretar los estados emocionales
humanos. Se requiere un sistema de reconocimiento de emociones
El dispositivo externo necesita completar la tarea (por ejemplo, confiable, preciso, flexible y potente para realizar sistemas HCI inteligentes
instrucciones que completan la intención del usuario). El dispositivo de [8].
salida es guiado y controlado por las instrucciones adquiridas por el
algoritmo de traducción. Ayuda a los usuarios a lograr sus objetivos,
como seleccionar alfabetos, controlar un mouse, operar una silla de Debido a que la HCI se estudia en varias disciplinas, incluidas la
ruedas, mover un brazo robótico y mover una extremidad paralizada con informática, la ingeniería de factores humanos y la ciencia cognitiva, la
una neuroprótesis. Las computadoras son actualmente el dispositivo de computadora que impulsa un sistema inteligente de HCI debe ser
salida más utilizado para la comunicación [4]. adaptable. Para generar respuestas apropiadas, los patrones de
comunicación humana deben comprenderse con precisión. La capacidad
La electroencefalografía (EEG) que utiliza electrodos insertados de una computadora para comprender las emociones y el comportamiento
externamente puede medir la actividad neuronal útil para una BCI y es humanos es un componente crítico de su adaptabilidad. Por lo tanto, es
segura, económica, no invasiva, fácil de usar, portátil y mantiene una alta fundamental reconocer los estados afectivos del usuario para maximizar
resolución temporal [5]. Debido a que un usuario puede emplear EEG en y mejorar el rendimiento de los sistemas HCI.
sistemas BCI en una variedad de campos sin la ayuda de un técnico u
operador, se ha vuelto popular entre los usuarios finales. Las BCI han En un sistema HCI, la interacción entre la máquina y el operador se
realizado contribuciones en una variedad de campos, incluidos la puede mejorar para hacerla más inteligente y fácil de usar si la
educación, la medicina, la psicología y los asuntos militares [6]. Ellos son computadora puede comprender con precisión el estado emocional del
operador humano en tiempo real. esta nueva

Fig.1 Componentes BCI

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12529

El área de investigación se llama computación afectiva (AC). AC es un área Las emociones discretas comprenden nueve emociones básicas: interés­
de inteligencia artificial que se centra en HCI mediante la detección del excitación, sorpresa­sobresalto, disfrute­alegría, angustia­angustia, mal
afecto del usuario. Uno de los objetivos clave del dominio AC es crear humor, miedo­terror, ira­ira, desprecio­disgusto y vergüenza­humillación.
formas para que las máquinas interpreten las emociones humanas, lo que Se cree que estos nueve básicos.

puede mejorar su capacidad de comunicación [9]. Las emociones juegan un papel importante en una salud mental óptima.
El modelo de Ekman [22] se basa en otra teoría bien aceptada. Según
El comportamiento, el habla, las expresiones faciales y las señales Ekman, las emociones básicas deben incluir las siguientes características:
fisiológicas pueden utilizarse para identificar las emociones humanas [10­12]. (1) las emociones son instintivas; (2) varias personas desarrollan la misma
Los primeros tres enfoques son algo subjetivos. Por ejemplo, los sujetos emoción en la misma situación; (3) varias personas expresan emociones
investigados pueden ocultar intencionadamente sus sentimientos genuinos, básicas de maneras comparables; (4) los patrones fisiológicos de diversas
lo que podría afectar su desempeño. La identificación de emociones personas son constantes cuando se producen emociones básicas. Ekman
basada en señales fisiológicas es más fiable y objetiva [13]. y sus colegas determinaron que había seis emociones principales
universalmente reconocibles por la expresión facial: tristeza, sorpresa,
Las BCI son tecnologías de sensores portátiles no invasivos que felicidad, disgusto, miedo e ira. A partir de estas seis emociones básicas
capturan señales cerebrales y las utilizan como entradas para sistemas que se pueden generar otras emociones compuestas (no básicas), como la
comprenden la correlación entre las emociones y los cambios de EEG para timidez, la culpa y el desprecio. Muchos teóricos y psicólogos han incluido
humanizar las HCI [14]. El sistema nervioso central genera señales EEG, en sus conjuntos de emociones básicas emociones adicionales que no
que responden a los cambios emocionales más rápidamente que otras estaban incluidas en las seis de Ekman. Algunos dividieron las emociones
señales neuronales periféricas. Además, se ha demostrado que las señales en pequeños grupos [23­28], centrándose en sentimientos generales, como
EEG proporcionan características esenciales para el reconocimiento el miedo o la ira (como emociones negativas) y la felicidad o el amor (como

emocional [15]. emociones positivas). Otros se centraron en matices más sutiles y dividieron
las emociones en grupos más grandes. La Tabla 1 resume algunos de los
1.3 Perspectiva científica de la emoción modelos de emociones más básicos.

En las siguientes secciones, analizamos brevemente qué es la emoción, los


modelos de representación de emociones y los experimentos provocados o
evocados por emociones. Sin embargo, algunos teóricos e investigadores creen que el modelo
discreto tiene límites en términos de representar emociones específicas en
1.3.1 ¿Qué es la emoción? una gama más amplia de estados afectivos. En otras palabras, los estados
afectivos cotidianos son demasiado complicados para estar bien
La emoción es una condición complicada que expresa la conciencia humana representados por un pequeño número de categorías discretas.
y se describe como una reacción al entorno. Como resultado, se ha propuesto un nuevo método conocido como emoción
estímulos [16]. Las emociones son, en general, reacciones ante ideas, dimensional. En este modelo, la emoción se organiza de forma
recuerdos o acontecimientos que ocurren en nuestro entorno. Es multidimensional, y cada dimensión representa una característica
fundamental para la toma de decisiones y la comunicación interpersonal emocional. Cada emoción se puede representar como un punto en un
humana. Las personas toman decisiones dependiendo de sus estados espacio multidimensional. En lugar de seleccionar etiquetas discretas, uno
emocionales; por lo tanto, las malas emociones pueden provocar dificultades podría expresar sus sentimientos en una variedad de escalas continuas o
no sólo psicológicas sino también físicas. Las emociones desfavorables de valores discretos, como atención­rechazo o agradable­desagradable.
pueden contribuir a una mala salud, mientras que las emociones positivas
pueden conducir a niveles de vida más altos [17]. Hasta la fecha, los investigadores han ofrecido numerosas técnicas
multidimensionales para modelar las emociones. A continuación se muestran
1.3.2 Modelos de emociones algunos ejemplos: (a) el modelo circumplejo 2D de Russell, que puede
incluir hasta 150 etiquetas afectivas utilizando dimensiones de excitación y
Históricamente, los psicólogos han utilizado dos técnicas para caracterizar valencia [19]; (b) Espacio 2D continuo de Whissell, con evaluación y
las emociones: el modelo de emoción discreto (básico) [18] y el modelo activación como dimensiones [34]; y (c) el modelo de emoción tridimensional
dimensional [19]. Los modelos dimensionales clasifican las emociones en de Schloberg, que añade una dimensión de atención­rechazo al modelo
dimensiones o escalas, y los modelos de emociones discretas comprenden bidimensional [35].
múltiples emociones principales e incluyen dos categorías de emociones
(positivas y negativas). El modelo de emoción 2D de Russell se utiliza con mayor frecuencia.
Varios teóricos han realizado experimentos para identificar emociones Como se muestra en la Fig. 2, el eje vertical representa la dimensión de
básicas y han ofrecido varios modelos categorizados. Darwin [20] propuso excitación (que expresa la intensidad emocional de la experiencia, que va
una teoría de la emoción que luego fue interpretada por Tomkins [21]. desde baja hasta excitación), y el eje horizontal representa la dimensión de
Tomkins afirmó que valencia (que muestra

123
Machine Translated by Google

12530 Aplicaciones y computación neuronal (2022) 34:12527–12557

Tabla 1 Resumen de Referencia Emociones


modelos de emociones categorizadas

[21] Sorpresa, alegría, interés, rabia, asco, miedo, angustia, vergüenza.


[22] Miedo, tristeza, felicidad, ira, asco, sorpresa.
[23] Rabia y terror, ansiedad, alegría.
[24] Dolor, placer
[25] Miedo, amor, rabia
[26] Miedo, pena, amor, rabia.
[27] Expectativa, rabia, miedo, pánico.
[28] tristeza, felicidad
[29] Ira, coraje, aversión, abatimiento, desesperación, deseo, miedo, esperanza, odio, tristeza, amor.
[30] Felicidad, tristeza, miedo, ira, asco.
[31] Deseo, interés, felicidad, sorpresa, tristeza, asombro.
[32] Ira, asco, desprecio, angustia, culpa, miedo, interés, vergüenza, alegría, sorpresa.
[33] Ira, miedo, júbilo, disgusto.

provocando emociones. Primero, evocar emociones creando


escenarios simulados. La gente tiene la costumbre de generar
algunas emociones inolvidables en el pasado. También es factible
provocar emociones haciendo que los sujetos recuerden fragmentos
de sus experiencias pasadas que tienen distintos efectos emocionales.
colores. El problema de este enfoque es que no puede
asegúrese de que el sujeto genere la emoción correspondiente,
y el tiempo de la emoción asociada es inconmensurable.
En segundo lugar, provocar emociones mostrando vídeos, música,
fotografías y otros materiales estimulantes. Esto es un

Fig. 2 El modelo de emoción 2D enfoque frecuente para provocar emociones, logrando que los participantes
generen estados emocionales y los etiqueten

el grado de alegría o alegría, que va de negativo a objetivamente. Finalmente, el sujeto debe jugar a un ordenador o

positivo). Hay cuatro categorías de emociones en el videojuego. Los juegos de ordenador no son sólo físicamente

sistema de coordenadas excitación­valencia. Las emociones negativas beneficiosos pero también son psicológicamente beneficiosos.

están representados en el lado izquierdo de la coordenada y el Los sujetos simplemente escuchan y observan los sonidos del entorno

Las emociones positivas se muestran a la derecha. El eje de valencia mientras usan cortometrajes o clips. Temas en computadora

representa emociones tanto positivas como negativas, y el Los juegos, por otro lado, no se limitan a observar o mirar el

El eje de excitación varía de emociones inactivas a activas. La figura 2 estímulos; De hecho, experimentan con la escena de primera mano.

muestra la primera área, que comprende alta excitación. Adoptan el modelo a seguir de los personajes del juego, y esto
tiene un efecto similar sobre las emociones de los individuos.
emociones de valencia positiva (HAPV) que van desde
contento a emocionado. El área 2 comprende alta excitación negativa.
Los recursos más comunes para la provocación de emociones son

valencia (HANV) emociones que varían de nervioso a el Sistema Internacional de Sonido Afectivo Digitalizado (IADS)

irritante. El área 3 comprende valencia negativa de baja excitación. [36] y el Sistema Internacional de Imagen Afectiva (IAPS)

(LANV) emociones. La última área abarca la baja excitación. [37]. Estos conjuntos de datos contienen estímulos emocionales

Emociones de valencia positiva (LAPV) (calma para relajarse). Como estandarizados. Como resultado, es valioso en estudios experimentales. IAPS

Como se muestra en la Fig. 2, las dos primeras zonas reflejan una alta excitación. está compuesto por 1200 fotografías divididas en 20 grupos de
emociones (activas), mientras que las dos últimas zonas indican bajas 60 imágenes. A cada fotografía se le asigna una valencia y
excitación (inactiva) de emociones. valor de excitación. La edición más reciente de IADS incluye 167
sonidos naturales grabados digitalmente que son comunes en
1.3.3 Modelos de provocación de emociones vida cotidiana y se clasifican por valencia, dominancia,
y excitación. Uso del sistema de maniquí de autoevaluación

La capacidad de inducir/provocar la respuesta del sujeto experimental. [38], los participantes etiquetaron el conjunto de datos. Los autores de [39]

estado emocional de ciertas maneras apropiadas, es decir, emocional afirman que las emociones evocadas por estímulos visuales o auditivos son

excitación, es un paso crucial en la detección de emociones sobre la base comparable. Por otra parte, los resultados del etiquetado afectivo de los

de señales fisiológicas. Hay tres métodos principales para multimedia pueden no ser generalizables a

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12531

situaciones cotidianas o situaciones más interactivas. Como resultado, son y evaluación del desempeño para problemas de reconocimiento de emociones.
bienvenidas más investigaciones que involucren estímulos emocionales La Sección 4 describe bases de datos públicas de datos de EEG para
interactivos para garantizar la generalización de los resultados del BCI. Hasta información emocional y presenta información general sobre enfoques de
donde sabemos, solo unos pocos estudios han empleado situaciones más aprendizaje profundo y automático. La sección 5 presenta estudios
interactivas para producir emociones, como individuos jugando o usando relacionados que analizan técnicas de aprendizaje automático y profundo
simuladores de vuelo. para reconocer estados emocionales humanos utilizando BCI basado en EEG.
Los desafíos y las direcciones de investigación futuras se cubrirán en la
Sección. 6. Finalmente, la sección. 7 concluye la revisión de la investigación.
1.4 Motivaciones y principales aportes

La motivación de esta revisión es permitir a los investigadores utilizar métodos

de aprendizaje automático para aumentar la tasa de reconocimiento rápido y 2 Descripción general de las señales de emoción y EEG
preciso de los estados emocionales humanos a partir de BCI basada en EEG.
El objetivo de esta revisión es identificar diferentes estudios en la literatura Esta sección ofrece una descripción general del EEG y la emoción. La
que utilizan enfoques de aprendizaje automático y profundo para clasificar los estructura y funciones del cerebro se describen en la sección. 2.1.

estados emocionales humanos mediante EEG. Así, las principales La corteza cerebral normalmente se divide en cuatro áreas, cada una de las
contribuciones de este estudio son buscar respuestas a las siguientes cuales realiza una función distinta. Se ha demostrado en los estudios que la
preguntas: corteza prefrontal (CPF) es la más estrechamente relacionada con las
emociones. La sección 2.2 describe en detalle
– ¿Qué son las emociones, los modelos de emociones y los experimentos de
Electroencefalograma, su origen, sus bandas de frecuencia y sus
provocación de emociones?
características. La sección 2.3 proporciona información general sobre la
– ¿Cuál es el papel de la interfaz cerebro­computadora en el reconocimiento
asociación entre los cambios emocionales y las señales de EEG, y las áreas
de emociones?
del cerebro más asociadas con las emociones, con el objetivo de utilizar
– ¿Cuál es la relación entre los datos del EEG y las emociones?
menos electrodos para lograr un buen rendimiento en la clasificación de las
estados en humanos?
emociones.
– ¿Cuáles son los diferentes métodos de extracción de características?
– ¿Cuáles son las diferentes funciones de selección y reducción?
2.1 Estructura y funciones del cerebro.
¿métodos?

– ¿Qué técnicas de aprendizaje automático y profundo se utilizan actualmente


El cerebelo, el cerebro y el tronco del encéfalo son los tres componentes
para clasificar los estados emocionales humanos mediante BCI basado
principales del cerebro humano. La corteza cerebral, el núcleo cerebral y el
en EEG?
sistema límbico forman el cerebro.
– ¿Qué medidas de evaluación se utilizan para valorar la
Las funciones cognitivas y emocionales de nivel superior están controladas
¿Eficacia de los modelos de clasificación?
principalmente por la corteza cerebral. Se encuentra en la capa más externa
– ¿Cuál es el trabajo reciente en el campo de las emociones humanas?
del cerebro humano, con un espesor de alrededor de 1 a 4 mm, y está
¿Reconocimiento utilizando datos de EEG?
compuesto principalmente de materia gris, con materia blanca debajo [40]. El
– ¿Cuáles son los problemas que deben resolverse y las direcciones de
cerebro está dividido en hemisferios izquierdo y derecho por un surco central
investigación que deben seguirse en el futuro en el reconocimiento de los
en el medio. Como se muestra en la Fig. 3 [6], el Lóbulo Frontal, el Lóbulo
estados emocionales humanos utilizando datos de EEG?
Occipital,

1.5 Organización del papel

La estructura de este trabajo es la siguiente: Apartado. 1 describe los


antecedentes sobre la interfaz cerebro­computadora, el reconocimiento de
emociones y las áreas de aplicación de sus técnicas, y diferentes modelos
de provocación emocional. La sección 2 presenta la
El papel de cada área del cerebro en la formación de emociones, describe las
bandas de frecuencia del EEG y las características del EEG, e investiga la
relación entre las emociones y los datos del EEG. La sección 3 describe la
estructura de los estudios basados en EEG.

Modelos BCI de reconocimiento de emociones humanas y proporciona una


descripción general de la adquisición de señales EEG, preprocesamiento,
extracción de características, reducción y selección de características, clasificación,Fig.3 Estructura fisiológica de la corteza cerebral.

123
Machine Translated by Google

12532 Aplicaciones y computación neuronal (2022) 34:12527–12557

El lóbulo parietal y el lóbulo temporal son las cuatro áreas de la corteza base objetiva para detectar algunas enfermedades. En neuroingeniería,
cerebral. Las funciones de estas cuatro áreas se des­ las personas discapacitadas pueden utilizar señales EEG producidas por
tinte. El lóbulo frontal se coloca antes del surco central del cerebro. Está imágenes en movimiento o por la mente para controlar sillas de ruedas o
a cargo de las actividades cognitivas superiores. El lóbulo prefrontal, el extremidades robóticas. Este es un tema popular en este momento que
área de movimiento frontal y el área de movimiento primario forman parte se conoce como interfaz cerebro­computadora (BCI). El análisis y
de él. Se encargan principalmente de la planificación, el pensamiento y procesamiento de señales EEG siempre resulta problemático en la
las funciones fisiológicas asociadas a las emociones y necesidades de investigación del cerebro debido a la no estacionariedad de los datos EEG
una persona. Detrás del surco central y justo delante de la fisura occipital y a las numerosas influencias ambientales.
se encuentra el lóbulo parietal. Es un centro sensorial del más alto nivel.
Es principalmente responsable de la integración de la información 2.2.2 Conceptos básicos del EEG

somatosensorial, así como de la reacción a la información espacial como


el dolor, la presión, la temperatura, el gusto y el tacto. Esta área también Las señales de EEG se clasifican en cinco categorías según la variación
está vinculada al pensamiento lógico y matemático. Debajo de la fisura en las bandas de frecuencia: delta (0,5 a 4 Hz), theta (4 a 8 Hz), alfa (8 a
lateral se encuentra el lóbulo temporal, con el lóbulo frontal al frente, el 13 Hz), beta (13 a 30 Hz) y gamma ( [30 Hz), como se muestra en la Fig.
lóbulo occipital detrás y el lóbulo parietal arriba. Se encarga principalmente 4 [6].
de procesar la información auditiva y olfativa, y está asociado con las Las ondas delta suelen aparecer en la corteza frontal con una amplitud
emociones y la memoria (actividades mentales). Finalmente, el lóbulo de 20 a 200 lV. Suelen detectarse en un estado inconsciente de falta de
occipital está situado detrás del surco occipital, en la parte posterior del oxígeno, sueño profundo sin sueños o estando anestesiados. La ola
hemisferio, y se encarga principalmente de procesar la información desaparecería en un adulto que esté despierto y alerta. Las ondas theta
relacionada con la visión. También tiene que ver con la memoria de una suelen aparecer en los lóbulos parietales y temporales con una amplitud
persona, la percepción del comportamiento y las concepciones abstractas. de 100 a 150 lV.
Se asocian con el estado de relajación y la carga de la memoria de
trabajo. Las ondas theta en la línea media frontal aumentarán cuando se
evoquen emociones positivas. Las ondas alfa ocurren principalmente en
2.2 señales EEG el lóbulo occipital y el lóbulo parietal con una amplitud de 20 a 100 lV. Se
pueden detectar en estado de reposo con los ojos cerrados. Los estímulos
2.2.1 Historia del EEG externos, como los visuales o auditivos, o cuando los individuos realizan
una actividad mental, pueden provocar la desaparición de las ondas alfa.
El cerebro funciona transfiriendo señales eléctricas entre neuronas. Un Tienen más energía oscilatoria que las ondas beta y gamma tanto en
método para estudiar la actividad eléctrica del cerebro es registrar el emociones positivas como negativas.
potencial del cuero cabelludo causado por la actividad cerebral. La señal
que se registra, es decir, las variaciones de potencial entre dos Las ondas beta normalmente sólo se observan en el lóbulo frontal; sin
ubicaciones, se denomina electroencefalograma (EEG). El EEG es uno embargo, cuando uno está contemplando, la onda beta emerge en una
de los métodos más eficaces para controlar la actividad cerebral, a variedad de lugares. La amplitud es de 5 a 20 lV. Ocurren cuando la
menudo conocida como ondas cerebrales. Hans Berger registró el primer mente de una persona está muy activa y concentrada. La corteza cerebral
EEG humano en 1929 y publicó el primer artículo sobre EEG humano está dominada por ondas alfa mientras el cuerpo humano está relajado,
[41]. Como especialista en este campo, fue él quien ideó el término y el ritmo beta se desvanece gradualmente a medida que aumenta la
"ectroencefalograma". Las primeras investigaciones de Richard Caton actividad emocional. Cuando el SNC está bajo tensión/estrés/distensión,
sobre la actividad cerebral animal en el siglo XIX fueron la base de su la amplitud de la onda Alfa
trabajo. Los electrofisiólogos y neurofisiólogos verificaron gradualmente
sus resultados, lo que permitió que la investigación del EEG en medicina
clínica y ciencias del cerebro avanzara rápidamente.

Los cambios en las emociones se pueden comprender estudiando las


señales del EEG. Los cambios funcionales y fisiológicos del sistema
nervioso central (SNC) pueden reflejarse en potenciales neuronales. El
EEG no representa sólo la actividad eléctrica de una única neurona, sino
más bien la actividad eléctrica de un grupo de neuronas en la zona del
cerebro donde se coloca el electrodo de medición del EEG. Como
resultado, la señal EEG incluye una gran cantidad de información
psicofisiológica útil y significativa. En medicina, la clasificación, el
procesamiento y el análisis de las señales EEG pueden proporcionar una
Fig. 4 Las formas de onda de cinco bandas de EEG.

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12533

disminuye mientras que la frecuencia Beta aumenta, y la onda Alfa se convierte a través del tono de voz, la expresión facial y los cambios fisiológicos de
progresivamente en una onda Beta. Cuando la corteza cerebral parece estar nuestro sistema nervioso. Debido a que las expresiones faciales y la voz
en estado beta, normalmente significa que está excitada. Las ondas gamma pueden ser falsificadas o no pueden considerarse como resultado de una
se encuentran con determinada emoción, no son predictores confiables de emoción. Como el
diferentes redes corticales sensoriales y no sensoriales. La amplitud suele ser usuario no tiene control sobre las señales fisiológicas, estas son más precisas.
inferior a 2 lV. Están asociados con tareas y funciones cognitivas cerebrales Las fuentes fundamentales de emoción en nuestro cuerpo son los cambios
de alto nivel como la recepción, procesamiento, integración, transmisión y fisiológicos.
retroalimentación de información en el tronco encefálico, así como con Los cambios fisiológicos se pueden dividir en dos categorías: los que afectan
actividades que exigen mucha atención (concentración). al Sistema Nervioso Central (SNC) y los que afectan al Sistema Nervioso
Periférico (SNP). La médula espinal y el cerebro forman el SNC. El cerebro es
Se observan con frecuencia durante el procesamiento sensorial multimodal [5, el centro de control de todo lo que hay en nuestro cuerpo y los cambios en la
6, 8, 13]. actividad eléctrica se traducen en diversas acciones y emociones. El
electroencefalograma (EEG) es una prueba que mide los cambios eléctricos
2.2.3 Características de la señal EEG en el cerebro. El EEG se describe como una actividad eléctrica de tipo alterno
registrada desde la superficie del cuero cabelludo utilizando electrodos
La señal EEG es una representación directa de la actividad cerebral y es útil metálicos y un medio conductor [42].
en el estudio de los fenómenos fisiológicos del cerebro humano. Las siguientes
son sus características principales [6, 8]
EEG contiene una gran cantidad de información útil sobre el
1. Las grabaciones de EEG suelen ser ruidosas y sensibles a las interferencias
los numerosos estados fisiológicos del cerebro. Responde con mayor rapidez
del entorno. Generalmente se mezclan con otras señales (incluidos EOG,
y sensibilidad a los cambios en los estados afectivos y, por tanto, es una
ECG y EMG), interferencias, artefactos y ruidos.
herramienta particularmente valiosa para comprender los estados emocionales
humanos. La región de baja frecuencia evoca EEG emocional más plenamente
2. Las señales EEG se pueden clasificar en espontáneas o evocadas. Durante
que la banda de alta frecuencia, y las emociones negativas están más
el proceso de adquisición de señales, varias señales fisiológicas
extendidas e intensas que las positivas [6]. En presencia de emociones alegres,
periféricas inevitablemente afectarán el EEG espontáneo o los potenciales
tristes y aterradoras, la potencia promedio de las ondas Beta, Alfa y Theta en
evocados. Las señales de EEG son muy no lineales debido a la
la línea media del cerebro será dramática.
adaptación de los tejidos humanos o a la regulación fisiológica.

calicamente diferente, lo que indica que el espectro de potencia de la línea


3. El cambio de señal del EEG es inestable, susceptible a variables ambientales
media del EEG es una de las características más útiles de la clasificación de
externas y tiene una fuerte propiedad de no estacionaridad. Para
las emociones [43].
descubrir y reconocer características de las señales de EEG, varios
Según investigaciones fisiológicas, las funciones cognitivas emocionales
estudios emplean enfoques de análisis estadístico.
superiores del ser humano están controladas principalmente por la corteza
cerebral. A través de la detección de emociones basada en EEG, sería
4. Aunque las señales de EEG tienen un rango de frecuencia de 0,5 a 100 Hz,
beneficioso encontrar las regiones del cerebro que están estrechamente
el rango de baja frecuencia de 0,5 a 30 Hz es el más relevante para la
relacionadas con las emociones [44]. Los electrodos se clasifican primero
cognición. Los investigadores suelen descomponerlo en cinco subbandas
según su ubicación en la corteza cerebral. Se extraen las características EEG
de frecuencia, cada una de las cuales corresponde a una función cognitiva
de cada grupo de electrodos y luego se realiza la clasificación de las emociones.
distinta.

Las dos formas de ondas EEG se clasifican comúnmente en espontáneas y El algoritmo de selección de características clasifica todos los electrodos según
evocadas. El sistema nervioso produce una fluctuación rítmica del potencial su grado de importancia, y luego la importancia de los electrodos se ilustra
sin ningún estímulo externo, lo que se conoce como EEG espontáneo. Los utilizando un mapa topográfico del cerebro, lo que permite un reconocimiento
potenciales evocados son cambios potenciales mensurables en la corteza más fácil de las regiones del cerebro donde se distribuyen los electrodos con
cerebral como resultado de la excitación/estimulación externa del ser humano. un rango más alto. .

órganos sensoriales. Según ciertos investigadores que estudian la conectividad cerebral funcional
basándose en EEG, existe una correlación entre los estados emocionales y
2.3 Señales EEG en el reconocimiento de emociones áreas específicas del cerebro.
Según Ekman y Davidson [45], las porciones frontales izquierdas del cerebro
Necesitamos comprender las fuentes de las emociones en nuestros cuerpos
se activan con el disfrute. Los autores en [46] integraron la red de conexión
para poder enseñarle a la computadora a comprenderlas y reconocerlas. Las funcional con activación local para representar la actividad de partes locales
emociones se pueden expresar verbalmente, como a través de palabras del cerebro que reaccionan a las emociones y reflejan
conocidas, o de forma no verbal, como

123
Machine Translated by Google

12534 Aplicaciones y computación neuronal (2022) 34:12527–12557

las interacciones entre áreas críticas del cerebro. Otro estudio descubrió que El sistema internacional de colocación de electrodos 10­20 se utiliza en la
cuando los individuos adoptaban emociones de miedo, su actividad frontal mayoría de los experimentos de emoción EEG. El número de electrodos varía
izquierda disminuía [47]. Las emociones placenteras se asocian con un de seis a 62. Según la Fig. 6 [8], se encontró que los electrodos de EEG que
aumento del poder de la banda theta en la línea media frontal, mientras que están vinculados a las emociones eran

las emociones desagradables se asocian con lo contrario [48]. Estos estudios Distribuidos principalmente en el lóbulo frontal (rojo), el lóbulo parietal (verde),
revelan una correlación entre los cambios en las emociones y las características el lóbulo occipital (azul), el lóbulo temporal (amarillo) y en la zona central
de las señales EEG correspondientes, lo que es más útil para investigar la (cuadrados). Las regiones frontal polar, frontal anterior, frontal, central frontal,
clasificación de las emociones de las señales EEG. Esto también proporciona temporal, parietal y occipital del cerebro se abrevian FP, AF, F, FC, T, P y O,
una base neurofisiológica para detectar emociones a partir de datos de EEG. respectivamente. El hemisferio izquierdo se indica con un sufijo de número
impar y el hemisferio derecho se indica con un sufijo de número par. Estas
áreas coinciden exactamente con la base fisiológica de la creación de
emociones. La dimensión de la característica extraída se puede reducir
significativamente ajustando la distribución de los electrodos. La complejidad
3 Metodología de reconocimiento de emociones de los cálculos se puede reducir, haciendo que el experimento sea más
BCI basada en EEG sencillo y fácil de realizar.

La arquitectura de un sistema BCI basado en EEG para el reconocimiento de


emociones se muestra en la Fig. 5. La adquisición de señales EEG, el
preprocesamiento, la extracción de características, la selección de 3.2 Preprocesamiento de señales EEG
características, la clasificación de emociones y la evaluación del desempeño
son procesos distintos que se discutirán en las siguientes secciones. . El preprocesamiento de señales EEG se ocupa de la limpieza y mejora de la
señal. Las señales de EEG son inherentemente débiles y pueden verse
3.1 Adquisición de señales EEG fácilmente infectadas por ruido de fuentes tanto internas como externas. El
ruido podría ser generado por electrodos o por el propio cuerpo humano. El
Actualmente, el EEG es universalmente aceptado como método estándar para término "artefactos" se refiere a estos ruidos. Los electrodos EEG pueden
medir la actividad eléctrica del cerebro. Los equipos EEG modernos incluyen captar señales eléctricas fisiológicas no deseadas, como el electromiograma
un conjunto de electrodos, una unidad de almacenamiento de datos, un (EMG) del parpadeo de los ojos y los músculos del cuello, mientras registran
amplificador y una unidad de visualización. Se encuentran disponibles métodos una señal EEG. Cuando el sujeto se mueve, también existen preocupaciones
de adquisición de señales de EEG invasivos y no invasivos. En el método con respecto a los artefactos de movimiento causados por el movimiento del
invasivo, la relación señal­ruido y la intensidad de la señal son altas. Los cable y el desplazamiento de los electrodos. Como resultado, la fase de
electrodos deben implantarse quirúrgicamente en la cavidad del cráneo y los preprocesamiento es crucial para reducir estos artefactos en los datos brutos
electrodos penetran en la corteza cerebral, lo que dificulta su operación. En el del EEG, que podrían influir en la clasificación posterior. Se debe evaluar
método de adquisición no invasivo, los electrodos se colocan en el cuero cuidadosamente si estos artefactos deben eliminarse, ya que pueden contener
cabelludo del sujeto. Este enfoque es sencillo de utilizar y es el método de información esencial sobre los estados emocionales y pueden mejorar el

adquisición más común en la investigación contemporánea de BCI. Las rendimiento de los sistemas de detección de emociones.
señales de EEG se pueden adquirir de manera eficiente utilizando auriculares
y cascos de EEG portátiles de bajo costo que colocan electrodos no invasivos
en todo el cuero cabelludo. Actualmente se encuentran disponibles en el Para reducir los artefactos en las señales de EEG recopiladas, se pueden
mercado varios dispositivos BCI de bajo coste basados en EEG [49]. utilizar filtros de dominio de frecuencia para reducir el ancho de banda del
EEG que se va a estudiar. Los filtros de alta frecuencia, los filtros de baja
frecuencia (también llamados filtros de paso alto y de paso bajo por los
Los objetivos de la investigación difieren; por lo tanto, en los experimentos ingenieros eléctricos), los filtros Butterworth y los filtros de muesca son algunos
de EEG que se centran en el reconocimiento de emociones, las señales de de los filtros más utilizados.
EEG recopiladas difieren al igual que el número y la ubicación de los electrodos. Las frecuencias entre 1 y 50–60 Hz se filtran utilizando

Fig. 5 Arquitectura de un sistema BCI basado en EEG para reconocimiento de emociones

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12535

la estimulación emocional. Luego, las características restantes se escalan


a un intervalo de [0, 1] [8]. Las variaciones individuales en las respuestas
emocionales subjetivas ante un estímulo similar son una dificultad
importante en la investigación del reconocimiento de emociones. En
consecuencia, la mayoría de los estudios tienen un número limitado de
clases de emociones. Muchos estudios de reconocimiento de emociones
DEAP [54] se centran en problemas de clasificación binaria (excitación
alta versus baja o positiva versus negativa) [55­59], y las etiquetas
emocionales objetivo generalmente se determinan utilizando un umbral
estricto simple de la datos de calificación subjetiva de los sujetos.

3.2.1 Análisis de componentes independientes

El análisis de componentes independientes (ICA) es un método estadístico para


encontrar proyecciones lineales de datos observables que maximicen la
independencia mutua [60]. Cuando se utiliza para la separación ciega de fuentes
Fig. 6 Electrodos para registro de EEG en diferentes lóbulos (BSS), ICA busca recuperar fuentes independientes a partir de mezclas de esas
fuentes mediante observaciones multicanal. En el procesamiento de señales EEG,
Filtros de alta y baja frecuencia. Un filtro Butterworth tiene una zona de ICA separa las señales en actividades de fuentes neuronales independientes que
transición amplia y una reacción plana en la banda de parada y de paso. se originan en varias áreas del cerebro y actividades de fuentes independientes no
Los filtros de muesca se emplean para evitar que se transmita una neuronales (componentes artefactos) relacionadas con movimientos oculares,
frecuencia específica en lugar de un rango de frecuencias. Se utiliza un parpadeos, ruido cardíaco, muscular y lineal, que pueden ser fácilmente comprendido
filtro de muesca para eliminar la frecuencia de las redes eléctricas, que en función de sus características espacio­temporales [50].
normalmente varía entre 50 y 60 Hz según la frecuencia de la señal
eléctrica estándar en el país en particular [13]. Cuando se utilizan filtros,
se deben utilizar con cuidado para evitar distorsiones de la señal. La siguiente es una descripción del problema de ICA.
Supongamos un modelo de mezcla lineal, señales EEG de m canales, X ¼ ½x1;

x2; :::xm de n fuentes independientes s ¼ ½s1;s2...sn.


Los métodos comunes para preprocesar datos de EEG que se han empleado El vector de señales observadas X se puede expresar como:
en varios estudios incluyen análisis de componentes independientes (ICA) [50],
X ¼ Como ð1Þ
análisis de componentes principales (PCA) [51], referencia promedio común (CAR)
[52] y patrones espaciales comunes (CSP). [53]. Cuando se emplean grabaciones donde A es una matriz de mezcla con el tamaño de m n.
multicanal, las herramientas PCA e ICA utilizan un análisis de fuente ciego para Las actividades de los componentes independientes (señales fuente recuperadas),
eliminar el ruido de las señales fuente, lo que permite utilizarlas para eliminar V, se obtuvieron aplicando una matriz de desmezcla W (es decir, una inversa de la
artefactos y reducir el ruido. El método CSP identifica filtros espaciales que pueden matriz A) a X [60]:
usarse para identificar señales que se correlacionan con movimientos musculares.
V¼WXX¼W1V _ _ ð2Þ
Para reducir el ruido, el CAR es ideal.

donde cada columna de W1 comprende pesos de electrodos (es decir, una


proyección espacial) de un componente independiente y cada fila de W es un filtro
Los datos de EEG de estados emocionales y basales (no emocionales) se
espacial para estimar un componente independiente.
incluyen en los datos de EEG preprocesados para la detección de emociones.
Además, las señales fisiológicas revelan una heterogeneidad significativa entre los
Hay tres pasos involucrados en la eliminación de artefactos basados en ICA:
individuos (es decir, variación de una persona a otra). En distintos momentos y/o en
(a) aplicar ICA a los datos de EEG, (b) identificar y eliminar componentes
diversos entornos, se pueden evocar diferentes emociones, incluso cuando el sujeto
independientes relacionados con artefactos y (c) proyectar componentes
y el material del estímulo son los mismos. Como resultado, entre los métodos de
independientes relacionados con EEG nuevamente en electrodos para reconstruir
preprocesamiento, para reducir el impacto del material de estímulo previo en el
el artefacto. ­datos de EEG corregidos. En general, el conocimiento previo de las
estado emocional siguiente, así como el impacto de las variaciones individuales en
características espacio­temporales de los artefactos del EEG se puede utilizar para
las señales fisiológicas, las características del EEG de referencia (antes de
identificar componentes independientes de los artefactos.
cualquier tipo de estimulación emocional) se eliminaron de las características del
Muchos estudios han demostrado la superioridad de la ICA para eliminar los
EEG después
artefactos del EEG. El ICA fue utilizado por Wang et al. [50] para corregir las señales
EEG registradas durante un movimiento.

123
Machine Translated by Google

12536 Aplicaciones y computación neuronal (2022) 34:12527–12557

tarea de planificación que implica mucho músculo y sí Tabla 2 Métodos de extracción de características utilizados en los estudios cubiertos en este
revisión (2015­2021)
movimientos. Después de eliminar los componentes del artefacto que vienen
de actividades musculares y oculares, señales EEG que codifican Referencias Extracción de características

Las direcciones de movimiento se pueden utilizar para anticipar la dirección.


[63] PESO, SF
de un movimiento previsto. En un estudio de seguimiento de la somnolencia
[56] SF, HP, FFT, Ella, SE, KE.
[61], la eliminación de artefactos basada en ICA se empleó como
[57, 64–66] DWT, SF
forma rutinaria de corregir los datos EEG registrados en una conducción
[67] STFT, PSD, DE, DASM, ASM, RASM, DCAU
proceso, que comprendía múltiples movimientos del cuerpo y la cabeza.
[58] MSST
Después de reducir los artefactos EMG/EOG de los BCI basados en imágenes
[68] SF, DE
motoras, el rendimiento del sistema (p. ej., clasificación
[59] FFT, HOS, biespectral
precisión) mejoró [62].
[55] SF, HP, FD

3.3 Extracción de características de EEG [69] características teóricas de grafos

[70] San Francisco, PSD

,
Después del preprocesamiento y la reducción de ruido, lo siguiente [71] Complejidad de Lempel­Ziv, WT, EMD, AE

La etapa es extraer características. Después de que las señales hayan sido [72] FFT, PSD, SF

limpia de ruido, la BCI debe extraer características críticas que [73] HOS

será enviado al clasificador. El objetivo principal de la característica [74] EMD,SF

Extracción en el proceso de reconocimiento de emociones mediante EEG. [75] PESO, NOSOTROS, AE, SE, FE

datos es obtener información que pueda reflejar efectivamente una [76] TQWT, SF

estado emocional del individuo. Posteriormente, dicha información podrá [77] PSD, SF, DWT

utilizarse en algoritmos de clasificación de emociones. El [78, 79] Delaware

La precisión de la identificación de las emociones está determinada principalmente por [80] VMD, PSD, SF

las características extraídas. Por lo tanto, extraer EEG esencial [81] DWT, ToC
características de los estados emocionales es fundamental. [82] DT­CWT, SF, PSD, FD, DE

A menudo se realizan análisis de características de EEG convencionales. [83] DWT, DE, FD, HP, PSD
en los dominios de tiempo, frecuencia y tiempo­frecuencia. [84] DME

Debido a las propiedades no lineales de los datos EEG, los datos no lineales [85] Alemania, PSD

El análisis dinámico de las señales EEG se puede emplear para [86] DDE

estudio más profundo. Esta sección cubrirá cuatro EEG


Características estadísticas (SF), transformada Wavelet (WT), parámetros de Hjorth
Métodos de análisis de características utilizados para reconocer emociones: tiempo,
(HP), transformada rápida de Fourier (FFT), transformada Wavelet discreta
dominios de frecuencia y tiempo­frecuencia, así como análisis de características (DWT), entropía de Shannon (ShE); Entropía espectral (SE), Kolmogorov
no lineales. Entropía (KE), transformada de Fourier de corto tiempo (STFT), potencia espectral
La Tabla 2 muestra los métodos de extracción de características utilizados en el Densidad (PSD), Asimetría Diferencial (DASM), Diferencial
Entropía (DE), Asimetría Racional (RASM), Caudalidad Diferencial
estudios cubiertos en esta revisión. La figura 7 presenta el uso.
(DCAU), Asimetría (ASM), Sincroexpresión multivariada
porcentaje de los dominios de características que han sido Transformada (MSST), espectral de orden superior (HOS), dimensión fractal
empleados en muchos de los artículos de investigación de esta revisión. (FD), descomposición en modo empírico (EMD), entropía aproximada
(AE), energía Wavelet (WE), entropía de muestra (SE), entropía difusa
Las características más utilizadas son aquellas en el dominio de tiempo­
(FE), descomposición en modo variacional (VMD), ondícula Q sintonizable
frecuencia (35%). Las características del dominio de frecuencia son
Transformada (TQWT), acumulante de tercer orden (ToC), transformada wavelet
en segundo lugar (27%) y las características del dominio del tiempo en tercer lugar (20%). compleja de árbol dual (DT­CWT), entropía diferencial dinámica
Además, también se utilizan datos sin procesar (sin funciones). (DDE)

(11%). Los datos sin procesar se utilizan como entrada para el aprendizaje profundo.
algoritmos. El uso de datos sin procesar produce resultados aceptables,
presumiblemente porque la información se retiene y el riesgo de
datos en el dominio del tiempo. Hay muchas técnicas en el
omitiendo características de señal importantes asociadas con la emoción
Dominio del tiempo para el análisis del EEG, como potencial relacionado con
está eliminado. También se utilizaron características no lineales (7%).
eventos (ERP), método de análisis de histograma, Hjorth.
características/parámetros: actividad, movilidad y complejidad
[87], cruce de orden superior (HOC) [88, 89], principal
3.3.1 Análisis en el dominio del tiempo
análisis de componentes (PCA) [90], componente independiente
análisis (ICA) y las dimensiones fractales (FD) de Higuchi como
Durante mucho tiempo, los análisis en el dominio del tiempo se han aplicado en
Medición de autosimilitud y complejidad de las señales en este dominio [91].
la investigación de la actividad cerebral. La mayoría de los EEG
Estas técnicas se basan en
Los equipos de adquisición disponibles actualmente en el mercado recogen EEG.

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12537

obedecer aproximadamente la distribución de Gauss Nðl; r2Þ, y su entropía


diferencial se puede calcular como:

1 registro
2
1 ðylÞ2
2
ffiffiffiffiffiffiffiffiffiffiffi
mi 2ri ðylÞ2
ffiffiffiffiffiffiffiffiffiffiffi
mi 2ri dy
DE¼Z1 _ 2p2pri
_ 2p2pri
_
1 ð4Þ

¼
2
1 logð2peri 2 Þ

Fig. 7 Gráfico circular de los dominios de las características utilizadas en los estudios
discutidos en esta revisión. 3.3.3 Análisis en el dominio tiempo­frecuencia

extraer características basadas en el tiempo. Además, existen características Los métodos anteriores utilizan las características del EEG en el dominio del
estadísticas como media, potencia, máximo, mínimo, mediana, desviación tiempo o de la frecuencia, respectivamente, como criterio de detección.
estándar, asimetría, varianza, energía relativa de la banda, curtosis , etc. Estos métodos se basan en el supuesto de que las señales de EEG son
Las características geométricas de las señales de EEG son el punto de lineales y casi estacionarias, es decir, se supone que el contenido de
partida para el análisis en el dominio del tiempo, y el analizador de EEG frecuencia de las señales de EEG es constante durante la ventana de
puede analizarlas estadísticamente con precisión e intuición. análisis. Sin embargo, investigaciones recientes han revelado que las
señales de EEG tienen características no estacionarias. El análisis en el
Las características de este dominio comprenden datos de EEG con una dominio del tiempo de una señal, utilizando técnicas basadas en
pérdida mínima de información. Sin embargo, debido a la complicada forma características como amplitud, duración, varianza y autocorrelación, no es
de onda de los datos de EEG, no existe un método común para analizar las adecuado para analizar una señal no estacionaria como la señal EEG de un
características en el dominio del tiempo de las señales de EEG. adulto.
Por lo tanto, los analistas de EEG deben tener una amplia experiencia y El análisis de una señal no estacionaria requiere información sobre la
conocimientos. distribución de energía en diferentes frecuencias y las variaciones de
frecuencia a lo largo del tiempo. Esta información no la proporcionan ni las
3.3.2 Análisis en el dominio de la frecuencia técnicas de análisis en el dominio del tiempo ni el análisis en el dominio de
la frecuencia. La representación en el dominio de la frecuencia tiene la
Se ha demostrado que las funciones en el dominio de la frecuencia tienen desventaja de que toda la información temporal se pierde durante la
más éxito para la identificación automática de emociones mediante EEG formación del espectro. Debido a estas limitaciones, se han desarrollado
que las funciones en el dominio del tiempo. Los métodos de análisis en el herramientas alternativas para representar las señales conocidas como
dominio de la frecuencia convierten señales de EEG en el dominio del dominio tiempo­frecuencia.
tiempo en señales en el dominio de la frecuencia para evaluar y extraer La técnica de análisis en el dominio de tiempo­frecuencia combina
características del dominio de la frecuencia. La señal de EEG generalmente información de los dominios de tiempo y frecuencia y permite un análisis
se divide en varias subbandas y se recuperan para su análisis localizado en el dominio de tiempo­frecuencia. Como resultado, las
características como la densidad espectral de potencia (PSD), el espectro características en el dominio del tiempo­frecuencia son muy adecuadas
de energía logarítmica, el espectro de orden superior (HOS) y la entropía para capturar señales no estacionarias y variables en el tiempo, que
diferencial (DE). El método más común para realizar análisis de frecuencia pueden usarse para caracterizar diversos estados emocionales. lo mas
es aplicar la transformada rápida de Fourier (FFT) directamente a un Un enfoque ampliamente utilizado en el análisis tiempo­frecuencia es la
segmento corto de EEG [93, 94]. transformada Wavelet [96]. La transformada de Fourier de corto tiempo
(STFT) [6], la transformada de Hilbert Huang (HHT) [97] y la transformada
3.3.2.1 Entropía diferencial La entropía diferencial (DE) es el espectro de de paquetes wavelet (WPT) [98] también son enfoques esenciales de análisis
energía logaritmo en una banda de frecuencia particular para una secuencia en el dominio del tiempo­frecuencia.
de EEG de longitud fija [95]. Al igual que la entropía para evaluar la
complejidad de variables aleatorias continuas, DE se puede representar 3.3.3.1 Transformada wavelet La transformada wavelet (WT) es un método
como: de procesamiento de señales para tratar señales no lineales y no
estacionarias. Una característica importante de WT es que en frecuencias
fðyÞlogðfðyÞÞdy altas proporciona información de tiempo perfecta y en frecuencias más bajas
DE¼Z ð3Þ
y proporciona información de frecuencia perfecta. Debido a que las señales
en las aplicaciones de detección de emociones normalmente comprenden
f(y) es la función de densidad de probabilidad de y, donde y es una variable
datos de baja frecuencia con una duración prolongada y datos de alta
aleatoria. Los experimentos revelan que después del filtrado de paso de
frecuencia con una duración corta, esta característica es significativa. Otro
banda, una serie de bandas de subfrecuencia de señales de EEG
beneficio

123
Machine Translated by Google

12538 Aplicaciones y computación neuronal (2022) 34:12527–12557

de la transformada wavelet es que permite una transformación más flexible Estas técnicas simplifican la complejidad del problema; sólo las características que
Representación tiempo­frecuencia de una señal mediante el uso de ventanas de contienen información significativa se pasan a un clasificador. Seleccionar una
análisis de variados tamaños, lo que permite un análisis selectivo durante la técnica adecuada de selección y reducción de características puede aumentar tanto
extracción de características para reconocer diferentes emociones y aumenta el la eficiencia del entrenamiento del modelo como la precisión de la predicción.
sistema de clasificación de desempeño. El análisis multiescala de la señal EEG
mediante WT permite que la señal EEG proporcione detalles y aproximaciones en La selección de funciones es una técnica para eliminar de manera eficiente una
varias escalas de ondas. La descomposición de ondas de la señal EEG produce un gran cantidad de funciones innecesarias (o redundantes) basándose en criterios de
conjunto de coeficientes de ondas en varias escalas. Estos coeficientes se pueden utilidad particulares para obtener los mejores resultados con la menor cantidad de
utilizar como conjunto de características de una señal para su clasificación porque procesamiento de datos.
pueden caracterizar completamente las características de la señal. La función Los enfoques de selección de características también reducen la posibilidad de
wavelet wðtÞ está definida sobreajuste si el conjunto de datos incluye muchas características pero no hay
suficientes observaciones. Al extraer información crucial de un conjunto de datos,
como sigue: la reducción de características/dimensionalidad busca transformar datos de alta

1 tuberculosis
dimensión en una representación comprensible de dimensiones inferiores [108].
wðtÞ ¼ wap ffiffiffi

ð5Þ Idealmente, las representaciones reducidas deberían contener la menor cantidad de


a
parámetros necesarios para tener en cuenta las propiedades observadas de los
donde a y b se representan como factor de escala y cambio de tiempo, datos [109]. La importancia de la reducción de características surge de su capacidad
respectivamente. Hay dos tipos de transformada wavelet: transformada para aliviar la maldición de la dimensionalidad que afecta a los conjuntos de datos
wavelet continua (CWT) y transformada wavelet discreta (DWT) [99]. A de alta dimensión. En general, la selección y reducción de características son
continuación se explica cómo se define el CWT: necesarias para ayudar en la visualización y comprensión de los datos, minimizar el
tiempo de entrenamiento del modelo y evitar la maldición de la dimensionalidad, todo

1 1 tuberculosis
lo cual mejora el rendimiento (o la generalización) de la predicción del modelo.
xðtÞ w dt
ð6Þ
ffiffiffiffiffi

CWTða; bÞ ¼ Z a
1 jaj p

donde x(t) es una señal que debe procesarse. El análisis wavelet será mucho más
eficiente si los parámetros de escalas y desplazamientos se convierten en potencias Los métodos comunes para la reducción de características/dimensionalidad del

de dos, conocidas como escalas y posiciones diádicas. El DWT, que se describe a EEG son el análisis de componentes principales (PCA) [110, 111], el análisis

continuación, proporciona dicho análisis: discriminante lineal (LDA) [112] y el análisis de componentes independientes (ICA)
[112]. PCA intenta representar datos d­dimensionales en un espacio menos
dimensional. Esto limitará la gama de posibilidades así como las complejidades del
1 1 t 2j k wð
xðtÞ Þdt 2j tiempo y el espacio. Aquí, el objetivo es representar datos en un espacio que refleje
ð7Þ
ffiffiffiffiffiffi

DWTðj; kÞ ¼ Z j2j jp
1 con precisión la varianza en términos del error de la suma al cuadrado. Se puede
encontrar información adicional en la literatura [112]. ICA convierte una señal
donde 2j y 2j k se sustituyen por a y b, respectivamente.
multivariada y aleatoria en una señal con componentes mutuamente independientes.
A partir de señales mixtas, este enfoque se puede utilizar para extraer componentes
3.3.4 Análisis de características no lineales
independientes. Aquí, independencia significa que la información proporcionada por
un componente no puede derivarse de los demás. Los detalles se dan en [112,
Las señales de EEG son muy complejas y tienen propiedades no lineales y no
113]. El objetivo de LDA es producir una nueva variable que incorpore los predictores
periódicas que pueden estudiarse mediante análisis dinámico no lineal. En los últimos
originales. Esto se realiza maximizando las diferencias en la nueva variable entre
años, existen muchos métodos de análisis no lineal que se han vuelto populares en
los grupos predefinidos. La idea es integrar las puntuaciones de predicción en una
el análisis de datos de EEG [100­102]. Entre los métodos dinámicos no lineales se
única variable compuesta nueva conocida como puntuación discriminante. Los
encuentran la entropía de permutación [103], la entropía aproximada [104], la
detalles se dan en [112].
entropía de descomposición de valores singulares, la entropía del espectro de
potencia [105] y la entropía de muestra [106].

3.4 Selección y reducción de funciones de EEG

Se puede utilizar una estrategia de búsqueda y un criterio de


En el reconocimiento de emociones basado en EEG, el proceso de selección y
evaluación para categorizar los métodos de selección de características
reducción de características es crucial. En un sistema BCI, los vectores de
[114]. Se podrían utilizar dos técnicas distintas, filtro y envoltura, para
características suelen ser de alta dimensionalidad [107]. Como resultado, con
evaluar un subconjunto de características que se han seleccionado. Los
frecuencia se utilizan técnicas de selección de características y/o reducción de
métodos de filtrado [115, 116] seleccionan características antes de
características para minimizar el número de características.
entregarlas al algoritmo de clasificación. En otras palabras, técnicas de filtrado.

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12539

elegir un subconjunto de características basándose en la comprensión previa de


el problema de clasificación o estadística adquirida a partir de la
datos, y lo hacen independientemente del diseño del clasificador.
Generalmente, los métodos de filtrado son rápidos debido a que
seleccionar las características más relevantes de los datos de entrenamiento y
luego descarte ciertas características según un umbral específico.
Debido a que son menos costosos computacionalmente, estos
Los enfoques son ideales para conjuntos de datos extremadamente grandes. Envoltura

Los algoritmos [117, 118] ejecutan la selección de características en el


contexto de (y en conjunto con) la clasificación Fig. 8 Gráfico circular de selección y reducción de funciones comunes de EEG
algoritmo. El clasificador se utiliza en la selección de características. métodos utilizados en los estudios discutidos en esta revisión

proceso como una subrutina en estos enfoques para evaluar la


conjunto de funciones que se ha seleccionado. Estas técnicas representan un y los métodos de selección de características de contenedor se proporcionan en la

tipo de algoritmo de optimización que emplea la siguientes apartados.

resultados de clasificación como función objetivo. Envoltura


Los métodos son computacionalmente intensivos, lo que restringe
3.4.1 Métodos de filtrado
su aplicación a enormes conjuntos de datos, donde su objetivo es
mejorar la precisión. Además de estos dos métodos, el
El método incorporado se utiliza internamente en los algoritmos clasificadores. Los métodos de filtrado utilizan diferentes técnicas de clasificación, seleccionadas

como el aprendizaje profundo. Los métodos envolventes requieren más cálculos debido a su simplicidad y éxito en diferentes aplicaciones,

que el método integrado. para ordenar las características. Los métodos de clasificación puntúan cada característica

La Tabla 3 muestra la selección y reducción de características. en función de su relevancia y utilizar un umbral para eliminar características.

métodos utilizados en los estudios discutidos en esta revisión. La figura 8 presenta temperaturas por debajo del umbral. Porque se usan antes.

el porcentaje de uso de la selección de funciones. clasificación para filtrar las variables menos importantes,
y métodos de reducción que se han utilizado en los distintos Los métodos de clasificación son métodos de filtrado. Varias medidas

estudios revisados en este trabajo. El 56% de estos estudios no y en varias publicaciones se han presentado definiciones de la relevancia de una
Utilice un método de selección o reducción de características. Incorporado variable [119, 120]. Uno de estos

Los métodos que operan internamente en algoritmos de clasificación como el definiciones es que ''Si una característica es condicionalmente independiente

aprendizaje profundo se utilizan con frecuencia (37%), seguidos de métodos de de las etiquetas de las clases, se considera irrelevante''. El

reducción (p. ej., PCA e ICA), filtrado La relevancia de las características se medirá mediante diferentes técnicas, como

métodos (p. ej., mRMR) (25 % de cada uno) y envoltorio el coeficiente de correlación de Pearson del

métodos (p. ej., PSO) (13%). Más detalles sobre el filtro técnica de información mutua (MI) [121]. Algunos investigadores han aplicado
métodos de filtrado para encontrar los más relevantes.
características para discriminar diferentes emociones [105]. El

Tabla 3 Métodos de selección y reducción de características utilizados en los estudios. La mayoría de los algoritmos de filtrado son univariados, es decir.

cubierto en esta revisión (2015­2021) consideran cada característica de entrada individualmente, de modo que cada
Una característica puede ser autoevaluada e independiente de las demás.
Referencias Selección/reducción de características
Esto puede llevar a dos problemas: características descartadas porque
[63] PCA no son individualmente relevantes pueden volverse relevantes cuando
[55, 67] mRMR combinado con otros y características que se consideran
[58] ICA individualmente según sea relevante puede resultar en despidos innecesarios. El
[68] codificador automático método de filtrado más utilizado es el wavelet.
[59] BSS transformar

[70] Prueba t de Welch con PCA

[72] LRFS 3.4.1.1 Redundancia mínima relevancia máxima Mínima

[73] CSS La relevancia máxima de redundancia (mRMR) es un método basado en filtros.

[81] PSO algoritmo de selección de características que ha demostrado ser


computacionalmente rápido [122]. El objetivo principal de mRMR es
Análisis de Componentes Principales (PCA), Máxima Relevancia de Redundancia
encontrar un subconjunto de características en el espacio de características del dado
Mínima (mRMR), Análisis de Componentes Independientes (ICA),
Selección secuencial hacia atrás (BSS), característica localmente robusta muestras que tienen una redundancia mínima con otras características
Selección (LRFS), Selección de subconjunto basada en correlación (CSS), Partícula pero máxima relevancia para la clase objetivo. El RMMR
Optimización de enjambre (PSO)
El algoritmo mide la relevancia de las características para el objetivo.
clases u otras características en el espacio de características usando mutuas

123
Machine Translated by Google

12540 Aplicaciones y computación neuronal (2022) 34:12527–12557

información. Se basa en dos principios: máxima relevancia y mínima Las técnicas de optimización inspiradas en la inteligencia han ganado
redundancia. La relevancia máxima se define de la siguiente manera: popularidad durante la década anterior. Enjambres de bandadas de pájaros,
insectos sociales y bancos de peces son modelos para ellos. La ventaja de
1 estos enfoques en comparación con las técnicas tradicionales es su
D¼ Iðxi; cÞ
X ð8Þ flexibilidad y solidez. Debido a estas cualidades, la inteligencia de enjambre
jSj
xiS es un modelo de diseño exitoso para algoritmos que abordan problemas

donde S representa conjunto de características e Iðxi; cÞ para información más complicados.

mutua entre la característica i y la clase objetivo c. La redundancia mínima


entre funciones se calcula de la siguiente manera: Recientemente se han presentado nuevos algoritmos evolutivos que
han demostrado un buen rendimiento en muchas aplicaciones cuando se
trata del desafío de seleccionar funciones. En [127], se utilizó Ant Lion
1
R¼ Optimizer (ALO) como modelo contenedor de selección de características
2X _ Iðxi; xjÞ ð9Þ
jSj xi;xjS para abordar este problema. El optimizador de lobo gris (GWO) se utilizó
eficazmente para resolver problemas de selección de características en
donde Iðxi; xjÞ representa información mutua entre las características i y j.
[128]. En [129], los autores utilizaron la optimización de enjambre de
partículas (PSO) en el reconocimiento de emociones basado en expresiones
Podemos obtener el criterio de selección de características para el
faciales para la selección de características.
método mRMR combinando las Ecs. 8 y 9:
Además, en [130], los autores utilizaron el algoritmo de evolución diferencial
maxðD RÞ ð10Þ (DE) como un algoritmo de selección de características basado en envoltura
para la clasificación de señales EEG de imágenes motoras.

3.4.2 Métodos de envoltura


3.5 Clasificación de emociones EEG

Los algoritmos de selección secuencial y los algoritmos de búsqueda


La recopilación de datos de EEG, el preprocesamiento, la extracción de
heurística son dos tipos de métodos contenedores. El algoritmo de selección
características, la selección o reducción de características y la clasificación
secuencial [123, 124] comienza con un conjunto en blanco y agrega
de emociones son todos pasos en el proceso de construcción de un
características hasta lograr el máximo rendimiento de la función/
modelo de reconocimiento de emociones. Uno de los aspectos más
clasificación objetivo. Para agilizar el proceso de selección se elige un
cruciales del desarrollo de un sistema de clasificación de emociones
criterio que vaya mejorando la función objetivo hasta conseguir el máximo
exitoso es encontrar el mejor clasificador que sea capaz de clasificar con
rendimiento con el menor número de características posibles. Los
precisión varias emociones. El clasificador desarrollado tiene una
algoritmos de búsqueda heurística evalúan varios subconjuntos para
influencia importante en la precisión del reconocimiento de emociones
mejorar la función objetivo. En la selección de características, buscar un
[131]. Un clasificador se basa en una función matemática que predice la
subconjunto óptimo es fundamental. A pesar de que un enfoque de
clase verdadera de una observación desconocida en un conjunto de
búsqueda heurística no garantiza que se encontrará el subconjunto óptimo,
datos de validación. Se han empleado diversos métodos de clasificación
generalmente descubre una respuesta satisfactoria en un período de
en el dominio de la informática afectiva para clasificar los datos del EEG
tiempo razonable [125]. Los dos tipos de métodos heurísticos son las
afectivo. Estos clasificadores van desde clasificadores convencionales
heurísticas específicas producidas para abordar un problema específico,
(algoritmos tradicionales de aprendizaje automático), como máquinas de
mientras que las metaheurísticas de propósito general desarrolladas para
vectores de soporte y árboles de decisión, y análisis discriminante lineal,
manejar una variedad de problemas [125]. Las metaheurísticas han
hasta clasificadores avanzados (algoritmos de aprendizaje profundo),
demostrado su eficiencia y eficacia en el manejo de desafíos difíciles y de
como redes neuronales recurrentes y memoria a corto plazo.
gran escala en el diseño de ingeniería, la programación de la minería de
datos y el aprendizaje automático durante las últimas dos décadas.

3.6 Evaluación del desempeño

La mayoría de los algoritmos inspirados en la naturaleza son


Los hallazgos sobre el reconocimiento de emociones deben presentarse
metaheurísticos [126]. Las tres principales fuentes de inspiración son las
de manera coherente para que varios grupos de estudio puedan
basadas en la evolución (p. ej., sistemas inmunológicos artificiales y
comprenderlos y compararlos. Como resultado, es fundamental seleccionar
algoritmos evolutivos), basadas en enjambres (p. ej., optimización de
y especificar cuidadosamente las técnicas de evaluación [132]. Una matriz
enjambres de partículas, colonias de hormigas y colonias de abejas) y
de confusión y precisión son las medidas de evaluación del desempeño
basadas en la física (p. ej., recocido simulado) [ 125]. La exploración del
más recomendadas para evaluar el desempeño del clasificador de
espacio de búsqueda y la explotación de las soluciones óptimas
emociones. Con base en la matriz de confusión, cinco medidas de
descubiertas son dos criterios paradójicos que todas estas técnicas tienen
desempeño de clasificación, es decir, especificidad, recuerdo (sensibilidad),
en común [125]. Enjambre
precisión, medida F y

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12541

Generalmente se calcula el área bajo la curva (AUC). En 4 Conceptos básicos y antecedentes


En general, estas medidas se calculan en base a cuatro principales
métricas de un resultado de clasificación binaria (positivo/negativo), verdadero 4.1 Conjuntos de datos de reconocimiento de emociones EEG
positivo (TP) y verdadero negativo (TN) que
indican estados emocionales correctamente identificados y falsos. Esta sección proporciona un resumen de los conjuntos de datos públicos de EEG
positivo (FP) y falso negativo (FN), que indican falso para el reconocimiento emocional que se utilizaron en los distintos
identificación de estados emocionales. Estas actuaciones investigaciones en esta revisión. El cuadro 4 muestra que siete públicos
Las medidas se definen de la siguiente manera.
Se utilizaron conjuntos de datos de EEG para el reconocimiento emocional,
Precisión (Acc): esta métrica mide cuántos casos incluyendo DEAP, etiquetado MAHNOB­HCI, DREAMER,
están correctamente clasificados. Si las clases están equilibradas, es decir, Conjuntos de datos SEED, AMIGOS, SAFE y GAMOMA. Estos
si cada clase tiene la misma cantidad de muestras, funciona bien. Los conjuntos de datos son útiles para el estudio y se han utilizado en un
Se calcula mediante la ecuación. 11 número de estudios de reconocimiento de emociones. La figura 9 muestra la

ðTP þ TNÞ porcentaje de conjuntos de datos de EEG utilizados en el reconocimiento de emociones


Acc ¼ 100 ð11Þ según los estudios de esta revisión. PROFUNDO y SEMILLA
ðTP þ FN þ TN þ FPÞ
son los más empleados (51% y 19% de participación, respectivamente). Otros
Sensibilidad (Sens): También se llama tasa positiva verdadera o estudios (17 %) empleados
recordar. Evalúa con qué frecuencia un clasificador clasifica adecuadamente sus propios conjuntos de datos, a los que a menudo no se puede acceder abiertamente.
un buen resultado. Está definido por la ecuación. 12 DREAMER es un conjunto de datos disponible públicamente que apareció con un
TP participación del 7% en esta revisión. El MAHNOB­HCI,
Sens ¼ 100 ð12Þ GAMOMA y AMIGOS aparecieron en nuestra muestra de investigación,
ðTP þ FNÞ
cada uno con una tasa de participación del 2%.
Especificidad (Spec): También se conoce como tasa negativa verdadera. Él
Calcula el porcentaje de veces que un clasificador funciona correctamente.
clasifica un resultado negativo. Como resultado, el Falso 4.2 Descripción general del aprendizaje automático
La tasa positiva (FPR) equivale a 1 especificidad. La especificación se puede calcular
mediante la ecuación. 13 El problema del reconocimiento de emociones se puede representar como
Tennesse un problema de clasificación o regresión. La distinción es
100 ð13Þ basado principalmente en el modelo emocional utilizado para representar
Especificación ¼ ðTN þ FPÞ
emociones, que se discutió en la Sección. 1.3.2. Las emociones son
Precisión (Prec): Esta métrica representa el porcentaje de representados como entidades distintas con etiquetas en categorías
clasificaciones correctas. Puede denotarse por la ecuación. 14 representaciones. Los modelos dimensionales, a diferencia de las representaciones
TP discretas, intentan describir emociones utilizando valores continuos de sus
Prec ¼ 100 ð14Þ
ðTP þ FPÞ características definitorias, que son
comúnmente representado en ejes.
Medida F (F): Representa la media armónica de Precisión y Sensibilidad. Es La mayoría de las técnicas anteriores, como se muestra en la Sección.
importante porque cuanto mayor sea el 5.1, trate el reconocimiento de emociones como un problema de clasificación,
precisión, menor será la sensibilidad y viceversa. Es intentar distinguir entre categorías de emociones, o
mensurable por la ecuación. 15 entre diferentes áreas del modelo de emoción 2D de Russell. En

ðPrec SensÞ En general, la literatura contribuye mucho más a la emoción.


F¼2 ð15Þ clasificación que a la regresión de la dimensión emocional. Como resultado, en
ðPrec þ SensÞ
esta sección nos concentraremos en
AUC: La curva característica del operador del receptor (ROC) es una Técnicas de clasificación de aprendizaje automático.
curva de probabilidad que grafica la Sens contra la FPR en En los sistemas que reconocen emociones se utilizaron algoritmos de
varios valores umbral. La curva ROC representa el desempeño de un clasificador aprendizaje automático para clasificar diferentes emociones.
en diferentes grados de significancia. El estados de BCI basado en EEG. Utilizando la base de datos Scopus como
El área bajo la curva ROC (AUC) resume la ROC fuente de información, la Figura 10a muestra estadísticas para
curva que indica qué tan bien un clasificador puede discriminar
Investigación sobre aprendizaje automático y reconocimiento y clasificación de
entre verdadero positivo y verdadero negativo. emociones EEG de 2012 a 2021. La Figura 10b muestra
La distribución del aprendizaje automático en la emoción EEG.
área de investigación de reconocimiento.

Como producto de inteligencia artificial, el aprendizaje automático


ha jugado un papel importante en la distinción entre

123
Machine Translated by Google

12542 Aplicaciones y computación neuronal (2022) 34:12527–12557

Tabla 4 Lista de conjuntos de datos de EEG disponibles públicamente utilizados para el reconocimiento emocional

Conjunto de datos
Participantes canales EEG Elicitación de emociones Estados de emoción

DEAP [54] 32 32 Videos musicales Valencia, excitación, dominancia y

gusto
MAHNOB­HCI 27 32 Fragmentos de vídeos Excitación y valencia calificadas con

etiquetado [133] e imágenes el maniquí de autoevaluación para

provoca varias emociones (ansiedad,

neutral, tristeza, diversión,

asco, alegría, sorpresa, ira

y miedo)

SEMILLA [44, 134] 15 62 clips de película Positivo, negativo y neutral.

SOÑADOR [135] 23 14 Clips de Excitación, valencia y dominancia.

AMIGOS [136] 40 14 películas vídeos cortos y largos. Excitación, valencia, dominio, agrado,

familiaridad y emociones básicas.

SEGURO [137] 6 5 Sonidos seleccionados de Agradable, feliz, asustado y enojado.


IADS.

JUEGOEMO [64] 28 14 Juegos de computadora Aburrido, tranquilo, terror y divertido.

tarea y luego aplicarlos a la tarea objetivo. Además,


La tecnología de minería de datos de aprendizaje automático puede almacenar datos en

un sistema de gestión de datos y analizarlo utilizando una máquina


algoritmos de aprendizaje, lo que resulta en la extracción de información
potencialmente importante. El algoritmo de aprendizaje automático elegido
puede tener un gran impacto en el resultado final.
resultados de clasificación o predicción [138].
Hay dos categorías de modelos de aprendizaje automático:
Aprendizaje supervisado y no supervisado. Máquina supervisada
Fig. 9 Gráfico circular de los conjuntos de datos de EEG utilizados para el reconocimiento de emociones. El aprendizaje es una técnica para determinar el clasificador.
en los estudios discutidos en esta revisión
parámetros utilizando datos de entrenamiento. Después de ver la salida
valor, la tarea de aprendizaje es establecer el valor de sus parámetros
distintos patrones de actividad cerebral; por lo tanto, se ha convertido en un
para cualquier valor de entrada válido. Un conjunto de datos de prueba que contiene datos que
parte importante del análisis de datos de BCI. Aprendizaje automático
no se ha contribuido al modelo mientras se alimenta el aprendizaje
Puede aprender conocimientos y reglas importantes de la fuente.

Fig. 10 Los métodos de aprendizaje automático para estudios de reconocimiento de emociones EEG realizados en la última década [2012­2021] basados en el scopus
base de datos

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12543

en el clasificador para validar el rendimiento de un algoritmo aprendido. El un margen de separación de datos adecuado (es decir, vectores de
aprendizaje no supervisado, por otro lado, es una técnica de aprendizaje soporte) [150].
automático que determina parámetros en función de datos de entrada y
una función de costos que debe reducirse. En los últimos años se han 4.2.2 Red neuronal artificial

implementado varios modelos de ML para la gestión de la clasificación de


señales EEG para el reconocimiento de emociones humanas. Entre estos Las redes neuronales artificiales (RNA) son una forma de técnica de
métodos se encuentran las máquinas de vectores de soporte (SVM), Naı¨ve aprendizaje automático que se desarrolló para simular el cerebro humano
Bayes (NB), k­vecino más cercano (K­NN), árboles de decisión (DT), [151]. Es decir, de la misma manera que las neuronas del sistema nervioso
bosque aleatorio (RF) y redes neuronales artificiales (ANN), que son humano pueden aprender de datos previos, la RNA puede aprender de los
ampliamente utilizado como método de clasificación; los describiremos datos y responder en forma de clasificaciones o predicciones. Está
brevemente en las siguientes secciones. formado por unidades de procesamiento simples, conocidas como neuronas
o nodos artificiales, y sus conexiones. El peso de cualquier conexión entre
dos unidades se utiliza para evaluar cuál es el impacto de una unidad sobre
4.2.1 Máquina de vectores de soporte la otra.
Algunas unidades sirven como nodos de entrada, otras sirven como nodos
La máquina de vectores de soporte (SVM) es una técnica de ML ocultos y el resto sirven como nodos de salida, realizando sumas y umbrales
supervisada capaz de resolver problemas de clasificación y regresión lineal [150].
y no lineal. Vladimir Vapnik fue quien lo introdujo [139]. SVM se ha En una red neuronal, hay tres capas esenciales: capas de entrada,
empleado en una variedad de aplicaciones, incluida la detección y el capas ocultas y capa de salida [152], como se muestra en la Fig. 11. La
reconocimiento de rostros [140­142], el diagnóstico de enfermedades capa de entrada de una ANN es la capa inicial que recibe datos en forma
[143­145] y el reconocimiento de textos [146­148]. En general, las SVM de números, textos , píxeles de imagen, archivos de audio, etc. Las capas
son intuitivas, teóricamente bien fundamentadas y han demostrado ser ocultas se encuentran en medio del modelo ANN. Es posible tener una
prácticamente exitosas. única capa oculta, como en un perceptrón, o numerosas capas ocultas.
Estas capas ocultas utilizan los datos de entrada para ejecutar varios tipos
El objetivo principal de SVM es localizar hiperplanos que separen con de cálculos matemáticos y reconocer patrones. El resultado obtenido por
precisión varios grupos (dos o más clases) de datos n­dimensionales. los rigurosos cálculos de la capa intermedia se encuentra en la capa de
SVM se basa en casos de entrenamiento colocados en el borde del salida.
descriptor de clase, conocidos como vectores de soporte; todos los demás
casos se eliminan. Según las etiquetas o clases que haya definido, SVM El rendimiento de una red neuronal se ve afectado por una serie de
intenta maximizar los límites de separación entre sus puntos de datos. parámetros e hiperparámetros. La salida de las RNA está influenciada
Como resultado, se obtiene el hiperplano óptimo con la distancia más larga principalmente por estos parámetros. Entre ellos se encuentran
al punto de entrenamiento más cercano de cualquier clase para lograr una ponderaciones, sesgos, tamaño de lote, tasa de aprendizaje y otros
buena separación de características. Cuando SVM no puede separar datos parámetros. La neurona artificial es un componente de la red neuronal
linealmente, utiliza funciones del kernel para mapear/transformar datos de artificial (RNA) que está diseñada para imitar la función de una neurona
entrada en espacios de características de alta dimensión. En un espacio biológica. Cada neurona artificial (nodo) de la red tiene un conjunto de
de alta dimensión, es factible diseñar un hiperplano que permita la pesos adjuntos.
separación lineal (que en el espacio de entrada de menor dimensión
corresponde a una superficie curva). Como resultado, en SVM, la función
del núcleo es crucial. En la práctica se pueden emplear funciones kernel
como polinómicas, lineales y gaussianas.

Los algoritmos de optimización se pueden utilizar para encontrar un


óptimo global particular para los parámetros de SVM, como el parámetro
de función del núcleo r y el factor de compensación de clasificación errónea
c, que controla la compensación entre el margen máximo y el error de
entrenamiento más pequeño. Como resultado, el rendimiento de la
clasificación basada en SVM está determinado por la optimización de
parámetros y la selección de una función kernel adecuada. Las
configuraciones de parámetros de SVM que son incorrectas dan como
resultado resultados de clasificación deficientes, como sobreajuste o
subajuste. [149]. SVM proporciona el beneficio de que el problema del
sobreajuste se puede gestionar simplemente seleccionando Fig.11 Arquitectura básica de ANN

123
Machine Translated by Google

12544 Aplicaciones y computación neuronal (2022) 34:12527–12557

versión de ID3 unos años más tarde. Según [158], C4.5 proporciona la base
para nuevos algoritmos de clasificación supervisados. El algoritmo J48 es
una versión basada en Java del método de clasificación C4.5, que surgió
como resultado de la necesidad de recodificar el algoritmo después de que
se construyó por primera vez en C [156]. El algoritmo siempre elige el mejor
paso evaluado localmente, independientemente de si generará o no la
solución óptima, y divide un problema en subproblemas generando
subárboles entre la raíz y las hojas. Salvatore Ruggieri creó EC4.5, una
técnica de clasificación que calcula árboles de decisión idénticos a C4.5
pero con hasta cinco veces la ganancia de rendimiento, en 2002. [159].
Fig.12 Modelo de una neurona artificial.

como se muestra en la Fig. 12. La suma ponderada de las entradas y el


sesgo se calculan utilizando una función de transferencia. La función de Los árboles de decisión tienen la ventaja sobre otros métodos de
activación recibe el resultado después de la función de transferencia. aprendizaje automático de que no son modelos de caja negra y pueden
ción ha calculado la suma. Las funciones de activación activan el resultado expresarse fácilmente como reglas. Esta ventaja tiene un mayor impacto en
apropiado desde el nodo en función de la salida recibida. La función de muchos dominios de aplicación, por lo que estos modelos se utilizan
activación verifica si la salida cumple con un umbral específico y genera cero ampliamente.
o uno. Sig­moid, ReLU, Softmax, Tanh y otras funciones de activación
comunes se utilizan en redes neuronales artificiales [153]. 4.2.4 Bosque aleatorio

Obtenemos el resultado final en función del valor disparado por el nodo. El bosque aleatorio (RF) [160] es un enfoque de conjunto sofisticado que
Luego, con la ayuda de las funciones de error, calculamos las diferencias utiliza un bosque de árboles de decisión para realizar clasificaciones y
entre las salidas predichas y reales y, usando retropropagación, modificamos regresiones durante el entrenamiento. Se basa en el concepto de algoritmo
los pesos de la red neuronal. de ensacado. Puede manejar grandes cantidades de datos porque solo
emplea un subconjunto de características al crear árboles de decisión. Se
Hay muchos tipos y arquitecturas diferentes de redes neuronales, cada necesita una fracción del tiempo para entrenar en comparación con otros
una con una diferencia básica en la forma de aprender; están bien descritos clasificadores [161]. Random Forest es una técnica de clasificación popular
en la literatura [151, 152]. Entre estas arquitecturas se encuentran la red debido a todas estas cualidades. La votación de todos los árboles de
neuronal de perceptrón multicapa (MLPNN) y la máquina de aprendizaje decisión determina el resultado final de RF [162]. A continuación se explica
extrema (ELM). paso a paso el modelo de trabajo de RF:

4.2.3 Árbol de decisión


– Los conjuntos de entrenamiento se eligen al azar y tienen el mismo tamaño
que el conjunto de muestra.
El árbol de decisión (DT) es un método común de aprendizaje automático
– Cada conjunto de entrenamiento se utiliza para construir un árbol de decisiones.
que se utiliza tanto para problemas de regresión como de clasificación. Se
– Extraiga un grupo de atributos al azar de todos los atributos con la misma
basa en la división del conjunto de datos en varios subconjuntos.
probabilidad y luego elija el mejor atributo para dividir los nodos de este
de acuerdo con un criterio que maximiza la separación de los datos,
subconjunto.
repitiendo este proceso de forma recursiva para producir un árbol [154, 155].
El criterio más utilizado es la ganancia de información, lo que significa que – La predicción se obtiene de cada árbol de decisión.
se maximiza la reducción de entropía debida a cada división.
– Se obtiene el voto por cada resultado previsto.
– La decisión final se toma seleccionando el máximo votado.
A cada nodo hoja de un árbol de decisión se le asigna una etiqueta de resultados
clase; Los nodos no terminales, como el nodo raíz y otros nodos internos,
llevan condiciones de prueba de atributos que ayudan a distinguir registros
con características distintivas [156]. 4.2.5 k­vecino más cercano
Cada nodo del árbol de decisión se puede definir como regla. Los nodos
superiores del árbol de decisión tienen un mayor impacto en la precisión k­vecino más cercano (K­NN) es uno de los algoritmos de aprendizaje
general de la muestra [157]. automático supervisados y basados en estadísticas que se utilizan para
J. Ross Quinlan creó ID3 (Iterative Dichotomizer 3), un algoritmo problemas de regresión y clasificación [163]. El algoritmo K­NN se ha
generador de árboles de decisión, a finales de los años 1970 y principios de perfeccionado enormemente con el tiempo y ahora se utiliza ampliamente
los 1980. Presentó el método C4.5 como una mejora en una variedad de campos: reconocimiento de texto [164], reconocimiento
de emociones [165] y reconocimiento facial [166]. El

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12545

Idea de K­NN basada en una medida de similitud (por ejemplo, Se pueden entrenar funciones complejas para identificar clases de
función de distancia) entre el conjunto de entrenamiento y de prueba. salida en una tarea de clasificación utilizando varias
Encuentre el ejemplo de entrenamiento que sea más similar al objeto transformaciones y varias capas ocultas. Recientemente se han
x cuando se le solicite que identifique su clase. Después de eso, publicado varios estudios sobre el uso de técnicas de aprendizaje
etiqueta x con la clase de este ejemplo. La precisión del algoritmo profundo (DL) para el reconocimiento automatizado de emociones,
puede mejorar a medida que aumenta el número de vecinos más cercanosa (k).
pesar de que son bastante nuevos en comparación con la larga
El enfoque K­NN comienza con la elección de un conjunto de historia del estudio de las emociones en psicofisiología. Según los
muestras de entrenamiento. Seleccione el número de vecinos (k). K­ datos de la base de datos scopus, la Figura 13a muestra
NN utiliza la distancia euclidiana entre la muestra de prueba y las estadísticas para la investigación de clasificación y reconocimiento
muestras de entrenamiento para descubrir las K­muestras más de emociones de DL y EEG de 2014 a 2021. La Figura 13b muestra
cercanas en el conjunto de entrenamiento para cada nueva instancia la distribución de DL en el área de investigación de reconocimiento de emociones
de prueba, como se muestra en la Ec.16. Cuente cuántas muestras Para mejorar el rendimiento de la clasificación y ahorrar tiempo de
de entrenamiento tiene cada clase entre los K vecinos que ha elegido. cálculo, la extracción y selección de características encuentran un conjunto
La clase objetivo de la instancia de prueba está determinada por el de características más pequeño. La extracción de características profunda
valor de clase más común de las muestras de entrenamiento K y superficial son dos tipos de extracción de características. Las características
[163]. El costo de K­NN es una complejidad de cálculo excesiva. El que han sido elaboradas a mano en diversos dominios analíticos, como el
volumen de datos en el conjunto de datos determina la complejidad dominio del tiempo, el dominio de la frecuencia y el dominio del tiempo­
computacional. Como resultado, K­NN se adapta mejor a conjuntos frecuencia, se denominan características superficiales. Como se describe
de datos con una cantidad modesta de muestras. en la sección 3.4, se utilizan numerosos enfoques de selección o reducción
de características para minimizar las características de dimensiones
ffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffifi

vu
2 superiores. Desafortunadamente, las características superficiales dependen
DðA; BÞ ¼ xn jai; bij ð16Þ
i¼1 ! en gran medida de la heurística y necesitan una gran cantidad de datos
Utah

etiquetados, que pueden ser difíciles de obtener en el contexto de aplicaciones del mundo re
La extracción y selección manual de características suele llevar mucho
4.2.6 Bayes ingenuo tiempo y ser tediosa, pero tiene una influencia significativa en el
rendimiento de los modelos de aprendizaje automático. Las
Un clasificador ingenuo de Bayes (NB) es un algoritmo de características superficiales creadas a mano suelen ser específicas de
clasificación probabilística que se basa en el teorema de un dominio, lo que dificulta su reutilización en otros problemas.
Bayes con supuestos de alta independencia [167, 168]. El Las técnicas clásicas de ingeniería de características y aprendizaje
clasificador NB supone que la presencia (o ausencia) de una automático pueden tener dificultades para extraer patrones complicados
característica en una clase no influye en la presencia (o y no lineales a partir de datos de series temporales con varias variables.
ausencia) de otras características. El clasificador NB supone Además, seleccionar las características más importantes de un gran conjunto
que la presencia (o falta) de una característica en una clase de características es crucial y requerirá el uso de enfoques de reducción de

no influye en la presencia (o falta) de otras características. La dimensionalidad. Además, la extracción y selección de características lleva
técnica de máxima verosimilitud se utiliza para calcular mucho tiempo calcularse. El costo de calcular la selección de características,
parámetros en modelos ingenuos de Bayes [169]. El por ejemplo, puede crecer exponencialmente a medida que crece la
clasificador NB se puede enseñar de manera muy eficaz en dimensionalidad de las características. Es posible que los algoritmos de
un entorno de aprendizaje supervisado, sobre la base de la búsqueda, en general, no encuentren el mejor conjunto de funciones para un
naturaleza precisa del modelo de probabilidad, y requiere modelo de aprendizaje automático en particular.
datos de entrenamiento mínimos para la clasificación. La Muchos investigadores se han centrado en técnicas de DL para
clase resultante en este clasificador es la que tiene mayor posprobabilidad.
resolver los desafíos de extraer características útiles y estables de datos
de series temporales. DL facilita la extracción de funciones hechas a
4.3 Descripción general del aprendizaje profundo mano para algoritmos de ML. Más bien, tiene la capacidad de aprender la
representación jerárquica de la característica de forma autónoma. En un
El aprendizaje profundo (DL) es un subconjunto del aprendizaje proceso de aprendizaje automático tradicional, esto elimina el requisito
automático y la inteligencia artificial que puede aprender de los datos de reconstrucción del espacio de características y preprocesamiento de
proporcionados [170]. En varias tareas y conjuntos de datos de datos. Las redes neuronales artificiales (ANN) están en el corazón del
clasificación y regresión, DL puede producir resultados significativos. aprendizaje profundo, y "deep" en el nombre indica la cantidad de capas
Se ha convertido en un tema popular en el mundo de la informática, en una red neuronal. Una red neuronal que tiene más de tres capas, que
con aplicaciones en atención médica, reconocimiento visual, análisis abarcan entradas y salidas, se conoce como algoritmo de aprendizaje
de texto, ciberseguridad y una variedad de otros campos [171]. profundo. La carrera de DL comenzó en la década de 1980. Quizás la
DL emplea varias capas ocultas en redes neuronales primera red neuronal artificial fue la
para realizar numerosos niveles de operaciones no lineales.

123
Machine Translated by Google

12546 Aplicaciones y computación neuronal (2022) 34:12527–12557

Fig. 13 Los métodos de aprendizaje profundo para estudios de reconocimiento de emociones EEG realizados en la última década [2014­2021] basados en la base de datos scopus

neocognitron [172] tiene la propiedad "profunda" y tiene en cuenta los red neuronal recurrente (RNN) con redes de memoria a largo plazo
conocimientos neurofisiológicos. Hinton y Salakhutdinov [173] hicieron (LSTM) como tipo especial y red neuronal convolucional (CNN), que se
una contribución significativa a la extracción de características en 2006, a emplean ampliamente como métodos de clasificación; los describiremos
la que se ha seguido en años posteriores [174­177]. Según diversas brevemente en las siguientes secciones.
investigaciones [178–180], las NN multicapa se pueden utilizar para
representar y aprender características utilizando metodologías iterativas
o no iterativas. 4.3.1 Red neuronal recurrente

Las redes neuronales profundas se utilizan en técnicas de DL para La red neuronal recurrente (RNN) es un método de aprendizaje profundo
extraer características relevantes mediante la aplicación de representación para procesar datos secuenciales de longitud variable, como datos de
de datos de alto nivel. La capacidad de tratar directamente con datos sin series temporales (sensores), sonido o lenguaje natural escrito. Está
procesar y automatizar la extracción y selección de características es un formado por redes neuronales feedforward conectadas cíclicamente.
aspecto atractivo de los enfoques de DL. La red se alimenta con muestras Aprovecha las correlaciones temporales entre los datos en diferentes
de series temporales y se crea una representación oculta de las entradas momentos para mapear el historial completo de entradas en la red y
de la capa anterior después de cada transformación no lineal, lo que da anticipar cada salida.
como resultado una estructura de representación de datos jerárquica.
Para decirlo de otra manera, en un paradigma de red profunda, cada capa En una red neuronal estándar, todas las entradas (y salidas) se
toma los resultados de la capa anterior y utiliza un mapeo no lineal para consideran independientes entre sí. RNN es un tipo de red neuronal que
convertirlos en un nuevo conjunto de características. tiene conexiones cíclicas y puede aprender datos secuenciales temporales.
Las redes RNN pueden captar patrones temporales que son dinámicos
Recientemente, los algoritmos de aprendizaje profundo como el y guardar información gracias a que cada capa oculta tiene bucles de
autoencoder, la red de creencias profundas (DBN), la red neuronal retroalimentación internos. Varios nodos forman la capa oculta de un
convolucional y la red neuronal recurrente han generado un gran impacto RNN, que genera resultados en función de las entradas actualmente
en diferentes aplicaciones como el reconocimiento de voz, la visión por disponibles y los estados ocultos anteriores.
computadora, el reconocimiento de objetos, el procesamiento del
lenguaje natural y el procesamiento de máquinas. traducción. Se proponen El algoritmo de retropropagación a través del tiempo (BPTT) [185] se
y aplican diferentes modelos de arquitectura profunda a señales de EEG puede utilizar para entrenar RNN. Sin embargo, los RNN son difíciles de
y se lograron resultados comparables en comparación con otros métodos entrenar debido a problemas de gradiente explosivo y de desaparición,
convencionales [181­184]. En los últimos años, DL se ha utilizado para lo que puede dificultar que la red retropague gradientes durante intervalos
construir arquitecturas de reconocimiento de emociones que pueden de tiempo prolongados [186, 187]. Esto restringe la cantidad de contexto
reconfigurarse debido a su capacidad para proporcionar abstracción de al que tienen acceso, lo cual es crucial para los datos de secuencia.
datos de alto nivel. Como resultado, la memoria a corto plazo (LSTM) y la unidad recurrente
En los últimos años, se han implementado varios modelos DL para de puerta (GRU) [187] han ganado popularidad como alternativas.
gestionar la clasificación de señales EEG para el reconocimiento de
emociones humanas. Entre estos métodos,

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12547

4.3.1.1 Red de memoria a largo plazo Las redes de memoria a largo consta de varios mapas de características. Las características locales
plazo (LSTM) son un tipo de red neuronal recurrente (RNN) con una de distintos puntos en el primero se extraen utilizando cada neurona
arquitectura única. del mismo mapa de características. Se aplica una función de activación
Hochreiter y Schmidhuber lo introdujeron en 1997 [188] para abordar la no lineal a las salidas de una operación lineal como la convolución. La
cuestión de la dependencia a largo plazo en las RNN. unidad lineal rectificada (ReLU) es la función de activación no lineal
Debido a que un RNN convencional se enseña mediante más utilizada en la actualidad y se utiliza para convertir operaciones
retropropagación a través del tiempo (BPTT) [185], aprender secuencias lineales en no lineales. La capa de agrupación se utiliza para minimizar
largas puede ser un desafío, lo que conduce al problema del gradiente la dimensión de los mapas de características y mejorar la solidez de la
de desaparición/explosión [186]. La celda RNN se sustituye por una extracción de características. Los valores de salida de la capa
celda cerrada, como una celda LSTM, para superar este problema. convolucionada también se seleccionan mediante un filtro deslizante
en la capa de agrupación. Las capas de agrupación media y máxima
Las celdas LSTM tienen un bloque de memoria y puertas que son las dos formas de capa de agrupación. La capa completamente
permiten que la información pase a través de la conexión LSTM. Hay conectada recibe todas las entidades que se han creado. La salida de
varias conexiones para entrar y salir por estas puertas. esta capa es una distribución de probabilidad para todas las clases. La
En los bloques de memoria, el estado temporal de la red se almacena capa completamente conectada es el resultado final de la clasificación.
en celdas de memoria con autoconexiones y el flujo de información Combina todas las neuronas de la capa anterior en una sola capa.
está controlado por unidades multiplicativas específicas llamadas
puertas [188]. En la construcción original, cada bloque de memoria
tenía tres puertas: una puerta de entrada, una puerta de olvido y una
puerta de salida. La primera puerta es una puerta de olvido, que utiliza 5 técnicas de reconocimiento de emociones humanas
una capa sigmoidea para elegir qué información del estado de la celda usando BCI basado en EEG
debe descartarse. La puerta de entrada es la segunda puerta que
incluye una capa sigmoidea para determinar qué valores se han En los últimos años se han publicado varios artículos de investigación
configurado para actualizar y una capa tanh para crear un vector de sobre el reconocimiento de emociones que emplean dispositivos BCI
valores recién actualizados. Finalmente, la salida del estado actual se para la recopilación de datos de EEG. Estos artículos utilizan varias
calculará utilizando la capa sigmoidea y el estado de celda actualizado. técnicas de aprendizaje automático y profundo. Según la base de datos
La capa sigmoidea determina qué aspectos del estado celular son scopus, la Fig. 14 muestra la cantidad de artículos de 2015 a 2021 que
definitivos. emplearon los clasificadores más utilizados: ANN, SVM, RF, K­NN, NB
y aprendizaje profundo. En esta sección, discutiremos y revisaremos
4.3.2 Red neuronal convolucional algunas de las técnicas de aprendizaje profundo y automático más
extendidas para el reconocimiento de emociones EEG, como se
La red neuronal convolucional (CNN) es un tipo de red neuronal artificial muestra en las siguientes secciones.
profunda y de avance basado en la estructura
tura de la corteza visual de los animales y se utiliza más comúnmente 5.1 Métodos de aprendizaje automático para el reconocimiento de
para analizar imágenes. La suposición de que las entradas son emociones EEG
imágenes es obvia en las arquitecturas CNN, lo que nos permite
codificar atributos específicos en la arquitectura. Como resultado, la Se utilizan diferentes métodos de aprendizaje automático para clasificar
construcción de la función directa es más eficiente y el recuento de diferentes estados emocionales a partir de datos de EEG como apoyo.
parámetros de la red disminuye drásticamente. A diferencia de una red
convencional completamente conectada, en la que una neurona está
conectada a todas las neuronas de la capa que la precede, una neurona
en una CNN solo está conectada a una porción especial de la capa
conocida como campo receptivo local. CNN tiene tres tipos diferentes
de capas en su diseño: (1) convolución, (2) agrupación y (3) capas
completamente conectadas [189]. Las capas de convolución y
agrupación sirven para la extracción de características, mientras que
una capa completamente conectada transfiere esas características al
resultado final, como la clasificación.
La capa de convolución es una parte fundamental del diseño de
CNN, ya que extrae características, lo que a menudo implica una
combinación de procesos lineales y no lineales, como el proceso de
Fig. 14 Número de publicaciones de 2015 a 2021 de los métodos de
convolución y las funciones de activación. La convolución es una forma aprendizaje profundo y automático más utilizados para el reconocimiento de
de proceso lineal que se utiliza para extraer características y emociones EEG basados en la base de datos Scopus.

123
Machine Translated by Google

12548 Aplicaciones y computación neuronal (2022) 34:12527–12557

Tabla 5 Resumen de los artículos de clasificación de emociones EEG que utilizan métodos tradicionales de aprendizaje automático entre 2015 y 2021

Referencias Conjunto de datos utilizado Métodos de clasificación Emociones Cuenta (%)

[63] Conjunto de datos propio SVM Asco Promedio 90.2

[56] DEAP C4.5 2clase/excitación Excitación: 69.09

2clase/Valencia Valencia: 67,89

[64] JUEGOEMO MLPNN HAPV, HANV, LAPV y LANV 4 clases/promedio. 73.2

Positivo y negativo 2 clases/promedio. 81,36


[57] DEAP MLPNN Positivo y negativo 77.14

[67] DEAP y SEMILLA GEL DEAP: HAHV,HALV, LAHV y DEAP: 69,67

LALV SEMILLA: 91.07

SEAD: Positivo, neutral y negativo.


[58] DEAP ANA 2clase/excitación Excitación: 82.11

2clase/Valencia Cenefa: 82,03

[68] DEAP y SEMILLA RF, K­NN, DT Positivo, neutral (tranquilo) y negativo. DEAP: 62.63

SEMILLA: 74,85

[59] DEAP LSSVM (lineal) 2clase/excitación, Excitación:64.84

2clase/Valencia Valencia: 61,17

[55] DEAP SVM ((RBF)) 2clase/excitación, Excitación: 73.06

2clase/Valencia Valencia: 73,14

[69] DEAP SVM y RVM 2clase/excitación, Excitación: 68

2clase/Valencia, Valencia: 65

2clase/Dominancia Dominio: 63

y 2clase/Agrado. Gusto: 67
[70] DEAP SVM (RBF) 2clase/excitación, Excitación: 67,7

2clase/Valencia Valencia: 69,6

[71] Conjunto de datos propio LIBSVM 2clase/excitación, Excitación: 74,88

2clase/Valencia Valencia: 82,63

[72] DEAP y LSSVM (RBF) 2clase/excitación, DEAP:

MAHNOB­HCI 2clase/Valencia Excitación: 65

Valencia: 68

MAHNOB­HCI:

Excitación: 67

Valencia: 70

[sesenta y cinco]
DEAP K­NN 2clase/excitación, Excitación: promedio. 92,9
2clase/Valencia Valencia: promedio. 92,8

[73] DEAP LDA Positivo, negativo, enojado. 82

y armonía
[74] DEAP MLPNN HVHA, LVLA, HVLA y 93,8

LVHA

[75] Conjunto de datos propio SVM Positivo, neutral y negativo. 85,9

[76] SEMILLA RFE, SVM Positivo, neutral y negativo. 93

[77] DEAP RF Feliz, triste, enojado y relajado. 75,60

[191] DEAP NÓTESE BIEN


Valencia, excitación y dominancia. 78.06

Máquina de vectores de soporte de mínimos cuadrados (LSSVM), Máquina de aprendizaje extremo regularizada de gráficos (GELM), Máquina de vectores de relevancia (RVM),
Análisis Discriminante Lineal (LDA), Conjunto de Bosques de Rotación (RFE)

máquina vectorial (SVM), bosque aleatorio (RF), k­más cercano Todas las técnicas de clasificación superficial clasifican las señales de EEG.
vecino (K­NN), máquina de aprendizaje extremo (ELM), red neuronal basándose únicamente en sus características, sin tener en cuenta
artificial (ANN) y Bayes ingenuo (NB). Estos la información dinámica temporal interna de las señales [190].

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12549

2015 a 2021. La Figura 16 ilustra un gráfico del porcentaje de uso de diferentes


técnicas de aprendizaje profundo utilizadas para el reconocimiento de emociones
EEG abordadas en esta revisión.
Según la Tabla 6, la precisión de clasificación de los algoritmos de
aprendizaje profundo varía entre 61,25% y 97,56%.
Se puede ver que los métodos tradicionales de aprendizaje automático no
tienen un efecto de clasificación tan bueno como los métodos de aprendizaje
profundo. Para determinar las características de las señales EEG, las técnicas
clásicas de aprendizaje automático requieren muchos conocimientos previos.
Sin embargo, varias personas tienen diferencias significativas en el complicado
proceso cognitivo, lo que dificulta encontrar funciones efectivas. Todo esto hace
que mejorar la precisión de la clasificación de la señal EEG sea extremadamente
difícil. El aprendizaje profundo, a diferencia de los algoritmos tradicionales de
Fig. 15 Varios métodos de aprendizaje automático utilizados en el reconocimiento
de emociones EEG abordados en esta revisión aprendizaje automático, no requiere amplios conocimientos previos ni extracción
manual de funciones.

La Tabla 5 resume la investigación en reconocimiento de emociones a partir de


EEG de 2015 a 2021 utilizando técnicas de aprendizaje automático. La Figura Es capaz de extraer características de datos complicados nivel por nivel. Como

15 ilustra un gráfico del porcentaje de uso de varios métodos de aprendizaje se muestra en la Fig. 16, LSTM y sus derivados son los más utilizados y

automático utilizados para el reconocimiento de emociones EEG abordados en representan el 50% del total. CNN y sus derivados son los segundos más

esta revisión. populares y representan el 36% de los estudios. DBN y DNN son los menos

Según la Tabla 5, la precisión de clasificación de los métodos tradicionales populares, cada uno con una proporción del 7%.

de aprendizaje automático oscila entre el 61,17 y el 93%.


Como se muestra en la Fig. 15, SVM y sus derivados son los más comúnmente
utilizados, contribuyendo con el 41%, y las funciones del núcleo relacionadas
son funciones de base radial (RBF), lineales y gaussianas, etc. Las redes 6 Desafíos y futuras direcciones de investigación
neuronales artificiales (ANN) y su arquitectura MLPNN son las segundas más
populares, con un 18% de uso. RF es elegido por el 14% de los investigadores. Como ha demostrado este estudio de revisión, podemos emplear dispositivos

El uso del K­NN es similar al del DT, cada uno representa el 9%. Sólo el 5% de BCI para registrar señales de EEG y analizarlas utilizando algoritmos ML y DL

los investigadores elige NB. modernos para aplicaciones del mundo real de tecnología de detección de
emociones. Sin embargo, hay cuestiones sin resolver que es necesario abordar.

ELM es el menos utilizado, con aproximadamente un 4%. En promedio, los enfoques existentes para la detección de emociones utilizando

SVM, como representación de las técnicas clásicas de aprendizaje automático, señales de EEG produjeron precisiones de clasificación superiores al 80%, lo

tiene la ventaja de poder separar clases en un espacio de dimensiones que parece ser apropiado para aplicaciones prácticas; sin embargo, la precisión

superiores utilizando diferentes funciones del núcleo, y ha sido elegido durante del reconocimiento es única para cada aplicación y depende en gran medida

mucho tiempo por la mayoría de los investigadores. de los conjuntos de datos utilizados en el estudio. Los siguientes son algunos

Como resultado, ocupa el primer lugar en esta revisión en términos de frecuencia de los temas abiertos y direcciones para futuras investigaciones en el campo

de uso del algoritmo. del reconocimiento de emociones que se descubrieron durante esta revisión.

5.2 Métodos de aprendizaje profundo para el reconocimiento de


emociones EEG
1. La investigación existente se centra principalmente en el problema del
reconocimiento de emociones dependientes subjetivas, que requiere un
En los últimos años, un gran número de investigadores han adoptado técnicas
clasificador personalizado para cada participante. Un modelo de
de aprendizaje profundo. Debido a las ventajas de la red neuronal recurrente
reconocimiento de emociones que sea independiente del sujeto (o
(RNN), la red neuronal convolucional (CNN), la red neuronal profunda (DNN),
genérico) y adecuado para un conjunto de individuos sería extremadamente
la red de creencias profundas (DBN) y la memoria a corto y largo plazo (LSTM)
útil en circunstancias del mundo real. Sin embargo, para lograr una
en el aprendizaje representacional y la alta precisión de clasificación, se pueden
precisión en la detección de emociones que sea consistente entre los
utilizar para clasificar situaciones más complicadas. Como resultado, un número
individuos, el modelo clasificador independiente del sujeto debe integrarse
cada vez mayor de investigadores considera que el aprendizaje profundo es un
con la técnica de aprendizaje por transferencia.
método de estudio importante para la detección de emociones mediante EEG.
La Tabla 6 resume la investigación en este campo utilizando métodos de
2. La mayoría de los conjuntos de datos de EEG conocidos se recopilaron
aprendizaje profundo de
utilizando herramientas de provocación visual en entornos de laboratorio.
En estudios anteriores, la condición emocional de los sujetos

123
Machine Translated by Google

12550 Aplicaciones y computación neuronal (2022) 34:12527–12557

Tabla 6 Resumen de los artículos de clasificación de emociones EEG utilizando métodos DL de 2015 a 2021

Referencias Conjunto de datos utilizado Métodos de clasificación Emociones Cuenta (%)

[78] Conjunto de datos propio BiLSTM Positivo, neutral 72,83

y negativo
[192] Conjunto de datos propio DL con RBM Feliz, tranquila, triste, 68,4

y asustado

[80] DEAP DNN 2clase/excitación, Excitación: 61,25 Cenefa: 62,50

2clase/Valencia

[81] DEAP LSTM HAHV,HALV, LAHV DEAP:

y SEMILLA y LALV, 4 clases: 82.01

2clase/excitación, y Excitación: 85,21 Cenefa: 84,16

2clase/Valencia SEMILLA: 90.81

Positivo, neutral y

negativo
[82] SEMILLA SRU Positivo, neutral y 80.02

negativo
[193] Conjunto de datos propio LSTM Feliz, miedo, ira, tristeza, 87,25

Sorpresa y disgusto
[194] DEAP y SOÑADOR RACNN 2clase/excitación, DEAP:

2clase/Valencia Excitación: 97,11 Valencia: 96,65

SOÑADOR:

Excitación: 97,01 Valencia: 95,55

[83] DEAP, SOÑADOR, CNN?SVM 2clase/excitación, DEAP:

SEMILLA y AMIGOS. 2clase/Valencia Excitación: 77,7 y Valencia: 76,6

Positivo y negativo SOÑADOR:

Excitación: 90,4 y Valencia: 88,2

AMIGOS:

Excitación: 90,5 y Valencia: 78,4

SEMILLA: 88,5

[84] Conjunto de datos propio, DEAP LSTM Asco, tristeza, sorpresa. DEAP: 91.38 SEMILLA: 89.34

y SEMILLA y la ira Conjunto de datos propio

Positivo negativo, 4 clase: 94,12

y neutral 3 clase: 92,66

[195] DEAP BiDCNN 2 clases/Excitación, Dependiente del sujeto


2 clase/Valencia Excitación: 94,72 Valencia: 94,38

Independiente del sujeto


Excitación: 63,94 Valencia: 68,14

[196] DEAP LSTM 2 clases/Excitación, Excitación: 85,65 Gusto: 87,99


2 clase/Valencia, Valencia: 85,45

2 clase/gusto
[66] DEAP LSTM fusionado 2clase/excitación, Excitación 83,85 Valencia 84,89

2clase/Valencia, Agrado 80,72 Dominio 84,37

2 clase/gusto
2 clase/Dominancia

[79] Conjunto de datos propio BiLSTM Neutral, triste, miedo y 84.21

Feliz
[85] SEMILLA y DGCNN Positivo, neutral y SEMILLA:

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12551

Tabla 6 (continuación)

Referencias Conjunto de datos utilizado Métodos de clasificación Emociones Cuenta


SOÑADOR negativas (%) 90,40

2clase/Excitación, SOÑADOR:

2clase/Valencia, Excitación 84,54 Valencia 86,23

2 clase/Dominancia Dominio 85.02

[86] SEMILLA DECNN Positivo y negativo 2clase/ 97,56

[197] DEAP 3D­CNN Excitación, Excitación 88,49 Valencia 87,44

2clase/Valencia

Máquina de Boltzmann restringida (RBM), unidades recurrentes simples (SRU), red neuronal convolucional asimétrica regional (RACNN), red neuronal convolucional de discrepancia
bihemisférica (BiDCNN), red bidireccional de memoria a corto plazo (BiLSTM), dinámica
Red neuronal convolucional gráfica (DGCNN), red neuronal convolucional empírica dinámica (DECNN)

antes de que se realizaran los experimentos no se consideró. Estas las dimensiones de valencia y excitación al mismo tiempo y luego
diferencias individuales pueden causar utilizar métodos de agrupación de datos para encontrar las clases
conjuntos de datos sean inconsistentes. reales de emoción.
3. Muchos estudios sólo consideraron una clasificación binaria de cada 2. Los componentes del sistema BCI basado en EEG, como la extracción
dimensión de la emoción. y selección de características, están en continua evolución.
4. En muchos estudios de reconocimiento de emociones, los investigadores Deberían basarse en una comprensión profunda de la fisiología y
examinaron los datos del EEG bajo diferentes estados emocionales la biología del cerebro. La creación de características distintivas
y descuidaron los datos del EEG de referencia (espontáneos). tiene el potencial de mejorar drásticamente los resultados de los
5. No se encontró en la literatura la detección de emociones mixtas sistemas de detección de emociones. Por ejemplo, las características
mediante EEG, como sentimientos agridulces, que integran del dominio del tiempo se mezclan con la frecuencia, las
influencias positivas y negativas percibidas al mismo tiempo. Las características de tiempo­frecuencia y la ubicación del canal.
investigaciones para mejorar el desempeño creativo están ligadas a
estas emociones mixtas, por lo que son interesantes [198]. 3. Se deben crear modelos emocionales con más dimensiones
desarrollado. Actualmente, el modelo de emoción bidimensional se
utiliza ampliamente. El reconocimiento de emociones de múltiples
Además de los puntos anteriores, en trabajos futuros se considerará lo
siguiente. clases requiere el desarrollo de modelos de emociones de
dimensiones superiores. Por ejemplo, el análisis acumulado de la
1. Tradicionalmente, las clases de emociones reales se han etiquetado información contextual del sujeto puede predecir la dimensión de la
en función de un umbral de datos de calificación subjetiva "postura" en un modelo de emoción tridimensional (es decir,
predeterminado. Desafortunadamente, es difícil determinar el umbral excitación, postura y valencia).
adecuado. Un enfoque novedoso es considerar 4. Deben desarrollarse enfoques avanzados de aprendizaje automático,
como técnicas de aprendizaje automático profundas y transferibles.
Las emociones son un reflejo de procesos cognitivos vinculados a la
comprensión biológica y a sucesos psicofisiológicos, y su creación
es un procedimiento subjetivo y difícil. Como resultado, proponer un
método de reconocimiento basado únicamente en métodos clásicos
de ML es problemático.

5. Para monitorear las fluctuaciones emocionales temporales en tiempo


real, los enfoques tradicionales de análisis de series de tiempo deben
integrarse con técnicas de aprendizaje automático [55, 199­203].

6. La mayoría de las técnicas de ingeniería para el reconocimiento de


emociones muestran que la categorización de la excitación suele ser
más precisa que la distinción de valencia. Lo racional
porque esto podría ser que los cambios en el nivel de excitación estén
Fig. 16 Diferentes métodos de aprendizaje profundo utilizados en el reconocimiento de directamente relacionados con las actividades del sistema nervioso autónomo (p. ej.,
emociones EEG abordados en esta revisión

123
Machine Translated by Google

12552 Aplicaciones y computación neuronal (2022) 34:12527–12557

conductividad de la piel y presión arterial) que son fáciles de medir, Financiamiento Financiamiento de acceso abierto proporcionado por la Autoridad de

mientras que la distinción del nivel de valencia requiere un análisis Financiamiento de Ciencia, Tecnología e Innovación (STDF) en cooperación con el
Banco Egipcio de Conocimiento (EKB).
factorial de las reacciones del ANS que están asociadas de forma
cruzada. Como resultado, necesitaremos crear un marco de
categorización específico de las emociones y extraer una variedad Declaraciones
de características relevantes para la valencia de los datos del EEG
en una variedad de dominios de análisis (p. ej., tiempo­frecuencia, Conflictos de intereses Los autores han declarado que no existen conflictos de
intereses. Intereses en competencia no financieros.
frecuencia, tiempo, entropía y multiescala). entropía).

Participantes humanos o animales Este artículo no contiene ningún estudio con


7. Necesitamos crear más conjuntos de datos que empleen técnicas de participantes humanos o animales realizados por ninguno de los autores.
obtención activa, como los videojuegos, porque imitan mejor las
experiencias de la "vida real" y son más eficaces para inducir
Declaración del autor de CRediT Essam H. Houssein participó en la supervisión,
emociones. metodología, conceptualización, análisis formal, visualización y redacción, revisión y
edición. Asmaa Hammad participó en el análisis formal, la visualización, los recursos,
la curación de datos y la redacción (borrador original). Abdelmgeid A. Ali participó en
la supervisión, metodología y redacción: revisión y edición. Todos los autores leyeron
7. Conclusión y aprobaron el artículo final.

El reconocimiento de emociones ha ganado importancia en el campo de


Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons
la HCI a medida que mejoran las tecnologías para los sistemas hombre­ Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción
máquina y la automatización. En los últimos años, el reconocimiento de en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los
autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons
emociones BCI basado en EEG ha recibido una atención cada vez mayor
e indique si se realizaron cambios. Las imágenes u otro material de terceros en este
en el campo de la informática afectiva. Se han llevado a cabo numerosos
artículo están incluidos en la licencia Creative Commons del artículo, a menos que se
estudios de investigación debido a avances significativos en la creación indique lo contrario en una línea de crédito al material. Si el material no está incluido
de dispositivos BCI asequibles y fáciles de usar. Examinamos más de en la licencia Creative Commons del artículo y su uso previsto no está permitido por la
normativa legal o excede el uso permitido, deberá obtener permiso directamente del
195 publicaciones para esta revisión. Cubrimos enfoques de identificación
titular de los derechos de autor. Para ver una copia de esta licencia, visite http://
de emociones EEG de última generación desarrollados en los últimos
creativecommons. org/licenses/by/4.0/.
años (2015 a 2021). También consideramos conjuntos de datos existentes
y describimos los componentes principales del proceso de detección de
emociones que utiliza BCI basado en EEG. Las señales de EEG son
datos confiables que no se pueden falsificar ni simular. EEG reacciona a
los cambios emocionales en tiempo real. Los siguientes procesos
Referencias
computacionales comprenden la metodología general para el
1. Mudgal SK, Sharma SK, Chaturvedi J, Sharma A (2020) Avance de la interfaz
reconocimiento de emociones BCI basado en EEG: recopilación de datos,
cerebro­computadora en neurociencias: aplicaciones y problemas. Neurocirugía
preprocesamiento, extracción de características, selección de Interdisciplinaria 20:100694
características o reducción de dimensionalidad, clasificación y evaluación 2. Wolpaw JR, Birbaumer N, McFarland DJ, Pfurtscheller G, Vaughan TM (2002)
Interfaces cerebro­computadora para comunicación y control. Clin Neurophysiol
del desempeño. En nuestra revisión, nos centramos en varias técnicas
113(6):767–791 3. Abdulkader SN, Atia A, Mostafa M­SM (2015)
de preprocesamiento, extracción de características y selección de
Interfaz cerebro­computadora: aplicaciones y desafíos. Egypt Inf J 16(2):213–230
características/reducción de dimensionalidad. 4. Jerry JS, Dean JK, Jonathan RW (2012) Interfaces cerebro­computadora en
Además, revisamos varias técnicas de clasificación de aprendizaje medicina. En
Procedimientos de Mayo Clinic, volumen 87.
profundo y automático y métricas de rendimiento de uso común. Investigar
la relación entre las señales cerebrales y las emociones es una tarea
Elsevier, págs. 268–279 5.
difícil, como se muestra en esta revisión, y constantemente se desarrollan Khosla A, Khandnor P, Chand T (2020) Un análisis comparativo de métodos de
nuevas metodologías e implementaciones. Se espera que muchos de clasificación y procesamiento de señales para diferentes aplicaciones basadas
en señales eeg. Biocybern Biomed Eng 40(2):649–690 6. Jiang W, Mei W (2021)
los desafíos actuales se resuelvan pronto, allanando el camino para una
Revisión de la
amplia gama de aplicaciones potenciales basadas en la identificación de
extracción y clasificación de características emocionales mediante señales de eeg.
emociones basada en EEG. Se pretende que esta revisión proporcione a Robótica cognitiva
los investigadores, particularmente a aquellos que recién comienzan en
7. Mamunur R, Norizam S, Anwar PPAM, Rabiu MM, Bifta SB, Sabira K et al (2020)
el campo, una idea del estado actual de la investigación sobre el
Estado actual, desafíos y posibles soluciones de la interfaz cerebro­computadora
reconocimiento y la categorización de las características del EEG de
basada en EEG: una revisión integral. Neurorob frontal 14:25
orientación emocional.
8. Zhang J, Yin Z, Chen P, Nichele S (2020) Reconocimiento de emociones
mediante datos multimodales y técnicas de aprendizaje automático: tutorial y
revisión. Informar a Fusion 59:103–126

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12553

9. Calvo RA, D'Mello S (2010) Detección de afectos: una revisión interdisciplinaria 37. Lang PJ, Bradley MM, Cuthbert BN et al (1997) Sistema internacional de
de modelos, métodos y sus aplicaciones. Computación de efectos trans IEEE 1 imágenes afectivas (iaps): manual técnico y calificaciones afectivas. Estudio del
(1): 18–37 Centro NIMH Emot Attent 1(39–58):3 38. Bradley MM, Lang PJ
10. Valery P (1999) Emoción en el habla: reconocimiento y aplicación a los call (1994) Medición de la emoción: el maniquí de autoevaluación y el diferencial
center. En: Actas de redes neuronales artificiales en ingeniería, volumen 710, semántico. J Behav Ther Exp Psychiatry 25(1):49–59 39. Zhou F, Xingda Q,
p. 22 11. Keith A, McOwan PW (2006) Jiao J, Helander MG (2014)
Un sistema automatizado en tiempo real para el reconocimiento de expresiones Predicción de emociones a partir de señales fisiológicas: un estudio de comparación
faciales humanas. IEEE Trans Syst Man Cybernet B (Cibernética) 36(1):96–105 entre elicitores visuales y auditivos. Interact Comput 26(3):285–302 40. Yin Z,
Zhang J (2018) Reconocimiento de fatiga mental genérico de tareas basado
12. Yin Z, Zhao M, Wang Y, Yang J, Zhang J (2017) Reconocimiento de emociones en señales neurofisiológicas y una máquina dinámica de aprendizaje extremo
mediante señales fisiológicas multimodales y un modelo de aprendizaje profundo profundo. Neurocomputación 283:266–281 41. Berger H (1929) U¨ ber das
conjunto. Programas de métodos informáticos Biomed 140:93–110 elektroenkephalogramm des men­schen. Arch Psychiatr Nervenkr
87(1):527–570 42. Teplan M et al (2002) Fundamentos de la medición de eeg.
13. Torres EP, Torres EA, Hernández­Álvarez M, Yoo SG (2020)
Reconocimiento de emociones bci basado en Eeg: una encuesta. Sensores
20(18):5083 Measure Sci Rev 2(2):1–11 43.
14. He Z, Li Z, Yang F, Wang L, Li J, Zhou C, Pan J (2020) Zhao G, Zhang Y, Ge Y (2018) Asimetría frontal del eeg y diferencia de poder de la
Avances en el reconocimiento de emociones multimodal basado en interfaces línea media en emociones discretas. Front Behav Neurosci 12:225 44. Zheng
cerebro­computadora. Brain Sci 10(10):687 15. WL, Bao­Liang L
Xiaowei L, Bin H, Tingshao Z, Jingzhi Y, Fang Z (2009) (2015) Investigación de bandas y canales de frecuencia críticos para el
Hacia el aprendizaje afectivo con un enfoque de retroalimentación eeg. En: reconocimiento de emociones basado en EEG con redes neuronales profundas.
Actas del primer taller internacional de ACM sobre tecnologías multimedia para IEEE Trans Auton Ment Dev 7(3):162–175 45. Ekman P, Davidson RJ (1993)
el aprendizaje a distancia, págs. 33–38 16. Mauss IB, Robinson La sonrisa
MD (2009) Medidas de emoción: una revisión. voluntaria cambia la actividad cerebral regional. Psychol Sci 4(5):342–345 46. Li P,
Cogn Emot 23(2):209–237 17. Liu H, Si Y, Li C, Li F, Zhu X, Huang X, Zeng Y, Yao D, Zhang
Naji M, Firoozabadi M, Azadfallah P (2015) Clasificación de emociones durante la Y et al (2019) Reconocimiento de emociones basado en Eeg combinando
escucha de música a partir de bioseñales de la frente. SIViP 9(6):1365–1375 conectividad funcional de red y activaciones locales.
18. Paul E (1992)
¿Existen emociones básicas? Psychol Rev 19. Russell JA (1980) Un IEEE Trans Biomed Eng 66(10):2869–2881
modelo circumplejo de afecto. J Pers Soc Psychol 39(6):1161 47. Bhatti AM, Majid M, Anwar SM, Khan B (2016) Reconocimiento y análisis de
emociones humanas en respuesta a música de audio utilizando señales
20. Charles D (2015) La expresión de las emociones en el hombre y los animales. cerebrales. Comput Hum Behav 65:267–275 48. Lee YY, Hsieh S
University of Chicago Press, Chicago 21. Silvan T (1962) (2014) Clasificación de diferentes estados emocionales mediante patrones de
Conciencia de las imágenes del afecto: Volumen I: Los afectos positivos. Editorial conectividad funcional basados en eeg. PLoS ONE 9(4):e95415 49. Peterson
Springer 22. Ekman P, Oster H (1979) Expresiones V, Galva´n C, Herna
faciales de emoción. Annu Rev Psychol 30(1):527–554 23. Gray JA (1985) Un todo ´ndez H, Spies R (2020) Un estudio de viabilidad de un sistema completo de interfaz
y sus partes: comportamiento, cerebro­computadora de bajo costo y apto para el consumidor. Heliyon
cerebro, cognición y emoción. Bull British Psychol Soc 24. Mowrer O (1960) Teoría 6(3):e03425 50. Wang Y, Jung TP (2012) Mejora de las
del aprendizaje y comportamiento. Asociación Estadounidense interfaces cerebro­computadora mediante análisis de componentes independientes.
de Psicología, Washington 25. Watson JB, Kimble GA (2017) Conductismo. Rouledge, En: Hacia interfaces prácticas cerebro­computadora. Springer, págs. 67–83 51.
Ofner P, Müller­Putz GR (2015) Decodificación de objetivos
de movimiento a partir de eeg y las fuentes discriminativas correspondientes: un
Londres estudio preliminar. En: 2015 37ª Conferencia Internacional Anual de la
26. Gurney E (1884) ¿Qué es una emoción? Mind 9(35):421–426 27. Panksepp Sociedad de Ingeniería en Medicina y Biología (EMBC) del IEEE. IEEE, págs.
J (1982) Hacia una teoría psicobiológica general de las emociones. Comportamiento 1468–1471 52. Alhaddad MJ, Kamel M, Malibary H, Thabit K, Dahlwi F, Hadi A
Cerebro Ciencia 5 (3): 407–422 (2012) Eficiencia ortográfica P300 con
28. Weiner B, Sarah G (1984) Un enfoque atribucional para el desarrollo emocional. referencia promedio común. En: Congreso internacional sobre sistemas autónomos
Emot Cognit Behav 167–191 29. Arnold MB (1960) Emoción y e inteligentes. Springer, págs. 234–241 53. Li X, Fan H, Wang H, Wang L
personalidad. psiquiatra americano (2019) Patrones espaciales comunes combinados con información de
Asociación de psicología, Washington sincronización de fase para la
30. Johnson­Laird PN, Oatley K (1989) El lenguaje de las emociones: un análisis de clasificación de señales eeg. Control de procesos de señales biomédicas 52:248–256
un campo semántico. Cogn Emot 3(2):81–123 31. Frijda NH et al (1986)
Las emociones. Cambridge University Press, Cambridge 32. Izard Carroll E (2013)
Emociones humanas.
Springer, Nueva York 33. McDougall William (2015) Una introducción a la psicología 54. Koelstra S, Muhl C, Soleymani M, Lee JS, Yazdani A, Ebra­himi T, Pun T, Nijholt
social A, Patras I (2011) Deap: una base de datos para el análisis de emociones;
ogía. Prensa de Psicología, Londres utilizando señales fisiológicas. IEEE Trans Affect Comput 3(1):18–31 55.
34. Whissell CM (1989) El diccionario del afecto en el lenguaje. En: La medición de Atkinson J, Campos D (2016)
las emociones. Elsevier, págs. 113­131 35. Schlosberg H (1954) Mejora del reconocimiento de emociones basado en bci combinando la selección de
Tres dimensiones de la emoción. Psicólogo Rev características de eeg y clasificadores de kernel. Expert Syst Appl 47:35–41 56.
61(2):81 Chen J, Bin H, Moore P, Zhang X, Ma X (2015)
36. Yang W, Makita K, Nakao T, Kanayama N, Machizawa MG, Sasaoka T, Sugata Sistema de evaluación de emociones basado en electroencefalograma que utiliza
A, Kobayashi R, Hiramoto R, Yamawaki S et al (2018) Base de datos de técnicas de ontología y minería de datos. Computación suave de aplicaciones
estímulos auditivos afectivos: una versión ampliada de los sonidos afectivos 30:663–674
digitalizados internacionales (iads­e).
Métodos de resolución de comportamiento 50 (4): 1415–1429

123
Machine Translated by Google

12554 Aplicaciones y computación neuronal (2022) 34:12527–12557

57. O¨ zerdem MS, Polat H (2017) Reconocimiento de emociones basado en 77. Pane ES, Wibawa AD, Purnomo MH (2019) Mejora de la precisión del
funciones eeg en clips de películas con selección de canales. Brain informatics reconocimiento de emociones eeg combinando la lateralización de valencia y el
4(4):241–252 aprendizaje conjunto con parámetros de sintonización.
58. Mert A, Akan A (2018) Reconocimiento de emociones basado en la distribución Cogn Process 20(4):405–417 78.
tiempo­frecuencia de señales eeg mediante transformación de sincronización Joshi VM, Ghongade RB (2020) Idea: base de datos de intelecto para el análisis de
multivariada. Proceso de señal de dígitos 81:106–115 59. Kumar N, emociones utilizando señales de eeg. J King Saud Univ­Comput Inform Sci
Khaund K, Hazarika SM (2016) Análisis biespectral de eeg para el reconocimiento de
emociones. Procedia Comput Sci 84:31–35 60. Hyva¨rinen A, Oja E (2000) 79. Yang J, Huang X, Hongkai W, Yang X (2020) Clasificación de emociones basada
Análisis de componentes independientes: algoritmos y aplicaciones. Neural Netw en EEG basada en una red bidireccional de memoria a corto plazo. Procedia
13(4–5):411–430 61. Papadelis C, Chen Z, Kourtidou­Papadeli C, Bamidis Comput Sci 174:491–504 80. Pandey P, Seeja KR (2019)
PD, Chouvarda I, Bekiaris E, Maglaveras N (2007) Monitoreo de la somnolencia con Reconocimiento de emociones independiente del sujeto a partir de eeg mediante
registros electrofisiológicos integrados para prevenir el sueño ­Accidentes de vmd y aprendizaje profundo. J King Saud Univ­Comput Inform Sci 81. Sharma
tráfico privados. Clin Neurophysiol 118(9):1906–1922 62. Asadi Ghanbari A, R, Pachori RB, Sircar P (2020)
Nazari Kousarrizi MR, Teshnehlab M, Ali­yari M (2009) Un método evolutivo de Reconocimiento automatizado de emociones basado en estadísticas de orden
rechazo de artefactos superior y algoritmo de aprendizaje profundo. Biomed Signal Process Control
para la interfaz cerebro­computadora utilizando ica. Int J Electr Comput Sci 9 (9): 58:101867 82. Wei C, Chen L, Song Z, Lou X, Li D (2020)
48–53 Reconocimiento de emociones basado en EEG utilizando una red de unidades
recurrentes simples y aprendizaje en conjunto. Biomed Signal Process Control
58:101756 83. Tema A, Russo M (2021) Reconocimiento de
63. Iacoviello D, Petracca A, Spezialetti M, Placidi G (2015) Un algoritmo de emociones basado en mapas de características de eeg a través de una red de
clasificación en tiempo real para bci basado en eeg impulsado por emociones aprendizaje profundo. Int J Eng Ciencia y Tecnología
autoinducidas. Programas de métodos informáticos Biomed 122 (3): 293–303
84. Sakalle A, Tomar P, Bhardwaj H, Acharya D, Bhardwaj A (2021) Red de
64. Alakus TB, Gonen M, Turkoglu I (2020) Base de datos para un sistema de aprendizaje profundo basada en lstm para reconocer emociones mediante un
reconocimiento de emociones basado en señales eeg y varios juegos de sistema inalámbrico impulsado por ondas cerebrales. Expert Syst Appl
computadora­gameemo. Control de procesos de señales biomédicas 60:101951 173:114516 85. Song
T, Zheng W, Song P, Cui Z (2018) Reconocimiento de emociones por Eeg mediante
65. Li M, Hongpei X, Liu X, Shengfu L (2018) Reconocimiento de emociones a partir redes neuronales convolucionales de gráficos dinámicos.
de señales eeg multicanal utilizando la clasificación de k­vecino más cercano. Computación de efecto trans IEEE 11 (3): 532–541
Technol Health Care 26(S1):509–519 66. Garg A, Kapoor 86. Liu S, Wang X, Zhao L, Zhao J, Xin Q, Wang S (2020) Reconocimiento de
A, Bedi AK, Sunkaria RK (2019) Modelo lstm combinado para la clasificación de emociones independiente del sujeto de señales eeg basado en una red neuronal
emociones mediante señales eeg. En: 2019 Conferencia internacional sobre convolucional empírica dinámica. IEEE/ACM Trans Comput Biol Bioinform 87.
ciencia e ingeniería de datos (ICDSE). IEEE, págs. 139–143 67. Zheng WL, Zhu Hjorth B (1970) Análisis de Eeg basado
JY, Bao­Liang L (2017) Identificación en propiedades en el dominio del tiempo.
de patrones estables a lo largo del tiempo para el reconocimiento de emociones a Electroencephalogr Clin Neurophysiol 29(3):306–310 88.
partir de eeg. Petrantonakis PC, Hadjileontiadis LJ (2009) Reconocimiento de emociones a partir
Computación de efecto trans IEEE 10 (3): 417–429 de eeg utilizando cruces de orden superior. IEEE Trans Inf Technol Biomed
68. Qing C, Qiao R, Xiangmin X, Cheng Y (2019) Reconocimiento de emociones 14(2):186–197
interpretables mediante señales de eeg. Acceso IEEE 7:94160–94170 89. Petrantonakis PC, Hadjileontiadis LJ (2010) Reconocimiento de emociones a
partir de señales cerebrales mediante filtrado adaptativo híbrido y análisis de
69. Gupta R, Falk TH et al (2016) Fusión de decisión del clasificador de vectores de cruces de orden superior. IEEE Trans Affect Comput 1(2):81–97 90. Shaw L,
relevancia y características teóricas de gráficos eeg para la caracterización Routray A (2016) Extracción de características estadísticas para el análisis de
automática del estado afectivo. Neurocomputación 174:875–884 70. Arnau­ patrones multivariados en meditación eeg utilizando pca. En: Conferencia
Gonza´lez P, Arevalillo­Herra´ez M, Ramzan N (2017) Internacional de Estudiantes (ISC) IEEE EMBS 2016.
Fusionando características de conectividad y energía altamente dimensionales IEEE, págs. 1–4
para identificar estados afectivos a partir de señales de EEG. Neurocomputación 91. Liu Y, Sourina O (2014) Algoritmo de reconocimiento de emociones dependiente
244:81–89 del sujeto basado en Eeg que utiliza dimensión fractal. En: Conferencia
71. Chen T, Sihang J, Ren F, Fan M, Yu G (2020) Modelo de reconocimiento de internacional IEEE de 2014 sobre sistemas, hombre y cibernética (SMC). IEEE,
emociones Eeg basado en el clasificador libsvm. Medida 164:108047 págs. 3166–3171 92. Yuen CT, San
San W, Seong TC, Rizon M (2009) Clasificación de las emociones humanas a partir
72. Yin Z, Liu L, Chen J, Zhao B, Wang Y (2020) Selección de características de eeg de señales de eeg utilizando características estadísticas y redes neuronales. Int
localmente robusta para el reconocimiento de emociones independiente del J Integrat Eng 1(3)
individuo. Solicitud de sistema experto 162:113768 93. Murugappan M, Subbulakshmi M (2013) Reconocimiento de emociones humanas
73. Chakladar DD, Chakraborty S (2018) Clasificación de emociones basada en Eeg a través de señales de electroencefalograma (eeg) de corta duración utilizando
mediante selección de subconjuntos basada en correlación. Biol Inspired Cognit transformada rápida de Fourier (fft). En: 2013 9º coloquio internacional del IEEE
Architec 24:98–106 74. Salankar sobre procesamiento de señales y sus aplicaciones.
N, Mishra P, Garg L (2021) Reconocimiento de emociones a partir de señales de eeg IEEE, págs. 289–294
mediante descomposición de modo empírico y gráfico de diferencias de 94. Yoon HJ, Chung SY (2013) Estimación de emociones basada en Eeg utilizando
segundo orden. Control de procesos de señales biomédicas 65:102389 75. la función logarítmica posterior ponderada bayesiana y el algoritmo de
Huang C (2021) Reconocimiento de emociones psicológicas mediante características convergencia del perceptrón. Comput Biol Med 43(12):2230–2237 95.
de eeg. Análisis del modelo de red Informe de salud Bioinform 10(1):1–11 Shi LC, Jiao YY, Lu BL (2013) Característica de entropía diferencial para la estimación
de vigilancia basada en eeg. En: 2013 35ª Conferencia Internacional Anual de
76. Subasi A, Tuncer T, Dogan S, Tanko D, Sakoglu U (2021) Reconocimiento de la Sociedad de Ingeniería en Medicina y Biología (EMBC) del IEEE. IEEE, págs.
emociones basado en Eeg utilizando transformada q wavelet sintonizable y 6627–6630
clasificador de conjunto de bosque de rotación. Control de procesos de señales
biomédicas 68:102648

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12555

96. Subasi A (2007) Clasificación de señales Eeg mediante extracción de características 117. Kohavi R, John GH (1997) Envoltorios para la selección de subconjuntos de funciones.
wavelet y una combinación de modelos expertos. Expert Syst Appl 32(4):1084–1093 ción. Artif Intell 97(1–2):273–324
97. Li Y, Yingle F, Gu 118. Sabeti M, Boostani R, Katebi SD, Price GW (2007) Selección de características
L, Qinye T (2009) Clasificación de las etapas del sueño basada en la transformada eeg de relevantes para la clasificación de señales de EEG de pacientes esquizofrénicos.
Hilbert­Huang. En: 2009 4ª conferencia IEEE sobre aplicaciones y electrónica Control de procesos de señales biomédicas 2(2):122–134
industrial. IEEE, págs. 3676–3681 98. Ting W, Guo­Zheng Y, Bang­Hua Y, Hong S 119. John GH, Kohavi R, Pfleger K (1994) Características irrelevantes y el problema de
(2008) Extracción selección de subconjuntos. En: Procedimientos de aprendizaje automático.
de características de Eeg basada en la descomposición de paquetes wavelet para la Elsevier, págs. 121­129
interfaz cerebro­computadora. Medición 41(6):618–625 99. Houssein EH, Hamad A, 120. Langley P et al (1994) Selección de características relevantes en el aprendizaje
Hassanien AE, Fahmy AA (2019) automático. En: Actas del simposio de otoño de la AAAI sobre relevancia 184:245–
271

Detección epiléptica basada en una máquina de vectores de soporte mejorada con 121. Battiti R (1994) Uso de información mutua para seleccionar características en el
optimización de ballenas. J Inf Optim Sci 40(3):699–723 100. Guido aprendizaje de redes neuronales supervisadas. IEEE Trans Neural Networks 5(4):537–
RC (2018) Una revisión del tutorial sobre la extracción de características artesanales 550 122. Peng H,
basada en entropía para la fusión de información. Inform Fusion 41:161–175 101. Long F, Ding C (2005) Selección de funciones basada en criterios de información mutua de
Vijith VS, Elsa máxima dependencia, máxima relevancia y redundancia mínima. IEEE Trans Pattern
Jacob J, Iype T, K Gopakumar, George Yohannan D (2016) Detección de ataques epilépticos Anal Mach Intell 27(8):1226–1238 123. Reunanen J (2003) Sobreajuste al realizar
mediante análisis no lineal de eeg. En: Conferencia internacional de 2016 sobre comparaciones entre
tecnologías de computación inventivas (ICICT), vol 3. IEEE, págs. 1–6 102. Zhang C, métodos de selección de variables. J Mach Learn Res 3:1371–1382
Wang H, Rongrong F (2013) Detección automatizada de la fatiga del
conductor basada en medidas de entropía y complejidad. IEEE Trans Intell Transp Syst 124. Pudil P, Novovicˇova´ J, Kittler J (1994) Métodos de búsqueda flotante en la selección
15(1):168–177 103. Nicolaou N, Georgiou J (2012) Detección de electroencefalograma de características. Pattern Recogn Lett 15(11):1119–1125 125. Talbi EG (2009)
epiléptico basado en entropía de permutación y Metaheurísticas: del diseño a la implementación, vol 74. Wiley, Hoboken 126. Fister Jr I,
máquinas de vectores de soporte. Expert Syst Appl 39(1):202–209 104. Pincus SM (1991) Yang XS, Fister I, Brest J, Fister D
Entropía aproximada como medida de la complejidad del sistema. Proc Natl Acad Sci (2013) Una breve revisión de algoritmos de optimización inspirados en la naturaleza.
88(6):2297–2301 105. Zhang A, Yang B, Huang L (2008) Extracción preimpresión de arXiv arXiv:1307.4186 127. Zawbaa HM, Emary E, Parv B (2015)
de características de señales eeg utilizando entropía espectral de potencia. En: Conferencia Selección de funciones basada
internacional de 2008 sobre ingeniería biomédica e informática, vol en el algoritmo de optimización de la hormiga león. En 2015 Tercera conferencia mundial
2. sobre sistemas complejos (WCCS). IEEE, págs. 1–7 128. Emary E, Zawbaa HM,
Hassanien AE (2016) Enfoques de optimización del lobo gris binario
para la selección de características. Neurocomputing 172:371–381 129. Mistry K, Zhang L,
IEEE, págs. 435–439 Neoh SC, Lim CP, Fielding B (2016) Un enfoque de selección de funciones pso
106. Richman JS, Randall Moorman J (2000) Análisis fisiológico de series temporales integradas en

utilizando entropía aproximada y entropía de muestra. micro­ga para el reconocimiento inteligente de emociones faciales. IEEE Trans Cybern
Am J Physiol­Heart Circulat Physiol 278(6):H2039–H2049 107. Lotte F, Congedo 47(6):1496–1509 130. Baig MZ, Aslam N, Shum HPH, Zhang L (2017) Algoritmo de
M, Le´cuyer A, Lamarche F, Arnaldi B (2007) evolución diferencial como herramienta para la selección óptima de subconjuntos de
Una revisión de los algoritmos de clasificación para interfaces cerebro­computadora características en
basadas en EEG. J Neural Eng 4(2):R1 108. imágenes motoras, por ejemplo. Expert Syst Appl 90:184–195 131. Kim KH, Bang SW, Kim
Ayyagari SSDP, Jones RD, Weddell SJ (2021) Detección de estados de microsueño a partir SR (2004) Sistema de reconocimiento de emociones que utiliza monitoreo a corto
del eeg: una comparación de métodos de reducción de características. Med Biol Eng plazo de señales fisiológicas. Med Biol Eng Compu 42(3):419–427 132.
Comput 1–15 109. Fukunaga K (2013) Introducción al Ilyas MZ, Saad P, Ahmad MI (2015) Un estudio sobre el análisis y la clasificación de señales
reconocimiento de patrones estadísticos. Elsevier, Ámsterdam 110. Liu J, Meng H, Li M, EEG para interfaces cerebro­computadora. En 2015 2do Congreso Internacional de
Zhang F, Qin R, Nandi AK (2018) Ingeniería Biomédica (ICoBE). IEEE,
págs. 1–6 133. Soleymani M, Lichtenauer J, Pun T, Pantic M (2011) Una base de datos
Detección de emociones a partir de grabaciones de EEG basada en reducción de multimodal para el reconocimiento de afectos y el etiquetado implícito. Computación
dimensiones supervisada y no supervisada. Computación de concurrencia: Pract Exp de efectos trans IEEE 3 (1): 42–55
30(23):e4446 111.
Doma V, Pirouz M (2020) Un análisis comparativo de métodos de aprendizaje automático
para el reconocimiento de emociones utilizando eeg y señales fisiológicas periféricas.
J Big Data 7(1):1–21 112. Abdulhamit Subasi M, Gursoy I (2010)
Clasificación de señales Eeg utilizando pca, ica, lda y máquinas de vectores de soporte. 134. Ruo­Nan Duan, Jia­Yi Zhu, Bao­Liang Lu (2013) Característica de entropía diferencial
Expert Syst Appl 37(12):8659–8666 113. Widodo A, Yang BS (2007) Aplicación de para la clasificación de emociones basada en eeg. En 2013, sexta Conferencia
máquinas de vectores de Internacional IEEE/EMBS sobre Ingeniería Neural (NER). IEEE, págs. 81–84 135.
soporte y extracción de características no lineales para el diagnóstico de fallas de motores Katsigiannis S, Ramzan N
de inducción. Expert Syst Appl 33(1):241–250 114. Mafarja M, Mirjalili S (2018) (2017) Dreamer: una base de datos para el reconocimiento de emociones a través de
Enfoques de optimización de ballenas para la selección de funciones señales de eeg y ecg desde dispositivos inalámbricos de bajo costo disponibles en el
de envoltura. Appl Soft Comput 62:441–453 115. Cabrera AF, Farina D, Dremstrup K (2010) mercado. IEEE J Biomed Health Inform 22(1):98–107 136. Miranda Correa JA,

Comparación de métodos de selección y clasificación de características para una Khomami Abadi


interfaz cerebro­computadora impulsada por imágenes no motoras. Med Biol Eng Comput M, Sebe N, Patras I (2018)
48(2):123–132 116. Koprinska I (2009) Selección de funciones para interfaces Amigos: un conjunto de datos para la investigación del afecto, la personalidad y el
cerebro­computadora. En: Conferencia de Asia Pacífico sobre descubrimiento de estado de ánimo en individuos y grupos. IEEE Trans Affect Comput
conocimientos y minería de 137. Lan Z, Liu Y, Sourina O, Wang L, Scherer R, Müller­Putz G (2020) Safe: Un conjunto
datos. Springer, págs. 106­117 de datos eeg para una selección de características afectivas estables.
Informe de ingeniería avanzada 44:101047

123
Machine Translated by Google

12556 Aplicaciones y computación neuronal (2022) 34:12527–12557

138. Lv Z, Qiao L, Wang Q, Piccialli F (2020) Métodos avanzados de aprendizaje 160. Tin Kam Ho (1995) Bosques de decisión aleatoria. En Actas de la tercera
automático para la interfaz cerebro­computadora. IEEE/ACM Trans Comput Biol conferencia internacional sobre análisis y reconocimiento de documentos,
Bioinform 139. Drucker H, Donghui W, volumen 1. IEEE, págs. 278–282
Vapnik VN (1999) Máquinas de vectores de soporte para la categorización de spam. 161. Deg˘er Ayata, Yusuf Yaslan, Mustafa Kamas¸ak (2016) Reconocimiento de
IEEE Trans Neural Networks 10(5):1048–1054 140. Kumar S, Singh S, Kumar J emociones a través de un bosque aleatorio y una respuesta galvánica de la piel:
(2018) Detección comparación de conjuntos de características basadas en el tiempo, tamaños de
automática de expresiones faciales en vivo utilizando un algoritmo genético con ventanas y enfoques de ondas. En 2016 Congreso Nacional de Tecnologías
características de haar wavelet y svm. Wireless Pers Commun 103(3):2435– Médicas (TIPTEKNO). IEEE, págs. 1–4 162.
2453 141. Kumar S, Singh S, Kumar J (2019) Detección de múltiples rostros Breiman L (2001) Bosques aleatorios. Mach Learn 45(1):5–32 163. Peterson LE
utilizando funciones híbridas con clasificador svm. En: Redes de datos y comunicaciones. (2009) K­vecino más cercano. Scholarpedia 4(2):1883 164. Pascal Soucy, Guy W
Springer, págs. 253­265 Mineau (2001) Un algoritmo knn simple para la categorización de texto. En: Actas de
la conferencia internacional IEEE de 2001 sobre minería de datos. IEEE, págs.
142. Shi L, Wang X, Shen Y (2020) Investigación sobre el método de reconocimiento 647–648 165. Fatemeh Bahari, Amin Janghorbani (2013)
facial 3D basado en lbp y svm. Optik 220:165157 143. Asuntha Reconocimiento de emociones basado en Eeg mediante análisis de gráficos de
A, Brindha A, Indirani S, Srinivasan A (2016) Detección de cáncer de pulmón mediante recurrencia y clasificador de vecino más cercano k. En 2013, 20ª Conferencia
algoritmo svm y técnicas de optimización. J Chem Pharm Sci 9(4):3198–3203 Iraní sobre Ingeniería Biomédica (ICBME). IEEE, págs. 228–233 166. Sasirekha
144. Dolatabadi AD, Khadem SEZ, Asl BM (2017) K, Thangavel K (2019) Optimización del vecino k más
Diagnóstico automatizado de pacientes con enfermedad de las arterias coronarias cercano mediante optimización de enjambre de partículas para el reconocimiento facial.
(EC) mediante svm optimizado. Programas de métodos informáticos Biomed
138:117–126 145. Nilashi M, Ahmadi N, Samad S, Shahmoradi L, Ahmadi H, Neural Comput Appl 31(11):7935–7944 167. Wang
Ibrahim O, Asadi S, Abdullah R, Abumalloh RA, Yade­garidehkordi E (2020) Diagnóstico H, Zhang Y et al (2016) Detección de señales de eeg de imágenes motoras empleando
de enfermedades mediante aprendizaje automático Técnicas: revisión y un proceso de aprendizaje ingenuo basado en bayes. Medición 86:148–158
clasificación. Journal of Soft Computing and Decision Support Systems 7(1):19–
30 146. Francis LM, Sreenath N (2020) Detección de texto sin Tedless utilizando 168. M Wiggins, Ashraf Saad, Brian Litt y George Vachtsevanos.
svm de mínimos cuadrados de una escena natural. Journal of Desarrollo de un clasificador bayesiano para la clasificación de edades basada
King Saud University­Computer and Information Sciences 32(3):287–299 147. Lin W, en ECG en aplicaciones médicas. Computación suave aplicada, 8(1):599–608,
Ji D, Yanan L (2017) Reconocimiento de trastornos en textos clínicos utilizando 2008
svm estructurado de etiquetas múltiples. BMC Bioinformática 18(1):1–11 169. Sharmila A, Geethanjali P (2016) Detección basada en Dwt de ataques epilépticos
a partir de señales de EEG utilizando clasificadores ingenuos de bayes y k­nn.
Acceso IEEE 4:7716–7727
170. Dong S, Wang P, Abbas K (2021) Una encuesta sobre el aprendizaje profundo y
148. Hassan AKA, Mahdi BS, Mohammed AA (2019) Reconocimiento de palabras de sus aplicaciones. Revisión de informática 40:100379 171. Iqbal H Sarker.
escritura a mano en árabe basado en transformación de características Aprendizaje profundo: una descripción general completa de técnicas, taxonomía,
invariantes de escala y máquina de vectores de soporte. Iraqi Jf Sci 381– aplicaciones y direcciones de investigación. SN Ciencias de la Computación, 2
387 149. Shalev­Shwartz S, Ben­David S (2014) Comprensión del aprendizaje (6): 1–20, 2021
automático: de la teoría a los algoritmos. Cambridge University Press, Cambridge 172. Fukushima K (1980) Un modelo de red neuronal autoorganizada para un
150. Chen WH, Hsu mecanismo de reconocimiento de patrones que no se ve afectado por el cambio
SH, Shen HP (2005) Aplicación de svm y ann para la detección de intrusiones. de posición. Biol Cybern 36:193–202
Computers & Operations Research 32(10):2617–2634 151. Basheer IA, Hajmeer 173. Hinton GE, Salakhutdinov RR (2006) Reducción de la dimensionalidad de los
M (2000) Redes datos con redes neuronales. ciencia 313 (5786): 504–507
neuronales artificiales: fundamentos, informática, diseño y aplicación. Métodos J
Microbiol 43(1):3–31 174. Yoshua Bengio, Pascal Lamblin, Dan Popovici, Hugo Lar­ochelle (2007)
Entrenamiento codicioso en capas de redes profundas. En Avances en sistemas
152. Fausett LV (2006) Fundamentos de las redes neuronales: arquitecturas, de procesamiento de información neuronal, págs. 153–160 175. Pascal Vincent,
algoritmos y aplicaciones. Pearson Education India 153. Sharma S, Sharma Hugo Larochelle, Isabelle Lajoie, Yoshua Bengio, Pierre­Antoine Manzagol, Le´on
S (2017) Funciones de activación en redes neuronales. Hacia la ciencia de datos Bottou (2010) Autocodificadores de eliminación de ruido apilados: aprendizaje
6(12):310–316 154. Quinlan JR (2014) C4. 5: programas de representaciones útiles en una red profunda con un criterio de eliminación de
para aprendizaje automático. ruido local. Revista de investigación sobre aprendizaje automático, 11 (12)
Elsevier
155. Loh WY (2011) Árboles de clasificación y regresión. Wiley Interdiscip Rev: Data 176. Chamara L, Zhou H, Huang GB, Vong CM (2013) Aprendizaje representacional
Min Knowl Discov 1(1):14–23 156. Bastos NS, Marques BP, con máquina de aprendizaje extremo para big data.
Adamatti DF, Billa CZ (2020) Análisis de señales eeg utilizando árboles de decisión: IEEE Intell Syst 28(6):31–34 177.
un estudio de modulación de amplitud. Computadora Intel Neurociencia Chen M, Weinberger KQ, Zhixiang X, Sha F (2015)
Marginar codificadores automáticos de eliminación de ruido lineales apilados.
157. Rasoul Safavian S, Landgrebe D (1991) Un estudio de la metodología del The Journal of Machine Learning Research 16(1):3849–3875 178. Cao
clasificador de árboles de decisión. IEEE Trans Syst Man Cybern 21(3):660–674 J, Zhao Y, Lai X, Ong MEH, Yin C, Koh ZX, Liu N (2015)
158. Rafik Khairul Reconocimiento de puntos de referencia con clasificación de representación
Amin, Yuliant Sibaroni, et al (2015) Implementación del árbol de decisión utilizando escasa y máquina de aprendizaje extrema. Instituto J. Franklin 352(10):4528–
c4. 5 algoritmo en la toma de decisiones de solicitud de préstamo por parte del 4545
deudor (estudio de caso: Bank pasar de la región especial de yogyakarta). En 179. Cao J, Zhang K, Luo M, Yin C, Lai X (2016) Máquina de aprendizaje extrema y
2015, 3.ª Conferencia Internacional sobre Tecnologías de la Información y la representación dispersa adaptativa para la clasificación de imágenes. Red
Comunicación (ICoTIC), págs. 75–80. IEE 159. Ruggieri S (2002) Eficiente c4. 5 neuronal 81:91–102
[algoritmo de 180. Yang Y, Wu QMJ (2015) Máquina de aprendizaje extremo multicapa con nodos
clasificación]. de subred para aprendizaje de representación. Transacciones IEEE sobre
IEEE Trans Knowl Data Eng 14(2):438–444 cibernética 46(11):2570–2583

123
Machine Translated by Google

Aplicaciones y computación neuronal (2022) 34:12527–12557 12557

181. Zhang J, Wu Y (2018) Clasificación automática de etapas del sueño de y eeg basado en aprendizaje automático y red neuronal profunda
eeg de un solo canal mediante el uso de convolucional de valores complejos métodos. Informática en Medicina desbloqueada 20:100372
red neuronal. Ingeniería Biomédica/Biomedizinische 194. Cui H, Aiping Liu X, Zhang XC, Wang K, Chen X (2020) Reconocimiento de
Técnica 63(2):177–190 emociones basado en Eeg utilizando una red neuronal convolucional asimétrica
182. Jiao Y, Deng Y, Luo Y, Bao­Liang L (2020) Somnolencia del conductor regional de extremo a extremo. Sistema basado en el conocimiento
Detección de señales eeg y eog utilizando redes gan y lstm. 205:106243
Neurocomputación 408:100–111 195. Huang D, Chen S, Liu C, Zheng L, Tian Z, Jiang D (2021)
183. Soumalya Sarkar, Kishore Reddy, Alex Dorgan, Cali Fidopi­astis, Michael Giering Primero las diferencias en el cerebro asimétrico: una red neuronal convolucional
(2016) Actividad portátil basada en EEG de discrepancia bihemisférica para el reconocimiento de emociones por ejemplo.
reconocimiento en el entorno de servicios relacionados con phm a través del Neurocomputación 448:140–151
aprendizaje profundo. Revista internacional de pronóstico y gestión sanitaria, 7(4) 196. Alhagry S, Fahmy AA, El­Khoribi RA (2017) Reconocimiento de emociones basado
en eeg utilizando la red neuronal recurrente lstm. Emoción 8(10):355–358
184. Maiorana E (2020) Aprendizaje profundo para biometría basada en eeg
reconocimiento. Neurocomputación 410:374–386 197. Salama ES, El­Khoribi RA, Shoman ME, Wahby Shalaby MA
185. Guo J (2013) Propagación hacia atrás a través del tiempo. Inédito. EM. (2018) Reconocimiento de emociones basado en Eeg utilizando convolucional 3D
Instituto de Tecnología de Harbin 40:1–6 Redes neuronales. Int J Adv Comput Sci Appl 9(8):329–337
186. Sepp Hochreiter, Yoshua Bengio, Paolo Frasconi, Ju¨rgen Sch­midhuber, et al 198. Kung FYH, Chao MM (2019) El impacto de las emociones encontradas en
(2001) Flujo gradiente en redes recurrentes: la dificultad de aprender dependencias Creatividad en la negociación: una perspectiva interpersonal. Frente
a largo plazo Psicología 9:2660
187. Reddy BK, Delen D (2018) Predicción del reingreso hospitalario por 199. Zheng W (2016) Reconocimiento de emociones basado en eeg multicanal
Pacientes con lupus: una metodología de aprendizaje profundo basada en rnn­lstm. a través del análisis de correlación canónica dispersa del grupo. Transacciones
Computación Biol Med 101:199–209 IEEE sobre sistemas cognitivos y de desarrollo 9(3):281–290
188. Hochreiter S, Schmidhuber J (1997) Memoria a largo plazo. 200. Hadjidimitriou SK, Hadjileontiadis LJ (2012) Hacia un reconocimiento del gusto por
Computación neuronal 9 (8): 1735­1780 la música basado en eeg mediante análisis de tiempo­frecuencia.
189. Yamashita R, Nishio M, Do RKG, Togashi K (2018) Redes neuronales IEEE Trans Biomed Eng 59(12):3498–3510
convolucionales: una descripción general y aplicación en radiología. Imágenes de 201. Jenke R, Peer A, Buss M (2014) Extracción y selección de características
conocimiento 9(4):611–629 para el reconocimiento de emociones de eeg. Computación de efecto trans IEEE
190. Alarcao SM, Fonseca MJ (2017) Reconocimiento de emociones mediante eeg 5(3):327–339
señales: una encuesta. Computación de efecto trans IEEE 10 (3): 374–393 202. Chatterjee R, Tanmoy Maitra SK, Islam H, Hassan MM, Alamri
191. Harsh Dabas, Chaitanya Sethi, Chirag Dua, Mohit Dalawat, A, Fortino G (2019) Una nueva característica basada en el aprendizaje automático
Divyashikha Sethia (2018) Clasificación de emociones mediante eeg selección de imágenes motoras, clasificación de señales eeg en internet
señales. En las actas de la Segunda Conferencia Internacional sobre Ciencias de del entorno de cosas médicas. Sistema de Computación Futur Gener
la Computación e Inteligencia Artificial de 2018, 98:419–434
págs. 380–384, 203. Moreira MWL, Rodrigues JJPC, Kumar N, Saleem K, Illin IV
192. Gao Y, Jong Lee H, Mehmood RM (2015) Aprendizaje profundo de eeg (2019) Predicción de la depresión posparto a través del embarazo.
Señales para el reconocimiento de emociones. En: 2015 IEEE internacional Análisis de datos para sistemas inteligentes conscientes de las emociones. Información
conferencia sobre talleres multimedia y expo (ICMEW). IEEE, Fusión 47:23–31
págs. 1 a 5

193. Aya Hassouneh AM, Mutawa MM (2020) Desarrollo de un


Nota del editor Springer Nature se mantiene neutral con respecto a
Sistema de reconocimiento de emociones en tiempo real mediante expresiones faciales.
reclamaciones jurisdiccionales en mapas publicados y afiliaciones institucionales.

123

También podría gustarte