Documentos de Académico
Documentos de Profesional
Documentos de Cultura
com
Recibido el 29 de enero de 2020, aceptado el 26 de febrero de 2020, fecha de publicación 4 de marzo de 2020, fecha de la versión actual 16 de marzo de 2020.
YULING LUO 1, QIANG FU1, JUNTAO XIE2, YUNBAI QIN1, GUOPEI WU1, JUNXIU LIU1,
FRANK JIANG 1,3,YI CAO4, Y XUEMEI DING5,6
1Escuela de Ingeniería Electrónica, Universidad Normal de Guangxi, Guilin 541004, China
2Departamento de Seguridad, Universidad Normal de Guangxi, Guilin 541004, China
3Facultades y universidades Laboratorio clave de automatización integrada inteligente, Universidad de Tecnología Electrónica de Guilin, Guangxi 541004, China
4Escuela de Negocios, Universidad de Edimburgo, Edimburgo EH8 9JS, Reino Unido
5Escuela de Computación, Ingeniería y Sistemas Inteligentes, Universidad de Ulster, Londonderry BT48 7JL, Reino Unido
6Facultad de Matemáticas e Informática, Universidad Normal de Fujian, Fuzhou 350108, China
Este trabajo fue apoyado en parte por la Fundación Nacional de Ciencias Naturales de China bajo la subvención 61976063 y la subvención 61762018, en parte por la
Fundación de Ciencias Naturales de Guangxi bajo la subvención 2017GXNSFAA198180, en parte por el Programa de 100 Talentos en el Extranjero de la Educación
Superior de Guangxi bajo la subvención F-KA16035 y la subvención F-KA16016, en parte del Laboratorio Clave de Automatización Integrada Inteligente de Colegios y
Universidades, Universidad de Tecnología Electrónica de Guilin, China, bajo la subvención GXZDSY2016-03, y en parte del Fondo de Investigación del Laboratorio
Clave de Información de Fuentes Múltiples de Guangxi Minería y Seguridad bajo la Subvención 18-A-02-02. El trabajo de Guopei Wu fue apoyado en parte por el
Proyecto de Innovación de Educación de Graduados de Guangxi bajo la subvención YCSW2020.
ABSTRACTOEn este artículo se propone un método novedoso para utilizar las redes neuronales de picos (SNN) y las técnicas de
procesamiento del electroencefalógrafo (EEG) para reconocer estados emocionales. Se emplean tres algoritmos, incluida la
transformada wavelet discreta (DWT), la varianza y la transformada rápida de Fourier (FFT), para extraer las señales de EEG, que
luego son tomadas por el SNN para la clasificación de las emociones. Se utilizan dos conjuntos de datos, es decir, DEAP y SEED,
para validar el método propuesto. Para el primer conjunto de datos, los estados emocionales incluyen excitación, valencia,
dominancia y agrado, donde cada estado se denota como estatus alto o bajo. Para este último conjunto de datos, los estados
emocionales se dividen en tres categorías (negativos, positivos y neutrales). Los resultados experimentales muestran que al
utilizar la técnica de procesamiento de datos de varianza y SNN, los estados emocionales de excitación, valencia, dominancia y
agrado se pueden clasificar con precisiones del 74%, 78%, 80% y 86,27% para el conjunto de datos DEAP, y una precisión general
del 74%, 78%, 80% y 86,27%. La precisión es del 96,67% para el conjunto de datos SEED, que supera a los métodos de
procesamiento FFT y DWT. Mientras tanto, este trabajo logra un mejor desempeño en la clasificación de emociones que los
enfoques de evaluación comparativa y también demuestra las ventajas de usar SNN para las clasificaciones de estados
emocionales.
Este trabajo está bajo una licencia Creative Commons Attribution 4.0. Para obtener más información, consulte https://creativecommons.org/licenses/by/4.0/
VOLUMEN 8, 2020 46007
Y. Luoet al.: Clasificación de emociones basada en EEG mediante SNN
Se utilizan varios métodos diferentes para preprocesar los datos del EEG Refleja la emoción "interna" del ser humano. Por tanto, la señal EEG se
y se proporciona la precisión del reconocimiento de emociones utilizando puede utilizar para clasificar las emociones directamente desde el
estos diferentes métodos. Una vez que se completa el pretratamiento de cerebro [20].
los datos del EEG, los datos preprocesados se pueden utilizar para
clasificar las emociones. También se han investigado previamente
métodos convencionales de aprendizaje automático, por ejemplo, lógica 1) CONJUNTO DE DATOS DEAP
difusa [10], perceptrón multicapa (MLP) [11], modelos ocultos de Markov En el conjunto de datos DEAP, las películas se utilizaron como
[12] y máquina de vectores de soporte (SVM) [13]. Estos clasificadores provocadores de emociones en los experimentos. La película es una de
sólo pueden procesar datos espaciales sin considerar las relaciones las formas más impactantes de desencadenar emociones porque incluye
temporales de los datos. Sin embargo, los datos de EEG son espacio- estímulos visuales y de audio dinámicos [21]. Hay más de 32 participantes
temporales, probablemente se pueda lograr un mejor rendimiento para incluidos en el conjunto de datos, y la edad está entre 19 y 37 años con
el reconocimiento de emociones si se considera la información espacial y un promedio de 26,9 años. La mitad de los participantes son mujeres
la información temporal de los datos de EEG durante el procesamiento. [18]. Todos los participantes siguieron las mismas instrucciones. Los
La mayor parte de la investigación actual se centra en la extracción de participantes se sientan a un metro de la pantalla. Las señales de EEG se
características de datos de EEG y la mejora de clasificadores [14]. Este registran a frecuencias de muestreo de 512 Hz utilizando el equipo
artículo elige los datos de EEG calculando la varianza y los identifica con uniforme.
SNN. La idea principal del artículo es construir una red neuronal sipiking El DEAP es un conjunto de datos multimodal y se utiliza para el análisis
(SNN) y emplear las características temporales y espaciales de SNN para de estados afectivos humanos. Se utilizaron cuarenta clips de vídeos
reconocer los datos de EEG. En comparación con otros trabajos de musicales seleccionados para desencadenar emociones. Mientras tanto,
investigación [14], el objetivo de este artículo es construir una red se registraron la actividad del sistema nervioso central, las señales
neuronal de picos (SNN) y emplear las características temporales y fisiológicas periféricas y la expresión facial. Al final de cada vídeo, el
espaciales de SNN para reconocer los datos de EEG. Permite codificar experimento pide a los participantes que realicen autoevaluaciones de
datos neuroinformáticos espaciales y temporales con ubicaciones de los niveles de excitación, valencia, agrado y dominancia. Se utilizó un
sinapsis y neuronas, así como el momento de las actividades de método de selección de estímulos para recopilar vídeos de un conjunto
activación [15]-[17]. En particular, el SNN considera el orden de secuencia de videoclips musicales seguido de una prueba de sujetos para elegir el
de los datos del EEG, lo que puede ayudar enormemente a los resultados material de prueba más adecuado. Según la descripción del conjunto de
del reconocimiento. Los resultados de la clasificación muestran que 74∼ datos, el experimento seleccionó estímulos en varios pasos. En primer
Con el método propuesto se pueden lograr precisiones del 86% y del lugar, se seleccionaron 120 estímulos iniciales de forma semiautomática y
96,67% para diferentes conjuntos de datos, que son superiores en efecto manual, donde 60 de 120 estímulos se eligieron de forma manual y el
a los puntos de referencia. resto de forma semiautomática. En segundo lugar, se determinó un
momento destacado de un minuto para cada estímulo. Al final, los 40
La parte restante de este documento está organizada de la siguiente estímulos finales se seleccionaron mediante un experimento de
manera: Los conjuntos de datos de EEG que se utilizan en este estudio se evaluación subjetiva basado en la web. Se seleccionaron un total de 32
presentan en la SecciónIIque también ilustra el principio básico de cómo electrodos activos para recopilar los datos del EEG. Otras señales
se utiliza el SNN para reconocer emociones. SecciónIIIDescribe los fisiológicas periféricas incluyen electromiografía, electrooculograma,
métodos para extraer las características del EEG. La clasificación de pulso de volumen sanguíneo que se recopilaron en función de la
emociones utilizando el SNN se analiza en la SecciónIV. SecciónV temperatura de la piel, pletismógrafo y respuestas galvánicas de la piel.
proporciona los resultados experimentales y proporciona el análisis de Los vídeos de rostros se recopilaron de 22 participantes [18], [22].
rendimiento. SecciónVIIproporciona la discusión, y la conclusión y el
trabajo futuro se presentan en la SecciónVIII. Durante el experimento, utilizamos las calificaciones de los
participantes como base para crear cuatro clasificaciones binarias, a
II. CONJUNTO DE DATOS DE EEG Y REDES NEURALES DE PICO saber, clasificaciones de niveles altos o bajos de excitación, valencia,
En este artículo se utiliza un conjunto de datos multimodal que utiliza señales agrado y dominancia. Los rangos de escala de tres etiquetas (es
fisiológicas para el análisis de emociones (DEAP) [18] y un conjunto de datos de decir, excitación, valencia y dominancia) van desde calma (o
EEG de emociones de la Universidad Jiao Tong de Shanghai (SEED) [19]. Estos aburrido) a estimulado (o excitado), infeliz (o triste) a feliz (o alegre),
conjuntos de datos registraron los datos de EEG a diferentes frecuencias de sumiso (o sin control) a dominancia (o facultados), respectivamente.
muestreo de 512 Hz y 1000 Hz, respectivamente, y se refirió al sistema La escala de gusto se basa en el gusto personal de los sujetos por el
internacional 10-20 para colocar electrodos en el cuero cabelludo. SecciónII-A vídeo musical, que es diferente de la escala de valencia. Se basa en el
dará una introducción detallada para estos conjuntos de datos, y la SecciónII-B sentir, no en los sentimientos. Por ejemplo, al participante le pueden
Discutiremos las ventajas de utilizar SNN para el procesamiento de datos gustar vídeos grabados tristes o enojados. La escala de calificación
espacio-temporales de EEG. de autoevaluación varía del 1 al 9. Por lo tanto, las calificaciones de
los sujetos se dividen en dos categorías (baja o alta) según un
A. CONJUNTOS DE DATOS umbral estable que se selecciona como 4,5. Las señales de EEG
La señal EEG se emplea con frecuencia para la evaluación de las preprocesadas en el conjunto de datos DEAP se muestrean a 128 Hz.
emociones humanas. La señal EEG se diferencia de otras señales porque Se aplica un filtro de paso de banda con una frecuencia de corte de
es un método práctico no invasivo y capaz de detectar con precisión 4-45 Hz.
Se propone la extracción de características. Los datos de extracción de Como la señal EEG posee características no estacionarias, un
características del conjunto de datos DEAP contienen 32 participantes, donde método de análisis en el dominio del tiempo-frecuencia puede
cada participante corresponde a un archivo. La cantidad de datos para cada brindar más información considerando las características
archivo es 40.×32×8064 (vídeo/prueba×canal×datos) bytes. Los datos de dinámicas. El método DWT se selecciona para descomponer los
extracción de características del conjunto de datos SEED contienen 15 datos de EEG en diferentes aproximaciones y niveles detallados
participantes, donde cada participante corresponde a tres archivos. Los (ambos corresponden a rangos de frecuencia). La característica
métodos de extracción de características se basan en los dominios de tiempo, no estacionaria de las señales EEG les permite expandirse a
frecuencia y tiempo-frecuencia en este estudio. funciones básicas creadas al expandir, contraer y cambiar una
La varianza se selecciona para el método de análisis en el dominio del única función prototipo (ψa,b, la onda madre) [28]. Los métodos
tiempo en este estudio. En primer lugar, es necesario calcular la media de de filtrado de señal incluyen filtro de paso bajo y alto.
la señal EEG, que viene dada por pasar el filtro. El filtro de paso bajo se puede describir mediante
∑t ∑
ξ(t1) + ξ(t2) +. . .+ ξ(tt) i=1ξ(ti) Fyo(k) = (5)
µξ= = , (1) s(norte)gramo(2k− norte),
t t
norte
dóndetsignifica el tiempo de la muestra,tsignifica el tiempo total, ξ(t) dóndes(norte) es la señal de entrada. El filtro de paso alto se puede
significa el valor de la señal EEG en el momentot. Para seleccionar datos describir mediante
ventanas de tiempo deslizantes. Finalmente, los datos correspondientes a El DWT se puede calcular mediante
la ventana de tiempo con pequeña varianza se seleccionan como datos ∫
1 t
objetivo. El objetivo del cálculo de la varianza es seleccionar la señal con W.X(cd) = s(t)√ ψ(√ − d)dt, (7)
una varianza baja (es decir, un rango de fluctuación pequeño). Por lo 2C 2C
tanto, se calcula la varianza de la señal EEG sin procesar. Se puede dóndecd∈R,c >0,yRrepresenta el espacio wavelet. Los
considerar que el momento actual ha sido estable en un estado factores de escala y desplazamiento se presentan mediante
emocional, lo que puede hacer que los datos seleccionados sean fáciles parámetros.Cyd, respectivamente. La única limitación para
de identificar. elegir una función prototipo como wavelet madre es
Entonces la varianza de la señal EEG sin procesar se define como satisfacer la condición de admisibilidad dada por
1∑t
υξ= (ξ(t) − µξ)2, t (2) ∫∞|ψ(ω)|2
t=1 Cψ= dω<∞, (8)
−∞ ω
La ventana de tiempo deslizante se utiliza para seleccionar y procesar los
datos del EEG. Teniendo en cuenta la cantidad de datos, las duraciones de las dóndeψ(ω) es la transformada de Fourier deψcd(t). En nuestro estudio, los
ventanas de tiempo se seleccionan como 1, 2 y 3 respectivamente. Elegimos datos de EEG utilizan la función wavelet ''db4'' para descomponerse en
estas ventanas de tiempo en función del mecanismo de atención [29]. Los cuatro niveles. La wavelet ''db4'' puede detectar con precisión
estudios han demostrado que la capacidad de atención humana promedio es información de corta duración y señales transitorias rápidas. Debido a las
de 12 segundos en 2000 y de 8 segundos en 2013. Mientras tanto, utilizamos la propiedades de localización tiempo-frecuencia casi óptima, se utiliza en
ventana de tiempo deslizante para la clasificación, donde estas ventanas de este trabajo. Por lo tanto, es mucho más probable que el uso de este
tiempo dan resultados detallados y pueden usarse para marcar decisiones método para extraer características de los datos del EEG tenga éxito [28].
adicionales. Los datos de estas ventanas de tiempo son suficientes para reflejar En esta sección se explican tres métodos para el procesamiento
el estado emocional y hacer que los problemas sean manejables. de señales EEG, es decir, varianza, FFT y DWT. Se basan en los
dominios de tiempo, frecuencia y tiempo-frecuencia,
En este artículo se selecciona la transformada rápida de Fourier (FFT) respectivamente. Las señales EEG posprocesadas se utilizan luego
para el procesamiento en el dominio de la frecuencia. La FFT se utiliza como entradas al SNN para la clasificación de emociones, que se
para calcular la transformada discreta de Fourier (DFT), que se selecciona presentará en la siguiente sección.
como método de ejemplo en el dominio de la frecuencia. El cálculo de
DFT viene dado por IV. CLASIFICACIÓN DE EMOCIONES USANDO EL SNN
∑norte−1 El SNN se emplea para clasificar estados emocionales para el proceso.
ξ(k) =DFT[ξ(norte)] = ξ(norte)W. nk,
norte (3) señales EEG cesadas. Como la señal EEG es un patrón espacio-
norte=1
FIGURA 2.Se elige un reservorio SNN de 1000 neuronas para el conjunto de datos de FIGURA 3.Las ubicaciones de los sitios de adquisición del EEG. Las neuronas
EEG. resaltadas se utilizan para mapear las características de entrada.
FIGURA 6.Niveles de activación de las neuronas para datos de EEG en el SNNcube después
FIGURA 4.Interacciones totales entre las neuronas de entrada. Las líneas gruesas
del aprendizaje no supervisado. El nivel de brillo de una neurona identifica su nivel de
indican una fuerte interacción.
activación. Cuanto más brillante es la neurona, más picos se emiten.
Por ejemplo, la excitación positiva/baja se utiliza para definir la emoción TABLA 1.La precisión de la clasificación en una ventana de tiempo de 1
segundo utilizando diferentes métodos.
"satisfecha", la excitación positiva/alta se utiliza para definir la emoción
"feliz", la excitación negativa/baja se utiliza para definir la emoción
"triste". '' emoción, etc. En el conjunto de datos DEAP, cuatro etiquetas de
emoción (valencia, excitación, dominancia y agrado) se dividen en dos
categorías, es decir, baja y alta. Una matriz de etiquetas contiene las
etiquetas emocionales correspondientes (1 para baja, 2 para alta). El
conjunto de datos de SEED se divide en estados emocionales positivos, TABLA 2.La precisión de la clasificación se realiza en una ventana de tiempo de
neutrales y negativos. Se utilizan dos conjuntos de datos para validar el 2 segundos utilizando diferentes métodos.
A. AJUSTES EXPERIMENTALES
El conjunto de datos DEAP contiene datos de 32 participantes, cada
TABLA 3.La precisión de la clasificación se realiza en una ventana de tiempo de
participante corresponde a un archivo. Hay 40 vídeos musicales, 32 3 segundos utilizando diferentes métodos.
canales y 128 puntos de muestreo por segundo, es decir, la forma de
matriz de 40×32×128 (vídeo/prueba×canal×datos) bytes. Los 20
participantes se seleccionan como datos de entrenamiento y 12
participantes se seleccionan como datos de prueba, al azar. Los
resultados son interdisciplinarios. El modelo SNN tiene 32 neuronas
de entrada en el reservorio SNN correspondientes a 32 canales de
EEG. El conjunto de datos SEED contiene datos de 15 participantes,
donde cada participante tiene tres archivos. Hay 62 canales y 200 se obtiene el resultado experimental. Por ejemplo, el parámetro
puntos de muestreo por segundo. El 80% de los datos se seleccionan sigma, en el rango de [0,2], se incrementa gradualmente en 0,5
como entrenamiento y el 20% se utilizan para pruebas. El SNN tiene pasos y el mejor resultado experimental se obtiene en 1,5.
62 neuronas de entrada en el reservorio correspondientes a 62
canales de EEG. El modelo SNN es una estructura de red completa y B. RESULTADOS DE LA CLASIFICACIÓN DEL DEAP
todos los participantes que se utilizan para entrenar SNN pueden Para las comparaciones se utilizan tres métodos diferentes (la
representarse mediante un modelo SNN. varianza, FFT y DWT) de extracción de características de EEG. La
Para lograr una clasificación confiable, en este estudio se arquitectura Neu-Cube SNN se aplica a los datos propuestos. Los
utiliza una ventana de tiempo móvil. Para obtener la ventana de resultados de la clasificación en tres ventanas de tiempo diferentes
tiempo más adecuada, se utiliza el método de varianza en todos se dan en la Tabla1a la mesa3. El método de variación elige datos de
los datos de EEG para comparar el rendimiento de la diferentes períodos a partir de los datos originales y mantiene las
clasificación en tres ventanas de tiempo diferentes, que en este características temporales y de ubicación de los metadatos.
enfoque son 1 s, 2 s y 3 s. Los datos DEAP EEG se seleccionan Arquitectura SNN en la que los datos neuroinformáticos tanto
entre 32 electrodos (p. ej., P7, O1, O2, etc.). Los datos de SEED espaciales como temporales se pueden codificar como ubicaciones
EEG se seleccionan entre 62 canales. Debido a que las señales de sinapsis y neuronas, así como el momento de su actividad
de EEG contienen la información de tiempo y la información de máxima. Es adecuado para representar la característica EEG. Por lo
ubicación, mapear la información de ubicación a las neuronas tanto, la arquitectura SNN puede obtener un mejor rendimiento.
de entrada necesita determinar las coordenadas de los Mesa1muestra las precisiones de clasificación en una ventana de
electrodos respectivos, como P7 (-60, -60, 0), O1 (-30 , -80, 10), tiempo de 1 s. Se puede ver que la precisión del método de varianza
O2 (30, -80, 10), etc. El valor máximo de la posición de las es mucho mayor que la de FFT y DWT para clasificar las emociones
coordenadas no es más de 100, por lo tanto 10×100×100×Se de valencia y dominancia. La precisión del método DWT es máxima
selecciona 100 como tamaño de coordenadas de SNNcube y para clasificar la excitación y el agrado.
SNNcube contiene 10×10×10 neuronas. Mesa2muestra las precisiones de clasificación en una ventana
Se selecciona el algoritmo de codificación de picos de ventana móvil de tiempo de 2 s. La precisión de reconocimiento del método de
para codificar las señales de EEG. En la sección de codificación, el umbral varianza es máxima para clasificar valencia y dominancia. Los
se establece en 0,3 mV. La duración del tiempo de entrenamiento, el métodos de varianza y DWT tienen la misma precisión y son más
tiempo refractario y la tasa STDP se establecen en 1 s, 6 ms y 0,01 en la precisos que la FFT para clasificar la excitación. La FFT y la DWT
sección del cubo de entrenamiento, respectivamente. En la sección del tienen la misma precisión y son más precisas que la variación
clasificador de entrenamiento, los parámetros mod, deriva, k y sigma se para clasificar el gusto.
establecen en 1,1, 0,5, 2 y 1,5 respectivamente. Para los parámetros Mesa3muestra las precisiones de clasificación en la ventana de
experimentales, utilizamos múltiples experimentos para obtener valores tiempo de 3 segundos. La precisión del método de la varianza es la
apropiados. Es decir, dentro de un cierto rango, los parámetros se más alta para clasificar la valencia, la excitación, la dominancia y el
ajustan en el mismo paso hasta alcanzar el valor óptimo del parámetro agrado. Mientras tanto, la Mesa3muestra que la precisión bajo el
TABLA 4.La precisión de la clasificación se realiza en una ventana de tiempo de 3 segundos utilizando diferentes métodos.
La ventana de tiempo de 3 segundos usando el método de varianza es mayor que la TABLA 5.La precisión de la clasificación en una ventana de tiempo de 1
segundo utilizando diferentes métodos.
ventana de tiempo de 1 y 2 segundos.
Además, se seleccionan los resultados de varios otros enfoques que
utilizan el mismo conjunto de datos para comparar el rendimiento. Las
precisiones promedio de estos enfoques se dan en la Tabla4. Los
resultados de [18] mostraron que las señales de EEG se pueden usar de
manera confiable para clasificar emociones e informar precisiones (55%
TABLA 6.La precisión de la clasificación se realiza en una ventana de tiempo de
-62%) mediante el uso de un clasificador gaussiano de Bayes. El enfoque 2 segundos utilizando diferentes métodos.
de [22] utilizó diferentes clasificadores para la clasificación y los
resultados experimentales demostraron que la precisión del uso de SVM
es mayor que la del ingenuo Bayes. Las mismas características y
clasificador en [22] se usan en el enfoque de [39] pero con diferente
número de subbandas, es decir, se usan 12 y 16 subbandas para [22] y
[39], respectivamente. Los resultados muestran que el enfoque de [22] TABLA 7.La precisión de la clasificación se realiza en una ventana de tiempo de
2 segundos utilizando diferentes métodos.
tiene una mayor precisión de clasificación que [39]. El enfoque de [40]
utilizó un clasificador de máquina de vectores de relevancia (RVM) y
extracción de características gráficas para clasificar las emociones, lo que
logra una precisión de clasificación del 65% al 69%. Los enfoques de [41]
y [42] utilizaron características de potencia espectral (SPF) y
características SPF con patrones espaciales comunes (CSP),
respectivamente. Ambos utilizaron SVM para las clasificaciones. Sin
es más alto, especialmente para los estados emocionales positivos y
embargo, sólo clasificaron dos estados emocionales y las precisiones son
neutrales. Se puede ver que la precisión utilizando el algoritmo FFT
del 50% al 62%. En este trabajo, se utiliza el método de varianza para
es mayor para la clasificación de estado negativo.
seleccionar los datos de señales EEG preprocesadas y luego se utiliza el
Mesa7muestra las precisiones de clasificación en una ventana de
SNN para clasificar los estados emocionales. La precisión de los cuatro
tiempo de 3 s. La precisión general del método de varianza es mayor que
estados emocionales (valencia, excitación, dominancia y agrado) es del
la de otros. Mientras tanto, la precisión de la clasificación individual
78%, 74%, 80% y 86,27%, respectivamente, lo que es mejor que otros
utilizando el método de varianza también es máxima. Cabe señalar que la
enfoques. Esto demuestra que debido a la capacidad de procesamiento
precisión del reconocimiento de la ventana de tiempo de 3 segundos
de información temporal-espacial, el SNN se puede utilizar para procesar
utilizando el método de varianza es mayor que la de la ventana de tiempo
tareas en el dominio de series de tiempo, como las clasificaciones de
de 1 y 2 segundos.
emociones basadas en EEG.
Los resultados de clasificación de varios otros enfoques que utilizan el
conjunto de datos SEED para la evaluación también se incluyen para
comparar el desempeño. Estos enfoques seleccionan 62 canales de datos
VI. RESULTADOS DE LA CLASIFICACIÓN DE SEMILLAS y cuatro bandas de frecuencia. Las precisiones de clasificación de estos
En el conjunto de datos SEED se utilizan tres métodos diferentes enfoques se muestran en la Tabla8. El enfoque de [19] muestra que el
(varianza, FFT y DWT) de extracción de características para realizar modelo de red de creencias profundas (DBN) puede obtener una
comparaciones. La arquitectura NeuCube SNN se aplica a los datos precisión general del 86,08%. El enfoque de [43] utiliza el método de
propuestos. Los resultados de la clasificación en tres ventanas de tiempo transferencia transductiva de parámetros (TPT) y el marco de
diferentes se dan en la Tabla5a la mesa7. Mesa5muestra las precisiones transferencia de sujetos, que logra una precisión general del 76,31%. El
en la ventana de tiempo de 1 s. Se puede ver que la precisión del método enfoque de [44] utiliza una estructura de red jerárquica con nodos de
de la varianza es mucho mayor que la de FFT y DWT. subred para la clasificación,
especialmente las precisiones de clasificación de positivo y neutral y puede obtener una precisión del 93,26%. En nuestro trabajo,
puede llegar al 100%. el método de varianza y SNN se utilizan para clasificar estados
Mesa6muestra las precisiones de clasificación en una ventana de emocionales. La precisión global muestra que se puede obtener un
tiempo de 2 s. Thmi precisión general del método de varianza resultado prometedor (96,67%).
TABLA 8.Exactitudes de clasificación de diferentes enfoques. clasificación de clases múltiples e integraciones del clasificador basado en
SNN y los dispositivos de hardware integrados BCI.
REFERENCIAS
[1] MS Hossain y G. Muhammad, ''Un sistema de reconocimiento de emociones para
aplicaciones móviles''.Acceso IEEE, vol. 5, págs. 2281–2287, 2017.
[2] A. Hernández-Matamoros, A. Bonarini, E. Escamilla-Hernández,
M. Nakano-Miyatake y H. Perez-Meana, ''Reconocimiento de expresiones faciales con
segmentación automática de regiones faciales utilizando un enfoque de clasificación
VII. DISCUSIÓN difuso''.Sistema basado en el conocimiento., vol. 110, págs. 1 a 14, octubre de 2016.
señales EEG. Como herramienta eficaz, el SNN se utiliza con señales modulación de amplitud y un procedimiento de selección de características combinado".
Sistema basado en el conocimiento., vol. 63, núm. 1, págs. 68–81, junio de 2014.
de EEG. En los estudios previos sobre la emoción, se han
[4] L. Zhang, K. Mistry, SC Neoh y CP Lim, ''Reconocimiento inteligente de emociones faciales
considerado muchas técnicas estándar de aprendizaje automático mediante optimización de polilla-luciérnaga''.Sistema basado en el conocimiento., vol. 111,
(por ejemplo, Bayes ingenuo [22], Bayes gaussiano [18], RVM [40], núm. 1, págs. 248–267, noviembre de 2016.
[5] KH Kim, SW Bang y SR Kim, "Sistema de reconocimiento de emociones que utiliza
etc.). Con la comparación de estos métodos, el SNN es más
monitoreo a corto plazo de señales fisiológicas".Medicina. Biol. Ing. Computadora., vol.
adecuado para datos espaciales y temporales. 42, núm. 3, págs. 419–427, mayo de 2004.
El marco NeuCube no sólo puede aprender rutas funcionales a partir [6] J. Atkinson y D. Campos, "Mejora del reconocimiento de emociones basado en BCI mediante la
combinación de selección de características de EEG y clasificadores de núcleo",Sistema experto.
de datos, sino también predecir estados futuros. El modelo se puede
Aplica., vol. 47, núm. 1, págs. 35 a 41, abril de 2016.
desarrollar para aprender datos espaciales y temporales de forma [7] J. Liu, J. Harkin, LP Maguire, LJ McDaid y JJ Wade, ''SPANNER: Una arquitectura de
supervisada y no supervisada. Incluye un componente de entrada para hardware de red neuronal con picos autorreparables''.Traducción IEEE. Red
neuronal. Aprender. Sistema., vol. 29, núm. 4, págs. 1287–1300, abril de 2018.
codificar los datos de entrada en secuencias de picos, donde un SNNcube
[8] R. Jenke, A. Peer y M. Buss, "Extracción y selección de características para el
aprende los datos de entrada en un modo no supervisado para capturar reconocimiento de emociones a partir de EEG".Traducción IEEE. Afectar. Computadora.
patrones espaciales y temporales, y una parte de salida en evolución para , vol. 5, núm. 3, págs. 327–339, julio de 2014.
[9] J. Liu, J. Zhang, Y. Luo, S. Yang, J. Wang y Q. Fu, "Detecciones de sustancias
tareas de clasificación o regresión.
espectrales de masas utilizando redes de memoria a largo plazo".Acceso IEEE,
Este estudio ha demostrado que la varianza es un método eficaz para vol. 7, págs. 10734–10744, 2019.
procesar los datos. En el conjunto de datos DEAP, SNN reconoce los [10] T. Nguyen, S. Nahavandi, A. Khosravi, D. Creighton e I. Hettiarachchi, ''Análisis de señales
EEG para aplicaciones BCI utilizando un sistema difuso'', enProc. En t. Conferencia
cuatro estados emocionales como clases bajas o altas. Las precisiones de
conjunta. Red neuronal. (IJCNN), julio de 2015, págs. 1–8.
clasificación son 78%, 74%, 80% y 86,27%, respectivamente. En el [11] YKD Nishikawa, W. Yu y H. Yokoi, "Controlador de mano protésico EMG utilizando un
conjunto de datos de SEED, los estados emocionales se dividen en método de aprendizaje en tiempo real", enProc. En t. Conf. Intel. Sistema de robots.,
1999, págs. 153-158.
positivos, neutrales y negativos. Se puede obtener una precisión global
[12] ADC Chan y KB Englehart, "Control mioeléctrico continuo para prótesis
del 96,67%. La precisión es mucho mayor que la de las técnicas motorizadas utilizando modelos ocultos de Markov",Traducción IEEE.
tradicionales de aprendizaje automático. Debido a que el SNN exhibe la Biomédica. Ing., vol. 52, núm. 1, págs. 121-124, enero de 2005.
[13] MA Oskoei y H. Hu, "Esquema de clasificación basado en máquinas de vectores de soporte para el
característica de la memoria para procesar los datos de series de tiempo,
control mioeléctrico aplicado a las extremidades superiores".Traducción IEEE. Biomédica. Ing.,
la información espacial y temporal está codificada por ubicaciones de vol. 55, núm. 8, págs. 1956-1965, agosto de 2008.
sinapsis, ubicaciones de neuronas y tiempos de actividad máxima en el [14] T. Song, W. Zheng, P. Song y Z. Cui, "Reconocimiento de emociones EEG mediante redes
neuronales convolucionales de gráficos dinámicos".Traducción IEEE. Afectar.
SNN. Se puede realizar una memoria asociativa y un sistema predictivo
Computadora., para ser publicado.
utilizando el modelo SNN para clasificar los estados emocionales del [15] D. Taylor, N. Scott, N. Kasabov, E. Capecci y E. Tu, "Viabilidad de la arquitectura
cerebro. NeuCube SNN para detectar la ejecución del motor y la intención del motor
para su uso en aplicaciones BCI", enProc. En t. Conferencia conjunta. Red
neuronal. (IJCNN), 2014, págs. 3221–3225.
VIII. CONCLUSIÓN Y EL TRABAJO FUTURO [16] E. Tu, N. Kasabov, M. Othman, Y. Li, S. Worner, J. Yang y Z. Jia, ''NeuCube(ST) para
modelado predictivo de datos espacio-temporales con un estudio de caso sobre datos
En este artículo se propusieron métodos para procesar señales EEG y
ecológicos'', enProc. En t. Conferencia conjunta. Red neuronal. (IJCNN), julio de 2014,
clasificar estados emocionales. Los conjuntos de datos DEAP y SEED págs. 638–645.
utilizados en este trabajo contienen las señales de EEG que se recopilaron [17] J. Liu, LJ Mcdaid, J. Harkin, S. Karim, AP Johnson, AG Millard,
J. Hilder, DM Halliday, AM Tyrrell y J. Timmis, "Explorando la autorreparación en una
de dispositivos de interfaz cerebro-computadora (BCI) de 32 y 62 canales.
red neuronal de astrocitos acoplados",Traducción IEEE. Red neuronal. Aprender.
Se utilizaron tres métodos de extracción de características, incluida la Sistema., vol. 30, núm. 3, págs. 865–875, marzo de 2019.
varianza, FFT y DWT, para procesar los datos del EEG. Luego se empleó el [18] S. Koelstra, C. Muhl, M. Soleymani, J.-S. Lee, A. Yazdani, T. Ebrahimi,
T. Pun, A. Nijholt e I. Patras, ''DEAP: una base de datos para el análisis de emociones; usando
SNN para clasificar los estados emocionales. Los resultados
señales fisiológicas''Traducción IEEE. Afectar. Computadora., vol. 3, núm. 1, págs. 18 a 31, enero
experimentales mostraron que, en comparación con otros dos métodos de 2012.
de extracción de características, el método de varianza con una ventana [19] W.-L. Zheng y B.-L. Lu, ''Investigación de bandas y canales de frecuencia críticos para el
reconocimiento de emociones basado en EEG con redes neuronales profundas''.
de tiempo de 3 segundos es más adecuado para procesar los datos EEG
Traducción IEEE. Auto. Desarrollo mental., vol. 7, núm. 3, págs. 162-175, septiembre de 2015.
sin procesar. Para la clasificación del estado emocional, el SNN logró la [20] Y. Liu, O. Sourina y MK Nguyen, "Reconocimiento y visualización de emociones humanas
mayor precisión que otros enfoques convencionales debido a su basadas en EEG en tiempo real", enProc. En t. Conf. Cibermundos, octubre de 2010,
págs. 262–269.
capacidad de procesamiento de datos espaciales y temporales. El trabajo
[21] X.-W. Wang, D. Nie y B.-L. Lu, "Clasificación del estado emocional a partir de datos de EEG
futuro incluye la optimización mediante un enfoque de aprendizaje automático".Neurocomputación, vol. 129, págs.
misación de los métodos propuestos, una mayor exploración de la 94-106, abril de 2014.
[22] SN Daimi y G. Saha, ''Clasificación de emociones inducidas por videos musicales y [43] WL Zheng y BL Lu, ''Personalización de modelos afectivos basados en EEG con
correlación con la calificación de los participantes''.Sistema experto. Aplica., vol. 41, aprendizaje por transferencia'', enProc. En t. Conferencia conjunta. Artif. Intel. (IJCAI),
núm. 13, págs. 6057–6065, octubre de 2014. 2016, págs. 2732–2738.
[23] W. Maass, ''Redes de neuronas con picos: la tercera generación de modelos de redes [44] Y. Yang, QMJ Wu, W.-L. Zheng y B.-L. Lu, "Reconocimiento de emociones basado
neuronales''.Red neuronal., vol. 10, núm. 9, págs. 1659-1671, diciembre de 1997. en EEG utilizando una red jerárquica con nodos de subred".Traducción IEEE.
[24] Y. Luo, L. Wan, J. Liu, J. Harkin, L. McDaid, Y. Cao y X. Ding, "Arquitectura Cognir. Desarrollar. Sistema., vol. 10, núm. 2, págs. 408–419, junio de 2018.
interconectada de bajo costo para redes neuronales con picos de hardware".
Fronteras Neurociencias., vol. 12, núm. 857, págs. 1 a 14, noviembre de 2018.
[25] J. Liu, Y. Huang, Y. Luo, J. Harkin y L. McDaid, "Circuitos de detección de
YULING LUO,fotografía y biografía no disponibles en el momento de la
fallas bioinspirados basados en modelos de sinapsis y neuronas con publicación.
picos".Neurocomputación, vol. 331, págs. 473–482, febrero de 2019, doi:
10.1016/j.neucom.2018.11.078.
QIANG FURecibió la maestría de la Escuela de
[26] L. Peng, Z.-G. Hou, N. Kasabov, G.-B. Bian, L. Vladareanu y H. Yu, ''Viabilidad de la
Ingeniería Electrónica de la Universidad Normal de
arquitectura de red neuronal de picos NeuCube para el reconocimiento de
Guangxi. Sus intereses de investigación incluyen
patrones EMG'', enProc. En t. Conf. Adv. Mec. Sistema. (ICAMechS), agosto de
redes neuronales con picos y análisis BCI.
2015, págs. 365–369.
[27] A. Delorme y S. Makeig, ''EEGLAB: una caja de herramientas de código abierto para el
análisis de la dinámica del EEG de un solo ensayo, incluido el análisis de componentes
independientes''.J. Neurosci. Métodos, vol. 134, núm. 1, págs. 9-21, marzo de 2004.
[28] M. Murugappan, N. Ramachandran e Y. Sazali, ''Clasificación de las emociones humanas a
partir de EEG mediante transformada wavelet discreta''.J. Biomed. Ciencia. Ing., vol. 03,
núm. 04, págs. 390–396, 2010.
[29] A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, AN Gómez,
JUNTAO XIE,fotografía y biografía no disponibles en el momento de la
L. Kaiser y I. Polosukhin, "Lo único que necesitas es atención", enProc. Adv. Inf.
publicación.
neuronal. Proceso. Sistema., 2017, págs. 5999–6009.
[30] N. Kasabov, V. Feigin, Z.-G. Hou, Y. Chen, L. Liang, R. Krishnamurthi,
M. Othman y P. Parmar, "Evolución de redes neuronales de picos para modelado, clasificación y YUNBAI QINRecibió una licenciatura y una maestría en
predicción personalizados de patrones espacio-temporales con un estudio de caso sobre ingeniería de comunicaciones de la Universidad de Jilin,
accidente cerebrovascular".Neurocomputación, vol. 134, págs. 269–279, junio de 2014.
Changchun, China, en 2008 y 2011, respectivamente.
Actualmente es profesor de la Escuela de Ingeniería
[31] N. Kasabov, NM Scott, E. Tu, S. Marks, N. Sengupta, E. Capecci, Electrónica de la Universidad Normal de Guangxi. Sus
M. Othman, MG Doborjeh, N. Murli, R. Hartono, JI Espinosa-Ramos, intereses de investigación incluyen visión artificial,
L. Zhou, FB Alvi, G. Wang, D. Taylor, V. Feigin, S. Gulyaev,
robots inteligentes, electrónica automotriz y big data de
M. Mahmoud, Z.-G. Hou y J. Yang, "Evolución de máquinas de datos espacio-
infraestructura de transporte.
temporales basadas en el marco neuromórfico NeuCube: metodología de
diseño y aplicaciones seleccionadas".Red neuronal., vol. 78, págs. 1 a 14, junio
de 2016.
[32] T. Delbruck y P. Lichtsteiner, "Control motor sensorial rápido basado en un sistema híbrido
GUOPEI WUActualmente está cursando la maestría en la
neuromórfico-procedimental basado en eventos", enProc. IEEE Internacional. Síntoma. Sistema
Escuela de Ingeniería Electrónica de la Universidad
de circuitos., mayo de 2007, págs. 845–848.
Normal de Guangxi. Sus intereses de investigación
[33] W. Gerstner, "¿Qué es diferente con las neuronas que se disparan?" enProc. Red neuronal
incluyen redes neuronales y análisis BCI.
plausible. Biol. Modelado, 2001, págs. 23–48.
[34] J. Liu, T. Sun, Y. Luo, S. Yang, Y. Cao y J. Zhai, "Una arquitectura de red de estado
de eco basada en una puerta lógica cuántica y su optimización".
Neurocomputación, vol. 371, núm. 1, págs. 100-107, enero de 2020.
[35] N. Kasabov, K. Dhoble, N. Nuntalid y G. Indiveri, "Redes neuronales dinámicas en
evolución para el reconocimiento de patrones espacio-temporales y espectro-
temporales en línea".Red neuronal., vol. 41, núm. 5, págs. 188-201, mayo de 2013.
[36] J. Liu, T. Sun, Y. Luo, S. Yang, Y. Cao y J. Zhai, "Optimización de la red de estado de
JUNXIU LIU,fotografía y biografía no disponibles en el momento de la
eco utilizando el algoritmo binario del lobo gris".Neurocomputación, vol. 385,
publicación.
págs. 310–318, abril de 2020, doi:10.1016/j.neucom.2019.12.069.
[37] Y. Liu y O. Sourina, "Reconocimiento del nivel de dominancia basado en EEG para la
interacción habilitada por emociones", enProc. IEEE Internacional. Conf. Expo FRANK JIANGRecibió la maestría en informática de la
Multimedia, julio de 2012, págs. 1039-1044. Universidad de Nueva Gales del Sur (UNSW) y el
[38] AJ Gerber, J. Posner, D. Gorman, T. Colibazzi, S. Yu, Z. Wang, Ph.D. Licenciado por la Universidad Tecnológica de
A. Kangarlu, H. Zhu, J. Russell y BS Peterson, "Un modelo circumplejo afectivo Sydney, en 2008. Tiene más de tres años de
de sistemas neuronales que sirven a la valencia, la excitación y la superposición experiencia como investigador postdoctoral en la
cognitiva durante la evaluación de rostros emocionales".Neuropsicología, vol.
UNSW. Ha publicado más de 80 artículos de
46, núm. 8, págs. 2129-2139, julio de 2008.
conferencias y artículos de revistas indexadas SCI/EI
[39] DS Naser y G. Saha, ''Reconocimiento de emociones inducidas por vídeos
de gran reputación. Sus principales intereses de
musicales utilizando DT-CWPT'', enProc. Conferencia india. Medicina.
investigación incluyen esquemas de aprendizaje de
Información. Telemedicina (ICMIT), marzo de 2013, págs. 53–57.
inspiración biológica y sus aplicaciones en el
[40] R. Gupta, KUR Laghari y TH Falk, "Fusión de decisión del clasificador de vectores de
sistemas sensibles al contexto, ciberseguridad basada en datos, análisis predictivo y
relevancia y características teóricas de gráficos EEG para la caracterización automática
técnicas blockchain.
del estado afectivo".Neurocomputación, vol. 174, págs. 875–884, enero de 2016.
[41] M. Soleymani, M. Pantic y T. Pun, ''Reconocimiento de emociones multimodal en
respuesta a videos''.Traducción IEEE. Afectar. Computadora., vol. 3, núm. 2, YI CAO,fotografía y biografía no disponibles en el momento de la publicación.
págs. 211–223, abril de 2012.
[42] S. Koelstra, A. Yazdani, M. Soleymani, C. Mühl, JS Lee, A. Nijholt,
T. Pun, T. Ebrahimi e I. Patras, "Clasificación de ensayo único de EEG y señales XUEMEI DING,fotografía y biografía no disponibles en el momento de la
fisiológicas periféricas para el reconocimiento de emociones inducidas por vídeos publicación.
musicales", enProc. En t. Conf. Información cerebral., 2010, págs. 89-100.