Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Emotion Recognition With Deep Learning Using GAMEEMO Data Set Alakus 2020.en - Es
Emotion Recognition With Deep Learning Using GAMEEMO Data Set Alakus 2020.en - Es
com
Reconocimiento de emociones con aprendizaje profundo Se clasificaron con el modelo de aprendizaje profundo de memoria
utilizando el conjunto de datos GAMEEMO bidireccional a largo y corto plazo (BiLSTM) y se llevó a cabo el proceso de
predicción. En la última etapa se midió el desempeño del modelo BiLSTM
tuberculosis alakus✉y yo turkoglu con diferentes métricas de evaluación.
los últimos años han cobrado impulso los estudios basados en señales de
feliz
electroencefalografía (EEG), que realizan el análisis de las emociones de una
frustrado
forma más robusta y fiable. En este artículo, se realizó un análisis de emociones
basado en señales de EEG para predecir emociones positivas y negativas. El negativo positivo
valencia valencia
estudio consta de cuatro partes. En la primera parte, se obtuvieron señales de
EEG del conjunto de datos GAMEEMO. En la segunda etapa, se calcularon los deprimido contenido
valores de entropía espectral de las señales de EEG de todos los canales y estos
valores se clasificaron mediante la arquitectura de memoria bidireccional de
aburrido
largo-corto plazo en la tercera etapa. En la última etapa, se evaluó el desempeño relajado
bajo
excitación
pensar, comunicarse, aprender, tomar decisiones, etc. Dado que todas estas y otras
acciones similares se llevan a cabo a través de las emociones, las emociones tienen un Las principales aportaciones del estudio se pueden resumir en:
gran impacto. en la vida diaria. Mientras que las emociones negativas afectan a las
personas tanto física como psicológicamente, las emociones positivas hacen que las †Hasta donde sabemos, el conjunto de datos GAMEEMO se analizó por primera vez en
personas tengan más éxito en la sociedad y mejoren sus condiciones de vida.1,2]. este estudio con el modelo de aprendizaje profundo BiLSTM. †Con este estudio se
Existen muchos estudios diferentes de análisis de emociones para comprender la observó que las señales de EEG obtenidas desde un dispositivo portátil también
naturaleza y el comportamiento de las emociones. Sin embargo, el hecho de que el pueden usarse para el análisis de emociones.
concepto de emoción sea abstracto y no tenga un resultado objetivo dificulta el
análisis de las emociones.3,4]. Además, una gran cantidad de métodos para recopilar El resto del trabajo se organiza de la siguiente manera: los estudios realizados
y procesar datos emocionales hace que el proceso de análisis sea más difícil y con señales EEG se mencionan en el apartado de trabajos relacionados. En la
requiera más tiempo. Por estas razones, se necesita un sistema basado en sección de datos y métodos, se brinda información general sobre el conjunto
computadora [5]. de datos, la entropía espectral y el modelo BiLSTM utilizado en este estudio. En
Las emociones se pueden obtener a través de métodos físicos y no físicos. la sección de resultados de la aplicación, se examinó el rendimiento del modelo
Ejemplos de estos incluyen señales de voz, lenguaje corporal, expresiones BiLSTM y se discutieron los resultados. En el apartado de conclusiones se
faciales y actividades físicas. Dado que estos métodos son fáciles de aplicar, los examinó el estudio y se realizaron explicaciones en base a posibles aplicaciones
datos se pueden obtener rápida y fácilmente. Sin embargo, durante la fase de futuras.
recopilación de datos, los sujetos pueden manipular las emociones de forma
intencionada o no. Mientras se recopilan las señales de voz, los sujetos pueden Obras relacionadas:En esta sección se examinan los estudios de análisis de emociones
imitar sus voces y ocultar sus expresiones faciales de manera similar.6]. Por lo realizados con señales de EEG. Los autores en [11] utilizó el modelo LSTM para la
tanto, el hecho de que los datos obtenidos por estos métodos sean predicción de emociones y clasificó las señales de EEG para ello. En el estudio se
incompletos y poco confiables provocó la necesidad de un sistema más utilizó el conjunto de datos DEAP y se realizó un proceso de clasificación para las
confiable y aumentó la importancia de las señales fisiológicas como la clases de valencia, excitación y agrado. Las señales no han sido preprocesadas ni
electroencefalografía (EEG).7]. Las señales EEG son el método más utilizado en clasificadas directamente en la arquitectura LSTM. El estudio se validó con una
esta área debido a su facilidad de uso, bajo costo y modelos portátiles.8]. validación cruzada cuádruple y el rendimiento del modelo LSTM se evaluó únicamente
con la métrica de precisión. Al final del estudio, se obtuvo una precisión de 0,8565
Hay dos tipos de patrones emocionales en la literatura, discretos y para excitación, 0,8545 para valencia y 0,8799 para agrado. Autores en [12] llevó a
dimensionales. Hay ocho emociones básicas (ira, alegría, confianza, miedo, cabo un análisis de emociones mediante aprendizaje profundo. En el estudio se utilizó
sorpresa, tristeza, disgusto y anticipación) en el modelo de emoción discreta.9]. el conjunto de datos DEAP y la extracción de características se llevó a cabo antes de la
En el modelo dimensional, las emociones no se expresan por sus nombres sino clasificación. En la fase de extracción de características, las señales se transformaron
según sus posiciones en el plano de excitación-valencia.10]. En este plano, las con descomposición del modelo empírico y descomposición del modelo variacional y
emociones se dividen en cuatro áreas principales. El eje de valencia se refiere a la densidad espectral de potencia, y los primeros valores de diferencia de las
laX-eje, y este eje indica si la emoción es negativa o positiva.Y-El eje expresa funciones del modo intrínseco se recopilaron a partir de estas señales convertidas.
excitación y las emociones se ordenan de menor a mayor según el grado de Luego, las señales se clasificaron tanto con máquinas de vectores de soporte (SVM)
actividad. El plano de excitación y valencia se muestra en la Fig.1. El plano se como con redes neuronales profundas. Tras el proceso de clasificación se alcanzaron
divide en cuatro zonas diferenciadas, como se puede observar en la Fig.1. Si precisiones de 0,6125 para excitación y 0,6250 para valencia. Los autores en [13]
bien hay emociones de valencia positiva de alta excitación en la primera zona, realizó análisis de emociones con análisis de componentes principales y aprendizaje
hay emociones negativas de alta valencia en la segunda zona. En la tercera y profundo. Como en otros estudios, en este estudio se utilizó el conjunto de datos
cuarta zona, hay emociones de valencia negativa-baja excitación y valencia DEAP. Las señales se transformaron primero en cinco bandas diferentes con
positiva-baja excitación, respectivamente. En este modelo, las emociones se transformada rápida de Fourier y se obtuvieron valores espectrales de potencia de
nombran según su ubicación en el plano de coordenadas en lugar de sus cada banda. Luego los valores se normalizaron y clasificaron con una red de
nombres. Por ejemplo, la emoción de felicidad se expresa como una valencia aprendizaje profundo. Las emociones de valencia se predijeron con una precisión de
positiva de alta excitación. Se pueden hacer inferencias similares para otros 0,5342 y las emociones de excitación con una precisión de 0,5205 con el método
tipos de emociones. En este estudio, se utilizó el modelo de emoción propuesto.
dimensional y las emociones se evaluaron como valencia positiva y valencia
negativa. Datos y métodos:En este estudio, las señales EEG pertenecientes al
El estudio consta de cuatro etapas. En el primer paso, se recopilaron señales de GAMEEMO [14] conjunto de datos. El conjunto de datos contiene señales
EEG del conjunto de datos de GAMEEMO. En el segundo paso, se calcularon los EEG de 28 personas. A diferencia de los dispositivos recolectores de EEG
valores de entropía espectral de cada señal de EEG. Entonces estos valores convencionales, los datos se obtuvieron con un dispositivo EEG portátil.
0,8
tasa positiva verdadera
0,2
Curva ROC de clase 0 (área = 0,90)
Curva ROC de clase 1 (área = 0,90)
clasificación de datos
0.0
0.0 0,2 0,4 0,6 0,8 1.0
modelo de aprendizaje profundo: BiLSTM
tasa de falsos positivos
Fig. 3Curva ROC de emociones positivas y negativas (la clase 0 se refiere a emociones
evolución del rendimiento negativas, la clase 1 se refiere a emociones positivas)
exactitud especificidad sensibilidad República de China Estos resultados también se compararon con los resultados del algoritmo de
aprendizaje automático utilizado en el artículo original. Los resultados de la
comparación se dan en la tabla.2. Dado que sólo hay un estudio en la literatura
con este conjunto de datos, sólo se pudieron examinar los resultados del
Figura 2Diagrama de flujo del estudio.
artículo original. Según los resultados dados en la tabla2, se ve que el método
de aprendizaje profundo propuesto fue mejor que los algoritmos de
Resultados de la aplicación:En este estudio, se clasificaron las señales de EEG del aprendizaje automático utilizados en el estudio original. Si bien se lograron
conjunto de datos GAMEEMO y se predijeron emociones positivas-negativas. Se utilizó valores de precisión del 73 y 66% para SVM y KNN, respectivamente, esta tasa
BiLSTM para el proceso de clasificación y el rendimiento del modelo de aprendizaje aumentó a ∼77% con el modelo BiLSTM. Según estos resultados, se puede
profundo se midió con valores de precisión, sensibilidad, especificidad y inferir que el método de aprendizaje profundo es al menos tan exitoso e
características operativas del receptor (ROC). Los parámetros del modelo BiLSTM incluso mejor que los métodos de aprendizaje automático existentes.
desarrollado se pueden resumir de la siguiente manera:
Tabla 2:Comparación de resultados de clasificación.
†Los datos de EEG, cuyos valores de entropía espectral se calcularon, se utilizaron en
Referencia SVM (precisión) KNN (precisión) BiLSTM (precisión)
la capa de entrada.
[14] 73% 66% —
†Luego se diseñó la capa BiLSTM de 128 unidades. La función ReLU se utilizó
el método propuesto — — 76,93%
como función de activación.