Está en la página 1de 89

2009

Universidad del Norte.


División de Ingenierías.
Departamento de Ingenierías
Eléctrica y Electrónica.

[CLASIFICACIÓN DE SEÑALES
Jaime Fernando Delgado Saa

EEG PARA APLICACIONES EN


EL DESARROLLO DE
INTERFACES HOMBRE -
MÁQUINA]
Tratamiento de señales EEG, selección y extracción de características y clasificación mediante
análisis discriminante, redes neuronales artificiales y máquinas de soporte vectorial.
CLASIFICACIÓN DE SEÑALES EEG PARA APLICACIONES EN EL
DESARROLLO DE INTERFACES CEREBRO – COMPUTADORA.

PRESENTADO A LA DIVISIÓN DE INGENIERÍAS

DEPARTAMENTO DE INGENIERÍA ELÉCTRICA Y ELECTRÓNICA

UNIVERSIDAD DEL NORTE

PARA LA OBTENCIÓN DEL TITULO DE MAGISTER EN INGENIERÍA


ELECTRÓNICA.

POR

JAIME FERNANDO DELGADO SAA.

INGENIERO ELECTRÓNICO Y ESPECIALISTA EN REDES DE COMPUTADORAS DE


NACIONALIDAD COLOMBIANA.

TRABAJO ASESORADO POR:

MSC MIGUEL ÁNGEL SOTAQUIRÁ GUTIÉRREZ


BARRANQUILLA – UNINORTE

2009
A Mi Padre, Carlos Emilio Delgado Angulo
“Science is but a perversion of itself unless it has
as its ultimate goal the betterment of humanity”.

Nikola Tesla
AGRADECIMIENTOS
Esta tesis es el resultado de 2 años de trabajo y no habría sido posible sin el apoyo soporte y
estimulo de muchas personas. En primer lugar quisiera agradecer a mi padre Carlos Emilio
Delgado Angulo por su apoyo en todos los aspectos de la vida, sus consejos y enseñanzas
han sido el principal elemento para el logro de las metas que hasta la fecha he alcanzado. Al
profesor Miguel Sotaquirá Gutierrez, por dirigir esta tesis y por el tiempo invertido en las
discusiones que se generaron alrededor del tema de investigación que aquí se trata.

Agradezco especialmente al Dr Christian Quintero Monroy por su continuo apoyo en el


desarrollo del trabajo, por estar siempre presto a la discusión y de quien aprendí mucho
durante estos dos años.

Al Dr Alois Schlögl de la universidad de Graz por su colaboración en la determinación de


los criterios de evaluación para Interfaces Cerebro – Computadora.

Agradezco también por su apoyo en el desarrollo del presente trabajo a los profesores
Julián Betancur y Juan Vélez. A los profesores Erick Vallejo Rodríguez y José Daniel Soto
por su especial colaboración en el desarrollo mi mis estudios de maestría.

A muchos amigos entre los cuales se encuentran Ronald Messino, Diego Gómez, Reinaldo
Pérez e Ivonne Robles por brindarme voces de ánimo y por su aporte con sugerencias
durante en desarrollo de este trabajo.
TABLA DE CONTENIDO
LISTA DE ACRÓNIMOS

AAR: Modelo autoregresivo adaptativo

AKC: Akaike criterio para selección del orden de modelos autoregresivos


ANN: Redes neuronales artificiales
AR: Autoregresivo
BBCI: Berlin Brain Computer Interface
BCI: Interfaz Cerebro -Computadora
BURG: Algoritmo paramétrico para cálculo de PSD
CMMR: Rechazo de modo común
ECoG: Electrcoticograma
EEG: Electroencefalograma
ERP: Potencial relacionado a eventos
FFT: Transformada rápida de Fourier.
FMRI: Imagen por resonancia magnética funcional
LDA: Análisis discriminante lineal
NISR: Espectroscopia por infrarrojo cercano
P300: Potencial electro-fisiológico que se presenta después de un evento extraño
PSD: Densidad espectral de potencia
SCP: Potenciales corticales lentos
SMR: Ritmos sensorimotores
STFT: Transformada de Fourier de tiempo corto
SVM: Máquina de vector de soporte
LISTA DE FIGURAS

Figura 1. Diagrama de bloques de una interfaz cerebro computadora. 6


Figura 2 Representación de plano discriminante y plano discriminante óptimo 12
Figura 3. Artículos publicados entre 1985 y 2004 sobre BCI’s. Tomado de de: [35] 15
Figura 4. Diagrama de flujo de la señal EEG en cada instante de tiempo.22
Figura 5. Densidad espectral de potencia (dependiente del tiempo) de la señal EEG en
C3.C4,Cz durante actividad motora (movimiento de la mano derecha) utilizando el
método de BURG con modelo AR de orden 10. 26
Figura 6. Densidad espectral de potencia (dependiente del tiempo) en C3, C4 y Cz utilizando la
FFT durante actividad motora (movimiento de la mano derecha). 26
Figura 7. Densidad espectral de potencia (dependiente del tiempo) promedio en C3, C4 y Cz
utilizando el método de BURG durante actividad motora relacionada con la clase 1
(columna izquierda) y con la clase 2 (columna derecha) 27
Figura 8.Densidad espectral de potencia (dependiente del tiempo) promedio en C3, C4 y Cz
utilizando la STFT durante actividad motora relacionada con la clase 1 (columna
izquierda) y con la clase 2 (columna derecha) 28
Figura 9. Índice de Fisher. Espectro calculado empleando el método de BURG. 29
Figura 10.Índice de Fisher. Espectro calculado empleando STFT. 30
Figura 11. Índice de Fisher para cada una de las 5 características citadas en la tabla 2. 32
Figura 12. Índice de Fisher para cada una de las 5 características citadas en la Tabla 3. 32
Figura 13. Error de clasificación del clasificador con base en los datos de entrenamiento.
34
Figura 14. Resultado de la clasificación de las señales EEG empleando las características
calculadas con el método de BURG 35
Figura 15. Resultado de la clasificación de las señales EEG empleando las características
calculadas con el método de STFT 35
Figura 16. Curso de la información mutua, precisión y relación señal a ruido empleando análisis
discriminante sobre los datos calculados con el método de BURG y la STFT. 37
Figura 17. . Resultado de la clasificación de las señales EEG mediante redes neuronales
empleando las características calculadas con el método de BURG 38
Figura 18. Matriz de confusión (BURG) 39
Figura 19. Resultado de la clasificación de las señales EEG mediante redes neuronales
empleando las características calculadas con STFT 40
Figura 20. Matriz de confusión (STFT) 41
Figura 21. Curso de la información mutua, precisión y relación señal a ruido empleando redes
neuronales sobre los datos calculados con el método de BURG y la STFT 42
Figura 22. Curso de la información mutua, precisión y relación señal a ruido empleando SVM
sobre los datos calculados con el método de BURG. 43
Figura 23. Curso de la información mutua, precisión y relación señal a ruido empleando SVM
sobre los datos calculados con la STFT. 44
Figura 24. Curso de la información mutua, precisión y relación señal a ruido empleando
máquinas de vector de soporte sobre los datos calculados con el método de BURG y
la STFT 45
Figura 25. Comparación del desempeño del análisis discriminante, las redes neuronales (ANN)
y la máquina de vector de soporte empleando los datos calculados con el método de
BURG 49
Figura 26. Comparación del desempeño del análisis discriminante, las redes neuronales (ANN)
y la máquina de vector de soporte empleando los datos calculados con la STFT
50
LISTA DE TABLAS

Tabla 1. Características del método de BURG y Yule-Walker 21


Tabla 2. Bandas de frecuencia con mayor separabilidad entre clases.(BURG) 31
Tabla 3. Bandas de frecuencia con mayor separabilidad entre clases (STFT). 31
Tabla 4. Comparación entre los resultados obtenidos con el método de BURG y la STFT.
36
Tabla 5. Matriz de confusión para los resultados empleando la BURG 36
Tabla 6. Matriz de confusión para los resultados empleando en método de STFT36
Tabla 7. Comparación de índices de desempeño para el método de BURG y la STFT. 36
Tabla 8. Índices de desempeño usando redes neuronales (BURG) 38
Tabla 9. Índices de desempeño empleando redes neuronales (BURG) 39
Tabla 10. Índices de desempeño empleando redes neuronales (STFT). 40
Tabla 11. Índices de desempeño empleando redes neuronales. 41
Tabla 12. Comparación de índices de desempeño para el método de BURG y la STFT con
Redes Neuronales. 41
Tabla 13. Información mutua máxima, error mínimo y máxima SNR empleando SVM y el
método de BURG. 43
Tabla 14. Matriz de confusión del sistema empleando SVM y el método de BURG. 43
Tabla 15. Kappa, precisión global del sistema y precisión específica empleando SVM y el
método de BURG 44
Tabla 16. Información mutua máxima, error mínimo y máxima SNR empleando SVM y la
STFT 44
Tabla 17. Matriz de confusión del sistema empleando SVM la STFT. 44
Tabla 18. Kappa, precisión global del sistema y precisión específica empleando SVM y el
método de BURG. 45
Tabla 19. Comparación de índices de desempeño, kappa, precisión y precisión específica para el
método de BURG y la STFT para el caso de máquinas de vector de soporte. 45
Tabla 20. Comparación entre los resultados obtenidos para IM, Error y SNR, con el método de
BURG y la STFT para el caso de las máquinas de vector de soporte. 46
Tabla 21. Comparación entre los tiempos de cómputo promedio (140 repeticiones) de la
densidad espectral para una sesión de 9 segundos con el método de BURG y la
STFT. 48
Tabla 22. Valores máximos obtenidos para la IM y el error mínimo con los tres métodos de
clasificación empleados usando las características calculadas con el método de
BURG. 48
Tabla 23. Valores para Kappa y precisión global obtenidos con los tres métodos de clasificación
empleados usando las características calculadas con el método de BURG. 49
Tabla 24. Valores máximos obtenidos para la IM y el error mínimo con los tres métodos de
clasificación empleados usando las características calculadas la STFT 50
Tabla 25. Valores para Kappa y precisión global obtenidos con los tres métodos de clasificación
empleados usando las características calculadas con la STFT. 50
Tabla 26. Diferencia en elvalor de Kappa para los clasificadores empleados, medida en errores
estándar 52
Tabla 27. Diferencia entre valores de Kappa entre STFT y BURG para un mismo clasificador,
medida en errores estándar 52
Tabla 28. Tiempo de cómputo para cada uno de los clasificadores empleados. 53
Tabla 29. Comparación de desempeños (tiempo de computo) entre parejas de cálculo de la
densidad espectral – clasificador. 53
ANEXO

INTRODUCCIÓN
1
1.1Motivación
La principal motivación para el desarrollo de Interfaces Hombre-Computadora (BCI) es
asistir a personas que han sufrido una enfermedad grave o enfermedad que impide la
realización de actividad motora, como es el caso de pacientes con Esclerosis Lateral
Amiotrófica (ALS) o pacientes con Apoplejía [ HYPERLINK \l "Ger05" 1 ]. Estas
enfermedades producen fallas en el sistema de control muscular, lo que tiene un impacto
negativo en la calidad de vida de las personas pues impide la realización de actividades
básicas que involucran entre otras la habilidad de las personas para comunicarse a través de
gestos, habla, escritura etc. 2].

Las BCI tienen la finalidad de establecer una vía de comunicación alterna entre el
hombre y la computadora (PC) [ HYPERLINK \l "Ger05" 1 ] y3], que no involucra el uso del
sistema muscular, sino que emplea señales EEG como señales de control para un PC u otro
dispositivo a través de este último.

Aunque las enfermedades y/o accidentes cerebro vasculares y sus consecuencias han
motivado el desarrollo de las BCI, las aplicaciones de esta tecnología no están limitadas a
estas situaciones. Personas que no sufren de ningún desmejoramiento de su habilidad para

1
ANEXO

realizar actividades motoras pueden usar las BCI en aplicaciones multimedia y de


entretenimiento. Algunos desarrollos [ HYPERLINK \l "Zha09" 4 ] y5] emplean este canal de
comunicación no-muscular para aplicaciones que involucran principalmente juegos y
realidad virtual.

Otro posible uso de las BCI se encuentra en el sector militar donde es posible emplear
las señales cerebrales en combinación con otras señales provenientes del cuerpo humano
para aumentar la velocidad de respuesta de pilotos. El programa de investigación ACT
(Alternative Control Technology) de la Fuerza Aérea de los Estados Unidos de América
tiene como meta el desarrollo de sistemas que permitan al usuario de un PC establecer
comunicación cuando sus manos están ocupadas con otra tarea [ HYPERLINK \l "Bay01" 6 ].

1.2Problemas Relacionados con las BCI y Enfoque de esta Tesis


Como ya se ha comentado previamente, las interfaces BCI se convierten en un medio de
comunicación alternativo1] para personas que han sufrido pérdida importante de su
habilidad motora que no les permite interactuar con el medio. En algunos casos el paciente
ha perdido cualquier habilidad de comunicación. La señal EEG, que es usada como fuente
de información, posee niveles de tensión muy bajos en amplitud comparados con los
niveles de tensión de señales no deseadas (ruido) lo que significa que la entrada del sistema
posee una relación señal a ruido muy baja.

La terea principal del sistema de adquisición y reprocesamiento (presente en toda BCI)


de la señal es minimizar el efecto del ruido. Luego la señal debe ser procesada para extraer
la información relevante (extracción de características), lo que involucra el procesamiento
de la señal EEG, la cual es no estacionaria. En algunos casos [ HYPERLINK \l "Xia08" 7 ],8],
[ HYPERLINK \l "Jan81" 9 ] y 10] el procesamiento de la señal EEG involucra la estimación de
la densidad espectral de potencia, donde el método empleado para dicha estimación
determinará en gran medida, la eficiencia del sistema.

Por otro lado se encuentra también restricción en cuando al costo computacional de la


solución planteada, pues dadas las características de las aplicaciones en las que se emplean
BCI’s, se requiere respuesta en tiempo real (o en vivo) por parte del sistema, en donde
además sea posible obtener respuesta para cada “trial”1 sin necesidad de realizar
promedios entre distintas pruebas.

Posterior al procesamiento de la señal es necesario determinar cuál de un número finito


de clases es la representada por la señal EEG, para lo cual se emplea un clasificador, esta
tarea, al igual que la extracción de características es también determinante de la eficiencia
1
En el “data-set” empelado, se denomina “trial” a cada prueba realizada con una duración de 9 segundos en
la cual el usuario realiza un actividad mentar específica entre el segundo 3 y el segundo 9.

2
ANEXO

del sistema y que requiere el uso, entre otras, de técnicas de aprendizaje de máquina, que
cumplan con el requerimiento de respuesta en “vivo” de modo que la aplicación sea útil.

Este trabajo se centra en la problemática referente a la extracción de características de


la señal EEG mediante la estimación espectral de potencia y en la clasificación de la
misma, por lo cual, las señales que se emplearán serán obtenidas de una base de datos
[ HYPERLINK \l "IDA08" 11 ] proporcionada por la universidad de Graz (Ver anexo). A estas
señales no se les realizará ningún tipo de procesamiento para minimizar el ruido ni eliminar
de artefactos2.

1.3Objetivos y Alcances.
El objetivo principal de este trabajo es desarrollar un conjunto de algoritmos que permitan
clasificar los potenciales eléctricos cerebrales relacionados con actividad motora (o
imaginación de actividad motora) para dos tipos de clases (dos actividades mentales
definidas).

Para tal fin se diseñará e implementará un conjunto de algoritmos que permitan extraer
características discriminantes de la señal EEG y se diseñarán e implementarán un conjunto
de algoritmos para la clasificación de las señales basándose en las características
discriminantes extraídas usando el primer algoritmo.

Los algoritmos desarrollados para extracción de características y clasificación serán


probados y comparados con base en métricas empleadas para evaluación de BCI’s (Kappa,
Información mutua, tasa de acierto de clasificación global y específica)12]. La base de
datos disponible corresponde a la presentada en la competencia BCI II por la universidad de
Graz donde se presenta un data-set para dos clases (imaginación del movimiento de la
mano derecha e imaginación del movimiento de la mano izquierda).

1.4Principales contribuciones
En este trabajo se diseña, implementa y se pone a prueba el bloque de procesamiento de
una Interfaz Cerebro-Computadora, el cual está compuesto principalmente por la extracción
de características y la clasificación.

Dada la necesidad de operación en tiempo real de este tipo de sistemas, se realiza una
comparación de los métodos para extracción de características en términos de desempeño y
tiempo de cómputo requerido. Se obtiene la comparación entre métodos paramétricos y no
paramétricos para la extracción de características de la señal EEG. La diferencia en la
2
Se denomina artefactos a interferencias en las señales biológicas debido a señales externas y movimiento del
paciente, que pueden afectar negativamente la calidad de la señal.

3
ANEXO

calidad de las características extraídas con cada uno de los métodos es medida con base en
el índice de Fisher y los valores de Kappa del sistema. El tiempo requerido para el cálculo
de la PSD ha sido tenido en cuenta para determinar cuál de los métodos se ajusta mejor a la
aplicación específica de las BCI.

En lo referente a la clasificación se obtiene la comparación de 3 distintos métodos de


clasificación empleando características obtenidas con métodos paramétricos y no
paramétricos. Esto permite seleccionar la mejor pareja (extracción de características –
clasificador) según en el desempeño del sistema, medido a su vez con base en distintos
índices empleados para la evaluación de BCI’s y con base también en el tiempo de
computo requerido.

Establecer una comparación entre dos métodos para la estimación de la densidad espectral
de potencia con el fin de determinar la conveniencia de la aplicación de métodos
paramétricos o no paramétricos en el desarrollo de BCI’s, en lo referente al análisis de las
componentes en frecuencia de la señal EEG relacionadas a eventos motores.

Establecer una comparación entre distintos métodos de clasificación con el fin de


determinar cual proporciona un mejor desempeño, medido con base en las métricas
empleadas para la evaluación de las BCI’s y a tiempo de computo.

1.5 Guía para la lectura de esta tesis


En el capítulo 2 se encuentra una revisión de temas necesarios para comprender el
funcionamiento del as interfaces cerebro computadora, así como una revisión de trabajos
relacionados donde se evidencian avances en el desarrollo de este tipo de sistemas.

En el capítulo 3 se describe la forma en que se desarrolla el presente trabajo indicando los


métodos empleados para extracción de características y la clasificación de las señales EEG.

En el capítulo 4 se muestran los resultados obtenidos tanto para la extracción de


características como para la clasificación empleando diversos métodos. Estos resultados
son discutidos desde el punto de vista de desempeño de los sistemas y el tiempo de
cómputo necesario, en el capítulo 5.

Basado en los resultados obtenidos, en el capítulo 6 se resumen las conclusiones obtenidas


del desarrollo del presente trabajo y se culmina con la propuesta de trabajos futuros en esta
área en el capítulo 7.

4
ANEXO

El anexo que se presenta contiene la descripción del “data-set” empleado para realizar las
distintas pruebas. Este “data-set” corresponde al presentado por la universidad de Graz en
la competencia BCI 2003.

5
ANEXO

MARCO TEÓRICO Y TRABAJOS


RELACIONADOS
2
Este capítulo incluye la información necesaria para comprender el funcionamiento y bases
científicas bajo las cuales operan las BCI’s, se incluye también una revisión de trabajos
realizados en el área que evidencia los principales retos en el desarrollo de este tipo de
sistemas.

2.1 Diagrama de bloques general de una Interfaz Hombre Computadora


En general una BCI está compuesta por los bloques que se muestran en la figura 4. El
bloque de adquisición de señales es el responsable de obtener las señales neurofisiológicas [
HYPERLINK \l "Ger05" 1 ]. La adquisición de las señales se puede realizar de manera invasiva o
no invasiva y se hace necesario el pre-procesamiento de la señal con el fin de eliminar ruido
que afecta la calidad de la seña, este ruido es debido a fuentes externas como internas. En el
caso de las fuentes externas, la interferencia causada por la red de alimentación domiciliaria
es la más importante, por lo que se involucran técnicas de filtrado como filtros adaptativos
y filtros “Notch”. El bloque de procesamiento se encarga de extraer características
relevantes en la señal EEG para luego, basado en el entrenamiento previo del sistema
determinar cuál de un conjunto posible de estados mentales está siendo descrito por las
características que presenta la señal. El resultado de la clasificación se muestra al usuario

6
ANEXO

con el fin de proporcionar retroalimentación, lo que permite tomar correcciones y mejorar


el desempeño del sistema.

Figura SEQ Figura \* ARABIC 1. Diagrama de bloques de una interfaz cerebro computadora.

2.2 Características de las señales EEG.


Las señales EEG son resultado de la actividad sináptica de las neuronas; el
electroencefalograma es la medición de las corrientes que fluyen durante la sinapsis entre
neuronas piramidales en la corteza cerebral. Aunque la magnitud de estas corrientes es muy
pequeña, la suma de las actividades de muchas neuronas genera un campo eléctrico que es
medible sobre la superficie del cuero cabelludo CITATION San07 \l 9226 [HYPERLINK \l
"San07"13] aunque trabajos recientes muestran que es posible medir señales EEG teniendo
contacto solo con el cabello y no con el cuero cabelludo, lo que facilita la medición, pues
no es necesario el uso de geles conductores CITATION LaC06 \l 9226 [HYPERLINK \l
"LaC06"14].

Debido a que la cabeza de un ser humano tiene varias capas (cuero cabelludo, cráneo,
cerebro) la señal EEG se atenúa de manera considerable al pasar por ellas, lo que hace que
la relación señal a ruido sea muy baja, razón por la cual los sistemas de adquisición de
señales deben ser muy precisos y poseer niveles de rechazo en modo común (CMRR)
suficientemente altos (>80dB) CITATION Gar98 \l 9226 [HYPERLINK \l "Gar98"15] para
atenuar de manera importante las fuentes de ruido.

7
ANEXO

La señal EEG puede ser dividida en 6 bandas principales según el contenido de


frecuencias, estas son: Delta (.5 – 4Hz), theta (4 – 7.5Hz), alpha (8 -12Hz), beta(14 –
26Hz), gamma (>30Hz) CITATION San07 \l 9226 [HYPERLINK \l "San07"13] y sigma(12
-15Hz) CITATION Mac05 \l 9226 [HYPERLINK \l "Mac05"16]. La inspección visual de la
señal EEG por parte del especialista puede revelar información sobre el funcionamiento del
cerebro.

Métodos de adquisición, características de la señal empleada en las interfaces hombre


computadora.

En lo referente a los métodos de adquisición las señales cerebrales pueden ser adquiridas
mediante técnicas invasivas o no invasivas. Las técnicas como Electrocorticograma,
(EcoG), Imagen por Resonancia Magnética Funcional (FMRI) y Espectroscopia de
Infrarrojo Cercano (NISR) proveen gran resolución pero tienen el inconveniente de
necesitar equipos voluminosos y costosos. En el caso específico de la ECoG es necesario
realizar una cirugía para ubicar los electrodos sobre la corteza cerebral, lo que además de
ser peligroso por el riesgo inherente de la operación, resulta ser costoso. Pese a esto la
ECoG es empleada en muchos trabajos de investigación CITATION HuR07 \l 9226
[HYPERLINK \l "HuR07"17], CITATION GUG09 \l 9226 [HYPERLINK \l "GUG09"18],
CITATION Hil \l 9226 [HYPERLINK \l "Hil"19] y CITATION Hug07 \l 9226 [HYPERLINK \l
"Hug07"20].

El EEG es una técnica no invasiva que no reporta riesgos para el usuario y es además
una técnica económica. Pese a que las señales obtenidas mediante EEG son altamente
afectadas por interferencias externas como lo son la interferencia electromagnética, mal
acople entre el electrodo y la piel y movimiento del paciente; es posible obtener suficiente
información para controlar la interfaz CITATION Hof07 \l 9226 [HYPERLINK \l "Hof07"2],
CITATION IDA08 \l 9226 [HYPERLINK \l "IDA08"11], CITATION LaC06 \l 9226
[HYPERLINK \l "LaC06"14], CITATION Lee05 \l 9226 [HYPERLINK \l "Lee05"5], CITATION
MCF97 \l 9226 [HYPERLINK \l "MCF97"3], CITATION JRW00 \l 9226 [HYPERLINK \l
"JRW00"8] empleando técnicas de procesamiento digital de señales para eliminación de
ruido.

En lo relacionado con el control de interfaces cerebro computadora, existen


principalmente dos métodos CITATION Küb07 \l 9226 [HYPERLINK \l "Küb07"21]. En el
primero el usuario aprende voluntariamente a controlar actividad cerebral por medio de
Bio-retroalimentación, que es un procedimiento en el cual al usuario se le presenta
información sobre su actividad cerebral (amplitud, frecuencia, etc. de la señal cerebral) y se
le pide que incremente o disminuya la actividad. Cuando el usuario realiza la actividad de
manera correcta se envía un estimulo visual o auditivo que refuerza el aprendizaje. En el

8
ANEXO

segundo caso el procedimiento es contrario, de modo que el usuario no requiere aprender a


controlar su actividad cerebral, el sistema es capaz de decodificar distintos estados o
actividades mentales adaptándose a cada usuario particular. La mayoría de los sistemas BCI
involucran los dos métodos para su operación, es decir, el usuario es entrenado para obtener
mediante Bio-retroalimentación control sobre las señales cerebrales (potencia en la banda
de 10Hz CITATION JRW00 \l 9226 [HYPERLINK \l "JRW00"8]) y el sistema además es
capaz de adaptarse a los cambios de la señal mientras el usuario realiza la actividad mental.

Tipos de señales neurofisiológicas empleadas en el diseño de BCI’s

Los tipos de señales neurofisiológicas CITATION Hof07 \l 9226 [HYPERLINK \l "Hof07"2]


normalmente empleados en el diseño de BCI’s son:

 Potenciales Relacionados a Eventos (ERP’s): Son potenciales que se desencadenan


como respuesta a un estimulo. Estos potenciales pueden ser medidos en el EEG antes
durante y después de un evento psicológico, motor o sensorial CITATION Küb07 \l
9226 [HYPERLINK \l "Küb07"21]. El ERP más usado en aplicaciones BCI es el P300, que
se presenta como una deflexión positiva en la señal EEG 300 ms después de la
presentación de un evento sorpresivo o extraño CITATION Hof07 \l 9226
[HYPERLINK \l "Hof07"2].

 Actividad Oscilatoria Cerebral (SMR): Son ritmos sinusoidales que aparecen en las
distintas bandas de frecuencia ya mencionadas (µ, β), siendo las de mayor importancia
para las BCI’s las oscilaciones en la banda alfa, beta y gamma, pues muestran una
relación con el movimiento o con la imaginación del mismo CITATION Ger05 \l 9226
[HYPERLINK \l "Ger05"1]. Así, para el control de la interfaz el usuario se debe concentrar
en la imaginación de un movimiento específico CITATION Küb07 \l 9226
[HYPERLINK \l "Küb07"21], originándose una desincronización en las bandas específicas
según el movimiento imaginado, lo que es interpretado por la interfaz ejecutándose una
acción predefinida. En CITATION JRW00 \l 9226 [HYPERLINK \l "JRW00"8],
CITATION Lee05 \l 9226 [HYPERLINK \l "Lee05"5], CITATION Xia08 \l 9226
[HYPERLINK \l "Xia08"7] se muestra el desarrollo de sistemas BCI que utilizan la
actividad oscilatoria cerebral en las bandas Alpha y Beta como entrada.

 Potenciales Corticales Lentos (SCP): Son potenciales de baja frecuencia que el usuario
puede aprender a controlar mediante Bio-retroalimentación. Dada su baja frecuencia
estos potenciales se ven como corrimientos en el nivel CD de la señal EEG, siendo
posible, con el entrenamiento previamente mencionado, generar corrimientos positivos
y negativos, lo que permite el control de dispositivos que posibiliten la comunicación

9
ANEXO

del usuario con el entorno, como se describe en CITATION Bir99 \l 9226 [HYPERLINK \l
"Bir99"22].

2.3 Procesamiento de la Señal EEG

2.3.1 Extracción de características

Con el fin de obtener información relevante a la realización de una tarea mental específica,
se realizan mediciones estadísticas de las características de la señal. Estas mediciones se
agrupan en lo que se conoce como un vector de características.

Este bloque del sistema mapea las características de la señal en un espacio de características
CITATION Gra04 \l 9226 [HYPERLINK \l "Gra04"23]. Estas características pueden ser los
coeficientes de un modelo autorregresivo de la señal cerebral CITATION Sch03 \l 9226
[HYPERLINK \l "Sch03"24], CITATION Vider \l 9226 [HYPERLINK \l "Vider"25] o la potencia
de la señal en una banda específica CITATION Xia08 \l 9226 [HYPERLINK \l "Xia08"7],
CITATION JRW00 \l 9226 [HYPERLINK \l "JRW00"8], CITATION Pin03 \l 9226
[HYPERLINK \l "Pin03"26].

Cuando se utiliza la actividad oscilatoria cerebral como entrada al sistema se emplean


métodos paramétricos y no paramétricos para el cálculo de la densidad espectral de
potencia.

Métodos no paramétricos:
Para obtener la distribución de potencia versus frecuencia de un proceso estocástico se
puede emplear la transformada de Fourier CITATION Bel01 \l 9226 [HYPERLINK \l
"Bel01"27]. El cálculo se basa en un segmento finito del la señal, de modo que si:

QUOTE (2.1)

Es la potencia de una realización del proceso en el intervalo de T a –T; el valor promedio


cuando QUOTE representa la verdadera potencia contenida en la
frecuencia QUOTE CITATION Bel01 \l 9226 [HYPERLINK \l "Bel01"27].

10
ANEXO

QUOTE

(2.2)

De lo cual se obtiene que:

QUOTE (2.3)

Y aplicando la relación inversa se obtiene que:

QUOTE (2.4)

QUOTE

(2.5)

Donde QUOTE representa la densidad espectral de potencia y QUOTE


es la función de autocorrelación. Como se puede ver, los métodos no para-
métricos se basan en el cálculo de la transformada de Fourier de la función de auto-
correlación de la señal muestreada. Los principales métodos no paramétricos empleados
para la estimación de la densidad espectral de potencia son CITATION Sto97 \l 9226
[HYPERLINK \l "Sto97"28]:

 Periodograma.
 Periodograma modificado
 Método de Barlet.
 Método de Welch.
 Método de Blackman – Tukey.

11
ANEXO

Métodos Paramétricos:
Los métodos no paramétricos se basan en el cálculo de la transformada de Fourier y
componen lo que se denomina métodos clásicos. Estos métodos no requieren mucha
información específica de la naturaleza de los datos CITATION SEM04 \l 9226
[HYPERLINK \l "SEM04"29], sin embargo al obtener información sobre la naturaleza de los
datos es posible seleccionar de manera más apropiada el tipo de ventana a emplear y las
técnicas de promediado de los datos. Sin embargo debido a que es necesario “enventanar”
los datos se producen distorsiones en el espectro estimado debido a la forma de la ventana
en sí y a que el método asume que la señal es cero fuera de la ventana.

Los métodos paramétricos hacen uso de un modelo para estimar el espectro de la señal.
El modelo se construye basado en datos actuales y previos de la señal. Los tipos de
modelos comúnmente empleados son los modelos autoregresivos (AR), los modelo de
media movible y (MA) y los modelos autoregresivos de media movible CITATION
SEM04 \l 9226 [HYPERLINK \l "SEM04"29]. Los modelos AR son útiles en señales con picos
agudos en el espectro pero con valles no muy profundos (como las señales EEG). La señal
es entonces estimada de un modelo que se basa en la siguiente ecuación:

(2.6)

Donde QUOTE es el orden del modelo, los valores de QUOTE


corresponden a los coeficientes del modelo autorregresivo y QUOTE es la
entrada de del sistema o función de ruido.

Con los métodos paramétricos la estimación de la densidad espectral de potencia se


basa en el cálculo de la respuesta en frecuencia de un modelo creado a partir de muestras de
la señal, de modo que cada muestra nueva se obtiene a partir de una combinación lineal de
las muestras previas, como se muestra en la ecuación 5. Dentro de este tipo de métodos se
destacan el método propuesto por Yule-Walker CITATION Sto97 \l 9226 [HYPERLINK \l
"Sto97"28] y el método de BURG CITATION Sto97 \l 9226 [HYPERLINK \l "Sto97"28].

2.3.2 Clasificación

En el marco de las interfaces Cerebro Computadora las técnicas más empleadas para
clasificación son: Análisis Discriminante (LDA), Redes Neuronales Artificiales (ANN) y
Máquinas Vector de Soporte (SVM)

12
ANEXO

Análisis discriminante lineal:


Es una técnica estadística que permite agrupar “objetos” en un conjunto de grupos que son
mutuamente excluyentes (clases) a partir de características medibles en cada uno de estos
objetos. El problema al realizar análisis discriminante se reduce a seleccionar la función o
regla que mejor separe los grupos. Si el número de clases es 2 la separación es una línea, si
el número de clases es 3, la función discriminante es una plano y para más de 3
dimensiones la separación se realiza por un híper plano.

Redes neuronales artificiales:


Una red neuronal artificial es un sistema que simula las propiedades observadas en los
sistemas biológicos (cerebro) para dar solución a problemas, buscando la misma
generalidad y robustez proporcionada por una red neuronal biológica.

Al contrario de los métodos convencionales donde el diseñador se ve en la necesidad de


modelar el sistema con un alto grado de formalismo matemático para luego generar un
conjunto de instrucciones (algoritmo) que dé solución al problema, las redes neuronales se
entrenan, de modo que el objetivo es que la red aprenda, para lo cual es necesario aplicar
señales de entrada, para las cuales se conoce la clase a que pertenecen CITATION Isa04 \l
9226 [HYPERLINK \l "Isa04"30].

Las redes neuronales han mostrado ser una herramienta importante para la clasificación
exitosa de señales EEG CITATION Biq05 \l 9226 [HYPERLINK \l "Biq05"31], si se
selecciona adecuadamente el modelo de red. En la actualidad se encuentran disponibles
herramientas que permiten realizar clasificación de señales EEG para reconocimiento de
patrones relacionados con problemas médicos CITATION Nue09 \l 9226 [HYPERLINK \l
"Nue09"32].

La principal ventaja de las redes neuronales sobre métodos como el del análisis
discriminante es que las redes no necesitan conocer el modelo de probabilidad del proceso,
pues la red neuronal puede adaptase a los datos sin especificación alguna del proceso que
genera los datos.

Algunos reportes sobre el uso de redes neuronales muestran que estas son mucho más
efectivas en la clasificación de las señales si se seleccionan cuidadosamente, CITATION
Jan81 \l 9226 [HYPERLINK \l "Jan81"9]. Boquiang y Wang CITATION Biq05 \l 9226
[HYPERLINK \l "Biq05"31] realizaron un estudio sobre clasificación de señales EEG en el cual
se muestra que el uso de redes BP (“Back-Propagation”) puede incrementar la tasa de
éxito en la clasificación de estas señales.

Las redes neuronales, dadas sus características de flexibilidad permiten diseñar


clasificadores prácticamente independientes del proceso que genera los datos, sin embargo

13
ANEXO

la selección correcta de las características de la red (modelo, topología tipo de aprendizaje)


son de gran importancia para obtener tasas de error bajas en cualquier sistema de
clasificación.

Algunos trabajos reportan bajo desempeño de las redes neuronales en aplicaciones BCI
CITATION ADL02 \l 9226 [HYPERLINK \l "ADL02"33], pero una mirada profunda revela que
la causa de tales tasas de error (claramente en el primer caso) es principalmente debida al
tipo de característica discriminantes entre clases, pues como se describe en CITATION
ADL02 \l 9226 [HYPERLINK \l "ADL02"33] estas no son diferenciables en gran medida.

No obstante las redes neuronales presentan la desventaja de requerir grandes recursos de


cómputo, lo que no las hace una técnica viable cuando dichos recursos son limitados.

Máquinas de vector de soporte:


Dado un grupo de muestras separables, la máquina de vector de soporte determina un plano
o híper-plano que separa los grupos. Dado que podrían existir muchos planos que
garantizan separabilidad entre grupos, la máquina de vector de soporte determina el plano
que ofrece la separación óptima, es decir, el plano que garantiza la máxima distancia entre
las muestras más distantes de cada grupo CITATION San07 \l 9226 [HYPERLINK \l
"San07"13]. La Figura 2 muestra esta situación. Aunque J2 (línea azul) separa los grupos
mostrados, J1 (línea roja) separa los grupos de manera óptima. En el presente trabajo se
hará uso de máquinas de vector de soporte con kernel lineal. Los resultados obtenidos se
compararán con los correspondientes a redes neuronales y análisis discriminante.

Figura SEQ Figura \* ARABIC 2 Representación de plano discriminante y plano discriminante óptimo

14
ANEXO

2.4 Criterios de evaluación para BCI´s


Con el fin de evaluar el desempeño de una BCI, un criterio debe ser empleado. El criterio
más empleado es la tasa de error o la precisión del sistema. Sin embargo la evaluación por
medio de la tasa de error no es siempre adecuada, dependiendo de la aplicación. Por tal
razón otros criterios han sido desarrollados y adoptados.

En la actualidad varios criterios son empleados para evaluar las BCI, entre estos, los mas
empleados son: La tasa de error, la información mutua y el coeficiente Kappa Cohen’s.

2.4.1 Exactitud de la clasificación y tasa de error.

La Exactitud en la clasificación (ACC) y la tasa de error QUOTE son


los criterios más empleados para la evaluación de sistemas BCI. En las competencias BCI
2003 y 2005 la tasa de error fue el criterio empleado en 9 de los 14 “data-sets”.

Sin embargo, debido a que por ejemplo, para un clasificador de dos clases ( M=2), la
probabilidad de éxito debido al azar es del 50%, un sistema podría, a la vista de este
criterio, presentar una tasa de error más baja debido al azar.

La ACC se calcula según la ecuación:

QUOTE
(2.7)

Donde QUOTE representa el número de muestras clasificadas de manera correcta.


La ACC recibe el nombre de Exactitud Global (OA) y puede ser obtenida también de la
matriz de confusión, que es una matriz que muestra la relación entre la intención del
usuario y la salida del clasificador.

2.4.2 Coeficiente Kappa Cohen’s

Es un coeficiente que indica el grado de acuerdo entre dos indicadores, de modo que el
valor de Kappa es cero si las clases predichas por el clasificador no muestran correlación
con las clases reales; el valor de kappa será 1 si existe total acuerdo entre las clases
predichas y las clases reales. Si el valor de kappa es menor de 0, esto indica que el

15
ANEXO

clasificador sugiere una asignación diferente entre las clases reales y las salida del sistema
CITATION ASc07 \l 9226 [HYPERLINK \l "ASc07"12].

El coeficiente Kappa emplea la ACC y el acuerdo accidental QUOTE o probabilidad


de acierto por azar.

QUOTE (2.8)

De modo que kappa se calcula como:

QUOTE (2.9)

2.4.3 Información Mutua

La meta final de una BCI es proveer un canal de comunicación entre el cerebro del usuario
y el medio ambiente CITATION ASc07 \l 9226 [HYPERLINK \l "ASc07"12]. Entonces la
teoría de comunicación de Shannon y Weaver puede ser aplicada directamente para
determinar la transferencia de información.

La competencia BCI en el data-set de la Universidad de Graz ha propuesto la información


mutua como un criterio de evaluación para sistemas BCI, en CITATION Sch03 \l 9226
[HYPERLINK \l "Sch03"24], CITATION Sch031 \l 9226 [HYPERLINK \l "Sch031"34] y
CITATION ASc07 \l 9226 [HYPERLINK \l "ASc07"12] se describe el cálculo de la
información mutua para sistemas BCI.

2.5 Sistemas existentes


El desarrollo de interfaces BCI ha tenido un auge importante en los últimos 10 años
CITATION Hon08 \l 9226 [HYPERLINK \l "Hon08"35], lo que se evidencia en el número de
publicaciones científicas presentadas por año. La Figura 3 muestra el número de artículos
presentados entre el año 1985 y el 2004.

16
ANEXO

Los trabajos con mayores aportes en el campo de las interfaces cerebro computadora según
el número de publicaciones al respecto de este tema y participación en eventos mundiales
conducentes al desarrollo de la tecnología empleada para mejorar los sistemas actuales son:

Figura SEQ Figura \* ARABIC 3. Artículos publicados entre 1985 y 2004 sobre BCI’s. Tomado de de: CITATION Hon08 \l
9226 [HYPERLINK \l "Hon08"35]

 BCI desarrollada por el Laboratorio de estudio de desordenes del sistema nervioso:


Wadsworth Center.
 BCI de GRAZ University.
 “Berlin Brain Computer Interface”
 “Tought Traslation Device”

Adicional a los aportes que se describen a continuación; estos grupos se han unido para
realizar un evento que se repite cada dos años desde el año 2001. El evento se llama “The
BCI Competition” en la cual participan universidades de todo el mundo, sin embargo la
única participación latinoamericana que se conoce hasta el 2008 está relacionada con el
presente proyecto, donde se ocupó el quinto puesto en la clasificación de señales EEG
empleando el “data-set” proporcionado por la Universidad del Graz. En el trabajo descrito
se emplearon redes neuronales como método de clasificación y estimación espectral por
métodos paramétricos (BURG).

17
ANEXO

2.5.1 BCI desarrollada por el Laboratorio de estudio de desordenes del sistema


nervioso: Wadsworth Center.

Este centro de investigaciones ha desarrollado dos sistemas BCI CITATION Sel07 \l 9226
[HYPERLINK \l "Sel07"36], los cuales tienen como entrada la actividad cerebral oscilatoria y
los potenciales P300 CITATION Hof07 \l 9226 [HYPERLINK \l "Hof07"2], CITATION
Sel07 \l 9226 [HYPERLINK \l "Sel07"36]. En el primer caso se usan las señales µ y β las
cuales muestra sincronización o desincronización con la ejecución de actividad motora,
estas señales se encuentran en las bandas 8 – 12Hz y 18 -26Hz respectivamente
CITATION San07 \l 9226 [HYPERLINK \l "San07"13], CITATION Mac05 \l 9226 [HYPERLINK
\l "Mac05"16].

Empleando los valores de potencia en cada una de las bandas citadas se puede
controlar el movimiento de un cursor. En 1991 este grupo reportó que un usuario puede
aprender a controlar sus señales µ con el fin de controlar el cursor en una dimensión
(Izquierda - Derecha). Luego de este desarrollo, la aplicación de extendió a más de dos
clases, donde el usuario puede seleccionar en pantalla 1 de 4 posiciones. Estos resultados se
obtuvieron mediante análisis estadístico “univariado” de la señal EEG.

En el 2004 se optó por un nuevo enfoque en el que se implementa un método basado


en regresión, obteniendo mejores resultados tanto para una dimensión como para 2
dimensiones, incluso si la configuración de las posiciones (targets) que el usuario debe
alcanzar son modificadas.

El segundo sistema diseñado por este grupo de investigación involucra el uso del
potencial P300. Este potencial se desencadena ante la aparición de un estimulo visual o
auditivo extraño entre un conjunto frecuente y estándar de estímulos CITATION Küb07 \l
9226 [HYPERLINK \l "Küb07"21]. El paradigma de la interfaz BCI mediante la adquisición del
potencial P300 se basa en una matriz de 6X6 símbolos, los cuales son resaltados en la
pantalla por filas y columnas. Cada vez que se resalta la columna o la fila que contienen el
símbolo que la persona desea seleccionar, se obtiene la señal P300. Luego, mediante un
sistema de clasificación se determina cual de los 36 posibles símbolos ha seleccionado el
usuario. Los resultados de este trabajo muestran que empleando 19 electrodos superficiales
sobre las zonas de la cabeza donde es posible obtener el potencial P300 se pudo establecer
que solo 6 ubicaciones proveen información relevante. Los métodos de clasificación
empleados en estos estudios involucran “Fisher Linear Classification”, Máquinas de Vector
de Soporte (SVM) y el método de correlación de Pearson, los cuales, según los resultados
preliminares, no muestran grandes diferencias en la precisión de la clasificación para el
caso de los potenciales P300 CITATION Sel07 \l 9226 [HYPERLINK \l "Sel07"36].

18
ANEXO

2.5.2 BCI de GRAZ University.

La interfaz cerebro computadora desarrollada por el laboratorio BCI de la universidad de


Graz emplea señales EEG asociadas con las oscilaciones de los ritmos β y µ o potenciales
evocados visuales y somato-sensoriales de estado estable como entradas del sistema.

La investigación está dirigida al uso de componentes espectrales complejas, selección de


características y estimación de parámetros auto-regresivos adaptativos (AAR) para mejorar
la clasificación en aplicaciones donde no es posible obtener valores promedios de las
señales CITATION Pfu07 \l 9226 [HYPERLINK \l "Pfu07"37] provenientes de la repetición de
una tarea mental. Las aplicaciones de esta interfaz incluyen el control de prótesis neurales,
control de sistemas de escritura y navegación en sistemas virtuales.

2.5.3 “Berlin Brain Computer Interface”

La interfaz desarrollada por este grupo de investigación es denominada “Berlin Brain


Computer Interface (BBCI)” CITATION Bla07 \l 9226 [HYPERLINK \l "Bla07"38]. Este
grupo basa su desarrollo en el empleo de técnicas de aprendizaje de máquina que buscan
que el sistema se ajuste a un grupo específico de características de la señal EEG de cada
usuario. De esta forma el usuario no debe aprender de la máquina sino, que por el contrario,
la máquina intenta ajustarse a características de cada usuario, no siendo necesarias largas
jornadas de entrenamiento y se obtienen buenos resultados desde el primer intento del
usuario por usar el sistema CITATION Bla07 \l 9226 [HYPERLINK \l "Bla07"38]. Se emplean
señales EEG relacionadas con el movimiento (pie derecho vs pie izquierdo), así como
modulaciones voluntarias de de ritmos sensorimotores por imaginación del movimiento.
Los resultados reportan tasas de transmisión de 35 bits CITATION Bla07 \l 9226
[HYPERLINK \l "Bla07"38] por minuto en un sistema de escritura libre, sin necesidad de
entrenamiento, lo que significa 4,5 letras por minuto incluyendo el tiempo tomado para
corregir errores durante la escritura.

2.5.4 “Tought Traslation Device”

La principal intención del las BCI es mejorar la calidad de vida de personas que han sufrido
algún tipo de accidente o enfermedad que limita el funcionamiento del sistema motor. En el
instituto de psicología medica y neurobiología conductista se desarrollo el “Thought
Traslation Device” (TTD) que permite comunicación verbal a través de la auto-regulación
de señales cerebrales. En este desarrollo se emplean los SCP para controlar el movimiento
de un cursor, que se utiliza luego para seleccionar un conjunto de letras. Estudios realizados
por este centro de investigación incluyen el uso de actividad oscilatoria cerebral (señales

19
ANEXO

QUOTE ) y ERP (potenciales P300). Al comprar el uso de SCP, P300 y señales


QUOTE , se evidencia que esta últimas ofrecen mayor rapidez y que su adquisición es
más fácil CITATION Hin07 \l 9226 [HYPERLINK \l "Hin07"39].

En los trabajos revisados se observa que son de gran interés las señales relacionadas con la
actividad oscilatoria cerebral como entrada para la BCI. Con el fin de obtener información
de esta señal, se emplean diversas técnicas de procesamiento para el cálculo de la densidad
espectral de potencia. Aunque se conoce que los métodos no paramétricos pueden brindar
una estimación aceptable de la densidad espectral de potencia de la señal EEG, otros
métodos han sido estudiados (AR, AAR, WAVELETS, etc.) sin embargo en algunos casos
el tiempo de computo es demasiado alto (WAVELETS). En lo que se refiere a la
clasificación, LDA es uno de los métodos más empleados junto con redes neuronales y las
SVM se perfilan como un método con gran potencial debido a su robustez. Este trabajo
busca determinar cuál de los métodos de clasificación citados ofrece un mejor desempeño,
en aplicaciones BCI, al mismo tiempo que se analizarán los resultados obtenidos al empelar
métodos paramétricos y no paramétricos en la estimación de la PSD.

20
ANEXO

DESCRIPCIÓN GENERAL DE LA
PROPUESTA. 3
En el presente trabajo se plantea el uso de los potenciales EEG relacionados con la
actividad oscilatoria cerebral motora, dado que es posible aprender a controlarlos mediante
entrenamiento (Bio-retroalimentación) y debido también a que existe una relación directa
entre la imaginación del movimiento y la actividad que se desea realizar. Además, no es
necesario esperar por la aparición de un estimulo externo para desencadenar la secuencia de
instrucciones que permite el control de dispositivos como en el caso de los potenciales
P300.

3.1 Cálculo de la densidad espectral de potencia


Teniendo en cuanta que se utilizará la actividad eléctrica oscilatoria como señal de entrada
al sistema y debido a que este tipo de señales presenta variación en la potencia de un grupo
de componentes de frecuencia específico con la realización o imaginación de actividad
motora, el método propuesto es el cálculo de la densidad espectral de potencia de la señal
(PSD).

21
ANEXO

Por ser la señal EEG es no estacionaria, los métodos convencionales podrían ser no
aptos para la estimación de la densidad espectral de potencia CITATION San07 \l 9226
[HYPERLINK \l "San07"13], CITATION Sto97 \l 9226 [HYPERLINK \l "Sto97"28]. Este trabajo
propone el uso de un método para-métrico de para la estimación espectral de potencia, a la
vez que propone realizar el mismo procedimiento mediante un método no-paramétrico, la
Transformada de Fourier de Tiempo corto (STFT) a fin de realizar una comparación en
términos de desempeño y costo computacional. Esto permitirá determinar, dependiendo de
las condiciones de operación del sistema, cuál de los métodos aquí propuestos se ajusta
mejor a la aplicación en tiempo real en términos de efectividad y eficiencia. Aunque la
bibliografía revisada muestra que en algunos casos los métodos paramétricos ofrecen una
mejor estimación del espectro de la señal EEG, no se encuentra un contraste de esta
efectividad con el tiempo de computo requerido para tal tarea en comparación con un
método no-paramétrico.

Si se requiere una representación de la densidad espectral de potencia en función del


tiempo y la frecuencia como sucede en las aplicaciones BCI que usan la actividad eléctrica
oscilatoria de las señales cerebrales, se emplea el espectrograma, que hace uso de la
transformada de Fourier de tiempo corto o STFT.

En el caso del empleo de métodos paramétricos, trabajos realizados CITATION


Sub05 \l 9226 [HYPERLINK \l "Sub05"40] muestran que el uso de métodos auto-regresivos
para la estimación de la densidad espectral de potencia de la señal EEG brinda una mejor
resolución que modelos no para-métricos. Sin embargo también se ha reportado en
CITATION Jan81 \l 9226 [HYPERLINK \l "Jan81"9] que en aplicaciones BCI los resultados
con FFT son en algunos casos muy aproximados a los obtenidos con algunos modelos auto-
regresivos.

Los algoritmos más empleados para el cálculo de modelos auto-regresivos de señales


son el propuesto por BURG y el algoritmo propuesto por YULE-WALKER. La tabla 1
Muestra las características principales de los dos algoritmos.

De acuerdo con la metodología propuesta se comparará un método para-métrico con


uno no paramétrico. Se utilizará el método paramétrico propuesto por BURG por brindar
mayor resolución en la estimación de datos de corta longitud, así como por generar un
modelo siempre estable con minimización del error en ambas direcciones. El método no
para-métrico que se implementará será la STFT pues provee resolución en tiempo y en
frecuencia, que es una característica importante en el análisis de señales EEG con
aplicaciones en BCI. CITATION San07 \l 9226 [HYPERLINK \l "San07"13]

22
ANEXO

BURG YULE-WALKER
No aplica ventanas a los datos Aplica ventanas a los datos
Minimiza en el sentido de mínimos Minimiza la predicción del
cuadrados, la predicción del error error hacia adelante.
hacia adelante y hacia atrás. Los
coeficientes del modelo AR se
CARACTERÍSTICAS restringen para satisfacer la recursión
L-D 3
Alta resolución para datos de longitud Pobre desempeño para datos
extensa de longitud reducida
Siempre produce un modelo estable No siempre produce un
del sistema que genera la señal modelo estable CITATION
Jan81 \l 9226 [HYPERLINK \l
"Jan81"9], CITATION
Sto97 \l 9226 [HYPERLINK \l
"Sto97"28]

Tabla SEQ Tabla \* ARABIC 1. Características del método de BURG y Yule-Walker

3.1.1 Estimación del espectro utilizando el método de BURG.


Los métodos de estimación para-métricos generan el modelo de un sistema que excitado
con ruido blanco produce la señal a la que se le está calculándola PSD. La respuesta en
frecuencia del sistema generado por medio de coeficientes auto-regresivos es la PSD de la
señal. Dado que la PSD arroja valores de vatios/Hz, para obtener el valor de potencia de la
señal para cada componente de frecuencia se multiplica cada punto de la PSD por un ancho
de banda igual a la resolución en frecuencia asignada durante el cálculo.

La señal EEG de la base de datos fue muestreada con una tasa de 128 muestras por
segundo. Este parámetro es fundamental para obtener una referencia correcta de la PSD, así
como también es necesario determinar el orden del modelo a emplear y la resolución en la
determinación de espectro. Dada la frecuencia de muestreo de 128Hz y seleccionando una
resolución de .125Hz que permite observar con suficiente detalle cómo se distribuye la
potencia en las componentes de frecuencia, resta por determinar el orden del modelo.
Trabajos relacionados CITATION Jan81 \l 9226 [HYPERLINK \l "Jan81"9] muestran que para
segmentos cortos de la señal EEG (no mayores a 1seg) se puede obtener una buena
estimación del espectro con ordenes tan bajos como 5 en la mayoría de los casos
estudiados, sin embargo un análisis visual de los datos revela que el criterio de selección
3
Recursión LD (Levinson - Durbin) es un algoritmo empleado para encontrar solución a
ecuaciones lineales con una estructura específica.

23
ANEXO

del orden el Akaike Information Criterion (AIC) CITATION San07 \l 9226 [HYPERLINK \l
"San07"13], CITATION Jan81 \l 9226 [HYPERLINK \l "Jan81"9] arroja un orden muy bajo y
se obtienen mejores resultados usando un orden de 10 CITATION Jan81 \l 9226
[HYPERLINK \l "Jan81"9]. Por lo anteriormente expuesto se selecciona un orden de 10, como
se sugiere en CITATION Jan81 \l 9226 [HYPERLINK \l "Jan81"9].

Figura SEQ Figura \* ARABIC 4. Diagrama de flujo de la señal EEG en cada instante de tiempo.

La Figura 4 muestra el diagrama de flujo del algoritmo desarrollado para obtener una
representación del cambio de potencia en una banda de frecuencias que abarca desde 7Hz
hasta 35Hz al correr el tiempo de la prueba. El algoritmo toma la señal y calcula para una
ventana de 1seg (128 muestras) el valor de la densidad espectral de potencia, luego la
ventana se mueve 1 muestra obteniéndose así un valor de potencia para cada frecuencia en

24
ANEXO

cada instante de tiempo. Dado que la longitud de la ventana es de 1seg, es necesario esperar
a que se obtengan 128 muestras de la señal, esto se traduce en un retardo en la salida de
1seg. Ahora bien, dada la forma en que se desplaza la ventana, el valor de potencia para
cada frecuencia en un instante de tiempo corresponde al valor promedio durante el último
segundo.

3.1.2 Estimación del espectro utilizando la transformada de Fourier de tiempo corto


Para establecer la comparación entre un método para-métrico y un método no para-métrico
se calculó la estimación espectral de potencia por medio de la STFT. Este algoritmo, al
igual que el propuesto para el método de BURG permite tener una representación en los
dominios del tiempo y la frecuencia.

3.1.3 Selección de características


Una vez obtenida la estimación espectral de la potencia en la señal EEG, se procede a
realizar una búsqueda de las características. Para tal fin se emplea el índice de Fisher, el
cual es un buen indicador del grado de separabilidad entre clases y ha sido ampliamente
empleado para en señales EEG CITATION Xia08 \l 9226 [HYPERLINK \l "Xia08"7]. El índice
de Fisher se calcula como se muestra en la ecuación 6,

(m1i  m2i ) 2
fri  (3.1)
 1i   2i
EMBED Equation.3 2 2

Donde y corresponde a las medias de la


EMBED Equation.3 m1i EMBED Equation.3 m2i
característica EMBED Equation.3 i para la clase 1 y 2 respectivamente,
EMBED
2y 2 son las varianzas de la clase 1 y 2 en la
Equation.3  1i EMBED Equation.3  2i
dirección de la característica EMBED Equation.3 i . Para este caso en particular, la
característica es el valor de potencia en cada componente de frecuencia, por lo tanto las
medias corresponden al valor promedio de potencia en cada componente de frecuencia en
el mismo instante de tiempo en todas las sesiones de entrenamiento que corresponden a la
clase 1. El mismo procedimiento se aplica para la clase 2 y para las varianzas en la potencia
de la señal en cada frecuencia y en cada clase.

25
ANEXO

3.2 Métodos empleados para la clasificación de las señales EEG.


Una vez seleccionadas las características es necesario clasificarlas entre las que pertenecen
a la clase 1 y las que pertenecen a la clase 2 según el “data-set” empleado (Ver Anexo).

Los métodos escogidos corresponden al análisis discriminante (LDA), redes neuronales


artificiales (ANN) y máquinas de vector de soporte (SVM), métodos empleados
actualmente en el desarrollo de sistemas BCI por su facilidad de implementación,
flexibilidad y robustez respectivamente.

Los métodos de clasificación se aplicarán a los vectores de características calculados con


BURG y con la STFT lo que permitirá comparar el desempeño de la BCI al variar el
método de extracción de características. La comparación del desempeño se hará con base
en las métricas de información mutua, coeficiente Kappa Cohen’s y tasa de acierto en la
clasificación descritos en la sección 2.5.

26
ANEXO

27
ANEXO

RESULTADOS 4
4.1 Determinación de la PSD: método de BURG
Basado en el algoritmo descrito en la sección 3.1 se calcula la PSD para las tres señales
disponibles (C4, C3 y CZ). La figura 5 muestra el espectro calculado donde se han tenido
en cuenta los valores de frecuencia entre 7 y 35Hz que abarca alpha, sigma, y beta.

4.2 Estimación de la PSD usando la STFT.


La implementación de esta estimación se realiza por medio de la función “spectrogram” de
MATLAB. Al igual que en el método de BURG, se establece el corrimiento de la ventana a
una muestra, lo que proporciona un valor de salida por cada muestra de entrada y que al
mismo tiempo causa un retardo de 1seg en la señal de salida.

La figura 6 muestra el resultado de la estimación espectral de potencia para C3, C4 y


Cz, durante la misma actividad motora analizada con el método de BURG.

28
ANEXO

Figura SEQ Figura \* ARABIC 5. Densidad espectral de potencia (dependiente del tiempo) de la señal EEG en C3.C4,Cz
durante actividad motora (movimiento de la mano derecha) utilizando el método de BURG con modelo AR de orden
10.

29
ANEXO

Figura SEQ Figura \* ARABIC 6. Densidad espectral de potencia (dependiente del tiempo) en C3, C4 y Cz utilizando la
FFT durante actividad motora (movimiento de la mano derecha).

En la figuras 5 y 6 se puede observar una diferencia importante en la representación de


la densidad espectral de potencia. El método paramétrico de BURG (Figura 5) permite
apreciar de mejor manera los picos de potencia de la señal en las distintas componentes de
frecuencia. Pese a esto, tanto la STFT como el algoritmo propuesto que utiliza el método de
BURG permiten observar que las bandas con mayor potencia se centran alrededor de 10Hz
y 20Hz respectivamente, siendo estas las bandas mencionadas en la literatura como las que
muestran relación con la actividad motora y la imaginación de la actividad motora
CITATION Ger05 \l 9226 [HYPERLINK \l "Ger05"1], CITATION Mac05 \l 9226
[HYPERLINK \l "Mac05"16], CITATION Xia08 \l 9226 [HYPERLINK \l "Xia08"7], CITATION
ADL02 \l 9226 [HYPERLINK \l "ADL02"33].

Dado que las figuras 5 y 6 solo muestran la densidad espectral de potencia para una
sesión, en la Figura 7 se muestra el valor promedio de la densidad espectral de potencia
(método de BURG) en cada componente de frecuencia en cada instante de tiempo para las
140 sesiones con las que se cuenta en el “data-set”, agrupadas de modo que en la izquierda
se muestran los valores de potencia promedio en cada componente, en cada instante de
tiempo, para las sesiones en las que se realiza la actividad mental correspondiente a la clase
1 (imaginación del movimiento de la mano izquierda) y en la derecha lo correspondiente a
la clase 2 (imaginación del movimiento de la mano derecha)

30
ANEXO

Figura SEQ Figura \* ARABIC 7. Densidad espectral de potencia (dependiente del tiempo) promedio en C3, C4 y Cz
utilizando el método de BURG durante actividad motora relacionada con la clase 1 (columna izquierda) y con la clase 2
(columna derecha)

La Figura 7 revela que en promedio, las componentes alrededor de 10Hz y 20Hz, alfa y
beta respectivamente, son las bandas con mayor concentración de potencia / Hz. Además es
posible observar que existen diferencias en las potencias en alfa y beta para la clase 1 y la
clase 2. Las variaciones observadas solo son importantes a partir del segundo 3, momento
(según el protocolo con que se creó el “data-set”) en que el sujeto de prueba realiza la
actividad mental.

La figura 8 muestra el cálculo anteriormente explicado para el promedio de la densidad


espectral de potencia utilizando la STFT.

31
ANEXO

Figura SEQ Figura \* ARABIC 8.Densidad espectral de potencia (dependiente del tiempo) promedio en C3, C4 y Cz
utilizando la STFT durante actividad motora relacionada con la clase 1 (columna izquierda) y con la clase 2 (columna
derecha)

La Figura 8 muestra que la densidad espectral de potencia estimada alrededor de 10Hz


y 20Hz es menor que la estimada con el método de BURG, sin embargo es posible observar
también que para la clase 1 y la clase 2 existen diferencias marcadas en la potencia en alfa y
beta en los canales C3 y C4. Este fenómeno es debido a la sincronización y
desincronización de las señales cerebrales con la ejecución del la actividad motora (o
imaginación de la misma), como se explica en CITATION San07 \l 9226 [HYPERLINK \l
"San07"13], CITATION Ger05 \l 9226 [HYPERLINK \l "Ger05"1], CITATION Mac05 \l 9226
[HYPERLINK \l "Mac05"16].

4.3 Separabilidad entre clases: índice de Fisher

Aunque se identificaron las bandas de frecuencia de la señal EEG con mayor potencia y se
evidencian también diferencias entre la potencia de la señal en bandas específicas para cada
una de las clases, es necesario verificar que tan discriminante es esta característica. Se
adopta entonces el criterio de Fisher sobre los valores de Potencia de la señal EEG en cada
una de las componentes de frecuencia y en cada instante de tiempo. Esto permite saber,

32
ANEXO

dado que el experimento se repite 140 veces, el valor de separabilidad de la componente fi


de la señal en el instante tj

La Figura 9 muestra el índice de Fisher de la señal EEG para el cálculo de potencia


realizado con el método de BURG.

Figura SEQ Figura \* ARABIC 9. Índice de Fisher. Espectro calculado empleando el método de BURG.

La Figura 9 evidencia que las componentes alrededor de 10 y 20Hz además de poseer


la mayor potencia también son las que poseen mayor separabilidad. Según el índice de
Fisher, para las dos clases presentes en el experimento. Sin embargo, el nivel de
separabilidad no se mantiene durante el tiempo de la prueba. Esto es debido a la re-
sincronización de las señales cerebrales luego de la realización de la tarea mental
CITATION Ger05 \l 9226 [HYPERLINK \l "Ger05"1].

33
ANEXO

Dado que el índice de Fisher determina la separabilidad entre clases, se seleccionan las
componentes de frecuencia con mayor índice de Fisher. La Tabla 2 resume los anchos de
banda en los cuales se encuentran los valores más altos para el índice de Fisher en cada uno
de los electrodos. Nótese que no se indican los valores de frecuencia para Cz dentro de la
banda beta, pues el cálculo del índice de Fisher muestra que la separabilidad ofrecida por
esta característica es muy baja y no se concentra alrededor de una componente de
frecuencia específica. (Ver Figura 9)

La Figura 10 muestra el valor del índice de Fisher para el caso en que la estimación
espectral de potencia se realiza mediante la STFT.

Figura SEQ Figura \* ARABIC 10.Índice de Fisher. Espectro calculado empleando


STFT.
Frecuencia con índice de Fisher Frecuencia con índice de Fisher
medio mayor en alfa medio mayor en beta
C4 9.0Hz-11.5Hz 19.5Hz – 22.5Hz
C3 10Hz-11.5Hz 20.5Hz - 22Hz
Cz 9.0Hz – 11.5Hz -

34
ANEXO

Tabla SEQ Tabla \* ARABIC 2. Bandas de frecuencia con mayor separabilidad entre clases.(BURG)

Al comparar la Figura 9 y la Figura 10 se observa que los valores obtenidos para el


índice de Fisher empleando el método de la STFT son menores que los obtenidos con el
método de BURG (ver valores máximos de las escalas de amplitud en las figuras 9 y 10)
indicando una menor separabilidad entre clases al calcular la densidad espectral de potencia
mediante la STFT. La Tabla 3 muestra los valores de frecuencia en los cuales se obtienen
los máximos para el índice de Fisher para los 3 electrodos usados empleando la STFT.

Frecuencia con índice de Fisher Frecuencia con índice de Fisher


medio mayor en alfa medio mayor en beta
C4 9.0Hz-11.5Hz 19.5Hz – 21.5Hz
C3 10Hz-12Hz 20.5Hz - 22Hz
Cz 10.5Hz – 12Hz -

Tabla SEQ Tabla \* ARABIC 3. Bandas de frecuencia con mayor separabilidad entre clases (STFT).

4.4 Vector de características discriminantes.


Una vez seleccionadas las bandas de frecuencia es posible establecer el vector de
características, el cual está compuesto por 5 elementos (ver tabla 2 y 3). Cada elemento
corresponde a la potencia en cada una de las bandas antes mencionadas. Las características
(elementos del vector) pueden ser estratificadas, según el aporte que cada una de ellas
provee. Dicho aporte puede ser medido nuevamente por el índice de Fisher.

Para la potencia de la señal calculada con el método de BURG, la Figura 11 muestra el


valor del índice de Fisher para cada una de las características a medida que transcurre el
tiempo de cada sesión. Se muestra solo el valor a partir del segundo 3 pues es el momento
en que el usuario es advertido de realizar la actividad mental.

El mismo procedimiento se aplica al cálculo de la potencia por medio de la STFT


obteniéndose los resultados mostrados en la Figura 12.

35
ANEXO

Figura SEQ Figura \* ARABIC 11. Índice de Fisher para cada una de las 5 características citadas en la tabla 2.

Figura SEQ Figura \* ARABIC 12. Índice de Fisher para cada una de las 5 características citadas en la Tabla 3.

36
ANEXO

4.5 Algoritmos de Clasificación


La prueba se realiza empleando las métricas empeladas en la “BCI competition II” y “BCI
competition IV” cuyos métodos se incluyen en Biosig CITATION Sch08 \l 9226
[HYPERLINK \l "Sch08"41] . En el primer caso la interfaz se analiza como un sistema de
comunicaciones CITATION Sch02 \l 9226 [HYPERLINK \l "Sch02"42], CITATION Sch031 \l
9226 [HYPERLINK \l "Sch031"34] lo que permite establecer parámetros como Información
Mutua (MI), Relación señal a ruido (SNR), Tasa de error (ER). Bajo este punto de vista el
sistema ofrece un mejor desempeño en la medida que la información mutua obtenida tenga
un mayor valor, lo que significa que la perdida de información en el canal es menor.

En el segundo caso se utiliza el coeficiente Kappa CITATION ASc07 \l 9226


[HYPERLINK \l "ASc07"12], el cual mide el grado de acuerdo entre dos estimadores y dado que
tiene en cuenta la concordancia entre los estimadores debido al azar se considera un
estimador muy robusto. En este caso un valor alto en kappa significa un mayor acuerdo
entre los estimadores, lo que significa que la clasificación de las actividades mentales es
acertada.

Se describirá el proceso empleando el cálculo de la densidad espectral de potencia


utilizando el método de BURG, y luego se mostrarán los resultados empleando la STFT; en
ambos casos, para cada uno de los clasificadores implementados

4.5.1 Clasificación de las señales EEG mediante análisis discriminante.

Las características discriminantes seleccionadas antes, se usarán para entrenar un


clasificador LDA. Se probará el clasificador agregando, una a la vez, las características
citadas, lo que permitirá verificar el aporte de cada característica. La métrica que se
empleará calificar el desempeño del sistema es el valor de la información mutua pico, y se
analizarán los valores del error mínimo en el sistema.

La Figura 13 muestra los errores de clasificación al entrenar el clasificador, agregando


una carácteristica a la vez. La información del error de clasificación es basada en los datos
de entrenamiento, es decir, al establecer la función discriminante sobre los datos de prueba
se obtiene un error si todos los datos no pueden ser clasificados de manera correcta.

37
ANEXO

Figura SEQ Figura \* ARABIC 13. Error de clasificación del clasificador con base en los datos de entrenamiento.

Los datos mostrados en la Figura 13 no se calcularon mediante la métrica propuesta


por la competencia BCI, pero son un indicador de cómo mejora la tarea de clasificación al
agregar características discriminantes. Al comparar las graficas se observa que la tasa de
error mínima alcanzada es menor para las características calculadas por el método
paramétrico, como era de esperarse, pues este método se ajusta mejor a las características
de la señal EEG como se mencionó antes, sin embargo la diferencia entre los errores de
clasificación no supera el 2% .

Se procede entonces a extraer las señales de prueba, las cuales se incluyen en el data-
set empleado y para las cuales inicialmente no se conocen las marcas o “labels”. Se extraen
las características discriminantes con los algoritmos propuestos seleccionando las bandas
de frecuencia según el procedimiento realizado, cuyos resultados se muestran en las tablas
2 y 3. Estas señales son aplicadas al clasificador LDA que ha sido entrenado con los datos
de entrenamiento (ver Anexo) y se obtienen los resultados que se muestran a continuación,
en términos de la información mutua del sistema, el error y la relación señal a ruido.

En las figuras 14 y 15 se muestra el resultado de clasificación para las características


obtenidas por el método de BURG y STFT respectivamente.

38
ANEXO

Figura SEQ Figura \* ARABIC 14. Resultado de la clasificación de las señales EEG empleando las características
calculadas con el método de BURG

Figura SEQ Figura \* ARABIC 15. Resultado de la clasificación de las señales EEG empleando las características
calculadas con el método de STFT

39
ANEXO

La tabla 4 resume los parámetros más importantes de los resultados, donde es posible
apreciar que el desempeño del sistema empleando las características obtenidas mediante el
método de BURG ofrece valores pico más altos que los obtenidos mediante la STFT.

Máxima IM Mínimo Error Máxima SNR


BURG 0.5459 13.57% 1.1314
STFT 0.4323 16.43% 0.8209

Tabla SEQ Tabla \* ARABIC 4. Comparación entre los resultados obtenidos con el método de BURG y la STFT.

Teniendo en cuenta que existen muchas métricas propuestas que permiten la


comparación entre distintos sistemas, se muestran a continuación mediciones del
desempeño del sistema empleando la métrica propuesta en la competencia BCI IV.

Las tablas 5 y 6 muestran la matriz de confusión para los resultados de clasificación


para el sistema con el método de BURG y con la STFT respectivamente.

Clases 1 2 Total
1 32578 (36,3%) 12292(13,7) 44870(50.0%)
2 12062(13.4%) 32808(36,6%) 44870(50.0%)
Total 44640(49,7%) 45100(50,3%) 89740(100.0%)

Tabla SEQ Tabla \* ARABIC 5. Matriz de confusión para los resultados empleando la BURG

Clases 1 2 Total
1 31781(35,4%) 13089(14,6%) 44870(50,0%)
2 12590(14,0%) 32280(36,0%) 44870(50,0%)
Total 44371(49,4%) 45369(50,6%) 89740(100%)

Tabla SEQ Tabla \* ARABIC 6. Matriz de confusión para los resultados empleando en método de STFT

A partir de estas matrices es posible extraer el coeficiente Cohen’s Kappa y el error del
mismo, la tasa de acierto global y la tasa de acierto específica. Estos datos se resumen en la
tabla 7, donde se incluye además la precisión específica de la clasificación, que indica el
grado de acierto del sistema para cada una de las clases.

Precisión Específica
Kappa Error Kappa Precisión
Clase 1 Clase 2
BURG 0.4572 0.0046 72.86% 72.79% 72.93%
STFT 0.4277 0.0045 71.39% 71.23% 71.54%

Tabla SEQ Tabla \* ARABIC 7. Comparación de índices de desempeño para el método de BURG y la STFT.

40
ANEXO

Figura SEQ Figura \* ARABIC 16. Curso de la información mutua, precisión y relación señal a ruido empleando análisis
discriminante sobre los datos calculados con el método de BURG y la STFT.

Los indicadores de desempeño empleados muestran que el funcionamiento de la


interfaz es siempre mejor (en términos de los valores de Kappa y de precisión del sistema)
empleando las características calculadas con el método de BURG. El error estándar de
Kappa se muestra para enfatizar los dos sistemas mostrados son comparables, pues la
diferencia en la desviación en la medición del parámetro Kappa es muy pequeña (0,0001).
El valor de Kappa es mayor para el método de BURG, indicando un mayor acuerdo entre
los datos de salida del sistema y los resultados verdaderos que el alcanzado empleando la
STFT. La tasa de error global y la específica son también mayores para el método de
BURG. La Figura 16 muestra el curso de la información mutua, la precisión y la relación
señal a ruido para los dos métodos comparados (BURG - STFT).

4.5.2 Clasificación de las señales mediante redes neuronales artificiales.

El segundo método de clasificación está basado en redes neuronales artificiales. Se


empleará una red neuronal artificial con una capa oculta y una capa de salida. El algoritmo
de entrenamiento empleado es el de gradiente escalado, el cual es computacionalmente

41
ANEXO

menos costoso que los otros algoritmos disponibles como el de gradiente conjugado y el de
Levenberg-Marquardt.

Se empleará el vector de características seleccionado anteriormente, para entrenar la


red. La tabla 8 muestra los resultados obtenidos para los índices de desempeño para el
vector de características calculado empleando el método de BURG para redes neuronales
con 1, 5, 10, 15, 20 y 25 neuronas en la capa oculta, de las cuales se toma la que ofrece
mejores resultados.

Número de Neuronas
1 5 10 15 20 25
Información Mutua Máxima 0.5459 0.5448 0.5110 0.5509 0.5693 0.5113
Mínimo Error 13,57% 14,29% 14,29% 15,00% 15,71% 15,00%
Máxima SNR 1.1315 1.1281 1.0306 1.1464 1.2018 1.0316
Coeficiente Cohen’s Kappa 0.4593 0.4520 0.4563 0.4270 0.4406 0.4239
Error estándar Kappa 0.0046 0.0046 0.0046 0.0046 0.0046 0.0045
Precisión Global 0.7296 72,60% 72,81% 71,35% 72,03% 71,19%

Tabla SEQ Tabla \* ARABIC 8. Índices de desempeño usando redes neuronales (BURG)

Figura SEQ Figura \* ARABIC 17. . Resultado de la clasificación de las señales EEG mediante redes neuronales
empleando las características calculadas con el método de BURG

42
ANEXO

Se observa de la tabla 8 que el mejor desempeño global se obtiene para la red con una
neurona, aunque con las otras redes es posible obtener mayores valores de la información
mutua, los valores de precisión global, kappa, y error mínimo son mayores en la red con
una neurona. Este resultado resulta interesante y podría sugerir que al emplear el método de
BURG, las características son lo altamente distinguibles, tanto que con una sola neurona se
obtienen buenos resultados de clasificación y que al emplear más neuronas el sistema
pierde generalidad. La Figura 17 muestra el curso de la información mutua, la relación
señal a ruido y la precisión para el caso de una neurona. La Figura 18 muestra la matriz de
confusión, donde los cuadros en color verde muestran el número de veces que se clasificó
bien la señal en cada clase, mientras que los cuadros en rojo muestran el número de errores
en cada clase. En la tabla 9 se muestran los valores de desempeño obtenidos a partir de la
matriz de confusión.

Figura SEQ Figura \* ARABIC 18. Matriz de confusión (BURG)

Precisión Específica
Kappa Error Kappa Precisión
Clase 1 Clase 2
BURG 0.4593 0.0046 72,96% 73,82% 72,05%

Tabla SEQ Tabla \* ARABIC 9. Índices de desempeño empleando redes neuronales (BURG)

43
ANEXO

Empleando las características obtenidas con la STFT se obtienen los siguientes


resultados:

Número de Neuronas
Parámetro 1 5 10 15 20 25
Información Mutua Máxima 0.5144 0.5064 0.5161 0.5237 0.5215 0.5464
Mínimo Error 15,71% 14,29% 13,57% 13,57% 17,14% 13,57%
Máxima SNR 1.0404 1.0179 1.0452 1.0667 1.0605 1.1330
Coeficiente Cohen’s Kappa 0.4339 0.4304 0.4184 0.4296 0.4195 0.4330
Error estándar Kappa 0.0046 0.0046 0.0045 0.0046 0.0045 0.0046
Precisión Global 71,69% 71,52% 70,92% 71,48% 70,98% 71,65%

Tabla SEQ Tabla \* ARABIC 10. Índices de desempeño empleando redes neuronales (STFT).

Figura SEQ Figura \* ARABIC 19. Resultado de la clasificación de las señales EEG mediante redes neuronales
empleando las características calculadas con STFT

Al comparar los parámetros obtenidos para cada una de las redes se observa que la red
con 25 neuronas provee los mejores resultados. En este caso la red que ofrece el mejor
resultado necesita un número mayor de neuronas que en el caso en que se emplea en
método de BURG, lo que sugiere que la STFT no provee características suficientemente
discriminantes por lo que es necesaria una relación más compleja entre los valores de

44
ANEXO

entrada y los de salida. La Figura 19 muestra el curso de la información mutua, la relación


señal a ruido y la precisión para el caso de 25 neuronas. La Figura 20 muestra la matriz de
confusión para los resultados obtenidos y la tabla 11 muestra los parámetros de desempeño
del sistema.

Figura SEQ Figura \* ARABIC 20. Matriz de confusión (STFT)

Precisión Específica
Kappa Error Kappa Precisión
Clase 1 Clase 2
STFT 0.4330 0.0046 71,65% 71,89% 71,41%

Tabla SEQ Tabla \* ARABIC 11. Índices de desempeño empleando redes neuronales.

Al comparar los resultados de clasificar las señales EEG con redes neuronales se observa
que los parámetros de desempeño son mayores para el caso en que el vector de
características es calculado mediante el método de BURG. La tabla 12 muestra los
resultados obtenidos con el método de BURG y la STFT empleando redes neuronales
artificiales. La Figura 21 muestra además la comparación del curso de la información
mutua, la precisión y la relación señal a ruido para los métodos citados.

Precisión Específica
Kappa Error Kappa Precisión
Clase 1 Clase 2
STFT 0.4330 0.0046 71,65% 71,89% 71,41%
BURG 0.4593 0.0046 72,96% 73,82% 72,05%

45
ANEXO

Tabla SEQ Tabla \* ARABIC 12. Comparación de índices de desempeño para el método de BURG y la STFT con Redes
Neuronales.

Figura SEQ Figura \* ARABIC 21. Curso de la información mutua, precisión y relación señal a ruido empleando redes
neuronales sobre los datos calculados con el método de BURG y la STFT

Al observar los resultados de la clasificación con redes neuronales artificiales para los
datos calculados con BURG y la STFT se observa que con BURG los valores pico de los
índices que se emplean para determinar si un sistema es mejor que otro son mayores
comparado con la STFT, sin embargo la diferencia en los valores pico de la información
mutua no son muy apreciables, así como la tasa de precisión alcanzada muestra valores con
diferencias no superiores al 2%.

4.5.3 Clasificación empleando máquinas de vector de soporte

Para clasificar las señales mediante máquinas de vector de soporte se utilizó el software
SVM Light CITATION Joa99 \l 9226 [HYPERLINK \l "Joa99"43], para el cual existe una
interfaz que permite la comunicación con Matlab desarrollada por Tom Briggs CITATION
Tom09 \l 9226 [HYPERLINK \l "Tom09"44], (Assistant Professor of Computer Science,
ShippensBURG University.)

46
ANEXO

Se entrenó la SVM empleando un Kernel lineal debido al requerimiento de ejecución en


vivo; con los vectores de característica ya citados calculados con la STFT y el método de
BURG. La Figura 22 muestra el curso de la información mutua, la precisión y la relación
señal a ruido para el sistema. La tabla 13 resume los valores de la Figura 22 indicando los
valores máximos y mínimos más importantes. La tabla 14 y 15 muestran la matriz de
confusión y el valor de Kappa y los valores de precisión para el sistema para el vector de
características obtenido mediante el método de BURG.

Figura SEQ Figura \* ARABIC 22. Curso de la información mutua, precisión y relación señal a ruido empleando SVM
sobre los datos calculados con el método de BURG.

Máxima IM Mínimo Error Máxima SNR


BURG 0.4812 15% 0.9486

Tabla SEQ Tabla \* ARABIC 13. Información mutua máxima, error mínimo y máxima SNR empleando SVM y el
método de BURG.

Clases 1 2 Total
1 29944(33,4%) 14926(16,7%) 44870(50,0%)
2 10117(11,2%) 34753(38,7%) 44870(50,0%)
Total 40061(44,6%) 49679(55,4%) 89740(100%)

47
ANEXO

Tabla SEQ Tabla \* ARABIC 14. Matriz de confusión del sistema empleando SVM y el método de BURG.

Precisión Específica
Kappa Error Kappa Precisión
Clase 1 Clase 2
BURG 0.4419 0.0046 72,09% 70,51% 73,51%

Tabla SEQ Tabla \* ARABIC 15. Kappa, precisión global del sistema y precisión específica empleando SVM y el método
de BURG

Empleando el vector de características obtenido con la STFT se obtienen los siguientes


resultados:

Máxima IM Mínimo Error Máxima SNR


STFT 0.4887 15,00% 0.9690

Tabla SEQ Tabla \* ARABIC 16. Información mutua máxima, error mínimo y máxima SNR empleando SVM y la STFT

Clases 1 2 Total
1 31151(29,7%) 13719(15,7%) 44870(50,0%)
2 11937(13,3%) 32933(36,7%) 44870(50,0%)
Total 43088(48,0%) 46652(52,0%) 89740(100%)

Tabla SEQ Tabla \* ARABIC 17. Matriz de confusión del sistema empleando SVM la STFT.

48
ANEXO

Figura SEQ Figura \* ARABIC 23. Curso de la información mutua, precisión y


relación señal a ruido empleando SVM sobre los datos calculados con la STFT.
Precisión Específica
Kappa Error Kappa Precisión
Clase 1 Clase 2
STFT 0.4282 0.0045 71,41% 70,83% 71,97%

Tabla SEQ Tabla \* ARABIC 18. Kappa, precisión global del sistema y precisión específica empleando SVM y el método
de BURG.

La Figura 24 muestra el curso de los parámetros información mutua, precisión y


relación señal a ruido utilizando máquinas de vector de soporte para los métodos de BURG
y la STFT, en la Tabla 19 se muestran los datos de Kappa y precisión según la métrica
empleada en la competencia BCI IV.

49
ANEXO

Figura SEQ Figura \* ARABIC 24. Curso de la información mutua, precisión y relación señal a ruido empleando
máquinas de vector de soporte sobre los datos calculados con el método de BURG y la STFT

Kappa Error Kappa Precisión Precisión Específica


Clase 1 Clase 2
STFT 0.4282 0.0045 71,41% 70,83% 71,97%
BURG 0.4419 0.0046 72,09% 70,51% 73,51%

Tabla SEQ Tabla \* ARABIC 19. Comparación de índices de desempeño, kappa, precisión y precisión específica para el
método de BURG y la STFT para el caso de máquinas de vector de soporte.

Máxima IM Mínimo Error Máxima SNR


STFT 0.4887 15,00% 0.9690
BURG 0.4812 15,00% 0.9486

Tabla SEQ Tabla \* ARABIC 20. Comparación entre los resultados obtenidos para IM, Error y SNR, con el método de
BURG y la STFT para el caso de las máquinas de vector de soporte.

Se observa en el caso de las máquinas de vector de soporte que la precisión global y el


valor de kappa muestran un mejor desempeño cuando se utilizan las características

50
ANEXO

extraídas con el método de BURG, sin embargo se observa que la información mutua es
mayor para el caso de la STFT pese a que el error mínimo obtenido es el mismo.

51
ANEXO

52
ANEXO

ANÁLISIS COMPARATIVO DE LOS


RESULTADOS. 5
5.1 Extracción de características.
Los resultados mostrados en la sesión anterior revelan que el método de BURG
proporciona un mejor desempeño que el uso de la STFT para el cálculo de la densidad
espectral de la señal EEG, de la cual se extraen las características relacionadas con la
actividad cerebral oscilatoria.

Hasta este punto se han tenido en cuenta parámetros de desempeño que indican que tan
bueno es el sistema para clasificar las señales, sin embargo es necesario también cuantificar
el costo computacional, debido a que la principal aplicación de las interfaces BCI se
relaciona con ejecución en tiempo real, entendiendo por esto que la salida debe ser
entregada de modo que el usuario tenga la sensación de que el sistema responde de manera
instantánea.

La Tabla 21 muestra el tiempo de cómputo requerido promedio (140 repeticiones) por


el algoritmo de BURG y la STFT, para determinar la potencia de la señal por unidad de

53
ANEXO

Hertzio. En el caso de la STFT el algoritmo fue recreado con el fin de simular la


adquisición de las muestras una a una.

Método Tiempo de computo [seg] CPU: Intel Core 2 duo 1.8GHz,


STFT 0.00025 RAM:2GB
BURG 0.0033 Software: MATLAB 7.0

Tabla SEQ Tabla \* ARABIC 21. Comparación entre los tiempos de cómputo promedio (140 repeticiones) de la
densidad espectral para una sesión de 9 segundos con el método de BURG y la STFT.

Los datos muestran que el cálculo de la densidad espectral empleando la STFT toma en
promedio, aproximadamente 1/10 del tiempo requerido con el método de BURG
proporcionando una salida más rápida. Sin embargo, estos tiempos pueden ser reducidos
seleccionando una resolución más baja para el cálculo del espectro, pues una vez
establecidas la bandas de frecuencia, una resolución de 0,5Hz es suficiente debido a que el
análisis de la señal empleando el índice de Fisher muestra que la banda de interés tiene un
ancho mayor a 1 Hz. Con esta reducción de la resolución se obtiene un 70% de reducción
en el tiempo de cómputo para la STFT y 9% para el caso del método de BURG.

5.2 Clasificación.
La Figura 25 muestra el curso de la información mutua, la precisión y la relación señal a
ruido para cada uno de los clasificadores empleados con las características calculadas
mediante el método de BURG. Los datos de los valores máximos de cada uno de estos
parámetros se muestran en la Tabla 22. Se puede observar que las redes neuronales
proporcionan el valor pico más alto de la información mutua, al mismo tiempo que este
valor se alcanza en un tiempo más corto que empleando análisis discriminante. La máquina
de vector de soporte muestra el peor desempeño en lo referente a la métrica de la
información mutua.

Máxima IM Mínimo Error Tiempo


LDA HYPERLINK 0.1357 4.6719
"mailto:0.5459@4.67
19s"0.5459
ANN 0.5464 0.1357 4.6172
SVM 0.4812 0.1500 4.6172

Tabla SEQ Tabla \* ARABIC 22. Valores máximos obtenidos para la IM y el error mínimo con los tres métodos de
clasificación empleados usando las características calculadas con el método de BURG.

54
ANEXO

Figura SEQ Figura \* ARABIC 25. Comparación del desempeño del análisis discriminante, las redes neuronales (ANN) y
la máquina de vector de soporte empleando los datos calculados con el método de BURG

Al comparar los valores del coeficiente Cohen´s Kappa y la precisión global obtenidas
de la matriz de confusión se observa nuevamente que el mejor desempeño se obtiene con
las redes neuronales, lo que resulta ser consistente con la métrica antes empleada que mide
la información mutua pico alcanzada por el sistema.

Kappa Error Kappa Precisión Global


LDA 0.4572 0.0046 0.7286
ANN 0.4593 0.0046 0.7296
SVM 0.4419 0.0046 0.7209

Tabla SEQ Tabla \* ARABIC 23. Valores para Kappa y precisión global obtenidos con los tres métodos de clasificación
empleados usando las características calculadas con el método de BURG.

Para las características calculadas con la STFT, se muestra en la Figura 26 el curso de


la información mutua, la precisión y la relación señal a ruido.

55
ANEXO

Figura SEQ Figura \* ARABIC 26. Comparación del desempeño del análisis discriminante, las redes neuronales (ANN) y
la máquina de vector de soporte empleando los datos calculados con la STFT

Máxima IM Mínimo Error Tiempo


LDA 0.4323 0.1643 4.5313
ANN 0.5464 0.1357 4.5859
SVM 0.4887 0.1500 4.6172

Tabla SEQ Tabla \* ARABIC 24. Valores máximos obtenidos para la IM y el error mínimo con los tres métodos de
clasificación empleados usando las características calculadas la STFT

Kappa Error Kappa Precisión Global


LDA 0.4277 0.0045 0.7139
ANN 0.4330 0.0046 0.7165
SVM 0.4282 0.0045 0.7141

Tabla SEQ Tabla \* ARABIC 25. Valores para Kappa y precisión global obtenidos con los tres métodos de clasificación
empleados usando las características calculadas con la STFT.

56
ANEXO

Los resultados mostrados en la Figura 26 y las tablas 24 y 25 muestran, nuevamente, que


empleando las características calculadas con la STFT se obtiene un mejor desempeño con
las redes neuronales, existiendo consistencia entre las métricas empleadas. Sin embargo, en
este caso las máquinas de vector de soporte muestran un mejor desempeño que el análisis
discriminante lineal.

Al realizar el análisis de las señales EEG empleando el índice de Fisher se evidencia que el
valor de este índice para el caso en que las señales se calculan con el método de BURG es
mayor que el obtenido mediante la STFT. Los resultados de las tablas 24 y 25 sugieren
entonces que el análisis discriminante es más sensible que las redes neuronales artificiales y
que las máquinas de vector de soporte. En el caso de las redes neuronales los valores de
información mutua y error mínimo se mantienen, estos puntos corresponden a los instantes
de tiempo en que la señal es más diferenciable, tanto para el método de BURG como para
el método que emplea la STFT, es decir, aunque el nivel de separabilidad disminuyó, la red
neuronal artificial fue capaz de diferenciar, con igual efectividad en esos puntos, entre la
clase 1 y la clases 2. Al comparar el desempeño con el valor de kappa, se observa que el
desempeño del sistema es inferior comparado con el caso en que la densidad espectral se
calculó con el método de BURG, fenómeno que se ve reflejado también en la tasa de
precisión global del sistema que cae de 72,96% a 71,65%. En el caso de las SVM se
observa un ligero incremento de la información mutua pese a que el valor del error mínimo
no disminuye. Los valores de kappa y de la precisión global muestran que el desempeño del
sistema disminuye, pese a que mejora con respecto al análisis discriminante. En el caso del
análisis discriminante se observa que al cambiar el método con el cual se determina la
densidad espectral de potencia los cambios en el desempeño son importantes. Esto muestra
que el análisis discriminante es mucho más sensible que los otros métodos empleados a las
diferencias en separabilidad de las señales.

Pese al análisis anterior es necesario realizar una revisión de las diferencias entre los
valores de desempeño con el fin de determinar si los resultados pueden considerarse
significativamente diferentes.

Se empelará para esto el parámetro Kappa pues se cuenta con el cálculo del error estándar.
La metodología planteada fue sugerida por el doctor Alois Schögl (Universidad de Graz)
quien describe en CITATION ASc07 \l 9226 [HYPERLINK \l "ASc07"12] los distintos tipos de
criterios de evaluación para BCI´s. Se calculará la diferencia entre los valores de Kappa
para cada clasificador y si el resultado de la diferencia es mayor a dos errores estándar, se
determina que la diferencia es significativa, como para determinar que un sistema es ofrece
un mejor o peor desempeño que otro.

57
ANEXO

Las tablas 25 y 23 muestran los valores para cada clasificador empleando el método de
BURG y la STFT. Basado en los valores de Kappa se construyen las tablas 26 y 27 en las
que los valores mostrados se obtienen con la siguiente ecuación:

QUOTE (5.1)

Donde QUOTE corresponde a los valores Kappa para el clasificador x y el


clasificador y respectivamente. QUOTE es el valor estándar de Kappa más grande
obtenido para los dos clasificadores. De modo que si el coeficiente resultante es mayor que
2, se superan dos errores estándar.

Tabla SEQ Tabla \* ARABIC 26. Diferencia en el valor de Kappa para los clasificadores empleados, medida en errores
estándar

Tabla SEQ Tabla \* ARABIC 27. Diferencia entre valores de Kappa entre STFT y BURG para un mismo clasificador,
medida en errores estándar

Los valores obtenidos muestran que no existe diferencia significativa entre el desempeño
del clasificador LDA y ANN empleando el método de BURG. Aunque la diferencia entre

58
ANEXO

estos dos métodos no alcanza dos errores estándar utilizando la STFT la diferencia entre el
valor obtenido entre STFT y BURG es apreciable. Los resultados obtenidos en la
comparación entre LDA y SVM y la comparación entre ANN y SVM muestran que las
redes neuronales artificiales y el análisis discriminante lineal ofrecen un desempeño
significativamente mejor que las SVM.

Los resultados mostrados en la Tabla 27 evidencian que los resultados obtenidos al emplear
el método de BURG son significativamente mejores que los obtenidos para la STFT en
cada uno de los clasificadores.

Con el fin de determinar cuál de los sistema es más exigente en cuanto a tiempo de
computo, se muestra en la Tabla 28 el tiempo promedio necesario para clasificar los datos
de unas sesión completa (641 muestras) el tiempo de computo es en el desarrollo un
parámetro limitante debido a que las aplicaciones deben ser posibles en tiempo real.

Tiempo de computo [s] Características del equipo


LDA 0.0095 CPU: Core 2 Duo@1.8GHz
ANN 0.0166 RAM: 2GB
SVM 17.85 SOFTWARE: Matlab 7.0

Tabla SEQ Tabla \* ARABIC 28. Tiempo de cómputo para cada uno de los clasificadores empleados.

Los resultados de la medición de los tiempos de cómputo, muestran que la implementación


de la máquina de vector de soporte no es apta en este caso para aplicaciones en vivo,
mientras que el análisis discriminante muestra el menor tiempo de cómputo entre los tres
métodos probados.

BURG STFT
LDA 2.120seg 0.170seg
ANN 2.130seg 0.177seg
SVM 19.90seg 18.00seg

Tabla SEQ Tabla \* ARABIC 29. Comparación de desempeños (tiempo de computo) entre parejas de cálculo de la
densidad espectral – clasificador.

La Tabla 29 muestra el tiempo de cómputo requerido por cada sistema para procesar 641
muestras, que corresponden a una sesión. Aunque las ANN no difieren mucho de lo
requerido por LDA el uso de LDA es preferido puesto que su implementación es mucho
más simple.

59
ANEXO

60
ANEXO

CONCLUSIONES 6
Se construyeron e implementaron algoritmos para la extracción y clasificación de señales
EEG. El análisis de los resultados obtenidos para cada uno de estos algoritmos y la
comparación de los resultados permite concluir lo siguiente:

 El método de BURG ofrece mejores resultados que la STFT en cuanto a la


estimación espectral de potencia de la señal EEG, lo que se observa en el nivel de
separabilidad de las señales medido con el índice de Fisher en las bandas de
frecuencia citadas por la literatura. También es evidente esta mejora al evaluar el
desempeño de cada uno de los sistemas con cada uno de los métodos descritos
(BURG y STFT)

 Entre los métodos de clasificación empleados en este trabajo, las ANN’s proveen el
mejor resultado en lo que se refiere a valores pico de información mutua, precisión
y el índice kappa. Sin embargo, los valores obtenidos para los índices antes
mencionados son muy cercanos, por lo que se establece un rango de confianza
determinado por el error estándar del índice kappa ( QUOTE ). Los
resultados muestran que no existe diferencia significativa en el desempeño del
sistema cuando se emplea el método de BURG o la STFT para la estimación

61
ANEXO

espectral de potencia y los clasificadores empleados son LDA o ANN, sin embargo
se aprecia una diferencia significativa cuando el método empleado para el cálculo
de la PSD es BURG y se compara LDA con SVM o ANN con SVM.

 El desempeño del clasificador LDA se acerca mucho al conseguido con el


clasificador basado en ANN; sin embargo el clasificador LDA es muy sensible a
diferencias de separabilidad en la señal, lo que se aprecia en la diferencia del valor
de kappa al emplear STFT y BURG ( QUOTE ). La combinación del
método de BURG con LDA ofrece buenos resultados con tiempos de respuesta
bajos (1,9µs por muestra) comparados con los otros métodos empleados. Por otro
lado la implementación del clasificador LDA es mucho más simple comparada a la
implementación de las ANN’s y las SVM, lo que acompañado a lo descrito en el
párrafo anterior, determina que el análisis discriminante es la mejor opción siempre
que el método de extracción de características sea eficiente.

 Se pudo establecer en este trabajo que al disminuir a calidad del vector de


características, las SVM son más robustas ofreciendo una menor disminución en el
desempeño, aunque estas últimas no ofrecen un mejor desempeño en términos de
precisión, comparado al clasificador LDA y las ANN’s

 El costo computacional de la implementación de las SVM es muy alto (28ms por


muestra), a un nivel que no permite su aplicación donde se requieren respuestas
inmediatas es decir, aplicaciones en vivo.

62
ANEXO

63
ANEXO

TRABAJO FUTURO. 7
El trabajo presente muestra los resultados al emplear la actividad eléctrica oscilatoria
cerebral. Sin embargo el nivel de precisión podría aumentarse aumentando el número de
electrodos usados para la adquisición de la señal, lo que significa mayor información sobre
la actividad cerebral global. También es de gran importancia los valores de frecuencia en
los que se concentra a mayor cantidad de potencia. Por otro lado la posición de los
electrodos de modo simétrico sobre los hemisferios del cerebro podría no ser apropiada,
debido a que las señales sobre un hemisferio muestran tener mayor grado de separabilidad,
según el índice de Fisher.

El empleo de sistemas que se adapten al usuario podría dar solución a las situaciones
diversas que se presentan durante el uso de una interfaz cerebro computadora, lo que
permitiría tener en cuenta el aprendizaje del usuario a medida que usa la interfaz, lo que
permitiría, a la vez, re-entrenar el clasificador, eliminando datos propios de la falta de
entrenamiento en la etapa del diseño del sistema.

El empleo de otros tipos de señales como el potencias P300 y SCP’s ofrecerían una
solución en aplicaciones especificas donde el usuario debe escoger entre varias opciones

64
ANEXO

que le son presentadas, estas señales son mucho más fáciles de reconocer lo que permite
disminuir el costo computacional.

65
ANEXO

BIBLIOGRAFÍA

BIBLIOGRAPHY
[1] G. Pfurtscheller, C. Neuper, and N. Birbaume, "Human Brain - Computer Interface," in Motor
Cortex in Volintary Movements, A. Riehle and E. Vaadia, Eds. CRC Press LLC, 2005, ch. 14.

[2] U. Hoffmann, J.-M. Vesin, and T. Ebrahimi, "Recent Advances in Brain-Computer


Interfaces," Multimedia Signal Processing, 2007. MMSP 2007. IEEE 9th Workshop on, p. 17,
Oct. 2007.

[3] D. J. MCFARLAND, A. T. LEFKOWICZ, and J. R. WOLPAW, "technology, Design and


operation of an EEG-based brain–computer interface with digital signal processing," Behavior
Research Methods, Instruments, & Computers, vol. 3, no. 29, p. 337–345, 1997.

[4] Q. Zhao, L. Zhang, and C. Andrzej, "EEG-based asynchronous BCI control of a car in 3D
virtual reality environments," Chinese Science Bulletin, vol. 54, no. 1, pp. 78-87, Jan. 2009.

[5] R. Leeb, R. Scherer, C. Keinrath, C. Guger, and G. Pfurtscheller, "Exploring Virtual


Environments with an EEG-based BCI through Motor Imagery," Biomedical Engineering, vol.
50, no. 4, pp. 86-91, Apr. 2005.

66
ANEXO

[6] J. D. Bayliss, A Flexible Brain-Computer Interface. Rochester, USA, 2001.

[7] X. Pei and C. Zheng, "Classification of Left and Right Hand Motor Imagery Tasks Based on
EEG Frequency Component Selection," Bioinformatics and Biomedical Engineering, 2008.
ICBBE 2008. The 2nd International Conference on, pp. 1888-1891, May 2008.

[8] J. R. Wolpaw, D. J. McFarland, and T. M. Vaughan, "Brain–Computer Interface Research at


the Wadsworth Center," IEEE TRANSACTIONS ON REHABILITATION ENGINEERING, vol.
8, no. 2, pp. 222-226, Jun. 2000.

[9] B. H. Jansen, J. R. Bourne, and J. W. Ward, "Autoregressive Estimation of Short Segment


Spectra for Computerized EEG Analysis," Biomedical Engineering, IEEE Transactions on,
pp. 630-638, Sep. 1981.

[10] A. Subasi, "Application of Classical and Model-Based Spectral Methods to Describe the State
of Alertness in EEG," Journal of Medical Systems, vol. 29, pp. 473-486, Oct. 2005.

[11] IDA. (2008, Nov.) BCI Competition II. [Online].

HYPERLINK
"http://ida.first.fraunhofer.de/projects/bci/competition_ii/Graz_description.doc"http://ida.fir
st.fraunhofer.de/projects/bci/competition_ii/Graz_description.doc

[12] A. Schlögl, J. Kronegg, J. E. Huggins, and S. G. Mason., "Evaluation criteria in BCI research,"
in Toward Brain - Computer Interfacing, G. Dornhege, et al., Eds. Massachusetts, USA: MIT
Press, 2007, ch. 19, pp. 327-342.

[13] S. Sanei, EEG Signal Processing. West Sussex, England: Willey & Sons Ltda, 2007.

[14] J. R. LaCourse and W. J. Smith, "Sensing the Human Alpha Rhythm Using a Non-Contact
Electroencephalographic Electrode," Bioengineering Conference, 2006. Proceedings of the
IEEE 32nd Annual Northeast, pp. 195-196, 2006.

[15] M. García and A. González, Potenciales bioeléctricos: origen y registro, 1st ed. Iztapalapa,
México: Casa Abierta al Tiempo, 1998.

[16] W. A. MacKay, "Wheels of Motion: Oscillatory Potentials in the Motor Cortez,," in Motor
Cortex in voluntary movements, A. Riehle and E. Vaadia, Eds. USA: CRC Press LLC, 2005..

[17] R. Hu, G. Li, M. Hu, J. Fu, and W. J. Freeman, "Recognition of ECoG in BCI Systems Based
on a Chaotic Neural Model," Advances in Neural Networks – ISNN 2007, vol. 4491/2007, pp.
685-693, Jul. 2007.

[18] G. Technologies. (2009, Aug.) g.BCIsys Brain Computer Interface. [Online]. HYPERLINK
"http://www.gtec.at/products/g.BCIsys/bci.htm"http://www.gtec.at/products/g.BCIsys/bci.ht
m

67
ANEXO

[19] N. J. Hill, et al., "lassifying EEG and ECoG Signals without Subject Training for Fast BCI
Implementation: Comparison of Non-Paralysed and Completely Paralysed Subjects.," pp. 1-4.

[20] J. E. Huggins, S. P. Levine, B. Graimann, S. Y. Chun, and J. A. Fessler, "Electrocorticogram


as a Brain -Computer Interface Signal Source," in Toward Brain Computer Interfacing, G.
Dornhege, et al., Eds. London, England: MIT Press, 2007, ch. 8, pp. 129-145.

[21] A. Kübler and L.-R. Müller, "An introduction to Brain-Computer Interfacing," in Toward
Brain-Computer Interface, G. Dornhege, et al., Eds. London, England: MIT Press, 2007, ch. 1,
pp. 1-25.

[22] N. Birbaumer, et al., "A spelling device for the paralysed," Nature, no. 398, pp. 297-298, Mar.
1999.

[23] G. N. Gracia, DIRECT BRAIN-COMPUTER COMMUNICATION THROUGH SCALP


RECORDED EEG SIGNALS. Lausanne, Switzerland, 2004.

[24] A. Schlogl, C. Keinrath, R. Scherer, and P. Furtscheller, "Information transfer of an EEG-


based brain computer interface," Neural Engineering, 2003. Conference Proceedings. First
International IEEE EMBS Conference on, pp. 641-644, Mar. 2003.

[25] C. Vidaurre, A. Schlögl, R. Cabeza, R. Scherer, and G. Pfurtscheller, "Adaptive On-line


Classification for EEG-based Brain Computer Interfaces with AAR parameters and band
power estimates," Biomedical Engineering, vol. 50, no. 11, p. 350–354, November.

[26] J. A. Pineda, D. S. Silverman, A. Vankov, and J. Hestenes, "Learning to control brain rhythms:
making a brain-computer interface possible," IEEE TRANSACTIONS ON NEURAL SYSTEMS
AND REHABILITATION ENGINEERING, vol. 11, no. 2, pp. 181-184, Jun. 2003.

[27] M. G. Bellanger, "Sapectral Analysis," in Adaptive Digital Filters. Paris, France: MARCEL
DEKKER, 2001, ch. 10.

[28] P. Stoica and R. L. Moses, Introduction to Spectral Analysis, , ,. Upper Saddle River, N.J.:
Prentece Hall, 1997.

[29] J. L. SEMMLO, "Spectral Analysis: Modern Techniques," in Biosignal and Biomedical Image
Processing:MATLAB based Applications. New Jersey, USA: Marcel Dekker, 2004, ch. 5.

[30] P. Isasi Viñuela, Redes Neuronales Artificiales: un unfoque práctico. Madrid, España: Pearson
Educación, 2004.

[31] L. Biquian, "Study of Feature Classification Methods in BCI Based on Neural Networks,"
Proceedings of the 2005 IEEE Engineering in Medicine and Biology 27th Annual Conference,
Sep. 2005.

[32] (2009, ) NueroXL Classifier Software.. [Online]. HYPERLINK


"http://www.neuroxl.com/neural_networks_eeg.htm"http://www.neuroxl.com/neural_netwo

68
ANEXO

rks_eeg.htm

[33] A. ADLAKHA, "Single trial EEG Classification," SWISS FEDERAL INSTITUTE OF


TECHNOLOGY, 2002.

[34] A. Schlögl, C. Keinrath, S. R, and G. Pfurtscheller, "Information transfer of an EEG-based


Bran-computer interface.," Proceedings of the 1st International IEEE EMBS Conference on
Neural Engineering,, pp. 641-644, Mar. 2003.

[35] B. Hong. (2008, Aug.) Trends in BCI/BMI research and our projects. Online Power Point .

[36] E. W. Sellers, D. J. Krusienski, M. Farland, and J. R. Wolpaw, "Non-Invasive Brain-Computer


Interface Research at the Wadsworth Center," in Toward Brain – Computer interfacing., G.
Dornhege, et al., Eds. London, England: MIT Press, 2007, ch. 2, pp. P31-34.

[37] G. Pfurtscheller, A. Schlögl, C. Vidaurre, and S. Wriessnegger, "Graz Computer Interface:


state of Research," in Toward brain-computer interfacing, G. Dornhege, et al., Eds. London,
England: MIT Press, 2007, p. 65–84.

[38] B. Blankertz, G. Dornhege, and V. Kunsmann, "The Berlin Brain Computer Interface:
Machine Learning –Based Detection of User Specific Brain States," in Toward brain-
computer interfacing, G. Dornhege, et al., Eds. London, England: MIT Press, 2007, ch. 5.

[39] T. Hinterberger and L. Tomas, "Brain Computer Interfaces for Communication in Paralysis: A
Clinical Experimental Approach," in Toward Brain-Computer Interface, G. Dornhege, et al.,
Eds. London, England: MIT Press, 2007, ch. 3, pp. 43-64.

[40] A. Subasi, "Application of Classical and Model-Based Spectral Methods to Describe the State
of Alertness in EEG," Journal of Medical Systems , vol. 29, no. 5, pp. 473-486, Oct. 2005.

[41] A. Schlögl. (2008, ) BIOSIG. An open source library for biomedical signal processing 2003 –
2009. http://BIOSIG.SF.NET.

[42] A. Schlögl, C. Neuper, and G. Pfurtscheller, "Estimating the mutual information of an EEG-
based Brain-Computer-Interface," Biomedizinische Technik, pp. 3-8, 2002.

[43] T. Joachims, B. Schölkopf, C. BURGes, and A. Smola, Making large-Scale SVM Learning
Practical. Advances in Kernel Methods - Support Vector Learning. MIT Press, 1999.

[44] T. Briggs. (2009, Mar.) Tom Briggs Assistant Professor of Computer Science, ShippensBURG
University. [Online]. HYPERLINK
"http://webspace.ship.edu/thbrig/"http://webspace.ship.edu/thbrig/

[45] A. Schlögl, J. Kronegg, J. E. Huggins, and S. G. Mason, "Evaluation criteria in BCI research,"
in Toward brain-computer interfacing, G. Dornhege, Ed. London, England: MIT Press, 2007,
ch. 19, p. 327–342.

69
ANEXO

70
ANEXO

ANEXO

i
ANEXO

Data set: BCI-experiment


Data set provided by Department of Medical Informatics, Institute for
Biomedical Engineering, University of Technology Graz. (Gert Pfurtscheller)

Correspondence to Alois Schlögl <HYPERLINK


"mailto:alois.schloegl@tugraz.at"alois.schloegl@tugraz.at>

This dataset was recorded from a normal subject (female, 25y) during a
feedback session. The subject sat in a relaxing chair with armrests. The task
was to control a feedback bar by means of imagery left or right hand
movements. The order of left and right cues was random.

The experiment consists of 7 runs with 40 trials each. All runs were conducted
on the same day with several minutes break in between. Given are 280 trials of
9s length. The first 2s was quite, at t=2s an acoustic stimulus indicates the
beginning of the trial, the trigger channel (#4) went from low to high, and a
cross “+” was displayed for 1s; then at t=3s, an arrow (left or right) was
displayed as cue. At the same time the subject was asked to move a bar into
the direction of the cue. The feedback was based on AAR parameters of
channel #1 (C3) and #3 (C4), the AAR parameters were combined with a
discriminant analysis into one output parameter. (similar to [1,2]). The
recording was made using a G.tec amplifier and a Ag/AgCl electrodes. Three
bipolar EEG channels (anterior ‘+’, posterior ‘-‘) were measured over C3, Cz
and C4. The EEG was sampled with 128Hz, it was filtered between 0.5 and
30Hz. The data is not published yet, similar experiments are described in [1-4].

The trials for training and testing were randomly selected. This should prevent
any systematic effect due to the feedback.

ii
ANEXO

1 2 3

5 cm
C3 1 Cz 2 C4 3
0 1 2 3 4 5 6 7 8 9 sec

Feedback period with Cue


Trigger
Beep

Figure SEQ Figure \* ARABIC 1: Electrode positions (left) and timing scheme
(right).

Format of the data

The data is saved in a Matlab-fileformat. The variable x_train contains 3 EEG


channels, 140 trials with 9 seconds each. The variable y_train contains the
classlabels ‘1’, ‘2’ for left and right, respectively. x_test contains another set
of 140 trials. The cue was presented from t = 3s to 9s. At the same time, the
feedback was presented to the subject. Within this period, it should be possible
to distinguish the two types of trials.

Requirements and evaluation

The task is to provide an analysis system, that can be used to control a


continuous feedback. For this reason, you should provide a continuous value
(<0 class “1”, >0 class “2”, 0 non-decisive ) for each time point. The
magnitude of the value should reflect the confidence of the classification, the
sign indicates the class. Include a description of your analysis system.

Evaluation

There is a close relationship between the error rate and the mutual information
[4]. We propose the mutual information because it take also into account the
magnitude of the outputs. The criterion will be the ratio between the maximum
of the mutual information and the time delay since the cue (t=3s). Only the
period between t=4 and t=9s will be considered.

Reference(s):

[1] A. Schlögl, K. Lugger and G. Pfurtscheller (1997) Using Adaptive Autoregressive


Parameters for a Brain-Computer-Interface Experiment,

iii
ANEXO

Proceedings of the 19th Annual International Conference if the IEEE Engineering in


Medicine and Biology Society ,vol 19 , pp.1533-1535.

[2] C. Neuper, A. Schlögl, G. Pfurtscheller (1999) Enhancement of left-right sensorimotor


EEG differences during feedback-regulated motor imagery.
J Clin Neurophysiol. 16(4):373-82.

[3] Pfurtscheller G, Neuper C, Schlögl A, Lugger K. (1998) Separability of EEG signals


recorded during right and left motor imagery using adaptive autoregressive parameters.
IEEE Trans Rehabil Eng. 6(3):316-25.

[4] Schlögl A., Neuper C. Pfurtscheller G. (2002) Estimating the mutual information of an
EEG-based Brain-Computer-Interface, Biomedizinische Technik 47(1-2): 3-8.

iv

También podría gustarte