Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Voice Monitoring
(Una plataforma de bajo costo para monitoreo de voz)
Resumen:
En este documento se propone una plataforma de bajo costo que se concibió para
monitorear la actividad vocal de las personas que usan la voz como una herramienta
profesional. Dicha plataforma incluye un registrador de datos portá til y un programa
de procesamiento que permite extraer los pará metros vocales de la señ al grabada. El
registrador de datos está equipado con un micró fono de contacto que está conectado a
la muesca yugular de la persona bajo supervisió n, detectando así el nivel de
aceleració n de la piel debido a la vibració n de las cuerdas vocales. La salida del
micró fono está condicionada a través de un circuito personalizado y luego se envía a
una placa barata basada en un microcontrolador, que almacena las muestras en bruto
en una tarjeta micro SD. El procesamiento fuera de línea proporciona una estimació n
del nivel de presió n sonora (SPL), la frecuencia fundamental (F0) y la dosis de tiempo
(Dt), que son los pará metros que parecen má s adecuados para la identificació n de
trastornos vocales y la prevenció n de un uso inadecuado de la voz. Para los
pará metros estimados, se implementan procedimientos de calibració n adecuados y su
efectividad se muestra a través de pruebas experimentales específicamente
concebidas. Se muestran resultados experimentales que se refieren a la calibració n del
dispositivo y su uso normal durante el intervalo de monitoreo de varias horas.
También se informa una comparació n con un dispositivo comercial.
I. INTRODUCCIÓ N
Es probable que los trastornos de voz cró nicos o recurrentes, desde los nó dulos de las
cuerdas vocales hasta la disfonía funcional, resulten del abuso de la voz, conductas
vocales erró neas [1] - [2] y acú stica deficiente en los entornos donde se usa la voz [3] .
Estas enfermedades son subestimadas o incluso ignoradas por la mayoría de las
personas, muchas de las cuales generalmente desconocen los riesgos o posibles
enfermedades. Los maestros de diferentes tipos y niveles, incluidos los maestros de
educació n física y mú sica, son algunas de las figuras má s afectadas [4], pero otros
profesionales de la voz involucrados son cantantes, operadores de centros de
llamadas, vendedores, abogados, etc. Para correlacionan la carga vocal [5] con los
hallazgos objetivos de la laringe, se han propuesto dosis vocales como indicadores de
la exposició n prolongada del tejido de las cuerdas vocales a las vibraciones. La
intensidad del habla, medida como Nivel de presió n sonora (SPL) frente a la boca del
hablante, la frecuencia fundamental del habla (F0) y el tiempo de fonació n (Dt) se
utilizan para evaluar algunas medidas de dosis vocal, como se propone en [6]. La
escasez de informació n objetiva sobre el papel del uso diario de la voz en la etiología
de los trastornos de la voz [7] ha despertado un interés creciente en el desarrollo de
dispositivos médicos para el monitoreo de la voz [8]. Investigaciones recientes han
utilizado un aceleró metro en miniatura pegado en la base del cuello como sensor de
fonació n durante mucho tiempo.
monitoreo de término de la funció n vocal. El Centro Nacional de Voz y Habla [9] - [11]
y el Hospital General de Massachusetts [12] - [14], han producido el dosímetro NCVS y
APM, respectivamente, mientras que otro dispositivo llamado VoxLog, se ha
desarrollado recientemente en Linko ̈Pings Universidad de Suecia [15] - [16]. El APM y
Voxlog son dispositivos comerciales, mientras que el dosímetro NCVS solo se usa para
investigació n. Los tres dispositivos son analizadores portá tiles que se basan en la
medició n del nivel de aceleració n de la piel (SAL) debido a la vibració n de las cuerdas
vocales. Estiman la frecuencia fundamental, la dosis de tiempo y el SP L a cierta
distancia de la boca del hablante como resultado de una calibració n. Ninguno de estos
dispositivos define un procedimiento de calibració n para los pará metros F0 y Dt, las
especificaciones de incertidumbre no está n disponibles y el costo de los comerciales
es actualmente prohibitivo para una gran campañ a de monitoreo.
La identificació n y la prevenció n de trastornos vocales a partir de los pará metros
estimados SP L, F0 y Dt aú n se encuentran en un nivel de investigació n, y se requiere
una gran actividad experimental para validar cualquier protocolo propuesto. Dicha
actividad, que debe realizarse en colaboració n con los médicos, debe involucrar a un
gran nú mero de pacientes, por lo que es aconsejable la disponibilidad de dispositivos
de bajo costo para el monitoreo de la voz. El dispositivo descrito en este documento
está concebido para responder a dicha demanda: se basa en componentes baratos, es
ponible, por lo que no afecta la actividad de la persona bajo supervisió n, los datos sin
procesar que almacena se procesan fuera de línea de acuerdo con algoritmos
personalizados en para extraer los pará metros de interés, siempre que se realice un
procedimiento de calibració n adecuado antes de su uso.
En la secció n II, la plataforma propuesta se describe proporcionando detalles de
hardware y firmware del registrador de datos, luego se describe el procedimiento
operativo y el programa de procesamiento. La secció n III muestra resultados
preliminares que se refieren al procedimiento de calibració n del pará metro SPL y al
monitoreo a largo plazo de la actividad vocal. Los valores SPL y F0 obtenidos con el
dispositivo propuesto también se comparan con los resultados proporcionados por el
dispositivo comercial APM.
B. Procedimiento operativo
C. Programa de procesamiento
donde KMIC (Pa / V) es la constante de calibració n del micró fono de referencia, que se
conoce con una incertidumbre está ndar relativa del 3%. El nivel de presió n acú stica
de referencia se obtiene como:
SPLMIC,i =20·log10 (P MIC,i/Po ) (2)
Fig. 4. Ejemplo de resultados de calibració n de la cadena basada en ECM contra el micró fono de
referencia
Fig. 5. Estimació n de la contribució n de incertidumbre relacionada con la repetibilidad de calibració n.
Los resultados obtenidos mediante el dispositivo comercial APM durante una lecció n
de la misma profesora.
La Figura 4 muestra los resultados de una sesió n de calibració n del ECM contra el
micró fono de referencia. La calibració n se realizó de acuerdo con el procedimiento
descrito en la secció n II-B, mientras que la persona bajo supervisió n se encuentra a
una distancia de aproximadamente 16 cm del micró fono. En la traza superior, los
círculos representan los valores experimentales, mientras que la línea continua es la
funció n de calibració n de segundo orden ajustada en el rango SPL de 55 dB a 95 dB a
16 cm, que corresponde al rango (39 ÷ 79) dB a 1 m. El residual entre los valores
experimentales y la curva ajustada, que se muestra en la traza inferior de la misma
figura, se caracteriza por una desviació n está ndar de 1 dB. Tal error de ajuste es una
de las contribuciones que se tiene en cuenta en la estimació n de la incertidumbre
esperada del pará metro SP L.
Otra contribució n que podría afectar la incertidumbre general
de manera significativa es la repetibilidad de calibració n. Para estimar tal
contribució n, se han repetido mú ltiples procedimientos de calibració n en un corto
intervalo de tiempo (aproximadamente diez minutos) sin quitar el ECM de la muesca
yugular de la persona bajo monitoreo. Un ejemplo de los resultados obtenidos durante
una sesió n de calibració n mú ltiple se muestra en la traza superior de la Figura 5,
donde se representan cinco curvas de calibració n diferentes. La forma de las curvas es
casi la misma, pero se han obtenido diferencias má ximas en el rango de 1.5 dB a 2.8
dB, como se muestra en la traza inferior de la figura 5. Una posible razó n de estos
grandes errores podría ser el ruido acú stico detectado por el micró fono de referencia,
ya que la calibració n se realizó en un laboratorio que no está aislado desde un punto
de vista acú stico. Se esperan mejoras al realizar el procedimiento de calibració n en
una cá mara anecoica.
También se han realizado varias sesiones de monitoreo a largo plazo con el
dispositivo propuesto para verificar su efectividad. Un ejemplo de los resultados
obtenidos se resume en las Figuras 6 y 7, que se refieren a la actividad vocal de una
profesora que fue monitoreada durante una lecció n que duró aproximadamente 100
minutos. En particular, la Figura 6 muestra el histograma de las ocurrencias SPL @ 1
m (barras rojas), que comienza con un valor que corresponde al nivel de ruido
eléctrico, es decir, aproximadamente 43 dB. El histograma se centra alrededor de 70
dB a 1 m, que es un valor razonable durante una lecció n en un gran aula universitaria
sin usar equipo de refuerzo. Se realizará n pruebas específicas para validar dichos
resultados mediante el monitoreo de la actividad corporal de la persona que usa el
ECM y su exposició n a ambientes ruidosos mientras no se realiza actividad vocal.
Las apariciones de la frecuencia fundamental F0 en el intervalo de monitoreo se
muestran en la Figura 7 (barras rojas). Se debe tener en cuenta que este histograma
solo se refiere a cuadros sonoros, ya que de acuerdo con el algoritmo descrito (ver
secció n II-C), un cero
El valor se asigna al pará metro F0 durante las tramas sordas. Los valores obtenidos
está n en el rango de 60 Hz a aproximadamente 480 Hz, como se esperaba para una
persona que habla.
En las figuras 6 y 7, las barras verdes representan las ocurrencias SPL y F0 obtenidas
monitoreando a la misma profesora a través del dispositivo comercial APM durante
otra lecció n similar. Estos resultados coinciden con los proporcionados por Voice-
Care: el nivel de ruido es de aproximadamente 40 dB y el valor SPL má s frecuente es
de 68 dB; los valores estimados para el pará metro F0 está n en el rango (70 ÷ 450) Hz.
Las diferentes formas de los histogramas se deben a la forma diferente en que se han
llevado a cabo las dos lecciones. Por la misma razó n, los valores del tiempo de
fonació n del pará metro Dt obtenido durante las dos lecciones (31.8% por Voice-Care y
33.3% por APM) pueden considerarse aceptables.
IV. CONCLUSIÓ N