Está en la página 1de 32

Análisis acústico vocal

Flgo. Jaime López U.


ANÁLISIS ACÚSTICO DE LA VOZ

• Es una forma de analizar y estudiar en forma


objetiva la voz de una persona.
• El hecho que sea objetivo permite eliminar la
subjetividad de la evaluación realizada con el
oído del evaluador.
Para llevar a cabo el análisis acústico de
la voz es necesario considerar varias
etapas.
• Grabación de la voz del paciente utilizando una cadena de
grabación apropiada.
• Se le pide al paciente que emita diferentes tipos de tareas
fonatorias.
• Estas señales acústicas ingresan a un software el cual capaz
de extraer las dimensiones físicas de una onda sonora,
analizarlas en forma cuantitativa y cualitativa, y finalmente
entregar como resultado gráficos y parámetros numéricos
que deben ser interpretados por el evaluador
Utilidades del uso del análisis acústico
de la voz
• Entregar mayor comprensión acústica del output de la voz y producir una
mayor asociación de este tipo de análisis con la valoración perceptual
auditiva.

• Proveer datos normativos para diferentes realidades vocales, diferentes


culturas, diferentes rangos etarios, diferentes ocupaciones, etc.

• Ofrecer una posibilidad de documentación para trazar la línea de base de la


voz de una persona.

• Monitorear el avance de la terapia o entrenamiento de la voz de una


persona.

• Sirve como instrumento de detección precoz de posibles problemas


vocales.
“ A pesar de la contribución innegable que entrega el análisis acústico de la voz,
la evaluación perceptual realizada por el oído entrenado del clínico nunca debe
ser eliminada. El análisis acústico debe ser utilizado como una forma
complementaria de evaluación vocal y como una manera objetiva no invasiva de
documentar el estado vocal de una persona. Para realizar un correcto análisis
acústico y una posterior interpretación, es necesario conocer de forma
detallada las bases acústicas de la producción de la voz”.
Tipos de análisis acústicos
• Oscilograma.
• Espectrograma.
• Spectrum FFT.
• Spectrum LPC.
• Cepstrum.
• Espectro promedio a largo plazo (LTAS).
• Análisis de índices foneticoacústicos.
• Fonetograma.
• Histograma.
• Contornos.
Oscilograma
El oscilograma es también llamado forma de onda. Constituye la representación visual
más elemental del sonido y es conformado en su eje horizontal por el tiempo y en el
De esta forma, el
eje vertical por la amplitud de la señal.

oscilograma es una representación gráfica de


una vibración en función del tiempo
Espectrograma
El espectrograma es la representación gráfica de la
frecuencia y la intensidad de la forma de onda en función
del tiempo.
El tiempo es graficado en el eje horizontal y la frecuencia
en el eje vertical.
La tercera dimensión se representa en un tercer eje, el cual
contiene la energía o amplitud de la señal.

La espectrografía está basada en el teorema de Fourier. Este teorema señala que


todas las ondas periódicas pueden ser descompuestas en la suma de una serie de
ondas senoidales con frecuencias armónicas. El análisis de Fourier es el proceso
mediante el cual se separa una onda compleja en sus componentes senoidales.
Lo que determina la claridad de los elementos
observados en el espectrograma es el ancho de banda
del filtro aplicado durante el proceso de creación del
espectrograma.
Yanagihara en el año 1967
propuso una forma de categorizar
las disfonías según las
características espectrográficas.
Espectro FFT y LPC

El espectro o espectrum FFT (Fast Fourier


Transformation) es una representación
gráfica de la señal de audio que es
extraída desde un punto específico de
tiempo del espectrograma.
El espectro FFT muestra la amplitud relativa de los
armónicos, reflejando la combinación del espectro de la
fuente, la función de transferencia y las características
de radiación.
Espectro LPC (Lineal Predicting Code) muestra una
envolvente del espectro y por lo tanto la
identificación de los formantes es fácil.
Análisis cepstral
(Cepstrum)

El análisis “cepstral” provee una forma


efectiva de derivar el valor de la F0 y
evaluar algunas características de la función
del filtro del tracto vocal y de la fuente de
una forma no invasiva.
Un pico cepstral alto (valor alto) es
obtenido en voces caracterizadas
por una estructura armónica bien
definida (Figura 49).
Una voz soplada o ronca tiene una estructura armónica
débilmente definida y, por lo tanto, el pico cepstral es
bajo (bajo valor) (Figura 50-51).
Espectro promedio a largo plazo (LTAS)

El espectro promedio a largo plazo es ampliamente conocido como una


herramienta útil y efectiva para la evaluación de las características de la
fuente (pliegues vocales) y filtro (tracto vocal) de la voz.

LTAS pone en un sólo espectro la medida de


varios espectros obtenidos en un periodo de
tiempo determinado, mientras el paciente
habla, lee un texto o canta una canción.

Alpha Ratio (diferencia de energía armónica entre una zona baja


y una zona alta del espectro).
Este tipo de análisis es ampliamente utilizado en el ámbito de la
investigación. Ha sido aplicado en estudios de reconocimiento de voces,
detección de la cualidad vocal, alteraciones de la voz, envejecimiento
vocal, evaluación de técnicas de terapia vocal y diferenciación vocal
entre diferentes poblaciones.

También podría gustarte