Está en la página 1de 42

MTODOS DE EXPLORACIN DE LA VOZ

Los mtodos para explorar la laringe y la voz se pueden dividir dos grandes grupos:
exploracin endoscpica y exploracin funcional.

Mtodos de exploracin endoscpica

Los mtodos de exploracin endoscpica son considerados mtodos invasivos ya que se


realizan por va endoscpica, como lo seala su nombre. Consisten bsicamente en la
introduccin por va oral o nasal de una ptica rgida o flexible para poder observar el
estado estructural y funcional de las estructuras de la laringe, faringe y nariz. A
continuacin de presentan en detalle los mtodos de exploracin endoscpica ms
utilizados en la clnica de voz. Estos exmenes son normalmente realizados por un
mdico otorrinolaringlogo o foniatra.

LARINGOSCOPA INDIRECTA

Para la realizacin de la laringoscopa indirecta se utiliza un pequeo espejo


larngeo el cual es introducido por va oral hasta el fondo de la orofaringe. La fuente de
luz externa (espejo frontal o luz frontal) es dirigida hacia la superficie reflectora del espejo
larngeo situado en la orofaringe y ste a su vez proyecta la luz reflejada en las cuerdas
vocales. Todo este procedimiento debe realizarse con anteriorizacin manual de lengua
por parte del examinador. Este mtodo de exploracin actualmente es raramente utilizado
por la gran cantidad de limitaciones que posee.

V ENTAJAS

Exploracin rpida.
Exploracin relativamente cmoda para el paciente.
Exploracin econmica.

D ESVENTAJAS

No es siempre tolerada por el paciente por aumento del reflejo nauseoso.


Dificultad en determinadas condiciones anatmicas.
No se realiza en posicin de fonacin (con la lengua exteriorizada no se puede
hablar ni cantar).

No se puede grabar imagen para posterior anlisis.

Slo permite observar parte de la laringe y no otras estructuras de las vas


respiratorias.

Mtodo bsico e insuficiente para detectar muchas de las patologas larngeas.

Realizacin del examen laringoscpico indirecto (Foto: Anatomia


Netter)

Se observan las cuerdas vocales a


travs del espejo larngeo durante el
examen de laringoscopa indirecta.

NASOFARINGOLARINGOSCOPA

El
instrumento
utilizado
para
la
realizacin
de
este
examen
se
denomina fibrolaringoscopio flexible, el cual es una cable compuesto por dos ases de
fibras pticas.
El examen lo realiza un mdico otorrinolaringlogo o foniatra. Consiste en la introduccin
del fibroscopio por la va nasal. En la mayora de los casos se utiliza anestesia tpica.
Mtodo de exploracin utilizado para valorar las tres funciones fisiolgicas de la laringe:
respiracin, deglucin y fonacin.

V ENTAJAS

Mayor tolerancia. No provoca reflejo nauseoso ya que no es introducido por va


oral.

Permite la exploracin de fosas nasales, rinofaringe, velo del paladar, tracto vocal
y laringe.

Explora todas las funciones larngeas: fonacin, respiracin y proteccin.

Es til para una buena valoracin de los trastornos funcionales de la voz.

Exploracin en condiciones fisiolgicas. El paciente puede hablar o cantar durante


la realizacin del examen.

Diagnstica la mayora de las alteraciones de la forma.


D ESVENTAJAS

Reducido el poder de magnificacin (aumento de la imagen).


Iluminacin reducida. Aunque actualmente esta limitacin se he reducido bastante.
Definicin de imagen pobre comparada con otros mtodos ms avanzados.

Nasolaringoscopio

Ubicacin de la fibra flexible en la


nariz y faringe. Abajo se observa
como la luz ilumina las cuerdas
vocales (Foto: Laryngoscope)

T ELELARINGOSCOPA CON LUZ ESTROBOSCPICA


La telelaringoscopa se realiza con un fibroscopio rgido (no flexible como
la nasofibrolaringoscopa) con luz estroboscpica o continua, siendo la ms utilizada la
primera. La introduccin de la ptica rgida se realiza por va oral y con extraccin lingual,
tal como en lalaringoscopa indirecta con espejo.

Se utiliza anestesia tpica en casos en que el paciente presenta un marcado reflejo


nauseoso. El examen lo realiza un mdico otorrinolaringlogo o foniatra.
V ENTAJAS

Excelentes imgenes aumentadas.


Posibilidad de registro en video y/o fotografa para posterior anlisis y revisin.
Adems permite ver y diagnosticar con exactitud el tipo y tamao de la lesin en las
cuerdas vocales.

Telelaringoscopio

D ESVENTAJAS

Puede haber poca tolerancia por el reflejo nauseoso (con anestesia local se suele
solucionar).
Se realiza en posicin no fisiolgica, es decir el paciente no puede hablar o cantar en
forma normal.
No permite explorar todas las funciones de la laringe. Slo se puede examinar la
funcinfonatoria de la laringe.

ANLISIS ESTROBOSCPICO
Este examen se realiza en la gran mayora de los casos con luz estroboscpica. A
travs del uso de esta luz se puede examinar el comportamiento dinmico de las cuerdas
vocales.
La luz estroboscpica crea una ilusin ptica de movimiento enlentecido (cmara lenta)
de la vibracin de las cuerdas vocales, teniendo como base las caractersticas perceptivas
fisiolgicas del ojo humano (Ley de Talbot). La telelaringoscopa con luz estroboscpica
es tambin llamada estroboscopa o laringoestroboscopa.

Realizacin del examen de telelaringoscopa con


luz estroboscpica (Foto: KayPentax)

Visualizacin comparada de estroboscopa pre y


post tratamiento (Foto: KayPentax).

E STUDIO DEL EXAMEN ESTROBOSCPICO


Durante la realizacin del examen y tambin en forma posterior (recordar que este
examen permite la grabacin de la imagen) se realiza la valoracin de varios parmetros:
1. Frecuencia fundamental

Se observa la frecuencia fundamental en la pantalla. La unidad de medida es el


Hz o ciclos por segundo.
Se realiza en registro medio, intensidad conversacional, valoracin de frecuencias
altas y bajas, valoracin en registro de falsete y pecho, etc

2. Cierre gltico

Se observa si el cierre gltico es completo, incompleto, intermitente o


permanente.
Si presenta abertura posterior, posterior y anterior, irregular, fusiforme, longitudinal,
en reloj de arena etc.

3. Amplitud del movimiento de las cuerdas vocales

Grado de desplazamiento lateral del borde interno de cuerdas vocales con


respecto a la lnea media de la glotis.
Se realiza la valoracin independiente de cada cuerda vocal.

4. Ondulacin de la mucosa

Se realiza la valoracin de las ondulaciones de la cubierta de las cuerdas vocales.


Se observa la extensin de la onda mucosa.
El grado de ondulacin depende principalmente de la rigidez de las cuerdas
vocales.
Se valora en forma independiente cada cuerda vocal.
La ondulacin de la mucosa puede estar ausente, disminuida, normal o
aumentada.

5. Regularidad de las vibraciones

Se refiere al grado en que los ciclos vibratorios se asemejan entre si.


Existencia de uniformidad de la amplitud o del tiempo del ciclo.
Si las vibraciones son regulares, se debiera observar una imagen esttica de las
cuerdas vocales mientras se utiliza la luz estroboscpica sincronizada con la
frecuencia de vibracin de las cuerdas vocales.

6. Asimetra de fase

La simetra de fase es la sincrona en la unin de ambas cuerdas vocales en la


lnea media y punto de mxima amplitud. Si existe una simetra de fase, se
observa una coordinacin de ambas cuerdas vocales para la formacin de una
imagen en espejo.
En caso de existir asimetra se debe valorar si esta es constante o intermitente.

7. Bandas Ventriculares

Se valora la participacin, movimiento o intervencin de las bandas ventriculares o


falsas cuerdas vocales durante la fonacin.

Secuencia estroboscpica de la vibracin de las cuerdas vocales (Foto: KayPentax)

Montaje estroboscpico. Se observa la secuencia de un ciclo vibratorio completo de las


cuerdas vocales. (Foto: KayPentax).

LARINGOSCOPA DIRECTA

Otro procedimiento para explorar la laringe es la laringoscopa directa. A travs de este


mtodo se realiza una observacin directa de la laringe.
Para llevarlo a cabo se requiere anestesia general y el paciente debe estar en la sala de
operaciones. Se utiliza un laringoscopio y un microscopio quirrgico.
Este procedimiento es el utilizado para realizar las microcirugas larngeas o tomas de
muestra del tejido de las cuerdas vocales generalmente para biopsia (examen realizado
por un mdico otorrinolaringlogo).

Posicin del paciente durante la laringoscopa directa en


la sala de operaciones.

Laringoscopio tpicamente utilizado durante procedimiento de laringoscopa directa (izq). Imagen


de las cuerdas vocales tomada durante laringoscopa directa a travs de un microscopio (der).

CMARA DE ALTA VELOCIDAD

Varias tcnicas de visualizacin de las cuerdas vocales son usadas en la clnica y en


la investigacin para el diagnstico de alteraciones de la voz y evaluacin de la fisiologa
normal de la produccin de la voz.
La estroboscopa es un mtodo comnmente usado (como fue ya descrito), pero su
utilidad est limitada a casos de vibracin peridica de los pliegues vocales y a tiempos
de fonacin largos.
Para capturar patrones de vibraciones aperidicas en los pliegues vocales (comn en
alteraciones de la voz de un grado de severidad mayor), las imgenes capturadas
con cmaras de alta velocidad han emergido como un mtodo efectivo de visualizacin.

Los sistemas con cmaras de alta velocidad graban imgenes de una vibracin sostenida
de las cuerdas vocales y estn diseadas para observar y capturar el movimiento de
estas por sobre 4.000 cuadros por segundo, lo cual es suficiente para capturar las
vibraciones reales de las cuerdas vocales, permitiendo adems la observacin de una
vibracin aperidica.
Este sistema no depende de la frecuencia fundamental (F0) para la extraccin del
movimiento (la laringoestroboscopa si depende de la F0), inicia la grabacin en el inicio
de la fonacin, de este modo supera muchas desventajas de la videoestroboscopa
larngea.

Secuencia tomada durante una emisin voclica con cmara de


alta velocidad (Foto: Laryngoscope).

Equipo utilizado para la obtencin de


imgenes con cmara de alta velociadad.
(Foto: KayPentax)

De izquierda a derecha: Imgenes de cuerda normal, con


ndulos y con plipo tomadas con cmara de alta velocidad
(Foto: Laryngoscope).

VIDEOKIMOGRAFA

A pesar de que las cmaras de alta velocidad son una gran solucin para el examen de
vibraciones aperidicas de los pliegues vocales como fue anteriormente sealado,

desafortunadamente la excesiva cantidad de informacin que entregan causan el proceso


de anlisis muy complejo y largo.
En un intento de reducir la cantidad de informacin mientras se mantienen las ventajas de
las imgenes de alta velocidad, se desarroll el mtodo de la videokimografa.
A travs de esta tcnica se muestran las vibraciones de los pliegues vocales y de los
tejidos que las rodean en una imagen nica.
La videokimografa utiliza una videocmara especial que adems de registrar las
imgenes de los pliegues vocales completos a una velocidad estndar, puede tambin
escanear una sola lnea de la imagen larngea a una velocidad cercana a las 8.000
imgenes por segundo.
Muchas imgenes sucesivas de esta lnea son puestas juntas para formar la imagen
kimogrfica resultante en tiempo real, la cual muestra las vibraciones de la parte
seleccionada de los pliegues vocales.
De esta forma entonces, la videokimografa entrega una buena perspectiva de los
movimientos de los pliegues vocales y contiene informacin importante que sera difcil de
interpretar slo con una grabacin con cmara de alta velocidad.

A la izquierda observamos la imagen completa de las cuerdas


vocales normales con la lnea puesta en el lugar donde se obtendr
la secuencia de la imagen de la derecha en funcin del tiempo.

De arriba a abajo: imgenes kimogrficas de inicio vocal duro,


normal y soplado.

De izquierda a derecha: imgenes kimogrficas tomadas durante registro modal, transicin y registro de
falsete. En este ltimo se observa carencia de contacto gltico (Foto: J. Voice).

MTODOS DE EXPLORACIN FUNCIONAL

Los mtodos funcionales de exploracin de la voz son considerados procedimientos no


invasivos ya que no es necesaria la introduccin de ninguna ptica por va endoscpica
(oral o nasal). Como lo seala su nombre, estos mtodos miden diferentes parmetros de
la funcin vocal. A continuacin se entrega una descripcin detallada de los mtodos
funcionales ms utilizados para evaluar la voz.
ELECTROGLOTOGRAFA
La electroglotografa es un mtodo no invasivo que permite obtener informacin sobre
los movimientos vibratorios de las cuerdas vocales.
El trmino electroglotografa hace referencia a un dispositivo que permite visualizar
indirectamente los movimientos de los pliegues vocales mediante una pequea corriente

elctrica que pasa a travs del cuello, a nivel de la laringe, utilizando dos electrodos de
sobre la superficie del cuello.
Para realizar este estudio es necesario colocar un par de electrodos sobre la superficie
del cartlago tiroides, a la altura de los pliegues vocales. Un dbil voltaje de alta frecuencia
es aplicado a un electrodo y el otro electrodo recoge la corriente elctrica que pasa a
travs de la laringe. La impedancia elctrica vara con la apertura y cierre de la glotis, lo
que se traduce en una variacin de la corriente elctrica en fase con la fase vibratoria de
los pliegues vocales.

Realizacin del examen de electroglotografa

A la izquierda, se observan los electrodos utilizados en la electroglotografa. A la


derecha, un paciente con los electrodos colocados a ambos lados del cartlago tiroides

ANLISIS DE LOS PARMETROS CUALITATIVOS DE LA ELECTROGLOTOGRAFA


1.
2.
3.
4.

Regularidad de frecuencia y amplitud.


Estudio de fases del ciclo glticos (abierta, en cierre, cerrada y en apertura).
Existencia de doble pico en el trazado.
Oscilaciones en la regin del pico de cierre.

5. Grado de amplitud de la onda electroglotogrfica.

1 = Mnimo contacto entre las cuerdas vocales.


a = rea de contacto comienza a aumentar rpidamente,
inicio de la fase de cierre, contacto margen inf.
a-b = Prosigue la aproximacin del margen inferior
b = Margen superior hace contacto
b-c = Se alcanza el cierre gltico
c = pto. De mximo contacto de las cuerdas vocales. Termina la fase de cierre
c-d = Mxima rea de contacto. La glotis es mnima
d = Inicio de la fase de apertura
d-e = Prosigue la separacin gradual del margen inf. de las cuerdas vocales
e = separacin completa del margen inf. Inicio de la separacin del margen sup
E-f = Espacio gltico aumenta
f = Punto de mnimo contacto, glotis mxima.
f-a = Pico de alejamiento entre las cuerdas vocales.
Esquema ideal de un ciclo de electroglotografa

P ARMETROS CUANTITATIVOS DE LA ELECTROGLOTOGRAFA


Los parmetros cuantitativos ms utilizados son: promedio de frecuencia fundamental,
frecuencia fundamental mxima, frecuencia fundamental mnima, desviacin estndar de
la frecuencia fundamental, Jitter, Shimmer, cociente de contacto y cociente de apertura.

E JEMPLOS DE O NDAS DE ELECTROGLOTOGRAFA

Onda EGG de una voz normal en registro modal

Onda EGG de una voz normal en registro de falsete (fase abierta ms larga que la fase de contacto).

Onda EGG de una voz normal en registro vocal fry

Onda EGG de paciente con disfona (voz soplada). Se observa una prolongacin de la fase abierta del ciclo fonatorio.

Onda EGG de paciente con voz apretada. Se observa una prolongacin de la fase cerrada.

Onda EGG irregular.

MEDIDAS AERODINMICAS DE LA FONACIN


Las medidas aerodinmicas de la fonacin constituyen un mtodo clnico de evaluacin
para obtener informacin acerca de la funcin vocal de forma no invasiva. Estas medidas
son consideradas objetivas conjuntamente con el anlisis acstico de la voz y la
electroglotografa. Las medidas aerodinmicas ms comnmente utilizadas en la clnica
son: presin subgltica, flujo transgltico y resistencia gltica.

Equipo para la realizacin del examen de las


medidas aerodinmicas de la fonacin.

El promedio de la velocidad de flujo transgltico es definido como la velocidad con que el


aire pasa entre los pliegues vocales durante la fonacin y es medido en ml/seg. Dicho en
otras palabras, es el volumen en litros dividido por el tiempo mximo de fonacin en
segundos.

La presin subgltica, que es medida en cm. de H2O, acta como una fuerza debajo de
los pliegues vocales, subiendo hasta que supera la resistencia de los stos y dando
comienzo as a la oscilacin. Esta presin representa la energa disponible para la
creacin de la seal acstica de la voz.
La resistencia larngea es una medida derivada que combina las medidas de presin y de
flujo, no puede ser medida directamente. Se calcula dividiendo la presin subgltica por el
promedio de velocidad de flujo. Esta medida sirve como una estimacin de la funcin de
vlvula de la laringe.
Para mayor informacin sobre este tema, se recomienda leer el artculo de medidas
aerodinmicas de la fonacin que estar disponible en algunos mdulos ms adelante.

Este grfico muestra como el flujo de aire transgltico (lnea roja) aumenta desde una fonacin apretada (izquierda),
pasando por una fonacin normal (tercio medio) y llegando a una fonacin soplada (tercio derecho).
A medida que disminuye la resistencia de los pliegues vocales, el flujo de aire incrementa entre ellos.

Grficos representativos de la disminucin de la velocidad de flujo despus de la terapia vocal.


A la izquierda (pre-terapia) se ve un mayor flujo que en el grfico de la derecha (post-terapia).

Grficos representativos de la disminucin de la presin subgltica despus de la terapia vocal.


A la izquierda (pre-terapia) se ve una mayor presin subgltica que en el grfico de la derecha (post-terapia).

De izquierda a derecha se observa un aumento del flujo gltico al ir cambiando los registros vocales.
En el extremo izquierdo la voz est siendo producida con registro de vocal fry, el cual es caracterizado por un largo tiempo
cierre de las cuerdas vocales (alto cociente de aduccin). En la zona central, el registro utilizado es el modal o voz de pecho
con un grado de cierre gltico medio. Al extremo derecho la produccin vocal corresponde al registro de falsete donde las
cuerdas vocales tienen un disminuido cierre gltico (en ocasiones no hay cierre) lo que se demuestra con el ms alto flujo
gltico de la secuencia.

FILTRO INVERSO
Es una tcnica de anlisis que se aplica tanto a la seal acstica como aerodinmica de
la voz para un anlisis especializado de la forma de onda.

Debido a que este tipo de seales (acsticas y aerodinmicas) son medidas a nivel de la
boca, la forma de onda resultante (la que se ve) es el producto de dos componentes: el
sonido de la fuente gltica (cuerdas vocales) y las caractersticas de resonancia
del tracto vocal (filtro acstico).
El filtro inverso es una tcnica que asla estos dos componentes. A travs de una serie
de procesos de filtros computacionales, los efectos de las influencias del tracto vocal o
cavidades supraglticas (filtro acstico) pueden ser eliminados para analizar aisladamente
lo que ocurre en la fuente gltica.
La forma de onda que queda despus de este proceso de filtro reflejara los elementos
glticos del sonido o flujo (sin las influencias del tracto vocal). Por lo tanto, la tcnica de
filtro inverso permite al clnico o investigador observar los patrones acsticos de la fuente
gltica o los patrones de flujo de aire en la glotis.
La seal de filtro inverso usualmente es descrita por las pendientes de apertura y
cierre de la forma de onda. Medidas tpicas incluyen rasgos de tiempo tales como
proporciones del tiempo de apertura y cierre comparado con el largo total del perodo, y
rasgos de la forma, tales como los mnimos o los picos de la forma de onda.

Utilizando la mscara de Rothenberg

Mscara de Rothenberg se utiliza para hacer filtro


inverso y medidas aerodinmicas (Foto: Glottal).

Software utilizado para la realizacin del filtro inverso de a seal acstica o aerodinmica.

RESONANCIA MAGNTICA
La tcnica de resonancia magntica es utilizada para obtener imgenes de la
configuracin del tracto vocal y las cuerdas vocales en la investigacin en el rea de
voz y habla. Este mtodo permite capturar una serie de imgenes en forma de cortes, en
varios planos anatmicos (coronal, transversal y sagital). Adems es posible realizar
reconstituciones tridimensionales de los diferentes volmenes del tracto vocal a partir de
las imgenes en cortes obtenidas previamente. Esta tcnica de exploracin a diferencia
de la tomografa computada (TAC) no tiene efectos perniciosos (no hay radiacin). La
resonancia magntica obtiene las imgenes larngeas o del tracto vocal a travs de la
deteccin de la frecuencia de seales de radio desde los tomos de hidrogeno en los
tejidos, los cuales son colocados en un fuerte campo magntico. Otras ventajas de esta
tcnica es que es posible observar imgenes claras de los tejidos blandos que son
relevantes en la produccin de la voz y el habla.

Imagen en corte sagital de cabeza y cuello


obtenida con resonancia magntica.

Equipo para realizar el examen de resonancia magntica (Izq).


Imagen en corte sagital centrada en los rganos articulatorios obtenida con resonancia magntica (der).

Secuencia durante la produccin de voz en registro modal (dos de la izquierda) y registro de falsete (dos de la derecha)
(Foto: J. Voice).

ELECTROMIOGRAFA LARNGEA
La electromiografa larngea es una un sistema directo para medir la actividad de los
msculos de la laringe que controlan el movimiento de las cuerdas vocales.
Esta tcnica debe ser realizada por un mdico especializado en su realizacin. Se
insertan agujas (que son a su vez electrodos) percutneamente en los msculos larngeos
y a travs de esto se puede estudiar el patrn de actividad muscular elctrica. Estos
electrodos se ubican en varios msculos de la laringe, pero principalmente en dos: el
cricotiroideo y el tiroaritenoideo.
La electromiografa larngea se utiliza para evaluar el inicio, la coordinacin y los patrones
de amplitud de la actividad muscular y puede ser usado para discriminar la funcin normal
de las alteraciones neurolgicas de los msculos larngeos tales como parlisis de cuerda
vocal (perdida del movimiento), paresia de cuerda vocal (disminucin del movimiento),
distonas, o fijaciones mecnicas como al anquilosis.
Las seales elctricas grabadas desde los msculos son interpretadas como normal o
patolgicas basadas en cuatro caractersticas bsicas: sincronizacin (inicio y trmino) de
la actividad muscular, y adems los patrones, nmeros y amplitud de los potenciales de
accin muscular.

Realizacin del examen de electromiografa larngea (izq).


Colocacin de los electrodos en los msculos cricotiroideo (izquierda) y tiroaritenoideo (derecha) (Foto: Laryngoscope)
(der).

Durante la realizacin de la electromiografa larngea, el paciente est en posicin


acostada y su cabeza levemente extendida hacia atrs. Una vez en esta posicin el
mdico inserta las agujas (electrodos) en los msculos larngeos que sern evaluados. Se
le pide la paciente que produzca varios sonidos con la voz (tareas fonatorias) y de esta
forma activar cada msculo que est siendo evaluado.

Grfico obtenido durante el examen de electromiografa larngea.

Nasometra
Es un examen realizado para evaluar y controlar el grado de nasalizacin o escape de
aire nasal durante el habla. Este examen utiliza un dispositivo que separa las cavidades
nasal y oral del paciente con una placa reflectora. Hay dos micrfonos, uno montado
arriba de la placa y otro debajo de la placa los cuales capturan la energa acstica
proveniente de la nariz y de la boca respectivamente durante el habla. Este instrumento
computa una proporcin de los datos acsticos obtenidos de estos dos micrfonos. Esta
proporcin es el correlato acstico de la nasalidad. La nasometra no slo se puede ser
utilizada para la evaluacin del grado de nasalidad, sino que adems es muy til como
herramienta de retroalimentacin en tiempo real durante la terapia, especialmente en
casos de pacientes con voz nasal (escape de aire por las fosas nasales).

Realizacin de la nasometra (Izq) . Nasmetro (der) (Foto: Glottal)

Equipo completo para realizar la nasometra

ANLISIS ACSTICO DE LA VOZ

Oscilogama
El oscilograma o forma de onda es una representacin temporal del sonido

Oscilogramas de voz normal (onda peridica compuesta).


Ambas ondas son las mismas, pero la segunda est ms descomprimida para una mejor visualizacin.

ESPECTRO FFT
La FFT (Transformada rpida de Fourier) muestra la amplitud relativa de los
armnicos, reflejando la combinacin del espectro de la fuente, la funcin de
transferencia y las caractersticas de radiacin. La FFT no es precisa para determinar la
frecuencia de los formantes ya que en ocasiones el centro de frecuencia de estos no
coincide con los armnicos.

FFT de la vocal /i/ con filtro de banda estrecha.


Se observa buena definicin para los armnicos de la voz.

FFT de la vocal /i/ con filtro de banda ancha.


No se observa buena definicin para los armnicos de la voz si la comparamos con la FFT de con banda estrecha (arriba).

FFT en cascada de la vocal /i/ con filtro de banda estrecha. Se observa el FFT en funcin del tiempo.

ESPECTROGRAMA
El espectrograma tambin se realiza aplicando un anlisis de Fourier. Se diferencia del
spectrum FFT en que entrega la informacin de forma diferente. El espectrograma se
observa en funcin del tiempo, no es un corte en un momento determinado como lo es el
spectrum. A travs del espectrograma podemos ver los cambios de armnicos y
formantes en una ventana con un tiempo determinado.

Espectrograma vocal /a/ voz normal con filtro de banda ancha


(Buena definicin para los formantes y ciclos)

Espectrograma vocal /a/ voz normal con filtro de banda estrecha


(Buena definicin para los armnicos de la voz)

Espectrograma voz disfnica con escape de aire. Se observa ruido interarmnico y prdida de energa
de los armnicos de alta frecuencia. Los armnicos mas altos desaparecen y son completamente reemplazados por ruido.

Espectrograma de un glisando (con filtro banda estrecha). A medida que aumenta la frecuencia fundamental en el glisando,
la distancia interarmnica es mayor. La secuencia se inicia con registro de vocal fry, luego modal, falsete, modal y finaliza
con vocal fry nuevamente.

Espectrograma de banda ancha de una secuencia voclica /i, e, a, o, u/ (con filtro de banda ancha). Gran variacin de los
formantes 1 y 2 a medida que se modifica el tracto vocal cambiando el molde voclico. La vocal /i/ de caracteriza por un
F1 en frecuencias bajas y F2 en frecuencias altas. La vocal /a/ se caracteriza por un F1 y F2 muy cercanos en frecuencias
medias.
La vocal /u/, F1 y F2 muy cercanos en frecuencias bajas.

Mismo espectrograma anterior con historia formntica (LPC).

Espectrograma de banda estrecha o angosta de una secuencia voclica. Los formantes no son notorios por el hecho de ser
con banda estrecha. Si existe una clara diferenciacin de los armnicos de la voz.

Espectrograma vocal /a/ cantada con vibrato. Se pueden ver las oscilaciones del vibrato en cada armnico
y adems se observa claramente el formante del cantante cercano a los 3000 Hz.

ESPECTRO PROMEDIO A LARGO PLAZO (LTAS)


LTAS (Long-term Average Spectrum) pone en un slo espectro la medida de varios
espectros obtenidos en un periodo de tiempo determinado, mientras el paciente habla, lee
un texto o canta una cancin. Es especialmente til para obtener caractersticas tanto de
la fuente (cuerdas vocales), como del filtro (tracto vocal), siendo mas importante las
primeras. A travs del LTAS es posible obtener varias variables relacionadas con la
distribucin de la energa espectral de la voz, por medio de pendientes espectrales,
siendo una de las ms utilizadas el Alpha Ratio.

Este grfico LTAS corresponde a al habla espontanea de un actor con voz resonante.
Posee gran amplitud de los armnicos de alta frecuencia.

Este grfico LTAS corresponde a al habla espontanea de un actor con voz opaca.
Posee pobre amplitud de los armnicos de alta frecuencia si la comparamos con la imagen anterior perteneciente a una voz
resonante.

LTAS de una voz severamente disfnica. Se observa ausencia completa de energa armnica en casi todo el espectro. Solo
se pueden distinguir los dos primeros armnicos. Desde 700 Hz hacia arriba slo se observa energa no armnica (ruido)

ESPECTRO LPC
La LPC (Lineal Predicting Code) muestra una envolvente del espectro y por lo tanto la
identificacin de los formantes es fcil. No se pueden ver los armnicos. El LPC se puede
graficar de dos formas: como historia formntica o como un corte.

Corte LPC de vocal /a/.

FFT y LPC de la vocal /a/ juntos. Al estar ambos juntos se obtiene una
buena aproximacin visual de la coincidencia formantes-armnicos.

LPC en historia formntica de una frase hablada. Lineas rojas muestran los formantes durante le habla.

LPC en historia formntica de una secuencia de dos vocales /i/ y /a/ en forma consecutiva.
La lnea de color rojo muestra el primer formante (F1), la lnea de anaranjada seala el segundo formante (F2),
ms arriba la lnea de color verde muestra el tercer formante (F3) y finalmente la lnea azul seala el cuarto formante (F4)

LPC en cascada de la vocal /i/. se observan los cortes de LPC en funcin del tiempo.

CEPSTRUM
El anlisis cepstral provee una forma efectiva de derivar el valor de la F0 y evaluar
algunas caractersticas de la fuente y funcin del filtro del tracto vocal de una forma no
invasiva. La palabra cepstrum se origina de la inversin de la primera slaba de la palabra
spectrum. La razn de esto es porque el anlisis cepstral es de alguna forma lo inverso
del anlisis espectral. En otras palabras, el mtodo cepstrum consiste en aplicar dos
transformadas de Fourier a la forma de onda del sonido vocal.

En esta imagen se observa la FFT (arriba) y el clculo del cepstrum (abajo). Este ltimo resulta en la determinacin del pico
de mayor amplitud en una escala temporal, lo que permite calcular el valor de la frecuencia fundamental, y la amplitud de
este pico del cepstrum, entregando informacin relacionada con grado de periodicidad de la voz.

Cepstrum voz normal. Se observa un pico con un valor de 7,6. Este valor representa el periodo de la F0 y a travs de ste
podemos derivar que el valor de la frecuencia fundamental es 131 Hz. La intensidad de ese pico est dada por el valor de
150, sealado presencia de alta energa en la F0 (atribuido a una voz de buena calidad). Adems podemos observar que
existe un ancho reducido del pico cepstral, indicando alta estabilidad de la frecuencia.

Cepstrum voz disfnica. Nuevamente se observa un pico con un valor de 7,6. y por lo tanto el valor de la frecuencia
fundamental es 131 Hz. Pero, en forma contraria a la imagen anterior, ac vemos un pico de F0 de baja intensidad (50) y
ms ancho. Lo primero seala poca energa en este componente espectral y lo segundo indica alto grado de inestabilidad.
Ambos rasgos caractersticos de voces de mala calidad.

ANLISIS DE NDICES ACSTICOS


Los ndices acsticos son valores numricos que entregan informacin acerca de
diferentes parmetros de la fonacin tales como: perturbacin de la frecuencia,
perturbacin de la amplitud, cantidad de ruido y energa armnica en la voz, cantidad de
sub-armnicos, quiebres vocales, temblor vocal e irregularidades.

Grfico de ndices acsticos de una voz normal


(todos los ndices estn en verde, dentro de rangos normales)

Grfico de ndices acsticos de una voz alterada (paciente con ndulos de cuerdas vocales).
Se ven ndices en rojo (fuera del rango de normalidad). Por ejemplo, se observa que los ndices jitter (Jitt) y shimmer
(Shim), perturbacin de la frecuencia y de la amplitud respectivamente, estn fuera de rangos normales.

Grfico de ndices acsticos de una voz severamente alterada (parlisis de cuerda vocal).
La mayora de los ndices acsticos estn en color rojo indicando que estn fuera del rango de normalidad.

FONETOGRAMA
El fonetograma es una representacin grfica de los rangos de frecuencia e intensidad
de una voz. Rango vocal y rango dinmico respectivamente. Mediante la grabacin se
le pide al paciente que emita cada nota de la extensin tonal a la mnima y mxima
intensidad que sea capaz de hacerlo. Esto dar un rea denominada campo vocal. El
fonetograma es muy til para registrar el estado pre y post tratamiento fonoaudiolgico,
mdico o quirrgico, de esta forma se pueden observar en forma grfica los avances del
tratamiento a travs de los parmetros ya mencionados: rango vocal, rango dinmico y
campo vocal.

Fonetograma perteneciente a una voz normal.

Fonetograma perteneciente a una voz patolgica. Campo vocal disminuido (disminucin del rango dinmico y rango vocal).

HISTOGRAMA
El histograma es un grfico que muestra el nmero de veces que se repite cada valor de
frecuencia fundamental o F0 (histograma de frecuencia) y cada valor de intensidad
(histograma de intensidad o amplitud) durante la emisin de la voz. Dicho de otra forma, el
histograma muestra las frecuencias fundamentales (en Hz) y las intensidades (en dB) que
ms utiliza el paciente durante la emisin de voz. Para obtener la F0 y la intensidad ms
utilizada por un paciente, se le pide que produzca una vocal mantenida, diga alguna frase
o hable en forma normal (habla espontnea), esta seal se grafica posteriormente en los
histogramas ya mencionados. El histograma es la forma objetiva ms confiable para
obtener el Tono medio hablado de una persona.

Histograma de Intensidad o amplitud correspondiente a una voz normal (vocal mantenida).


La barra ms larga es la intensidad ms utilizada por el paciente. Este caso muestra una voz estable.

Histograma de Frecuencia correspondiente a una voz normal (vocal mantenida). La barra ms larga es la F0 ms utilizada
por el paciente. Voz estable.

Histograma de F0 correspondiente a una voz con quiebre vocal (comnmente encontrado en la puberfona). Se observan
dos picos claramente diferenciados producto de la gran diferencia de F0 de la voz antes y despus del quiebre vocal. Voz
con inestabilidad.

Histograma de amplitud correspondiente a una voz con quiebre vocal. Se observan dos picos claramente diferenciados
producto de la gran diferencia de amplitud de la voz antes y despus del quiebre vocal.

CONTORNOS
Los contornos grafican la variacin ciclo a ciclo de la frecuencia fundamental (F0) y
la amplitud. Mientras ms parejo sean los contornos se demuestra menos variacin ciclo
a ciclo y por lo tanto mejor calidad vocal durante una vocal mantenida en el tiempo. Las
escalas de F0 e intensidad son diferentes e independientes.

Grfico mostrando una voz normal con frecuencia fundamental (F0) y amplitud estables. Arriba, la lnea de color azul se
observa el contorno de amplitud y abajo, la lnea de color rojo, el contorno de F0 o contorno meldico.

Grfico mostrando un quiebre vocal. Arriba en azul se observa el contorno de amplitud el cual baja bruscamente producto
del quiebre vocal. Abajo en color rojo el contorno meldico, el cual asciende bruscamente pasando desde registro de pecho
a falsete durante el quiebre tonal.

Grfico mostrando contornos de intensidad y F0 muy inestables. Se le solicit al paciente producir una vocal mantenida los
ms estable posible, sin embargo no fue capaz de realizar la tarea solicitada.

Estos contornos de intensidad y F0 pertenecen a un paciente con temblor de voz. Esta patologa es de origen neurolgico.
En el grfico se observa claramente que tanto el contorno de amplitud, como el de F0 presentan modulaciones reflejando en
temblor del paciente.

Fonoaudilogo Marco Guzmn


www.vozprofesional.cl

También podría gustarte