Exploración Clínica de La Voz 2018

EXPLORACIÓN CLÍNICA DE LA VOZ
A lo largo de la última década, la preocupación por los problemas de la voz ha

pasado de considerarse una atención médica extraordinaria, dirigida a unos
cuantos profesionales de la voz o cantantes de elite, a formar parte del
concepto de salud en su sentido más amplio, al alcance de todos (Papsin,
1996). Atrás quedó el tiempo en que la patología de la voz se consideraba una
consecuencia inevitable de una grave enfermedad de base, que era la
importante, o de su consideración como un problema otorrinolaringológico de
carácter menor al que un individuo debía, en la mayor parte de los casos,
acostumbrarse. Los trastornos de la voz cobran su máxima importancia
cuando el propio individuo los concibe como la alteración de un parámetro
vital que le causa sufrimiento o incapacidad de adaptarse al medio (social o
laboral).
Hasta hace relativamente poco tiempo, la valoración objetiva y exacta de la voz

era inexistente. Históricamente, la voz ha sido medida de una forma subjetiva;
el juicio era hecho íntegramente por la percepción de expertos mediante la
llamada valoración psicoacústica de la voz. Este tipo de análisis, a pesar de su
frecuente uso aún hoy, presenta el inconveniente de la subjetividad con la que
el oyente juzga la voz, llevando a discrepancias intra e interjuicios (LaBlance,
Steckol y Cooper, 1996).
Actualmente, la aparición de nuevas posibilidades técnicas en el análisis
anatómico-funcional de las cuerdas vocales (la laringoestroboscopia, el análisis
acústico-vocal y, sobre todo, el análisis espectrográfico) permiten al
profesional contar con herramientas muy útiles para ayudar a su “oído clínico”
a precisar mejor sus juicios diagnósticos y a sistematizar más adecuadamente
la rehabilitación.
La integración de los diferentes niveles de análisis y profesionales en el

proceso de evaluación de la voz resulta de enorme interés e importancia de
cara a conseguir una mayor finura y precisión en el diagnóstico. De esta
manera se logra la objetivación de la alteración fonatoria (aislar las variables
más determinantes que se pueden considerar a la hora de anticipar los efectos
de una disfonía funcional), con el fin de poder analizar los resultados post-
tratamiento, realizar comparaciones inter-institucionales o entre diferentes
servicios clínicos y solucionar conflictos médicos-legales, cada vez más
frecuentes.
Para la elaboración de un protocolo básico de exploración clínica de la voz la
Sociedad Europea de Laringología nos dicta unas sugerencias:
 la función vocal es multidimensional.
 para la presentación-publicación de resultados de tratamiento de
trastornos de la voz es necesario unas exploraciones básicas o mínimas en
el objeto de poder realizar comparaciones y posibles meta-análisis.
 aunque continuamente están apareciendo nuevos procedimientos
diagnósticos, un set básico de exploraciones se tiene que realizar en todos
los casos.
 este protocolo básico debe ser utilizado para el estudio de las disfonías
más comunes, pero existe un pequeño grupo de patologías específicas que
requerirá su propio protocolo como la disfonía espasmódica o las voces de
sustitución (no generada por las cuerdas vocales).
El protocolo que nosotros aconsejamos de Exploración Clínica de la Voz
contiene estas exploraciones o estudios (ver Anexo al final del capítulo):
1. Valoración subjetiva por el propio paciente

2. Exploración perceptual de la voz
3. Exploración videolaringoestroboscópica
4. Exploración aerodinámica
5. Análisis acústico
6. Análisis espectrográfico
Veamos en que consiste cada uno de ellos.
1.- Valoración subjetiva del propio paciente:

Esta evaluación de la voz, aunque subjetiva por definición, tiene una gran
importancia en la práctica clínica, ya que es el paciente quien tiene que vivir
con su voz.
La calidad de vida de los pacientes es un importante factor que se debe

cuantificar en muchas áreas de la medicina, por lo que se está prestando
atención a desarrollar herramientas válidas (cuestionarios) para medir el
impacto de la enfermedad que el paciente percibe. Este tipo de cuestionarios
se está extendiendo a todos los ámbitos de la medicina en respuesta a la
importancia de valorar todos los aspectos emocionales o de calidad de vida del
paciente, dentro de una perspectiva holística de la persona.
El índice de incapacidad vocal o Voice Handicap Index (VHI) es un cuestionario

desarrollado por Jacobson y cols. (1997) con el fin de cuantificar el impacto
percibido por un sujeto afectado por un trastorno vocal en los ámbitos de la
propia función vocal, en la capacidad física relacionada con ella y en las
emociones que provoca la disfonía. En realidad existen distintos cuestionarios
para estudiar la calidad de vida de los pacientes disfónicos, tales como el Voice
Performarce Questionnaire, el Voice-Related Qquality of Life, el Voice
Participation Profile y la Voice Symptom Scale, pero se ha concluido que el VHI
es el cuestionario más versátil y fácil de completar por el paciente y el que
contiene la información más relevante acerca de la calidad de vida relacionada
con la voz.
El VHI contiene 30 ítems organizados en tres grupos de 10,
denominados subescala física, subescala emocional y subescala funcional. Cada
pregunta el paciente la responde con una puntuación de 0 a 4, siendo 0=
nunca, 1= casi nunca, 2= algunas veces, 3= casi siempre y 4= siempre; siendo,
por la tanto, el valor máximo del VHI 120 puntos. Se puede usar también una
versión corta al demostrarse que con 10 ítems seleccionados de los 30
originales se tenía la misma potencia y fiabilidad.
El VHI ha sido adaptado a la lengua de muchos países como instrumento
válido para la valoración del menoscabo vocal. En España el VHI ha sido
traducido por la Comisión de Foniatría de la Sociedad Española de
Otorrinolaringología (SEORL) y posteriormente validado.
La versión en español del VHI-30 sería la siguiente:
– Parte I-F (funcional)

F1. La gente me oye con dificultad debido a mi voz
F2. La gente no me entiende en sitios ruidosos.
F3. Mi familia no me oye si la llamo desde el otro lado de la casa.
F4. Uso el teléfono menos de lo que desearía.

F5. Tiendo a evitar las tertulias debido a mi voz.
F6. Hablo menos con mis amigos, vecinos y familiares.
F7. La gente me pide que repita lo que les digo.
F8. Mis problemas con la voz alteran mi vida personal y social.
F9. Me siento desplazado de las conversaciones por mi voz.
F10. Mi problema con la voz afecta al rendimiento laboral.
– Parte II-P (física)

P1. Noto perder aire cuando hablo.
P2. Mi voz suena distinto a lo largo del día.
P3. La gente me pregunta: ¿qué te pasa con la voz?
P4. Mi voz suena quebrada y seca.
P5. Siento que necesito tensar la garganta para producir la voz.
P6. La calidad de mi voz es impredecible.
P7. Trato de cambiar mi voz para que suene diferente.
P8. Me esfuerzo mucho para hablar.
P9. Mi voz empeora por la tarde.
P10. Mi voz se altera en mitad de una frase.
– Parte III-E (emocional)

E1. Estoy tenso en las conversaciones por mi voz.
E2. La gente parece irritada por mi voz.
E3. Creo que la gente no comprende mi problema con la voz.
E4. Mi voz me molesta
E5. Progreso menos debido a mi voz.
E6. Mi voz me hace sentir cierta minusvalía.
E7. Me siento contrariado cuando me piden que repita lo dicho.
E8. Me siento avergonzado cuando me piden que repita lo dicho.
E9. Mi voz me hace sentir incompetente.
E10. Estoy avergonzado de mi problema.
El VHI abreviado (VHI-10) sería este:
F1. La gente me oye con dificultad debido a mi voz.
F2. La gente no me entiende en sitios ruidosos.
F8. Mis problemas con la voz alteran mi vida personal y social.
F9. Me siento desplazado de las conversaciones por mi voz
F10. Mi problema con la voz afecta al rendimiento laboral.

P5. Siento que necesito tensar la garganta para producir la voz.
P6. La calidad de mi voz es impredecible.
E4. Mi voz me molesta.
E6. Mi voz me hace sentir cierta minusvalía
P3. La gente me pregunta: ¿qué te pasa con la voz?
Es de destacar que existen trabajos en los que no se ha encontrado relación

del VHI con los parámetros analizados habitualmente en el estudio de la
disfonía, de lo que se deduce que las sensaciones de un paciente acerca de su
problema vocal no puedes ser evaluadas mediante medidas objetivas. Este
hecho se observa de forma frecuente en las consulta de voz en pacientes que
no valoran un tratamiento ya realizado como particularmente efectivo a pesar
de que pueda presentar unos excelentes resultados posterapeúticos en las
medidas objetivas.
Aunque nosotros preferimos el VHI como instrumento para la valoración

objetiva de propio paciente, la Sociedad Europea de Laringología propone una
evaluación mínima subjetiva mediante una doble escala visual analógica de
100mm: por un lado la impresión de la calidad de la voz en sentido estricto
(escala Vo) y por otro lado, la repercusión que el problema vocal tiene en su
entorno social y profesional (escala Dis). Un resultado de = indicaría una voz
normal y uno de 100, de alteración extrema de la función vocal.
2.- Exploración perceptual de la voz:

La Valoración Perceptual de la voz, también llamada Psicoacústica consiste en la
apreciación subjetiva de las características de la voz del sujeto en función de la
experiencia previa y de los conocimientos del examinador. Comienza desde el
mismo momento en que el paciente entra en el consultorio y el clínico inicia la
entrevista.
Es difícil decir si una voz es normal y, más difícil todavía, indicar cómo debería
ser una voz en una persona determinada para considerarla normal.
Diríamos entonces que existe una alteración de la voz cuando ésta difiere de
las voces de otras personas del mismo sexo y similar edad y grupo cultural en
el timbre, tono, volumen y flexibilidad en la dicción. Por tanto, a modo de
conclusión, podríamos decir que el concepto de voz normal, en sentido
estricto, no existe.
Desde el punto de vista clínico-práctico las características perceptuales de una

voz disfónica se pueden describir utilizando diversos sistemas de análisis: el
perfil vocal de Wilson, el Perfil Vocal de Buffalo, la Escala por rangos de Boone;
pero, sin duda, el más extendido de todos en nuestro país (y el que hemos
utilizado en nuestro protocolo) es el sistema GRABS (propuesto por Hirano en
1981), acrónimo inglés de las palabras:
– G, grade (grado)

– R, rough (también en inglés hoarse, ronca, áspera)
– A, astenic (asténica, fatigada, cansada)
– B, breathy (aérea, espirante, soplada)
– S, strain (también en inglés harsh, tensa, constreñida)
Cada uno de los apartados se valora en una escala de 4 puntos, donde 0 sería
normal, 1 ligero, 2 moderado y 3 severo o extremo. Los parámetros B y R son
los más fiables en la clínica diaria y se relacionan con lesiones orgánicas; los
factores A y S son menos fiables y se relacionan con trastornos funcionales.
Debido a esto existe una escala simplificada, muy usada en los países
germano-hablantes, que se conoce como RBH ( RauhigKeit por ronca o
áspera, Behauchtheit por aérea y Heiserkeit por disfonía).
3.- Exploración videolaringoestroboscópica:
Actualmente se considera la principal herramienta clínica para diagnosticar el
origen de los trastornos de la voz. La estroboscopia es un método de
exploración que produce una ilusión óptica por la que un objeto que se mueve
con rapidez y periódicamente aparece inmóvil o moviéndose lentamente.
Aunque es un método conocido desde hace muchos años, el creciente interés

por la patología vocal y los avances de la técnica han hecho que sea
considerado el procedimiento más útil de los que disponemos para el
diagnóstico de los trastornos de la voz, al permitirnos observar con gran
precisión y detalle las alteraciones de la ondulación de la mucosa y la situación
del borde libre de la cuerda vocal. Los principios fisiológicos en los que se basa
la obtención de imágenes estroboscópicas son las características perceptivas
del sistema óptico. El sistema visual humano presenta una limitación temporal
ya que retiene una imagen en su retina durante 0.2 segundos, lo que se
denomina persistencia de la visión e impide ver más de cinco imágenes por
segundo. Las imágenes secuenciales que se producen a intervalos menores de
0.2 segundos persisten en la retina y se fusionan con las imágenes sucesivas
para producir la ilusión óptica de movimiento aparente. Este fenómeno se
denomina Ley de Talbot, que también explica el hecho de que veamos un
movimiento continuo cuando se nos presentan una serie de imágenes fijas
que cambian rápidamente como son los dibujos animados. Para la
observación a ojo desnudo de un objeto en movimiento demasiado rápido
(como puede ser la vibración de las cuerdas vocales durante la fonación, entre
100 y 1000 vibraciones por segundo) precisa de una iluminación intermitente
en muy cortos destellos de luz.
Se pueden sincronizar los destellos de luz con la frecuencia a la que están
vibrando las cuerdas vocales de forma que aparezca iluminado siempre que
pase por el mismo lugar, logrando así el efecto de inmovilidad o “imagen
congelada”. Si conseguimos que el destello ilumine el objeto en una posición
un poco más adelantada (desincronizadas las frecuencias) estaremos
observando un movimiento ficticio en “cámara lenta”.
figura 1
Por su facilidad de uso nosotros preferimos realizar la estroboscopia con

telelaringoscopio de 70º, aunque esto puede variar en función de las
preferencias del examinador, no obstante sería aconsejable si se van a realizar
comparaciones pre/postratamiento usar el miso tipo de endoscopio (rígido o
flexible, si rígido: el mismo ángulo) (ver figura 1)
La utilización de los unos determinados parámetros estroboscópicos esta
basado en la fiabilidad (reproductividad inter e intraobservador), en la no
redundancia y en la sensibilidad clínica (relación con conceptos fisiológicos).
Los parámetros estroboscópicos básicos son:
o Cierre glótico
El cierre glótico se clasifica en completo o incompleto. Es interesante describir
los casos de cierre glótico incompleto dado que hay formas características de
determinadas patologías ( ver figura 2):
figura 2
1. Ojal posterior (asociada habitualmente a un uso muscular inadecuado,

pero que también se observa a menor escala en mujeres adultas sin
trastornos de la voz).
2. Ojal anterior (generalmente causada por un defecto estructural).
3. Ojal anterior y posterior (en “reloj de arena”, asociada habitualmente a
nódulos vocales bilaterales).
4. Ojal irregular (asociada a bordes irregulares, cicatrices o lesiones de las
cuerdas vocales).
5. Ojal fusiforme, en doble paréntesis (asociado a procesos neurológicos,
psicógenos, de uso muscular inadecuado o de envejecimiento).
6. Ojal longitudinal o cierre incompleto en toda la longitud de los bordes
libres de las cuerdas vocales (asociadas a afonía por conversión psicógena o
parálisis).
o Regularidad o periodicidad
Es el grado en que los ciclos vibratorios sucesivos se asemejan entre sí. Se
valora mediante la luz estroboscópica sincronizada con el ciclo vocal (“imagen
congelada”) de forma que si es periódica se verá una imagen estática y si es
aperiódica o irregular la imagen parece que “salta”. Toda patología que altere
el tono muscular y las propiedades mecánicas de la cuerda vocal así como la
presión subglótica puede modificar la periodicidad del aparato vocal.
o Onda mucosa
La onda mucosa se refiere a le serie

de ondulaciones de la cubierta de las cuerdas que se observan durante la
fonación. Depende de una viscosidad tisular diferente entre el revestimiento
mucoso y el músculo vocal (ver figura 3). Puede observarse en forma de una
luz horizontal o una línea que se desplaza de la superficie medial a la lateral de
las mismas y de abajo hacia arriba. Se observa mejor durante una fonación
intensa y se juzga independientemente en cada cuerda vocal. Puede estar
ausente, disminuida, normal o aumentada. La onda mucosa estará aumentada
cuanto mayor sea la presión subglótica (fonación intensa) y cuando la cuerda
vocal esté fláccida (edema de Reinke). Por el contrario, estará disminuida
cuando la mucosa de la cuerda vocal esté más o menos rígida (voz en falsete,
cicatriz en la cuerda, pólipos y nódulos fibrosos, leucoplasia, carcinoma in situ).
Cuando está ausente puede deberse a una cicatriz extrema por cirugía previa
o por un carcinoma invasor.
o Simetría
Permite observar hasta qué punto el desplazamiento y aproximación de las
cuerdas vocales para encontrase en la línea media de la glotis es tan
coordinada y perfecta que forman imágenes en espejo. Las cuerdas vocales
son simétricas cuando tienen idéntico comportamiento tanto en el
movimiento de apertura y de cierre (simetría de fase) como en el de extensión
latero-medial (simetría de amplitud). En general se puede decir que cualquier
lesión vocal que limite la capacidad vibratoria producirá una onda asimétrica,
por ejemplo cicatriz vocal, quiste epidérmico o leucoplasia.
4.- Exploración Aerodinámica:
figura 4
En la fonación interviene un flujo aéreo generado por los pulmones en

espiración; flujo, que tropieza en el nivel glótico con una resistencia vinculada
a la aducción de las cuerdas vocales (ver figura 4). Como resultado de la
interacción de esta columna aérea con la resistencia que le oponen las cuerdas
vocales (función esfinteriana), éstas entran en vibración resultando una serie
de pulsos de presión que afectan a las moléculas de aire existentes en el
aparato vocal haciendo que oscilen (ver figura 5). Así una laringe que no cierre
con la suficiente firmeza sus cuerdas vocales dejará un ojal glótico por donde
figura 5
se pierde una gran cantidad de aire, dando lugar a un acortamiento de la
fonación que el sujeto es capaz de realizar en cada inspiración.
La valoración aerodinámica, también llamada valoración de la eficacia

fonorespiratoria, no pretende ser más que la valoración objetiva de estos
conceptos de flujos aéreos y presiones de la columna aérea. En un protocolo
básico de exploración clínica de la voz bastaría con la medición de los
siguientes parámetros que hemos seleccionado, tal y como proponemos en
nuestro protocolo “Teatinos”.
4.1. Tiempo Máximo de Fonación (TMF):
Es la medida indirecta más sencilla para objetivar el volumen de aire empleado
durante la fonación. Nos proporciona información sobre la integridad glótica,
el apoyo respiratorio o ambas cosas. Se define como el mayor tiempo que un
sujeto es capaz de mantener una vocal, generalmente la /a/ o la /e/, tras una
inspiración profunda a un volumen y una frecuencia (tono) cómodas. Se
obtiene de la siguiente forma: se coloca el sujeto de pie con el tronco bien
erguido y se le indica que emita el sonido vocal tras realizar una inspiración
profunda; el tono debe ser el habitual en su fonación ni muy agudo ni muy
grave, evitando cualquier gesto laríngeo propio de la hiperfonación; asimismo,
el sonido debe producirse a un volumen que aproximadamente se oiga a unos
2 metros en un entorno silencioso (lo que viene a representar unos 45-55 dB.).
Se mide la duración de dicho sonido vocal antes de que decaiga su tono y
volumen con un cronómetro. Es conveniente realizar 3 mediciones con un
intervalo de 2-3 minutos entre ellas y se considera óptima la de mayor
duración. Los valores normales varían en función de la edad y el sexo como se
muestra en la tabla 1.
SEXO MASCULINO
EDAD MEDIA (segundos) DESVIACIÓN TÍPICA
(segundos)
< 4 años 8,9 2,1
Entre 4 y 12 años 17,1 4,1
Adultos 25,9 7,4
> de 65 años 14,7 6,2

SEXO FEMENINO
MEDIA (segundos) DESVIACIÓN ESTANDAR
EDAD (segundos)
< 4 años 7,5 1,8

Entre 5 y 12 años 14,9 3,8
Adultas 21,3 5,6
> de 65 años 13,5 5,7
Unos valores por debajo de 10 segundos se deben considerar patológicos. Un
valor bajo del TMF (Tiempo Máximo de Fonación) puede deberse a dos
circunstancias: una patología respiratoria con volúmenes pulmonares bajos o
bien una patología laríngea en la que exista pérdida de la eficacia glótica
porque una lesión impida el cierre de las cuerdas vocales (masa, fijación).
4.2.-Índice s/z o fonorespiratorio:

Consiste en la relación entre TMF para la consonante /s/ (Tiempo de Soplo) y el
TMF para la vocal /a/ ó /e/.
Indice s/z: TMF “s” / TMF “a”

Donde TMF ”s” corresponde al numerador de la relación y TMF “a” al
denominador. Tiene como finalidad relacionar las funciones pulmonar y
laríngea.
Los individuos normales deben ser capaces de mantener la vocalización /a/

(TMF “a”) durante un periodo de tiempo igual o ligeramente menor al
mantenido durante la espiración controlada sin vocalización /s/ (TMF “s”), es
decir el numerador de la relación es igual o ligeramente mayor que el
denominador por lo que el cociente debe de ser la unidad o ligeramente
mayor. Si existe una patología respiratoria y la laringe es normal habrá una
reducción tanto en el tiempo del aire espirado sin fonación /s/ (TMF “s”) como
el de fonación /a/ (TMF “a”), por lo que el cociente seguirá sin variar. Sin
embargo, si existe una patología laríngea con incompetencia glótica y apoyo
respiratorio normal habrá una disminución para mantener la fonación de la
vocal (TMF “a”) sin afectación del aire espirado sin fonación /s/ (TMF “s”), por lo
que el cociente será mayor dado que el denominador ha disminuido.
El límite de la normalidad se encuentra en 1,5-1,4. Valores mayores de 1,5 se

relacionan con defectos de cierre por incompetencia glótica o por lesiones del
borde libre que impiden el cierre. Este cociente aporta una información muy
valiosa de una forma rápida y simple, precisando sólo de un cronómetro.
4.3.-Capacidad Vital (CV):

Es un parámetro respiratorio que consiste en la cantidad de aire que una
persona puede expulsar del tórax por espiración forzada tras una inspiración
forzada. Se calcula mediante un espirómetro y nos informa del estado del
órgano del fuelle fonatorio.
4.4.- Cociente de Fonación:

Es la medida básica del control respiratorio y de la eficacia del cierre glótico.
Resulta de la relación entre la capacidad Vital (CV) y el TMF:
CF: CV / TMF
Los valores normales son de 155 +/- 45 ml/seg.; valores más altos indican
escape de aire y uso ineficaz de la glotis.
5.- Análisis acústico:

El estudio de la señal acústica proporciona información sobre la calidad de la
voz mediante el estudio de los principales parámetros acústicos que
componen la voz. El desarrollo informático ha incidido y ha sido motor de
cambios en muchos campos, pero sobre todo ha posibilitado la rápida difusión
de los equipos de análisis acústico y de las estaciones de exploración vocal
conjunta, en donde se suman la imagen y el análisis acústico, siendo ésta la
forma más actual de abordar el diagnóstico y el seguimiento de los
tratamientos de la patología de la voz.
Un diagnóstico vocal preciso, en estos momentos, no se puede hacer

exclusivamente con un análisis acústico, que no puede descubrir el origen de
una alteración vocal. El análisis acústico tiene su máxima relevancia en la
cuantificación de la disfonía; es decir: en la determinación inicial del grado de
disfonía y en su evolución. A pesar de los esfuerzos que actualmente se están
haciendo para que el análisis vocal sirva para hacer el diagnóstico, aún no se
ha conseguido, pero puede que no esté lejos el día en que con un fragmento
grabado de la voz del enfermo podamos diagnosticar las patologías con un
razonable grado de fiabilidad.
El procedimiento a seguir para la realización de un análisis acústico requiere

distintas fases: en primer lugar, la señal acústica será captada por un
micrófono, después deberá ser digitalizada por un convertidor
analógico/digital para que, finalmente, sea analizada y procesada por un
programa de análisis acústico.
Las ventajas del análisis acústico son:
– Identifica los componentes vocales responsables de la disfonía,

aumentando la precisión del diagnóstico.
– Cuantifica los componentes vocales responsables de la disfonía, para así
poder establecer una estadificación de la disfonía. En este sentido, se le ha
querido dar al análisis acústico una significación semejante a la que la
audiometría tiene en la patología del oído.
– Valora la evolución de la disfonía tras los tratamientos aplicados (tanto a
corto como a largo plazo). Esta valoración permitirá realizar cambios en el
tratamiento.
– Es sencillo en la utilización de los equipos, poniendo al alcance de todos,
los recursos necesarios para hacer análisis acústicos vocales. A esto hay que
añadir la universalización del ordenador personal, que facilita enormemente el
cálculo de los parámetros que hace unos años había que “medirlos a mano”.
Los inconvenientes del análisis acústico son:
– La emisión vocal por parte del paciente puede no tener siempre las
mismas características, con lo que cabrían diferencias incluso entre dos
exploraciones consecutivas; esto crea una incertidumbre que resta credibilidad
a la prueba. Esta es la principal diferencia con la audiometría en donde el
paciente tiene que reconocer una señal, no emitirla.
– Inutilidad del análisis acústico vocal si no se hace en el contexto de un
abordaje clínico global. La propia facilidad del análisis acústico puede llegar a
crear confusión al no matizar e interpretar los hallazgos.
– Falta de unos estándares de normalidad para cada una de las pruebas,
con lo que la normalidad se obtiene muchas veces para cada uno de los
equipos. Esta falta de unidades precisas (en ocasiones dadas en porcentajes)
lo diferencia también de la audiometría en donde el decibel es una unidad
normalizada en todos los audiómetros.
Básicamente un análisis acústico de la voz debe incluir el estudio de estos
parámetros:
5.1.- Frecuencia fundamental (Fo):

La frecuencia es el correlativo físico del fenómeno perceptivo del tono o altura
del sonido. Representa el número de veces que las cuerdas vocales se abren y
se cierran por segundo, y se mide en hertz (Hz) o ciclos por segundo.
Existen cambios que se desarrollan en la Fo a lo largo de la vida del individuo.

Los niños y las niñas tienen una frecuencia parecida (240 Hz.) hasta la
pubertad en donde los varones tienen un descenso hasta unos 110 Hz. (se les
pone la voz más grave), mientras que las mujeres se mantienen en unos 210
Hz. Hacia la tercera edad la frecuencia de los hombres aumenta (140 Hz.) y la
de las mujeres disminuye (190 Hz.), volviéndose a coincidir el tono hacia el final
de la vida.
La patología no tiene demasiada importancia en las variaciones de la Fo. Tal

vez sólo en el edema de Reinke tiene significación. Ello es debido a que el
edema aumenta significativamente la masa y la frecuencia disminuye con lo
que la voz se hace más grave.
5.2.- Intensidad:
La intensidad es al volumen lo que la frecuencia al tono. La intensidad es el
producto de la amplitud de vibración de las cuerdas vocales y de la presión
subglótica y se expresa en decibelios (dB).
Los valores típicos para hablantes durante una conversación normal son los
siguientes: varía entre 75 y 80 dB, con una desviación estándar de 4.5 dB.
5.3.- Jitter:
El jitter es la perturbación involuntaria de la frecuencia, es la variación de la
frecuencia fundamental (o recíprocamente del periodo) entre cada ciclo vocal y
el siguiente. En cierta forma, lo que medimos es la estabilidad de la fonación.
Se expresa en porcentajes (%).
Dentro de la normalidad la frecuencia entre ciclo y ciclo no es exactamente

igual. Pero esa variación entre ciclos tiene un grado de tolerancia: todos
entendemos que una voz patológica tendrá una variación de la frecuencia
entre ciclos mucho más alta. No obstante, pese a la alta sensibilidad que tiene
el Jitter para hacerse patológico en las voces disfónicas, esta medida no sirve
para determinar la causa de la disfonía ya que el Jitter puede alterarse por
diferentes causas:
– Neurológicas: por falta de control del sistema nervioso sobre los
músculos vocales.
– Aerodinámicas: cuando existe un defecto de cierre glótico que pueda
provocar escape de aire que haga vibrar irregularmente a las cuerdas.
– Mecánicas: cuando hay asimetrías en la masa de las cuerdas o cuando
hay cambios en las propiedades biomecánicas de las mismas.
5.4.- Shimmer:
La perturbación de la amplitud de la señal vocal, medida en ciclos
consecutivos, recibe el nombre de Shimmer. El Shimmer tiene la misma
importancia que la perturbación de la frecuencia para determinar el grado de
disfonía de una voz, aunque al igual que ésta no se ha podido vincular
el Shimmer a una patología determinada. Por investigaciones preliminares
parece que el Shimmer es inversamente proporcional, pero no de forma lineal,
con la intensidad vocal media: a mayor intensidad menor Shimmer.
Los valores se dan en porcentajes (%).
5.5.- Ruido glótico:

El ruido glótico o espectral se calcula fundamentalmente mediante el
parámetro Relación Armónico/Ruido (A/R, en inglés H/N). Al analizar el ruido
espectral, medimos aisladamente la cantidad de ruido o la cantidad de
armónicos, sin relacionarlos. Si nosotros consideramos que incluso las voces
normales tienen un cierto componente de ruido, podemos relacionar la
energía empleada en la formación de los armónicos con la energía empleada
(o pérdida) en forma de ruido. La relación A/R es el cociente entre la amplitud
media de la onda y la amplitud media del ruido considerado aisladamente. El
valor se expresa en dBs, y la cifra normal es de 12 dBs; cuando la voz es
disfónica las cifras son menores (aumenta el denominador).
También se puede el ruido espectral como Energía del Ruido Normalizado (ERN,
en inglés NNE).
6.- Análisis espectrográfico:
Normalmente forma parte del análisis acústico pero con una intención
exclusivamente didáctica preferimos tratarlo de forma separada.
El análisis objetivo del timbre vocal se lleva a cabo mediante la Espectrografía

de la voz. Es una potente herramienta de análisis vocal y que su misión
consiste en realizar una completa disección física de una onda acústica en sus
componentes básicos. En realidad, lo que hace la espectrografía es desandar
el camino que la fuente vocal y el filtro han compuesto hasta formar la voz. La
espectrografía vuelve hacia atrás y es capaz de detectar la frecuencia
fundamental del ciclo vocal, los armónicos de la onda compleja resultante
(múltiplos de la Fo) y las zonas de filtro o refuerzo del tracto (los formantes), y
todo ello tanto en el dominio temporal como en el dominio de frecuencia. Así
mismo, la espectrografía es capaz de detectar la energía no vocal, el ruido que
aparece entre los armónicos y que lo único que consigue es desencadenar la
disfonía. El potencial del espectrograma es que refleja tres características a la
vez: las frecuencias de la voz (Fo y armónicos: lo que es el espectro), el
tiempo en que acontece el fenómeno vocal y la intensidad de cada una de las
frecuencias armónicas (amplitud del espectro); la intensidad viene reflejada
por una escala de grises. Al introducir la representación por el color, o escala
de grises plasmamos tres características (3 dimensiones) en una superficie de
papel (2 dimensiones): en el eje de abscisas (horizontal) se representa el
tiempo, en el eje de ordenadas (vertical) se representan las frecuencias, y la
intensidad de grises de las líneas horizontales (armónicos) nos da su
intensidad (amplitud del espectro).

Otra característica importante del espectrograma es que se puede obtener
tras el paso por un filtro de banda estrecha o por un filtro de banda ancha.
El espectrograma resultante del paso por un filtro de banda estrecha nos va a
mostrar muy bien las frecuencias, pero mal los pulsos glóticos y
deficientemente los formantes (mejor resolución del dominio de la frecuencia).
El espectrograma resultante del paso por un filtro de banda ancha nos mostrará
muy bien los pulsos glóticos, y los formantes (como bandas oscuras
horizontales de concentración de energía), pero mal las frecuencias (mejor
resolución del dominio temporal). Ambas representaciones son
complementarias (ver figura 6 y 7).
Figura 6 (E. banda estrecha)
Figura 7 (E. banda ancha)
Ventajas de la Espectrografía respecto al Análisis Acústico.

En los últimos años, de la mano del desarrollo de la informática, han salido al
mercado diferentes programas de análisis de la voz. Estos paquetes por lo
común integran herramientas para poder realizar el análisis acústico de la voz
y la espectrografía.
El análisis acústico, como sabemos, presenta una serie de inconvenientes:
 No es posible comparar los resultados obtenidos entre distintos

programas debido a que los algoritmos de cálculo que emplean suelen ser
diferentes.
 Los resultados que se expresan numéricamente son difíciles de
interpretar si no se comparan con una base de datos de voces normales y
patológicas que incluye el programa y que suelen pertenecer a sujetos que
hablan otro idioma.
 No existe fiabilidad en el análisis de voces extremadamente aperiódicas.
Las medidas de perturbaciones menores del 5% suelen ser fiables, sin
embargo, las superiores al 7% deben ser cuestionadas, por lo que se
precisa de un control visual de la definición periódica de la señal
(oscilograma).
Por el contrario, la espectrografía carece de estos problemas porque:
 Crea un gráfico en el que se representan los armónicos y formantes en

el espectro y en el que el ruido añadido por la patología vocal se observará
de forma nítida, sin que tengamos que ayudarnos de bases de datos para
su interpretación.
 Es absolutamente comparable entre los distintos programas
disponibles. Creemos de mucha mayor utilidad para la evaluación de los
resultados terapéuticos el empleo del espectrograma de banda estrecha
que la clasificación de la voz que hace el programa basándose en su base
de datos de voces normales y patológicas.
 Es útil para el estudio de las voces sin periodicidad o creadas por
patrones caóticos de vibración de las cuerdas vocales. Por muy patológica
que sea la voz siempre se dispondrá de un gráfico en el que veremos
representado el ruido, los armónicos, los subarmónicos y los segmentos
vacíos de señal.
 Puede ser el único método para estudiar y objetivar las voces con
importantes alteraciones de la estabilidad de la intensidad y del tono a
largo plazo, o lo que es lo mismo, el temblor vocal ya que el análisis
acústico de las perturbaciones a corto plazo (Jitter, Shimmer) no documenta
los fenómenos que caracteriza a estas alteraciones.
Anexo A
PROTOCOLO DE EXPLORACIÓN CLÍNICA DE LA VOZ
DATOS PERSONALES Nº HC:

APELLIDOS: EDAD: SEXO:
NOMBRE:
Dirección:
Teléfono: Profesión:
Fecha de examen:
1.-VALORACIÓN SUBJETIVA POR EL PROPIO PACIENTE:

Puntuación de VHI:
2.-EXPLORACIÓN PERCEPTUAL:
(0=normal;1=ligero;2=moderado;3=severo)
 G:
 R:
 A:
 B:
 S:
3.-EXPLORACIÓN AERODINÁMICA:

¨ Tiempo Máximo de fonación (TMF) ___________
¨ Índice fono-respiratorio /s/ (normal 1.4-1.5)
/a/
¨ Capacidad Vital (CV)
¨ Cociente de Fonación: CV / TMF =_____________(normal 155+/-45)
4.- EXPLORACIÓN VIDEOLARINGOESROBOSCÓPICA:

4.1.- Cierre glótico:
– Completo
– Incompleto:
– Ojal Posterior – Ojal Anteroposterior – Ojal Fusiforme
– Ojal Anterior – Ojal Irregular – Ojal Longitudinal
4.2.- Regularidad o periodicidad: SI NO
4.3.-Onda mucosa
Normal Aumentada Disminuida Ausente

C.V. Drcha
C. V. Izada
4.4.- Simetría
C. V. Derecha SI NO
C. V. Izquierda SI NO

5.-ANÁLISIS DE LOS PARÁMETROS ACÚSTICOS:

ü Frecuencia fundamental (fo) (Hz)
ü Intensidad /dB)
ü Jitter (%)
ü Shimmer (%)
ü Ruido glótico (dB)

6.-ANÁLISIS ESPECTROGRÁFICO:
Armónicos, formantes, ruido, subarmónicos

Exploración Clínica de La Voz 2018

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Exploración Clínica de La Voz 2018

Cargado por

Copyright:

Formatos disponibles

EXPLORACIÓN CLÍNICA DE LA VOZ

A lo largo de la última década, la preocupación por los problemas de la voz ha

Hasta hace relativamente poco tiempo, la valoración objetiva y exacta de la voz

La integración de los diferentes niveles de análisis y profesionales en el

1. Valoración subjetiva por el propio paciente

1.- Valoración subjetiva del propio paciente:

La calidad de vida de los pacientes es un importante factor que se debe

El índice de incapacidad vocal o Voice Handicap Index (VHI) es un cuestionario

La versión en español del VHI-30 sería la siguiente:

– Parte I-F (funcional)

F2. La gente no me entiende en sitios ruidosos.

F3. Mi familia no me oye si la llamo desde el otro lado de la casa.

F4. Uso el teléfono menos de lo que desearía.

F6. Hablo menos con mis amigos, vecinos y familiares.

F7. La gente me pide que repita lo que les digo.

F8. Mis problemas con la voz alteran mi vida personal y social.

F9. Me siento desplazado de las conversaciones por mi voz.

F10. Mi problema con la voz afecta al rendimiento laboral.

– Parte II-P (física)

P2. Mi voz suena distinto a lo largo del día.

P3. La gente me pregunta: ¿qué te pasa con la voz?

P4. Mi voz suena quebrada y seca.

P5. Siento que necesito tensar la garganta para producir la voz.

P6. La calidad de mi voz es impredecible.

P7. Trato de cambiar mi voz para que suene diferente.

P8. Me esfuerzo mucho para hablar.

P9. Mi voz empeora por la tarde.

P10. Mi voz se altera en mitad de una frase.

– Parte III-E (emocional)

E2. La gente parece irritada por mi voz.

E3. Creo que la gente no comprende mi problema con la voz.

E4. Mi voz me molesta

E5. Progreso menos debido a mi voz.

E6. Mi voz me hace sentir cierta minusvalía.

E7. Me siento contrariado cuando me piden que repita lo dicho.

E8. Me siento avergonzado cuando me piden que repita lo dicho.

E9. Mi voz me hace sentir incompetente.

E10. Estoy avergonzado de mi problema.

El VHI abreviado (VHI-10) sería este:

F1. La gente me oye con dificultad debido a mi voz.

F2. La gente no me entiende en sitios ruidosos.

F8. Mis problemas con la voz alteran mi vida personal y social.

F9. Me siento desplazado de las conversaciones por mi voz

F10. Mi problema con la voz afecta al rendimiento laboral.

P6. La calidad de mi voz es impredecible.

E4. Mi voz me molesta.

E6. Mi voz me hace sentir cierta minusvalía

P3. La gente me pregunta: ¿qué te pasa con la voz?

Es de destacar que existen trabajos en los que no se ha encontrado relación

Aunque nosotros preferimos el VHI como instrumento para la valoración

2.- Exploración perceptual de la voz:

Desde el punto de vista clínico-práctico las características perceptuales de una

– G, grade (grado)

Aunque es un método conocido desde hace muchos años, el creciente interés

Por su facilidad de uso nosotros preferimos realizar la estroboscopia con

Los parámetros estroboscópicos básicos son:

1. Ojal posterior (asociada habitualmente a un uso muscular inadecuado,

La onda mucosa se refiere a le serie

En la fonación interviene un flujo aéreo generado por los pulmones en

La valoración aerodinámica, también llamada valoración de la eficacia

< 4 años 7,5 1,8

4.2.-Índice s/z o fonorespiratorio:

Indice s/z: TMF “s” / TMF “a”