Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PUNTOS CLAVE
• La voz es multidimensional, por lo que la evaluación de la voz debe ser multidimensional.
• Los exámenes de percepción auditiva, visual y táctil son componentes clave de una evaluación de la voz.
• Es importante caracterizar la percepción del problema por parte del paciente y el impacto del trastorno de la voz en la
vida del paciente. Se pueden utilizar varias escalas publicadas para informar diversos aspectos de la discapacidad o la
calidad de vida.
• Se pueden utilizar medidas específicas para comprender mejor la producción de voz y documentar aspectos de la
calidad de la voz. Un grupo de compases proporciona una descripción más completa de la voz que cualquier compás
solo.
• Las mediciones de la función vocal son menos “objetivas” de lo que parecen, y su relación con la calidad de la voz es
complicada y no se comprende por completo.
• La terapia de voz ayuda a los pacientes a aprender técnicas eficientes y saludables para mejorar la calidad y el volumen
de la voz, minimizar las discapacidades relacionadas con la voz, mejorar la eficacia comunicativa y restaurar la identidad
y la salud vocal.
La voz se produce por interacciones entre los sistemas respiratorio, laríngeo y de resonancia. El patólogo del habla y el
lenguaje evalúa cada sistema además de la producción total del habla. Este capítulo describe los componentes típicos de
una evaluación de la voz y cómo interpretar los resultados, incluidos los resultados informados por el paciente (PRO), la
evaluación perceptiva, la evaluación instrumental del mecanismo de producción de la voz y la onda de sonido resultante,
y la terapia de diagnóstico. El capítulo concluye con una introducción a la terapia de la voz.
EVALUACIÓN PERCEPTUAL
Evaluación de percepción auditiva
El tono, el volumen y la calidad de la voz generalmente se evalúan durante la evaluación de la percepción auditiva. El
tono, la variabilidad y el rango del tono, el volumen y la variabilidad y el rango del volumen se evalúan en relación con la
edad, el sexo, el género y el entorno de prueba del hablante. La calidad de la voz es más difícil de definir y medir, aunque
es importante porque el objetivo final de la intervención suele ser mejorar la calidad de la voz. Los médicos deben
considerar la variabilidad cultural al determinar si la calidad está deteriorada. Tradicionalmente, la calidad de la voz se
clasifica como una serie de características pseudoindependientes (p. ej., respiración entrecortada, aspereza y tensión),
pero la evidencia sólida sugiere que el patrón general es más que la suma de estas características. Los calificadores a
menudo no están de acuerdo al calificar la calidad de la voz; esto se basa en varios factores, incluida la dificultad para
aislar características o dimensiones individuales, representaciones internas diferentes e inconsistentes de los
parámetros y la gravedad, resolución de escala inadecuada y la magnitud del parámetro objetivo.
Las tareas de calificación perceptiva que controlan estos factores, como determinar si dos estímulos son iguales o
diferentes, calificar el grado de disimilitud de dos producciones y ajustar una copia sintética de una voz para que
coincida con un original, conducen a una evaluación de calidad de voz más confiable. La tarea del método de ajuste
cuantifica la calidad percibida por el nivel de una característica particular (p. ej., relación ruido-señal) que el evaluador
establece para igualar perceptivamente los dos estímulos. Se puede usar una tarea de clasificación y calificación cuando
se requieren comparaciones de múltiples estímulos. Los oyentes colocan íconos que representan estímulos en una línea
para que los elementos que suenan más similares se coloquen más cerca unos de otros. Las distancias entre estímulos se
organizan como matrices de disimilitud y se analizan utilizando escalas multidimensionales.
Dos escalas de calificación que se utilizan clínicamente son la escala GRBAS (grado, aspereza, respiración, astenia y
distensión) 28 y la Evaluación perceptiva auditiva de consenso: voz (CAPE-V). La escala GRBAS es una herramienta de
calificación simple mediante la cual la gravedad general y las cinco dimensiones de la calidad de la voz se califican en
escalas de cuatro puntos. La letra G representa el grado o calidad general, R es aspereza, B es respiración, A es astenia
(debilidad) y S es tensión. Cada parámetro está clasificado; la puntuación es cero si no hay déficit, 1 si el déficit es leve, 2
si es moderado y 3 si el déficit es severo. No se ha establecido una recomendación estándar para el tipo de diferencias a
utilizar con GRBAS, por lo que se debe documentar la información específica sobre las condiciones de prueba.
El CAPE-V es una herramienta de clasificación mediante la cual seis parámetros básicos (gravedad general, aspereza,
respiración, tensión, tono y volumen) se clasifican marcando la gravedad a lo largo de una línea de 100 mm. Estos
parámetros pueden complementarse con parámetros adicionales seleccionados por el examinador. Cada parámetro
también se marca como si se produjera de forma constante o intermitente. El CAPE-V se califica en base a dos vocales
sostenidas, seis oraciones estándar y al menos 20 segundos de habla natural. Las recomendaciones sobre los entornos
de prueba y grabación se incluyen en la publicación de referencia.
Las características adicionales evaluadas en la evaluación de la percepción auditiva incluyen la respiración del habla, la
producción del habla y la resonancia. Los correlatos de percepción auditiva de la respiración del habla incluyen el grupo
de duración de la respiración, el volumen promedio, la variabilidad del volumen y la duración de la inspiración. Estos
proporcionan información importante sobre el volumen pulmonar gastado, la idoneidad y consistencia de la presión
alveolar y la forma de la caja torácica y las paredes abdominales durante el habla. Varios otros aspectos de la producción
del habla, como la articulación imprecisa, la resonancia y las alteraciones de la prosodia, pueden indicar trastornos
estructurales o neurológicos que afectan la producción de la voz. La resonancia se describe utilizando los términos
hipernasal, hiponasal y “cul-de-sac”. La prosodia se refiere a la velocidad del habla, la presencia de sílabas repetidas o
prolongadas, las ráfagas de habla, la entonación (es decir, monotono o monosonoridad) y patrones de acentuación.
Evaluación de percepción visual
La evaluación de la percepción visual se refiere a los aspectos visibles y físicos de la producción de la voz relacionados
con la etiología, el mantenimiento o el resultado de la disfonía. Características de la apariencia general, como la edad
aparente en comparación con la edad cronológica; altura y peso; expresión facial; piel, cabello y uñas; higiene personal;
y la vestimenta brindan información sobre enfermedades sistémicas subyacentes, tratamientos previos o trastornos
emocionales. La falta de atención a la higiene personal y la vestimenta, por ejemplo, puede ser indicativa de un
trastorno emocional o demencia.
Se cree que la postura y la tensión musculoesquelética contribuyen a la disfonía por tensión muscular (MTD), que altera
el tono, el volumen y la calidad de la voz. La evaluación implica la evaluación de la alineación de la cabeza, el cuello, el
torso, la pelvis y las piernas. La tensión musculoesquelética es visible como extensión anormal del movimiento de la
mandíbula, mentón saliente, extensión del cuello, abultamiento de los músculos del cuello al hablar u hombros
levantados.
La disfunción neurológica está indicada por observaciones tales como inestabilidad, asimetría, rigidez, vacilación,
lentitud, debilidad, falta de coordinación, inconsistencia y movimientos extraños. Son especialmente notables la
debilidad, la asimetría y la falta de coordinación de la lengua, la mandíbula, los labios o el paladar blando. La presencia
de distonías focales, como calambres del escritor, blefaroespasmo, tortícolis y disfonía oromandibular, generalmente
lleva al examinador a considerar un trastorno de la voz con base neurológica, como la disfonía espasmódica.
La dismorfología física, en particular las características sindrómicas o la evidencia de diferencia o resección orofacial,
deben tenerse en cuenta por su posible relación con un déficit de resonancia o inteligibilidad del habla. Muchas
enfermedades sistémicas que pueden afectar la laringe y la voz tienen síntomas físicos visibles, entre las que se
encuentran la artritis reumatoide, el lupus y el síndrome de Sjögren. Para una discusión detallada del examen de
percepción visual, se anima al lector a consultar los trabajos de Koschkee y Rammage.
Medidas Respiratorias
La mayoría de las personas con problemas relacionados con la voz no requieren pruebas completas de función
pulmonar. Varias medidas de la capacidad respiratoria o el uso durante el habla son útiles para describir los trastornos
de la voz y planificar el tratamiento. Estos incluyen las presiones inspiratoria y espiratoria máximas, la capacidad vital y
el porcentaje de capacidad vital en el que los pacientes inician y terminan el habla.
Medidas de fuente
La “fuente” de la voz es la salida de la vibración de las cuerdas vocales (área gloal) y su interacción con las presiones del
tracto vocal subgloal y supragloal (flujo gloal). Se utilizan dos técnicas para estimar la fuente: electrogloografía (EGG) y
filtrado inverso.
Electroglotografía
EGG mide la conductancia de una señal eléctrica de baja frecuencia a través del cuello entre dos electrodos de
superficie. La conductancia de la señal varía con la vibración de las cuerdas vocales: cuando las cuerdas vocales se ponen
en contacto entre sí, la conductancia aumenta y la pendiente de la traza EGG resultante es positiva; a medida que las
cuerdas vocales se separan, la conductancia disminuye y la pendiente es negativa. Los resultados son relativos en lugar
de absolutos y no miden el área global ni el cierre. La forma de la onda es potencialmente significativa para describir el
patrón de vibración de las cuerdas vocales, y se han propuesto muchos cocientes para cuantificar la forma de onda (por
ejemplo, abierta, sesgada y contacto). Las técnicas para cuantificar la forma de onda aún no se han estandarizado, en
gran parte debido a los desafíos técnicos y la dificultad para relacionar la forma de onda EGG con el movimiento de las
cuerdas vocales.
Medidas aerodinámicas
La evaluación aerodinámica implica medir las presiones y los flujos de aire. Aunque es difícil separar las contribuciones
respiratorias de las laríngeas a las medidas de presión y flujo de aire durante la producción de la voz, las medidas
aerodinámicas brindan información valiosa para comprender la producción de la voz. Las mediciones se enumeran en la
Tabla 55.1 junto con sus correlatos perceptivos hipotéticos y valores normativos.
TABLA 55.1- Correlatos perceptuales de las medidas aerodinámicas
Medida Correlación perceptiva Media Normativa (Desviación Media normativa (desviación
Estándar) para Mujeres estándar) para hombres
a
Presión aire subgloal Esfuerzo fonatorio y fuerza 7,52 (2,17) cm H2O 6,43 (1,07) cm H2Oa
o intraoral de las consonantes de
presión
Presión umbral de Esfuerzo para iniciar la ≈3 cm H2O modal, ≈8 cm H2O tono altob
fonación fonación
Flujo de aire Respiración entrecortada 91–156 (16–71) ml/sc 101–183 (16–77) ml/sc
Resistencia de la VA Esfuerzo fonatorio, fuerza 27–51 cm H2O/L/s 24–45 cm H2O/L/sc
laríngea vocal y tensión
a Datos de Subtelny JD, Worth JH, Sakuda M: Presión intraoral y tasa de flujo durante el habla. J Speech Hear Res 9:498, 1966.
b Datos de Verdolini-Marston K, Titze IR, Druker DG. Cambios en la presión umbral de fonación con condiciones de hidratación
inducida. J Voz 8:30, 1994.
c Datos de Baken RJ, Orlikoff RF. Medición clínica de la voz y el habla, 2ª ed. San Diego, 2000, Grupo Editorial Singular.
Flujo de aire
El flujo de aire se mide como volumen (mL o L) por unidad de tiempo (segundo o minuto). El flujo de aire medio se
evalúa comúnmente durante la fonación sostenida y los valores están influenciados por el sexo, la edad, la frecuencia
fundamental y la intensidad. El flujo de aire medio suele estar elevado cuando el cierre gloal es deficiente, como en el
deterioro del movimiento de las cuerdas vocales, y puede estar elevado o reducido con hiperfunción.
Resistencia de las vías respiratorias laríngeas
La resistencia de las vías respiratorias laríngeas es la relación entre la presión de aire translaríngea y el flujo de aire
translaríngeo. Una mayor resistencia de las vías respiratorias laríngeas puede indicar una mayor intensidad vocal, una
fase cerrada prolongada del ciclo gloal o una mayor fuerza de cierre gloal.
Frecuencia
La frecuencia fundamental (F0) es el número de ciclos repetitivos por segundo presentes en la forma de onda acústica. El
tono es el principal correlato de percepción de la frecuencia, aunque muchos factores adicionales contribuyen a la
percepción del tono. El tono alterado y el rango de tono restringido son síntomas comunes de los trastornos de la voz y
pueden representar una preocupación importante para los pacientes. La frecuencia fundamental de habla promedio y el
rango de frecuencia máximo se pueden medir utilizando una variedad de paquetes de software gratuitos y disponibles
comercialmente, y la salida varía entre los paquetes según el algoritmo utilizado para el cálculo. La señal acústica debe
ser casi periódica para que el software identifique la frecuencia fundamental, una característica que limita la evaluación
precisa de muchas voces deterioradas. Los valores normativos están influenciados por la intensidad, la muestra del
habla, el tipo de vocal, la edad y el género, y una frecuencia fundamental de habla promedio varía de 100 a 125 Hz para
hombres adultos de 70 años y de 190 a 225 Hz para mujeres adultas. El rango de frecuencia máximo a menudo se
informa utilizando la escala de semitonos basada en octavas, con 12 semitonos en una octava. El rango máximo para
hombres y mujeres suele ser de dos y media a tres octavas, o aproximadamente de 29 a 36 semitonos.
Intensidad
El nivel de presión del sonido medido en decibeles (dB SPL), o intensidad, es el principal correlato acústico de la
sonoridad, aunque muchos factores influyen en la percepción de la sonoridad. El nivel de presión del sonido está
influenciado por la frecuencia, la vocal, la muestra del habla, el equipo, la distancia desde la fuente de sonido y el ruido
ambiental. Las medidas más habituales son los niveles medio de habla y de presión sonora mínimo y máximo. En
promedio, hombres y mujeres hablan a aproximadamente 70 dB SPL (a una distancia de 6 pulgadas), aunque la
variabilidad en el habla conversacional es significativa. La intensidad mínima suele ser inferior a 60 dB y la intensidad
máxima es superior a 110 dB. Las medidas de intensidad se utilizan para documentar los síntomas del paciente de
volumen inadecuado, como podría ocurrir con la enfermedad de Parkinson o el deterioro del movimiento de las cuerdas
vocales, o dificultad para hablar en voz baja, que puede ocurrir con cicatrices o lesiones.
Un espectro muestra la frecuencia por amplitud y permite un examen preciso de la energía presente en todas las
frecuencias que componen una forma de onda (Fig. 55.3). Los espectros promedio a largo plazo muestran la cantidad de
energía en cada frecuencia sumada durante un largo período de tiempo, como una lectura estándar. Debido a que la
medida se promedia sobre una muestra tan larga, los efectos del contexto del habla se minimizan. Las medidas de
espectros típicamente comparan la magnitud de la energía en diferentes bandas de frecuencia. Los valores resultantes, a
menudo denominados inclinación espectral, indican si las frecuencias bajas o altas dominan el espectro. Una mayor
inclinación espectral (es decir, menos información de alta frecuencia) se asocia con una voz entrecortada.
HIGO. 55.3 Espectrogramas de banda estrecha para una mujer que dice “zah zay zee zoh zoo” usando su calidad de voz normal (A) y
una calidad de voz entrecortada (B). Las estrías horizontales son energía armónica y la energía de apariencia borrosa de baja
amplitud (azul o verde) es ruido. Tenga en cuenta que hay armónicos de mayor frecuencia en la producción normal que en la
producción entrecortada. Los armónicos en su producción normal son de mayor amplitud (naranja y rojo) que los de la producción
entrecortada (verde y amarillo).
Un cepstrum es un espectro de un espectro. La prominencia del pico cepstral (CPP) es una medida de la periodicidad de
la señal que no se basa en la extracción de la frecuencia fundamental, sino que corresponde a la regularidad de los picos
armónicos. Se ha encontrado que la medida se corresponde con las calificaciones de respiración entrecortada y disfonía
general. Un CPP más alto refleja armónicos regulares y calidad de voz de cerveza, mientras que un CPP más bajo es
consistente con una peor calidad de voz.
TERAPIA DIAGNÓSTICA
La terapia de diagnóstico, o terapia de sonda, se utiliza para determinar si se puede modificar la calidad de la voz. La
respuesta a las pruebas terapéuticas puede guiar las decisiones de intervención e incluso puede ayudar a determinar el
diagnóstico. Las pruebas de terapia a menudo incluyen la modificación de la tensión o la postura del músculo laríngeo
extrínseco. También incluyen técnicas para modificar los subsistemas de respiración, fonación y resonancia.
INTRODUCCIÓN A LA TERAPIA PARA LOS TRASTORNOS DE LA VOZ Y DE LAS VÍAS AÉREAS LARÍNGEAS
Terapia para Trastornos de la Voz
Los patólogos del habla y el lenguaje trabajan con los pacientes para usar el mecanismo de producción de voz más
eficiente y saludable posible para mejorar la calidad y el volumen de la voz, minimizar las discapacidades relacionadas
con la voz, mejorar la eficacia comunicativa y restaurar la identidad y la salud vocal. La terapia de la voz generalmente
implica una terapia indirecta y directa para mejorar la técnica de producción de la voz del paciente. El número de
sesiones de terapia de la voz y el pronóstico de mejora varían y dependen de cada paciente y de sus objetivos. La terapia
es generalmente a corto plazo (de una a ocho sesiones) y es más exitosa para aquellos que demuestran la capacidad de
mejorar la voz al principio del proceso. Es importante señalar que la terapia de la voz requiere cambios de
comportamiento, y los pacientes solo mejoran con la terapia cuando participan activamente incorporando las nuevas
habilidades en su vida diaria. Primero se presenta una descripción general de la terapia de la voz para la disfonía,
seguida de la terapia para los trastornos de las vías respiratorias laríngeas.
El componente indirecto de la terapia de la voz, el asesoramiento para optimizar el entorno laríngeo y el uso de la voz,
suele ser breve. Implica una "higiene vocal" adecuada y relevante, en la que el patólogo del habla y el lenguaje refuerza
las recomendaciones del médico con respecto al entorno laríngeo interno (por ejemplo, hidratación, precauciones
contra el reflujo y cumplimiento del régimen de medicación prescrito) y una "reducción de fonotrauma" adecuada y
relevante qué pacientes son guiados para modificar la cantidad y el tipo de uso de la voz. Para algunos pacientes, las
recomendaciones de tratamiento primario son médicas, quirúrgicas o implican estrategias compensatorias (p. ej.,
amplificación). En este caso, una o dos sesiones de terapia de voz indirecta pueden ser los únicos servicios que requieren
de un patólogo del habla y el lenguaje. Por lo general, sin embargo, la mayor parte de la terapia de la voz se dedica al
trabajo directo en la técnica de producción de la voz (que se describe más adelante), porque la terapia de la voz directa
conduce a una mejoría mayor en la calidad de la voz y los síntomas que la higiene vocal por sí sola.
Comentarios generales
La técnica de terapia de voz que se utiliza varía según las fortalezas y necesidades del paciente y las fortalezas y la
capacitación del médico. Ninguna técnica o "receta" estándar de oro para la terapia de la voz funciona para todos los
pacientes y médicos, incluso dentro de un diagnóstico, y los pacientes responden a diferentes tipos y niveles de
retroalimentación e instrucción. La elección de la técnica de terapia a menudo es independiente del diagnóstico médico
subyacente, porque los pacientes con el mismo diagnóstico médico producen comportamientos vocales muy diferentes.
La mayoría de las veces, el objetivo de la intervención es generar un cambio en los sistemas de resonancia, laríngeo y
respiratorio, y el patólogo del habla y el lenguaje usa una combinación de muchas técnicas para producir este cambio. La
siguiente sección es una descripción general de varias técnicas organizadas por sistema, seguida de consideraciones
adicionales para poblaciones específicas.
HIGO. 55.4 Las maniobras manuales para mejorar los patrones de voz desordenados incluyen
empujar hacia atrás el hioides con un dedo (A) y bajar el cartílago tiroides (B).
Respiración
Para la mayoría de los pacientes, trabajar con la respiración implica simplemente discutir y practicar el momento
apropiado para la inhalación (es decir, grupos de respiración) y usar el rango objetivo de capacidad vital (es decir, iniciar
al 60 % y terminar al 40 % de la capacidad vital). Las cuerdas vocales rígidas, el cierre globular deficiente o la necesidad
del paciente de usar una voz fuerte pueden requerir instrucciones adicionales. Los pacientes que necesitan hablar en voz
alta, por ejemplo, pueden necesitar instrucciones para inhalar a un volumen pulmonar mayor (es decir, hasta el 80 % de
la capacidad vital), usar un esfuerzo muscular adicional para resistir el retroceso durante el comienzo de la espiración y
facilitar la exhalación continua cerca del nivel espiratorio en reposo. El Método Accent es una técnica de terapia en la
que el paciente se enfoca en coordinar el movimiento abdominal con la producción de sonido. La técnica no altera
simplemente la respiración, sino que altera holísticamente todos los niveles de producción de la voz.
Postura y Alineación
Cuando las características musculoesqueléticas contribuyen a MTD, es posible que deban abordarse directamente en la
terapia de voz. Cuando sea apropiado, se les enseña a los pacientes a eliminar la protuberancia de la mandíbula y
mejorar la alineación del cuello, la posición de los hombros y el movimiento de la mandíbula durante el habla.
Consideraciones adicionales
Aunque las técnicas descritas anteriormente a menudo forman la base de la terapia de la voz, se necesitan
consideraciones adicionales y técnicas especializadas para algunas poblaciones de pacientes.
Disfonía relacionada con la edad: se ha demostrado que varias de las técnicas descritas anteriormente mejoran la voz en
adultos mayores. También se ha descrito una terapia diseñada específicamente para tratar los déficits respiratorios y
laríngeos de la presbifonía a través del ejercicio vocal y se denomina ejercicio de entrenamiento de resistencia a la
fonación (PhoRTE).
Cantantes, actores y locutores profesionales: los locutores y cantantes profesionales requieren una cuidadosa
coordinación con los gerentes, directores, profesores de canto, entrenadores de voz u otros. La terapia de la voz para
prevenir y remediar los trastornos de la voz hablada está dentro del alcance de la práctica de los patólogos del habla y el
lenguaje, mientras que optimizar el uso de la voz para actuar, hablar en público y cantar es típicamente el dominio de los
entrenadores, maestros y entrenadores de la voz. Algunos patólogos del habla y el lenguaje también están capacitados
en otro campo del cuidado de la voz y pueden desempeñar funciones duales para rehabilitar las voces lesionadas y
mejorar las sanas.
Comunicación transgénero: para facilitar la percepción de un rol de género diferente, la terapia de comunicación
generalmente incluye más que la modificación del tono vocal. Es posible que sea necesario abordar la sonoridad, la
calidad de la voz y las resonancias del tracto vocal además de la precisión del habla, la entonación y la prosodia, la
velocidad y el lenguaje. La terapia también puede incluir la toma de conciencia y la modificación de la postura corporal,
los gestos y el uso social del lenguaje.
Tos crónica
El tratamiento por parte del logopeda puede estar indicado para la tos crónica refractaria al tratamiento médico
adecuado. Los temas del tratamiento son similares a la terapia de la voz, con un componente de asesoramiento que
incluye educación sobre las causas de la tos y aprender a aumentar la humedad en los ambientes internos y externos de
los pacientes (p. ej., sorber agua, inhalar vapor, alterar la humedad ambiental y disminuir la cafeína, alcohol y humo) y
reducir la exposición a irritantes (p. ej., alergias, reflujo y vapores). También hay un componente conductual y se
enseñan estrategias para retrasar, inhibir o reemplazar la tos con otro comportamiento. Los pacientes deben aprender a
romper el ciclo de irritación/tos para toser con menos fuerza, con menos frecuencia y durante menos tiempo.
CONCLUSIONES
La evaluación y la terapia de la voz son dinámicas y evolucionan a medida que evoluciona nuestra comprensión de la
producción, la medición y la calidad de la voz. Un mejor conocimiento de los vínculos entre la producción y la percepción
impulsará futuras técnicas de evaluación y gestión.