Curso de Voz

Curso de voz
1. HISTORIA CLÍNICA
Introducción
Aunque existen muchas causas que pueden originar una disfonía, vamos a estudiar la forma de
presentación de la patología vocal más frecuente: la disfonía por abuso o mal uso vocal.
La teoría del círculo vicioso del sobreesfuerzo vocal formulada por Le Huche permite
comprender las peculiaridades de esta alteración.
Por un lado explica la génesis de lesiones orgánicas secundarias a trastornos disfuncionales, y

por otro lado ayuda a plantear el tratamiento integral de estas alteraciones vocales.
El concepto de disfonía disfuncional es útil para comprender que no existe una frontera nítida
entre las disfonías funcionales y las orgánicas, sino que las primeras pueden complicarse con
lesiones orgánicas laríngeas producidas por el sobreesfuerzo vocal, entre las cuales el ejemplo
más representativo lo constituyen los nódulos laríngeos.
Las implicaciones terapéuticas son importantes. Las lesiones orgánicas secundarias a una
disfonía disfuncional que precisen cirugía han de ser tratadas de forma complementaria con
rehabilitación logopédica con el fin de eliminar las causas primarias (funcionales) que las
originaron.
Historia Clínica y Anamnesis
El primer contacto con el paciente es una importante oportunidad para conocer los mecanismos
que pueden explicar su alteración vocal.
La anamnesis y la recogida sistemática de información en la historia clínica es el mejor método

para descubrir los factores desencadenantes y favorecedores de la disfonía disfuncional.
El correcto planteamiento terapéutico individual se basará en la comprensión del círculo vicioso

del sobreesfuerzo vocal de cada caso.
La exploración del paciente comienza con la anamnesis, relación que hace el paciente de los
trastornos vocales que presenta. En este momento, además de conocerse detalles del proceso
patológico vocal, se va a escuchar la voz del paciente lo que permite al examinador hacer un
análisis perceptual de la voz.
En un principio se puede dejar al paciente relatar de forma espontánea el problema vocal para
después formularle preguntas dirigidas:
Anamnesis: relación que hace el paciente de los trastornos vocales que presenta.
Preguntas dirigidas:
• Factores que precipitaron la disfonía

• Historia de la disfonía
• Factores que la mejoran o la empeoran
Curso de voz
Disfonía Disfuncional
Se entiende por disfonía la alteración de una o varias de las características acústicas de la voz
que son intensidad, tono y timbre.
Las alteraciones del timbre vocal son las más frecuentes, de hecho son las que más afectan a la
estética de la voz.
Alteración de la voz mantenida por un trastorno del funcionamiento vocal y condicionada por un
mal uso o un abuso vocal.
Comienza de forma intermitente, apareciendo únicamente tras un episodio de abuso vocal, para
después hacerse cada vez más frecuente, hasta hacerse continua y terminando por desarrollar
en muchos casos lesiones orgánicas secundarias. Es por ello que el término "disfuncional"
presenta ventajas porque nos ayuda a describir ya a comprender la patogenia de una alteración
vocal en la que un trastorno de la función desemboca en la aparición de una lesión orgánica.
De esta forma, desde la concepción de un proceso puramente funcional (sin lesión orgánica) se
llega al concepto de un problema disfuncional, en el que un factor funcional y la lesión orgánica
se imbrican.
Se comprende mucho mejor la patogenia del trastorno vocal si se investigan no causas, sino
factores, y con mayor precisión factores favorecedores y factores desencadenantes que se
combinan para dar origen a un sobreesfuerzo vocal, que en forma de círculo vicioso explica que
un trastorno puramente funcional al comienzo puede originar alteraciones de la mucosa
laríngea como nódulos, pólipos, quistes o edema de Reinke.
ETIOLOGIA (Le Huche)
El mecanismo de aparición y el mantenimiento de la disfonía disfuncional se comprende si se

consideran los tres conceptos clave del círculo vicioso del sobreesfuerzo vocal, los factores
desencadenantes y los factores favorecedores.
La comprensión del mecanismo patogénico servirá de base para un tratamiento adecuado.
Así, existen tres conceptos clave a identificar:
• El círculo vicioso del sobreesfuerzo vocal

• Los factores desencadenantes
• Los factores favorecedores
Curso de voz
Círculo Vicioso del Sobreesfuerzo Vocal
Cuando la voz se altera por una causa cualquiera, como en una laringitis aguda (factor
desencadenante), lo primero que el sujeto hace de forma inconsciente es esforzarse para que la
voz cumpla con sus cometidos. Este sobreesfuerzo se traduce al comienzo en un momentáneo
aumento de la eficacia, pero a costa de un esfuerzo desmedido que conduce a una progresiva
disminución del rendimiento vocal (es decir, la relación que existe entre la eficacia y el consumo
de energía).
En condiciones normales esta situación provoca de inmediato una reducción voluntaria de la

producción vocal, por lo que el sobreesfuerzo vocal se sustituye por un comportamiento de
moderación en el que la persona por unos días o por unas horas limita la producción vocal o
como mínimo su intensidad, hasta que se recupere la laringe y vuelvan a existir unas
condiciones favorables para la fonación.
Sin embargo, si existen condiciones patológicas (factores favorecedores), la persona no puede

adoptar el comportamiento de moderación y se ve obligada a continuar incrementando su
esfuerzo de forma proporcional a la disminución de su rendimiento vocal. Cuanto más
dificultosa es la producción de la voz, más se esforzará y cuanto más se esfuerce, menos fácil
será emitirla.
Es el clásico círculo vicioso del sobreesfuerzo vocal. El aumento del esfuerzo finaliza por
constituir un hábito y altera de forma duradera el mecanismo de la producción de la voz.
Tiempo después se podrán observar lesiones de la mucosa laríngea como consecuencia del
sobreesfuerzo vocal (laringopatías disfuncionales) que agravan este círculo vicioso. Las lesiones
más representativas de este fenómeno son los nódulos vocales.
Curso de voz
Factores Desencadenantes (por orden de frecuencia)
Son procesos puntuales que permiten la constitución del círculo vicioso del sobreesfuerzo vocal.
Estos factores pueden ser tanto orgánicos como psicológicos. Por orden de frecuencia de
presentación son los siguientes:
1. Algunos procesos patológicos de la esfera ORL: El más representativo es la laringitis

aguda, pero también puede ser un traumatismo laríngeo (excesos vocales o
intubación), una exposición prolongada al aire acondicionado, proceso alérgico o
infecciones faríngeas.
2. Factores psicológicos: Son tan frecuentes como los anteriores y de hecho se pueden
asociar a ellos. Las tensiones que se originan por contrariedades laborales o familiares
pueden muy bien alterar al mecanismo de la fonación.
3. Debilitamiento general. La sobrecarga psicofísica asociada a situaciones problemáticas o
enfermedades.
4. Tos. Frecuente síntoma asociado al reflujo faringolaríngeo, traqueítis o procesos
alérgicos. (ver anexo 1: Reflujo Modificado)
5. Período premenstrual. La fase premenstrual produce una modificación del epitelio de
las cuerdas vocales en forma de engrosamiento que altera la flexibilidad de la voz. En
algunos casos puede conducir hacia el círculo vicioso del sobreesfuerzo vocal.
6. Embarazo e intervención abdominal. Por impedir el uso de los músculos abdominales en
la producción del soplo fonatorio.
7. Disfonía ex-acinesia terapéutica (Tarneaud). Es un mecanismo peculiar relacionado con
la exagerada e inoportuna recomendación médica de guardar reposo vocal. En
personas predispuestas, el reposo vocal excesivamente riguroso puede originar un
estado psicológico de temor hacia la emisión vocal que provoca una desorganización
del comportamiento fonatorio. (Ver anexo 2: Reposo Vocal 1 y anexo 3: Reposo
Vocal 2)
Curso de voz
Factores Favorecedores (por orden de frecuencia)
Obligación socioprofesional de hablar o cantar
Características psicológicas: Emotividad y carácter primario.
Situaciones psicológicas difíciles.
Intoxicación alcohólica y tabáquica.

Curso de voz
Procesos crónicos ORL
Deficiente control audiofonatorio.
Los factores desencadenantes no bastan por si solos para inducir el círculo vicioso del
sobreesfuerzo vocal. Es necesario además el concurso de otro factor que impida la adopción del
comportamiento de moderación por parte del paciente (impiden que se cure espontáneamente
la momentánea alteración provocada por los factores desencadenantes). Expuestos también en
orden de frecuencia tenemos:
1. La obligación socioprofesional para hablar o cantar: Es el factor más importante que

impide a una persona con una simple laringitis aguda guardar unos días de reposo
vocal. Determina la entrada del paciente en el círculo vicioso del sobreesfuerzo vocal
sobre todo en caso de profesores, cantantes, representantes de comercio,
conferenciantes, etc.
2. Características psicológicas: Algunos tipos psicológicos predisponen a la entrada en este
círculo vicioso. La emotividad y el carácter primario están frecuentemente implicados.
La tendencia a la ansiedad y el perfeccionismo suelen ser características psicológicas
comunes.
3. Situaciones psicológicas difíciles: En el caso de situaciones conflictivas duraderas en el
tiempo que originan prolongadas dificultades psicológicas con estados de tensión.
4. Intoxicación alcohólica y tabáquica.
5. Procesos crónicos ORL: Amigdalitis crónica, sinusitis, procesos alérgicos, reflujo
faringolaríngeo, etc.
6. Deficiente control audiofonatorio: Una hipoacusia más o menos importante se asocia
con la imposibilidad de control de la intensidad vocal por parte del sujeto (efecto
Lombard). El paciente con una hipoacusia no protesizada tiende a emitir una voz
exageradamente intensa, lo que actúa como factor favorecedor del círculo vicioso del
sobreesfuerzo vocal.
7. Técnica vocal defectuosa: Es frecuente encontrar docentes con grandes cargas lectivas
a los que no han sido instruidos en los aspectos más básicos de la higiene vocal. De
hecho es el colectivo donde se concentran más los problemas vocales de origen laboral.
Otros profesionales especialmente expuestos son los actores y cantantes sin un
entrenamiento vocal adecuado.
Curso de voz
8. Exposición al ruido. Los ambientes con gran nivel de ruido (también por el efecto
Lombard) elevan la intensidad vocal de forma inconsciente y refleja. Las personas que
trabajan de forma continuada en estos ambientes desarrollan importantes esfuerzos
vocales.
9. Exposición al polvo, vapores irritantes y aire acondicionado: Por la irritación laríngea
resultante y la deshidratación de la superficie de las cuerdas vocales.
Falta de rendimiento vocal
La fonación durante un proceso catarral hace que el sujeto emplee más energía para obtener el
mismo resultado vocal.
Esta circunstancia hace disminuir la eficiencia vocal.
Vemos en la siguiente fórmula la relación que existe entre la energía aerodinámica requerida y
la intensidad vocal conseguida: a menor energía usada para una misma intensidad habrá mayor
eficiencia.
Jiang J. Vocal Fold Physiology. Otolaryngol Clin North Am 2000; 33: 699-718
Ver anexo 4: Presión Umbral
Ver anexo 5: Perdida eficiencia

Curso de voz
Tipos de DISFONIA
De acuerdo con esta teoría de Tarneaud y Le Huche, la existencia de un comportamiento de

sobreesfuerzo vocal puede causar una alteración laríngea.
De esta forma, se puede hablar de laringopatías de origen funcional o laringopatías

disfuncionales que se definen como alteraciones de la estructura de la cuerda vocal producidas
o mantenidas por un comportamiento vocal defectuoso.
Por tanto se denomina disfonía disfuncional simple, en la que el círculo vicioso del
sobreesfuerzo vocal determina las alteraciones vocales y los síntomas asociados sin que existan
lesiones visibles en la exploración endoscópica de la laringe.
La disfonía disfuncional complicada es en la que se pueden observar lesiones en la exploración

(laringopatías disfuncionales) que están originadas por el propio proceso de sobreesfuerzo vocal
e introducen elementos de perturbación suplementarios.
Conociendo la patogenia que explica la aparición de estas lesiones orgánicas se comprende la

necesidad de incluir o asociar un tratamiento de rehabilitación vocal que elimine los factores
que han determinado esta situación en el paciente concreto.
Laringopatías disfuncionales
Las figuras que se recogen en este apartado hay que mencionar que corresponden al "The
Kleinsasser´s Archive of Microlaryngoscopy" Editor: NORBERT KLEINSASSER,
Curso de voz
Otorhinolaryngology, Ludwig-Maximilians-University, Marchioninistraße 15, D - 81377 Munich,

Germany Fax.: +49-89-5160-3919, e-mail: Norbert.Kleinsasser@hno.med.uni-muenchen.de
Nódulos vocales (Ver anexo 6):
https://youtu.be/bCj2zDpjYrQ
Pólipo vocal (Ver anexo 7):
https://youtu.be/47v2TDhvGv0
Edema de Reinke (Ver anexo 8):
https://youtu.be/tvmvLYtuNZE
Quiste vocal (Ver anexo 9):
https://youtu.be/idUlwbsDCnY
Hemorragia de la cuerda vocal:
Alteraciones Biomecánicas
• Aumento de la Masa
• Cierre glótico incompleto
• Vibración alterada o caótica
Ver anexo 10: Alteraciones Biomecánicas.

Curso de voz
Alteraciones Biomecánicas - Diapositiva 16. Subarmónicos en la segunda parte de la fonación.

Edema de Reinke.
Alteraciones Biomecánicas - Diapositiva 17. Espectrograma tipo I de Yanagihara.
Alteraciones Biomecánicas - Diapositiva 18. Espectrograma tipo IV.
Para saber más
• Voice Disorders and Phonosurgery I y II. The Otolaryngologic Clinics of North America
2000; Vol 33. Excelente revisión global del tema, que a pesar de los años transcurridos
sigue plenamente vigente.
• La Voz (4 Tomos): Le Huche F y Allali A. editorial Masson. Una obra ya clásica,
recomendable para iniciarse en el estudio de los trastornos de la voz por su asequible y
a la vez profundo contenido.
Clasificación de las Disfonías
Titze, I. R.: Towards standards in acoustic analysis of voice J. Voice, 1994; 8: 1-7.
• Disfonías sin alteraciones orgánicas.

• Alteraciones orgánicas de la voz.
• Disfonía por alteraciones del movimiento de la laringe.
• Alteraciones sistémicas que afectan a la voz.
Disfonías sin alteraciones orgánicas
• Disfonía músculo-tensional
• Trastorno de voz psicógeno
• Trastorno de voz conversivo
Alteraciones orgánicas de la voz
• Lesiones del epitelio:

• Leucoplasia
• Papiloma
• Carcinoma
Lesiones subepiteliales (Ver anexo 11: artículo de Friedrich):
• Lesiones exudativas del espacio de Reinke
• Nódulos
• Pólipos
• Edema de Reinke
• Alteraciones microvasculares
• Cicatrices y granulomas
Lesiones congénitas (Ver anexo 12: Difícil diagnóstico):
• Sulcus y puentes mucosos
• Quistes
• Sinequias
Curso de voz
Disfonía por alteraciones del movimiento de la laringe
• Parálisis laríngeas.
• Disfonía espasmódica.
• Temblor.
• Movimiento paradójico laríngeo.
Alteraciones sistémicas que afectan a la voz
• Manifestaciones extraesofágicas del reflujo (Ver anexo 13: reflujo modificado)

• Infecciones laríngeas
• Enfermedades neurológicas (Ver anexo 14: Neurolaringología)
• Parkinson
• ELA
• Esclerosis múltiple
Síntomas de las disfonías
La disfonía puede ser un síntoma más de una enfermedad, sin embargo, existen distintas
formas de presentarse que obedecen a los distintos mecanismos patogénicos que la producen.
La asociación con otros signos o síntomas nos pueden orientar en el proceso diagnóstico.
A continuación se exponen distintos síntomas asociados a las disfonías.
• Escape de aire o voz aérea

• Fatiga vocal
• Atragantamiento o aspiración al deglutir
• Odinofonía
• Laringoespasmo
Escape de aire
https://youtu.be/i6VV6CeiLf4
https://youtu.be/47v2TDhvGv0
Común en las enfermedades que impidan el correcto cierre de las cuerdas en la fonación como
en las lesiones tipo masa (mecánica) o en las parálisis laríngeas (neurológica).
Fatiga vocal
• Parálisis Vocal
• Atrofia Vocal
• Disfonía de origen neurológico (Ver anexo 15: Neurolaringología)
Curso de voz
Aspiración
• Parálisis Vocal
• Accidente cerebrovascular
Odinofonía
• Disfonía por tensión muscular

• Granuloma vocal
https://youtu.be/E8R4vB7Ka1I
Ver anexo 16: Reflujo modificado y con Anexo 17: Disfonía por tensión muscular
Informaciones de interés para evaluar un trastorno vocal
Para la correcta evaluación del trastorno vocal es importante indagar sobre una serie de
factores que tienen relación con el mismo.
• Profesión
• Hábitos tóxicos
• Tensión psíquica (estrés)
• Antecedentes Médicos
• Toma de Medicamentos
Profesión
• Puede ser la causa principal de su disfonía

• Trabajos:
• En sitios ruidosos
• Teleoperadora
• Exposición a irritantes ambientales
Es importante establecer si el paciente usa su voz de forma profesional.
Hábitos Tóxicos
• Es incompatible el hábito de fumar con la salud vocal.

• Es prioritaria la lucha contra el tabaco en la consulta de voz.
Curso de voz
Antecedentes Médicos
• No podemos ver aisladamente el trastorno vocal.

• Ha de ser valorado en el contexto en el que se presenta.
• Los pacientes pueden tener enfermedades generales que afectan a la voz o aumentan
la severidad de una disfonía.
• Enfermedades Respiratorias
• Enfermedades Gastrointestinales: RFL (Ver anexo 18: Reflujo modificado y anexo
19: Neurolaringología)
• Enfermedades Autoinmunes:
• Artritis reumatoide
• Lupus
• Enfermedad de Sjögren
Enfermedades Neurológicas
Enfermedades Neurológicas
Ver anexo 20: Esteroides inhalados y voz
Efecto sobre las cuerdas
Causa
vocales
Hipoadducción Parkinson, Distrofia muscular, Miastenia, TCE, DEAbd
Hiperadducción DEAdd, Parálisis pseudobulbar, Enfermedad de Huntington
Ambos componentes Esclerosis múltiple, Ataxia cerebelosa, ELA
Parkinson, Temblor benigno, DEA, mioclonia
Temblor vocal
palatofaringolaríngea
• Alergia
• Endocrinopatías
• Radioterapia previa
• Tratamiento vocal previo
• Trastornos Psiquiátricos
• Asociados a la disfonía o como causa
• Efectos secundarios de sus tratamientos
Curso de voz
Antecedentes Quirúrgicos
• Intubación endotraqueal
• Parálisis vocal yatrógena:
• Endarterectomía carotídea
• Vértebras cervicales
• Tiroidectomía
• Mediastinoscopia
• Base de Cráneo
• Cirugía Torácica
Toma de Medicamentos
• Antihistamínicos: Sequedad del tracto vocal

• Descongestivos: Secreciones viscosas
• Sedantes vestibulares: Sequedad
• Diuréticos: Sequedad
• Antitusivos: Sequedad
• Antidepresivos: Sequedad
• Antiparkinsonianos: Sequedad
• Vincristina: Parálisis vocal
• Esteroides inhalados (Enlace a documento explicativo):
• Colonización por Cándidas
• Arqueamiento vocal
Vitamina C: Sequedad
Andrógenos (Danazol): Disminuye la F0
Aspirina: Predispone a hemorragia vocal
Profesor del Módulo: Dr. Faustino Núñez Batalla
Médico del Servicio de ORL del Hospital Universitario Central de Asturias.

Profesor Asociado de ORL de la Universidad de Oviedo (Diplomatura de Logopedia).
Vocal de la Comisión para la Detección Precoz de la Hipoacusia Infantil (CODEPEH),

representando a la Sociedad Española de Otorrinolaringología (SEORL), desde Febrero de 2007.
Responsable del “Fellowship en Foniatría” del Hospital Universitario Central de Asturias,

financiado por la Sociedad Española de Otorrinolaringología y Patología Cérvico-Facial para
especialistas en Otorrinolaringología (2003-2005).
Miembro electo de la Junta Directiva de la Sociedad Española de Otorrinolaringología y

Patología Cérvico-Facial: Presidente de la Comisión de Foniatría (Noviembre 2003 - Noviembre
de 2006 y de Noviembre de 2006 a Noviembre de 2009).
Presidente del Comité Organizador de la V Reunión Nacional de la CODEPEH (Comisión para la

Detección Precoz de la Hipoacusia Infantil). Oviedo 8-10 de noviembre de 2006.
Autor del Curso de Evaluación y Diagnóstico de las Alteraciones de la Voz.

www.medifusion.com/cursos. Avalado por la Sociedad de Otorrinolaringología y Patología
Curso de voz
Cérvico Facial. Acreditado por la Comisión de Formación Continuada del Ministerio de Sanidad
con 7.9 créditos. Primer curso online de voz, 1999.
Últimos artículos sobre el tema:
• Faustino Núñez-Batalla, Juan Pablo Díaz-Molina, Andres Coca-Pelaz, Carlos Suarez-

Nieto. Voice outcomes after laser cordectomy. Journal of Laryngology and Voice 2011;
1: 6-11.
• Núñez-Batalla F, Díaz-Molina JP, Costales-Marcos M, Moreno Galindo C, Suárez-Nieto C.
Neurolaringología. Acta Otorrinolaringol Esp. 2011 Feb 22. [Epub ahead of print].
• García-López I, Núñez-Batalla F, Gavilán Bouzas J, Górriz-Gil C. Validation of the
Spanish version of the voice handicap index for vocal singing (SVHI). Acta
Otorrinolaringol Esp. 2010; 61: 247-54.
• Núñez-Batalla F, Corte-Santos P, Señaris-González B, Llorente-Pendás JL, Górriz-Gil C,
Suárez-Nieto C. Adaptation and validation to the Spanish of the Voice Handicap Index
(VHI-30) and its shortened version (VHI-10). Acta Otorrinolaringol Esp. 2007; 58: 386-
92.
• Núñez Batalla F, Caminero Cueva MJ, Señaris González B, Llorente Pendás JL, Gorriz Gil
C, López Llames A, Alonso Pantiga R, Suárez Nieto C. Voice quality after endoscopic
laser surgery and radiotherapy for early glottic cancer: objective measurements
emphasizing the Voice Handicap Index. Eur Arch Otorhinolaryngol 2008; 265: 543-8.
2. EXPLORACION
Evaluación Perceptual de la Voz
Durante la entrevista con el paciente ya se ha escuchado suficientemente su voz y estamos en

condiciones de proseguir el estudio de la misma por medio de la evaluación perceptual de la
voz, que persigue describir el tipo y la severidad del trastorno, identificar e interpretar la voz
anormal para realizar un diagnóstico diferencial y determinar si el paciente es candidato a la
terapéutica. En este punto aún no necesitamos de medios especiales para el estudio de la voz.
Esta evaluación perceptual consta de dos etapas, la de realización de pruebas vocales y la de
elaboración del perfil vocal.
1) Pruebas Vocales.
Constan de la ejecución de tareas de emisión de la voz en determinadas condiciones que se

deben grabar en un magnetófono.
a. Voz conversacional espontánea. Se advertirán sus características acústicas y se juzgará

la severidad global de la disfonía, especialmente en relación con la estética y la
inteligibilidad.
b. Prolongación de una vocal. Se pide que sostenga la fonación de la vocal /a/ el mayor
tiempo posible y de forma estable. Los factores a analizar son la cualidad, tono,
intensidad y estabilidad. La voz puede ser aérea, dando la impresión de una pérdida de
aire a través de la glotis. Puede tener cierta ronquera o bien ser constreñida dando la
impresión de que la produce una glotis excesivamente cerrada. El tono puede ser
excesivamente alto o bajo. Se pueden también identificar fluctuaciones rítmicas o
Curso de voz
interrupciones y la frecuencia de las mismas. Por último, se debe anotar el tiempo que
es capaz de sostener la vocal en segundos como una medida de la eficiencia
fonorespiratoria.
c. Tos y ataque glótico duro. Si se sospecha la existencia de parálisis laríngeas, una de las
pruebas más útiles para valorar la fuerza de la adducción vocal es pedir que tosa lo
más fuerte posible, así como producir una vocal con ataque glótico duro . Los
pacientes con una capacidad de adducción normal de las cuerdas vocales producirán
sonidos abruptos y explosivos. Aquellos que presenten una moderada debilidad cordal
producirán una tos normal debido a la acción de las bandas ventriculares pero el ataque
glótico duro revelará la debilidad dado que en este caso sólo actúan las cuerdas vocales
verdaderas. En los casos moderados o severos, tanto la tos como el ataque glótico
estarán alterados en distinta severidad, desde una ligera pérdida de agudeza hasta la
completa ausencia de la interrupción momentánea de la corriente de aire que
caracteriza a ambas pruebas.
d. Rango tonal. Se pide que cante la escala musical tan alto y tan bajo como sea capaz
para determinar su posible estrechamiento, pero este factor se estudiará mejor con la
realización de un fonotograma.
e. Resistencia. Se le pide contar vigorosamente hasta 100 para determinar la capacidad
de mantener la fuerza muscular respiratoria, fonatoria, resonadora y de los sistemas de
articulación. Se prestará atención al posible deterioro de la fonación, cierre velofaríngeo
o defectos articulatorios.
f. Exploración motora del habla. Para detectar una disartria de la que la disfonía es sólo
un acompañante.
g. Exploración de la tensión musculoesquelética. Su presencia se determina por los
siguientes criterios: Dolor alrededor de los cartílagos laríngeos y hueso hioides que a
veces se irradia hacia los oídos, esternón o tórax. Elevación de la laringe y el hueso
hioides con resistencia a la movilización lateral, superior o anteroposterior con un
estrechamiento del espacio tirohioideo. Obtener mejoría en la fonación al descender
con la mano el bloque laringe-hioides.
h. Tono óptimo. En ocasiones los pacientes presentan una disfonía por hacer un esfuerzo
consciente o inconsciente para bajar el tono de su voz. Se utiliza la prueba diseñada
por Cooper consistente en producir un sonido parecido al de asentimiento ("Umhum")
de la forma más espontánea posible . El tono vocal se elevará y desaparecerá la
disfonía al mismo tiempo que se nota una amplificación del sonido en el área nasal si
efectivamente el tono de la voz había sido excesivamente bajo.
Con estos hallazgos ya estamos en condiciones de acercarnos al diagnóstico probable del caso
que estamos estudiando:
• Si nos enfrentamos a un paciente que ni fona ni articula podemos sospechar que se

trata de un trastorno psíquico de conversión. Si el paciente susurra con o sin ruidos
laríngeos, en el cual el resto del mecanismo periférico del habla es normal también
debemos sospechar un trastorno de conversión.
• Si oímos una disfonía aérea incongruentemente severa con un ataque glótico duro
normal y una tos normal es compatible con una disfonía psicógena.
• Una voz áspera y constreñida nos hará sospechar de la presencia de una masa
laríngea, una enfermedad neurológica o un trastorno psicógeno.
• La intensidad de fonación baja no suele indicar nada, se puede observar en la hipo o en
la hipertonía, sin embargo es característico de la enfermedad de Parkinson.
• La intensidad excesiva indica una sordera o una disartria atáxica severa.
Curso de voz
• Un tono excesivamente elevado suele orientar hacia un problema psicógeno con un

aumento de la tensión muscular, reacción de conversión o una puberofonía.
• Un tono excesivamente bajo orienta hacia los trastornos orgánicos, las lesiones
estructurales o que aumenten la masa de las cuerdas vocales provocan la producción
de una voz con tono bajo y ronca, que también es frecuente observar en las parálisis
laríngeas unilaterales, la disfonía pseudobulbar, el temblor orgánico, la disartria mixta y
la esclerosis lateral amiotrófica.
• El temblor rítmico o las interrupciones en la fonación orientan hacia un temblor
esencial.
• Una prolongación de la vocal corta o la emisión de frases cortas sugiere una
hipoadducción de las cuerdas vocales, bien por razones orgánicas o bien por causas
psicógenas, que causas escape de aire.
• Una tos débil o un ataque glótico débil orientan hacia una paresia o parálisis adductora
uni o bilateral.
• La incapacidad para cantar la escala traduce debilidad del músculo cricotiroideo y una
voz monótona es característica de la enfermedad de Parkinson.
• Las fluctuaciones del tono son raras y ocurren en la puberofonía las rea
2) Análisis Perceptual.
Es el método más indicado para analizar la sensación psicoacústica que nos produce el timbre
de la voz del paciente, aunque es subjetivo, con el entrenamiento puede llegar a ser
reproducible y preciso. El disponer de instrumentos para realizar el análisis acústico de la voz no
debe hacer que olvidemos la valoración auditivo-perceptual de la voz, de hecho cuando se
estudia una voz severamente afectada, es frecuente constatar el fracaso de los métodos
objetivos y que solo podamos utilizar este sistema. La mejor manera de valorar la calidad de la
voz es escucharla y utilizar escalas estándar de calificación, como las del sistema GRBAS. Este
sistema califica cinco factores:
• G, Grade: Grado global de severidad de la disfonía.

• R, Roughness: Voz ronca, áspera, que da la impresión de ser producida por pulsos
glóticos irregulares. Incluye la diplofonía y las "roturas de voz". Se relaciona con
variaciones amplias de la frecuencia fundamental.
• B, Breathiness: Impresión auditiva de escape de aire, voz aérea, incluyendo segmentos
no fonados.
• A, Asthenicity: Sensación de astenia o fatiga vocal. Voz con timbre opaco. Voz
hipocinética o hipofuncional.
• S, Strain: Voz constreñida, tensa, que da la sensación de fonar con gran esfuerzo.
Cada uno de estos factores se califica con una escala de 0 a 3 (0=normal, 1=ligeramente
afectado, 2= moderadamente afectado, 3=afectación severa). Los parámetros B y R se
relacionan con las lesiones orgánicas y son los que han mostrado la suficiente fiabilidad como
para ser tenidos en cuenta en la clínica. Sin embargo, los factores conductuales (A y S), que
están más relacionados con trastornos funcionales, parecen menos fiables.
EJEMPLOS CON VOCES (Clips de sonido):
Sexo G R B A S
M 1 1 1 0 1
Curso de voz
M 1 1 0 0 1
M 2 2 2 0 1
M 2 2 1 0 2
M 2 2 2 2 0
M 2 2 1 0 1
M 3 3 3 3 0
M 3 3 3 3 0
M 3 3 3 2 0
Diagnóstico diferencial
AARONSON observó que los trastornos vocales se pueden agrupar en ocho categorías distintas
basándose únicamente en la percepción de la voz. Cada una de ellas se relaciona con un
probable comportamiento fisiopatológico distinto de la laringe y puede servir como base para
sospechar las distintas etiologías que pueden generar las alteraciones vocales concretas.
Este modelo práctico de clasificación de las disfonías se basa en el hecho de que éstas tienden
a agruparse espontáneamente en categorías perceptualmente distintas (Voice clusters). Dichas
categorías son una abstracción o prototipo en el cual se pueden incluir las voces de similar
calidad acústica. A cada categoría corresponde un mecanismo fisiopatológico concreto, que es
el responsable de la calidad vocal, aunque sea generado por muy distintas causas. Así, cuando
oímos una voz aérea o cuchicheada, sabemos que el comportamiento fisiopatológico de la
laringe que lo crea es una insuficiente adducción de las cuerdas vocales. La causa anatómica o
funcional específica que la genera puede ser muy variada, desde una parálisis vagal alta hasta
un simple pólipo o unos nódulos vocales. La ventaja de categorizar el sonido en un grupo
concreto es la de organizar nuestro pensamiento lógico acerca de su causa, permitiéndonos
construir un diagnóstico diferencial. Existen ocho categorías distintas:
1. Voces aéreas.
2. Voces ásperas.
3. Voces ásperas con interrupciones arrítmicas.
4. Voces ásperas con interrupciones rítmicas.
5. Temblor vocal.
6. Voces aéreas de forma intermitente.
7. Voces de tono bajo.
8. Voces de tono elevado.
1. Voces aéreas. El comportamiento fisiopatológico que subyace en esta categoría es

el cierre glótico incompleto o ineficaz.
a. La causa más frecuente de un cierre glótico incompleto es la existencia
de una masa en la superficie de una o ambas cuerdas vocales que
Curso de voz
impide su completo contacto en la línea media. Las lesiones más

comunes son los nódulos vocales, los pólipos y los carcinomas.
b. Si no se comprueba la existencia de una masa en las cuerdas vocales,
la siguiente causa en frecuencia es una enfermedad neurológica que
afecte al nervio vago (X par).
c. Una laringoscopia indirecta es suficiente para descartar ambas
posibilidades, y si es así se tendrá que pensar en una enfermedad de la
unión mioneuronal como la miastenia gravis, un parkinsonismo
temprano o bien lesiones cerebrales que puedan crear una apraxia de
fonación o una enfermedad de lóbulo frontal.
d. Descartadas todas las causas orgánicas expuestas se puede pensar en
la existencia de un origen psicógeno de esta disfonía.
2. Voces ásperas. El mecanismo fisiopatológico común en esta categoría es la

hiperadducción completa y contínua de las cuerdas vocales.
e. Este comportamiento laríngeo se puede observar en los casos en los

que una masa impide el cierre completo de las cuerdas, el sujeto es
consciente de la ineficacia de su voz y genera un gran esfuerzo vocal
en forma de hiperadducción como mecanismo compensador. Es
frecuente escuchar una voz aérea al nivel conversacional que con el
canto o el grito desaparece.
f. Otras causas de hiperaducción vocal hay que buscarlas en
enfermedades neurológicas como la parálisis pseudobulbar o la
esclerosis lateral amiotrófica, en la que domine la espasticidad sobre la
flacidez al nivel de la laringe.
g. Si se demuestra que no existe una causa orgánica, nuevamente
tendremos que pensar en un origen psicógeno de esta disfonía.
3. Voces ásperas con interrupciones arrítmicas. En esta categoría se agrupan

aquellas voces cuyo mecanismo fisiopatológico común consiste en una hiperadducción
intermitente y arrítmica de las cuerdas vocales.
a. Las dos causas orgánicas que destacan en este grupo son las distonías
como la disfonía espástica adductora de origen neurológico y la corea.
b. En caso de no poder demostrar ninguna de las mismas, se tendrá que
pensar en una disfonía espástica adductora de origen psicógeno.
4. Voces ásperas con interrupciones rítmicas. La diferencia con la anterior categoría
es que las interrupciones se suceden con un patrón bien definido por la existencia de
repetidas hiperadducciones vocales regulares en el tiempo. Los ejemplos más
característicos son el temblor heredofamiliar benigno o temblor esencial y la más
infrecuente mioclonia velofaringolaríngea.
5. Temblor vocal. Se observa una adducción-abducción parcial y rítmica de las
cuerdas vocales.
a. La causa más frecuente es el estado de ansiedad.
b. En cuanto a las causas orgánicas que la pueden producir están el
síndrome cerebeloso y el temblor esencial de intensidad moderada.
La fisiopatología de estas voces comprende la existencia de fluctuaciones rítmicas en la

contracción de los músculos torácicos espiratorios y de los músculos laríngeos.
Curso de voz
6. Voces aéreas de forma intermitente. El mecanismo que las crea es una

hiperabducción intermitente de las cuerdas vocales. Las causas orgánicas se centran
en el temblor esencial en el que predomine la abducción vocal, lo que se denomina
una disfonía espástica abductora neurológica.
7. Voces de tono bajo. El mecanismo común es una reducción de la frecuencia
fundamental de la vibración vocal.
a. Entre las causas orgánicas se pueden encontrar las de origen
traumático (úlceras de contacto, hiperplasia epitelial) o bien
endocrinológicas (hipotiroidismo, virilización o acromegalia).
b. Las causas psicógenas son derivadas de una estrés crónico o por un
tono de voz bajo electivo.
8. Voces de tono alto. Existe un aumento en la frecuencia fundamental de la
vibración vocal.
a. Las causas orgánicas son la existencia de una laringe anormalmente
pequeña en casos de trastornos endocrinológicos en el sexo masculino
o la existencia de una sinequia congénita o adquirida en la comisura
anterior de la laringe, que acorta la porción vibrátil de las cuerdas, y
por tanto, elevan su frecuencia fundamental.
b. Entre las causas psicógenas se encuentra la puberofonía como cuadro
destacado.
Procedimientos de exploración de la estructura y función de la laringe
• La laringe, por su disposición anatómica, es un órgano de imposible observación sin

ayuda de instrumentos ópticos al encontrarse su eje formando un ángulo de 60-70º
con el eje de la cavidad oral.
• Por este motivo no fue hasta la segunda mitad del siglo XIX cuando se pudo observar
una laringe humana en funcionamiento.
Curso de voz
Invención de la laringoscopia
• Fue Manuel Patricio Rodríguez García, profesor de canto español, quien ideó y llevó a
cabo la primera observación de una laringe humana en funcionamiento.
• Empleó un espejillo de dentista que calentó y colocó en el fondo de su orofaringe, para
iluminándolo observar sus propias cuerdas vocales.
• Este histórico episodio dio lugar al nacimiento de la laringoscopia y a la especialidad de
la laringología.
• Su invención da lugar al nacimiento de la laringología (1854).
• Hasta entonces nunca se habían visto las cuerdas vocales en movimiento.
Manuel Patricio Rodríguez García

Curso de voz
• 1805-1906
• Hijo de cantante de ópera y hermano de María Malibrán.
• Profesor de Canto en el Conservatorio de París, se estableció después en Londres en la

Royal Academy of Music.
• No tenía ningún entrenamiento médico ni científico, su único deseo era observar la

glotis sana durante el canto.
Autolaringoscopia
• Publicado en la Royal Society: "Physiological observations on the human voice".

• El modo de descubrirlo es ahora una leyenda, fue presentado en el 7º Congreso
Internacional de Medicina en Londres en 1881.
Descubrimiento
Curso de voz
• Paseando por el jardín del Palais Royal de París, vio como se reflejaba el sol en una
ventana abierta del palacio.
• Observó el interior de la estancia desde fuera, imaginando así la laringoscopia.
Reconocimientos a M. García
• Doctor en Medicina por la Universidad de Köningberg.

• Director de la Royal Academy of Music, 1878.
• Homenaje en su 100 cumpleaños en La Royal Medical and Chirurgical Society de
Londres.
• Comendador de la Real Orden Victoriana.
• Real Orden de Alfonso XII
• Gran Medalla de la Ciencia del Emperador Alemán.
Curso de voz
Portrait of Manuel Garcia . John Singer Sargent -- American painter . 1904-1905 . Rhode Island
School of Design, Providence. Oil on canvas
Espejo frontal de Clar y espejillos laríngeos de distintos tamaños. Vigentes en la actualidad en la

clínica diaria.
Curso de voz
Laringoscopia Indirecta
• Ventajas
• Rápida
• Barata
• Poco equipamiento
Desventajas
• Reflejo nauseoso
• Características Anatómicas
• No fisiológica
https://youtu.be/i16cE110Xqk
https://youtu.be/bpORoGss8b8
Laringoscopia indirecta con endoscopios
• El desarrollo de endoscopios con precios asequibles ha extendido su uso en la clínica

diaria, llegando a sustituir al espejillo laríngeo.
• Existen endoscopios rígidos (telelaringoscopios) que magnifican la imagen con lo que
aumenta mucho la capacidad diagnóstica con respecto al espejillo.
• Los fibroscopios hacen posible la endoscopia minuciosa en pacientes de difícil
exploración, las desventajas ópticas han sido obviadas con el desarrollo de fibroscopios
con chip distal.
• No obstante, se recomienda a los residentes seguir entrenándose en la técnica de la
laringoscopia indirecta con espejillo laríngeo.
Curso de voz
Cuadro comparativo endoscopios
Optica rígida Fibroendoscopio Espejillo laríngeo

Introducción Oral Nasal Oral
Reflejos:
- Velofaríngeos +++ 0 ++
- Laríngeos (tos) 0 ++ 0
Imagen +++ + +++
Aumento +++ + +
Respiración Buena Buena Buena
Fonación /e/; /i/ Habla y canto /e/
Estroboscopia +++ + +/-
Coste +++ ++ -
Conclusión Dinámica vocal Faringolaringe Faringolaringe
Curso de voz
Laringoscopia normal
Fibrolaringoscopia dinámica
• Esencial para valorar ciertos trastornos:

• Disfonía por tensión muscular
• Movimiento paradójico de las cuerdas vocales
• Afonía funcional
• Trastornos neurológicos
• Parálisis vocal
Es una valiosa exploración complementaria a la estroboscopia.
Evalúa múltiples parámetros asociados a la fonación.
Se realiza en de forma natural y dinámica.
Sistemática de la exploración:
• Se observa la estructura
• Después la función
Sub-regiones a explorar:
• Nasofaringe
• Base de la lengua
• Laringe (global)
• Cuerdas vocales en particular
En cada sub-región hay tareas específicas para que el paciente facilite la valoración
funcional.
a. Sub-región nasofaríngea
• Tarea: fonación sostenida de la /ii/, habla /koka//kola/, fricativa /s/ prolongada.

• Parámetros a evaluar: Enfermedad nasal, masas rinofaríngeas, temblor del paladar
blando e insuficiencia velo-faríngea.
Curso de voz
• Patología: Incompetencia velo-faríngea, temblor vocal, sinusitis, neoplasias

rinofaríngeas.
b. Sub-región base de la lengua
• Tareas: en reposo y protrusión lingual.

• Parámetros de evaluación: temblor, fasciculaciones, tumores, infecciones.
• Patología: temblor esencial del tracto vocal, ELA, tumores, infecciones.
c. Sub-región laringe global
• Tareas: reposo, alternar fonación /ii/ con respiración, y habla.

• Parámetros de evaluación: Movilidad y sincronía de las cuerdas vocales, movimientos
paradójicos, constricción supraglótica en fonación y temblor.
• Patología: disfonía por tensión muscular, movimientos paradójicos, temblor vocal,
parálisis vocal, tumores, reflujo.
d. Sub-región cuerdas vocales
• Tarea: respiración, alternar fonación-respiración y fonación sostenida.

• Parámetros de evaluación: lesiones vocales, insuficiencia glótica y temblor.
• Patología: lesiones benignas, lesiones malignas, atrofia vocal y parálisis vocal.
TEMA 3. VIDEOESTROBOSCOPIA LARINGEA I: PRINCIPIOS BASICOS.
Introducción
La videoestroboscopia laríngea es una técnica especial de iluminación de las cuerdas vocales

que permite observar su vibración en cámara lenta, o bien detener la imagen en un punto del
ciclo.
Aunque es un método conocido desde hace muchos años, el creciente interés por la patología
vocal y los avances de la técnica han hecho que se difunda enormemente hasta el punto de ser
considerado como el método más importante en la valoración de la disfonía.
La utilidad diagnóstica de esta técnica se fundamenta en la premisa de que una vibración

anómala de las cuerdas vocales puede tanto contribuir al desarrollo de una lesión vocal, como
ser el resultado de la presencia de patología.
La disfunción vocal puede ser evaluada por métodos basados en medidas perceptuales,
aerodinámicas o acústicas y, sin embargo, la vibración vocal anómala que produce la disfonía
permanece oculta a estas técnicas indirectas.
Añadiendo el videoestroboscopio a la exploración de las disfonías se obtienen imágenes del

movimiento aparente de las cuerdas vocales que son imprescindibles para valorar una variedad
de patologías vocales. Sin la ayuda del estroboscopio es imposible observar la vibración del
borde libre de las cuerdas vocales que por ser un fenómeno enormemente rápido y frecuente,
solamente veremos una imagen borrosa.
Curso de voz
La disfunción vocal puede ser originada por la perturbación del movimiento de cualquier parte
de las cuerdas. La vibración normal de las mismas precisa que sus tejidos sean suaves y
flexibles, que tengan un borde libre liso y sin irregularidades y que su ligamento tenga la
suficiente laxitud como para permitir el movimiento. Otros requerimientos adicionales son que
la rigidez sea suficiente para mantener las propiedades elásticas naturales, que las
articulaciones cricoaritenoideas permitan los movimientos requeridos para la fonación y que
exista una presión subglótica mantenida que dinamice al sistema desde el aparato respiratorio.
Más importante que conocer la disfunción vocal es entender cómo se origina la producción de la
voz normal. La valoración precisa de la patología vocal demanda el conocimiento de la anatomía
y de los factores involucrados en la producción tanto de los patrones normales como de los
alterados.
https://youtu.be/ajbcJiYhFKY
https://youtu.be/-rCG6cUzzys
https://youtu.be/mJedwz_r2Pc
Concepto y definición de la estroboscopia
El término estroboscopia se refiere al uso de iluminación intermitente para la observación de un

objeto en movimiento, por lo que estroboscopio es el instrumento que se usa para estudiar las
fases del movimiento por medio de una fuente luminosa que se interrumpe periódicamente.
Así, la estroboscopia es un fenómeno óptico que captura fragmentos de un movimiento

completo por lo que un objeto que se mueve de forma rápida podemos observarlo de forma
lenta o incluso aparentemente detenido.
Este fenómeno óptico se basa en que el ojo humano retiene una imagen en su retina durante
0.2 segundos, lo que se denomina persistencia de la visión e impide que se puedan ver más de
cinco imágenes distintas por segundo. Las imágenes secuenciales que se produzcan a intervalos
menores de 0.2 seg persisten en la retina y se fusionan con las imágenes sucesivas para
producir la ilusión óptica de movimiento aparente. Este fenómeno se denomina la Ley de
Talbot, que también explica el hecho de que veamos un movimiento continuo cuando se nos
presenta una serie de imágenes fijas que cambian rápidamente, como es una película
cinematográfica o los dibujos animados. Lo que en realidad el ojo retiene en su retina es una
rápida serie de imágenes fijas que la mente se encarga de enlazar unas con otras "rellenando"
los vacíos que existen entre ellas y crear un continuo en movimiento.
Si cada imagen fija difiere ligeramente de la que le precede y de la que le sigue, el sistema
visual no tendrá problemas en percibir movimiento, es lo que se denomina"correspondencia",
en cambio si una imagen difiere sustancialmente de las adyacentes, se percibe un movimiento
grosero o desordenado.
La observación de un objeto en movimiento demasiado rápido para verlo a ojo desnudo precisa
de la iluminación intermitente con cortos destellos de luz. Los destellos sincronizados con las
fases del ciclo vibratorio las iluminan a una frecuencia visible al ojo humano. Así, perdiendo de
observar una parte del movimiento y rellenando esos huecos con nuestra persistencia de la
visión, somos capaces de observar fenómenos tan rápidos como el batir de las alas de un
pájaro, el movimiento de una hélice, o la vibración de las cuerdas vocales.
Curso de voz
La luz estroboscópica emite una serie de rápidos destellos, cada uno de ellos ilumina un punto
del ciclo vibratorio de las cuerdas. Los puntos iluminados se fusionan visualmente, resultando
un patrón vibratorio promedio de los sucesivos ciclos explorados.
Los destellos pueden ser emitidos a la misma frecuencia que están vibrando las cuerdas
(sincronización) o ligeramente desfasados de la misma (desincronización). El resultado es que
en la iluminación sincronizada se va a observar a las cuerdas siempre en el mismo punto de su
ciclo, por lo que veremos como resultante la imagen "congelada" de las mismas como si
estuviesen paradas en ese punto, cuando en realidad están vibrando.
Hirano M, Bless DM. Videostroboscopic examination of the larynx. Singular Publishing Group,
San Diego, 1993.
En tal estado de "imagen congelada", cualquier movimiento que apreciásemos sería signo de
estar ante una vibración aperiódica o asimétrica.
Por el contrario, si variamos 1 o 2 Hz la frecuencia de los destellos, se desincronizará de la

frecuencia de vibración de las cuerdas, por lo que se iluminarán las distintas fases del ciclo.
Este desfase sistemático a lo largo de los sucesivos ciclos dará como resultado una imagen de
movimiento en cámara lenta de las cuerdas vocales.
Curso de voz
San Diego, 1993.
Las imágenes secuenciales harán que tengamos la imagen de un ciclo con la ilusión óptica de
movimiento aparente. Este ciclo que observamos a cámara lenta es en realidad una
composición que hacemos de fragmentos de innumerables ciclos sucesivos que sucedieron
durante la exploración.
Parámetros de la Vibración Vocal
Para el estudio del fenómeno vibratorio vocal por medio del videoestroboscopio laríngeo es
preciso tener en cuenta los parámetros que describen este movimiento:
1. 1. El primero es la FRECUENCIA FUNDAMENTAL, tono, o frecuencia básica de la voz

(F0). Es la responsable de la tonalidad que se percibe. El periodo fundamental es el
tiempo empleado en completarse un ciclo vocal y se relaciona con la frecuencia
fundamental mediante la fórmula F0 x P = 1.
2. La AMPLITUD es el término que describe la excursión lateral del borde libre de las
cuerdas vocales.
3. Las FASES del ciclo vibratorio son la fase abierta y la fase cerrada. La primera ocupa la
mayor parte del ciclo y se puede subdividir en dos componentes, la fase de cierre de la
fase abierta y la fase de apertura de la fase abierta.
Curso de voz
Timcke R, von Leden H, Moore P. Laryngeal vibrations: Measurements of the glottic

wave. Arch Otolaryngol 1958; 68: 1-19.
4. La ONDA MUCOSA es otro parámetro de importancia. Se refiere a la serie de

ondulaciones de la cubierta de las cuerdas que se observan en la fonación excepto en
el falsetto, que viajan desde abajo hacia arriba a una velocidad de 0.5 a 1 metro por
segundo. Su génesis depende de la existencia de una capa superficial de la lámina
propria suave y flexible.
Curso de voz
Hirano M, Bless DM. Videostroboscopic examination of the larynx. Singular Publishing

Group, San Diego, 1993.
5. La HOMOGENEIDAD estructural de las cuerdas hace que se observen estos parámetros

de forma también homogénea a lo largo y a lo ancho de la superficie de las cuerdas
vocales, con la excepción de que la amplitud es mayor en el punto medio de las
cuerdas membranosas.
6. La SIMETRIA del movimiento vibratorio es indicativo de que las propiedades mecánicas
de ambas cuerdas son muy parecidas. Cuando se pierde este parámetro indica que
existen diferencias entre ambas cuerdas.

Curso de voz
Equipo
Las cuerdas vocales vibran normalmente entre 100 y 500 veces por segundo por lo que su
observación se hace imposible si no se emplean técnicas especiales como la estroboscopia, la
estroboscopia con rayos X, la fotografía ultrarápida, la glotografía fotoeléctrica, la
electroglotografía o la glotografía ultrasónica. La estroboscopia es el método más práctico para
los fines clínicos.
Para lograr una adecuada valoración estroboscópica de la laringe es básico contar con un
equipo adecuado y conocer su correcta utilización. La estroboscopia dará información acerca de
la existencia de una hiperfunción laríngea, cambios en la rigidez de las cuerdas debido a un
carcinoma, papiloma o una cicatriz, presencia de tono en una cuerda paralizada como dato
pronóstico, asimetrías de vibración y los efectos del edema de las cuerdas en su
comportamiento vibratorio.
El equipo básico con el que hay que contar consiste en un micrófono, una fuente de luz, una
unidad electrónica central y un pedal de control.
• El micrófono es el encargado de disparar la luz estroboscópica al llevar información de

la onda sonora de la voz producida por el paciente a la unidad electrónica central
donde se amplifica y se filtra. Consta de un estetoscopio que se aplica a la piel del
cuello a la altura del ala tiroidea. Si no contacta adecuadamente con la piel y no
recibe información la unidad electrónica, no se producirá la luz estroboscópica.
• La unidad electrónica central transmite la frecuencia fundamental extraída de la voz a
una lámpara de xenon que emite una luz blanca intermitente sincronizada a la
frecuencia fundamental de la fonación. La frecuencia de los destellos luminosos
coincide con la frecuencia fundamental de la vibración vocal, independientemente de
que se cambie el tono, a no ser que el examinador quiera cambiar el ritmo de
destellos.
• La luz intermitente puede ser conducida por un cable de fibra óptica hacia un
microscopio quirúrgico, un endoscopio rígido, un fibroscopio o un simple espejillo
laríngeo según sea el método elegido para visualizar la laringe.
• El pedal sirve para gobernar el estroboscopio. Tiene tres posiciones básicas. La primera,
pisado hasta el fondo, hace que el estroboscopio emita la luz continua de
exploración. La segunda, levantando a mitad del recorrido, hace que se emita una
luz estroboscópica desincronizada (cámara lenta). La tercera, levantando un poco
más el pie, hace que la luz estroboscópica se sincronice con la vibración vocal en el
punto del ciclo que nos interese (imagen congelada).
• Existen una serie de elementos auxiliares con los que puede contar el equipo de
estroboscopia, los más comunes son una fuente de luz constante que sirve de luz de
exploración con la que buscamos las cuerdas vocales para posicionar el endoscopio
antes de disparar la luz intermitente o estroboscópica y una pantalla de cristal líquido
que nos indica la frecuencia fundamental de la fonación a tiempo real. Otros
aditamentos pueden ser un sistema de grabación en vídeo o la posibilidad de acoplar
un laringógrafo para obtener las curvas de la electroglotografía sobreimpresas en la
pantalla del monitor donde estamos observando las cuerdas vocales con la luz
estroboscópica.
Curso de voz
Además de contar con un equipo estroboscópico de calidad, con más o menos elementos
auxiliares, es vital contar con endoscopios adecuados. Lo más común es disponer de un
nasofibroscopio y de un telelaringoscopio rígido.
• El fibroscopio permite observar la función laríngea durante la producción de frases o

incluso durante el canto, produciendo mínimas molestias al paciente, sus ventajas
hacen que se le pueda considerar el método endoscópico de elección para la
estroboscopia en niños o en pacientes con un reflejo nauseoso intenso. Sus
desventajas son que no produce magnificación de las imágenes y la pérdida de
intensidad de iluminación, que en algunos casos puede ser crítica, ya que la luz
estroboscópica en ocasiones es menos intensa que la que nos proporciona una
fuente de luz fría convencional.
• El telelaringoscopio o laringoscopio rígido de 90 grados es el sistema con el que
mejores imágenes estroboscópicas se consiguen, la pérdida lumínica es despreciable
y magnifica las imágenes. Reevaluar laringoscopias hechas con un espejillo laríngeo
mediante el telelaringoscopio con luz normal hace que se cambie de diagnóstico o
que aparezcan otros hallazgos en casi el 30% de los casos, si se complementa con la
luz estroboscópica aumenta hasta el 43%. Para un examinador entrenado que esté
familiarizado con la patología vocal la laringoscopia con endoscopio rígido es más
eficiente que la laringoscopia indirecta con espejillo laríngeo, incluso en el estadiaje
de los carcinomas laríngeos la telelaringoscopia puede ser equivalente a la
laringoscopia directa bajo anestesia general. La diferencia es análoga a la
exploración con rinoscopia anterior comparándola con la endoscopia del complejo
osteomeatal. La combinación de una iluminación perfecta, magnificación de la
imagen y el ángulo de observación que se consigue con el telescopio hace que se
puedan detectar lesiones sutiles que de otra forma pasarían desapercibidas aún sin
usar una fuente de luz estroboscópica. Esta información debe tenerse en cuenta
cuando, por cuestiones económicas, no se pueda disponer de un estroboscopio, al
menos considerar la compra de un telelaringoscopio.
Factores que Determinan la Fiabilidad de la Exploración
Para lograr una exploración estroboscópica útil es importante tener en cuenta los factores que
deben controlarse. Por una parte debemos tener en cuenta los conocimientos del examinador,
tanto de la producción del sonido vocal como de la patología laríngea e interpretación de la
estroboscopia, y por otra parte los factores del paciente que pueden ser adversos a la técnica.
El examinador debe conocer que la vibración vocal varía enormemente con la edad, sexo, modo
de fonación, soporte respiratorio y ansiedad.
• Por ejemplo, cuando se fona con frecuencias extremadamente altas, la onda mucosa se
reduce sin que comporte la existencia de patología.
Curso de voz
• Es importante familiarizarse con los parámetros estroboscópicos que suelen afectarse

con las distintas patologías. Se debe buscar la presencia de asimetría en la vibración
laríngea como signo de patología en una de las cuerdas, sin embargo no hay que
olvidar que dicha asimetría es un hallazgo frecuente en personas de edad avanzada sin
que traduzca una enfermedad. Otro parámetro es la aperiodicidad que resulta de un
desequilibrio de las fuerzas musculares entre ambas cuerdas por afectación nerviosa o
neuromuscular de una de ellas sin olvidar que esta aperiodicidad es norma encontrarla
en personas normales cuando se está fonando al final del volumen pulmonar o tono
vocal e intensidad baja. También se observa en personas de edad avanzada.
• Las variaciones normales del cierre glótico se relacionan con el sexo y con los cambios
de tono e intensidad. Cuando se fona en tono muy alto se aprecia un cierre glótico
incompleto, la mayoría de las mujeres presentan un cierre glótico incompleto en la
parte posterior debido a que tienen una fase cerrada más corta que los hombres, sin
embargo en edades avanzadas es raro observar en las mujeres un cierre glótico
incompleto por arqueamiento de las cuerdas cuando en el hombre es muy frecuente.
Estos ejemplos ilustran la necesidad de un entrenamiento previo a realizar interpretaciones de

las imágenes estroboscópicas, que aunque teóricamente anormales, según en qué caso y
situación no comportan patología.
Las observaciones estroboscópicas dependen de la evaluación subjetiva del examinador, y por

tanto están sujetas a prejuicios a la hora de interpretarlas. Estos prejuicios suelen ser de dos
tipos:
• En el primero existe una tendencia a sobredimensionar lo observado, se piensa que es

más grave de lo que en realidad es una situación y se proponen tratamientos
igualmente sobredimensionados.
• En el segundo existe una tendencia a minimizar los hallazgos, atribuyendo una menor
importancia a la enfermedad que se está estudiando de la que en realidad le
corresponde.
En la estroboscopia se propone reducir estas tendencias realizando un protocolo de

estudio con una escala de valoración de los distintos parámetros que se deben evaluar,
aunque nunca se logrará, por mucha experiencia que se tenga, eliminarlas por completo. Otro
método para eliminar la subjetividad de esta exploración es el uso rutinario de la grabación de
las imágenes en vídeo que siempre pueden ser comparadas por el mismo examinador o por
otros.
Los factores propios del paciente que pueden perturbar la exploración son el miedo con el que
se presentan a realizar una prueba cuyo nombre les suena extremadamente complicado, el
reflejo nauseoso intenso, la alergia a los anestésicos locales, la imposibilidad para fonar por su
enfermedad, los pólipos nasales si intentamos realizar una fibroscopia y los problemas de la
articulación temporomandibular.
• Si la voz del paciente es extremadamente débil, el aparato no emitirá los destellos de

luz estroboscópica por no llegarle información de que está fonando, esta dificultad se
puede paliar en parte colocando el micrófono a otra persona con voz normal y
Curso de voz
observando las cuerdas del paciente, aunque la luz no se acoplará de forma perfecta a
la frecuencia de vibración de las cuerdas a explorar puede servir de ayuda.
• La presencia de naúseas que impidan la telelaringoscopia se pueden suprimir usando
un anestésico local tópico en la faringe (que es infrecuente tener que usarlo) o bien
pasar directamente al fibrolaringoscopio con el que es raro tener estos problemas,
aunque como se dijo anteriormente, la imagen no sea de tanta calidad. Si se usan los
anestésicos locales tópicos se debe estar en condiciones de afrontar los posibles efectos
adversos y sobre todo explicar las sensaciones que va a notar una vez anestesiado,
especialmente si es una persona ansiosa, para evitar situaciones embarazosas. El uso
del diazepam se reserva para los reflejos nauseosos intensos en personas alérgicas a
los anestésicos o para explorar sujetos ansiosos.
La imagen de la videoestroboscopia debe llenar el monitor para poder observar con claridad los
bordes de las cuerdas vocales, debe poderse ver la onda mucosa y no debe tener artefactos.
Los artefactos más frecuentes son la distorsión óptica, especialmente en el caso de usar el
fibroscopio. En caso de realizar grabaciones se recomienda el uso de sistemas de Super-VHS o
Super-8 y no se considera un lujo el disponer de una videoimpresora (videoprinter) para
obtener imágenes en papel de las distintas fases del ciclo con el objeto de archivarlas en la
historia clínica para poder consultarlas de forma rápida sin tener que desplazarse al vídeo. Estos
procedimientos de almacenamiento de la imagen están en la actualidad siendo desplazados por
la digitalización de la misma y archivo en el disco duro del ordenador.
Por último, hay que tener en consideración las normas de higiene básicas en la exploración
como son el uso de guantes en todo procedimiento y seguir las recomendaciones de
desinfección del fabricante del endoscopio para garantizar al paciente el uso de un instrumento
en condiciones óptimas y no dañar los sistemas ópticos.
Tema 4. VIDEOESTROBOSCOPIA LARINGEA II.
Protocolo de Exploración e Interpretación de los Resultados.
El esquema de exploración e interpretación de la estroboscopia más empleado es el propuesto

por Hirano, que sistematizó su estudio magistralmente (1981).
Protocolo de Exploración
Se sienta al paciente enfrente del examinador con el cuello ligeramente extendido y la cabeza
ligeramente inclinada hacia atrás. Se coloca el micrófono en la piel del cuello a la altura del ala
tiroidea, puede ser interesante fijarlo con una banda de Velcro alrededor del cuello.
Se le pide sacar la lengua para sujetarla con una gasa, tal y como se hace en la laringoscopia
indirecta, y se pisa el pedal de control hasta activar la luz de exploración (luz continua no
Curso de voz
estroboscópica) que nos ayudará a posicionar el telelaringoscopio para lograr la visualización de

las cuerdas vocales.
Una vez colocado el endoscopio correctamente debemos ajustar su posición de forma que en la
imagen se pueda observar simultáneamente los aritenoides, la comisura anterior y la anchura
glótica máxima (en posición de separación de las cuerdas vocales), para lo cual debe evitarse la
epiglotis, lo que en ocasiones es difícil.
Para evitar el empañado de las lentes del endoscopio se puede recurrir a sistemas tan simples
como es contacto de las lentes con la mucosa oral del paciente justo antes de la exploración,
con el objeto de igualar la temperatura de las mismas y el aire espirado. Otros sistemas son
más complicados, los endoscopios rígidos o telelaringoscopios pueden contar con una toma de
aire cerca de la empuñadura que desemboca a ambos lados de las lentes, este sistema sirve
para conectar el endoscopio a una bomba que insufla aire para que salga cerca de las lentes y
evitar de ese modo el empañado, este método además de complicado da lugar a que el
paciente sienta la corriente de aire y de lugar a naúseas. El primer sistema es el aconsejable
por sencillo y barato además de suficientemente efectivo en todos los casos.
Cuando la laringe ya se tiene en la imagen del endoscopio se le pide al paciente que emita la
vocal /e/ a una intensidad y tono normales, si la epiglotis nos estorba la visión es muy útil pedir
que fone la vocal /i/, ya que se produce una verticalización de la epiglotis, apartándose del
campo visual. La fonación debe sostenerse al menos 2 segundos, lo que en ocasiones es difícil
de conseguir sobre todo en pacientes con grandes aperturas glóticas o volúmenes pulmonares
bajos.
Hasta ahora toda la exploración se desarrolló con luz de exploración continua (no
estroboscópica), en este momento se levanta el pié ligeramente del pedal para generar la luz
estroboscópica.
En una primera fase aparecerá la luz estroboscópica desincronizada con el ciclo vocal, lo que
nos permitirá observar la vibración en "cámara lenta", veremos la onda mucosa. Si levantamos
un poco más el pié del pedal, la luz estroboscópica pasará a aparecer sincronizada con el ciclo
vocal, obtendremos imágenes "congeladas" de las cuerdas vocales en el punto del ciclo que
seleccionemos con el pedal de control. Podemos ver las cuerdas en fase cerrada o en los
distintos puntos de la fase abierta, que es el punto más interesante en cuanto a la visualización
del borde libre. Aquí se verán los defectos del cierre glótico y se valorará la periodicidad de la
vibración, ya que en la imagen congelada, cualquier vibración aperiódica se delatará por la
aparición de movimiento.
Una vez realizada la exploración en tono e intensidad normales se le pide que aumente de
intensidad de fonación y después en tonos altos y bajos, por último se observa el ataque glótico
pidiendo al paciente que emita una rápida sucesión de cortas fonaciones de la vocal /i/.
Curso de voz
Todo este procedimiento se debe realizar con el telelaringoscopio, si esto no es posible, se debe
emplear el fibroscopio teniendo en cuenta sus limitaciones como son su poca definición de
imagen, pobre fidelidad de color, distorsiones ópticas, poca fiabilidad para valorar lesiones
pequeñas, no detección de cambios sutiles de coloración de las cuerdas y el efecto de que las
estructuras más cercanas al fibroscopio simulen tener un mayor volumen o abultamiento.
El tiempo que consume una exploración depende de varios factores entre los que se encuentran
la anatomía del paciente, la habilidad del paciente para seguir nuestras instrucciones, la
habilidad del explorador y el tipo de patología de que se trate. Para una valoración breve con
vocales sostenidas se emplean de 10 a 15 minutos incluyendo la grabación en vídeo y otros 10
minutos para volver a observarlo y completar los protocolos de valoración.
Cada estudio que se realice se aconseja que debe ser documentado de tres maneras distintas:
un protocolo, una descripción narrativa y una impresión en papel del vídeo. Los tres métodos
en combinación dentro de la historia clínica dan una gran información para poder realizar
futuras comparaciones o para mostrar a otros profesionales.
El protocolo es el elemento más importante puesto que nos asegura una anotación ordenada y
sistemática de todos los parámetros que necesitaremos posteriormente para interpretar la
exploración, permite no pasar por alto ningún dato que en el momento del procedimiento
puede olvidarse, es especialmente aconsejable cuando no se dispone de sistema de grabación
en vídeo y se puede archivar en la historia clínica para su consulta rápida en cualquier
momento.
Interpretación de los Resultados.
En esta fase se deben integrar los conocimientos de la enfermedad, la anatomía y la fisiología

de la fonación. La interpretación de los resultados se basa en la evaluación subjetiva pero
sistemática de las imágenes estroboscópicas.
No se debe pretender interpretar la estroboscopia de forma válida sin una considerable

práctica. Con 20 horas de entrenamiento visual, la mayoría de los observadores pueden estar
de acuerdo en un 90% en sus juicios acerca de la simetría de la vibración, cierre glótico,
amplitud de vibración, y onda mucosa.
La interpretación de la exploración estroboscópica debe ser ordenada y metódica, analizando

cada parámetro detenidamente.
1. Frecuencia fundamental (F0). La frecuencia fundamental se lee en herzios (Hz) en la

pantalla del estroboscopio. Cuando varía a lo largo de la exploración debe describirse.
Hay que tener en cuenta las variables que pueden afectar a la frecuencia fundamental
dado que pueden ser relevantes a la hora de interpretar los datos.
Curso de voz
a) A más rigidez en los tejidos de la cuerda, mayor será la frecuencia fundamental.

Fisiológicamente se observa cuando el músculo cricotiroideo se contrae y estira la
cuerda vocal, pero se puede dar en presencia de patologías como las cicatrices
vocales, que aumentan la rigidez, y por tanto la frecuencia fundamental ( :
fibrosis cicatricial de ambas cuerdas en mujer de 42 años, voz muy aérea con F0 de
330 Hz).
b) Cuanto más corta sea la porción vibrátil de la cuerda vocal, mayor será la
frecuencia fundamental. Fisiológicamente se constata en la voz infantil y femenina,
que tienen una mayor F0 que en la voz masculina por estar producidas por unas
cuerdas más cortas. Las sinequias en la comisura anterior tienen el mismo efecto al
producir un acortamiento de la porción vibrátil de las cuerdas.
c) Cuanto mayor sea la masa de las cuerdas, menor será la frecuencia fundamental.
En presencia de un pólipo o un edema de Reinke, la F0 tiende a reducirse, causando
por este motivo mayor preocupación en pacientes del sexo femenino, que con
frecuencia se quejan de ser confundidas con un hombre al teléfono ( : Edema
de Reinke en mujer de 45 años).
d) Cuanto mayor sea la presión subglótica, mayor será la frecuencia fundamental.

Esta influencia es pequeña y carece de importancia clínica.
2. Periodicidad. La periodicidad se basa en la regularidad de los sucesivos ciclos de la

vibración vocal. La vibración periódica es la que es uniforme en amplitud y tiempo, la
aperiódica se define por variar en amplitud, en tiempo o en ambos. Se determina
explorando la vibración con la luz estroboscópica sincronizada al ciclo (imagen
"congelada"), si es periódica veremos una imagen estática, sin embargo, si es
aperiódica comprobaremos la existencia de movimiento visible en lugar de dicha
imagen estática. El mantenimiento de la periodicidad depende de un equilibrio estable
entre las propiedades mecánicas del aparato vibrador (cuerdas) y la presión pulmonar,
este equilibrio puede verse perturbado por:
a) Asimetría.- Una marcada asimetría en las propiedades mecánicas de las cuerdas

como puede verse en una parálisis, carcinoma o pólipo.
b) Interferencia con la homogeneidad.- Una lesión localizada en un punto concreto

de una cuerda vocal como puede ser un quiste submucoso o un carcinoma.
c) Flacidez.- Causada por una lesión muy edematosa o por una parálisis
recurrencial.
d) Tono inestable.- La incapacidad de mantener un tono estable puede verse en

enfermedades neuromusculares o en las disfonías espásticas.
Curso de voz
e) Fuerza inconsistente.- La incapacidad de exhalar aire desde los pulmones con la

suficiente fuerza como para crear una presión subglótica eficaz puede verse en
enfermedades neuromusculares o patología neumológica.
3. Amplitud del movimiento horizontal. La amplitud se define por la extensión del

movimiento latero-medial de la cuerda vocal durante su vibración. Este parámetro se
juzga independientemente en cada cuerda vocal. Es normal si es aproximadamente un
tercio del ancho de la parte visible de la cuerda vocal, en la figura observamos un
esquema en el que se representa la amplitud. Línea central = amplitud cero. Primera
marca = amplitud normal. Segunda marca = amplitud máxima.

Hay que tener en cuenta los factores que pueden afectar a la amplitud:
a) Cuanto más corta sea la porción vibrátil, menor será la amplitud.
b) Cuanto más rígida sea la cuerda, menor será la amplitud. El ejemplo fisiológico es
la fonación en falsetto.
c) Cuanto mayor es la masa de la cuerda, menor será la amplitud.
d) Cuanto mayor es la presión subglótica, mayor será la amplitud. El ejemplo es el

grito.
e) Cuanto más firme sea el cierre glótico, menor será la amplitud. Se puede
observar en la disfonía hiperfuncional y en la disfonía espástica.
Curso de voz
4. Cierre glótico. El cierre glótico se clasifica en completo o incompleto según veamos o no

un ojal entre ambas cuerdas en la fase cerrada del ciclo. Cuando el cierre es incompleto
es interesante describir la forma del ojal, dado que hay formas de ojales característicos
de determinadas patologías.

Un cierre glótico incompleto se puede observar en numerosas alteraciones:
a) Alteración de la adducción vocal. Se causa por una parálisis recurrencial,

anquilosis o luxación de la articulación cricoaritenoidea.
b) Borde libre irregular. Causado por un pólipo, nódulo, quiste, o cualquier otra
masa.
c) Obstáculo entre las cuerdas. Como un cuerpo extraño, una sinequia o un

granuloma.
d) Borde libre fibroso. Si existe una fibrosis en este punto no se crea el efecto
Bernouilli como ocurre en las cicatrices o en el sulcus vocalis.
e) Hiperactividad del músculo cricotiroideo. Si los músculos adductores se ven

desbordados por una actividad exagerada del cricotiroideo, como ocurre en el
falsetto, se compromete el cierre glótico.
5. Simetría del movimiento. Se basa en que las dos cuerdas vocales deben dan una
imagen especular entre ambas durante su vibración. Para hablar de simetría deben
tener idéntico comportamiento en cuanto al momento de apertura, cierre y extensión
del movimiento de separación. Si existe alguna diferencia se habla de asimetría y se
debe de especificar en qué consiste, si es de tiempo o de amplitud. Las diferencias en
las propiedades mecánicas (posición, forma, masa, tensión, elasticidad y viscosidad)
causan el movimiento vibratorio asimétrico. Toda lesión unilateral produce una
asimetría en la vibración.
Curso de voz
6. Onda mucosa. La existencia de una onda que viaja en sentido vertical sobre la mucosa
de las cuerdas es uno de los hechos más importantes de la vibración. Las ondas
mucosas se pueden describir de cuatro maneras: a) Ausente. b) Disminuida. c) Normal,
cuando se observa claramente una onda que atraviesa al menos la mitad del ancho de
la parte visible de la cuerda durante una fonación en tono e intensidad normales. d)
Aumentada. Además hay que describir qué cuerda es la que presenta la onda anormal.
Los factores que pueden afectar a la onda mucosa son:
a) Cuanto más rígida es la mucosa, menor es la onda. Los ejemplos son la voz
en falsetto y la vibración en un ambiente con aire seco. En cuanto las patologías
citar las cicatrices los carcinomas, papilomas, quistes, nódulos fibrosos, pólipos
firmes y la hiperplasia epitelial. En los casos de lesiones edematosas la mucosa es
anormalmente flexible, dando una onda mucosa incrementada.
b) Mucosa parcialmente rígida. En los casos que existan zonas de la cuerda que
presenten mayor rigidez la onda se detiene en esos puntos. Los ejemplos son el
sulcus vocalis, las cicatrices localizadas, los quistes pequeños, los carcinomas de
escasas dimensiones y las hiperplasias epiteliales pequeñas.
c) Cuanto mayor es la presión subglótica, mayor es la onda mucosa. El ejemplo es

la fonación intensa.
d) Cierre glótico fuerte o débil. Un cierre glótico demasiado fuerte o demasiado débil
dan una onda mucosa disminuida, se puede observar en la fonación hipercinética y
en la hipocinética.
7. Otras observaciones. Es importante reseñar los hallazgos que no estén contemplados

en los apartados anteriores como:
a) Porciones de las cuerdas que no vibran.
b) Si se observan otros factores no protocolizados debe hacerse mención aparte

como en el caso de encontrar vibración de los aritenoides, un pólipo que emerge
desde la subglotis cuando se fona, etc.
c) Vibración de las estructuras supraglóticas. En la laringe normal, las estructuras

supraglóticas permanecen al margen del movimiento vibratorio de las cuerdas, en
ocasiones se puede observar que las bandas exhiben una vibración, temblor o que
se aproximan ambas impidiendo ver las cuerdas en fonación. Este fenómeno ocurre
con frecuencia cuando las cuerdas vocales están seriamente dañadas, es un
mecanismo compensatorio que intenta preservar la función fonatoria.
Patologías Vocales y su Exploración Estroboscópica

Curso de voz
No existe una relación constante entre una enfermedad y un patrón vibratorio, dado que éste
depende no sólo de la enfermedad en sí sino también de su tamaño, extensión, localización,
histología y el tipo de fonación del paciente incluyendo los mecanismos compensatorios. Sin
embargo, existen tendencias generales de la vibración, por lo que con frecuencia se pueden
asociar patrones típicos a una determinada enfermedad.
NODULOS VOCALES.- Normalmente se localizan en la unión del tercio medio con el anterior de
las cuerdas vocales. Son lesiones blanquecinas, sesiles, de pequeño tamaño y generalmente
bilaterales. La lesión está confinada en la capa superficial de la lámina propria y consiste en un
edema localizado con fibras colágenas. Es habitualmente simétrica y frecuentemente interfiere
con el cierre completo de la glotis durante la fonación. La masa y la rigidez de la cubierta se
incrementa ligeramente sin afectarse ni la transición ni el cuerpo de las cuerdas vocales. El
aspecto de la glotis cerrada se asemeja a un cascanueces o reloj de arena y la onda mucosa
está ausente en ese punto cuando los nódulos son fibrosos, mientras que si predomina el
edema está presente.
San Diego, 1993.
La estroboscopia permite hacer un diagnóstico diferencial con los quistes intracordales.
POLIPO LARINGEO.- Se desarrollan en el borde libre de las cuerdas, pueden ser de color rojizo
o blanquecino, de variados tamaños, pediculados o sesiles, uni o bilaterales. La patología se
localiza en la capa superficial de la lámina propria. Histológicamente se caracterizan por una
hemorragia intratisular, una degeneración hialina, trombosis y edema. Además puede haber
una proliferación de fibras colágenas y infiltrado de células inflamatorias. La lesión impide el
cierre glótico. La masa de la cubierta se incrementa. La rigidez es variable: Si predomina la
Curso de voz
hemorragia, degeneración hialina, trombosis, proliferación colágena o inflamación, se

incrementa. Si predomina el edema disminuye. La vibración de la cuerda contralateral se
interfiere dando lugar a vibración asimétrica y aperiódica. La amplitud se reduce en la cuerda
afecta y la onda mucosa está ausente en ese punto si el pólipo es hemorrágico o fibroso, pero
puede estar aumentada si es edematoso y flexible.
San Diego, 1993.
EDEMA DE REINKE.- Son sinónimos degeneración polipoidea, corditis crónica polipoidea,

hipertrofia crónica edematosa y cuerda vocal polipoidea. La porción membranosa de las cuerdas
vocales están edematizadas en toda su longitud, con frecuencia es asimétrica. Histológicamente
consiste en un edema de la capa superficial de la lámina propria. Generalmente no existen
defectos del cierre glótico. La masa de la cubierta se incrementa y la rigidez de la misma
disminuye. La transición y el cuerpo no se afectan. Los movimientos de las cuerdas son
asimétricos y con frecuencia aperiódicos. La amplitud de la excursión horizontal suele ser
pequeña pero la onda mucosa está aumentada.
Curso de voz
San Diego, 1993.
QUISTES VOCALES.- Los más comunes son los epidermoides, aunque los quistes de retención
se encuentran en ocasiones, los primeros son defectos congénitos, mientras que los segundos
son lesiones adquiridas. Se localizan en la capa superficial de la lámina propria, aunque en
ocasiones pueden abrirse a la luz laríngea o penetrar en el ligamento vocal. La pared del quiste
consiste en un epitelio escamoso y contienen material caseoso, en ocasiones son bilaterales y
su tamaño es muy variable. Impiden el buen cierre glótico. Las propiedades mecánicas son
asimétricas entre ambas cuerdas y la homogeneidad de la cuerda afecta se pierde. El borde
libre de la cuerda no es lineal. La masa y la rigidez de la cubierta aumentan, siendo la rigidez
superior que en el caso de los pólipos. La transición y el cuerpo no se afectan. La amplitud de la
excursión lateral está muy disminuida en el lado afecto y no se observa onda mucosa sobre el
quiste, hecho que permite diferenciar estas lesiones de los pólipos y nódulos. Hay que
sospechar de su existencia cuando se observen signos indirectos tales como una monocorditis,
un pequeño abultamiento en el borde libre o un "nódulo" unilateral.
Curso de voz
San Diego, 1993.
SULCUS VOCALIS.- Es una lesión difícil de diagnosticar, ya que solamente se detecta por las
alteraciones que origina en la vibración de las cuerdas. Consiste en un surco situado a lo largo
del borde libre de la cuerda, que se encuentra arqueada en mayor o menor medida. La mayor
parte de las ocasiones la lesión es bilateral y simétrica. La etiología es desconocida aunque se
sospecha que puede ser tanto congénita (sulcus vergeture), como adquirida por procesos
inflamatorios de larga evolución, especialmente la ruptura de un quiste submucoso. La lesión se
sitúa en la capa superficial de la lámina propria y el cierre glótico es insuficiente en toda su
longitud (ojal fusiforme) puesto que los bordes libres de las cuerdas están arqueados. La masa
de la cubierta es menor y la rigidez se haya incrementada. La amplitud del movimiento lateral
es menor y la onda mucosa se interrumpe en el surco.
Curso de voz
San Diego, 1993.
CICATRIZ VOCAL.- Puede afectar a cualquier capa de la cuerda. Se forman tras traumatismos
vocales, el más frecuente tras cirugía, en ocasiones es la respuesta a una inflamación de las
cuerdas. Es una lesión que pasa desapercibida a cualquier método de exploración excepto para
la estroboscopia. Consiste en fibras colágenas densas que son mucho más rígidas que los
tejidos normales de la cuerda. La localización es muy variable, si ocupa toda la extensión de la
cuerda esta es homogénea, mientras que si es localizada será heterogénea, las propiedades
mecánicas de las cuerdas son asimétricas. La porción afectada siempre es más rígida y se
pueden ver involucrados, además de la cubierta, la transición y el cuerpo. La presión subglótica
tiende a aumentar para poner en movimiento dichas zonas de mayor rigidez. Una vez iniciado el
movimiento la vibración es asimétrica y aperiódica, con una amplitud de la excursión lateral
limitada y con ausencia de onda mucosa sobre la cicatriz. El cierre glótico a menudo es
incompleto sin un patrón característico.
Curso de voz
San Diego, 1993.
LEUCOPLASIA.- La lesión se origina en el epitelio, en la capa superficial de la lámina propria,

nunca invade el ligamento a no ser que se convierta en maligna. El borde libre de las cuerdas
suele ser no lineal, las propiedades mecánicas son asimétricas y la rigidez de la cubierta
aumenta. La fuerza espiratoria y la presión subglótica son normales. Durante la vibración, el
cierre glótico es incompleto con una forma irregular, los movimientos son asimétricos y
aperiódicos, con una amplitud limitada, la onda mucosa suele estar disminuida en el sitio de la
lesión, hecho que la diferencia con el carcinoma, donde no se observa onda mucosa.
Curso de voz
San Diego, 1993.
CARCINOMA.- Se origina del epitelio invadiendo en profundidad las demás capas de la cuerda.
Suelen ser unilaterales. El cierre glótico es incompleto aumentando la masa y la rigidez de todas
las capas que estén involucradas. Durante la vibración se observa una marcada diminución del
movimiento sobre el área afecta, sin poderse observar onda mucosa. La estroboscopia puede
detectar estas lesiones en estadios verdaderamente incipientes de la enfermedad, con las
ventajas que ello comporta. El estroboscopio es muy útil, por tanto, en la vigilancia de los
pacientes tras la radioterapia, ya que la onda mucosa desaparecerá de forma muy temprana en
las recidivas.
Curso de voz
San Diego, 1993.
PARALISIS RECURRENCIAL.- Cuando se observa una parálisis vocal, es importante discernir el

grado y naturaleza de la misma. La estroboscopia laríngea puede, con alguna limitación,
sustituir a la electromiografía en el diagnóstico de estas lesiones. La patología se localiza en el
cuerpo de la cuerda, al estar paralizado el músculo. La glotis no se cierra por completo y la
incompetencia glótica es marcada. Las cuerdas son asimétricas y el borde libre de la cuerda
afecta está arqueado. La vibración es asimétrica y aperiódica. La amplitud está reducida en el
lado paralítico y la onda mucosa está reducida o ausente. Todas estas anormalidades aumentan
según el número de las neuronas afectadas, por lo que la estroboscopia puede ser usada como
un método pronóstico. Si el músculo está totalmente paralizado y atrofiado, la cuerda presenta
unos movimientos pasivos, como una bandera al viento. Si por el contrario, está parética o
comienza a aparecer la reinervación, podremos observar una onda mucosa.
Curso de voz
San Diego, 1993.
DISFONIA HIPERFUNCIONAL.- Se define como un grupo de alteraciones de la voz que cursan

con una actividad excesiva de los músculos laríngeos durante la fonación. El cierre glótico es
excesivamente firme y se suele observar una aproximación de las bandas. Las cuerdas vocales
suelen estar acortadas y la masa de toda la cuerda incrementada. La rigidez del cuerpo de la
cuerda aumenta, con lo que la fase cerrada del ciclo se prolonga. La amplitud de los
movimientos se reduce.
DISFONIA HIPOCINETICA.- Estos trastornos se originan por una insuficiente actividad de los
músculos laríngeos. El cierre glótico es demasiado débil y en ocasiones incompleto. La rigidez
de la cuerda se reduce y la presión subglótica tiende a bajar. La fase cerrada es corta o
inexistente durante el ciclo. La amplitud del movimiento está limitada.
Curso de voz
San Diego, 1993.
Integración de la estroboscopia en el Laboratorio de Voz.
El objetivo principal del Laboratorio de Voz es documentar el comportamiento vocal del paciente
y determinar su potencial. Consiste en conocer lo que el paciente hace con su voz, lo que
puede hacer con su voz y lo que podría hacer tras una modificación quirúrgica de su estructura.
La videoestroboscopia representa sólo una parte, aunque importante, del proceso de la

valoración de un trastorno de la voz. Desde que la International Association of Logopedics and
Phoniatrics (1992) dictaminó que para la correcta valoración de una disfonía no es suficiente
con objetivar el trastorno con nuestro oído, se ha hecho necesario construir un sistema de
documentación de la voz. No sólo los requerimientos médico-legales tienen que hacer al clínico
buscar estos sistemas de documentación, sino que deben ser adoptados como una parte de la
estrategia de optimización de la terapéutica de la disfonía. Las medidas objetivas de la voz no
sólo nos dan una documentación sin sesgos, son capaces de aportar parámetros clínicamente
útiles que el oído o el ojo desnudos son incapaces de percibir.
La documentación de la función laríngea se usa para: a) Determinar el mejor procedimiento

terapéutico. b) Monitorizar el tratamiento. C) Ayudar a diagnosticar el problema. d) Documentar
el grado y extensión de la enfermedad. e) Determinar el pronóstico y f) Determinar la causa de
que se mantenga la disfonía a pesar del tratamiento.
Curso de voz
Los métodos objetivos de medición de la función vocal incluyen medidas de la señal acústica,
aerodinámica, movimiento y los componentes electromiográficos de la producción vocal. La
utilidad de cualquier técnica diagnóstica es mínima si no puede contestar a las preguntas de
dónde se localiza la alteración, el impacto que tiene en la producción de la voz o el grado de
disfunción vocal. Dada la complejidad de la producción vocal, es imposible determinar su estado
con un solo parámetro. Se precisa de una batería de pruebas para poder juzgar una disfonía sin
caer en errores de interpretación.
En los siguientes capítulos se exponen las técnicas de valoración acústica, aerodinámica y

espectrográfica de la voz.
1. EVALUACION AERODINAMICA:
Ver documento "Aerodinámica - Estudio de la Eficiencia Vocal"
La interacción entre el mecanismo valvular de la laringe y el flujo aéreo pulmonar es decisiva

para el mantenimiento de la fonación durante períodos lo suficientemente prolongados para
poder hablar sin interrupciones para tomar aire. Una laringe que no cierre con la suficiente
firmeza sus cuerdas, dejará un ojal glótico por donde se pierde una mayor cantidad de aire,
dando lugar a un acortamiento de la fonación que el sujeto es capaz de realizar en cada
inspiración.
Las pruebas que exploran la coordinación fono-respiratoria son simples y no precisan de

instrumentos especiales.
Tiempo Máximo de Fonación (TMF)
Es el tiempo que una persona es capaz de mantener una fonación sostenida de una vocal. Nos
da información acerca del control de la función respiratoria, la eficiencia glótica y el control
laríngeo.
Cuando la función respiratoria no es normal, la cantidad de aire que se emplea para mantener
la fonación está disminuida o la fuerza que se ejerce sobre la laringe es menor (presión
subglótica).
Si el problema se sitúa en la glotis, la eficiencia glótica estará disminuida porque el aire se

pierde al existir un defecto del cierre (aire vocal no productivo) o porque la fuerza de las
hemilaringes al cerrarse está aumentada y el aire se pierde explosivamente al abrir la glotis. El
control motor laríngeo produce una fuerza armónica de cierre que determina la mayor eficiencia
glótica, generalmente alterada en las enfermedades neurológicas que afectan a la fonación.
Curso de voz
El paciente debe emitir la vocal /a/ en un tono e intensidad cómodos, entendiendo por
comodidad la emisión de la voz a su tono habitual (ni muy agudo ni muy grave), procurando no
hacer ningún gesto laríngeo que aumente el esfuerzo. La intensidad cómoda se refiere a un
volumen que sea escuchado (sin sensación de esfuerzo) a unos 2 metros en un entorno
silencioso, lo que viene a representar unos 45-55 dB.
Después de una inspiración profunda el paciente, de pié y con el tronco bien erguido, emite la
vocal y se mide la duración con un cronómetro. Se recomienda realizar la prueba dos o tres
veces y tomar el tiempo mayor como la medida a recoger.
Según HIRANO, los varones tienen un TMF medio de 25-35 seg y las mujeres de 15-25 seg.
Clínicamente, unos valores por debajo de 10 seg se deben considerar patológicos. Las
variaciones según la edad y el sexo han sido estudiadas por KENT:
MASCULINO MEDIA FEMENINO MEDIA

3-4 años 8.9 seg +/- 2.1 3-4 años 7.5 seg +/- 1.8
5-12 años 17.7 seg +/-4.1 5-12 años 14.9 seg +/-3.8
ADULTOS 25.9 seg +/- 7.4 ADULTAS 21.3 seg +/- 5.6
ANCIANOS 14.7 seg +/-6.2 ANCIANAS 13.5 seg +/-5.7
La mayoría de las disfonías tienen una reducción del TMF, especialmente aquellas que están
producidas por una incompetencia del cierre glótico.
Si sabemos que un paciente no tiene problemas pulmonares y está emitiendo a un volumen

cómodo, toda disminución del TMF debemos achacarla, en un principio, a una pérdida de la
eficacia glótica. Cuando alguna lesión impide el cierre de las cuerdas (masa, atrofia o rigidez)
parte del aire se escapa sin producir vibración. Dicho aire crea turbulencias que producen un
sonido no armónico (ruido) que caracterizan a la disfonía. De esta forma podemos asociar la
disfonía a una disminución del TMF. La excepción a esta regla se produce en ciertos tipos de
disfonía por hiperfonación cuando el flujo aéreo es bajo y el paciente es capaz de producir
habitualmente tiempos de fonación excesivamente largos.
Los valores del TMF bajos tienen mayor significación patológica que los prolongados. Un valor
reducido puede deberse a dos causas principales: La existencia de una respiratoria que curse
con volúmenes pulmonares bajos o porque exista una incompetencia de la glotis que deje
escapar excesivo volumen de aire durante la fonación.
Es posible realizar una estimación del TMF mediante las fórmulas:
TMF = 0.67 x CV / 110 para hombres
TMF = 0.59 x CV/ 110 para mujeres

Curso de voz
Donde CV es la capacidad vital medida por espirometría.
Flujo Aéreo
El flujo aéreo o velocidad del volumen es una medida expresada en cm3 /seg que refleja la
rapidez con la que el aire pasa a través de la glotis. Esta velocidad es similar en niños y en
adultos y se influencia por el registro en el que se está fonando.
El flujo medio se puede calcular midiendo directamente con un espirómetro el volumen de aire
usado durante la fonación y dividiéndolo por el tiempo que duró dicha fonación. Este parámetro
es útil para valorar la evolución tras una fonocirugía, especialmente en los casos de parálisis
recurrencial y sulcus vocalis donde los valores del flujo aéreo preoperatorios son excesivamente
altos.
Los pacientes que presentan una disfonía hiperfuncional, generalmente exhiben valores de flujo
bajos que van incrementándose según desaparece la hiperfunción con el tratamiento.
Indice s/z
También conocido como índice o cociente fonorespiratorio, es el resultado de la división del

TMF para la consonante /s/ y el TMF para la vocal /a/.
El TMF se halla pidiendo que produzca el sonido /s/ todo el tiempo que pueda tras una
inspiración profunda. La intensidad debe ser baja y el control de la espiración máximo. De esta
forma se trata de conseguir un tiempo de producción del sonido /s/ igual o mayor al TMF de la
vocal /a/.
Este índice tiene como finalidad relacionar las funciones pulmonar y laríngea. Valorar de forma
aislada el TMF de la vocal /a/ corto tiene un sentido engañoso pues puede significar tanto una
capacidad pulmonar pobre como una incompetencia glótica.
En 1977, BOONE introdujo el índice S/Z sugiriendo que los individuos normales deberían de ser
capaces de mantener la vocalización durante un periodo de tiempo igual o ligeramente menor a
la espiración controlada sin vocalización y con producción del sonido no vocal /s/. Este cociente
debe ser próximo a la unidad.
Si el aparato respiratorio está afectado y la laringe es normal, hay una reducción semejante en
el tiempo del aire espirado sin fonación (/s/) que con fonación (/a/). En estas circunstancias, el
resultado de la división del TMF para la consonante y el TMF para la vocal igual a la unidad o
próximo a ella.
Sin embargo, en el caso de estar afectada la eficiencia glótica se pierde aire (aire vocal no
productivo), con la consiguiente disminución de la capacidad para mantener la fonación de la
Curso de voz
vocal /a/ (denominador de la división), pero sin disminuir la duración de la espiración

controlada que produce el sonido /s/ (numerador de la división). En este caso se obtendrán
valores S/Z altos, el límite de la normalidad se encuentra en 1.4.
Así, el índice S/Z se encuentra aumentado en los casos con lesiones glóticas que aumentan la
masa (nódulos, pólipos, etc), manteniéndose normal en los casos de disfonías funcionales. Este
índice aporta una información valiosa con un procedimiento simple y rápido que precisa como
instrumental sólo de un cronómetro. En la fonocirugía se utiliza para valorar la recuperación de
la eficiencia del cierre glótico.
Cociente de Fonación
Es la medida básica del control respiratorio y de la eficiencia del cierre glótico. Es el índice que
resulta de dividir la capacidad vital (CV) entre el tiempo máximo de fonación:
CF = CV / TMF
Los valores normales son 155 +/- 45 ml/seg, si se encuentran valores más altos quiere decir
que existe un escape de aire, voz espirada y un uso ineficaz de la laringe.
2. FONETOGRAMA O PERFIL DEL RANGO VOCAL:
Descrito por Calvet en 1953 es la representación gráfica de la capacidad fonatoria de la laringe,

lo que supone medir la intensidad o volumen en decibelios tanto máximo como mínimo que una
persona es capaz de emitir y mantener al menos durante 2 segundos en un tono determinado.
Esta medida se realiza a lo largo de todo el espectro de tonos que el paciente es capaz de
producir, desde el más grave hasta el más agudo, pronunciando siempre una misma vocal que
puede ser la /a/, la /i/ o la /u/.
Estos parámetros: intensidad y frecuencia, son medidas objetivas y cuantificables.
La información que se va obteniendo se anota sobre un diagrama cartesiano en cuyo eje de

abscisas (X) se reconocen frecuencias desde 32.7 hasta 2096 Hz, con sus correspondientes
notas musicales equivalentes, comprendiendo un total de 6 octavas divididas en 72 semitonos.
En el eje de ordenadas (Y), se representan los decibelios o nivel de presión sonora (NPS) desde
los 40 a los 120 dB.
Curso de voz
Primero, se establecen las frecuencias máxima y mínima que la persona es capaz de emitir,
comenzando desde la F0 y descendiendo a lo largo de la escala musical no incluyendo el "vocal
fry", se procede también en forma ascendente desde la F0 hasta la frecuencia máxima, de esta
forma se puede calcular el rango en semitonos. Después se tomarán 10 muestras por encima
de la frecuencia mínima a lo largo del rango hallado para medir con el sonómetro (a 30 cm de
la boca) las intensidades máxima y mínima que la persona es capaz de emitir. Los valores se
anotan en el diagrama propuesto por la Union of European Phoniatricians(Schutte y Seider,
1983).
Al realizar el fonetograma obtenemos una gráfica con dos perfiles, uno superior de NPS
máximos y otro inferior de NPS mínimos, a lo largo del espectro de frecuencias que es capaz de
emitir la persona explorada. Uniendo ambos perfiles obtenemos el CAMPO VOCAL (CV), que es
la expresión en dos dimensiones del potencial fonatorio de la laringe. El límite izquierdo del
campo vocal es la frecuencia fundamental del sonido más grave que puede emitir y el límite
derecho corresponde al más agudo.
Curso de voz
El fonetograma correctamente realizado permite:
• Determinar la severidad de la disfonía en pacientes con patología orgánica vocal.

• Demostrar la mejoría de la disfonía tras el tratamiento.
• Analizar el potencial vocal de cantantes y profesionales de la voz (Gamboa, 1996).
Actualmente existen programas para la realización del denominado fonetograma automático,

que es algo menos preciso que el realizado con sintetizador de frecuencias y sonómetro, pero
sin duda menos costoso en tiempo.
Las medidas fonetométricas son el RANGO VOCAL O FONATORIO (RV), o diferencia expresada
en semitonos entre la frecuencia máxima y mínima; el RANGO DINAMICO (RD), o la diferencia
en dB entre las intensidades máxima y mínima en cada frecuencia y el CAMPO VOCAL (CV), que
es el área comprendida entre los dos perfiles de presión sonora máxima y mínima del
fonetograma y se expresa en dB por semitono.
De todos estos parámetros, el más útil es el CV, ya que resume a todos los demás. Además el
fonetograma es una representación gráfica que puede valorarse de un vistazo con alto grado de
aproximación a los valores calculados.
Curso de voz
El RV en los adultos sanos alcanza e incluso supera los 36 semitonos, es decir tres octavas,
dependiendo del entrenamiento, comprensión de las instrucciones y la colaboración de la
persona explorada. La F0 en los varones varía entre los 100 y los 160 Hz y en las mujeres entre
los 220 y los 260 Hz (Nieto, 1995), estando este valor más cerca de la frecuencia mínima del
rango que de la máxima.
Los rangos dinámicos apenas son algo mayores en los varones que en las mujeres, por lo que
el campo vocal expresado en dB por semitono no depende del sexo. En general observamos en
el fonetograma un estrechamiento del Rango Dinámico en las frecuencias extremas, lo que
refleja la dificultad que tiene la laringe para modular la intensidad de una nota cuando se emite
en los extremos del rango vocal. Es también fisiológico que los valores de intensidad baja sean
más altos en las frecuencias agudas que en las graves.
En los casos de pólipos laríngeos las cifras del campo vocal en adultos se reducen
aproximadamente a la mitad respecto a los controles y esta reducción es aún más severa en el
caso de los edemas de Reinke, en los que las cifras del campo vocal bajan hasta el 35% de los
valores normales. Los carcinomas de cuerda vocal, incluso en estadio T1, producen gran
restricción del campo vocal que puede disminuir hasta cifras menores.
En general cualquier patología laríngea, orgánica o funcional produce restricciones en los

rangos vocales y dinámicos, y por tanto en el campo vocal. No podemos establecer patrones
característicos de fonetograma para cada patología pues esta prueba establece o documenta la
ANALISIS ACUSTICO DE LA VOZ.
El análisis acústico es uno de los métodos más interesantes para valorar la función vocal. Entre
sus ventajas hay que tener en cuenta que no solo es una técnica no-invasiva, sino que además
nos da información cuantitativa acerca del estado de la función vocal.
El estudio de la voz se inicia captando la señal acústica por medio de un micrófono para
digitalizarla por medio de un convertidor analógico/digital. Una vez digitalizada la señal está en
condiciones de ser analizada por el programa de análisis acústico.
Por medio de distintas aplicaciones informáticas se pueden estudiar las tres características
acústicas de la voz: frecuencia, intensidad y timbre.
Frecuencia o Tono.
Curso de voz
Las anormalidades en el tono se asocian frecuentemente a muchos procesos patológicos. La

percepción del tono está relacionada de forma compleja con la intensidad y las características
espectrales del sonido vocal.
La FRECUENCIA FUNDAMENTAL (F0), que viene determinada por la frecuencia de la vibración

de las cuerdas vocales, es el factor más importante que contribuye al tono que percibimos. De
todos los datos clínicos relacionados con la voz, la F0 es el más frecuentemente hallado por su
facilidad de determinación por medio de instrumentos computerizados y por la información de
utilidad que nos brinda acerca del estado y comportamiento de las cuerdas vocales.
Para evaluar la extensión tonal de la voz se obtiene:
• El tono más grave, mandando contar de 1 a 25 mientras se baja progresivamente el

tono en cada número enunciado.
• El tono más agudo, cantando la escala hacia arriba incluyendo el falsete. Se debe
repetir al menos tres veces.
Toda la sesión es recomendable que quede grabada en un magnetófono para reproducirlo y

comparar con diapasones el sonido de la voz con el fin de identificar las notas musicales de las
frecuencias extremas. En la actualidad se dispone de medios electrónicos y computerizados
para este fin.
El "tono óptimo" es el nivel de tono en el cual la voz se produce de un modo más eficaz, con la
menor tensión laríngea y con la máxima comodidad. Se cuenta el número de tonos de la escala
musical que contiene la extensión tonal del individuo y el tono óptimo está situado a una cuarta
parte del tono más grave para los hombres y varias notas más abajo para las mujeres. Otro
método es mandarle bostezar y luego suspirar, el tono del suspiro es a menudo el tono óptimo.
El tono habitual o frecuencia fundamental (F0) se determina para saber si se usa el tono que le
corresponde según su edad y sexo. Si difiere dos o más tonos del tono óptimo debe iniciarse
una terapia vocal para modificarlo. Se obtiene mediante un analizador electrónico (Visi-Pitch) o
mediante programas informáticos de análisis acústico de la voz.
La frecuencia fundamental se relaciona con el tono de la voz que se percibe, siendo éste un
factor muy importante tanto desde un punto de vista sintomático como etiológico. Es el reflejo
de las características biomecánicas de las cuerdas vocales en tanto interaccionan con las
presiones subglóticas y en tanto se modifican por la estructura laríngea y la fuerza muscular
aplicada.
La frecuencia de vibración se influye por la longitud, masa y elasticidad de la cuerda vocal:
F = (elasticidad / masa)1/2
Curso de voz
La frecuencia fundamental nos da de esta forma alguna pista acerca de la normalidad de estas
variables. Los valores normales de la F0 son:
Hombres: 117 Hz +/- 30 Hz
Mujeres: 217 Hz +/- 35 Hz
Una aplicación clínica del análisis de la frecuencia es la determinación de la perturbación de la

frecuencia o jitter, que es la extensión o el alcance de cambios abruptos y rápidos en periodos
adyacentes de la onda de la frecuencia fundamental (Iwata y von Lenden, 1970). Es la
variabilidad a corto plazo de la frecuencia fundamental, es decir, cuánto difiere un periodo dado
de la onda del periodo que inmediatamente le sigue. Es la medida de las variaciones
involuntarias de la frecuencia. Si el sistema laríngeo fuese perfecto no existirían diferencias
entre un periodo y otro y la perturbación sería cero.
A mayor valor de perturbación existe una percepción más ronca de la voz.
Se mide fonando la vocal /a/ al menos 5 seg y se usa la siguiente fórmula:
ΔT = Tn - Tn+1
Siendo ΔT el incremento de T o perturbación, Tn la duración del periodo n en mseg y Tn+1 la

duración del periodo n+1 en mseg.
El ΔT en personas normales varía poco, desde -0.6 a +0.5 mseg.
Las mayores perturbaciones reflejan factores como asimetrías en la masa de las cuerdas, en el
control neural de la laringe, en la tensión de las cuerdas y en sus características biomecánicas.
La medida se realiza con programas informáticos y no es posible comparar los resultados de los
distintos programas ya que difieren en sus algoritmos de cálculo.
La perturbación se puede ver influida por la frecuencia e intensidad de la fonación, los valores
más altos de perturbación se relacionan con fonaciones de intensidad y frecuencia bajas,
Curso de voz
mientras que los valores de jitter más bajos se relacionan con fonaciones de intensidad y
frecuencia altas.
Los valores del jitter se pueden expresar de diferentes maneras:
• Jitter medio absoluto.- Es simplemente la diferencia media absoluta entre periodos

vocales secuenciales medida durante una fonación sostenida. Se expresa en
milisegundos.
• Jitter medio relativo y Razón de Jitter.- El valor anterior se divide entre el periodo vocal
medio para después multiplicar por 100, lo que da un porcentaje. Si se multiplica por
1000 se denomina Razón de Jitter y es adimensional.
Intensidad.
La intensidad es la correlación física del fenómeno perceptual del volumen vocal y refleja la
amplitud o fuerza con la que se produce el tono.
Para estudiar la intensidad a la que se habla, lo primero que hay que realizar es una
audiometría para determinar si existen pérdidas de audición que contribuyan a la producción de
una fonación demasiado intensa o demasiado débil.
La intensidad debe medirse con un sonómetro a 20 cm de la boca del sujeto, en una cámara
sonoamortiguada y expresarse en decibelios o nivel de presión sonora.
Los valores normales en el adulto presentan un rango entre 30 y 110 dB, siendo el nivel
habitual de conversación de 70-75 dB.
Cualquier condición patológica que afecte al cierre glótico, a la fuerza muscular, a la presión
subglótica o a la amplitud de la vibración, afectará a la intensidad.
Una forma subjetiva de valorar grosso modo si existe alguna alteración en la intensidad es
colocar al sujeto en distintos ambientes de ruido y ver su adaptación a los mismos
aprovechando el fenómeno de Lombard.
La perturbacion en la amplitud o shimmer se refiere a las variaciones en la amplitud a corto

plazo de ciclo a ciclo.
Curso de voz
Refleja asimetrías en las características de las cuerdas y se suele relacionar a las voces que
percibimos como ásperas. Sirve también como índice de estabilidad vocal, no debe ser mayor
de 0.7 dB o del 7% de la amplitud media. Como el jitter, el shimmer medio tiende a ser mayor
cuando existe patología vocal y cuando se produce una fonación a baja intensidad y baja
frecuencia. Se puede expresar de dos formas:
• Shimmer medio en decibelios. Es simplemente la media absoluta en dB de las

diferencias entre amplitudes vocales secuenciales medidas en una fonación sostenida.
• Shimmer medio percentual. Es el anterior dividido entre la amplitud media y
multiplicado por 100, lo que da un porcentaje.
Energía del ruido glótico.
Las voces patológicas presentan con frecuencia una cantidad excesiva de ruido turbulento que
se correlaciona estrechamente con el grado de la voz aérea percibida (breathiness). Esta
medida calcula la magnitud relativa de la energía del ruido laríngeo que se origina por un
defecto del cierre glótico causado por una enfermedad orgánica o funcional de la laringe.
Existen dos medidas del ruido glótico:
• Energía del ruido normalizada (NNE).

• Relación armónico/ruido (HNR).
La primera es más sensible que la segunda, con lo que es más útil para discriminar las voces
patológicas de las normales. Aunque la NNE no es el único parámetro relacionado con la
ronquera, se ha observado que es más importante que otros.
Análisis del timbre. Espectrografía
Analizar la calidad o el timbre de la voz no es fácil. El análisis propiamente dicho se realiza

primero en el oído, en la mayoría de los Centros Foniátricos es lo que más se utiliza, pero este
método es cualitativo y subjetivo, por lo que se presta a errores y su documentación no es
posible más allá de la realización de una grabación de la voz. Por ello es importante disponer de
análisis objetivos que permitan una cuantificación y una representación gráfica del timbre vocal.
Curso de voz
Para el análisis subjetivo del timbre vocal se recomienda el uso de los calificativos "escape",
"aspereza o tensión", "ronquera" y "vocal fry".
• El término escape describe al aire audible durante la fonación causado por un cierre
glótico insuficiente (vibración asincrónica de las cuerdas, parálisis de una de ellas o por
disponerse en paréntesis).
• La aspereza o tensión describe a la voz emitida con hipertensión de las cuerdas,
acústicamente corresponde a un sonido aperiódico en el transcurso del espectro y
resulta desagradable al oído. Puede estar causada por problemas neurológicos,
alteración de la masa o elasticidad de las cuerdas o bien por malos hábitos de la voz
como el ataque glótico duro.
• La ronquera se utiliza cuando hay una disfonía bien marcada al combinarse los dos
componentes antes descritos, se suele ver en cuadros neurológicos, alteraciones de la
masa, configuración y elasticidad de las cuerdas y en los edemas laríngeos.
• El vocal fry describe a una sonido semejante a la fritura, chasquido o crujido,
escuchado en la frecuencia más baja de la voz. En la voz normal se puede escuchar
cuando la entonación decae demasiado al final de las frases. Solamente se considera
un problema si aparece de forma frecuente. La etiología es diversa y con frecuencia
desaparece al elevar la altura e intensidad de la voz.
El análisis objetivo del timbre vocal se tiene que llevar a cabo por medio de la espectrografía de
la voz. La espectrografía se ha convertido en una técnica fácil, barata y potencialmente más útil
gracias a la sustitución de los antiguos métodos analógicos por los nuevos métodos basados en
la digitalización del sonido en ordenadores personales. Esto ha hecho que podamos realizar un
análisis en tiempo real en un entorno metodológico sencillo, sin embargo, la utilidad clínica
descansa principalmente en las modernas bases teóricas que correlacionan el producto acústico
con el comportamiento fisiológico, conocimiento que garantiza la correcta interpretación del
espectrograma.
El sonido se define como un disturbio causado en el aire. Es una vibración, entendiendo como
tal, el movimiento de vaivén de un cuerpo. La fuente de sonido vibra y transmite el sonido al
aire que es un medio elástico donde se propaga. En este medio se origina un patrón de
compresiones y rarefacciones de las partículas que lo componen. Conocido esto, el sonido se
describe como una onda o un movimiento ondulatorio.
El sonido se mueve como una onda longitudinal, o sea, que las partículas se mueven hacia
atrás y hacia delante en el sentido de la propagación del sonido. Si atamos un lápiz a una de las
ramas de un diapasón
Curso de voz
y lo hacemos vibrar se registra sobre un papel en movimiento una vibración sinusoidal. Como el
diapasón vibra a una única frecuencia, el patrón registrado en el papel es un sinusoide.
El gráfico que se originó se denomina onda y es la representación gráfica del sonido en dos
dimensiones: amplitud y tiempo
La onda así representada es especialmente importante puesto que el sinusoide es la onda

básica que puede ser usada como una especie de unidad en el análisis acústico (sonido
armónicamente simple).
Pero en la naturaleza no es posible encontrar sonidos armínicamente simples, sino que la

mayoría son sonidos armónicamente complejos, constituidos por una onda compleja que es un
tono que puede ser descompuesto en dos o más sinusoides o armónicos, como si fuese
generado por varios diapasones vibrando simultáneamente.
Curso de voz
Cada armónico es un sinusoide y los distintos armónicos de una onda compleja están
relacionados entre sí como enteros múltiplos. Por ejemplo, el tercer armónico de un tono de
100 Hz es 300Hz:
F3 = F0 X 3 ; F3 = 100 X 3 = 300 Hz
Hasta ahora hemos representado el sonido en un gráfico de amplitud versus tiempo que refleja
el desplazamiento de una molécula del aire durante la propagación del sonido. Otro método de
representar el sonido es el espectro, que es un gráfico de amplitud versus frecuencia.
El espectro nos indica la amplitud de cada componente sinusoidal de un sonido complejo.

Debemos notar que cada sinusoide solo viene representado por una línea en el espectro dado
que la energía sonora se concentra en una sola frecuencia. Cuantos más sinusoides se añadan
al sonido complejo más líneas aparecerán en el espectro.
La voz humana es un sonido complejo armónicamente rico y sus armónicos se hayan

espaciados por intervalos que corresponden a la frecuencia fundamental. Los armónicos son
múltiplos enteros de la fundamental, si el primero es de 100 Hz, el segundo es de 200 y el
tercero de 300.
Curso de voz
El sonido se puede representan tanto en forma de onda (amplitud vs tiempo) como en forma
de espectro (amplitud vs frecuencia). Las dos representaciones están matemáticamente
relacionadas por una operación denominada la transformación de Fourier. El análisis espectral
de Fourier tiene como objetivo básico convertir un patrón amplitud versus tiempo (onda) en un
patrón que muestre la cantidad de energía en los distintos componentes sinusoidales del
sonido. Así un sonido complejo se puede desintegrar en sus distintos componentes (armónicos)
para su estudio. Un espectro estará formado por la frecuencia en el eje horizontal y la
intensidad en el eje vertical.
El espectro laríngeo presenta una serie de armónicos cuya energía o amplitud declina cuanto
más agudo es el armónico en unos 12 dB por octava (12 dB cada vez que se doblan los Hz), el
espectro se representa en la figura.
Una vez producido el sonido en la laringe, viaja a lo largo del tracto vocal donde sufrirá un
filtrado, dando lugar a máximos relativos de intensidad en determinados armónicos, áreas que
se denominan formantes.Nota: Si se quiere profundizar en los aspectos físicos de los formantes
se recomienda la lectura de: 1. Bonavida A. Notas básicas de acústica vocal, en Diagnóstico y
Tratamiento de los Trastornos de la Voz, García Tapia R y Cobeta I (Eds.) Editorial Garsi, 1996.
2. Núñez F, Suárez C. Espectrografía clínica de la voz. Servicio de Public. de la Universidad de
Oviedo, 1999.
Al estar definida la vibración sonora por tres dimensiones: Amplitud, frecuencia y tiempo, puede
representarse gráficamente como si fuera un objeto real en un espacio de tres dimensiones.
En la figura
Curso de voz
(Bonavida, 1996) se representan tres sinusoides que representan la vibración de tres

diapasones al mismo tiempo dando lugar a un sonido complejo formado por tres armónicos. La
frecuencia más baja es considerada como el armónico fundamental (frecuencia fundamental) y
las otras dos el segundo y el tercer armónicos. Según el plano de proyección se obtendrán del
mismo objeto tres formas distintas de representación bidimensional:
A. OSCILOGRAMA (Wave form). El plano de proyección es el AMPLITUD versus TIEMPO.

El periodo puede apreciarse por la separación temporal de los máximos. Esta gráfica
permite observar, por ejemplo, en el caso de una vocal el periodo glotal y por tanto el
tono o pitch (frecuencia de la vibración glotal) y la amplitud de la señal (valor máximo),
entre otras características.
B. ESPECTROGRAMA (Power spectrum). El plano de proyección es el de AMPLITUD versus
FRECUENCIA. Las tres sinusoides proyectadas sobre este plano aparecen como un
conjunto de tres rayas verticales con sus correspondientes amplitudes en su correcta
posición y equidistantes en la escala de frecuencias.
C. SONOGRAMA (Sound Spectrogram). El plano de proyección es el de FRECUENCIA
versus TIEMPO. Las tres sinusoides representativas de la frecuencia fundamental y del
segundo y tercer armónico al ser proyectadas sobre este plano se convierten en líneas
paralelas al eje de tiempos.
El sonograma es la representación más completa de cualquier tipo de vibración, permite

explorar el contenido espectral de una señal en cada intervalo de tiempo y la presencia y
evolución temporal de las zonas de los formantes.
En la práctica se tiende a denominar "espectrograma" al sonograma. En un espectrograma de

banda estrecha se observarán unas líneas horizontales paralelas al eje de las Y, separadas
siempre por una distancia constante e igual a la frecuencia fundamental de la voz (que es la
Curso de voz
primera línea que observamos), por ello todas las demás líneas o armónicos serán múltiplos de
la primera.
Si se realiza el espectrograma de banda estrecha del diapasón vibrando , como es una

onda periódica simple, solo aparecerá una línea a la altura correspondiente a los Hz del
diapasón, en este caso a 512 Hz.
Se ha convenido en representar la intensidad que acompaña a cada armónico como la

intensidad en negro de su trazado, así, las líneas con una intensidad de negro más fuerte son
las que portan mayor intensidad. Entre un armónico y otro debe existir un vacío de trazado o
espacio en blanco, el ruido añadido a la vibración armónica se detecta por un trazado anárquico
y difuminada, tanto más intenso cuanto más negro sea su dibujo.
Curso de voz
Espectrografía de las voces aéreas
En este tipo de disfonías se crea un flujo aéreo turbulento debido al cierre glótico incompleto
durante el ciclo vocal o por un comportamiento vibratorio irregular. Se crean dos perturbaciones
en la señal acústica: la primera consiste en la aparición de componentes de ruido (señal no
periódica o de espectro contínuo) relacionados a dicho flujo aéreo turbulento y la segunda es
una pérdida de los armónicos de alta frecuencia debido a que la fase de cierre glótico del ciclo
vocal se encuentra acortada o es incompleta.
Según Yanagihara, las características acústicas de la disfonía se determinan por las

interacciones entre tres factores: 1. Componentes de ruido en el formante principal de cada
vocal. 2. Componentes de ruido de alta frecuencia encima de los 3 kHz. 3. Pérdida de
componentes armónicos de alta frecuencia. Con la progresión de la severidad de la disfonía,
estos tres parámetros se hacen más prominentes de una forma gradual, con lo que es posible
generar una clasificación en cuatro grados de severidad de una disfonía basándose en los
trazados de un espectrograma de banda estrecha:
• Grado I. Los componentes armónicos se mezclan con componentes de ruido

principalmente en la región de los formantes de las vocales.
Curso de voz
• Grado II. Los componentes de ruido predominan sobre los armónicos del segundo
formante. Además existen ligeros componentes de ruido de alta frecuencia por encima
de los 3 kHz.
• Grado III. El segundo formante se reemplaza en su totalidad por ruido. El componente

de ruido de alta frecuencia intensifica su energía y expande su rango.
Curso de voz
• Grado IV. El primer formante pierde sus componentes periódicos y se observan

componentes de ruido. En las altas frecuencias se intensifica aún más el ruido.
Esta clasificación es de utilidad en la clínica por dos motivos principales: Por permitir
expresar numéricamente una cualidad multidimiensional de la voz, tradicionalmente
difícil de calificar de otra manera y porque el grado acústico objetivo de la disfonía se
ha visto que se relaciona con la gravedad subjetiva que se percibe al oido.
Espectrografía de las voces tensas o ásperas de forma continua

Curso de voz
Mientras que en la voz espirada predomina la presencia de un flujo aéreo turbulento generado
por un insuficiente cierre glótico, en la voz áspera predominan las irregularidades en la
vibración vocal causadas por un desequilibrio en la masa o tensión entre ambas cuerdas.
Omori et al. describieron la presencia de una anormalidad acústica diferente que afecta
principalmente a los casos de disfonía generada por pólipos o edema de Reinke. Esta
anormalidad acústica está representada en el sonograma por trazados diferenciados de
pequeña magnitud que se sitúan entre dos armónicos consecutivos en el sonograma de banda
estrecha que se denominan subarmónicos.
Se considera que se hallan presentes cuando se observa la existencia de trazados horizontales

diferenciados entre dos armónicos múltiplos de la frecuencia fundamental, definida como el
primer trazado que aparece en el espectro. Para saber que dichos trazados no son múltiplos de
la frecuencia fundamental se obtiene su valor en Hz mediante el cursor de pantalla que nos
permite conocer el punto del espectro en que nos encontramos. Su presencia en el trazado
espectrográfico es variada:
• Pueden ocupar la totalidad de la muestra
como en esta voz de una disfonía plicae ventricularis que se percibe como clara
diplofonía.
• Pueden ser más de uno

Curso de voz
en este caso se muestra un espectrograma donde se aprecian dos subarmónicos (con

una frecuente 1/3 de la F0) en un caso de prolapso de ventrículo.
• Pueden estar presentes en puntos concretos de la misma, coincidiendo con breves

fragmentos de voz cualitativamente distintos del resto, en forma de voz áspera
como en este caso de edema de Reinke cuyo análisis acústico dió un jitter y un
shimmer normales.
Espectrografía de las voces tensas o ásperas con interrupciones intermitentes

arrítmicas.
Curso de voz
Lo primero que llama la atención es el hecho de que su presencia no es constante en toda la

muestra en la mayoría de los casos, sino que está determinada por fragmentos de voz
cualitativamente distintos del resto, que perceptivamente corresponden a las roturas de voz o a
fragmentos de fonación especialmente esforzados, el caso más característico es el de una
disfonía espástica adductora en la que los subarmónicos se encuentran en las fases del
espasmo vocal
aunque también se pueden encontrar trazados que detectan los espasmos sin que tengan que
existir subarmónicos necesariamente
.
Curso de voz
Espectrografa de las voces tensas o ásperas con interrupciones rítmicas y del

temblor vocal
Se presentan en conjunto estos dos tipos de voces por presentar similares características
espectrográficas. El temblor vocal consiste en una fluctuación de la intensidad y tono de la
fonación de forma regular
que en su forma más severa pueden causar roturas de voz con descenso súbito del tono o
interrupciones bruscas en la producción vocal, que se corresponden con una disfonía espástica,
tanto adductora como abductora. En estos pacientes se ha observado la existencia de un
movimiento irregular y entrecortado de los músculos intercostales interno y externo que muy
probablemente es el responsable de las fluctuaciones en intensidad y en tono. Las
interrupciones en la fonación se han atribuido a la existencia de cierres espasmódicos de la
glotis, pero también puede ser cierto que ocurra el fenómeno opuesto, una súbita distensión de
las cuerdas vocales.
Limitaciones del análisis acústico
En los últimos años, de la mano del desarrollo de la informática, han salido al mercado
diferentes programas de análisis de la voz. Estos paquetes por lo común integran herramientas
para poder realizar el análisis acústico de la voz y la espectrografía.
El análisis acústico se basa principalmente en la cuantificación de las perturbaciones de la

amplitud (Shimmer) y el tono (Jitter) y de la relación armónico/ruido.
El uso de esta herramienta presenta problemas:
• No es posible comparar los resultados obtenidos entre distintos programas debido a

que los algoritmos de cálculo que emplean suelen ser diferentes.
Curso de voz
• Los resultados que se expresan numéricamente son difíciles de interpretar si no se

comparan con una base de datos de voces normales y patológicas que incluye el
programa y que suelen pertenecer a sujetos que hablan otro idioma.
• No existe fiabilidad en el análisis de voces extremadamente aperiódicas. Las medidas
de perturbaciones menores del 5% suelen ser fiables, sin embargo, las superiores al
7% deben ser cuestionadas, por lo que se precisa de un control visual de la definición
periódica de la señal (oscilograma).
Por el contrario, la espectrografía carece de estos problemas:
• Crea un gráfico en el que se representan los armónicos y formantes en el espectro y en

el que el ruido añadido por la patología vocal se observará de forma nítida, sin que
tengamos que ayudarnos de bases de datos para su interpretación.
• Es absolutamente comparable entre los distintos programas disponibles. Creemos de
mucha mayor utilidad para la evaluación de los resultados terapéuticos el empleo del
espectrograma de banda estrecha que la clasificación de la voz que hace el programa
basándose en su base de datos de voces normales y patológicas.
• Es útil para el estudio de las voces sin periodicidad o creadas por patrones caóticos de
vibración de las cuerdas vocales. Por muy patológica que sea la voz siempre se
dispondrá de un gráfico en el que veremos representado el ruido, los armónicos, los
subarmónicos y los segmentos vacíos de señal.
Por estas razones, encontramos de enorme utilidad el uso del espectrograma de banda
estrecha en nuestro Laboratorio de Voz, de cuyo archivo de voces se han extraído los siguientes
ejemplos:
1. Paciente de 26 años de sexo masculino que sufrió una sección del nervio vago izquierdo
a consecuencia de la resección de una fibromatosis agresiva cervical. En la
estroboscopia se observa una parálisis vocal izquierda en abducción. Se nos remite para
valorar una tiroplastia tipo I:
• Espectrograma de banda estrecha preoperatorio correspondiente a un tipo IV
de Yanagihara.
Curso de voz
• Espectrograma durante el test de compresión lateral de la laringe, como prueba

preoperatoria que predice que existen probabilidades de mejoría de la fonación
con la tiroplastia. Se observa la aparición de armónicos bien estructurados,
mezcla de ruido y un bajo tiempo máximo de fonación, al mismo tiempo que se
oye una voz más potente y mejor timbrada.
• Espectrograma postoperatorio, se observa la recuperación de los armónicos y el

descenso en la intensidad del ruido, la voz es prácticamente normal en cuanto
a intensidad y timbre.
Otro ejemplo de espectrograma antes y después de un tratamiento. En este caso se

observa una mejoría de la voz en una mujer de 50 años con edema de Reinke tras dos meses
de abandono del hábito tabáquico.
• Espectrograma en la primera visita. Grado III de Yahagihara
Curso de voz
• Espectrograma después de dejar de fumar. Grado I de Yanagihara, al

observarse que ha recuperado los armónicos en el segundo formante
El temblor vocal y fluctuaciones similares de la intensidad y el tono de la voz pueden

monitorizarse únicamente con la espectrografía, aquí vemos el espectrograma de una disfonía
espástica adductora antes y después del tratamiento con inyección de toxina botulínica.
• Espectrograma antes del tratamiento
Curso de voz
• Espectrograma tras la inyección de toxina botulínica.
Es importante tener claro el objetivo del análisis acústico de la voz y comprender sus
limitaciones, el lugar que debe ocupar se podría comparar con la audiometría en el estudio de
la patología del oído: De forma aislada no puede hacernos llegar a un diagnóstico específico,
como tampoco nos evitaría realizar una otoscopia. De la misma manera, el análisis acústico de
la voz no sustituye a la laringoscopia ni puede diagnosticar de forma precisa el trastorno vocal
que genera la disfonía estudiada. En los siguientes ejemplos se observa que el espectrograma
es muy similar aunque las patologías son netamente diferentes:
• Cicatriz vocal.
Curso de voz
• Disfonía infantil.
• Quiste vocal.
.
Curso de voz
• Sulcus vocalis (Vergeture).
• Carcinoma de cuerda vocal.
• Tuberculosis laríngea.
Curso de voz
Otras aplicaciones de la espectrografía
También se aplica esta técnica en otros ámbitos distintos como puede ser en la biología,
música, etc:
• Espectrograma de los sonidos emitidos por una orca (Keiko, la de "Liberad a Willi").
• Espectrograma de sonidos de ballenas.

Curso de voz
• Espectrograma del sonido de un violín.
• O, emisiones vocales humanas más complejas.
.
Curso de voz
PROTOCOLO BASICO PARA LA VALORACION FUNCIONAL DE LA PATOLOGIA VOCAL
Ver documento "Protocolo Básico Voz"
El propósito de este protocolo básico es el de alcanzar un acuerdo y uniformidad en cuanto a la

metodología para la valoración funcional de la patología vocal adaptando el publicado por el
Comité de Foniatría de la European Laryngological Society (ELS) (1).
El fin de la normalización de los procedimientos de estudio de la disfonía es el de permitir

comparaciones relevantes con la literatura a la hora de presentar o publicar los resultados de
un tratamiento vocal, o un nuevo procedimiento para el estudio de la patología vocal. Los meta-
análisis de los resultados de los tratamientos vocales son en general limitados, cuando no
imposibles de realizar debido a la gran heterogeneidad en la valoración de los resultados
funcionales. La ELS ha propuesto un conjunto mínimo multidimensional de parámetros con el
fin de estudiar las disfonías que incluye 5 herramientas: percepción, videoestroboscopia,
acústica, aerodinámica y autovaloración por parte del paciente. La instrumentación para llevar a
cabo estos estudios se ha intentado limitar a aquella considerada como esencial para el
profesional que realiza fonocirugía.
Los principios básicos que han servido de guía para la elaboración de este protocolo son:
1. La función vocal es multidimensional.

2. Se precisa de un conjunto mínimo de requerimientos básicos para la presentación de
los resultados de los tratamientos vocales con el fin de permitir comparaciones y meta-
análisis.
3. Se sigue animando a utilizar nuevas y más sofisticadas metodologías en la evaluación
vocal pero se debe completar el conjunto mínimo en todos los casos, para permitir
comparaciones.
4. Las recomendaciones pueden ser aplicadas para casi todos los tipos de alteraciones
vocales, pero un reducido grupo de trastornos específicos necesitarían de un protocolo
adaptado para ellos con el fin de incrementar su sensibilidad: las voces de sustitución
(las no generadas por las cuerdas vocales) y la disfonía espasmódica.
5. En el conjunto básico de parámetros o "troncus communis" para la valoración de las
disfonías se deben considerar los siguientes componentes. Todos ellos ofrecen
resultados cuantitativos:
• Percepción
• Videoestroboscopia
• Acústica
• Aerodinámica y eficiencia
• Autoevaluación por el paciente Ver documento "Validación del VHI"
Cada uno de los anteriores ítems tiene su propia relevancia específica consiguiéndose
así una visión multidimensional de la voz estudiada.
Prerrequisito: la grabación de la señal vocal
La grabación de audio es la herramienta básica más valiosa de la valoración de
la voz. Una vez obtenida una grabación de calidad puede ser almacenada permitiendo
posteriores investigaciones sobre ella como puede ser una evaluación perceptual ciega
o análisis acústicos sofisticados. Es esencial conservar las grabaciones como archivos
Curso de voz
con el fin de poder recuperarlos con facilidad. Los sistemas de análisis acústico
comercialmente disponibles graban directamente la señal, la digitalizan y la guardan
apropiadamente en los ordenadores donde están instalados. Se recomienda
configurarlos con el fin de que las grabaciones tengan una frecuencia de muestreo de
20.000 Hz. Se deben llevar a cabo de forma ideal en una habitación sonoamortiguada o
en su defecto conseguir un ruido ambiente menor de 50 dB. La distancia de la boca al
micrófono precisa de ser constante a 10 cm, y colocándolo con un ángulo de 45 a 90º
para reducir el ruido aerodinámico de la boca durante el habla.
Muestra a grabar
Una grabación estándar puede consistir en:
• /a:/ en un tono e intensidad cómodos, grabado en tres intentos con el fin de evaluar si
existe variabilidad en la calidad vocal.
• /a:/ ligeramente más intensa, con el fin de evaluar posibles cambios en su calidad.
• Una frase sencilla o un corto pasaje literario estándar.
Para la selección fonética de la frase o pasaje hay que tener en cuenta que contenga
una vocalización constante y esté libre de fricativas para no sesgar el cálculo de la
relación armónico-ruido.
Un pasaje para su lectura y grabación podría ser el siguiente, extraído de la obra

"Platero y yo" de Juan Ramón Jiménez: "Platero es pequeño, peludo, suave; tan blando
por fuera, que se diría todo de algodón, que no lleva huesos. Sólo los espejos de
azabache de sus ojos son duros cual dos escarabajos de cristal negro".
1. Percepción.
Se propone usar el término "disfonía" para designar cualquier clase de patología vocal
percibida: la alteración puede referirse al tono o intensidad, así como al timbre o características
rítmicas o prosódicas. El término "ronquera" se recomienda limitarlo para designar las
alteraciones de la calidad vocal o timbre, y excluye el tono, intensidad y ritmo. La calificación de
la ronquera se realiza a partir del habla conversacional escuchada durante la anamnesis del
paciente, La severidad de la misma se cuantifica bajo el parámetro G (Grado) de la escala
GRABS propuesta por Hirano: califica la calidad vocal global, integrando todos los componentes
alterados.
Se han identificado dos componentes principales de la ronquera: La calidad aérea (B:

Breathiness), que es la impresión audible de la pérdida de aire turbulento a través de una glotis
insuficientemente cerrada y la aspereza (R: Roughness), que es la impresión audible de pulsos
glóticos irregulares, fluctuaciones anormales en la F0 o impulsos percibidos por separado (vocal
Curso de voz
fry), incluye la diplofonía y las roturas de voz. Cuando está presente la diplofonía debe
registrase como "d".
Estos parámetros han mostrado la suficiente fiabilidad (reproductividad inter e intraobservador)

en la clínica. Los parámetros que describen el comportamiento vocal "astenia" y
"tensión" (asthenicity, strain: A y S)son considerados como menos fiables en la actualidad y han
sido omitidos del protocolo básico.
Para la calificación, se recomienda el empleo de una escala de cuatro puntos (0 = normal o

ausencia de alteración, 1 = ligeramente alterado, 2 = moderadamente alterado y 3 =
severamente alterado), pero es posible calificar sobre una escala analógico visual de 100 mm.
Enlace a documento explicativo
2. Videolaringoestroboscopia.
La Videolaringoestroboscopia es la principal herramienta clínica para el diagnóstico etiológico de

los trastornos de la voz. Es utilizada para estudiar la calidad de la vibración vocal, por lo que
también valora la efectividad de los tratamientos. La pertinencia de los parámetros
estroboscópicos se basa en la combinación de fiabilidad (reproductividad inter e
intraobservador), no redundancia y sentido clínico (relación con los conceptos fisiológicos). Los
parámetros básicos son:
• Cierre glótico: gradación cuantitativa usando una escala de cuatro puntos o una escala
analógico-visual de 100 mm. Se recomienda que se especifique el tipo de defecto de
cierre glótico (longitudinal, dorsal, ventral, irregular, oval o en reloj de arena).
• Regularidad: gradación cuantitativa del grado de irregularidad presente en la onda
mucosa percibido con el estroboscopio.
• Onda mucosa: gradación cuantitativa de la onda mucosa, representación de la fisiología
de la estructura en capas de las cuerdas.
• Simetría: gradación cuantitativa del movimiento "especular" de ambas cuerdas.
Generalmente la asimetría está causada por limitaciones en la actividad vibratoria de
una lesión (cicatriz difusa, quiste, leucoplasia).
Cada parámetro estroboscópico debe puntuarse con la escala de cuatro puntos o la analógico-
visual. Esta exploración se puede documentar por medio de su grabación en video.
Se recomienda observar y grabar las imágenes estroboscópicas en diferentes modos de

fonación (el grado del cierre glótico generalmente aumenta con el aumento de la intensidad),
sin embargo, esta gradación básica se refiere a fonación en tono e intensidad cómodas. Para
permitir comparaciones entre distintas exploraciones del mismo paciente, se recomienda utilizar
el mismo tipo de endoscopio (rígido o flexible, si rígido: el mismo ángulo).
Curso de voz
3. Aerodinámica.
El parámetro aerodinámico más simple de la fonación es el tiempo máximo de fonación (TMF)

en segundos. Consiste en la prolongación de la /a:/ lo más posible tras una inspiración máxima,
en un tono e intensidad cómodos. Es una de las medidas clínicas de la valoración de la voz más
utilizadas. Se precisa una demostración previa y se realizan tres intentos, seleccionando el más
prolongado para compararlo con la norma. Para eliminar posibles sesgos debidos a una
capacidad respiratoria de soporte del paciente que compense un defecto de cierre glótico se
puede recurrir a calcular la siguiente relación (flujo aéreo promediado o Cociente de Fonación =
PQ):
PQ = CapacidadVital(ml)/TMF(seg)
La capacidad vital (CV) se define como el volumen de aire intercambiado en la boca entre la
posición de inspiración máxima y la espiración completa. Se puede cuantificar de forma fiable
usando un espirómetro de mano. La CV depende de factores antropométricos, especialmente
del peso.
4. Acústica.
Los parámetros acústicos son medidas objetivas y no invasivas de la función vocal. Están
disponibles a precios accesibles y han sido aplicados con éxito en la monitorización de los
cambios en la calidad vocal a lo largo del tiempo. Las medidas de perturbación (en periodo y
amplitud) así como los cálculos de la relación armónico-ruido parecen ser las medidas más
robustas y determinan los elementos preceptúales básicos de la calidad vocal: grado, aspereza
y calidad aérea. La limitación general de los sistemas empleados para el análisis acústico es que
no pueden, al menos de manera fiable, analizar señales fuertemente aperiódicas. Las medidas
de la perturbación, siempre que sean menores del 5% se tienen por fiables. Sin embargo, en la
actualidad, existe una estandarización insuficiente de los algoritmos óptimos para el cálculo de
la relación señal-ruido (NNE: energía de ruido normalizada, HNR: relación armónico-ruido). De
esta manera, jitter % y shimmer % son los parámetros propuestos como medidas acústicas
básicas, para analizar señales vocales obtenidas de la /a:/ sostenida en intensidad y tono
cómodos. El jitter es calculado como la diferencia media entre periodos de ciclos vocales
adyacentes dividida por el periodo medio. Es, por tanto, una medida derivada de la F0
(frecuencia fundamental de la voz). Para el shimmer, se realiza un cálculo similar sobre las
amplitudes pico a pico. Obviamente, para permitir comparaciones pre y postratamiento se
requieren similares técnicas y materiales.
También incluido es este apartado de medidas acústicas está el fonetograma, concretamente 3

puntos críticos del mismo: la frecuencia más alta y la intensidad mínima (dB A a 30cm) son los
dos puntos más sensibles a los cambios en la calidad vocal, estando la segunda relacionada con
la presión umbral mínima de fonación. Si a estos dos puntos sumamos la frecuencia mínima ya
se puede calcular el rango de la frecuencia fundamental. Este fonetograma de tres puntos se
Curso de voz
puede obtener sin completar todo el perfil vocal que precisa mucho tiempo. Sin embargo, estos
tres puntos representan producciones vocales extremas, y son, como el TMF y la CV, muy
sensibles al aprendizaje y a los efectos del cansancio.
5. Autoevaluación por el paciente.
Esta evaluación de la voz, aunque subjetiva por definición, es de mucha importancia en la

práctica clínica diaria. Es el paciente el que vive con su voz y está influenciado por los aspectos
culturales y sociales que son relevantes para la voz en su medio. Esta evaluación necesita de
una cuantificación cuidadosa y se precisa comparar y correlacionar con los datos de la
valoración objetiva. El objetivo básico es el de diferenciar la calidad vocal alterada y la
severidad de la incapacidad o minusvalía en la vida diaria social y profesional. Se puede calcular
un índice de incapacidad vocal basándose en las respuestas del paciente a un conjunto de
preguntas cuidadosamente elaborado: además de los aspectos ya mencionados, también
investiga la posible repercusión emocional de la disfonía. Sin embargo, para el protocolo básico
se recurre a una evaluación subjetiva mínima por parte del paciente sobre una doble escala
analógico-visual de 10 cm: la impresión acerca de la calidad vocal y la impresión acerca de las
repercusiones que la alteración vocal tiene en su vida diaria social y profesional. El extremo
izquierdo de la escala o cero se relaciona con la voz normal y el extremo derecho o 10 con la
voz extremadamente alterada.
Ejemplo de una valoración con el protocolo básico propuesto:
Mujer de 26 años con nódulos vocales, antes del tratamiento.
PERCEPCION: G34 B52 R18d
ESTROBOSCOPIA: Cierre 40 (reloj de arena), Reg 10, Onda 25, Sim 0.
AERODINAMICA: PQ 285 ml/s (TMF 13 seg).
ACUSTICA: Ji 1.2%, Shi 6.1%, F0-rango: 131-392 Hz, intensidad min: 53 dB(A) 30cm.
EVALUACION SUBJETIVA: Voz30, Dis50.
Explicación:
Percepción: Se califica por medio de 3 escalas analógicas de 100 mm. 0 significa normal y 10
extremadamente alterado. Está presente diplofonía (d).
Estroboscopia: Se califica sobre 4 escalas de 10 cm: cierre, regularidad, onda mucosa y

simetría. Para el cierre, si es patológico, se recomienda especificar su forma: en este caso es en
reloj de arena. La simetría es normal en este caso.
Curso de voz
Aerodinámica: El cociente de fonación en ml/seg y el TMF. La capacidad vital fue de 3705 ml.
Acústica: Jitter % y shimmer %, con el rango de la F0.
Evaluación subjetiva: La paciente calificó su calidad vocal como 30 sobre 100 (leve a
moderada), mientras que la impresión acerca de las repercusiones es de 50 sobre 100
(moderada a severa).
Conclusión
La instrumentación precisa para completar el protocolo básico es la mínima, pero es la que se

considera esencial para los profesionales que realizan fonocirugía.
En resumen, 2 de las dimensiones son objetivas: aerodinámica y acústica, 2 son objetivas pero
calificadas subjetivamente por el examinador: percepción de la voz grabada y estroboscopia, y
una dimensión es totalmente subjetiva: la autoevaluación por el paciente.
El documento original se puede encontrar en:
• Dejonckere PH. A basic protocol for functional assessment of voice

pathology.






Curso de voz

1: 6-11.
92.
3. TRATAMIENTO
Principios Básicos de la Fonomicrocirugia
En los últimos años hemos asistido a la aparición de una serie de innovaciones técnicas en la
microcirugía laríngea. Estas novedades son consecuencia directa del conocimiento de la
estructura histológica de la superficie vibrátil de las cuerdas vocales, de la comprensión de los
principios fisiológicos de la producción de la voz y del empleo del estroboscopio en la valoración
preoperatoria de la disfonía.
El término fonomicrocirugía apareció en 1994 para hacer referencia a las técnicas quirúrgicas de
la microcirugía laríngea dirigidas a mejorar o restaurar la voz por medio de la resección de las
lesiones que la alteran, preservando al máximo la microestructura de la cuerda vocal, en
especial el epitelio y la lámina propria. Quedan fuera de este término las técnicas
transcervicales abiertas de la fonocirugía.
Sin duda, el aspecto esencial de la cirugía, al que no es ajena la fonomicrocirugía, es la

adecuada valoración preoperatoria del trastorno. Las indicaciones quirúrgicas se contemplarán
en los casos que presenten una disfonía continua a pesar de haber agotado las opciones
médicas y rehabilitadoras (Enlace a documento explicativo).
Consentimiento Informado
Curso de voz
Enlace a documento explicativo 1
Enlace a documento explicativo 2
Es imprescindible informar exhaustivamente al paciente, no solo desde el punto de vista del

imperativo legal sino también desde el ético.
• Explicar los objetivos de la cirugía y asegurarse de que sus expectativas son realistas.
• Advertir que existe el riesgo de empeorar la calidad de la voz. Nunca garantizar que se
recobrará la voz normal.
• Informar de que, en ocasiones, el periodo postoperatorio es prolongado, así como la
rehabilitación y el uso moderado de la voz.
• Indicar que algunos pacientes presentan la necesidad de eliminar comportamientos
vocales de abuso mediante la logopedia preoperatoria.
Laringoscopia Directa
La primera descripción del método para exponer las cuerdas vocales se debe a Green que en
1852 extirpó una masa polipoidea del vestíbulo laríngeo usando una espátula con iluminación
natural. La técnica no se reprodujo hasta que Kirstein en 1895 la redescubrió al destacar la
importancia del uso de una fuente de luz artificial para llevar a cabo la laringoscopia directa,
gracias a lo que la técnica se extendió internacionalmente. Posteriormente, la técnica ganó en
precisión al introducir Kleinsasser el uso del microscopio quirúrgico que permite trabajar con
visión binocular, mejor iluminación y magnificación de las estructuras.
En las primeras décadas del siglo XX se desarrollaron los cinco principios básicos para conseguir
la visualización adecuada de la porción músculo-membranosa de las cuerdas vocales mediante
la laringoscopia directa:
1. Posición adecuada de la cabeza y el cuello. Se consigue flexionando el cuello hacia el

tórax y extendiendo la cabeza en la articulación occípito-atloidea (figura original de
Jackson).
Curso de voz
From Jackson and Jackson: Bronchoscopy, Esophagoscopy and Gastroscopy.
2. Contrapresión laríngea externa. Presión dirigida en el sentido antero-posterior con el

objeto de llevar el esqueleto laríngeo hacia atrás, como se observa en esta figura
original de Killian.
Curso de voz
Zeitels SM. Premalignant epithelium and microinvasive cancer of the vocal fold: The
evolution of Phonomicrosurgical Management. Laryngoscope 1995; 105, suppl Nº 67.
3. Adaptación de la forma del laringoscopio a la configuración triangular de la glotis. Es el

concepto de la “V-invertida” (figura original de Killian).
Curso de voz
4. Suspensión laríngea independiente para liberar las manos del cirujano.
5. Distensión laríngea interna. Consiste en la distensión de las estructuras supraglóticas

hacia la periferia con el fin de obtener la visión más amplia posible de las cuerdas
vocales.
Principios de la Técnica Quirúrgica
El objeto de la técnica es erradicar de la práctica la decorticación de las cuerdas vocales como

método para tratar sus lesiones benignas. Antes de conocer la importancia de la integridad de
la cubierta de la cuerda en la calidad de la voz, el objetivo de la cirugía era establecer un borde
libre rectilíneo, sin importar que el ligamento quedase denudado de mucosa y cicatrizara por
segunda intención. Así, con los conocimientos actuales, se deben tener en cuenta las siguientes
recomendaciones:
1. Respetar la integridad tisular de la cuerda. Evitar el daño a la mucosa sana, en especial

la que cubre el borde libre. Si se actúa en la comisura anterior se debe estar seguro de
que al menos una de las cuerdas conserve su cubierta mucosa para evitar sinequias.
2. No traccionar excesivamente las lesiones muy localizadas con el fin de que al resecarlas
no se origine una muesca en el borde libre de la cuerda.
Curso de voz
3. Extirpar las lesiones con instrumentos cortantes, de manera que se conserven la

mucosa normal y el ligamento vocal para evitar cicatrices. Esto se consigue mediante el
empleo de las microtijeras, en lugar de arrancar las lesiones con las micropinzas.
4. Emplear la técnica de la cordotomía de manera apropiada con el fin de evitar la
cicatrización por segunda intención.
Incisiones, Microcolgajos y Planos de Disección
La premisa de extirpar las lesiones con el mínimo daño sobre los tejidos sanos de las cuerdas
vocales ha sido el determinante del desarrollo de la técnica de la cordotomía, que consiste en la
disección caudal tangencial de la cubierta de la cuerda utilizando el plano de la lámina
superficial de la lámina propria.
Zeitels SM. Premalignant epithelium and microinvasive cancer of the vocal fold: The evolution of
Phonomicrosurgical Management. Laryngoscope 1995; 105, suppl Nº 67.
El objetivo es eliminar la lesión sin dañar el epitelio que la cubre ni el ligamento vocal
subyacente. Así, esta técnica se emplea principalmente para la extirpación de lesiones
submucosas (quistes y edemas), aunque en ocasiones se indica para explorar la cuerda.
Existen dos variantes de cordotomía:

Curso de voz
Zeitels SM. Premalignant epithelium and microinvasive cancer of the vocal fold: The evolution of
Phonomicrosurgical Management. Laryngoscope 1995; 105, suppl Nº 67.
1. Con microcolgajo lateral. Aunque descrita inicialmente como la única forma de realizar
la cordotomía, en la actualidad se usa para los casos en que la lesión es difusa o de
grandes proporciones o para las ocasiones en que se sospecha una identificación difícil
del ligamento vocal (cuerdas cicatriciales). La intervención comienza con una incisión en
la cara superior de la cuerda, cercana al ventrículo. Se introduce un disector en la
incisión para elevar un colgajo mucoso a través de la capa superficial de la lámina
propria. Con el mismo instrumento se diseca la lesión del colgajo mucoso y del
ligamento vocal o bien se aspira el edema. Una vez extirpada la lesión o aspirado el
edema se repone el colgajo sobre el ligamento vocal intacto sin que sea necesario el
uso de adhesivos tisulares o suturas.
Curso de voz
Curso de voz
Para facilitar la disección del ligamento o cuando se precise la resección de epitelio se

puede emplear la técnica de inyección submucosa de suero salino con epinefrina.
2. Con microcolgajo medial. Con esta técnica la incisión se emplaza en la parte medial de
la cara superior de la cuerda limitándola en longitud a las dimensiones de la lesión a
extirpar. Se prefiere usar en las situaciones en las que: 1) las lesiones afecten
únicamente la cara medial de la cuerda, 2) la mucosa que cubre la lesión sea muy fina,
3) exista una mucosa redundante, o 4) aparentemente sea sencillo despegar la lesión
del ligamento vocal. El empleo de esta variante de la cordotomía se justifica en que no
solo respeta al ligamento vocal sino que se deja intacta la capa superficial de la lámina
propria que no está afectada por la lesión, minimizando el riesgo de que se origine una
fibrosis cicatricial.
Instrumentos Quirúrgicos
Aparte de la adecuada dotación de material necesario para la laringoscopia directa,
es importante contar con un mínimo de instrumentos diseñados expresamente para la

fonomicrocirugía. En muchas ocasiones las cajas de microcirugía laríngea solamente cuentan
con pinzas de biopsia para retraer la mucosa, lo que dificulta enormemente la técnica de la
cordotomía.
Los microinstrumentos tienen 22 cm de longitud

Curso de voz
y la mayoría son pares simétricos con terminal hacia la derecha y hacia la izquierda. Los
instrumentos más útiles son (similar a la presentación del instrumental en el curso de cirugía
menor):
• Micropinzas curvas.
• Micropinzas triangulares, diseñadas para manejar con delicadeza el borde de la incisión

de cordotomía sin desgarrarlo.
• Microtijeras curvas.
• Disectores romos.
• Bisturí lanceolado.
Curso de voz
Zeitels (1996) demostró que para la resección de lesiones pequeñas es más apropiado el uso de
los instrumentos de corte convencionales, reservando el uso del láser para lesiones
supraglóticas o para lesiones de grandes dimensiones en las que el sangrado pueda dificultar el
reconocimiento de la microanatomía de la cuerda vocal.
Variantes de la Técnica
• Cirugía mediante laringoscopia indirecta. Consiste en resecar lesiones del borde libre de
las cuerdas con anestesia tópica en la consulta bajo el control visual que proporcionan
las distintas técnicas de la laringoscopia indirecta. Bastian la utiliza para la biosia de
lesiones malignas, inyección intracordal de teflon, gelfoam o toxina botulínica, sección
de sinequias glóticas y resección de granulomas. Mahieu la realiza con control
estroboscópico para extirpar exclusivamente lesiones de escaso volumen. Sin embargo,
Zeitels opina que esta técnica soslaya las innovaciones introducidas en la cirugía vocal,
es imposible la manipulación bimanual precisa de los tejidos, no se pueden crear
microcolgajos y el campo operatorio es móvil e inestable. Recomienda evitarla por la
imprecisión general del método y por promover la cicatrización por segunda intención.
No obstante, estaría indicada en:
• Las situaciones clínicas que impidan la anestesia general o se rechace la misma
por el paciente, siempre que las lesiones no sean voluminosas.
• La toma de biopsia de una neoplasia.
• Cuando no sea posible exponer la laringe con la laringoscopia directa.
Cirugía mediante el sistema videotelescópico. La innovación tecnológica de este sistema
consiste en sustituir el microscopio quirúrgico por el uso de un telescopio de 4 mm tipo Hopkins
que se adapta al tubo del laringoscopio y está conectado a una cámara de vídeo.
Curso de voz
Se realiza una laringoscopia directa por suspensión y se opera mirando a través del
monitor. Las ventajas que este método introduce respecto al uso del microscopio
quirúrgico son:
• Profundidad de campo. Elimina la necesidad de reenfocar una vez que se

posiciona el sistema de endoscopia. La profundidad de campo es
significativamente mayor que la que proporciona el microscopio, permitiendo
observar con nitidez y “foco” desde la punta del laringoscopio hasta la
subglotis.
• Campo de visión. El campo es más extenso debido a que la imagen óptica se
obtiene desde el extremo distal del laringoscopio, no desde el extremo proximal
(donde se emplaza el microscopio).
Curso de voz
• Instrumentación. Facilita la manipulación instrumental por crear un campo

visual sin la obstrucción del microscopio.
• Documentación. Se puede grabar el procedimiento directamente.
• Comodidad quirúrgica al operar desde una distancia óptima sin tener que
observar a través de los oculares del microscopio.
• Se facilita la docencia por el monitor.
Reposo Vocal Postoperatorio
Enlace a documento explicativo
Reposo Vocal
Hidratación Vocal
La mayoría recomienda guardar reposo vocal de 1 a 7 días después de la fonocirugía. La

recomendación del reposo de voz está basada en la creencia de que evita traumatizar las
estructuras recién intervenidas, pero no existen evidencias objetivas que la sustenten. Ford
recomienda 24 horas de reposo vocal relativo. Aún respetando esta recomendación
escrupulosamente las cuerdas siguen estando sometidas a fuertes adducciones durante la
deglución y otras actividades de cierre laríngeo no relacionadas con la fonación.
El reposo vocal si parece ser beneficioso para la recuperación de la voz en una laringitis aguda,
una hemorragia submucosa de la cuerda y otras alteraciones graves de la fonación.
Curso de voz
Si se recomienda un reposo vocal prolongado puede provocar estados de ansiedad que

obstaculizan la rehabilitación o inducen la aparición de mecanismos compensatorios indeseables
como una fonación con bandas o el excesivo empleo de la musculatura extralaríngea.
Se ha visto el desarrollo de disfonías secundarias en pacientes que han guardado reposo vocal
de solo una semana tras una intervención de nódulos vocales atribuibles a una causa psicógena
o por debilitamiento de las cuerdas vocales, en cualquier caso yatrógenas. En lugar de un
reposo vocal postquirúrgico, sería deseable planear una adecuada rehabilitación logopédica
postquirúrgica.
Se debe recomendar que el paciente no susurre en el postoperatorio, ya que aunque el

cuchicheo no hace vibrar las cuerdas, se requiere de un gran esfuerzo para producir un susurro
útil para la comunicación y puede inducir una fonación con bandas.







1: 6-11.
Curso de voz

92.

Curso de Voz

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Curso de Voz

Cargado por

Copyright:

Formatos disponibles

Curso de voz

Por un lado explica la génesis de lesiones orgánicas secundarias a trastornos disfuncionales, y

Historia Clínica y Anamnesis

La anamnesis y la recogida sistemática de información en la historia clínica es el mejor método

El correcto planteamiento terapéutico individual se basará en la comprensión del círculo vicioso

• Factores que precipitaron la disfonía

ETIOLOGIA (Le Huche)

El mecanismo de aparición y el mantenimiento de la disfonía disfuncional se comprende si se

La comprensión del mecanismo patogénico servirá de base para un tratamiento adecuado.

Así, existen tres conceptos clave a identificar:

• El círculo vicioso del sobreesfuerzo vocal

Círculo Vicioso del Sobreesfuerzo Vocal

En condiciones normales esta situación provoca de inmediato una reducción voluntaria de la

Sin embargo, si existen condiciones patológicas (factores favorecedores), la persona no puede

Factores Desencadenantes (por orden de frecuencia)

1. Algunos procesos patológicos de la esfera ORL: El más representativo es la laringitis

Factores Favorecedores (por orden de frecuencia)

Obligación socioprofesional de hablar o cantar

Características psicológicas: Emotividad y carácter primario.

Situaciones psicológicas difíciles.

Intoxicación alcohólica y tabáquica.

Procesos crónicos ORL

Deficiente control audiofonatorio.

1. La obligación socioprofesional para hablar o cantar: Es el factor más importante que

Falta de rendimiento vocal

Esta circunstancia hace disminuir la eficiencia vocal.

Ver anexo 4: Presión Umbral

Ver anexo 5: Perdida eficiencia

De acuerdo con esta teoría de Tarneaud y Le Huche, la existencia de un comportamiento de

De esta forma, se puede hablar de laringopatías de origen funcional o laringopatías

La disfonía disfuncional complicada es en la que se pueden observar lesiones en la exploración

Conociendo la patogenia que explica la aparición de estas lesiones orgánicas se comprende la

Otorhinolaryngology, Ludwig-Maximilians-University, Marchioninistraße 15, D - 81377 Munich,

Nódulos vocales (Ver anexo 6):

Pólipo vocal (Ver anexo 7):

Edema de Reinke (Ver anexo 8):

Quiste vocal (Ver anexo 9):

Hemorragia de la cuerda vocal:

Ver anexo 10: Alteraciones Biomecánicas.

Alteraciones Biomecánicas - Diapositiva 16. Subarmónicos en la segunda parte de la fonación.

Alteraciones Biomecánicas - Diapositiva 17. Espectrograma tipo I de Yanagihara.

Alteraciones Biomecánicas - Diapositiva 18. Espectrograma tipo IV.

Para saber más

Clasificación de las Disfonías

• Disfonías sin alteraciones orgánicas.

Disfonías sin alteraciones orgánicas

Alteraciones orgánicas de la voz

• Lesiones del epitelio:

Disfonía por alteraciones del movimiento de la laringe

Alteraciones sistémicas que afectan a la voz

• Manifestaciones extraesofágicas del reflujo (Ver anexo 13: reflujo modificado)

Síntomas de las disfonías

A continuación se exponen distintos síntomas asociados a las disfonías.

• Escape de aire o voz aérea

• Disfonía por tensión muscular

Informaciones de interés para evaluar un trastorno vocal

• Puede ser la causa principal de su disfonía

• Es incompatible el hábito de fumar con la salud vocal.

• No podemos ver aisladamente el trastorno vocal.

• Antihistamínicos: Sequedad del tracto vocal

Profesor del Módulo: Dr. Faustino Núñez Batalla

Médico del Servicio de ORL del Hospital Universitario Central de Asturias.

Vocal de la Comisión para la Detección Precoz de la Hipoacusia Infantil (CODEPEH),

Responsable del “Fellowship en Foniatría” del Hospital Universitario Central de Asturias,