Documentos de Académico
Documentos de Profesional
Documentos de Cultura
VOCAL
ÍNDICE
CLASE 1 - 07/04 - ANAMNESIS
CLASE 3 - 14/04 - ÍNDICES TMF – S/Z - TIPO DE INSPIRACIONES
CLASE 13 - 19/5 - EJERCICIOS VIBRATORIOS
DATOS GENERALES: Nombre y apellido, fecha, edad, dirección, fecha de nacimiento, teléfono, escolaridad,
talla, peso, profesión (punto fundamental que puede afectar el uso de la voz, debemos tener en cuenta de
que trabaja, cuantas horas y el ambiente) derivación, diagnóstico, fonoaudióloga, constitución familiar,
identificación vocal.
(A medida que voy hablando con el paciente voy dándome cuenta de los distintos aspectos y completando,
no hace falta preguntar ítem por ítem, tomar todo esto me puede llevar un encuentro o 2 con el paciente).
Completar con laboratorio de la voz.
El diafragma está sujeto a distintas estructuras, no está suelto, y es un músculo involuntario. Con estas
inserciones, en una inspiración el diafragma descendió contrayéndose y como una de las inserciones son las
uniones costales, las costillas se desplazan hacia afuera y el abdomen también hacia afuera porque presiona
las vísceras. Por ende, todos deberíamos respirar de manera costo diafragmático - abdominal. Lo que luego
se hace es entrenar ese espacio e incentivar y estimular más ese movimiento. Este tipo de respiración nos
permite ampliar el perímetro en sentido vertical, posterior y horizontal. Y con esto poder tener un mayor
dominio del aire y regular, dosificar la salida del aire, y apoyar la emisión (sostén). Para sostener se requiere
que se activen todos los músculos respiratorios. (lograr soplo sostenido y no empuje exclusivamente
abdominal donde se larga todo el aire, como al soplar las velitas).
La respiración se hace de acuerdo a la emisión. No es lo mismo hablar que cantar, o cantar distintos estilos.
No todas las voces femeninas tienen que ser agudas, cada tracto vocal es individual y particular. Una voz
más agravada no significa que haya una presencia de patología. Hay que ver el panorama general.
A veces lo que es grave no es por las cuerdas vocales, sino por la resonancia que tiene el paciente. Quizás el
laboratorio de la voz da normal. No hay buena resonancia o amplificación del sonido adecuada.
13 EJERCICIOS VIBRATORIOS
Vibración de labios: primero solo con aire y luego agregamos sonido. No hay que mandar mucha fuerza ni
que los labios estén rígidos. Vibración muy blanda. Si se realiza mucho puede dar hiperventilación por ende
general mareos. Coordinar el aire.
Con sonido, realizarlo con una frecuencia cómoda, pequeños glissando. Es un buen ejercicio para poder
movilizar y poner en funcionamiento la mucosa laríngea. Genera cierta presión (todos los ejercicios de tracto
vocal aumentan la presión orofacial dentro de la boca y una disminución en el estrés de impacto, es decir,
se reduce el impacto entre pliegues y comienza una vascularización del pliegue vocal, con la cual se empieza
a calentar lentamente la musculatura, trabaja con el aire porque hay mayor consumo del mismo, hay
sodificación de aire, y al producir una vibración labial, me produce una sensación de cierto cosquilleo dentro
de lo que es la máscara facial. Entonces es un ejercicio muy completo y favorece mucho el trabajo que
queremos hacer con los pacientes que es aumentar las sensaciones resonanciales.
En particular la profe usa mucho el glissando, ya que es una sensación muy interesante donde se acercan las
distancias de las notas. El sonido lo hace con un /pr/. La profe se extiende sólo una octava, porque se busca
estabilidad y relajación, y si se sigue subiendo no genera algo relajante. Quizás se va del si2 al si3. Se sube y
baja de a tonos, se puede dé a semitonos pero se hace muy largo el ejercicio.
Vibración de lengua: Por orden de efectividad va primero este. Y segundo el de labios. Se coloca la lengua
en el medio de los labios. No se hace mucha fuerza con las mejillas. Se prueba primero con aire y corto, luego
con sonido, sonidos solos, y luego glissando.
La vibración de los labios genera un masaje sobre la lengua.
No hay que trabajar con la ansiedad, si el paciente no le sale y se frustra, cambiar.
Cada ejercicio tiene su beneficio si está bien realizado. Los 3 hacen lo mismo, con que salga uno está bien
pero unos son más efectivos que otros.
Después a esta vibración le puedo agregar una vocal. Ej. /r/ con /u/ → /ru/.
Con estos ejercicios el paciente practica el pasaje sin darse cuenta.
Siempre tienen que ser cómodos para el paciente, y ver que sucede antes y luego de las vibraciones, si
termino con fatiga vocal, si puedo realizar mejor los ejercicios, etc. Justamente se trabajan las sensaciones
por ende es importante ver que le sucede al paciente.
Es importante acompañar con el piano o teclado, está bueno tener elementos para no trabajar
exclusivamente con la vocalización.
Muchas veces cuando se va subiendo con tonos hacia los agudos, y luego debe bajar hacia los graves
(Siempre la distancia de una octava) lo que sucede es que uno queda como trepado o montado en lo agudo,
cuesta desprenderse de eso. Cuando se siente próximo a la zona de pasaje, es decir, que la nota empezó a
subir cada vez más, bajar la intensidad, que permite que la laringe y los músculos se relajen y la báscula
aparece sola. Si yo sigo con esa intensidad vocal y manteniendo en ese registro y no pasar al siguiente. Pero
la mecánica fonatoria no es la que le corresponde a la zona. Entonces en el canto clásico hay como una manía
de trabajar todo como pasado, entonces ya se empieza el grave con una colocación del agudo, para evitar el
trauma del pasaje, pero lo que genera esto es que los graves estén deslucidos, se escapa el aire. Lo que se
tiene que hacer es que el grave tiene que tener una ecualización con el agudo, que es lo que se busca con
todos los ejercicios donde intentan trabajar la resonancia y despertar sensaciones.
Es importante trabajar con los registros. En pacientes con lesiones, incluso pequeñas como nódulos, el
paciente refiere estar más cómodo con los graves, pero luego de una o dos sesiones ya los agudos pasan a
ser un lugar mucho más confortable que el grave, porque hay menos tensión.
Esto se relaciona con las fibras blancas del tiroaritenoideo a diferencia de las fibras rojas del cricotiroideo
que tienen menor fatiga vocal, entonces el tiroaritenoideo es un músculo que desgasta mucho, y por eso
cuando una persona habla mucho y no tiene una buena resonancia de su voz, se fatigan.
Muchos ejercicios los pueden hacer por copiar a la fono. La copia es una buena base.
Otro ejercicio del tracto vocal semi ocluido es la /m/. O el método masticatorio o “/m/ masticada”. Entonces
se hace el sonido de la /m/ pero masticando (moviendo los músculos como si se masticara), pero sin contacto
de los dientes o maxilares.
Se pueden ir bajando los tonos. También se puede bajar la cabeza, mirar hacia el suelo mientras se realiza el
ejercicio, e incluso con las manos tocar la zona de la masticación, donde está la articulación (atrás de los
cachetes). Se trabaja entonces la flexibilidad de la articulación.
Este ejercicio genera lo mismo: que los pliegues vocales se contacten suavemente, empezar a sentir
sensaciones vibratorias. Observar cuando estas sensaciones son más agradables, si se hacen con una
intensidad mayor o menor. Es importante trabajar con intensidades bajas porque hay menos contacto y más
amoroso el impacto.
Con todo esto, se trabaja tan solo con la fisiología fonatoria. No estamos con relajaciones, etc. Solo se trabaja
con la voz con esto. Es personal de cada fono si trabajar más con la voz, con la respiración o si meterse más
con la relajación. Roxana no trabaja casi con relajación con ejercicios como vimos en educación vocal, quizás
masajea si ve mucha tensión.
Pero hay que usar las sesiones lo + óptimas posible, y eso implica no estar mucho tiempo de la sesión con
relajación, solo si es verdaderamente importante. Sin embargo, la fono decide cómo hacer sus terapias, pero
no puede haber pacientes que pueden mejorar en pocos meses, y están años en tratamiento.
Se puede utilizar otra vocal, la /i/: se combina con /s/ /r/, etc. entonces mismos ejercicios con /si/. Lo mismo
con la vocal /a/. La i suele generar incomodidad porque la laringe asciende mucho más.
Si aparece picazón, dolor, tirones, etc. es algo que está mal posicionado o hay alguna alteración.
A veces se puede considerar importante tomar clases de canto para trabajar con la voz. Pero dejando esto
de lado, siempre es importante trabajar la voz con el paciente desde el vamos, desde el inicio, aunque se
hagan ejercicios de relajación o respiratorios o pautas de higiene vocal o articulación, etc. Pero es importante
trabajar la voz con la técnica de voz cantada, y con todos los ejercicios vocales.
11 ESTRUCTURA DE LA CUERDA O PLIEGUE VOCAL
La separación entre epitelio y lámina propia es clara, tanto como el límite entre capa superficial e intermedia.
La capa intermedia y profunda (ligamento vocal) están mal diferenciadas en sus límites.
MÚSCULOS LARÍNGEOS
Se dividen en extrínsecos e intrínsecos.
• Los extrínsecos se dividen en 2 grupos:
− Infrahioideos, que sujetan la laringe a la parte superior del tórax.
− Suprahioideos, que unen la laringe con la base del cráneo y mandíbula; se encargan de regular los
movimientos de ascenso y descenso de la laringe.
• Recordemos que el único músculo dilatador de la glotis es el cricoaritenoideo posterior, la abducción de
las CV debida a la contracción del CAP está sincronizada con los movimientos respiratorios.
• Los músculos cricoaritenoideo lateral, inter aritenoideo y tiroaritenoideo lateral son aductores de las
CV.
• El músculo cricotiroideo es el principal tensor de las CV, el otro es el tiroaritenoideo con su haz más
interno (músculo vocal), pero difieren en la forma de tensión:
− CT produce una tensión isotónica, cambia
el largo del músculo.
− TA produce una tensión isométrica
aumenta el tonismo, pero el largo del músculo es
el mismo (en las mujeres llega a una tensión
máxima en los agudos).
MOVIMIENTOS Y SUSPENSIÓN DE LA LARINGE
La laringe se mueve en tres ejes:
• Vertical hacia abajo y arriba (como cuando tragamos, cuando bostezamos desciende, cuando emitimos
agudos asciende, cuando emitimos graves desciende).
• Horizontal lateral, acercamiento y alejamiento de CV.
• Horizontal anteroposterior cuando se contrae el músculo CT produciendo la báscula laríngea que elonga
las CV.
REGULACIONES
REGULACIÓN DEL TONO
El cambio de tono es determinado por los cambios de longitud, masa y tensión.
• Cuando se elonga la cuerda disminuye la masa y aumenta la tensión, provocado por el CT (falsetto)
• En el registro modal el cambio de fr. se debe a variaciones de rigidez o tensión provocado por el TA.
• La elongación y tensión máxima se consigue por la relajación completa del TA y la contracción del
Cricoaritenoideo posterior (fija aritenoides), y el acortamiento máximo requiere de la contracción del TA
y la interrupción total de la contracción del CT y relativa del Cricoaritenoideo posterior
REGULACIÓN DE LA INTENSIDAD
La intensidad vocal depende de la presión subglótica y de la amplitud de las vibraciones de las CV. Los sonidos
más intensos resultan del logro de presión subglótica suficiente para vencer la resistencia del cierre de CV.
Esto es mucho más difícil lograrlo en frecuencias agudas porque este equilibrio entre poder disminuir la
intensidad, pero a su vez sostener una frecuencia aguda con una buena resonancia y calidad tímbrica es de
las cosas más complejas que existen para hacer en el canto.
• Funcionales: son las que no presentan alteración visible al examen, y se generan a partir del uso
incorrecto y/o abuso de la voz. Constituyen el mayor porcentaje de las disfonías.
Dentro del campo de estas disfonías podemos encontrar:
− Fatiga vocal (antes se llamaba fonastenia, ya no se usa ese término)
− Cierres glóticos incompletos (hiatus)
− Fonación de bandas
− Trastornos mutacionales
− Disfonías psicógenas
• Orgánicas: son aquellas generadas por una lesión en pliegues vocales o en alguna parte de los sistemas
intervinientes en la producción vocal.
Dentro de las lesiones orgánicas encontramos:
− Parálisis recurrenciales
− Surcos
− Laringectomías parciales y totales
− Neurológicas
Dentro de las mismas nos encontramos con algunas congénitas (surco, diafragma laríngeo, quistes
intracordales) y otras adquiridas (traumáticas, inflamatorias, neoplásicas, endocrinológicas,
neurológicas y iatrogénicas).
• Mixtas (orgánico funcionales /funcionales orgánicas): Son aquellas disfonías funcionales diagnosticadas
tardíamente, por lo que el abuso o mal uso de la voz a lo largo del tiempo predispone la aparición de
lesiones.
Las lesiones mixtas más frecuentes son:
− Esbozos nodulares
− Nódulos
− Pólipos
− Edemas cordales
− Pseudoquistes
− Granulomas de contacto
OTRA NOMENCLATURA
Alteraciones estructurales mínimas: Se incluye aquí una serie de variaciones anatómicas mínimas o
pequeñas malformaciones que se encuentran solo a nivel de pliegues vocales:
• Asimetrías glóticas
• Desproporciones glóticas
• Alteraciones de la cubierta del pliegue vocal. Sulcus, quistes submucosos, disgenesias vasculares,
puentes de mucosa, microdiafragmas laríngeos.
Los hallazgos de la historia clínicas deben hacer sospechar la posibilidad de estas lesiones:
• Disfonías desde la infancia
• Antecedentes de lesiones benignas recurrentes de los pliegues vocales
• Antecedentes de lesiones benignas de pliegues vocales resistentes al tratamiento
FUNCIONES LARÍNGEAS
• Ventilación: *No es respiración. Cuando hablamos de respiración en medicina hablamos del ciclo de
Krebs, que es la formación de energía a nivel de la célula. Cuando hablamos de ventilación hablamos del
pasaje de aire.
• Fonación
*Ambos conceptos (ventilación y fonación) están unidos ya que sin una no puede funcionar la otra.
• Protección de la vía aérea: Sin esta función ninguna de las otras dos funciones puede realizarse. Esto
quiere decir que la programación básica de la laringe es proteger a la vía aérea. Evitar que algo entre en
la vía aérea. Para cumplir esa función, la laringe va a descartar la función de fonación y hasta de
ventilación por un tiempo. Esta es la función básica de la laringe. Que tengamos esta protección en la
vía aérea es lo que nos va a permitir hablar, comer, ventilar. Si no hubiéramos tenido esta evolución
seriamos simplemente primates.
Para que nosotros podamos hablar y al mismo tiempo alimentarnos, tuvo que evolucionar toda la base del
cráneo, el cráneo y el cuello para llegar a tener estabilidad. Es algo bastante evolucionado.
ESTRUCTURA DE LA LARINGE:
• Cartílagos • Vasos sanguíneos (arteriales y venosos)
• Ligamentos (unen los cartílagos) • Nervios
• Músculos
1. CARTÍLAGOS
Si bien algunos libros los dividen más importantes o menos importantes, todos son importantes por igual.
Desde abajo hacia arriba tenemos:
• CRICOIDES: que es un cartílago en forma de anillo. En la parte posterior es más alto.
En alguna bibliografía lo podemos encontrar como el primer anillo traqueal. Los anillos
traqueales tienen una característica que en la parte de atrás están incompletos. Por lo
que esta es la gran diferencia entre el cricoides y los anillos traqueales. El cricoides es
completamente entero, no le falta la parte de atrás.
• TIROIDES: Es como un libro abierto hacia atrás. Tiene una escotadura superior y una escotadura inferior y
tiene cuernos superiores e inferiores. Los inferiores, se van a articular con el cricoides.
3. MÚSCULOS
• EXTRÍNSECOS
a) Infrahioideos:
- Esternohioideo - Esternotiroideo - Tirohioideo
b) Suprahioideos:
- Digástrico - Genihioideo
- Milohioideo - Estilofaringeo
Todos estos músculos extrínsecos hacen de sostén a la laringe y cualquier falla en ellos, va a repercutir
directamente en los músculos intrínsecos y en la calidad vocal.
• INTRÍNSECOS
- Cricotiroideo: Es un músculo que tiene dos vertientes. Una vertical y una horizontal. Las dos van desde
la región lateral del cricoides hasta el borde inferior interno del cartílago tiroides (porción vertical) y la
porción horizontal se funde hacia atrás con los constrictores de la faringe.
La función de este músculo es que cuando se contrae lo que hace es tirar el cartílago tiroides hacia
adelante y estira las cuerdas vocales. Es el musculo tensor de las cuerdas vocales. Es el musculo que eleva
el pitch vocal (eleva el tono vocal).
Tiene una característica, es el único musculo de la laringe que esta inervado por el laríngeo superior. El
laríngeo superior es principalmente en su 90% sensitivo. Pero tiene unas fibras que son motoras que van
a inervar directamente a este musculo. Todos los demás están inervados por el laríngeo superior.
- Cricoaritenoideo posterior: Es un músculo que tiene dos partes. Parte vertical y oblicua.
La parte vertical se inserta en la parte posterior del cartílago cricoides y se oblicua hasta insertarse en la
apófisis muscular en una de las partes del cartílago aritenoideo.
Donde se inserta la cuerda vocal es la apófisis vocal del aritenoideo.
Cuando el musculo cricotiroideo se contrae hace girar (rotar) al cartílago aritenoideo llevando la apófisis
vocal hacia lateral y lo que hace es abrir la glotis. Es el musculo abductor de la glotis. Es el único musculo
abductor de la glotis. Abre las cuerdas vocales.
- Interaritenoideo: Va desde la apófisis muscular de un aritenoides hasta la apófisis muscular del otro
aritenoideo. Es el único musculo impar de la laringe. Al contraerse, cierra las cuerdas vocales. Este
musculo es un musculo impar y recibe inervación motora de los dos nervios recurrentes (del lado derecho
y del lado izquierdo). Si un recurrente se paraliza, este musculo puede llegar a tener contracción porque
sigue recibiendo la inervación del otro lado.
- Tiroaritenoideo: Musculo propio de la cuerda vocal. Es el que engrosa la cuerda vocal y la lleva a la línea
media.
- Cricoaritenoideo lateral: Colabora un poco en esta función de llevar la cuerda vocal a la línea media.
VASOS Y NERVIOS
La circulación viene por ramas de la carótida que dan ramas que se van metiendo a la laringe.
El nervio recurrente se llama recurrente porque nacen en el cuello, van hacia el tórax y suben de vuelta hacia
el cuello. Recurren.
El recurrente izquierdo es más largo porque pasa por atrás del cayado aórtico para subir a la laringe. Entra a
la laringe e inerva a todos los músculos.
FONACIÓN
La imagen representa un ciclo vocal.
- DESCENSO LARÍNGEO:
Cuando nacemos la laringe esta casi atrás de la boca. Casi en C2-C3. En un adulto está en C4-C5 y C6.
Por eso, cuando en un niño de un año se le hace sacar la lengua se le ve la epiglotis porque la laringe todavía
está muy alta. Esa es la explicación por la cual un bebe puede estar siendo amamantado
y respira. Al estar ascendida la laringe, esta cae directamente por detrás de las coanas
y la faringe directamente en la boca. Esta separada la vía aérea de la vía digestiva. En la
medida que la laringe desciende se forma ese trayecto por el cual va a pasar la comida
y el aire. El ser humano es el único animal que se puede morir alimentándose.
- ANGULACIÓN
La angulación de la laringe de un niño está entre 110 y 120° (cartílago tiroides principalmente).
Mientras que el adulto en 90°.
Este es el cambio principal que se da en la muda vocal.
La laringe de la mujer se modifica muy poco. Los cambios más notorios son en el hombre.
- FORMA
La laringe en el niño es casi un cilindro en vez de la forma cónica.
La epiglotis es acartuchada y en los adultos más estirada.
Los aritenoides en los niños son grandes en comparación a la laringe. Luego ya no, porque la
laringe creció y los aritenoides quedaron con el mismo tamaño.
Las cuerdas vocales en el niño son más cortas y gruesas y en el adulto más largas y finas.
HISTOLOGÍA
- Mucosa → epitelio plano estratificado no queratinizado.
- Lámina propia
Nacimiento: Monocapa hipercelular. Principalmente formada por ácido hialuronato.
2 meses: primeros signos de una diferenciación bilaminar. Dos capas muy tenues.
11 meses: se comienza a observar la formación de una tercera capa profunda, pero todavía no
bien definida.
7 años: estructura trilaminar
12 a 17 años: MADURACIÓN DEFINITIVA DE LA LÁMINA PROPIA, con la muda vocal que es cuando
terminan siendo las 3 capas.
- Músculo
Cuando uno va a hacer una estroboscopía a un chico no vamos a ver las mismas imágenes y la misma onda
que en un adulto, porque no están del todo formadas las cuerdas vocales. Siempre tenemos que pensar en
cómo es la anatomía a determinada edad para saber qué es lo que tenemos que ver.
Introducción
1974 → Hirano propuso que las cv funcionan como un vibrador de dos capas: cover-body. Esta mucosa es la
que vibra sobre el cuerpo cordal.
Esta vibración que se genera en la capa superficial fue también estudiada por otro autor.
1975 → Matsushita → Mucosal Wave: movimientos ascendentes y laterales que se generaban en la mucosa
durante la vibración de las cv, se parecían a las ondas que se generan en un medio fluido. Es entonces el que
habla propiamente dicho de la onda mucosa. Se puede pensar entonces como el viento mueve el agua.
Entonces, este viento lo relacionamos con lo que es la presión subglótica, y la onda mucosa es iniciada por
esta presión.
Esta onda mucosa tiene un componente vertical y un componente horizontal. A través de las fibroscopías
estamos acostumbrados a ver la cara superior de las cv.
Hoy en día se quiere medir o graficar la onda mucosa con muchos softwares.
https://asa.scitation.org/doi/10.1121/1.3493637
Además de los puntos verdes, también hay que pensar en un componente vertical, que se está tratando de
estudiar el movimiento, y que por cómo podemos observar las cv, es de difícil acceso a esa información.
Se habla de labios inferiores y superiores, que se abren en tiempos diferentes (siempre se empieza a abrir
en la parte inferior, y luego en la superior). Tenemos entonces una diferencia de fase en el eje vertical.
En la fase de apertura, la deformación de la cubierta por la fuerza de la presión subglótica permite el paso
del aire a través de las cv e induce el movimiento lateral que genera la onda mucosa.
En la fase de cierre, primero se juntarán los labios inferiores y luego los superiores de las cv. Las propiedades
elásticas de los tejidos permiten a las cv reunirse en la línea media (más allá de considerar a la presión
subglótica).
Parámetros que se pueden evaluar de la onda mucosa y el ciclo vibratorio, tanto cuanti como cualitativa:
• componente horizontal
• componente vertical
• simetría
• periodicidad
• amplitud de onda
• velocidad
Muchas veces puede haber diferentes mediciones dependiendo de quién las hizo, qué papers son, qué
softwares, etc. O incluso distinto con la clínica, que se basa principalmente en lo cualitativo.
Técnicas:
➢ Técnicas indirectas
• EGG
➢ Técnicas directas de visualización
• VKM/DKM: son distintas versiones, distintas maneras de realizar lo mismo.
• Estroboscopía
• HSDI
El recorrido que se va a utilizar para observar la onda mucosa y las cv, es primero la electroglotografía (EGG)
y luego las técnicas directas que trabajan a partir del registro de una cámara.
A mayor contacto entre las cv, menor impedancia eléctrica. EGG mide la calidad de contacto entre cv.
La forma de onda de EGG (Lx) describe la duración, coordinación y patrones de contacto relativos propios
de los ciclos vocales.
Como no podemos observar las cv, es un estudio que se combina con otros.
Sincronizado con una estroboscopía, la EGG nos da información de la actividad
del labio inferior de la cv (inicio de fase de apertura).
El pico de la onda es el punto de mayor contacto entre las cv. Pero cuando la
curva comienza a descender ya podemos pensar que los labios inferiores de
las cv empezaron a separarse. Claramente en una imagen EGG no lo podemos
ver, pero sintonizado con la estroboscopía nos da una información nueva, el
tiempo de contacto, etc.
Esquematización de esto:
Relacionado a los registros vocales:
Así como tampoco se puede hablar de la asimetría ant-post, tampoco de izq-der, ya que se evalúa el contacto
entre ambas cuerdas y el patrón de movimiento.
ESTROBOSCOPÍA
• Recurre a un efecto óptico para poder registrar el ciclo.
• Bajo costo relativo, rapidez: herramienta efectiva.
• Captura 30 cuadros por segundo. (Fps)
• Crea ilusión de slow motion al sincronizar la cámara con una luz estroboscópica. Cuando la luz se
enciende la cámara captura una imagen. Como la imagen que entrega se compone de un promedio
de sucesivos ciclos vibratorios, la estroboscopía sólo puede usarse para grabar vibraciones periódicas
de las cv.
• La activación de la luz estroboscópica requiere de una frecuencia
de fonación estable.
• Muchos desórdenes vocales se caracterizan por su aperiodicidad
y/o inestabilidad frecuencial por lo que no pueden ser evaluados
mediante estroboscopía. Ej. una parálisis.
• La estroboscopía es un estudio subjetivo y quienes lo realizan
deben estar bien entrenados para reducir variaciones y
distorsiones.
• No hay consenso sobre las escalas de valoración de los
parámetros de la OM.
Se selecciona esa línea roja, y la cámara solo va a registrar lo que sucede en esa línea. Como se sacan muchas
fotos por segundo, puedo tener una imagen del ciclo.
Todos los parámetros a observar siempre nos van a dar información sólo de la línea de
escaneo que establecimos previamente al registro. Es decir, no vamos a obtener
información del eje antero-posterior.
Si por ejemplo en el redondel hay un pólipo, y se selecciona la línea violeta, no nos vamos
a enterar de esa lesión.
Hoy en día existe la digital kimografía, que les permiten seleccionar múltiples líneas a la vez. Antes también
se tenía que seleccionar la línea antes del registro, en cambio lo que sucede con esto digital es que uno
puede ir eligiendo luego.
• VKG puede describir vibración en voces inestables basándose en la asimetría der-izq, fases abierta y
cerrada, propagación de la OM, diferencia de fase, amplitud y frecuencia.
• VKG no puede dar cuenta del eje antero-posterior de la glotis. A su vez, al no registrar el cuadro completo
es difícil determinar si hubo movimiento del endoscopio o vibración irregular.
Se pueden medir:
• Amplitud lateromedial: excursión de la cuerda durante la vibración. Amplitud CVI, Amplitud CVD,
máxima amplitud.
• Periodicidad: regularidad sucesiva de los ciclos de vibración de la cv.
• Fases de apertura y cierre.
Kimograma fonación con ataque brusco: al inicio de la fonación se ve la aproximación de las bandas que no
permite ver las cv. (serían lo gris de los costados).
Por otro lado, Kimograma de paciente con parálisis de CVD. Vemos la asimetría entre CVC y CVI donde
indican las flechas. En los círculos rojos podemos ver aperiodicidad.
Con estos estudios están tratando también de poder ver qué pasa con los labios inferiores.
Esto no se sabe si hoy en día se está haciendo en el país. Es algo más avanzado.
Cuerda vocal con parálisis, donde la marcada con rojo tiene mayor periodicidad.
Existen otras medidas más objetivas ya que las anteriores se pueden medir con tiempo con un cronómetro
pero todavía dependen un poco del evaluador.
Existen otra 3 medidas que son las que determinan las bases fisiológicas de la fonación. De hecho, las medida
aerodinámicas son mucho más cercanas a la fisiología que las medidas acústicas. Ya que las medidas
aerodinámicas tienen dirección directa con la fisiología. En cambio, las medidas acústicas tienen una relación
con el sonido que es una CONSECUENCIA de la fisiología vocal. Mientras que las medidas aerodinámicas son
parte DIRECTA de la fisiología vocal.
• FLUJO:
a) Volumen de flujo: Cantidad de flujo que sale en un tiempo de fonación (cantidad de flujo que pasa por los
pliegues vocales en una fonación antes de tomar la otra respiración). *No se utiliza tanto en la clínica.
b) Promedio de velocidad de flujo: Es la velocidad con que pasa el flujo de aire entre los pliegues vocales.
*Cuando tenemos una voz normal, vamos a tener un promedio de velocidad de flujo dentro de limites
normales. En cambio, cuando tenemos una voz soplada, los pliegues vocales no cierran bien y se escapa aire.
Entonces el volumen del flujo aumenta ya que se escapa aire más rápidamente. Por eso es que a las personas
con voz soplada no les alcanza el aire para decir una frase completa.
Una persona con voz apretada, ese promedio de velocidad de flujo disminuye ya que los pliegues vocales
están más cerrados, entonces se demora mucho más en pasar el aire.
• PRESIÓN:
a) Presión subglótica: Todo lo que está por debajo de los pliegues vocales.
b) Presión supraglótica: Tracto vocal o cavidades de resonancia *Para Guzmán mejor llamarlo tracto vocal y
no cavidades de resonancia. Son las cavidades por sobre los pliegues vocales hasta los labios (Esta cavidad
también tiene aire y al tener aire también tiene cierta presión, por eso la denominamos presión supraglótica)
*La presión supraglótica es también denominada intraoral.
c) Presión transglótica: Resta entre la presión subglótica y supraglótica (Psub-Psupra). Es muy importante
ya que la presión transglótica es lo que permite que los pliegues vocales oscilen.
Si por ej. tuviéramos una presión subglótica de 10cmH20 y una supraglótica de 2 cmH20= 8cmH20 (esta
sería la presión transglótica) → Es una presión transglótica positiva. Si es positiva quiere decir que hay un
gradiente de presión. Es decir, hay mayor presión en un sector que en otro por lo tanto hay flujo de aire.
Pero por ejemplo si tengo un tracto vocal semi ocluido (ej. Tengo un sorbete o taparse la boca), eso aumenta
la resistencia, aumenta la presión intraoral y también aumenta la presión subglótica (pero principalmente la
intraoral). Entonces por ej. la presión supraglótica ahora es de 5cmH20 y la subglótica tenía 10 cmH20= 5
cmH2O (presión transglótica).
Si me tapo más fuerte la boca la presión supraglótica va a aumentar, estando al borde de que la presión
transglótica este en 0. (Las presiones se igualan)
Cuando está en cero, no hay diferencia de presión por lo que no habrá flujo de aire. Si no hay flujo de aire
no hay voz porque no hay vibración de los pliegues vocales.
d) Presión intraglótica: Presión de aire que hay ENTRE los pliegues vocales que actúa como un colchón de
aire. Es la típica presión que se explica en el efecto Bernoulli que disminuye y aumenta con la oscilación de
los pliegues vocales. Cuando llega a ser negativa, ocurre un efecto de succión y ahí es cuando se cierran los
pliegues vocales según la teoría Mioelástica-Aerodinámica.
• RESISTENCIA:
Resistencia glótica: Es la dificultad que oponen los pliegues vocales a que pase el flujo de aire. Ese flujo
determinado por el gradiente de presión puede pasar más fácilmente o menos.
Si tenemos una voz normal, vamos a tener una resistencia dentro de limites normales.
Si es una voz soplada la resistencia va a estar disminuida porque los pliegues no cierran bien y oponen menos
resistencia. Por eso el aire pasa más rápido.
Si tenemos una voz apretada, la resistencia glótica es muy alta y el flujo de aire va a ser más lento.
El flujo es la corriente de aire, es el movimiento de partículas de aire. Estas partículas de aire cuando están
dentro de una cavidad tienen cierta presión. Nosotros tenemos dos cavidades principales donde
almacenamos aire para la producción de la voz: En la cavidad subglótica y la cavidad supraglótica.
En el ciclo vibratorio tenemos diferentes fases. Cuanto más abierta sea la fase, más flujo va a pasar.
ALGUNOS PRINCIPIOS FÍSICOS PARA ENTENDER LA FISIOLOGÍA DE LAS MEDIDAS AERODINÁMICAS DE LA
FONACIÓN: SISTEMA DE FLUJO, PRESIÓN Y RESISTENCIA
La ley de Ohm fue creada para la electricidad. Decía que cuando tenemos cierta concentración de partículas
y tenemos una resistencia muy grande, no va a haber flujo porque la resistencia es muy alta. Pero si esa
resistencia la liberamos, las partículas iban a fluir hacia un lugar de menor concentración (de P1 A P2).
Existe una relación entre la resistencia, el flujo y la presión diferencial que se explica por el principio eléctrico
conocido como la Ley de Ohm.
Ley de Ohm: Dicha ley dice que el voltaje es: VOLTAJE = CORRIENTE X RESISTENCIA
La corriente que aparece en la Ley de Ohm es flujo de electrones. La corriente es flujo.
La resistencia tiene que ver con pequeñas resistencias que oponen los circuitos eléctricos al flujo de
electrones.
El voltaje se refiere a la diferencia de concentración de electrones que existen entre las centrales eléctricas
y el enchufe de la casa. El enchufe de la casa tiene muy baja concentración de electrones y las torres de alta
tensión tienen muy alta concentración de electrones. Es por eso que los electrones fluyen desde esa central
hacia los enchufes de esos hogares. Porque existe una concentración diferencial. Eso permite el flujo de
electrones.
APLICACIÓN DE LA LEY A LAS MEDIDAS AERODINÁMICAS:
La ley de Ohm en términos aerodinámicos seria:
F=P1-P2/R
Por otra parte, el flujo esta inversamente relacionado con la resistencia. Si yo aumento la resistencia, el
flujo disminuye.
El tracto vocal cuando estamos hablando normalmente está en posición de tracto abierto. Eso produce que
la presión de aire del tracto vocal al hablar sea igual a la presión atmosférica. Porque son cavidades que
están conectadas.
En términos aerodinámicos fonatorios, la presión atmosférica se considera 0. Al igual que la presión intraoral
(supraglótica).
En términos fisiológicos pulmonares, se considera que la presión atmosférica es 0 como punto de referencia.
Entonces:
Psubglotica - Psupraglotica = Flujo x Resistencia glótica
Queda:
Psubglotica = flujo x resistencia glótica
Esta es la fórmula básica que tenemos que recordar.
F=P/R
El esfuerzo fonatorio no es lo mismo que fatiga vocal. El esfuerzo fonatorio es el exceso de fuerza, de trabajo.
Que se mide normalmente en exceso de presión. Hacen más fuerza para producir voz.
Por lo que en una persona que lleva años con un pólipo, su cuerpo compensa y la presión va a estar
aumentada. → Pensándolo en términos aerodinámicos, un esfuerzo fonatorio se correlaciona con una
presión aumentada.
En la fórmula: F=P/R
Si aumentamos el numerador (presión), el flujo va a estar más aumentado.
Con este cuadro, un paciente además siente fatiga respiratoria, se siente agotado luego de hablar mucho
tiempo y se cansa corporalmente hablando porque todo el sistema muscular del cuerpo compensa.
*Importante! En la voz, el término fatiga no se tiene que asociar con lo muscular. Ni vocal ni respiratoria a
pesar de que los pacientes sienten fatiga vocal y respiratoria.
Pero los músculos de la respiración y los pliegues vocales son altamente resistentes a la fatiga. De hecho no
hay evidencia que los pliegues vocales y respiratorios realmente se puedan fatigar como producto de hablar.
Ej. Parálisis de cv. Una se puede mover y la otra está paralizada en posición paramediana. Tenemos un GAP
glótico.
Se escucha una voz muy soplada. Y se escucha una doble frecuencia porque una cuerda vocal vibra en una
frecuencia y otra vibra en otra.
La resistencia va a estar disminuida, el flujo va a estar aumentado.
Y además a este paciente le sacaron la tiroides hace dos semanas. Este paciente no tendría una gran
compensación porque no paso tanto tiempo desde la intervención por lo que la presión subglótica va a estar
normal. Sin tanta compensación
Pero si esa persona consulta tardíamente, después de 2/3 años, ese paciente ya llega con un grado de
compensación muy importante porque su cuerpo ya se dio cuenta que esa voz no le funcionaba. Entonces
tenemos un aumento de presión subglótica.
Además de disminución de la resistencia que ya tenía, se suma un aumento de la presión subglótica. Por lo
que el flujo va a aumentar todavía más. Y al paciente se le va a escapar el aire porque tiene un gran GAP
glótico.
1. FLUJO:
El flujo se podía medir en Promedio de la velocidad de flujo y Volumen de flujo *No lo vamos a ver porque
no tiene mucha aplicación clínica.
Ej. si el paciente tiene 50 ml/seg de flujo. Es un flujo disminuido que puede deberse a:
• Aumento de la resistencia
• Disminución de la presión
Ej. Un paciente con disfonía espasmódica que no esté compensado con aumento de presión, puede tener
un flujo disminuido de 50 ml/seg.
Ej. un paciente con ELA tiene los músculos respiratorios (y los de todo el cuerpo) con una tonicidad
disminuida. Pierden fuerza, por lo que la presión va a estar disminuida. Entonces podemos tener un flujo
transglótico muy bajo que no siempre es porque la resistencia sea alta, sino que si vamos a la formula
también existe una presión subglótica muy disminuida. Y cuando está muy disminuida, el flujo pasa muy
lento.
Ej. El frito vocal también produce un aumento de la resistencia y por lo tanto un flujo disminuido.
Si vamos al otro extremo, por ejemplo un paciente que tenga 450 o 500 ml/seg. Podemos pensar en:
• Disminución de la resistencia
• Aumentada la presión subglótica
• o Ambas
Ej. parálisis de pliegue vocal.
En resumen:
• Los pacientes con incompetencia glótica tales como parálisis de pliegue vocal pueden tener un promedio
de velocidad de flujo muy alto (400-600 ml por segundo).
• Pacientes con hiperfunción severa o vocal fry pueden tener un promedio de velocidad de flujo muy bajo
(5-10 ml por segundo)
• Pacientes con problemas neurológicos o compromiso respiratorio pueden mostrar un flujo muy irregular
o inestable.
2) PRESIÓN
Cuando hablamos de presión, hablamos de una fuerza por unidad de área actuando perpendicularmente en
esa área. Se mide en cm de H20.
La presión subglótica actúa como fuerza debajo de los pliegues vocales hasta que supera la resistencia de los
pliegues vocales y estas comienzan la oscilación. Representa la energía disponible para la creación de la señal
acústica de la voz.
La presión subglótica es un arma de doble filo: porque sin la presión subglótica no hay energía, no hay fuerza,
no hay fonación. Pero a su vez la presión subglótica es la causante de todas las lesiones fono traumáticas.
Muchas veces, cuando decimos que lo que causa los nódulos, los pólipos y todas las lesiones por fono trauma
es el mal uso de la voz, es algo muy general. Porque en realidad lo que causa estas lesiones es el aumento al
estrés de impacto porque los pliegues chocan con mucha fuerza. Y este choque lo causa la presión subglótica.
Cuanto más presión subglótica se utilice, más choque, el estrés de impacto y por lo tanto mayor probabilidad
de fono trauma.
Hay dos elementos que determinarán cuanta presión subglótica es necesaria para iniciar la fonación:
• Viscosidad de los tejidos de cuerdas vocales
• Grado de aducción
Una persona con disfonía espasmódica lo que hace es aumentar el grado de aducción y ese grado de
aducción provoca automáticamente un aumento en la presión subglótica.
Una persona con parálisis de cuerdas vocales de dos años que ya compenso, como el cuerpo se da cuenta
que la voz no suena, la presión subglótica aumenta para sonar un poco más.
La presión subglótica siempre compensa. Siempre es una forma de compensar.
Por lo que la presión subglótica aumentada ocurre tanto en casos de mucha hiperfunción (disfonía
espasmódica), como en casos de mucha hipofunción (parálisis de cv bilateral abierto).
Siempre va a ocurrir una compensación con aumento de presión subglótica. EN el caso de la disfonía
espasmódica para poder vencer las cuerdas vocales que están firmemente aducidas o en el caso de la
parálisis de cv bilateral para lograr que el ruido que produce la voz suene un poco más fuerte (aire con más
fuerza).
En cuanto a la viscosidad de los tejidos: Ej. un edema de Reinke, la viscosidad de esos tejidos esta aumentada.
Entonces la cuerda vocal se pone más viscosa. La viscosidad es la resistencia que tiene un fluido para poder
moverse.
Todas y cada una de las lesiones fono traumáticas y procesos inflamatorios producen aumento de la
viscosidad de los pliegues vocales.
Si tenemos un fono trauma, este se produjo por exceso de presión subglótica pero como va a haber
inflamación (nódulos por ejemplo) entonces el cuerpo va a compensar con más presión subglótica y va a
haber más fono trauma. Cuanto más fono trauma, más compensación.
Personas que apenas se le escucha (en una conversación) 5 cmH20. Pero personas que tienen una voz muy
poderosa (más resonantes) esa presión va a estar cercana a 10 cmH20.
En voces normales ya con 3 cm de H20 ya es posible producir voz.
Una persona que habla fuerte aumenta la presión subglótica y por lo tanto,
aumenta el estrés de impacto. Siempre.
El aumento del estrés de impacto no es malo. De hecho es bueno ya que si no fuera porque los pliegues
vocales chocasen más fuerte, no tendríamos la capacidad de cambiar la intensidad de la voz.
La rigidez de los pliegues vocales, la hiperfunción, la hipofunción, el cierre glótico incompleto, etc. afecta la
presión subglótica.
En estados patológicos como cáncer, parálisis de pliegues vocales, disfonía funcional hiperfuncional están
asociados con alta presión subglótica.
Ej1. En una parálisis que lleva años, la presión subglótica va a estar aumentada por compensación.
Ej2. Las cuerdas vocales no cierran pero tiene mucha constricción supraglótica. Hay mucha presión
subglótica.
Ej3. En el edema de Reinke el cierre no se ve afectado. Lo que aumenta la presión subglótica es la viscosidad.
La presión subglótica se estima desde la presión supraglótica porque al paciente se le pide hacer PA PA PA
PA PA PA. y cuando hacemos esto, ese evento tiene a su vez dos eventos:
el /p/ y el /a/
Cuando estamos en el /a/ los pliegues vocales están cerrados. Entonces la cavidad P1 (subglotis) de la cavidad
P2 (supraglotis) están separadas porque las cuerdas vocales están cerradas. Si en ese momento mido la
presión subglótica de la cavidad oral estoy midiendo presión intraoral. Si la medimos en este momento de
la /a/ vamos a estar midiendo la presión intraoral (supraglótica) porque las cavidades están separadas.
Pero si mido la presión de aire dentro de la boca en el momento de la /p/ (que es un sonido sordo), los
pliegues vocales están abiertos. Por lo que las cavidades P1 y P2 están conectadas. Por el principio de Pascal,
cuando dos cavidades están conectadas las presiones se igualan. Entonces cuando nosotros metemos esa
manguerita por la boca en este momento, estamos midiendo la presión intraoral que es igual a la presión
subglótica (P1) porque ambas cavidades están conectadas.
Recordar:
• La presión subglótica excesivamente alta indica hiperfunción
• La presión subglótica excesivamente baja indica hipofunción
Ej. parálisis de pliegue vocal. Probablemente la parálisis de la cv si es reciente va a tener una disminución de
la presión subglótica. Pero si ya lleva muchos años, por compensación esta ya va a haber aumentado.
Ej. Los pliegues vocales no cierran bien pero hay una gran constricción de las bandas ventriculares. También
podemos tener un aumento de la presión subglótica.
Ejemplo:
Tenemos arriba el flujo transglótico y abajo la presión subglótica. Los picos son del PA PA PA.
El “Mean peak air preassure” es equivalente a la presión subglótica. Nos dice 8.66 (rango normal ya que la
normalidad estaba entre 5 y 10).
Umbral de presión de la fonación: Es la mínima presión subglótica requerida para que las
cuerdas vocales entren en oscilación (iniciar la fonación).
Se le pide al paciente que en vez de que haga PA PA PA a intensidad normal, debe hacerlo a
la mínima intensidad posible antes que sea susurrado. (no tiene que ser susurrado).
En esa fonación tan mínimamente suave se le mide la presión subglótica de la misma forma.
Y esa presión subglótica es el umbral de presión de la fonación.
Por ejemplo un paciente con nódulos no va a poder hacerlo dentro del rango de normalidad. Porque los
nódulos impiden que con esa presión tan baja cierren. Por lo que va a tener que poner más presión. → Su
presión subglótica mínima para poder producir voz va a estar aumentada.
La presión de los pulmones debe exceder el umbral de presión de la fonación → la oscilación de los pliegues
vocales puede ser lograda.
Exactamente lo mismo a lo que vimos en la presión subglótica ya que el umbral de presión de la fonación es
un tipo de presión subglótica.
El umbral de presión de la fonación es de vital importancia como predictor de las estructuras y de las
capacidades vibratorias de las cuerdas vocales.
Las personas que sienten esfuerzo fonatorio son las personas que requieren más presión para iniciar la
fonación. (UPF mucho más alto)
Mientras más sanas se encuentren los pliegues vocales, menor será el UPF.
Las condiciones más favorables para un bajo UPF es cuando la amplitud glótica prefonatoria es pequeña y el
borde libre de los pliegues vocales es relajado.
Ej. Pliegues vocales normales. Deberían tener un bajo UPF.
Los individuos con alteraciones de la voz a menudo dicen tener problemas para iniciar la fonación.
El UPF provee una importante prueba del efecto de la terapia de la voz y de la cirugía.
después de una cirugía, el UPF debería disminuir siempre porque la persona debería disminuir su esfuerzo
fonatorio.
Hay una relación entre la hidratación sistémica y el UPF. Las personas hidratadas permanentemente
deberían disminuir el UPF porque la hidratación sistémica disminuye la viscosidad de los pliegues vocales. Y
pliegues vocales menos viscosos se mueven más fácilmente por lo tanto requieren menos presión.
UPF y calentamiento vocal: Se ha visto en algunos estudios que el calentamiento vocal antes de salir a actuar
en profesionales de la voz también pudiese disminuir el umbral de la fonación. Pero no hay tanta evidencia
como la que existe sobre la hidratación
3) RESISTENCIA
Es una medida derivada que combina las medidas de presión y de flujo.
La determinan los software porque hacen una formula → R=P/F
Aclaración:
El concepto macro de laboratorio de voz incluye:
• Análisis acústico • Electroglotografía • Medidas aerodinámicas
5 ESQUEMA CORPORAL VOCAL DEL CANTANTE (ECV)
*Propio esfuerzo: cuando uno produce sonido, ya sea hablando o cantando, porque trabajamos con otras
frecuencias, u otra extensión de frecuencia y otras intensidades, hay un montón de sensaciones internas que
se empiezan a desencadenar a diferentes niveles y empiezan a cambiar. Las sensaciones tienen que ver más
que nada con una vibración y con las sensibilidades personales y particulares (si al paciente le pareció más
fácil producir la voz, o más incómodo, etc.). Es algo que se intenta trabajar con ejercicios.
(En el libro de principios de foniatría hay un capítulo sobre el esquema corporal vocal del cantante. *Pero
con la definición anterior alcanza).
El ECV está relacionado con las sensaciones auditivas que percibe el cantante de su propia voz, las que a su
vez le permitirán mejorarlo y controlarlo. (uno ajusta su voz dependiendo de lo que escucha, quizás se hacen
variaciones de apertura de la voz, o velocidad, la intensidad, etc.).
Importante para esto tener oído musical, que vendría a ser la posibilidad de poder reproducir un sonido o
melodía, aunque sea sencilla. El oído musical le permitirá al cantante controlar en cada momento su emisión:
el uso correcto de las presiones subglóticas le permitirá afinar y no producir sonidos calantes* (cuando la
nota no llega a su afinación exacta, es algo muy frecuente) o crescentes (o crecido, es cuando la afinación se
pasa de la frecuencia a la cual tengo que llegar, muchas veces pasa por no tener técnica vocal, entonces una
persona llega al sonido pero muy forzadamente). La laringe está un poco más alta de lo normal). Por último,
también necesitamos de la memoria para poder repetir de manera correcta el mismo mecanismo fonatorio.
*calantes: muchas personas lo llaman desafinación, pero no es lo mismo, porque el calante no llega a la nota
por muy poco, un cuarto de nota para llegar. En cambio, la desafinación está muy lejos de la nota.
Sensorialidad auditiva: no es sino el oído musical que el cantante debe desarrollar en paralelo y simultáneo
con la adquisición del ECV.
Sensaciones internas:
• Región faringobucal: desde alvéolos, dientes superiores, zona palatina anterior (paladar duro) hasta
úvula y faringe, zona superior.
• Región laríngea: no se perciben a este nivel nada más que sensaciones difusas.
• Región nasofacial: conjunto óseo de la cara. (se le dice lleva a la voz a la máscara)
• Región torácica: no deben forzarse las sensaciones intensas en esta zona.
• Región pelviana y del perineo: están comprometidas en el canto a gran volumen y las notas más
agudas. (cantar desde una región muy baja).
Las vibraciones se dispersan a través de los huesos y llegan más allá que a una sola zona. Pero se puede hacer
terapia para llegar a lo ideal.
Hay que pensar en los 3 sistemas, parte respiratoria, la laringe y lo resonancial. Los 3 tienen que estar en
sincronía, para que el sistema total que es la fonación funcione correctamente. Ahora cuando uno sale de la
octava de extensión comienza a percibir otras sensaciones, por eso se describen las regiones.
Técnica vocal
Modo de utilizar los órganos fonadores en la voz cantada sobre la base de automatismos neurológicos
sensomotrices, adquiridos por entrenamiento y que permiten al sujeto un rendimiento vocal adecuado en
cuanto a fr., intensidad y timbre, sin fatiga vocal.
Todo entrenamiento vocal a lo que apunta es que uno pueda cantar todo el tiempo que quiera, todos los
años que quiera, sin generar daño vocal y sin fatiga. Por eso es tan importante la higiene vocal,
entrenamiento previo, el enfriamiento vocal posterior, cantar el repertorio adecuado para nuestra voz, no
es lo mismo canto lírico o clásico que popular.
*Soprano ligera: las más agudas. Soprano lírico: son la gran mayoría de los sopranos.
En el canto a gran volumen hay que tratar de proteger a la laringe, ejerciendo una mayor impedancia. Este
término se utiliza para calificar la resistencia fluida que se opone a la propagación de las ondas sonoras.
Acá podemos introducir el término de la cobertura o cubertura. Significa que si yo trato de, por ejemplo,
dilatar el fondo de la boca, lo que tengo que tratar de hacer es que la onda sonora, el aire que pasa por
medio de las cv, que va a generar esa corriente de aire que rebotará sobre las estructuras resonanciales,
amplificando esas frecuencias de la mejor manera, de acuerdo a la posición de la abertura de la boca, la
posición de los labios, la situación de la lengua y del velo del paladar, va a producir un sonido que va a ser
más bello a lo que se escucha y me va a permitir lograr una intensidad mayor sin que se esté exactamente
ejerciendo mucha presión de aire para generar un sonido intenso.
Entonces, por ejemplo, si se piensa la emisión con la forma de un megáfono invertido, la parte grande del
megáfono está hacia adentro, donde esta dilatación posterior, la elevación más excedida del velo del
paladar, el descenso de la lengua me va a permitir realizar un sonido que va a trabajar a una alta impedancia,
entonces el producto final es mucho más rico, por ejemplo, en armónicos.
Respiración
Desarrollo de la sensibilidad de la cincha abdominal (toda la zona costo diafragmática abdominal).
Emisión
Desarrollo de las sensibilidades palatales:
La resonancia tanto en el habla como en el canto debe producirse espontáneamente y como resultado de la
coordinación entre la salida del aire y su pasaje por las cavidades que actúan como resonadores.
Volumen o Intensidad
Durante la ejercitación debe usarse una intensidad media, el F (forte) y FF (fortísimo) sólo deberán
practicarse cuando se haya logrado un pleno dominio del sostén abdominal.
*En piano la F es P. Es difícil cantar con piano. Cantar pianísimo requiere mucho entrenamiento.
Pasaje vocal
Pasar de un registro a otro. Se entiende de registro a una serie de tonos sucesivos que se realizan dentro de
una misma mecánica y se distinguen con otro registro por la mecánica distinta. Ej. voz de pecho con una
mecánica con activación del músculo ariaritenoideo y cuando hacemos un pasaje a un registro más agudo o
registro de falsete, o liviano, activamos además el cricotiroideo.
Normalmente hay un pasaje más marcado, sobre todo en mujeres, desde una voz de pecho, modal, grave o
hablado, a un registro agudo, liviano o falsete. Hay un gran salto, tirolés de cambio. Hay que tratar que no
haya un cambio grosero en los pasajes.
Lo que sucede en el pasaje es el movimiento de báscula laríngea que hace en los cartílagos, entonces el
tiroides se adelanta por sobre el cricoides.
El pasaje lo hacemos todos, incluso con técnica vocal o no. Lo que cambia es que el pasaje sea sutil o no.
Muchos maestros de canto trabajan la sensación del bostezo para generar la cobertura de la voz, porque al
inicio del bostezo la base de la lengua baja, el velo del paladar se levanta, entonces hay una sensación de
distensión de la laringe. Luego, el bostezo varía.
Sin embargo, hay otros ejercicios que generan mejor movilidad del velo del paladar, pero no cantar con la
sensación del bostezo, porque al cantar con esta sensación, es un movimiento tenso. Se puede usar solo
como recurso de práctica pero no para cantar.
El velo del paladar, si no hay ningún trastorno a nivel motor, tiene mucha movilidad. Hay que estimularlo.
Clasificaciones vocales
Características anatómicas: (no es una regla exacta)
1. tipo físico: personas bajas, voces agudas. personas altas y delgadas, voces graves.
2. apreciación largo y grosor de pliegue vocal, voces graves: p.v largo o delgado. Voces agudas: p.v corto y
gruesas.
3. forma y tamaño del paladar óseo, senos paranasales y resonadores supraglóticos. (por lo general se
espera con personas con cara redonda la resonancia es mejor, que si la cara es estrecha y fina).
4. características funcionales:
• Buscar dónde está la zona de pasaje.
• Dónde es la zona más confortable de la voz o tesitura.
• Cuál es la extensión total de la voz.
5. características acústicas:
• timbre: se refiere a la cualidad tímbrica de la voz en base a los armónicos; color claro (o
brillante) u oscuro.
• intensidad: en general este factor suele unirse a timbre y a la extensión total.
Sin embargo, las clasificaciones vocales no se hacen solo una vez o de una sola vez. Hay que escuchar un par
de veces.
Tampoco es una clasificación tan tajante, se puede extender la extensión vocal. Son referencias para saber
más o menos dónde está la voz de una persona.
Los pasajes de las sopranos se hacen entre un fa3 y un si3 (aproximadamente), depende del tipo de soprano.
Se puede cambiar el movimiento de cambio de báscula laríngea en alguna de esas notas. Las mezzosoprano
pasan entre un re3 y mi3. Y las contralto entre un si2 y un do3.
En los varones el cambio no es tan preciso, porque su longitud de la laringe es distinta que las mujeres,
entonces su pliegue puede extenderse más.
Cantante popular
- La técnica vocal que debe usar el cantante popular no difiere de la técnica del canto lírico.
- La zona de la voz que debe trabajarse es la gama de voz hablada, la respiración costo abdominal. Debe
buscarse la resonancia natural y espontánea.
- Tienen amplificación con el micrófono, por lo que no necesita trabajar el volumen, si no más la dicción, etc.
- Cualquiera sea el estilo musical, las bases fisiológicas de la emisión deben mantenerse: relajación o
bienestar muscular y apoyo respiratorio.
Preguntas en la clase:
*Correlación
Tiene que haber un correlato entre la voz hablada y cantada. Entonces, si hay poca posibilidad de sostener
el discurso hasta los finales de las frases, también se ve en el canto, hay un correlato en esto.
También puede haber falta de musicalidad que se escucha en el habla y en el canto.
La voz hablada también hay que pensarla como una música, hay que hacer variaciones entre la frecuencia e
intensidades.
Sin embargo, muchas personas cantan maravilloso y hablan feo. No siempre hay correlato en todos los
pacientes.
La voz hablada da mucha información. Porque la voz es la misma, la estructura es la misma, etc.
Velt (cinturón) → se mezcla con la voz media, pero el velting se trata de una respiración costodiafragmática
pero que el aire no llegue tan abajo, y con muy poca presión de aire, porque lo que se sostiene es tratar de
nivelar las tensiones musculares entre el cricotiroideo y el tiroaritenoideo. Entonces respirar más alto y con
poca liberación de aire.
También depende del idioma, porque el inglés es muy nasal, y quizás con el español cuesta esta mixtura,
también se la llama voz mixta, porque no está super alto ni bajo, no hay un cambio entre los registros agudos
y graves.
*Comedia musical
Le ponen mucho brillo a la voz, pero es una voz más hablada, es una colocación diferente.
Spech speak singing.
Tienen que saber articular entre el habla y el canto, porque mezclan mucho esto todo el tiempo. Tienen que
ser cantantes y actores a la vez, y tener un gran dominio de la voz para poder pasar de un tipo de emisión a
otro.
*Registro de fritura: no se debería usar tanto al cantar, sino más bien cuando una persona habla y en las
frases finales. Lo que produce es un gran acortamiento del pliegue vocal, con mucha contracción y mucho
contacto.
Quizás mucha gente lo utiliza para hacer un cambio entre este registro y falsete. Y va variando entre fritura
y falsete, para ablandar la mucosa laríngea, por ejemplo luego de mucho impacto o después de mucha tos.
Si tenemos una voz muy disfónica quizás no está este registro de fritura.
16 DISFONÍAS FUNCIONALES EN EL CANTANTE CLÁSICO Y EL CANTANTE POPULAR
¿Qué es cantar?
Es el uso de la voz humana para producir sonido. El pulmón actúa como una reserva de aire y como un fuelle
que empuja el aire entre las cuerdas vocales haciendo que ellas vibren. El sonido resultante se amplifica al
resonar en las cavidades supraglóticas y se articula mediante los labios, dientes, lengua y paladar.
*Y sabemos que todo lo que vamos a hacer, sobre todo con la lengua, el paladar blanco y los labios, vamos
a hacer diferentes modificaciones de sonidos. Hay sutiles diferencias entre un tipo de cantante y otro.
Canto coral
A menudo acompaña las labores manuales, expresa alegría o tristeza o bien forma parte del ritual religioso.
Entre las variadas y numerosas tradiciones del canto coral en el mismo está la polifonía o canto a varias
voces.
Hay una diferencia entre el unísono, que es cuando uno canta, o todo un grupo de gente canta pero lo mismo
con la misma melodía, y es lo que suele pasar en los cantos religiosos, que un grupo es guiado a cantar una
melodía pero no hay diferencias de voces, y entre lo que es la polifonía o canto coral, porque se puede cantar
a 3 voces, a 4, a 6, a 8, a 12, etc. pero se hacen subdivisiones dentro de las mismas clasificaciones, y esto
requiere un poco más de entrenamiento, porque ya el hecho de que haya una persona al lado cantando otra
cosa es un gran entrenamiento, no solo desde lo vocal sino también desde lo auditivo.
Música coral
• Cantada por un grupo de personas que cantan como una unidad. Generalmente el término de música
coral señala que hay dos o más cantantes por cada voz.
• La mayoría de la música coral está compuesta para un coro de mujeres u hombres, mixto, de niños o
adultos mayores.
¿Es conveniente que el alumno sepa su clasificación vocal? Sí. Tiene que ver con un tema de salud y de
cuidado, no poniendo una limitación sino trabajar más dentro de las posibilidades de cada cantante.
Muchas veces lo que sucede es que algunas personas prefieren no decirles a los alumnos su clasificación
vocal, porque después creen que no van a cantar una canción que no esté dentro de su clasificación, sin
embargo, esto depende mucho del estilo de canto, ya que si es popular, uno puede cantar una canción de
un artista con otra tonalidad, ejemplo, si cristina aguilera canta más agudo, bajo la canción para que quede
cómodo para la persona que la va a cantar. Ahora bien, en el canto clásico esto no se puede hacer, las
partituras o escrituras están preparadas para una cierta clasificación vocal, y no se las puede modificar.
Temor a la cirugía por posibles cambios Prefieren la cirugía, para resolver rápidamente el
en la voz. problema.
Tienen mayor percepción de su aparato No es tanta la percepción y hay mayor abuso
fonador. vocal.
Todos deberíamos hacer ejercicios de calentamiento vocal antes de hablar y obviamente antes de cantar.
Parte práctica:
Canción:
En la rama de un nogal canta y trina un zorzal / Trala la la la la la la la la la / trala la / trala la
Es una canción que pasa por una octava, en la primera frase puede empezar en un La2 y luego fue
disminuyendo
Ejercicios: ciertas posiciones mientras se están hablando y haciendo esfuerzo para que se entienda.
• Con la lengua empujando un cachete y luego el otro.
• Con la lengua entre los incisivos de arriba y el labio superior.
• Con los dedos apoyándolos en los cachetes y ponerlos entre los dientes.
Escala perceptual. Es una adaptación de la escala GRBAS (grade, roughness, breathiness, astenicity, strain).
En el mundo se utiliza esta última. La RASAT es la que utilizamos en Argentina.
Ambas son importantes en el día mundial de la voz. El hospital de Clínicas tuvo una gran cantidad de gente
que se acercaba al mismo para atenderse en este día, donde el otorrino evaluaba las cuerdas vocales y al
lado una fonoaudióloga acompañando en la evaluación. Se hacía una detección temprana, y se brindaba un
cuestionario, en el cual aparecían preguntas tales como: ¿Hace cuánto tiene la disfonía?, ¿Es fumador?,
¿Tiene reflujo? cansancio vocal, toma medicamentos, etc. Se iban marcando con cruces y luego se hacía una
estadística. También se evaluaba la voz del paciente, con la escala RASAT. Por lo general, no es un solo
parámetro mal, sino que hay un conjunto o mezcla de aspereza, tensión, etc. Una vez que se veían algunos
parámetros dentro de lo anormal, se pedía que vuelvan a concurrir para un diagnóstico y seguimiento
correcto. Esto era solo una campaña de detección.
A veces no se podían hacer estas campañas, entonces pasaron a hacerse cursos de distintas charlas. Los
resultados de la campaña daban, del total de personas que concurrían, 2% patología premaligna, 1%
patología maligna. La patología más común que se encontraba eran los nódulos, pero se encontraban
muchas enfermedades. Por otro lado, se les entregaba a las personas un folleto con distintas
recomendaciones y pautas, tales como: Tomar agua, si tiene una disfonía de más de 15 días de evolución,
consulte. Cuando hay dolor o reflujo consulte. También se destacaba mucho que no se fumara, ya que era
uno de los precursores más comunes para que se generen patologías malignas.
Consiste en la apreciación subjetiva de las características de la voz del sujeto en función de la experiencia
previa y de los conocimientos del examinador.
En la actualidad no hay un método que haya demostrado ser mejor que los demás para medir la calidad
vocal percibida. Hay diferentes escalas de evaluación perceptual.
Vamos a desarrollar las 2 más utilizadas: Una utilizada más utilizada a nivel nacional (RASAT) y otra a nivel
internacional (GRBAS).
No hay una que sea mejor que la otra pero las escalas de evaluación perceptual son indispensables en la
práctica clínica tanto fonoaudiológica como laringológica.
SI bien existen diferentes formas de evaluar la calidad vocal del individuo, es indispensable y fundamental
escuchar la voz de un paciente que llega con una queja vocal y poder hacer una evaluación perceptiva de
diferentes parámetros que podemos llegar a valorar de la voz de esa persona. Eso es lo que nos permite es
darnos una impresión diagnostica y en el seguimiento de esa persona, poder ir valorando los cambios de esa
persona a lo largo del tiempo.
ESCALA GRBAS.
• Escala creada por Phonatory Funtion Tests of the Japan Society of Logopedics and Phoniatrics en
1969 por Isshiki y cols., y divulgada por Hirano en 1981.
• Es la más utilizada internacionalmente
• De ella se realizaron variaciones como GRBASI, RASAT, RASATI, CAPE-V
Nos vamos a referir en la variación más utilizada en Argentina que es la escala RASAT (y su variación
posterior, RASATI)
La escala GRABAS analiza el grado de disfonía que puede tener una persona teniendo en cuenta cinco
aspectos:
1. GRADO: Calidad de la voz en general, haciendo una integración entre los diferentes parámetros
2. ROUGHNESS/ASPEREZA: Hace referencia a la impresión de irregularidad de los pulsos glóticos
(irregularidad de la vibración de los pliegues vocales) *Este parámetro genera cierta controversia en
cuanto a la traducción del termino
3. BREATHINESS/SOPLO: Hace referencia a un aumento de escape de aire a través de la glotis.
4. ASTHENIC/ASTENIA: Impresión de voz débil, con falta de potencia
5. STRAIN/TENSION: Nos da la impresión de una voz hiper funcionante.
Cada parámetro se evalúa a partir de la emisión sostenida de una vocal /a/ o /e/ y habla conectada.
Es importante tener distintos tipos de pruebas. Ya que hay características que se ven más reflejadas en
emisiones sostenidas y otras en el habla conectada.
*Estas distintas valoraciones pueden realizarse en distintas instancias a lo largo del tratamiento. Y
obviamente al final del tratamiento.
En relación a la escala GRBAS se realizaron diferentes estudios en diferentes lugares a nivel internacional
donde se evalúa la fiabilidad intra e Inter-observador y quedó demostrado que las medidas: Grado,
Roughness (aspereza) Y Breathiness (Soplo) más fiables en las investigaciones, por lo cual, muchos autores
utilizan esta forma abreviada de la escala –GRB- (Webb y cols 2004).
A su vez, otros autores (Picchirillo, et al (1998)), juzgaron importante anexar a la escala GRBAS el tópico de
inestabilidad, llamando a la escala GRBASI.
Pinho y Pontes (2002): El termino Rough en la lengua inglesa generalmente es utilizado para caracterizar la
irregularidad de la vibración, genera cierta ambigüedad traducido. Por lo que puede ser percibido de
distintas maneras, entonces ellos sostienen que es impreciso para distinguir entre la ronquera y la aspereza.
Para alejarse de la controversia relativa a la escala GRBAS, proponen la adopción de una nueva sigla: RASAT
(que sí diferencia los parámetros de ronquera y aspereza)
ESCALA DE EVALUACIÓN PERCEPTIVA DE LA FUENTE GLÓTICA: RASAT
RONQUERA: Se justifica por la irregularidad vibratoria de la mucosa de las cuerdas vocales durante la
fonación debido a la presencia aislada de hendidura glótica, de alteración orgánica en la mucosa vibratoria
o ambas.
Un ejemplo característico de ronquera ocurre en las lesiones de masa. Esta situación genera ruido en bajas
frecuencias.
*Podemos diferenciar ese ruido en bajas frecuencias viéndolo en un espectrograma de banda angosta y
observando dónde se ubica el ruido entre los armónicos.
ASPEREZA: Se relaciona a la rigidez de la mucosa, que también causa cierta irregularidad vibratoria.
La calidad vocal es bien característica, cuya impresión es la de una voz seca y sin proyección. En el análisis
acústico se caracteriza por la presencia de ruidos en alta frecuencia.
*Es importante valorar varias tareas fonatorias, no solo una vocal sostenida.
*Estos dos parámetros comparten la irregularidad vibratoria.
*A diferencia de la ronquera, en la aspereza la voz suena agudizada.
En cambio en la ronquera, que se relaciona con una lesión de masa, en general se percibe como más
agravada. Separar estos parámetros nos sirven para poder identificarlos entre sí.
SOPLO: Ruido de fondo audible, cuya correlación fisiológica más frecuente Es la presencia de hendidura
glótica (Puede ser por ej. En una parálisis recurrencial en la cual los pliegues vocales no se juntan en la línea
media entonces queda una hendidura lotica de cierta dimensión y permite que ese aire salga a través de la
fonación. En algún pólipo chiquito también se puede escuchar cierto soplo si está en el borde libre y también
alguna otra lesión de masa que haga que haya una hendidura glótica o cierre glótico incompleto, que lo
vemos al mirar una fibroscopía).
Excepcionalmente, se puede encontrar soplo en casos de extrema rigidez de mucosa, como por ejemplo
puede ser la presencia de alguna leucoplasia o algún carcinoma incipiente.
*Se escucha sobre todo aire en la voz. En general cuando hay soplo la voz se escucha con un volumen menor.
Muchas veces se relaciona con el termino hipofonía o con una voz con un volumen más bajo del habitual. Ej.
En el caso de una parálisis recurrencial que es el caso más conocido asociado a la presencia de soplo.
ASTENIA: Correlacionada con hipofunción de las cuerdas vocales y poca energía en la emisión, como lo
observado en casos neurológicos, por ejemplo miastenia gravis.
*Falta de fuerza en la voz. Se puede observar en casos neurológicos o algunos pacientes con alguna otra
patología de origen neurológico o enfermedad degenerativa.
Es una característica de la voz que no es fácil de escuchar pero es una voz que nos da la impresión de que
necesitamos acercarnos a la persona para poder escucharla mejor. Es una voz que le falta fuerza o energía.
TENSIÓN: Asociada al esfuerzo vocal por aumento de la aducción glótica (hiperfunción), generalmente
relacionada al aumento de la actividad de la musculatura extrínseca de la laringe, causando su elevación.
*La tensión en general está asociada a la desviación en algún otro parámetro. Muchas veces la tensión
aparece por alguna actividad a nivel glótico.
*Muchas veces la tensión es muy observable en la actitud del paciente al fonar o en como está siendo la
emisión. No solo es audible sino observable en cuanto al uso de la musculatura de la laringe. A veces es más
evidente que otras.
Es importante observar para hacer una observación completa del paciente y no solo lo que se escucha.
En el año 2008 fue introducido en la escala RASAT la “I” referente a la inestabilidad vocal → RASATI
INESTABILIDAD. Lo que se percibe son variaciones de la frecuencia y del volumen de la voz. La imposibilidad
de mantener una emisión estable. Muchas veces asociado a tensión o a alguna patología neurológica que
generan que haya fluctuaciones en la voz.
* En relación a la inestabilidad, en algunos pacientes podemos escuchar que hacia el final de la frase, el
paciente va perdiendo volumen o se va como apagando la voz. La inestabilidad no solo en una vocal
sostenida (en donde es más fácil de percibir) se puede percibir sino en el habla encadenada también se
observa.
*Se pueden visualizar por ejemplo en la disfonía espasmódica: Lo que producen estas patologías
neurológicas son inestabilidades vocales pero también inestabilidades o movimientos anormales de otros
segmentos corporales por eso son fácilmente identificables. La INESTABILIDAD en estas patologías es la
característica más importante.
La escala RASATI también utiliza la graduación originalmente propuesta para la escala GRBAS en cada uno
de sus aspectos en 4 niveles:
0: Normal
1: Leve
2: Moderado
3: Severa
EJEMPLOS Y DUDAS:
¿Cómo diferencio aspereza de ronquera?
No es tan fácil diferenciar salgo que sea una voz muy ronca, muy agravada por ejemplo un edema de Reinke
que en ese caso no hay duda, pero en los casos en que hay irregularidad de la mucosa por ejemplo un quiste,
muchas veces se escucha aspereza y muchas veces ronquera.
Pero si la masa que esta sobre los pliegues vocales genera una voz muy agravada (como en el edema de
Reinke), se parece a lo que es un frito vocal.
A diferencia de la aspereza que se escucha como una voz más rasposa, agudizada.
CONCLUSIONES:
• La valoración perceptiva de la calidad de voz hablada o cantada de un sujeto es uno de los pasos
primordiales en la evaluación clínica
• Si bien contamos con distintas escalas que nos permiten categorizar los aspectos percibidos en la
calidad vocal, es primordial la experiencia del clínico especialista en voz a la hora de realizarse la
evaluación perceptual
• Esta evaluación debe siempre complementarse con las otras medidas subjetivas y objetivas a fin de
orientar el diagnóstico y realizar un adecuado seguimiento del paciente durante el tratamiento.
*Esta evaluación perceptiva que realizamos la hacemos desde que conocemos al paciente.
A partir de la pandemia, los estudios como generan un grado de aerolización muy alto fueron suspendidos
entonces los pacientes que ya estaban en atención presencial pasaron a hacer atención virtual.
Ante la imposibilidad de hacer un análisis acústico de la voz, se valieron mucho de lo que es el análisis
perceptual de la voz. Se trabaja con los pacientes a través de zoom o videollamadas. Pero la evaluación
perceptual de la voz en una etapa inicial, controles o al final de tratamiento se hacen a través de audios
grabados.
Es mejor si el paciente se puede descargar una grabadora de voz ya que los audios de WhatsApp filtran
algunas frecuencias o sonidos entonces es más fiable la grabadora de voz.
Se pide a los pacientes a través de un protocolo que le envían escrito, las tareas fonatorias a realizar y que
les envíen las muestras de voz grabadas.
Eso es lo que sirve para hacer una evaluación perceptual. Mas allá de lo que se escucha en cada sesión o
trabajo con el paciente.
Pero siempre se establece una muestra inicial, una muestra luego de algunas sesiones y una muestra hacia
el final del tratamiento.
Es importante entender la diferencia entre formantes y armónicos, no sólo es importante para el área de la
voz sino también para lenguaje y audición. Incluso para la policía o gendarmería por ejemplo, para poder
detectar la voz, dependiendo de la musculatura y la apertura de la boca y composición de los armónicos y
reconocer a un culpable. Los formantes sirven para reconocer el habla, por eso tienen mejor resolución
temporal. En cambio, al paciente que tengo que analizar la voz y su evolución desde el inicio del tratamiento
y a los 2 meses por ejemplo, lo que se evalúa son los armónicos que tienen mejor resolución espacial en un
momento dado.
¿Qué pasa en las cuerdas vocales con los cambios de frecuencia? Frecuencia no es lo mismo que tono.
En las frecuencias más agudas las cv se alargan y se afinan, mientras que en las graves trabajan engrosadas.
Entonces la mucosa que vibra es diferente dependiendo del registro o cambios en las frecuencias que haya.
Movimientos de elongación, acortamiento, ensanchamiento, angostamiento, si hay un triángulo más
marcado o grueso o más fino, todo esto va a depender del cambio de frecuencia. También los cambios de la
masa. Siempre el análisis de los registros para pacientes tiene que ser de manera espontánea. Nunca le
decimos primero, porque si no podría imitar.
ANÁLISIS ACÚSTICO DE LA VOZ
Frecuencia fundamental (F0): corresponde al componente frecuencial (1° armónico) más bajo de la señal.
Representa el n° de veces que las cv se abren y cierran por segundo, y se expresa en ciclos por segundo o Hz.
*Si una persona tiene una A de 220 Hz y estuvo hablando por una hora y media. La cantidad de veces que
las cv se movieron y abrieron y cerraron son muchísimas. El cansancio vocal es impresionante si uno no tiene
una pausa o descanso de las cv.
*Si una persona grita, va a ser la cantidad de veces que se mueven las cv más el choque brusco.
La laringe humana es capaz de producir una amplia gama de frecuencias (rango vocal, no le decimos
extensión para el análisis acústico sino para la parte artística), que varía en función de la edad y del sexo. Los
valores normales son alrededor de 125-150 Hz para el hombre, 250 Hz para la mujer y 350 Hz en la infancia,
dependiendo de su edad. *Estos valores normales tienen que ver con la contextura física, la altura (porque
tiene que ver con el tamaño de las cv) y con su edad.
*Dentro de los valores normales también tenemos que tener en cuenta su nacionalidad, su cultura, donde
vive geográficamente (el ejemplo de que las porteñas tienen una voz un poco más grave).
Se expresa en ciclos vibratorios u oscilatorios (podemos verlos en el Anagraf si ampliamos la forma de onda).
La duración de cada ciclo que compone la F0 se denomina periodo (T) y se mide en segs. Frecuencia y periodo
tienen una relación inversa, de manera que conociendo uno podemos averiguar el otro: T=1/F0 y F0=1/T.
Frecuencia (análisis acústico) /tono (uso artístico): la percepción psicoacústica del hecho físico de la
frecuencia es el tono vocal. Cuando aumenta la F0 el tono se hace más agudo, y cuando disminuye se hace
más grave. Estos cambios no son lineales y no percibimos igual el mismo aumento a una frecuencia baja que
a una frecuencia alta.
*Se dice que los cambios de frecuencia baja se perciben mejor que las altas frecuencias.
Variación de la F0: esta puede variar dentro de unos límites determinados, en función de:
• La masa de las cv, cuando la masa aumenta (por una patología, ej.: Edema de Reinke, gran
vascularización, masas intracordales) disminuye la F0 (la voz se hace más grave).
Por ejemplo, el paso de 100 a 150 Hz es más evidente para nuestros oídos que el de 2500 a 2550 Hz. Las
notas musicales reflejan este fenómeno de percepción y así el paso del Do de la primera octava al Do de la
segunda es de 32,7 a 65,4 Hz, (se percibe mejor) mientras que el paso del Do de la quinta al Do de la sexta
octava (más agudo) es de 523,2 a 1046,5 Hz: para subir una octava (12 notas entre tonos y semitonos) hay
que duplicar la frecuencia en el rango de las frecuencias altas. (Ej.: “La” con el que hablo es 220 Hz, si
aumento a la2 es 440, la3 660, y así sucesivamente.)
• La longitud y la tensión de las cv: lo normal es que ambas varíen conjuntamente, y con un aumento de
la longitud aumenta la tensión de la cuerda, lo cual se traducirá en una vibración más rápida y por lo
tanto en un aumento de la F0 produciendo un sonido más agudo (variación isotónica).
También puede aumentar la F0 sin aumentar la longitud, pero incrementando la tensión (variación
isométrica).
Jitter: entendido también como una medida de la variabilidad de la frecuencia. Las mediciones del Jitter son
variaciones relativas en tiempos pequeños.
Puede informar sobre el estado de la glotis.
Los valores se relacionan con las características perceptuales del sonido: áspero o soplados, y del estado de
las cv.
→ Ciclos vibratorios: su similitud y estabilidad demuestra la periodicidad oscilatoria de las cv. Si los ciclos
duran lo mismo o casi lo mismo entonces el Jitter va a presentarse sin alteración.
Entre un ciclo y otro tiene que haber una misma distancia en tiempo. Si hay mucha diferencia y distancia hay
cierta aperiodicidad.
Sin embargo, siempre va a haber una mínima alteración, por mejor cantante que uno sea, el Jitter no va a
tener un valor absoluto en producción humana, es decir que la perturbación de la frecuencia nunca va a ser
igual a 0, eso lo puede dar un instrumento musical o alguna emisión electrónica, sino siempre va a haber una
mínima perturbación de la frecuencia ya que nuestra oscilación no es absolutamente periódica en el tiempo,
en realidad es cuasi periódica.
*El más conocido es el Jitter pero también otro usado actualmente es el cepstrum.
Es una técnica de medición de la F0.
Amplitud de Cepstrum: medida del grado de periodicidad que tiene la señal en un instante determinado.
En las emisiones que presentan ruido, los valores de amplitud del cepstrum son menores. Para el Anagraf
tiene que ser mayor a 0.2. En el PRAAT será otro.
Intensidad: al igual que la F0, la intensidad varía de forma involuntaria durante el habla, pero esta variación
es normal y útil para la correcta interpretación de los mensajes que se quiere hacer llegar al interlocutor, y
no es éste el ámbito del estudio de las perturbaciones. Para el análisis acústico le llamamos amplitud.
Shimmer: las mediciones de esta sirven para cuantificar pequeños lapsos de inestabilidad vocal. Se miden
sobre la base de los grados de amplitud en cada ciclo fonador. Los picos de los ciclos si son parejos nos dan
una idea de una perturbación mínima de la amplitud.
El sistema lo hace automáticamente y nos da un valor normal o alterado. Una voz va a tener una pequeña
inestabilidad normal o esperable. Si hay una variación grande, hay una posible patología. Sin embargo, al
igual que el Jitter, no se ha podido vincular con una afección determinada.
>>>> Los valores de Jitter y Shimmer varían según el sistema que se use para analizar la voz <<<<
Parámetros de ruido: La relación armónico-ruido (HNR) es una medida que cuantifica la cantidad de ruido
en la señal de la voz. Es el cociente entre la energía de componentes armónicos de la señal y la
correspondiente al ruido.
El ruido espectral se muestra como puntos, con menor o mayor densidad, entre los armónicos. En el
espectrograma, especialmente en el de banda estrecha, lo primero que debemos fijarnos es en la agudeza
con que se perfilan los trazados horizontales de la F0 (si están estables) y los armónicos. En las voces
normales hay una gran riqueza de armónicos (negro) y escaso ruido interarmónico (gris), lo cual refleja un
buen cierre glótico.
Por lo contrario, en voces disfónicas, con predominio del componente aéreo o turbulencias, las líneas de los
armónicos están mal delimitadas y hay mucho ruido entre ellas. Aunque ninguna voz, por normal que sea,
tiene una ausencia absoluta de ruido, cuando más disfónica sea más ruido contendrá el espectrograma.
El valor normal (Para Anagraf, para otros programas el valor de índice armónico/ruido varía) es de 5 o mayor.
Acá hay soplo. Se perciben claramente armónicos en las frecuencias graves y se desdibujan en las frecuencias
medio agudas por componente ruido.
Acá hay alteraciones, hay un gris difuso. Sin embargo, se ven los armónicos pero son pocos. La primera línea
negra de abajo es la F0, luego comienzo a contar para arriba, 5 más o menos. Lo de arriba gris es el
componente de ruido. Aparecen además subarmónicos (mitad de armónico) en el inicio fonatorio (voces con
aspereza) porque no hay buena oscilación de cv, y quizás están interviniendo estructuras supraglóticas en
esta oscilación (bandas ventriculares). Si uno mira el contorno de frecuencia en estas voces muchas veces
hay interrupciones.
Estudio acústico:
paciente: Alejandra, edad: 28 años, fecha: 12-4-2020, cv sin alteraciones, emisión de la /a/ sostenida.
El valor de F0 es de 209 Hz: levemente descendida. (normal 220-240 Hz según sexo y edad cronológica).
Puede variar el laboratorio de la voz porque no desayunó la persona, porque los movs. de ascenso y descenso
de la laringe permiten que la F0 se eleve por ejercicio deglutorio.
Lo verde es la forma de onda. Si yo amplio veo los ciclos.
Lo rojo es el contorno de amplitud.
El azul es el contorno de frecuencia. En el cuadro están todos los valores.
Esto me muestra el funcionamiento de las cuerdas vocales, de los ciclos vibratorios.
Lo verde no es absolutamente estable, no es perfecta la voz humana.
Se elige una porción para buscar los parámetros y resultados. Depende de cada profesional u hospital y se
eligen una cierta cantidad de segundos de esta porción, depende de la modalidad. Pero se tienen que
informar la cantidad de segundos que han sido utilizados.
Lo normal es tener de 20 a 50 armónicos, tener 50 es raro pero puede ser por ejemplo un cantante lírico.
Espectro LTAS (long term average spectrum (?) Gráfico de sección (se toma o selecciona un momento dado
de pocos segundos, no es a lo largo del tiempo) que muestra armónicos y formantes en forma vertical.
(clickear a la izquierda del sistema, donde dice Sec- LTAS, al LTAS se lo llama espectro de sección).
El espectro LTAS es más preciso y me permite ver si los armónicos y formantes tienen buena amplitud y si
los armónicos acompañan a los picos de los formantes. En este caso los acompañan.
Observo 4 formantes claros y sobre el final un último con un pequeño pico.
El primer formante tendría que ser igual en amplitud al segundo en una voz bien trabajada. Después van
disminuyendo alrededor de 12 dB por octava.
Algo importante: en la 4ta ventana del 1er gráfico del estudio acústico completo, el valor de armónicos/ruido
es:
H/N: harmonic/Noise: 6.39 dB: dentro de valores normales (normal > a 5 dB).
No tiene patología en cv, pero se observa muy leve inestabilidad en especial en el contorno de amplitud. Por
eso se habla de cuasi periodicidad y de aperiodicidad en caso de alguien que tenga todo alterado.
Los hablantes sin patología presentan cuasi periodicidad. Los valores del Jitter y Shimmer normales no son
iguales a 0. No producimos sonidos artificiales: un piano puede producir una nota estable en el tiempo y si
se analizara mostraría quizás algo más estable que nuestra voz. Lo mismo con el tono de un teléfono de
línea.
Índice de riesgo vocal o de perturbación integrado: con cuatro valores: Jitter, Shimmer, Cepstrum y H/N.
El cepstrum es otra forma de medir la perturbación frecuencial. Su valor normal debe ser mayor a 0.2.
Sirve para medir voces más “caóticas”, que no se pueden sostener en el tiempo (x ej, voces con disfonía
espasmódica, o con mucha aspereza).
Cuando todos los valores están dentro de la normalidad los 4, se ubican en este gráfico en el cuadrado
inferior.
Cuando están alterados, se ubican en el cuadrado superior a la izquierda.
En cuanto a lo numérico deben dar los cuatro un menor a 2 (esto se refiere al índice de perturbación
integrado).
En este caso dan 1.25: dentro de lo normal.
Dónde está la bolita verde es donde indica el cepstrum. Que en este caso está dentro de la normalidad.
Precisión Vocal Total: orientada a lo articulatorio en el tiempo. Tiene que ver con la posición de la lengua y
órganos fonatorios para los formantes.
Para esta /a/ sostenida debe dar > a 90%. En este perfil acústico da 93%: sin alteración. Si mi /a/ es más
cercana a una /o/ se me va a ir para arriba a la derecha, si es más cercana a una /e/ porque estoy sonriendo
por ejemplo, se me va a ir arriba a la izquierda. Voy a tener mayor precisión vocal cuánto más seguridad
tenga en la emisión y más estable sea esa nota durante el tiempo de emisión.
Aprovechamiento de energía: cuando los picos de armónicos coinciden con los formantes (LTAS) quiere
decir que hay un buen aprovechamiento de energía.
35%. Lo normal es mayor a 20%. No presenta alteraciones.
Hacemos un cambio a la izquierda del gráfico para investigar formantes (mayores concentraciones de
energía) se hace click en LPC. En la ventana superior se observa el espectro de banda ancha.
Podemos ver bandas de grises más oscuros y más claros. Sobre los más oscuros, se observa la línea de
puntos. Cada línea de puntos se sitúa en una frecuencia determinada.
Abajo, en la 4ta ventana de los cálculos o magnitudes, se observa: F1, F2, F3, F4 y F5: son las frecuencias de
los formantes. Se calculan en Hz. Y a la derecha hay otra información: B1, B2, B3, B4, B5: son los anchos de
banda.
F1: lo normal para una /a/ es que este cerca de 900 (en mujeres, en hombres más cerca de los 600 y en niños
está más cerca de 1000).
Si está alejado (200, 300) suele tener voz nasalizada, no levantó el velo del paladar correctamente, etc.
El paciente con patología compensa, trata de hablar como puede y el aire se le va a la nariz.
Las líneas blancas son los formantes (lo que veíamos antes en picos en el otro gráfico).
Cada formante tiene un pico y un ancho de banda, esto no lo informamos como terapeutas vocales.
Si yo bajo 5 decibeles del pico y trazo una línea horizontal me va a dar un ancho de banda. Cuanto más picudo
es el pico menor es el ancho de banda y viceversa. Una voz bien colocada va a tener un pico muy marcado,
de buena amplitud, si bajo 5 db me va a dar un ancho de banda angosto (más picudo), eso significa que hay
buen aprovechamiento resonancial. Si mi voz no está tan aprovechada o tuviese alguna patología el pico va
a ser más bajo y el ancho de banda va a ser más ancho (menos picudo).
La frecuencia de los formantes varía según sea la vocal que se emita. Existen valores de normalidad para
estos resultados de frecuencia de formantes según se emita /a/, /i/ o /u/. Asimismo para el resto de los
fonemas del habla.
Aquí vemos los picos de formantes situados en diferentes frecuencias dada las diferentes posiciones de los
órganos fonoarticulatorios. (Cada formante tiene un pico y un ancho de banda).
El tercer dibujo muestra el formante, su pico frecuencial, su energía y el ancho de banda. En el estudio
acústico el ancho de banda se llama B1, B2, etc. según cada formante.
Cuanto más angosto es el ancho de banda hay un mayor aprovechamiento resonancial.
En la /i/ y la /u/ hay un tracto vocal semiocluido, en la /a/ está más abierto (deja escapar todo).
Este estudio de reconocimiento de voz lo hace un fonetista, un lingüista o alguien de la policía federal.
Formante de cantante: los estudiantes de canto se enriquecen con armónicos y modifican muchísimo los
valores de frecuencia, energía y ancho de banda de los formantes y sus características de a medida que
estudian y entrenan. Mejoran el aprovechamiento resonancial.
Un estudioso de la voz cantada y la acústica ha sido Johan Sundberg, sobre la producción vocal de los
cantantes de ópera. Este autor introdujo el concepto de Formante del Cantante (1977) explicando que el
cantante produce un sonido con una resonancia especial, que lo ayuda a destacar su voz del
acompañamiento orquestal. En algunos teatros por ejemplo los cantantes de ópera tienen 100, 120 dB de
intensidad, no usan micrófonos y se los escucha ya que desarrollaron dicho formante.
Cerca de los 2000 y 3000 Hz aumentó la amplitud de este formante gracias a la educación vocal.
La tabla de valores en el análisis acústico para estos cantantes va a ir creciendo en vez de disminuir.
Otros sistemas de análisis acústico
PRAT
Es gratuito, puede bajarse de internet.
Aquí vemos:
En la primera ventana: la forma de onda.
En la segunda:
• los armónicos (filtro de banda angosta).
• Contorno de frecuencia en amarillo y contorno de amplitud.
• Valor del contorno de frecuencia (215 Hz) y valor del contorno de amplitud (energía) en dB.
Se miden de 0 a 5000 hz los armónicos.
Es excelente, pero tenemos que fijarnos en la distancia con el micrófono y ver que no haya ruido ambiente.
WAVE SURFER
También se baja de internet.
En la segunda ventana se ven los picos de los formantes en colores (espectro de banda ancha).
Las líneas en vertical (paralelas a los colores) son los ciclos por segundo.
En las ventanas de abajo puedo buscar los valores de los formantes. En este sistema son frecuencias no
exactas, aparecen con decimales.
GRAF
También se puede bajar de internet.
Me muestra armónicos en el tiempo.
La persona está diciendo algo por eso se resaltan unos armónicos al inicio y otros no.
DR. SPEECH
Recuadros de izquierda a derecha:
1° Jitter
2° Shimmer
3° Frecuencia
4° armónico/ruido
Líneas horizontales de abajo: “calidad vocal estimada”
1° voz ronca
2° voz áspera
3° voz con soplo
(cuadro a la izquierda)
En la segunda ventana veo la forma de onda.
En la primera ventana veo armónicos y componentes de ruido (difuso gris), es una voz patológica.
OTROS SISTEMAS
• Pitcher
• Voice explorer
• Computerized speech research enviroment
• Computerized speech lab: CSL
• Multispeech
Emisión vocal
Es el resultado de la interacción de la fuente: cuerdas vocales y filtro: tracto vocal (parte superior de la
laringe más la parte inferior de la faringe que luego va a la boca y la parte superior de la faringe que va a la
nariz).
GLISSANDO
Hizo un glissando de la nota más grave a la más aguda y lo amplió, dejó solo el contorno de frecuencia. Da
de donde a donde se extiende.
Ciclos
Vemos un solo ciclo, cv se van cerrando (forma convergente) y abriendo (forma divergente).
El ciclo vibratorio, o la onda, va de abajo hacia arriba.
Análisis acústico:
• modelo lineal (de Fant)
• modelo no lineal: estudia medidas de caos.
ANAGRAF
Primero, segundo y tercer formante tienen picos altos, una muy buena
amplitud. Los armónicos también son muy estables, parejos y se pueden
contar, y tienen buena amplitud, salvo cuando miramos el primero, que no
coincide exactamente el pico del formante con los picos de los armónicos,
pero esto luego de trabajar un poco la voz, comienza a coincidir.
ÍNDICE DE LYAPUNOV
Es un índice para medir a la gente que tiene parálisis, una disfonía espasmódica, que le sacaron una cv, surco
vocal bilateral con una aspereza terrible.
Realizar el análisis perceptual + acústico lineal + acústico no lineal con los coeficientes de Lyapunov
aplicados a la medición de voces con alta perturbación o caos fonatorio.
Los métodos tradicionales no cuantifican ciertos tipos de alteraciones. El modelo de fuente y filtro basado
en teorías acústicas dinámicas lineales no representa adecuadamente todas las alteraciones del habla.
Parálisis de cv izquierda:
inicio de la terapia vocal: Valores de jitter: 56.10% shimmer:
2.40 LME: -0.36
Todos los índices dan malos.
Control de la terapia:
jitter: 3.2% shimmer: 0.34 % LME: 0.43
No es voz normal pero es una mejoría.
Entonces, el informe con todos los estudios acústicos que realizamos a un paciente es:
Índices de perturbación que indican cuasi periodicidad o aperiodicidad
Índice de Lyapunov: 0.53
Aprovechamiento resonancial
19 armónicos hasta los 5100 Hz. No hay aprovechamiento del tracto vocal. Porque está por un lado la emisión
llevada hacia más una /o/ y aparece esa nasalidad.
Precisión vocal total: 79%: descendido (normal > a 90%). Indica nasalidad por la colocación vocal.
Rango vocal
-Emisión de vocales de fr. graves a agudas, en forma deslizada.
-Emisión de frecuencias agudas a graves*.
-Se informa el límite superior en el inferior, en Hz y en notas musicales.
*Muchas veces en pacientes, por ejemplo con una muda vocal incompleta, en chicos de 14/15 años, que
hablan en un falsetto, y no le da el límite inferior, entonces para hacer el rango vocal se pide que se haga de
agudo a grave, para poder bajar lo más posible, algo que no podía hacer sin esta forma deslizada.
La forma de buscar el rango vocal es esta:
FONETOGRAMA
Rango vocal del habla: 8 semitonos: disminuido (normal es 11 semitonos).
Frecuencia más utilizada: 231 Hz. s/p.
Oración fonéticamente balanceada: “digo rápido algunas palabras en español o
castellano, justamente la lengua que se habla en Argentina. Bueno, muchas
gracias”.
Rango vocal con /u/: 194 a 1137 Hz, de Sol2 a Do#5: cercano a 3 octavas de
emisión.
Abarca registros modal y falsete (e incluso una zona más aguda del falsete).
Mide cociente de apertura y cierre de las cv. No se hace en el hospital por falta de equipo.
1. onda normal
2. falla de cierre glótico (prolongación, fase abierta)
3. onda irregular, se presenta tanto en alteraciones orgánicas como funcionales.
4. Fonación en bandas: se ve doble pico, el mayor corresponde a la vibración de los pliegues verdaderos
y el menor a los falsos.
10 CHARLA CON JORGE GURLEKIAN
Ingeniero e investigador del conicet y creador del programa ANAGRAF.
• ATR: Histograma de F0 (para saber la F0 que más utiliza el paciente dentro de los F0 por ejemplo en voz
hablada) y Fonetograma de la voz hablada y cantada. Antes se hacía de una manera más artesanal con
el teclado y el decibelímetro, pero ahora se puede hacer de manera digital.
También en este programa se calcula el cepstrum, pero es el cepstrum suavizado, que permite calcular
aspectos de cualidad de voz.
Referencias: fonetograma de la voz hablada: valores de referencia normal para hablantes masculinos y
femeninos. UBA. Facultad de Medicina. 2002.
CEPSTRUM
Dentro de las medidas objetivas se encuentra el cepstrum.
Es una medida de la armonicidad que tiene una emisión de habla. En una voz donde predomina el ruido, no
hay armonicidad, entonces el cepstrum ahí dará un valor muy bajo. Si hay una voz con poco ruido y muy
armoniosa, el cepstrum dará valores más altos. Entonces mide la calidad de la voz, sobre todo teniendo en
cuenta la presencia del ruido. Sin embargo, además del ruido, hay otros componentes que tienen que ver
con los armónicos, y si estos no están variando suavemente, el cepstrum también lo mide.
Se usa particularmente cuando hay alteraciones severas de la voz. No solo se usa para voces normales y poco
disfónicas. Habitualmente los métodos calculan la F0 a través de métodos frecuenciales o temporales, pero
como la F0 está muy deteriorada y destruida, estos métodos fallan o no pueden utilizarse directamente.
Pero el cepstrum se puede aplicar porque hasta puede evaluar ruido.
Lo mismo sucede con el Retrato de Fase - Lyapunov, o el LTAS (espectro promedio de largo plazo).
Entonces el cepstrum se encuentra dentro de esta trilogía de mediciones vinculadas con alteraciones
severas, pero también se puede usar en voces normales y poco deterioradas.
CEPSTRUM → SPECTRUM. Son palabras muy similares, justamente el spec es la inversa de ceps. O sea, el
espectro logarítmico deriva a cepstrum. CEPSTRUM es la inversa del espectro logarítmico de la señal. Pero
es simplemente una regla mnemotécnica.
En Praat se utiliza otro algoritmo, que calcula el cepstrum suavizado. Hay que saber los valores de normalidad
para un programa y para otro. Son lo mismo pero no miden de la misma manera.
En el Anagraf: abajo de todo hay unos botones amarillos que uno de ellos es el botón del cepstrum, que dice
aplitud del cepstrum. También hay otro botón en el panel de la izquierda que dice CP que calcula el contorno
de F0, cuando este está continuo aparece como una línea continua.
PROCESAMIENTO HOMOMÓRFICO
Tenemos una señal, y le calculamos el espectro. Aplicamos la transformación de cepstrum, que consiste en
hacer la inversa del espectro, entonces hacer la inversa me lleva a tener la onda de nuevo, pero en vez de
representarla como la señal y en función del tiempo como todas las frecuencias, esta inversa hace una
representación tal que se pone en escala logarítmica en función del tiempo. (Recordar que la frecuencia es
inversa del tiempo), entonces el tiempo que hay en la amplitud del pico de cepstrum, que sería el tiempo
mayor o de mayor duración, va a tener la frecuencia más baja, y la fr. más baja en una señal de habla es la
fundamental. Entonces ese máximo, en el eje del tiempo, corresponde al periodo fundamental. Si uno hace
la inversa del periodo fundamental, obtiene la F0. Y todas las otras frecuencias se amontonan al inicio de la
escala de tiempo.
Así que lo que hizo el CEPSTRUM es evidenciar si había una F0, y este máximo de este pico va a ser más alto
cuando más armónica sea la señal.
Se mide la altura de ese pico, desde el máximo hasta su base, y esa es la amplitud.
• Cuando la señal es totalmente periódica y no hay ruido, el máximo de ese pico va a ser 1.
• Cuando no hay F0 va a ser 0 o hasta negativo, porque el ruido puede ser mayor que ese máximo.
1. La fuente de Excitación (E) debida a un tren cuasi periódico de pulsos generado por la vibración glótica
de -12 dB/octava de caída en los armónicos, o debida a un ruido generado en cualquier punto del tracto
vocal. Para generar habla tenemos la fuente de excitación antes que nada. Pueden ser la F0 y sus
armónicos o puede ser ruido.
3. Un componente de radiación desde los labios hasta el oído del receptor. Que
explica el realce de altas frecuencias +6 dB/octava al propagarse el sonido por el aire.
La contribución del tercer componente suele integrarse al primero.
TONO GLOTAL (lo primero), FORMA DE LA /a/, REALCE DE LAS ALTAS FRECUENCIAS.
CEPSTRUM
• Como la señal de habla es una combinación o convolución de los dos primeros componentes, una técnica
para estimar los parámetros del habla es separar o deconvolver la señal, teniendo en cuenta que las
características espectrales de los dos componentes son bien diferentes.
Es decir, el habla es una combinación de la excitación debida a la vibración de los pliegues vocales o
debido al ruido, y donde esa energía resuena, que es el tracto vocal. Entonces son dos componentes
espectrales muy diferentes, y a esa combinación se la denomina convolución (término matemático).
• El proceso de convolución implica transformar el producto de dos señales en su suma. Como esta suma
implica a dos señales con espectros diferentes, entonces las podemos separar mediante un filtrado lineal.
La transformación deseada es logarítmica.
• Esto se logra al obtener el espectro de Fourier de la señal combinada
E es el espectro de la excitación y Tv es la salida del tracto vocal, luego se realiza el filtrado mediante
la transformada inversa de Fourier.
• En síntesis, el Cepstrum de una señal es el resultado de calcular la transformada inversa de fourier
del espectro de fourier de la señal en escala logarítmica (dB).
1a. Gráfico de Cepstrum de una señal aperiódica. Valor de cepstrum muy bajo.
1b. Gráfico de una señal periódica sin ruido. Más cerca de 1 el cepstrum.
1c. Periódica con ruido. (Lo rojo sería el ruido).
1d. Periódica con mucho ruido. Da negativo, predomina el ruido.
La amplitud del pico de cepstrum se indica con la doble flecha.
Entonces el cepstrum se utiliza en un esquema junto con el jitter, shimmer y armónico ruido, para definir lo
que es el riesgo vocal.
Acá encontramos los 4 parámetros en este gráfico, el cuadrado amarillo rodeado del circulo verde es el del
parámetro de normalidad, y sobre la diagonal, hay distintos parámetros en distinta zona, representados por
los círculos de colores.
El cuadrado verde significa super normal, y la parte amarilla ya implica una zona de riesgo.
El cuadrado rosa es de alta alteración, y la zona amarilla es de riesgo vocal.
Entonces lo que permite este esquema, es que cuando miramos los parámetros y alguno contradiga a otro,
cada uno va a ser evaluado dependiendo de a dónde caiga en este esquema. Cuál va a ser la contribución al
índice de perturbación. Si cae en la zona verde, la contribución va a ser 0. Si cae en la zona rosa, la
contribución va a ser 5.
Si cae en otro lado, irá aumentando mientras más cerca al cuadrado rosa esté.
Entonces, de acuerdo al valor del Shimmer, jitter, amplitud del cepstrum y armónico-ruido, va a haber
distinta contribución, y lo que se hace es promediar la contribución de estos parámetros, y eso nos da un
valor promedio.
Si la contribución es menor a 2, es una voz normal. Si es mayor a 3 hay alteración. Y si cae entre 2 y 3, está
en riesgo.
EJEMPLOS:
Índice de perturbación:
El 1° ejemplo: 0.25, por ende es normal.
El 2° ejemplo: 2.25 ya está en zona de riesgo.
El 3° ejemplo: 3.50 ya hay alteración.
Se promedian los valores porque hay algunos que pueden dar normal y
otros que no, y no se puede tomar objetivamente si está o no en riesgo,
por esa razón se promedian y de acuerdo al valor nos indicará cómo se
encuentra el paciente.
¡RECORDAR!
La amplitud va a depender tanto de lo inarmónico de los armónicos, como de la presencia de ruido. El
cepstrum mide ambas cosas porque se mide la amplitud respecto a la envolvente que está dada por la
energía de la vocal y del ruido.
Jitter y Cepstrum
Cuando la frecuencia fundamental está cortada o interrumpida, el Jitter va a dar cada vez más alto, mucho
mayor a 1. Entonces se empezó a ver que el uso del jitter en voces altamente disfónicas, en realidad no
estaba dando ninguna información interesante, era de suponer que iba a dar más alto el jitter, con el propio
oído te das cuenta, y que de 2, 3, 5, es lo mismo, ya que no está midiendo correctamente. El jitter necesita
el F0.
Entonces, el jitter se usa para voces normales o levemente disfónicas. No para voces con alta alteración y
donde el F0 no está. Y revisando en los algoritmos, se dieron cuenta que había que usar el cepstrum (en
ingeniería se usa este concepto, no es una medida nueva, sino que viene a salvar los errores que se cometían
con el jitter).
Por otro lado se utiliza el jitter solo donde se cree que es confiable, y se pinta la onda en cierto segmento. A
Gurlekian esto no le pareció correcto, porque se da un valor a solo un segmento y no a toda la onda, sin que
uno sepa cuál era ese segmento. Entonces de ahí surgió la idea de comparar el cálculo de F0 por dos métodos
(el método temporal y un método espectral) y si son iguales o dentro de una cercanía quiere decir que era
confiable.
Pero se dieron cuenta que con el cepstrum se supera este problema, o por lo menos daba una información
que se sumaba a la del jitter. El cepstrum tolera que no haya F0.
7 CLASIFICACIÓN DE LA SEÑAL
National Center for Voice And Speech (1995), Clasificó los tipos de señales. Esta clasificación tiene que ver
con el ruido en esa voz.
Señal 1: Señal cuasi periódica que no presenta alteraciones cualitativas en el segmento analizado, si existen
modulaciones o subarmónicos su energía tiene magnitud inferior a la energía de la frecuencia fundamental.
Son voces normales o levemente alteradas. índices de perturbación confiables. (Puedo confiar en ese valor
numérico ya que la frecuencia fundamental se distingue claramente y eso hace que el sistema lo pueda
calcular sin ningún problema).
Señal 2: Señal acústica con alteraciones cualitativas, subarmónicos, intermitencias, diplofonía y
modulaciones. La amplitud de los subarmónicos es tan alta que no existe f0 única en la mayor parte del
segmento. Esta señal permite visualizar el trazado con dificultad y no permite realizar mediciones confiables,
salvo en algún pequeño segmento estable. El análisis visual de trazado es descriptivo y depende de la
experiencia del evaluador. La mayor parte de las voces patológicas producen esta señal sonora.
*Son las señales que mayormente tenemos en la clínica.
*Si pude tomar un segmento estable de por ejemplo 1 segundo de emisión los valores, en ese segmento los
puedo considerar confiables. Siempre cuanto más tiempo de análisis tengo para los valores de perturbación,
mejor.
Señal 3: Señal sin estructura periódica aparente. Es aperiódica o casi caótica que no permite realizar
mediciones confiables y el análisis visual es acotado. Es en pacientes con disfonías espasmódicas, disfonías
por CA.
*No podemos realizar mediciones confiables. únicamente vamos a poder hacer un análisis visual del
espectrograma y los diferentes tipos de gráficos que nos otorgan los sistemas como para hacer un informe.
*Tienen que ver con disfonías moderadas a severas, disfonías espasmódicas, disfonías por cáncer,
cordectomías, etc. Son voces que no se pueden analizar desde lo numérico.
Hay que tener en cuenta el tipo de señal que estamos analizando para saber si los parámetros que estoy
analizando, son confiables o no.
Ej. En una voz muy ruidosa donde la frecuencia fundamental el sistema no la puede extraer claramente
porque hay mucho ruido. ¿Cómo sé si ese valor que me tira el Jitter y Shimmer son confiables? Teniendo en
cuenta el tipo de señal, yo voy a poder saber si puedo considerar confiable o no ese valor.
ÍNDICES DE PERTURBACIÓN:
• Son medidas de variabilidad de la señal ciclo a ciclo. A corto plazo. (Las variaciones ciclo a ciclo no se
perciben como variación de tono o la intensidad sino que se perciben como ruido).
• No son percibidas por el oído como variación, sino como ruido
• No es posible corregirlas voluntariamente.
• Se miden por lo general en la vocal sostenida /a/, sin variación de tono o intensidad
• Se toma para su medición el segmento más estable, evitando inicio y final
• JITTER: (Local, local absoluto, rap, ppq5, ddp)
• SHIMMER: (Local, local-Db, apq3, apq5, apqll, dda)
• HNR-NHR
JITTER:
• Evalúa la perturbación del periodo ciclo a ciclo (frecuencia)
• Es un índice de estabilidad del sistema fonatorio, evalúa la cantidad vibratoria de los pliegues vocales
(cuan periódica es la vibración de esos pliegues vocales)
• Tiene relación inversa con la F0 y la amplitud (Al subir la F0, baja el Jitter; Cuando sube la amplitud,
disminuye el Jitter). *Es importante tenerlo en cuenta cuando hacemos reevaluaciones.
• Sensible a las alteraciones aerodinámicas, de tejidos o control neuromuscular
• Se expresa con un porcentaje (en el PRAAT) *Por lo general en pacientes donde haya lesiones fono
traumáticas o lesiones de masa en las cuerdas vocales o alteraciones neurológicas, por lo general el Jitter
va a dar alterado.
SHIMMER:
• Evalúa la perturbación de la amplitud ciclo a ciclo. No se percibe como variación
• Tiene relación inversa con la F0 y la amplitud
• Casi siempre cuando aumenta el jitter también aumenta el Shimmer
• Cuando hay ruido en la voz se aumenta, relación con la resistencia glótica (ruido de soplo).
• Se expresa en porcentaje o dB (dependiendo cual sea el tipo de Shimmer que se va a utilizar).
CEPSTRUM:
• Es una medida espectral que mide la estabilidad del periodo, pero a partir del espectrograma (F0). Es
más confiable en voces ruidosas que el Jitter, por eso a nivel mundial se está utilizando más el
CEPSTRUM que los índices de perturbación. *Lo que hace es medir la energía del primer armónico.
• Se logra por medio de una doble transformada de Fourier
• Cuanto más periódica es la voz, mayor será la amplitud del pico cepstral y más agudo en su ángulo.
• El cepstrograma es un gráfico de amplitud por tiempo (quefrency = periodo) para calcular la
frecuencia (Calculo de la F0: 1/Periodo) 1/0.004204 = 237.8686
*El CEPSTRUM hoy por hoy es la medida por excelencia para medir estabilidad en la voz en la frecuencia
fundamental sobre todo.
17 INVESTIGACIÓN DE LA FONOAUDIÓLOGA
Relación entre el diagnóstico morfo-funcional de la laringe y los parámetros acústicos de la voz en un
grupo de pacientes que asisten al servicio de estroboscopia de una clínica de la ciudad de Cali.
Contenido de la investigación:
1. Introducción
La voz en el proceso comunicativo involucra muchos elementos, no solo en el componente anatomo-
fisiológico. También tenemos que tener en cuenta el componente lingüístico, físico-acústico y social-
comunicativo.
Es importante entender la anatomía y la fisiología de la voz para poder entender porque se aplica una técnica
u otra al trabajar con pacientes. Es vital conocer este componente, pero este no se desliga del componente
lingüístico, donde se debe tener una competencia para poder hacer determinados sonidos como lo exige la
lengua, en este caso el español, y tener una competencia con relación al contenido del lenguaje que se está
manejando, a la argumentación del lenguaje, etc. que son componentes que se pueden evaluar. Otro
componente es el físico-acústico, teniendo en cuenta que la voz es el punto del cambio de energía
aerodinámica que ocurre en todo el sistema respiratorio, y luego de pasar por las cv se convierte en energía
acústica, la cual se puede medir, evaluar, cuantificar, describir cualitativamente. Todo esto es importante,
pero no hay que dejar de lado el componente social-comunicativo, que es de vital importancia ya que no es
lo mismo trabajar una voz de un cantante, profesor, locutor, que una persona que se dedica a ser vendedor
ambulante, donde tienen la misma importancia pero el componente social y las competencias que necesitan
para desarrollarse en cada espacio son variadas.
Entonces en ese sentido, cuando evaluamos a pacientes hay que tener en cuenta todos estos componentes
y elementos, para poder adaptar la terapia a las necesidades de cada persona.
Permite la valoración de la vibración y el estado del borde Permite el análisis de los parámetros
libre de los pliegues vocales. acústicos que componen la voz.
*Hay que pensar en dos dx:
• dx del otorrino: dx médico de estructura y función.
• dx de fono: dx de la voz y como afecta en la comunicación.
*El análisis acústico no vino para reemplazar el análisis perceptual. Sigue siendo de vital importancia el oído
para dar un dx.
Entonces, también tenemos que tener en cuenta en la evaluación clínica de la voz:
• Evaluación perceptual, aerodinámica y acústica.
• Métodos técnicos y tecnológicos con mejores grados de confiabilidad.
• Alto grado de variabilidad intra e inter observador.
2. Planteamiento del problema y justificación.
• El análisis acústico de voz es reconocido como una prueba diagnóstica complementaria y poco relevante
por la comunidad médica en la detección de alteraciones de la voz.
• No se ha establecido la relación entre los datos obtenidos por laringoestroboscopia y el análisis de voz.
• Escasos elementos de análisis para establecer una relación entre los hallazgos estroboscópicos de la
valoración morfo-funcional de la laringe y los parámetros acústicos de la voz.
• Es importante formar a los otorrinos para que pidan estos exámenes acústicos porque son muy
importantes y no suelen pedirlos, o lo hacen recién después de pasar por muchos otros estudios.
• Promoción de la salud vocal y la detección temprana de alteraciones de la voz, donde se ampliaría esto
a partir de usar el análisis acústico.
• Uso y aplicación de análisis acústico de voz como ayuda diagnóstica.
• Interdisciplinariedad en el abordaje de la voz.
Es importante saber la anatomía de las cuerdas y la teoría cuerpo-cubierta, donde está conformado por el
epitelio, por la capa superficial, intermedia y profunda de la lámina propia. De estas 3 la capa superficial y el
epitelio forman la cubierta, y el cuerpo se forma a partir de la capa intermedia, profunda, por el ligamento
vocal y el músculo vocal. En la estroboscopia se puede observar cómo se mueve el músculo, pero también
se ve vibrar esa cubierta o mucosa.
Por otro lado, algo muy importante a tener en cuenta es cómo se lleva a cabo el ciclo glótico: este siempre
va a depender de la presión subglótica, los pliegues vocales siempre van a fonar de abajo hacia arriba, de
adelante hacia atrás.
1. Conclusiones y recomendaciones
Conclusiones
• La estroboscopia laríngea permitió detectar asimetrías vibratorias, alteraciones estructurales,
diferencias en la oclusión glótica y otras condiciones que son poco visibles con otros métodos de
valores clínica usados para establecer el diagnóstico morfo-funcional.
• Los parámetros acústicos de Shimmer, relación armónico/ruido y amplitud del pico de Cepstrum,
mostraron consistencia en las mediciones clásicas de perturbación utilizadas para discriminar grupos
con distintos grados de alteración vocal.
• El índice de perturbación vocal integrado facilitó la clasificación en voces normales, en riesgo y voces
alteradas en la población evaluada. Este índice puede facilitar la detección temprana de riesgo vocal
y ser útil en la toma de decisiones clínicas reduciendo los costos para el control y el seguimiento del
tratamiento de las alteraciones de la voz.
• Los parámetros acústicos y el índice de perturbación vocal integrado presentaron una relación
estadística significativa con las alteraciones detectadas a través de la estroboscopia, específicamente
con las variables de amplitud de la vibración, el cierre glótico, periodicidad y asimetría en la vibración.
• El estudio permitió establecer la relación entre el dx morfo-funcional de la laringe y los parámetros
acústicos de la voz.
Recomendaciones
• Es pertinente proyectar la aplicación del análisis acústico en las pruebas diagnósticas en los casos de
disfonía, en la detección temprana de las alteraciones de la voz y en los programas de prevención.
• Implementar este estudio como modelo para futuras investigaciones con poblaciones específicas
como en casos con disfonía asociada a laringitis crónica.
• El estudio de las voces con un índice de perturbación vocal integrado mayor a 3, se debe
complementar con la valoración perceptual y el análisis espectrográfico.
• Fortalecer la participación del fonoaudiólogo durante la prueba de estroboscopia laríngea.
• Fortalecer la investigación interdisciplinar.
19 ELECTROGLOTOGRAFÍA
La voz es un fenómeno complejo que tiene muchas aristas para poder estudiarla.
La voz es un proceso biomecánico que tiene que ver con un proceso de
transducción que comienza con un fenómeno aerodinámico para convertirlo
en un estímulo sonoro que luego a través de varias modificaciones va a dar
lugar a nuestra voz.
Tiene que ver con una mecánica bioespecífica de base que cumple su rol
gracias a la acción de los pliegues vocales.
Estos pliegues vocales además se accionan gracias a esta energía
aerodinámica (presión subglótica de aire) que las pone en movimiento y
genera diferentes tipos de patrones en relación a este fenómeno.
Cuando hablamos de evaluación vocal, J. Stemple habla de ciertos pasos a seguir respecto a la evaluación
del paciente.
Comenzando siempre por el examen médico otorrinolaringológico para el diagnóstico y visualización
laríngea.
A partir de ahí, el fonoaudiólogo comienza con una entrevista inicial, una evaluación perceptual y por último
una evaluación instrumental.
Dentro de esta evaluación instrumental contamos actualmente con muchas herramientas.
Los avances tecnológicos durante las últimas décadas nos permitieron contar con muchas opciones de
evaluación instrumental.
Nos vamos a centrar en la evaluación objetiva de la voz. Dentro de esta evaluación objetiva de la voz, en el
análisis instrumental podemos incluir tres tipos de pruebas que son:
1. Mediciones aerodinámicas
2. Mediciones acústicas
3. Mediciones electroglotográficas
En la evaluación fonoaudiológica se implementaron en los últimos 60 años nuevos recursos para lograr hacer
más objetiva información que antes solo se analizaba desde lo perceptual en el análisis clínico de la voz.
Esta evaluación objetiva viene a traer aportes a la clínica pero no reemplaza a la evaluación perceptual sino
que es un complemento de todas las demás herramientas.
Las que realizamos como fonoaudiólogos son las electroglotografías y vienen a complementar lo que es la
información del análisis acústico.
ELECTROGLOTOGRAFÍA
Es un método no invasivo para conocer el
patrón vibratorio de los pliegues vocales.
Es una técnica complementaria al análisis
acústico y a las medidas aerodinámicas pero
que se basa específicamente en la descripción
del patrón de vibración de los pliegues vocales.
Cuando hablamos del patrón vibratorio de los pliegues vocales tenemos que tener en cuenta que lo que
hace al funcionamiento laríngeo podríamos considerar distintos tipos de funcionamiento por registros.
Estos registros determinan diferentes modos, no solo patrón vibratorio de pliegues vocales sino también
diferentes tipos de acomodaciones del tracto vocal.
La electroglotografía no es una técnica nueva. En 1957 Fabre describe por primera vez este procedimiento
utilizando la aplicación de un método basado en el fenómeno de impedancia aplicado al examen de la
función laríngea, específicamente del movimiento de los tejidos relacionados a los pliegues vocales.
La electroglotografía es un procedimiento que por ser objetivo durante los últimos años ha sido utilizando
en muchos reportes en la evidencia científica. Actualmente contamos con reportes tanto de investigación
como para la clínica. Se utiliza tanto para voces normales como para voces patológicas.
Según Rothenbertg (1988) el termino electroglotografía (EGG) “es aceptado como el nombre genérico para
designar a un dispositivo mediante el cual se puede visualizar los movimientos de los pliegues vocales
mediante una corriente eléctrica muy pequeña que pasa por el cuello a nivel del cartílago tiroideo en la
laringe, usando dos o más electrodos de superficie en el cuello
que van puestos de a pares”
CICLO GLOTAL
En la fase abierta tenemos:
• En apertura
• Abierta
• En cierre
Este ciclo glotal se va a ir repitiendo a lo largo del tiempo y el dispositivo va a permitir es sacar valores
estadísticos en relación a estos ciclos glóticos.
UTILIDADES DE LA EGG
La electroglotografía es capaz de indicar: por un lado sobre el momento donde la glotis se cierra y cuándo
se abre en cada ciclo glotal y además, la forma o patrón que utiliza para su realización.
Muchos autores han descripto el uso de la electroglotografía. Autores como Baken 1992, Titze 1990, Le
Huche & Allali 1994 detallaron que:
• Es una evaluación de tipo OBJETIVA y permite de forma no invasiva obtener información sumamente
relevante sobre los patrones de contacto a nivel glótico.
• Es una señal esencialmente libre de influencia supraglótica y puede ser de enorme valor para
conocer patrones diferenciados en relación a la fuente-filtro en la producción vocal. *La
electroglotografía nos aporta información referente a la fuente.
• Su forma de onda permite además obtener de forma sencilla la frecuencia fundamental de la voz.
• Permite indagar aspectos relacionados a la función de los pliegues vocales que no se pueden obtener
a través del análisis acústico como el cociente de contacto. (Gran importancia)
La gran diferencia entre el análisis acústico y la electroglotografía es que el análisis acústico nos va a dar
información sobre no solo lo que tiene que ver con la fuente sino también con el filtro. En cambio la
electroglotografía se va a basar en información sobre la fuente.
Diversos autores se han referido a la EGG y su utilidad dentro de la evaluación y la terapéutica de la voz
normal y la patológica.
Su uso ha sido reconocido para el seguimiento de deficiencias vocales de tipo funcional y orgánico a partir
de intervenciones quirúrgicas y/o terapéuticas. (Zagólski & Carlson, 2002)
También se ha reportado evidencia de la EGG en la clínica vocal utilizando la retroalimentación de los sujetos
para la optimización fonatoria, tanto en voces patológicas como en voces normales con la utilización de
diferentes registros e inclusive en voz cantada.
Se ha reportado a la EGG con el uso suplementario de un transductor de presión intranasal colocado debajo
del velo del paladar brindando información adicional sobre aspectos medibles en deglución.
Cuando existe aumento de la impedancia eléctrica los pliegues vocales se encuentran en fase
abierta disminuyendo la conductancia y cuando estos se aproximan durante la fase de cierre
disminuye la impedancia eléctrica (la energía se transmite de un electrodo a otro) y aumenta la conductancia
entre los mismos.
*Esta impedancia que vamos a generar en los tejidos se va a modificar cuando los pliegues vocales se
aproximan o se separan. Vamos a tener un fenómeno que se llama conductancia que se va a producir de
manera directa cuando los pliegues vocales están juntos.
La energía eléctrica va a pasar de un lado hacia el otro cuando estos pliegues vocales estén juntos y cuando
los pliegues vocales se vayan separando esta conductancia va disminuyendo y vuelve a aumentar cuando los
pliegues vocales vuelven a unirse.
Esto es lo que sucede a través del paso de los electrodos y el paso de esta energía eléctrica que genera
impedancia y conductancia a través de las diferentes fases del ciclo glotal.
Cuando esta resistencia se aplica a tejidos vivos surgen además algunos otros interrogantes que se
relacionan con las circunstancias y las restricciones que este fenómeno produce aplicado al funcionamiento
real de la laringe.
Las personas a las cual se le ve a realizar este estudio suelen querer saber cuál es la cantidad de voltaje que
van a recibir, si lo van a sentir, si podría causarles daño.
Cuando hablamos de electroglotografía hablamos de paso de energía por los tejidos. Por lo tanto las
características eléctricas de los electroglotografos son muy específicas:
La cantidad de corriente utilizada en el caso de la EGG es aproximadamente de 0.5 Watts (Vatios) y no podría
causar ningún tipo de daño ya que la magnitud de la corriente eléctrica es muy pequeña.
La persona no percibe nada cuando se realizan. A diferencia de otros electrodos que se utilizan en otras
pruebas.
Solo percibe el collar que va bastante ajustado al cuello pero no percibe el paso de la energía eléctrica.
Si la intensidad de la corriente eléctrica es baja, se genera el transporte de la misma de forma variable según
el material en el cual se aplica, pero si la misma es demasiado intensa provoca una reacción del tejido, lo
cual no es el objetivo de la EGG. Esto en cambio seria material de estudio si nos referidos a campos
relacionados con la electroestimulación de tejidos. En el caso de la electroglotografía no hablamos de
electroestimulación sino simplemente de transporte de energía eléctrica.
FUNCIONAMIENTO Y PROCEDIMIENTO:
Para la evaluación electroglotográfica es necesario de una interfaz que permita el registro de las
modificaciones en la actividad glótica.
Existen diferentes empresas que fabrican este dispositivo para la evaluación electroglotográfica entre los
más difundidos se encuentran:
• Electroglottography by Donald Miller (es el más accesible)
• VoceVista, Electrography by lingWaves
• Electroglotograph by Dr. Speech
• EG2-PCX2 (Glottal Enterprises)
*Necesitamos no solo del electroglotógrafo sino también de una placa que digitalice esta señal y la lleve a
un Software adecuado.
Parámetros Electroglotográficos
La señal obtenida a través del electroglotógrafo genera una gráfica: se denomina electroglotograma y es
proporcional a la superficie de contacto entre ambos pliegues vocales.
El electroglotograma es como el oscilograma que vemos en el análisis acústico. Debemos saber analizarlo
porque es muy útil en relación a la clínica y en relación al patrón.
Así como el análisis acústico, la electroglotografía nos va a dar
información cuantitativa y cualitativa. Entrega resultados como Gráficos
o parámetros numéricos según el caso.
Actualmente, se utiliza la onda electroglotográfica de Fourcin o también denominada como Registro Lx.
Fourcin llama registro Lx a la onda donde la fase de cierre en los pliegues vocales produce una deflexión de
la señal hacia arriba reflejando mayor conductividad y contacto.
La onda LX es proporcional a la superficie de contacto entre ambos pliegues vocales y el análisis debe
realizarse tanto cualitativa como cuantitativamente.
*Esta onda lo que hace es determinar la fase de apertura hacia abajo de la curva y la fase de cierre a nivel
superior de esta grafica.
PATRONES ELECTROGLOTOGRÁFICOS
Hay diferentes patrones que podemos determinar además del análisis de la onda.
Estos patrones los podemos analizar en forma numérica y en algunos casos podemos verlo también en
forma gráfica.
También está muy relacionado con patrones aerodinámicos como la presión subglótica y la resistencia.
Cuando tenemos muy aumentado el cociente de contacto tenemos que pensar que existe un nivel
demasiado elevado de presión subglótica y demasiado elevado de resistencia glótica.
Lo que podemos ver es que la forma de onda y el CQ se ven influenciados según la frecuencia, la intensidad
y el registro primario (registro pulso, modal o elevado).
Vamos a hablar que el cociente de contacto va
a ser mucho mayor cuanto menor sea la
frecuencia.
En el cociente de contacto por ejemplo en el
funcionamiento del registro/pulso,
podríamos hablar de que al tener menor
frecuencia, lo que se puede ver a través de
EGG es que el cociente de contacto es muy
elevado. En lo que es vocales se encuentran
en fase de cierre mucho tiempo.
A diferencia de registro elevado donde
podríamos tener un contacto mucho menor
y tendríamos que hacer una subdivisión (que
tiene más que ver con la voz cantada) y lo que
algunos autores denominan registros
secundarios que tienen que ver con la
configuración glótica. Diferentes tipos de
configuración glótica para producir el distinto
tipo de registro elevado.
Entonces ahí el cociente de contacto varía
según el tipo de configuración que el cantante utilice en una misma frecuencia.
El análisis de la forma de onda es información sumamente valiosa y que permite completar lo obtenido en
la evaluación instrumental objetiva de forma cuantitativa. Vamos a entender claramente cuál es el patrón
de funcionamiento que está realizando esa persona.
La imagen es un ejemplo de un glissando en una
voz cantada. Se puede ver que a medida que va
aumentando en la escala tonal, la curva se va
disminuyendo en su grosor y el CQ también va
disminuyendo.
En voces hipofuncionales por lo general encontramos bajo nivel de contactos, porcentajes muy bajos. Por
lo tanto el coeficiente de apertura es bastante elevado. Esto se relaciona con un elevado flujo transglótico,
una baja presión subglótica y muy poca resistencia a nivel glótico.
En cambio, en voces hiperfuncionales estamos hablando de cocientes de contacto que son muy elevados y
por lo tanto coeficientes de apertura muy bajos. Esto va a ser igual a flujo transglótico bajo, resistencia
glótica muy elevada y presión subglótica también muy elevada.
La resistencia y la presión son directamente proporcionales.
Podríamos decir que si nosotros obtenemos niveles de criterio demasiado elevados, la impedancia es
demasiada y los niveles inferiores al 35% nos estarían hablando de poca impedancia.
Muchas veces esto podría estar influenciado por el registro con el que está fonando la persona.
Consideraciones finales:
Este tipo de herramienta debe ser utilizada de forma complementaria a otros procedimientos y protocolos,
para determinar de forma fehaciente las posibilidades vocales de la persona evaluada, conociendo en detalle
el funcionamiento de todos los elementos implicados en la biomecánica de la función vocal.
22 EVALUACIÓN DE LA VOZ
• Imagen laríngea (fibro, estrobo, etc.)
• Análisis acústico de la voz (en lo posible cercano a la fecha que se tomó la imagen laríngea)
• Medidas aerodinámicas (entre algunos de ellos medidas de eficiencia glótica como TMF, o índice S/Z)
• Anamnesis y ficha vocal
• Análisis perceptual
• Medidas de autovaloración de la voz (nos dan mucha información acerca del motivo de consulta del
paciente, cuál es su queja, y como impacta en diferentes dominios de su vida cotidiana).
Utilidad (cuestionarios)
• Permiten medir/valorar el impacto subjetivo de un trastorno vocal.
• Ayudan al especialista en terapia vocal para diseñar estrategias terapéuticas adaptadas a las
necesidades de cada sujeto.
• Brindan información sobre el impacto de la disfonía en la comunicación del paciente, para poder
buscar recursos con el fin de minimizarlo.
• Útiles para el monitoreo del paciente.
PROTOCOLOS DE AUTOVALORACIÓN
DE LA VOZ
Todos son similares en cuanto a
afirmaciones acerca del impacto del
trastorno de la voz en diferentes
dominios y es importante trabajar con
protocolos que hayan sido traducidos y
validados.
Subescalas:
1°
2°
3°
Para cada uno de los resultados posibles se les indica un índice de incapacidad vocal que va de leve a grave.
VHI – 10: VERSIÓN CORTA DEL VHI-30 Rosen, 2004
Las primeras 5 afirmaciones corresponden a la parte funcional, hay 3 afirmaciones de la parte física, y 2
afirmaciones de la parte emocional. No pierde validez por ser una versión acortada.
De estos cuestionarios se desprendieron otros que tienen aplicaciones para distintas poblaciones más
específicas como es el caso del Singing VHI, o el VHI pediátrico.
SINGING VHI
Evalúa más que nada la población de los profesionales de la voz, en particular los cantantes, quienes tienen
ciertos requerimientos y ciertas exigencias vocales que no son las mismas de cualquier paciente con otro
tipo de actividad diaria en la cual utilizan su voz.
Se da con las mismas respuestas que el anterior, pero sin los números (versión en inglés, en español si tiene).
Tiene 36 preguntas, es más largo. Tiene también los 3 dominios mezclados. También está la versión reducida:
S-VHI (Versión 10) Puede complementarse con el VHI normal.
VHI PEDIATRICO
Índice de discapacidad vocal pediátrico.
En 2007 aparece, en 2015 se realizó la
adaptación y validación al español, en 2019
fue adaptado y validado al español de
Argentina.
CONSIDERACIONES FINALES
Recordar que, tanto en niños como en adultos, el impacto en la calidad de vida no va a estar directamente
relacionado con el tamaño de una lesión o agravado por la severidad de una patología, sino que cada uno lo
va a percibir distinto de acuerdo el impacto que tenga en la calidad de vida.
• Dice la OMS: “la evaluación de la calidad de vida puede servir para medir los resultados en la
investigación relativa a los beneficios comparativos de los diferentes métodos terapéuticos”.
• En investigaciones alrededor del mundo las escalas subjetivas toman un papel primordial a la hora de
mostrar cambios o diferencias significativas en relación a la comparación de diferentes técnicas de
rehabilitación.
• Valoración de los resultados de cualquier intervención terapéutica.
• La aplicación de cuestionarios como el VHI resultan fundamental en la terapia vocal para diseñar un plan
terapéutico y monitorear la evolución del paciente.
En general en el hospital toman el VHI al inicio, cuando el paciente hace su primera consulta, luego de algunas
sesiones, y al alta del paciente. Lo interesante es también tomarlo a largo plazo. Incluso sirve para realizar
alguna investigación.
20 LARINGECTOMIZADOS
Inicio en la atención de pacientes laringectomizados en el año 1977 (pacientes con cáncer), al ingreso como
Fonoaudióloga al Servicio de ORL del Hospital de Clínicas, a cargo del Prof Dr. Juan Carlos Arauz.
Hospital de clínicas:
• Centro de referencia de derivación de pacientes con patología laríngeas
• Se realizaban muchas laringectomías
• Aprendían a hablar con voz esofágica (con el segmento faringo esofágico) o voz erigmofónica (lo
inventaron a partir de la palabra “eructo” ya que el paciente aprende a hablar a través de ellos).
La primera presentación se dio en un Congreso de ORL en el año 1978: “nuestra experiencia con el paciente
laringectomizado”. Fonoaudiólogas Nilda Corradini y Liliana Sigal: enseñanza del método deglutorio. (El
paciente tragaba y eructaba).
Modalidad de abordaje:
• Entrevista prequirúrgica (los pacientes iban primero a fono para que se les explicara que no iban a contar
con su laringe, sino que va a poder comunicarse con un habla proveniente del esófago, y se le mostraban
ejemplos de otros pacientes).
• Rehabilitación fonoaudiológica (después de operado a los 15 días)
• Reuniones de pacientes y familiares (en un principio se mandaban a CROL (centro de rehabilitación de
operados de laringe) pero luego dejo de tener tanta importancia y empezaron a tenerla las
fonoaudiólogas del hospital Roffo y del hospital María Curie, hospitales oncológicos).
Asesoramiento:
Explicarle que no cuenta más con su laringe y cómo va a estar fonando de ahí en adelante, pueden ocurrir
tres casos:
Caso 1: va a tener un traqueostoma, orificio en el cuello por el cual va a respirar.
Detrás de ese orificio tiene el esófago y por arriba hay un segmento que va a representar las CV que tenía
antes, algunos autores la llaman neoglotis, pero en realidad es el segmento faringo esofágico, de más o
menos 11 cm de longitud. Está conformado por los músculos cricofaríngeo (en la parte superior del esófago)
y el constrictor inferior y medio de la faringe. Ese segmento va a moverse y originar un sonido que va a ir por
la faringe hasta la boca, donde va a articularlo. Al principio va a salir un sonido similar un eructo solo de corta
duración, pero luego esto se va a prolongar.
Caso 2: Le pueden colocar una prótesis de silicona que va de la tráquea al esófago y los comunica. En ese
caso el paciente va a hablar con voz traqueo esofágica. En el año 1991 en Argentina la prótesis todavía no
estaba colocándose a todos, entonces se usaban todos los recursos que se pudieran para que el paciente
pueda hablar con la mejor voz esofágica posible.
Caso 3: Puede usar un laringófono o laringe artificial, que es un vibrador que se coloca en el cuello en las
partes blandas. Cuando yo apreto, el vibrador trasmite el sonido por partes blandas hacia la boca donde lo
artículo. En ese caso el paciente contará con voz “robótica”.
• Informar sobre los diferentes métodos y el tiempo de tratamiento que es incierto, puede durar de 2
meses a un año depende del tiempo que quiera el paciente.
• Contactarlo con otro paciente laringectomizado para que escuche su nueva voz
• Otorgar una entrevista postquirúrgica durante el periodo de internación para asegurar el bienestar
del paciente con respecto a:
a) Modo de comunicación con su familia, canalizar sus dudas
b) Informar sobre la importancia de la protección del traqueostoma
c) Cuidados de la cánula traqueal
d) Tiempo que transcurrirá entre el postoperatorio inmediato y la rehabilitación propiamente dicha
• Aplicar la terapia rehabilitadora para el logro del habla alaringea.
Laringe Artificial:
• Uso de laringófono manual con un diafragma vibratorio que se coloca firmemente contra el cuello para
que funcione.
• Las vibraciones se trasmiten a través de la piel hacia el interior de la hipofaringe.
• Se requiere de una buena articulación para una mejor emisión.
Desventaja:
• Requiere el uso de una mano
• Voz robótica.
Se puede investigar la elasticidad del segmento faringoesofágico mediante el test de insuflación, cuando el
paciente no obtiene el sonido en el entrenamiento de la voz esofágica.
Asimismo para evaluar si podrá ser un buen hablante de habla traqueoesofágica. (Video Test de insuflación).
Mecanismo de producción:
• El aire, previamente deglutido o introducido en esa porción del esófago, es eructado o soplado hacia la
faringe hacia la cavidad oral, produciendo un sonido (eructo), que será articulado por los órganos
articulatorios de igual forma que lo era el soplo pulmonar tras pasar por la glotis.
• Acerca de la resonancia: el sonido creado en la pseudoglotis al pasar por el tubo faringo-bucal se
amplificará según la posición en que se coloquen la lengua y el velo del paladar en estas cavidades. Es
importante relajar la faringe para producir la voz con el mínimo grado de tensión muscular del cuello.
• Por último, otro factor diferenciador va a ser la entonación (interrogaciones, exclamaciones).
• Con la práctica se logra desarrollar el tono muscular consiguiendo aumentar tanto la intensidad, la
duración y la entonación.
En resumen, en la producción de voz esofágica:
• La fuente de aire la constituye el esófago (músculo cricofaríngeo que está en la boca del esófago)
• La estructura estrecha, flexible y elástica con capacidad para vibrar, la constituye la neoglotis (segmento
faringo esofágico)
• Las cavidades de resonancia son las mismas que antes de la laringectomía.
• El aprendizaje de la voz erigmofónica supone un gran logro para el paciente laringectomizado, ya que le
permite recuperar una herramienta fundamental en la comunicación con otras personas; pero su
adquisición no es fácil y sus características, intensidad, duración, timbre, fluidez y entonación, difieren
mucho de la voz laríngea que poseía el paciente, por lo que necesita un periodo de adaptación y de
identificación como su propia voz.
• La impresión que el propio paciente tiene de su nueva voz y la funcionalidad de la misma para mantener
una comunicación oral, se muestran como variables que pueden incidir en su estado emocional, más allá
de las características físico-acústicas que pueda presentar en cada paciente.
Tiempo de aprendizaje:
Cuanto tardaron en adquirir voz esofágica
*frecuencia: pacientes.
Una de las causas que puede generar que tarden más tiempo en aprender puede ser:
• Otra operación luego de la primera por recidiva.
• Aplicación de rayos, la radioterapia endurece los tejidos entonces les cuesta más, no permite esa
elasticidad del segmento faringo – esofágico.
21
Dudas:
Qué pasa con la función de protección de la laringe: Cerraron la faringe en el cuello. Entonces el paciente
mastica, traga, va a faringe, orofaringe (no tiene que ir a nasofaringe porque el velo del paladar funciona).
*Recordar que laringofaringe ya no se llama porque laringe no hay. Sino la porción inferior de la faringe sigue
por el esófago y va todo al estómago donde se digiere.
Ya no hablamos de que la laringe se cierra, de que la glotis se cierra para que los alimentos no pasen por ella.
Al no haber laringe, los alimentos pasan a la laringe y al esófago.
Se respira por la tráquea. Se termino la encrucijada aerodigestiva. Solo hay respiración por el agujero que se
abrió de la tráquea al cuello y hay alimentación boca-faringe-esófago. No hay nada en el paso del alimento.
Si hubo un tumor grande y la faringe está muy estrecha (porque sacaron el tumor y tuvieron que sacar más
tejidos, debiendo cerrar apretadamente la faringe), el paciente tiene dificultad para tragar.
También a veces aparece la dificultad para tragar cuando hay una recidiva. Así como cierta disminución en
la intensidad de la voz. (cuando aparece de nuevo un cáncer después de varios años).
Entonces: el paciente mastica, traga y se va el alimento hacia abajo. Luego respira y tiene que tener ese
agujero abierto siempre.
Cuando al paciente lo operan, le colocan una cánula. La cánula tiene que estar un tiempo. Se usa 1 mes todos
los días mañana, tarde y noche. Al mes, se puede probar sacarla de día pero a la noche se le dice al paciente
que la use, para que no sienta que se ahoga.
La cánula tiene una forma curva (aprox. 10 cm) parecida a la curvatura de la tráquea. Debe usarse. El paciente
saca la cánula, la higieniza y se la vuelve a colocar. Esto para que tenga la vía aérea disponible siempre porque
por ahí va a respirar. Ya no va a tomar aire por boca o por nariz para respirar. Sino que lo va a hacer a través
de la tráquea: del traqueostoma o estoma, que es por donde entra el aire.
Mientras que va a seguir comiendo por la boca. (boca-faringe-esófago).
Lo que se va a compartir, va a ser:
- el esófago (parte superior)
- constrictores inferior y medio de la faringe para hablar
Por eso el paciente va a tomar un poco de aire por la boca (por el método de inyección o por el método de
presión-gloso-faríngea (gloso-palatina)). Que es lo mismo movimiento que nosotros hacemos cuando vamos
a tragar, que levantamos la lengua hacia el paladar.
Con estos dos métodos, que son los mejores para poder hablar, en el sentido que no están dependiendo de
un tercer elemento (ej. tener que estar tragando agua), el paciente va a fonar bien.
También hay un tercer método que es el de la inhalación: abrir la boca y tratar de tomar un poquito de aire.
Pero el aire al inhalar va a entrar por tráquea. Y cuando se exhala, se saca el eructo y va a salir el aire por
tráquea entonces se va a escuchar como un escape de aire por el traqueostoma.
El otro método que se enseñaba al principio cuando la profesora entro al hospital, es el método de deglución:
trago y eructo. Pero fue algo que empezaron a usar por intuición porque notaron que al tomar un vaso de
soda, era más fácil eructar. Entonces si al paciente en la primera sesión y segunda sesión veo que no le sale
inyectar o la presión glosopalatina o inhalar, con un vaso de coca o algún líquido que contenga gas, va a
poder eructar y es lo que queremos lograr. (Liliana dice que ella apoya esto, que ella es menos rígida en
cuanto a que no se puede o no se debe, sino que hay que poder aprovechar recursos para lograrlo).
Entonces luego se inhibe la deglución (para que no esté todo el tiempo tragando para poder emitir) y
educamos con inyección, con presión glosopalatina o con inhalación (Para Liliana de los 4 métodos, este
último no sería el mejor, prefiere los primeros 3. Es decir, inyección, la presión glosopalatina y si no le sale
que degluta, pero estar aspirando por boca para tratar de eructar va a salir aire por el traqueostoma también
y se va a escuchar un escape que resulta molesto). *Luego cada uno elige viendo al paciente que le sale y
que no, cual es la mejor forma.
VOZ TRAQUEOESOFÁGICA
Prótesis que comunicaba la tráquea con el esófago. El médico cirujano que realizaba las operaciones era
Singer y el fonoaudiólogo era Bloom. Se creo una empresa que fabricaba esas prótesis.
Voz Traqueoesofágica:
Pasaje de aire pulmonar de tráquea a esófago a través de la fístula creada por el cirujano:
• Fístula primaria: se efectúa en el mismo acto quirúrgico de la LT)
• Fístula secundaria: operación posterior
La prótesis vocal que se coloca en la fístula es un tubo de silicona hueco que se abre cuando al ocluir con el
dedo y exhalar, aumenta la P+ en la VA permitiendo el flujo de aire hacia el esófago → Se activan superficies
mucosas del segmento faringoesofágico produciéndose el sonido.
Prótesis fonatoria
• Prótesis de silicona que se coloca en una fistula creada quirúrgicamente en la pared traqueoesofágica.
*La fistula es un canal que va desde la tráquea al esófago. Hay una separación de las vías digestiva y
respiratoria. Las rayitas del grafico en color rosa, indican dónde el medico hizo la fisulta. Abrió un
agujerito (un canal) que comunica tráquea y esófago. En esa fistula es donde se va a colocar la prótesis
de silicona.
• El pasaje de aire pulmonar desde la tráquea al esófago activa las superficies del segmento
faringoesofágico produciéndose el sonido.
*El paciente toma aire por el traqueostoma (el agujero que esta hacia el exterior) ese aire va hacia los
pulmones. Realiza el recorrido: tráquea - bronquios - pulmones. Luego se exhala: Pulmones - bronquios
- tráquea. Si el paciente pone un dedo en el traqueostoma, ese aire no tiene por donde salir y si hay un
canal o fistula que comunica la tráquea con el esófago, ese aire se va por ese canal hacia el esófago:
esófago-faringe-boca. Al abrir la boca digo una /a/. Pasa el aire de los pulmones hacia el esófago, es decir
el aire está desviado → ESTO PASA POR UNA FISTULA. (Importante pregunta de final).
Recordar que estos pacientes, no pueden tomar aire por nariz porque no hay conexión entre nariz que va
hacia laringe, tráquea, bronquios pulmones. Porque no tiene la laringe. Al sacarle la laringe, la nariz y la boca
están separadas de la función respiratoria. El paciente pierde olfato porque no le entra aire por nariz.
Igualmente se educa después. Están separadas la vía respiratoria de la digestiva. Se pierde la encrucijada
aerodigestiva. Entonces le paciente siempre va a tomar aire por traqueostoma (el agujero que hay en el
cuello) que es el resultado de la tráquea suturada al cuello.
Si usa la voz esofágica, no va a haber ninguna conexión entre la parte respiratoria y la parte digestiva. No
hay ninguna conexión y el paciente va a hablar tomando una “burbuja de aire” (toma pequeñita de aire) por
boca. Utilizando los métodos inyección, presión, inhalación o deglución. Esa es la forma que tiene el paciente
de hablar. Esa es la voz esofágica. El mecanismo de voz normal desapareció.
Con la voz traqueoesofágica, lo que ocurre es que inventaron la prótesis fonatoria de Erin Singer que se
coloca en el canal que el medico cirujano hacia entre tráquea y el esófago. El agujero se realiza 5 mm por
debajo del borde superior de la tráquea. Se realiza un canal o fistula con el paciente dormido. Se realiza
mediante una punción primaria o punción secundaria.
• Punción primaria: En los últimos tiempos, se realizaba esta. Sacan la laringe y dejan al paciente preparado
para colocarle una prótesis. Entonces en la misma operación de laringectomía total, dejan la fistula hecha
para que al paciente le coloquen un par de días después la prótesis.
• Punción secundaria: Es una fístula secundaria a la laringectomía total. Ej. Un paciente operado de una
laringectomía total y tuvo algún problema en esa operación. Quieren mandarlo a hacer voz esofágica y
no le sale. Al mes de operado de laringectomía total, puede ser nuevamente operado (una pequeña
intervención donde abren ese canal o fístula de tráquea a esófago). Le da la posibilidad al paciente 3
meses a ver si aprende el habla esofágica y si no le sale prueban con la prótesis. Puede realizarse la
intervención al mes, 3 meses, al año. Pero la diferencia es que no se realiza en la misma intervención que
la laringectomía.
Ambas opciones son válidas.
*Por la fistula se pueden producir aspiraciones, por eso hay que colocar una
sonda. Si no, se producen aspiraciones (se va la comida o parte del líquido
que traga el paciente hacia la tráquea). Esto se evita con la sonda o
colocando la prótesis.
Funcionamiento de la Prótesis:
1 2
La imagen de la derecha muestra la utilización de una prótesis de silicona blanda. Se utilizaban cuando ella
viajo a USA en 1994. Luego se reemplazaron por las prótesis de la imagen izquierda que son prótesis más
resistentes y más duraderas.
Se observa como en la imagen de la derecha el paciente una vez que tomo aire por la tráquea, coloca un
dedo para tapar el traqueostoma y lograr que el aire espirado (que viene de los pulmones) vaya a través de
la prótesis al segmento faringo-esofágico. Y luego vuelva en forma de sonido.
El de la imagen de la izquierda tiene una válvula exterior que se abre para que el paciente respire, y se cierra
automáticamente por un juego de presiones. El aire va a la prótesis y de la prótesis a faringo esófago y se
produce el sonido.
En síntesis: A la derecha lo hace el paciente con su dedo y a la izquierda se hace automáticamente mediante
una válvula.
**Aclaración: Los médicos muchas veces al explicarle al paciente dicen que se le pone una “valvulita”,
llamando así a la prótesis. En realidad, es una prótesis y no una valvulita. Lo que sí es una válvula es lo que
se ve a la izquierda que se coloca en el traqueostoma para el habla sin usar las manos.
Prótesis Funciones:
• Mantener abierta la fístula. Para eso está la prótesis. Si no coloco la prótesis, se cierra la fistula.
• Permitir que el aire pase de la tráquea al esófago para la producción de habla. Va de tráquea →
Traqueostoma → A esófago para producir habla.
• Prevenir la pérdida de alimento o escape de fluido del esófago a la tráquea durante la deglución. Si dejo
un canal o fistula abierta se van a ir los alimentos a la vía aérea.
Importante! Si el paciente tosió y se le salió la prótesis, tiene que ir inmediatamente a cualquier centro de
salud para que le coloquen una sonda y no se le cierre la fistula. Si se cierra hay que abrirla nuevamente. Si
no hay prótesis, toda herida en el cuerpo tiende a cerrarse
*Antes se daba a elección si querían colocarse la prótesis o no. Con el dólar 1 a1 eran económicas. Con la
crisis del 2001 se complicó la compra de las prótesis y aumento también mucho su valor.
Luego se creó la Ley de Discapacidad, las personas laringectomizadas se presentaban como discapacitados y
el gobierno debía que proveerles todo. Las obras sociales podían orientarlos que a través del certificados de
discapacidad podían acceder a las prótesis. Hoy en día debe ser más difícil acceder a las prótesis.
Cuando fistulizan y colocan la prótesis en forma primaria, es posible que la segunda prótesis tenga que ser
más corta. Las que más se usan son las de 10 mm pero hay prótesis un poco más cortas y protesis de 15 mm
también.
La pared traqueoesofágica puede estar muy inflamada por la operación si es en forma primaria y es posible
que la segunda prótesis tenga que ser más corta.
Si el medico coloca una prótesis larga, es incómodo para el paciente porque al tapar, empujan la prótesis
hacia atrás y le puede producir tos por estar tocándole la pared posterior y producirse inflamación o picazón.
Además se moviliza si es muy larga y puede abrir la fistula.
*Cuando se hacía en forma secundaria se media el grosor de la pared traqueoesofágica.
Duración de la prótesis:
En general alrededor de 12 meses, aunque hay pacientes que han referido una duración de hasta 15 meses.
Cuando se empieza a gastar, cuando el límite posterior se empieza a consumir o achicar y el paciente empieza
a sentir que cuando habla le pasa líquido a la vía respiratoria, es porque la prótesis se está fundiendo.
La parte posterior de ambas prótesis tiene un diámetro más grande que la prótesis en sí. Tienen un límite
posterior y uno anterior. Ambos tienen un diámetro mayor para que la prótesis no se mueva. En el límite
anterior de la prótesis, que da a la tráquea, está la entrada de aire (es un circulito que está abierto).
El límite posterior de la prótesis está parcialmente cerrado. Cuando pasa el aire se abre.
*El límite anterior está siempre abierto pero el límite posterior tiene una lengüeta que se abre para dejar
pasar el aire. Si ésta estuviese todo el tiempo abierta, cuando el paciente traga comida o liquido ese líquido
pasaría a través de la prótesis hacia la tráquea y los bronquios y el paciente se aspiraría.
Cuando pasa una determinada cantidad de meses y la lengüeta de la parte posterior de la prótesis se
empieza a gastar, puede ser que pase liquido hacia la vía aérea.
Los pacientes recién operados, muchas veces tienen hongos. Uno de los hongos comunes en esa zona es
Cándidas. La candidiasis lesiona la parte posterior de la prótesis porque la candidiasis se asienta en la parte
posterior de la faringe. Esto se produce por una disminución de las defensas, por el cáncer, por la operación
posterior, en la época de recuperación posterior. El paciente con voz esofágica no se entera de esto. Pero al
paciente con voz traqueoesofágica se le arruina la prótesis.
Otra cosa que arruina las prótesis es la ingesta de líquidos muy calientes.
Entonces además de cambiar la alimentación hay que indicarles que no tomen tanto mate durante el día y
si toman, no puede ser a una temperatura muy alta porque si no se destruye la parte posterior de esas
prótesis.
Con el paso del tiempo se han hecho prótesis cada vez más resistentes. Duran cada vez más.
El paciente se da cuenta que la prótesis no le sirve más porque se empieza a destruir la lengüeta del orificio
posterior y empieza a pasar liquido hacia la vía respiratoria.
*Si se la colocan a cualquier paciente no hay forma de seleccionar. Pero si el paciente viene para voz
esofágica al consultorio y le enseñamos, es nuestra obligación contarle de que existe una prótesis. Que si
alguna vez se la puede colocar va a hablar con mucha más fluidez. Pero que también puede hablar con mucha
fluidez con voz esofágica.
Si tiene dificultad para hablar con voz esofágica no hay mejor resolución que una prótesis. Para eso tiene
que haber una buena comprensión para entender el manejo del sistema y tiene que vivir cerca de un centro
de salud.
Un señor que le colocaron una prótesis y vivía en el interior de la provincia de rio gallegos, y no tenía como
llegar a un centro de salud. Por eso es tan importante tener criterio para los casos.
• No debe haber un segmento faringoesofágico con hipertonía o espasmo. Esto se produce por
enfermedad neurológica (espasmo de cierre). Cuando el paciente tiene que utilizar el musculo
cricofaríngeo que está en la parte superior del esófago, puede pasar que haya un espasmo de cierre y no
salga la voz, pero tampoco va a tragar bien.
La hipertonía puede producirse porque esta tan cerrado, el cáncer fue importante y el medico cerro los
tejidos y todo está apretadamente.
• Presencia de candidiasis que destruye la zona valvulada de la prótesis (la válvula o lengüeta posterior de
la prótesis se destruye)
• Tamaño del traqueostoma, excesividad de secreciones, granulomas. Un paciente que tiene un
traqueostoma muy grande y utiliza el dedo para obturar, no puede terminar de tapar porque el
traqueostoma es muy grande. O puede que el traqueostoma es muy chiquito. Si quedo muy chiquito y
se le coloca una prótesis, el paciente siente dificultad para respirar.
Las excesivas secreciones provocan que se le tape siempre la tráquea, se le meten las secreciones por
delante hacia la prótesis.
Granulomas se producen cuando se coloca una prótesis que es un cuerpo extraño y resulta que el
paciente es alérgico a los plásticos (silicona) y forma granulaciones alrededor del traqueostoma o
alrededor de la prótesis y hay que estar curándoselas. No es un buen candidato.
• Dificultad en la obturación: El paciente tiene dificultades, no sabe hacerlo, se apura, pierde aire, destapa
antes de terminar la frase o no obtura el estoma al comenzar a hablar. A pesar de que obtenga el habla
en la primera sesión, necesita un periodo corto de entrenamiento.
* Un paciente con Parkinson, que tiene un temblor en la mano, no va a poder tapar correctamente.
Cánulas:
Esto es lo que se usa por fuera. Es una cánula que se coloca al paciente después de operado.
Hay cánulas que van con un tapón afuera que tiene agujeritos y en este tapón se coloca un pedacito de goma
espuma, esto sería par aun paciente con un laringectomía total y este tapón hace que se proteja cuando hay
demasiado viento, demasiada humedad afuera para conservar el calor de su vía respiratoria. Porque de los
36 grados de temperatura corporal, al pasar a tener un agujero abierto, baja muchísimo la temperatura y
aumentan las secreciones entonces se crean este tipo de tapones.
También hay tapones para las válvulas free-hands.
Filtros:
Conservan la temperatura y la humedad. Se coloca en el traqueostoma. Tiene una porción abierta (lo que se
ve en la parte superior del rosa) y una goma espuma para conservar la humedad.
Antes se colocaban prótesis de siliconas. Luego empezaron a colocarse prótesis de silicona pero mucho más
duras. Antes eran blandas.
Vemos en la imagen de la izquierda (fondo violeta). La parte de la derecha va hacia el traqueostoma (exterior)
y a la izquierda está el lado que va hacia el interior.
Después del anillo de retención (círculos anterior y posterior de mayor diámetro) vemos la válvula o lengüeta
que se abre y se cierra para que pase el aire hacia el esófago. Esto es en la prótesis Provox.
En la Blom Singer (derecha) no se distingue donde está la lengüeta, se distingue mejor en la Provox. Estos
son los dos modelos.
Prótesis Provox Vega con tres diámetros para maximizar el flujo de aire.
No solamente las prótesis tienen distintas longitudes de 10 mm porque la pared traqueoesofágica tiene 10
mm pero pueden ser más largas o más cortas.
También pueden tener distintos diámetros. SI el paciente tiene una hipertonía del segmento
faringoesofágico porque le cerraron apretadamente los tejidos o un cáncer que hubo que sacar mucho y
cerraron apretadamente los tejidos, hay distintos diámetros para maximizar el flujo de aire.
A la prótesis Blom-Singer se le colocaron anillos de titanio. Para que salga en la rx y poder ver que este bien
colocada la prótesis.
Todos los días hay que limpiar la prótesis para limpiar las secreciones que provienen de la tráquea.
ACLARACIONES:
• Habla esofágica es: Laringectomía total + traqueostoma
• Habla traqueoesofágica: Laringectomía total + traqueostoma + prótesis
*Tosen sin sonido, se ríen sin sonido. Más que nada se tapan para reírse pero sino es sin sonido.
24 EL PACIENTE LARINGECTOMIZADO
MODALIDAD DE ABORDAJE:
• Entrevista prequirúrgica: les ofrecen si quieren usar la prótesis o quieren quedarse con la voz
esofágica. *Las obras sociales en la actualidad tardan en proveer la prótesis y se hace una punción
secundaria y no primaria. Se lo duerme y se le hace el canal o fístula entre la tráquea y el esófago, y
para que ese canal no se cierre se le coloca una sonda.
• Rehabilitación fonoaudiológica. *Siempre.
• Reuniones de pacientes y familiares. *En este momento se hará por zoom.
ASESORAMIENTO:
Segmento que vibra: Se mueve y vibra el segmento faringoesofágico, compuesto por el músculo
cricofaríngeo y los constrictores inferior y medio de la faringe.
LARINGE ARTIFICIAL:
• Uso de laringófono manual con una
diafragma vibratorio que se coloca
firmemente contra el cuello para que
funcione. (Sin embargo, luego de la
operación si ya tiene el laringófono, como
está todo vendado, se lo pone mientras en
la mejilla)
• Las vibraciones se transmiten a través de la
piel (a través de las partes blandas) hacia el
interior de la hipofaringe, hacia la boca.
• Se requiere de una buena articulación para una mejor emisión.
Desventajas:
• Requiere el uso de una mano.
• Voz robótica.
VOZ TRAQUEOESOFÁGICA:
Pasaje de aire pulmonar de tráquea al esófago a través de la fístula creada por el cirujano:
• Fístula primaria: se efectúa en el mismo acto quirúrgico de la Laringectomía Total.
• Fístula secundaria: operación posterior.
La prótesis vocal que se coloca en la fístula es un tubo de silicona hueco, que se abre cuando al ocluir con el
dedo y exhalar, aumenta la P+ en la VA permitiendo el flujo de aire hacia el esófago → se activan superficies
mucosas del segmento faringoesofágico produciéndose el sonido.
*Es un tubito que un extremo da al exterior, y el otro extremo da hacia el esófago, que tiene una válvula o
lengüeta que se abre por el paso del aire, por la presión de la misma, entonces el paciente toma el aire por
traqueostoma, y cierra con un dedo para que el aire pase por la prótesis a través del tubo y va atravesando
el espacio conformado por el segmento faringoesofágico.
Si no hubiera lengüeta, el líquido que toma el paciente, si el tubo está abierto en los dos extremos, pasaría
a la tráquea, entonces tiene que tener un cierre posterior.
*A veces es mejor esperar unos días para la prótesis vocal por todo el proceso de cicatrización, a veces la
primaria es medio invasiva.
FUNCIONES DE LA PRÓTESIS:
• Mantener abierta la fístula
• Permitir que el aire pase de la tráquea al esófago.
• Prevenir la pérdida de alimento (sobre todo el líquido) o escape de fluido del esófago a la tráquea
durante la deglución.
*Nos damos cuenta que hay fallas cuando esa lengüeta no está funcionando y el paciente empieza a sentir
que pasa líquido.
DIFERENTES LONGITUDES:
Se debe medir el grosor de la pared traqueoesofágica antes del cambio de prótesis. Si la fistulización y
colocación ha sido en forma primaria, es posible que la segunda prótesis tenga que ser más corta. (si es muy
larga, el paciente tapa y la prótesis se va para atrás, y cuando come la prótesis puede irse para adelante, y
ese movimiento produce que se le abra un poco el diámetro de la fístula y cuando trague filtre líquido
alrededor de la prótesis). (Incluso si se tapa la prótesis larga, y se dirija para atrás le dé sensación de querer
toser, porque en vez de llegar solo a la pared anterior del esófago, llega hacia atrás y molesta).
La prótesis tiene una lengüeta larga que va hacia el cuello, y la parte de arriba es el anillo de retención, y es
ahí donde se colocaba una cápsula, y luego se abría la prótesis.
Hoy en día hay colocadores en la parte posterior que luego se saca y ahí se amplía la prótesis.
También existe la prótesis provox. donde en la lengüeta tiene una división y se corta un extremo.
DURACIÓN DE LA PRÓTESIS:
En general alrededor de 12 meses, aunque hay pacientes que han referido una duración de hasta 15 meses.
FREE HANDS:
Válvula que se abre y cierra sola. Es para pacientes que ya no usan la cánula. Hay
pacientes que no la toleran.
Por juego de presiones la lengüeta se abre y cierra. Cuando no habla, la válvula
está cerrada que permite que respire. Es muy cara.
El paciente pierde olfato porque entra menos aire por la nariz. Se recupera a partir del mecanismo de
inhalación (y no va a entrar como antes, por cambio de presiones), pero el olor va a entrar, entonces se
trabaja con café, o aromas fuertes, porque si no pierde el olfato.