Está en la página 1de 111

TERAPÉUTICA

VOCAL
ÍNDICE
CLASE 1 - 07/04 - ANAMNESIS
CLASE 3 - 14/04 - ÍNDICES TMF – S/Z - TIPO DE INSPIRACIONES
CLASE 13 - 19/5 - EJERCICIOS VIBRATORIOS

CLASE 11 - 12/5 - ANATOMÍA Y FISIOLOGÍA Y TEORÍAS DE LAS CV


CLASE 18 - 04/6 - ANATOFISIOLOGÍA LARÍNGEA
CLASE 14 - 21/5 - TÉCNICAS PARA VISUALIZAR/EVALUAR LA VIBRACIÓN DE LAS CV Y SU ONDA MUCOSA
CLASE 23 – 23/6 - ASPECTOS AERODINÁMICOS DE LA VOZ

CLASE 5 - 21/04 - ESQUEMA CORPORAL VOCAL DEL CANTANTE (ECV)


CLASE 16 - 28/5 - DISFONÍAS FUNCIONALES EN EL CANTANTE CLÁSICO Y EL CANTANTE POPULAR

CLASE 12 - 14/5 - ESCALA PERCEPTUAL DE LA VOZ

CLASE 2 - 09/04 - LABORATORIO DE LA VOZ


CLASE 4 - 16/04 - LABORATORIO DE LA VOZ
CLASE 6 - 23/04 - LABORATORIO DE LA VOZ
CLASE 8 - 30/04 - LABORATORIO DE LA VOZ
CLASE 9 - 05/05 - LABORATORIO DE LA VOZ - LA VOZ DEL ACTOR CALLEJERO
CLASE 10 - 7/05 - CEPSTRUM
CLASE 7 - 28/04 - PRAAT PASO A PASO – SOLO INTRODUCCIÓN
CLASE 17 - 02/6 - RELACIÓN E/ EL DX MORFO-FUNCIONAL DE LA LARINGE Y LOS PARÁMETROS ACÚSTICOS

CLASE 19 - 09/6 – ELECTROGLOTOGRAFÍA


CLASE 22 - 18/6 - VOICE HANDICAP INDEX
CLASE 20 - 11/6 - LARINGECTOMIZADOS
CLASE 21 - 16/6 - REHABILITACIÓN DE LA VOZ EN PACIENTES LARINGECTOMIZADOS
CLASE 24 - 25/6 - EL PACIENTE LARINGECTOMIZADO
1 ANAMNESIS

Cada hospital tiene un manejo diferente. En el hospital de clínicas se realiza:


- Fibroscopía.
- Estroboscopia: Se realiza si hay alguna duda diagnóstica con lo anterior.
Luego se realiza:
- Laboratorio de la voz.
Es importante tener una mirada global del paciente desde que ingresa al consultorio (postura, respiración,
forma de hablar, etc.).

ANAMNESIS → propia del hospital de clínicas

DATOS GENERALES: Nombre y apellido, fecha, edad, dirección, fecha de nacimiento, teléfono, escolaridad,
talla, peso, profesión (punto fundamental que puede afectar el uso de la voz, debemos tener en cuenta de
que trabaja, cuantas horas y el ambiente) derivación, diagnóstico, fonoaudióloga, constitución familiar,
identificación vocal.

A) INFORMACIÓN DEL PACIENTE


1 – Descripción del problema y causas: cuando empezó y cómo, si lo puede describir específicamente, etc.
2 – Episodios previos de disfonía y tratamientos realizados.
3 – Condiciones en que ejerce su actividad.
4 – Modificaciones de la voz: Mañana, Tarde, Noche, Frío, Calor. Por lo general no muchos se dan cuenta si
hay variaciones según estas condiciones, pero se consulta para ver si el diagnostico que yo tengo coincide
con lo que el paciente me relata. Es muy importante la hidratación con agua ya que cuando las mucosas
están secas el trabajo es más costoso, por eso es parte de la terapia.
5 – Enfermedades generales.
6 – Enfermedades específicas: Afecciones respiratorias y rinofaríngeas, Alergias (cuando hay un brote
alérgico se irritan las mucosas), Trastornos glandulares (hormonales), Trastornos auditivos (no solo del
paciente sino que también afecta si convive con alguna persona con trastorno auditivo ya que esto genera
un esfuerzo mayor en la comunicación diaria), Trastornos digestivos – reflujo (Es bastante común. El hecho
de tener secreciones a nivel laríngeo nos habla de que pudo haber habido algún episodio de reflujo durante
la noche y la laringe se defiende generando más mucosa para defenderse. Algunas manifestaciones de
reflujo laringofaríngeo: pueden sentirse sensaciones de ardor, tener que aclarar constantemente la
garganta, tener sensación de secreción postnasal, tener tos sin relación con alergia o resfrío, el que es
cantante necesita más tiempo para calentar la voz, los agudos no suenan iguales, etc.).
7 – Adicciones (cantidad y tiempo): Tabaco, Alcohol, Drogas. (no solo afecta lo que inhalamos sino también
la temperatura más elevada de lo que tiene el cuerpo en el interior, debilita las mucosas y hay mayor
predisposición para las patologías).
8 – Conducta fonatoria: Grita, Habla mucho, Susurra, Telefónicamente, Habla poco, Realiza esfuerzos. (La
laringe cuantos más movimientos tenga (cambios vocales, de alturas, de intensidad, etc.) mejor trabaja, por
ende, si siempre el discurso y el tono de voz es muy monótono o con intensidad alta constantemente,
probablemente me canse más).
9 – Síntomas: Dolor de garganta, Fatiga, Sensación de cuerpo extraño, Tensión cervical, Carraspeo, Otros. (si
tengo nódulos o esbozos nodulares no voy a sentir dolor por eso sino por toda la musculatura que se pone
en juego para poder habar).
(En general no se detalla toda la información que nos provee el paciente, sino que tachamos con una equis
o un tilde, después si uno quiere agregar algo más se pone en observaciones para facilitar mejor la lectura
para los distintos profesionales que traten al paciente en el servicio hospitalario).

FICHA FONIÁTRICA → propia del hospital de clínicas


A. Aspecto y/o movilidad de los órganos fonoarticulatorios: (labios, lengua, paladar duro, velo del
paladar, mordida, falta de piezas dentarias, nariz, mandíbula)
B. Examen funcional de la voz y del comportamiento respiratorio:
• INTENSIDAD: normal, suave, fuerte.
• ALTURA: normal, aguda, grave, bitonal (cambia el tono en el desarrollo de la emisión, en general aparece
mucho en la muda vocal de los hombres que es más brusco), diplofónica (cuando escucho dos frecuencias
simultáneas, por lo general cuando hay patología de masa y unilateral puede aparecer).
• TIMBRE: claro (normal), velado, ronco.
• RESONANCIA: facial (normal), nasal (algún problema de velo del paladar o algún componente alérgico),
laríngea, pectoral (estas dos últimas van un poco más de la mano, se siente una voz más abajo como que no
puede subir).
• ATAQUE: correcto, soplado, brusco
• CUERPO: mantenido (normal), tembloroso, otro
• FILATURA: normal, trunca, descenso al final de la frase, termina haciendo una fritura.
(estos tres últimos se evalúan con el efecto Kaiser: paciente dice una vocal y evalúo su comienzo, como lo
mantiene y como termina, evalúo si el inicio es brusco, si hay soplo, si es normal, en el desarrollo veo si hay
temblor o no, que tiene que ver con el soporte respiratorio).
• MODULACIÓN: expresiva, exagerada, monótona. (Es muy común en las personas la modulación cerrada,
hay poca flexibilidad).
• RITMO: normal, taquilálico (más ligero), bradilálico (más lento).
• ARTICULACIÓN: (puntos y modo) correcto, incorrecto.
• GAMA TONAL EN LA QUE HABLA (F0): (sacando de lado que el paciente pudo haberse realizado una
estroboscopia donde el otorrino pudo haberme sacado un valor de frecuencia fundamental aproximado, y
sacando de lado el laboratorio de la voz, se puede evaluar con el piano y una palabra). Debemos saber la
gama de normalidad en la que se va a situar la voz del paciente para situarme en el piano (mujer adulta entre
200 y 250 HZ, más o menos un la bemol 2.
• EXTENSIÓN: (todas las notas que puedo emitir independientemente de la calidad con la que yo emita esas
notas) Elegimos una vocal, la “U” es una vocal muy amena porque laringe esta baja cuando la uso, los labios
están juntos y eso me permite una mejor emisión, entonces es amigable para trabajar con alguien que tiene
un trastorno vocal. Desde la nota que la persona frecuenta, si no estoy segura voy bajando de a semitonos
buscando a ver hasta donde llego (fritura) hasta determinar el límite inferior. Luego desde esa misma nota
que frecuento más voy subiendo hasta encontrar el límite superior).
La extensión se puede medir con glissando que en general es más fácil y les da un poco más de extensión, o
sin glissando
En un paciente con patología vamos a tener menos extensión y flexibilidad que alguien que tiene una emisión
normal.
• OÍDO MUSICAL: posee, no posee (cuando cuesta lo mejor es hacer la extensión con glissando y no nota
por nota para que el paciente no se pierda).
• TIPO RESPIRATORIO: torácico alto o clavicular, costodifragmático, abdominal. (Todos respiraríamos de la
manera costo diafragmática abdominal (juntos) pero a veces forzamos o exageramos más una parte que
otra, lo que hay que lograr es lograr un equilibrio y direccionar un poco más consciente ese tipo respiratorio).
(Al paciente no le indico que respire ni nada, evalúo lo que trae)
• MODO RESPIRATORIO: nasal, bucal, mixto. (Una respiración normal es mixta porque hay momentos en los
que se requiere usar una o la otra, en reposo la nariz, hablando mucho o cantando las respiraciones quizás
son más bucales que son más rápidas que nasales, hay que alternar).
• ESPEJO DE GLATZER: simétrico, asimétrico. Pongo un espejito (la profe dice que respira, pero yo recuero
de educación vocal que era decir una vocal) y lo que veo es si por las dos narinas se empaña el espejo.
• PRUEBA DE ROSENTHAL: derecha, izquierda. (Me tapo una narina hago 20 respiraciones por una y después
por la otra y controlo si puede o hace menos).
• EFICIENCIA FONATORIA CON /s/ /z/ (índice s/z): (“tome aire y lo saca con una S prolongada” y yo tomo el
tiempo, luego hago lo mismo con la Z, los valores deben darme igual o +- 1, en pacientes con patología los
valores van a ser inferiores).
• TIEMPO MÁXIMO DE FONACIÓN: /a/ /i/ /u/. (hago lo mismo que en el anterior pero con estas vocales y
consigno cuanto tiempo tardo, normalmente ante patologías hay variación entre las vocales por ejemplo
porque el cierre cuesta más).

DIAGNÓSTICO FONIÁTRICO y PRONÓSTICO.

(A medida que voy hablando con el paciente voy dándome cuenta de los distintos aspectos y completando,
no hace falta preguntar ítem por ítem, tomar todo esto me puede llevar un encuentro o 2 con el paciente).
Completar con laboratorio de la voz.

3 ÍNDICES Y TIPOS RESPIRATORIOS


Índice tmf:
/a/ /i/ /u/ niños= 10 seg mujer= 14 s hombre= 15 s
Se toma aire (respiración profunda) y se pide que el paciente haga 3 veces c/vocal y se hace un promedio
con los 9. Puede costar la /a/ más que las otras porque es una vocal neutra y muy abierta. En la /i/ hay más
cierre glótico y la laringe sube, entonces es más prolongada. La /u/ es una vocal muy cómoda, con labios
muy cerrados, laringe está más baja, por lo cual es una vocal muy cómoda para trabajar en la terapia.
Ejemplo: (se toman 2 muestras).
a: 13s a2: 14s 99s:6= 16,5
i: 17s i2: 18s
u: 18s u2: 19s

Índice s/z. adultos= 20-25 seg niños= 10 seg.


Se toman 3 veces la s y tres veces la z y se toma un promedio.
Estos valores tienen que dar 1+/- entre la s y la z.
Ej. s1 =22. promedio: 23,5.
s2 =25.
(En educación vocal vimos que en nuestra lengua la S suena igual que la Z, entonces sería lo mismo pero acá
en esta cátedra lo toman como distintas).
Con esto se puede evaluar si al hacerlo se hace de manera temblorosa, si hace un efecto Kaiser.
No es lo mismo hacerlo recién despiertos y a la tarde, por lo general puede ser mejor cuando uno está más
despierto. Los cantantes tienen que levantarse mínimo dos horas antes de cantar. Los docentes deberían.
También influye si los pacientes son alérgicos, tienen reflujo, moco por detrás de la nariz, carrasperas, etc.
A veces se recomienda que si hay un proceso alérgico o rinitis crónica se inspire por la boca, aunque no es
lo ideal. La resonancia es distinta en estos pacientes.
Cuando se toma un café o té es recomendable tomar 2 vasos de agua, porque esas bebidas secan. Es para
compensar.
En cantantes, o personas que usen la voz como locutores, etc. que entrenen la voz, o incluso deportistas o
personas que hacen yoga, estos índices suelen dar mejores y más prolongados. Incluso a todos los que
utilicen la voz profesionalmente o con un entrenamiento diario se los considera deportistas de alto
rendimiento.
Cuando hay procesos inflamatorios no conviene trabajar con la voz ni hacerle hacer al paciente trabajar la
misma. Grados de congestión graves no se puede trabajar.

TIPO DE INSPIRACIONES → llevar el aire a:


-costal superior. Suele ser incómodo, es típico en niños que hablan rápido y con tono alto.
-abdominal, suele ser la más cómoda.
-respirar normal y ver que sucede. Saber si se mueve la zona costal. Hay que hacer respiración costo
diafragmática - abdominal.

El diafragma está sujeto a distintas estructuras, no está suelto, y es un músculo involuntario. Con estas
inserciones, en una inspiración el diafragma descendió contrayéndose y como una de las inserciones son las
uniones costales, las costillas se desplazan hacia afuera y el abdomen también hacia afuera porque presiona
las vísceras. Por ende, todos deberíamos respirar de manera costo diafragmático - abdominal. Lo que luego
se hace es entrenar ese espacio e incentivar y estimular más ese movimiento. Este tipo de respiración nos
permite ampliar el perímetro en sentido vertical, posterior y horizontal. Y con esto poder tener un mayor
dominio del aire y regular, dosificar la salida del aire, y apoyar la emisión (sostén). Para sostener se requiere
que se activen todos los músculos respiratorios. (lograr soplo sostenido y no empuje exclusivamente
abdominal donde se larga todo el aire, como al soplar las velitas).

La respiración se hace de acuerdo a la emisión. No es lo mismo hablar que cantar, o cantar distintos estilos.

No todas las voces femeninas tienen que ser agudas, cada tracto vocal es individual y particular. Una voz
más agravada no significa que haya una presencia de patología. Hay que ver el panorama general.
A veces lo que es grave no es por las cuerdas vocales, sino por la resonancia que tiene el paciente. Quizás el
laboratorio de la voz da normal. No hay buena resonancia o amplificación del sonido adecuada.
13 EJERCICIOS VIBRATORIOS

Vibración de labios: primero solo con aire y luego agregamos sonido. No hay que mandar mucha fuerza ni
que los labios estén rígidos. Vibración muy blanda. Si se realiza mucho puede dar hiperventilación por ende
general mareos. Coordinar el aire.
Con sonido, realizarlo con una frecuencia cómoda, pequeños glissando. Es un buen ejercicio para poder
movilizar y poner en funcionamiento la mucosa laríngea. Genera cierta presión (todos los ejercicios de tracto
vocal aumentan la presión orofacial dentro de la boca y una disminución en el estrés de impacto, es decir,
se reduce el impacto entre pliegues y comienza una vascularización del pliegue vocal, con la cual se empieza
a calentar lentamente la musculatura, trabaja con el aire porque hay mayor consumo del mismo, hay
sodificación de aire, y al producir una vibración labial, me produce una sensación de cierto cosquilleo dentro
de lo que es la máscara facial. Entonces es un ejercicio muy completo y favorece mucho el trabajo que
queremos hacer con los pacientes que es aumentar las sensaciones resonanciales.
En particular la profe usa mucho el glissando, ya que es una sensación muy interesante donde se acercan las
distancias de las notas. El sonido lo hace con un /pr/. La profe se extiende sólo una octava, porque se busca
estabilidad y relajación, y si se sigue subiendo no genera algo relajante. Quizás se va del si2 al si3. Se sube y
baja de a tonos, se puede dé a semitonos pero se hace muy largo el ejercicio.

Vibración de lengua: Por orden de efectividad va primero este. Y segundo el de labios. Se coloca la lengua
en el medio de los labios. No se hace mucha fuerza con las mejillas. Se prueba primero con aire y corto, luego
con sonido, sonidos solos, y luego glissando.
La vibración de los labios genera un masaje sobre la lengua.
No hay que trabajar con la ansiedad, si el paciente no le sale y se frustra, cambiar.

Vibración de la R: es el tercero de efectividad. Si el paciente ya tiene problemas con la r, le va a costar este


ejercicio, porque justamente hay que sostenerla. Es la r y no la rr.
También hacerlo con glissando. Se puede poner los dedos a los costados de los labios, como ayuda de
soporte en las comisuras. Porque puede no haber un entrenamiento de las comisuras labiales y esto permite
poder realizar la vibración.

Cada ejercicio tiene su beneficio si está bien realizado. Los 3 hacen lo mismo, con que salga uno está bien
pero unos son más efectivos que otros.
Después a esta vibración le puedo agregar una vocal. Ej. /r/ con /u/ → /ru/.
Con estos ejercicios el paciente practica el pasaje sin darse cuenta.
Siempre tienen que ser cómodos para el paciente, y ver que sucede antes y luego de las vibraciones, si
termino con fatiga vocal, si puedo realizar mejor los ejercicios, etc. Justamente se trabajan las sensaciones
por ende es importante ver que le sucede al paciente.

Es importante acompañar con el piano o teclado, está bueno tener elementos para no trabajar
exclusivamente con la vocalización.

Muchas veces cuando se va subiendo con tonos hacia los agudos, y luego debe bajar hacia los graves
(Siempre la distancia de una octava) lo que sucede es que uno queda como trepado o montado en lo agudo,
cuesta desprenderse de eso. Cuando se siente próximo a la zona de pasaje, es decir, que la nota empezó a
subir cada vez más, bajar la intensidad, que permite que la laringe y los músculos se relajen y la báscula
aparece sola. Si yo sigo con esa intensidad vocal y manteniendo en ese registro y no pasar al siguiente. Pero
la mecánica fonatoria no es la que le corresponde a la zona. Entonces en el canto clásico hay como una manía
de trabajar todo como pasado, entonces ya se empieza el grave con una colocación del agudo, para evitar el
trauma del pasaje, pero lo que genera esto es que los graves estén deslucidos, se escapa el aire. Lo que se
tiene que hacer es que el grave tiene que tener una ecualización con el agudo, que es lo que se busca con
todos los ejercicios donde intentan trabajar la resonancia y despertar sensaciones.
Es importante trabajar con los registros. En pacientes con lesiones, incluso pequeñas como nódulos, el
paciente refiere estar más cómodo con los graves, pero luego de una o dos sesiones ya los agudos pasan a
ser un lugar mucho más confortable que el grave, porque hay menos tensión.
Esto se relaciona con las fibras blancas del tiroaritenoideo a diferencia de las fibras rojas del cricotiroideo
que tienen menor fatiga vocal, entonces el tiroaritenoideo es un músculo que desgasta mucho, y por eso
cuando una persona habla mucho y no tiene una buena resonancia de su voz, se fatigan.

Muchos ejercicios los pueden hacer por copiar a la fono. La copia es una buena base.

Otro ejercicio del tracto vocal semi ocluido es la /m/. O el método masticatorio o “/m/ masticada”. Entonces
se hace el sonido de la /m/ pero masticando (moviendo los músculos como si se masticara), pero sin contacto
de los dientes o maxilares.
Se pueden ir bajando los tonos. También se puede bajar la cabeza, mirar hacia el suelo mientras se realiza el
ejercicio, e incluso con las manos tocar la zona de la masticación, donde está la articulación (atrás de los
cachetes). Se trabaja entonces la flexibilidad de la articulación.
Este ejercicio genera lo mismo: que los pliegues vocales se contacten suavemente, empezar a sentir
sensaciones vibratorias. Observar cuando estas sensaciones son más agradables, si se hacen con una
intensidad mayor o menor. Es importante trabajar con intensidades bajas porque hay menos contacto y más
amoroso el impacto.

Con todo esto, se trabaja tan solo con la fisiología fonatoria. No estamos con relajaciones, etc. Solo se trabaja
con la voz con esto. Es personal de cada fono si trabajar más con la voz, con la respiración o si meterse más
con la relajación. Roxana no trabaja casi con relajación con ejercicios como vimos en educación vocal, quizás
masajea si ve mucha tensión.
Pero hay que usar las sesiones lo + óptimas posible, y eso implica no estar mucho tiempo de la sesión con
relajación, solo si es verdaderamente importante. Sin embargo, la fono decide cómo hacer sus terapias, pero
no puede haber pacientes que pueden mejorar en pocos meses, y están años en tratamiento.

Se puede utilizar otra vocal, la /i/: se combina con /s/ /r/, etc. entonces mismos ejercicios con /si/. Lo mismo
con la vocal /a/. La i suele generar incomodidad porque la laringe asciende mucho más.
Si aparece picazón, dolor, tirones, etc. es algo que está mal posicionado o hay alguna alteración.
A veces se puede considerar importante tomar clases de canto para trabajar con la voz. Pero dejando esto
de lado, siempre es importante trabajar la voz con el paciente desde el vamos, desde el inicio, aunque se
hagan ejercicios de relajación o respiratorios o pautas de higiene vocal o articulación, etc. Pero es importante
trabajar la voz con la técnica de voz cantada, y con todos los ejercicios vocales.
11 ESTRUCTURA DE LA CUERDA O PLIEGUE VOCAL

DESDE LO HISTOLÓGICO SE OBSERVAN 5 CAPAS:


1. Epitelio de la mucosa. Células de tipo escamoso.
2. Capa superficial de lámina propia. Espacio de Reinke (le da origen a la patología “edema de Reinke”).
Capa muy flexible.
3. Capa intermedia de lámina propia. Fibras elásticas.
4. Capa profunda de lámina propia, fibras colágenas.
5. Músculo vocal (tiroaritenoideo). Constituye el cuerpo de la cuerda vocal. Fibras de músculo estriado.

La separación entre epitelio y lámina propia es clara, tanto como el límite entre capa superficial e intermedia.
La capa intermedia y profunda (ligamento vocal) están mal diferenciadas en sus límites.

TEORÍA CUBIERTA – CUERPO


Las 5 capas pueden reclasificarse en tres secciones:
1. Cubierta (cover) formada por el epitelio y capa superficial de LP (Cuando hablamos de onda mucosa nos
referimos a esto). En general es donde se asienta toda la patología de masa entonces cuando está
cubierta tiene flexibilidad nosotros lo que tenemos es una ondulación de ese pliegue vocal en buenas
condiciones. Nosotros tenemos que trabajar mucho sobre esa cubierta.
2. Transición formada por el ligamento vocal, considerada de transición porque la rigidez es intermedia
entre la de la cubierta y la que tiene el músculo.
3. Cuerpo (body) constituido por el musculo vocal.
Las propiedades mecánicas de la cubierta y de transición son controladas pasivamente por los músculos
laríngeos, mientras que las del cuerpo por el musculo en sí mismo. Hirano desarrolló el concepto que la
mucosa es como un “cover” que produce el movimiento similar al de una onda. El efecto de ondulación que
se observa a lo largo de la superficie de las Cs. Vs es la llamada “onda mucosa” que se propaga de abajo a
arriba (de zona anterior a posterior). Cuando las cuerdas vocales se alargan las capas actúan como si se
tratara de una sola: falsete. Los procesos patológicos afectan la cubierta, en el caso del Edema de Reinke
aumenta la viscosidad de dicho espacio y los patrones vibratorios se hacen más rústicos, también una cicatriz
post quirúrgica.

PATRONES VIBRATORIOS: REGISTROS


Según Hirano existen 3 tipos de patrones vibratorios.
1. Falsetto (voz liviana, loft, aguda) no hay un completo cierre glotal y abarca las frecuencias más agudas
de 160 a 800 Hz (podemos subir más).
2. Registro modal (voz pesada, registro hablado, grave) hay cierre glótico completo cubriendo un rango
entre 100 a 300 Hz.
3. Frito vocal (registro de pulso) la fase de cierre es relativamente más larga que el ciclo entero. Son las
frecuencias más graves de toda la tesitura, abarcando de 30 a 75 Hz.
BIOMECÁNICA LARÍNGEA
• La laringe no es primariamente un órgano fonatorio.
• Su función principal es respiratoria.
• Función de protección: Función esfinteriana primaria durante la deglución.
• Función esfinteriana secundaria: consiste en un reflejo de cierre por esfuerzo glótico, con aducción
tensa y total laríngea incluyendo cuerdas y bandas, efectuada ante un importante esfuerzo físico.
• Finalmente se halla en el hombre como una función adaptada la función fonatoria.

MÚSCULOS LARÍNGEOS
Se dividen en extrínsecos e intrínsecos.
• Los extrínsecos se dividen en 2 grupos:
− Infrahioideos, que sujetan la laringe a la parte superior del tórax.
− Suprahioideos, que unen la laringe con la base del cráneo y mandíbula; se encargan de regular los
movimientos de ascenso y descenso de la laringe.
• Recordemos que el único músculo dilatador de la glotis es el cricoaritenoideo posterior, la abducción de
las CV debida a la contracción del CAP está sincronizada con los movimientos respiratorios.
• Los músculos cricoaritenoideo lateral, inter aritenoideo y tiroaritenoideo lateral son aductores de las
CV.
• El músculo cricotiroideo es el principal tensor de las CV, el otro es el tiroaritenoideo con su haz más
interno (músculo vocal), pero difieren en la forma de tensión:
− CT produce una tensión isotónica, cambia
el largo del músculo.
− TA produce una tensión isométrica
aumenta el tonismo, pero el largo del músculo es
el mismo (en las mujeres llega a una tensión
máxima en los agudos).
MOVIMIENTOS Y SUSPENSIÓN DE LA LARINGE
La laringe se mueve en tres ejes:
• Vertical hacia abajo y arriba (como cuando tragamos, cuando bostezamos desciende, cuando emitimos
agudos asciende, cuando emitimos graves desciende).
• Horizontal lateral, acercamiento y alejamiento de CV.
• Horizontal anteroposterior cuando se contrae el músculo CT produciendo la báscula laríngea que elonga
las CV.

REGULACIONES
REGULACIÓN DEL TONO
El cambio de tono es determinado por los cambios de longitud, masa y tensión.
• Cuando se elonga la cuerda disminuye la masa y aumenta la tensión, provocado por el CT (falsetto)
• En el registro modal el cambio de fr. se debe a variaciones de rigidez o tensión provocado por el TA.
• La elongación y tensión máxima se consigue por la relajación completa del TA y la contracción del
Cricoaritenoideo posterior (fija aritenoides), y el acortamiento máximo requiere de la contracción del TA
y la interrupción total de la contracción del CT y relativa del Cricoaritenoideo posterior

REGULACIÓN DE LA INTENSIDAD
La intensidad vocal depende de la presión subglótica y de la amplitud de las vibraciones de las CV. Los sonidos
más intensos resultan del logro de presión subglótica suficiente para vencer la resistencia del cierre de CV.
Esto es mucho más difícil lograrlo en frecuencias agudas porque este equilibrio entre poder disminuir la
intensidad, pero a su vez sostener una frecuencia aguda con una buena resonancia y calidad tímbrica es de
las cosas más complejas que existen para hacer en el canto.

REGULACIÓN DEL TIMBRE


Es la característica acústica que nos permite distinguir 2 sonidos que tienen la misma frecuencia e intensidad.
El timbre dependerá de los resonadores, la forma y dimensión del tracto vocal con sus variaciones (con las
características físicas de cada uno de nosotros).

SISTEMA RESONANCIAL → TEORÍA FUENTE-FILTRO


• Fant (1960) considera al aparato fonatorio como un sistema que convierte la energía aerodinámica de
corriente continua en una energía acústica de corriente alterna.
• La teoría de fuente-filtro de Fant dice que la fonación se produce por la respuesta de un sistema de filtros
(tracto vocal) a una o más fuentes de sonido.
• Varios elementos de la cavidad supraglótica se controlan a voluntad para modificar los sonidos glóticos.
• La graficación en la que se representan todas las frecuencias y amplitudes se llama espectro del sonido.
El filtrado actúa modificando el espectro, en las cavidades resonanciales algunas bandas frecuenciales
son enfatizadas constituyendo los formantes.
• En fonética se emplea el llamado triángulo vocálico que diseñó Helwag en el siglo XVIII para representa
el punto, usando 2 dimensiones: un eje vertical correspondiente al grado de abertura bucal y uno
horizontal para la parte de la lengua que queda afectada.
• Según como se posicione la lengua, el tracto vocal presentará constricción en distintos lugares:
- paladar duro para las vocales /i/ y /e/,
- en el velo del paladar /u/,
- en la faringe superior /o/ y
- en la faringe inferior /a/.
• El estrechamiento dividirá al tracto en dos cavidades: anterior y posterior, que resonarán juntas o
independientes si la constricción es muy amplia o muy estrecha respectivamente. Las distintas
conformaciones del tracto originarán distintos formantes vocálicos.
CLASIFICACIÓN DE DISFONÍAS
La clasificación a la que se adhiere en la actualidad es la que considera a las disfonías agrupadas en tres
tipos:

• Funcionales: son las que no presentan alteración visible al examen, y se generan a partir del uso
incorrecto y/o abuso de la voz. Constituyen el mayor porcentaje de las disfonías.
Dentro del campo de estas disfonías podemos encontrar:
− Fatiga vocal (antes se llamaba fonastenia, ya no se usa ese término)
− Cierres glóticos incompletos (hiatus)
− Fonación de bandas
− Trastornos mutacionales
− Disfonías psicógenas

• Orgánicas: son aquellas generadas por una lesión en pliegues vocales o en alguna parte de los sistemas
intervinientes en la producción vocal.
Dentro de las lesiones orgánicas encontramos:
− Parálisis recurrenciales
− Surcos
− Laringectomías parciales y totales
− Neurológicas
Dentro de las mismas nos encontramos con algunas congénitas (surco, diafragma laríngeo, quistes
intracordales) y otras adquiridas (traumáticas, inflamatorias, neoplásicas, endocrinológicas,
neurológicas y iatrogénicas).

• Mixtas (orgánico funcionales /funcionales orgánicas): Son aquellas disfonías funcionales diagnosticadas
tardíamente, por lo que el abuso o mal uso de la voz a lo largo del tiempo predispone la aparición de
lesiones.
Las lesiones mixtas más frecuentes son:
− Esbozos nodulares
− Nódulos
− Pólipos
− Edemas cordales
− Pseudoquistes
− Granulomas de contacto

OTRA NOMENCLATURA
Alteraciones estructurales mínimas: Se incluye aquí una serie de variaciones anatómicas mínimas o
pequeñas malformaciones que se encuentran solo a nivel de pliegues vocales:
• Asimetrías glóticas
• Desproporciones glóticas
• Alteraciones de la cubierta del pliegue vocal. Sulcus, quistes submucosos, disgenesias vasculares,
puentes de mucosa, microdiafragmas laríngeos.

Los hallazgos de la historia clínicas deben hacer sospechar la posibilidad de estas lesiones:
• Disfonías desde la infancia
• Antecedentes de lesiones benignas recurrentes de los pliegues vocales
• Antecedentes de lesiones benignas de pliegues vocales resistentes al tratamiento

(CASO CLÍNICO Nº1)


11 ANATOMOFISIOLOGÍA LARÍNGEA
Dr. Marcelo Sztajn

FUNCIONES LARÍNGEAS
• Ventilación: *No es respiración. Cuando hablamos de respiración en medicina hablamos del ciclo de
Krebs, que es la formación de energía a nivel de la célula. Cuando hablamos de ventilación hablamos del
pasaje de aire.
• Fonación
*Ambos conceptos (ventilación y fonación) están unidos ya que sin una no puede funcionar la otra.
• Protección de la vía aérea: Sin esta función ninguna de las otras dos funciones puede realizarse. Esto
quiere decir que la programación básica de la laringe es proteger a la vía aérea. Evitar que algo entre en
la vía aérea. Para cumplir esa función, la laringe va a descartar la función de fonación y hasta de
ventilación por un tiempo. Esta es la función básica de la laringe. Que tengamos esta protección en la
vía aérea es lo que nos va a permitir hablar, comer, ventilar. Si no hubiéramos tenido esta evolución
seriamos simplemente primates.

Para que nosotros podamos hablar y al mismo tiempo alimentarnos, tuvo que evolucionar toda la base del
cráneo, el cráneo y el cuello para llegar a tener estabilidad. Es algo bastante evolucionado.

ESTRUCTURA DE LA LARINGE:
• Cartílagos • Vasos sanguíneos (arteriales y venosos)
• Ligamentos (unen los cartílagos) • Nervios
• Músculos

1. CARTÍLAGOS
Si bien algunos libros los dividen más importantes o menos importantes, todos son importantes por igual.
Desde abajo hacia arriba tenemos:
• CRICOIDES: que es un cartílago en forma de anillo. En la parte posterior es más alto.
En alguna bibliografía lo podemos encontrar como el primer anillo traqueal. Los anillos
traqueales tienen una característica que en la parte de atrás están incompletos. Por lo
que esta es la gran diferencia entre el cricoides y los anillos traqueales. El cricoides es
completamente entero, no le falta la parte de atrás.

• TIROIDES: Es como un libro abierto hacia atrás. Tiene una escotadura superior y una escotadura inferior y
tiene cuernos superiores e inferiores. Los inferiores, se van a articular con el cricoides.

• ARITENOIDES: Se articulan sobre las cavidades o articulaciones que tiene el cricoides.


Son una especie de pirámide triangular que tienen una parte que se llama apófisis vocal
y otra apófisis muscular.

Por el tipo de articulación los aritenoides pueden moverse en


todas las direcciones hasta en forma circunferencial. Si los
ponemos en movimiento, los cartílagos aritenoides junto con
el musculo de la cuerda vocal realizan los movimientos.

Por dentro del tiroides está la EPIGLOTIS.

Sobre la epiglotis está el hueso hioides que se caracteriza


por ser el único que no se articula con ningún otro hueso
del cuerpo. Generalmente las articulaciones unen dos
huesos.

2. LIGAMENTOS → unen las estructuras.


- CRICOTIROIDEO que une el cartílago cricoides con el tiroideo.
- TIROHIOIDEO une el borde superior del cartílago tiroideo con el hueso hioides, por donde entra el nervio
laríngeo superior.
- Ligamento que se encuentra por dentro entre el cartílago tiroides y el musculo vocal que es la membrana
cuadrangular o cono elástico que limita en el espacio paraglótico.

3. MÚSCULOS
• EXTRÍNSECOS
a) Infrahioideos:
- Esternohioideo - Esternotiroideo - Tirohioideo

b) Suprahioideos:
- Digástrico - Genihioideo
- Milohioideo - Estilofaringeo
Todos estos músculos extrínsecos hacen de sostén a la laringe y cualquier falla en ellos, va a repercutir
directamente en los músculos intrínsecos y en la calidad vocal.

• INTRÍNSECOS
- Cricotiroideo: Es un músculo que tiene dos vertientes. Una vertical y una horizontal. Las dos van desde
la región lateral del cricoides hasta el borde inferior interno del cartílago tiroides (porción vertical) y la
porción horizontal se funde hacia atrás con los constrictores de la faringe.
La función de este músculo es que cuando se contrae lo que hace es tirar el cartílago tiroides hacia
adelante y estira las cuerdas vocales. Es el musculo tensor de las cuerdas vocales. Es el musculo que eleva
el pitch vocal (eleva el tono vocal).
Tiene una característica, es el único musculo de la laringe que esta inervado por el laríngeo superior. El
laríngeo superior es principalmente en su 90% sensitivo. Pero tiene unas fibras que son motoras que van
a inervar directamente a este musculo. Todos los demás están inervados por el laríngeo superior.

- Cricoaritenoideo posterior: Es un músculo que tiene dos partes. Parte vertical y oblicua.
La parte vertical se inserta en la parte posterior del cartílago cricoides y se oblicua hasta insertarse en la
apófisis muscular en una de las partes del cartílago aritenoideo.
Donde se inserta la cuerda vocal es la apófisis vocal del aritenoideo.
Cuando el musculo cricotiroideo se contrae hace girar (rotar) al cartílago aritenoideo llevando la apófisis
vocal hacia lateral y lo que hace es abrir la glotis. Es el musculo abductor de la glotis. Es el único musculo
abductor de la glotis. Abre las cuerdas vocales.

- Interaritenoideo: Va desde la apófisis muscular de un aritenoides hasta la apófisis muscular del otro
aritenoideo. Es el único musculo impar de la laringe. Al contraerse, cierra las cuerdas vocales. Este
musculo es un musculo impar y recibe inervación motora de los dos nervios recurrentes (del lado derecho
y del lado izquierdo). Si un recurrente se paraliza, este musculo puede llegar a tener contracción porque
sigue recibiendo la inervación del otro lado.

- Tiroaritenoideo: Musculo propio de la cuerda vocal. Es el que engrosa la cuerda vocal y la lleva a la línea
media.

- Cricoaritenoideo lateral: Colabora un poco en esta función de llevar la cuerda vocal a la línea media.

NLS= Nervio laríngeo superior NLI= Nervio laríngeo inferior

VASOS Y NERVIOS
La circulación viene por ramas de la carótida que dan ramas que se van metiendo a la laringe.
El nervio recurrente se llama recurrente porque nacen en el cuello, van hacia el tórax y suben de vuelta hacia
el cuello. Recurren.
El recurrente izquierdo es más largo porque pasa por atrás del cayado aórtico para subir a la laringe. Entra a
la laringe e inerva a todos los músculos.

ESTRUCTURA DE LA CUERDA VOCAL


La estructura de la CV desde la profundidad hasta superficie tenemos:
• Musculo vocal (tiroaritenoideo)
• Capa profunda y capa intermedia: Que forman el ligamento vocal
• Capa superficial: También conocida como espacio de Reinke que principalmente es una capa formada
por liquido (como gelatina).
Estas tres capas (superficial, intermedia y profunda forman la lámina propia). Todo esto está cubierto por un
epitelio.
Lámina propia → vasos sanguíneos
En esta imagen se ve la microcirculación de la cuerda vocal. Mientras más en el borde estemos,
los vasos van paralelos al borde libre. Cuando ya llegamos al ventrículo, los vasos empiezan a ir
en cualquier dirección. Cuando nosotros vemos vasitos en la cuerda vocal que no están paralelos
al borde libre, quiere decir que ese vaso nos está guiando hacia donde hay una patología. Porque
hay un lugar donde necesita más metabolismo esa cuerda vocal y el cuerpo envía vasos a esa
zona. En el ámbito médico se dice que el vaso sanguíneo transversal es una flecha que indica
donde va a estar la patología.

FONACIÓN
La imagen representa un ciclo vocal.

Hay dos etapas en la fonación:


La cuerda vocal se encuentra cerrada, empieza a aumentar la presión
subglótica (aire desde los pulmones).
Va abriendo la cuerda vocal desde abajo (desde la subglotis hacia arriba).
Llega un momento que la presión subglótica supera a la presión supraglótica con lo cual se genera una
corriente de aire.
Una vez que pasa esta corriente de aire, se produce el mecanismo inverso. La presión supraglótica es mayor
que la subglótica y se empieza a cerrar la cuerda. Para comenzar de nuevo el ciclo.
*Cuando las cuerdas vocales se van a cerrar el tiroaritenoideo cierra quedando un espacio. Lo que termina
cerrando la glotis es la mucosa de la cuerda vocal. Por el efecto Bernoulli. Esto ocurre porque en una
corriente de aire que pasa, se genera una corriente perpendicular hacia el centro que hace que la mucosa se
expanda y se cierre. Así se produce el cierre glótico.
Cuando el espacio de Reinke está muy seco por falta de agua, el musculo tiende a hacer más fuerza para
acercarse a ese cierre y ahí es donde comienzan los problemas. A veces simplemente tomando mucho líquido
esto se soluciona.

Fisiología → FUNCIÓN PROTECTORA (función principal de la laringe)


Estímulo → NLS → NIR
Hay un estímulo que llega a la supraglotis, lo agarra el nervio laríngeo superior que es principalmente
sensitivo y genera una respuesta a través del nervio recurrente inferior en los músculos.
La vía aérea se cierra en tres partes:
• Repliegue ariepliglótico
• Bandas ventriculares (o cv falsas)
• Cuerdas vocales
El musculo tiroaritenoideo es el segundo musculo más rápido en responder a un estímulo después del recto
medial del ojo que es el que usamos ante un peligro para ver a donde escapamos.

¿Qué pasa en la laringe del niño? CAMBIOS ANATÓMICOS.


Desde que nacemos hasta que nos convertimos en adultos hay un cambio de estas características:
- DESCENSO - ANGULACIÓN - FORMA

- DESCENSO LARÍNGEO:
Cuando nacemos la laringe esta casi atrás de la boca. Casi en C2-C3. En un adulto está en C4-C5 y C6.
Por eso, cuando en un niño de un año se le hace sacar la lengua se le ve la epiglotis porque la laringe todavía
está muy alta. Esa es la explicación por la cual un bebe puede estar siendo amamantado
y respira. Al estar ascendida la laringe, esta cae directamente por detrás de las coanas
y la faringe directamente en la boca. Esta separada la vía aérea de la vía digestiva. En la
medida que la laringe desciende se forma ese trayecto por el cual va a pasar la comida
y el aire. El ser humano es el único animal que se puede morir alimentándose.
- ANGULACIÓN
La angulación de la laringe de un niño está entre 110 y 120° (cartílago tiroides principalmente).
Mientras que el adulto en 90°.
Este es el cambio principal que se da en la muda vocal.
La laringe de la mujer se modifica muy poco. Los cambios más notorios son en el hombre.

- FORMA
La laringe en el niño es casi un cilindro en vez de la forma cónica.
La epiglotis es acartuchada y en los adultos más estirada.
Los aritenoides en los niños son grandes en comparación a la laringe. Luego ya no, porque la
laringe creció y los aritenoides quedaron con el mismo tamaño.
Las cuerdas vocales en el niño son más cortas y gruesas y en el adulto más largas y finas.

En un niño, la luz interna de la tráquea es de 5 mm. En el adulto es de 10 mm.


De modo que si un niño tiene una pequeña congestión que aumente la mucosa 1 mm, la luz interna va a
pasar de 5 mm a 3 mm. Es decir con 1 mm de edema, disminuye la luz un 64 % en un chico. Mientras que en
un adulto, si aumenta 1 mm el edema, nos queda una luz de 7 mm. Solamente la luz disminuyo un 35%.
Por eso están importante y tan peligroso los procesos bronquiales y procesos inflamatorios en la vía aérea
de los chicos. Porque apenas se inflama reduce mucho la luz aérea.

HISTOLOGÍA
- Mucosa → epitelio plano estratificado no queratinizado.
- Lámina propia
 Nacimiento: Monocapa hipercelular. Principalmente formada por ácido hialuronato.
 2 meses: primeros signos de una diferenciación bilaminar. Dos capas muy tenues.
 11 meses: se comienza a observar la formación de una tercera capa profunda, pero todavía no
bien definida.
 7 años: estructura trilaminar
 12 a 17 años: MADURACIÓN DEFINITIVA DE LA LÁMINA PROPIA, con la muda vocal que es cuando
terminan siendo las 3 capas.
- Músculo
Cuando uno va a hacer una estroboscopía a un chico no vamos a ver las mismas imágenes y la misma onda
que en un adulto, porque no están del todo formadas las cuerdas vocales. Siempre tenemos que pensar en
cómo es la anatomía a determinada edad para saber qué es lo que tenemos que ver.

COMO ESTUDIAMOS A LA LARINGE:


- Evaluación perceptual - FEES → fibroscopía de la deglución.
- Nasofibrolaringoscopía flexible. - Nasofibroscopía con chip and tip.
- Laringoscopía rígida. - Laringoscopía de alta velocidad.
- Videoestroboscopía. - Videoquimiografía.
14 TÉCNICAS PARA EVALUAR LA VIBRACIÓN DE LAS CV Y SU ONDA MUCOSA
Lic. Cecilia Cavallo
Clase basada en un paper → Mucosal Wave Measurement and Visualization Techniques.

Introducción
1974 → Hirano propuso que las cv funcionan como un vibrador de dos capas: cover-body. Esta mucosa es la
que vibra sobre el cuerpo cordal.
Esta vibración que se genera en la capa superficial fue también estudiada por otro autor.
1975 → Matsushita → Mucosal Wave: movimientos ascendentes y laterales que se generaban en la mucosa
durante la vibración de las cv, se parecían a las ondas que se generan en un medio fluido. Es entonces el que
habla propiamente dicho de la onda mucosa. Se puede pensar entonces como el viento mueve el agua.
Entonces, este viento lo relacionamos con lo que es la presión subglótica, y la onda mucosa es iniciada por
esta presión.
Esta onda mucosa tiene un componente vertical y un componente horizontal. A través de las fibroscopías
estamos acostumbrados a ver la cara superior de las cv.

Hoy en día se quiere medir o graficar la onda mucosa con muchos softwares.

https://asa.scitation.org/doi/10.1121/1.3493637
Además de los puntos verdes, también hay que pensar en un componente vertical, que se está tratando de
estudiar el movimiento, y que por cómo podemos observar las cv, es de difícil acceso a esa información.
Se habla de labios inferiores y superiores, que se abren en tiempos diferentes (siempre se empieza a abrir
en la parte inferior, y luego en la superior). Tenemos entonces una diferencia de fase en el eje vertical.
En la fase de apertura, la deformación de la cubierta por la fuerza de la presión subglótica permite el paso
del aire a través de las cv e induce el movimiento lateral que genera la onda mucosa.
En la fase de cierre, primero se juntarán los labios inferiores y luego los superiores de las cv. Las propiedades
elásticas de los tejidos permiten a las cv reunirse en la línea media (más allá de considerar a la presión
subglótica).

Parámetros que se pueden evaluar de la onda mucosa y el ciclo vibratorio, tanto cuanti como cualitativa:
• componente horizontal
• componente vertical
• simetría
• periodicidad
• amplitud de onda
• velocidad

Muchas veces puede haber diferentes mediciones dependiendo de quién las hizo, qué papers son, qué
softwares, etc. O incluso distinto con la clínica, que se basa principalmente en lo cualitativo.

Técnicas:
➢ Técnicas indirectas
• EGG
➢ Técnicas directas de visualización
• VKM/DKM: son distintas versiones, distintas maneras de realizar lo mismo.
• Estroboscopía
• HSDI

El recorrido que se va a utilizar para observar la onda mucosa y las cv, es primero la electroglotografía (EGG)
y luego las técnicas directas que trabajan a partir del registro de una cámara.

TÉCNICA INDIRECTA → EGG → ELECTROGLOTOGRAFÍA


Técnica no invasiva que mide las modificaciones en el paso de la corriente eléctrica a través de
dos electrodos colocados en la superficie del cartílago tiroides.
Cuando los pliegues vocales están en contacto, hay un alto grado de conductividad: la corriente
pasa de un electrodo al contrario y la onda obtenida llega a su nivel máximo de amplitud.
Mientras que al momento en que los pliegues vocales se separan, la corriente no pasa de un electrodo al
otro, y por lo tanto, la onda generada tendría una amplitud mínima, debido al aumento de impedancia para
el paso de la corriente eléctrica.

A mayor contacto entre las cv, menor impedancia eléctrica. EGG mide la calidad de contacto entre cv.
La forma de onda de EGG (Lx) describe la duración, coordinación y patrones de contacto relativos propios
de los ciclos vocales.

Como no podemos observar las cv, es un estudio que se combina con otros.
Sincronizado con una estroboscopía, la EGG nos da información de la actividad
del labio inferior de la cv (inicio de fase de apertura).

El pico de la onda es el punto de mayor contacto entre las cv. Pero cuando la
curva comienza a descender ya podemos pensar que los labios inferiores de
las cv empezaron a separarse. Claramente en una imagen EGG no lo podemos
ver, pero sintonizado con la estroboscopía nos da una información nueva, el
tiempo de contacto, etc.

Esquematización de esto:
Relacionado a los registros vocales:

En conclusión de este estudio:

Así como tampoco se puede hablar de la asimetría ant-post, tampoco de izq-der, ya que se evalúa el contacto
entre ambas cuerdas y el patrón de movimiento.

Otra de las ventajas o desventajas es que:


• es menos costosa.
• por sí solas no son tan útiles como las técnicas de visualización para evaluar los parámetros de la OM.
• Su uso en conjunto con por ejemplo, la estroboscopía o HSDI, pueden aportar datos originales a la
exploración.
• Da información sobre la F0 pero no está calculada a partir del análisis del sonido-acústico, sino a partir
del contacto de las cv.

TÉCNICAS DIRECTAS → Ver el patrón de las cv y las ondas mucosas.


En principio, todas estas técnicas utilizan un endoscopio rígido que registra imágenes del plano superior de
las cv para evaluar su vibración.
Las técnicas se diferencian en el tipo de cámara que cada una utiliza y en cómo es analizada la información
posteriormente.

ESTROBOSCOPÍA
• Recurre a un efecto óptico para poder registrar el ciclo.
• Bajo costo relativo, rapidez: herramienta efectiva.
• Captura 30 cuadros por segundo. (Fps)
• Crea ilusión de slow motion al sincronizar la cámara con una luz estroboscópica. Cuando la luz se
enciende la cámara captura una imagen. Como la imagen que entrega se compone de un promedio
de sucesivos ciclos vibratorios, la estroboscopía sólo puede usarse para grabar vibraciones periódicas
de las cv.
• La activación de la luz estroboscópica requiere de una frecuencia
de fonación estable.
• Muchos desórdenes vocales se caracterizan por su aperiodicidad
y/o inestabilidad frecuencial por lo que no pueden ser evaluados
mediante estroboscopía. Ej. una parálisis.
• La estroboscopía es un estudio subjetivo y quienes lo realizan
deben estar bien entrenados para reducir variaciones y
distorsiones.
• No hay consenso sobre las escalas de valoración de los
parámetros de la OM.

HSDI → High Speed Digital Imaging.


• Es el estudio que más avanzó en cuanto a su uso.
• No se basa en un efecto óptico, si no en la captura real de múltiples
imágenes de un mismo ciclo glótico.
• Captura entre 2000 y 5000 fps, valor mucho más alto que la F0 →
permite ver aperiodicidad.
• La cantidad de imágenes por seg es independiente de la fr. y por lo
tanto más efectivo en el dx de vibraciones patológicas, aperiódicas
de la cv.
• Se podría plantear que una desventaja es el tiempo que insume el
procesar tal cantidad de imágenes.
• En Argentina no saben si hay.

VKG - VIDEOKIMOGRAPHY - Videokimografía


• Es más rápido que el HSDI, ya que no requiere
tanto procesamiento.
• Se selecciona, previamente a la grabación una
línea de registro transversal a la glotis.
• Como se registra menos data el n° de fps puede
ascender a 8000. (más cuadros x ciclo glotal).

Se selecciona esa línea roja, y la cámara solo va a registrar lo que sucede en esa línea. Como se sacan muchas
fotos por segundo, puedo tener una imagen del ciclo.
Todos los parámetros a observar siempre nos van a dar información sólo de la línea de
escaneo que establecimos previamente al registro. Es decir, no vamos a obtener
información del eje antero-posterior.

Si por ejemplo en el redondel hay un pólipo, y se selecciona la línea violeta, no nos vamos
a enterar de esa lesión.

Hoy en día existe la digital kimografía, que les permiten seleccionar múltiples líneas a la vez. Antes también
se tenía que seleccionar la línea antes del registro, en cambio lo que sucede con esto digital es que uno
puede ir eligiendo luego.
• VKG puede describir vibración en voces inestables basándose en la asimetría der-izq, fases abierta y
cerrada, propagación de la OM, diferencia de fase, amplitud y frecuencia.
• VKG no puede dar cuenta del eje antero-posterior de la glotis. A su vez, al no registrar el cuadro completo
es difícil determinar si hubo movimiento del endoscopio o vibración irregular.

Se pueden medir:
• Amplitud lateromedial: excursión de la cuerda durante la vibración. Amplitud CVI, Amplitud CVD,
máxima amplitud.
• Periodicidad: regularidad sucesiva de los ciclos de vibración de la cv.
• Fases de apertura y cierre.

Kimograma fonación con inicio suave:

Kimograma fonación con ataque brusco: al inicio de la fonación se ve la aproximación de las bandas que no
permite ver las cv. (serían lo gris de los costados).

Por eso entonces podemos ver el tipo de inicio.

Por otro lado, Kimograma de paciente con parálisis de CVD. Vemos la asimetría entre CVC y CVI donde
indican las flechas. En los círculos rojos podemos ver aperiodicidad.

DKG - DIGITAL KIMOGRAPHY


• La avenida de la DKG usada en conjunto con la HSDI fue un gran avance ya que permitió un análisis
más efectivo de los parámetros de la onda mucosa, así como la posibilidad de cuantificarlos.
• La DKG usa las imágenes obtenidas por HSDI y las analiza mediante un software que permite
seleccionar una línea perpendicular a la glotis.
• La elección de la línea post grabación permite realizar correcciones en cuanto al ángulo de registro y
bloqueos de la cámara.
• Luego se realiza el montaje cuadro por cuadro en un kimograma donde se puede observar: fase
abierta, cerrada, periodicidad, simetría der-izq, diferencia de fase y de amplitud.

Es muy similar a lo anterior, pero es una manera distinta de procesarla.


• El uso en conjunto de HSDI con DKG otorga un modo más confiable y rápido de obtener resultados
cuantitativos y cualitativos de los parámetros de OM respecto a los obtenidos solo con HSDI.
• Del kimograma mismo se pueden obtener curvas cuantitativas que describen el movimiento de las
cv: amplitud OM, diferencia de fase y fr.
• Es decir, expande las posibilidades de comparar cuantitativamente parámetros de OM en voces
patológicas.

Se marcaron 4 líneas que corresponden a 4 kimogramas.

Con estos estudios están tratando también de poder ver qué pasa con los labios inferiores.
Esto no se sabe si hoy en día se está haciendo en el país. Es algo más avanzado.

Cuerda izquierda con lesión.

Cuerda vocal con parálisis, donde la marcada con rojo tiene mayor periodicidad.

Diferencias entre los estudios:


23 ASPECTOS AERODINÁMICOS DE LA VOZ
Clase con Marcos Guzmán - Fonoaudiólogo Chileno. Doctor en vocología. www.vozprofesional.cl

CONCEPTOS Y MEDIDAS MUY UTILIZADAS EN LA CLÍNICA DE LA VOZ:


• Tiempo máximo espiratorio
• Tiempo máximo de fonación
• Índice S/Z
Son todos conceptos de los que ya nos estamos refiriendo a medidas aerodinámicas.

Existen otras medidas más objetivas ya que las anteriores se pueden medir con tiempo con un cronómetro
pero todavía dependen un poco del evaluador.
Existen otra 3 medidas que son las que determinan las bases fisiológicas de la fonación. De hecho, las medida
aerodinámicas son mucho más cercanas a la fisiología que las medidas acústicas. Ya que las medidas
aerodinámicas tienen dirección directa con la fisiología. En cambio, las medidas acústicas tienen una relación
con el sonido que es una CONSECUENCIA de la fisiología vocal. Mientras que las medidas aerodinámicas son
parte DIRECTA de la fisiología vocal.

APLICACIÓN CLÍNICA DE LAS MEDIDA AERODINÁMICAS DE LA FONACIÓN


Las medidas aerodinámicas que interactúan en el proceso de producción de la voz son:

• FLUJO:
a) Volumen de flujo: Cantidad de flujo que sale en un tiempo de fonación (cantidad de flujo que pasa por los
pliegues vocales en una fonación antes de tomar la otra respiración). *No se utiliza tanto en la clínica.
b) Promedio de velocidad de flujo: Es la velocidad con que pasa el flujo de aire entre los pliegues vocales.
*Cuando tenemos una voz normal, vamos a tener un promedio de velocidad de flujo dentro de limites
normales. En cambio, cuando tenemos una voz soplada, los pliegues vocales no cierran bien y se escapa aire.
Entonces el volumen del flujo aumenta ya que se escapa aire más rápidamente. Por eso es que a las personas
con voz soplada no les alcanza el aire para decir una frase completa.
Una persona con voz apretada, ese promedio de velocidad de flujo disminuye ya que los pliegues vocales
están más cerrados, entonces se demora mucho más en pasar el aire.

• PRESIÓN:
a) Presión subglótica: Todo lo que está por debajo de los pliegues vocales.
b) Presión supraglótica: Tracto vocal o cavidades de resonancia *Para Guzmán mejor llamarlo tracto vocal y
no cavidades de resonancia. Son las cavidades por sobre los pliegues vocales hasta los labios (Esta cavidad
también tiene aire y al tener aire también tiene cierta presión, por eso la denominamos presión supraglótica)
*La presión supraglótica es también denominada intraoral.
c) Presión transglótica: Resta entre la presión subglótica y supraglótica (Psub-Psupra). Es muy importante
ya que la presión transglótica es lo que permite que los pliegues vocales oscilen.
Si por ej. tuviéramos una presión subglótica de 10cmH20 y una supraglótica de 2 cmH20= 8cmH20 (esta
sería la presión transglótica) → Es una presión transglótica positiva. Si es positiva quiere decir que hay un
gradiente de presión. Es decir, hay mayor presión en un sector que en otro por lo tanto hay flujo de aire.
Pero por ejemplo si tengo un tracto vocal semi ocluido (ej. Tengo un sorbete o taparse la boca), eso aumenta
la resistencia, aumenta la presión intraoral y también aumenta la presión subglótica (pero principalmente la
intraoral). Entonces por ej. la presión supraglótica ahora es de 5cmH20 y la subglótica tenía 10 cmH20= 5
cmH2O (presión transglótica).
Si me tapo más fuerte la boca la presión supraglótica va a aumentar, estando al borde de que la presión
transglótica este en 0. (Las presiones se igualan)
Cuando está en cero, no hay diferencia de presión por lo que no habrá flujo de aire. Si no hay flujo de aire
no hay voz porque no hay vibración de los pliegues vocales.
d) Presión intraglótica: Presión de aire que hay ENTRE los pliegues vocales que actúa como un colchón de
aire. Es la típica presión que se explica en el efecto Bernoulli que disminuye y aumenta con la oscilación de
los pliegues vocales. Cuando llega a ser negativa, ocurre un efecto de succión y ahí es cuando se cierran los
pliegues vocales según la teoría Mioelástica-Aerodinámica.

• RESISTENCIA:
Resistencia glótica: Es la dificultad que oponen los pliegues vocales a que pase el flujo de aire. Ese flujo
determinado por el gradiente de presión puede pasar más fácilmente o menos.
Si tenemos una voz normal, vamos a tener una resistencia dentro de limites normales.
Si es una voz soplada la resistencia va a estar disminuida porque los pliegues no cierran bien y oponen menos
resistencia. Por eso el aire pasa más rápido.
Si tenemos una voz apretada, la resistencia glótica es muy alta y el flujo de aire va a ser más lento.

El flujo es la corriente de aire, es el movimiento de partículas de aire. Estas partículas de aire cuando están
dentro de una cavidad tienen cierta presión. Nosotros tenemos dos cavidades principales donde
almacenamos aire para la producción de la voz: En la cavidad subglótica y la cavidad supraglótica.

CÓMO MEDIR ESTOS PARÁMETROS AERODINÁMICOS:


1. Los podemos medir dependiendo de la etapa del ciclo vibratorio en la que estamos.
Estos parámetros varían en el ciclo dependiendo de la
fase cerrada o abierta.
En la imagen se observa el glotograma de flujo que se
obtiene a través de una técnica que se denomina filtro
inverso.
*El glotograma de flujo NO es la electroglotografía (son
cosas distintas) hace relación según la etapa de
vibración en la cual nos encontramos. Por ej. En este
sector hay flujo transglótico muy bajo y si vemos la
correlación, coincide con que los pliegues vocales
están cerrados.

A medida que va subiendo la velocidad de flujo (escapa


más flujo entre los pliegues vocales) se correlaciona con
que estos se están abriendo o están máximamente
abiertos.
Entonces una forma de medir el flujo es dependiendo de
la etapa del ciclo vibratorio en la cual nos encontramos.
Pero esta forma no se utiliza en la clínica, se hace para
investigación.

Lo que a nosotros nos interesa, es la tendencia que tiene


el paciente. Cuánto flujo transglótico en una tarea de habla espontanea o en una vocal sostenida tiene como
promedio. Cuál es su promedio. Y no dependiendo de la etapa del ciclo vibratorio en la cual se encuentra.

En el ciclo vibratorio tenemos diferentes fases. Cuanto más abierta sea la fase, más flujo va a pasar.
ALGUNOS PRINCIPIOS FÍSICOS PARA ENTENDER LA FISIOLOGÍA DE LAS MEDIDAS AERODINÁMICAS DE LA
FONACIÓN: SISTEMA DE FLUJO, PRESIÓN Y RESISTENCIA

Este esquema simboliza cualquier sistema de flujo-resistencia


que exista en el cuerpo humano.
La osmosis es cuando las partículas pasan una membrana y
pasaban de un lado a otra. Ese paso de partículas se denomina
osmosis y siempre va desde lo más concentrado a lo menos
concentrado.
Eso es lo que ocurre también con todas las partículas de aire en
el sistema aerodinámico de producción de la voz.
En la parte izquierda del esquema tenemos las partículas ejerciendo una determinada presión (P1) y la
membrana o válvula que ofrece cierta resistencia. Al otro lado hay menos concentración de partículas por lo
tanto ejercen menos presión (P2).
Pensándolo en el sistema fonatorio-resonancial, P1 correspondería a la presión subglótica y la P2 a la
supraglótica. La presión subglótica SIEMPRE tiene que ser mayor que la presión supraglótica, sino no hay
flujo y sin flujo no hay voz.
La resistencia estaría determinada por el grado de aducción de los pliegues vocales (lo más importante) ya
que es lo que determina la resistencia para el paso del aire. Pero también hay otros elementos que afectan
a la resistencia. Por ejemplo, la f0. Una F0 media probablemente va a tener menos resistencia que una
frecuencia fundamental alta porque las cuerdas vocales van a estar más estiradas, más rígidas.
Si tenemos por ejemplo un proceso de cáncer que aumente la rigidez, también va a aumentar la resistencia.
Los pliegues vocales van a moverse menos fácilmente.
Lo fisiopatológico más importante es el grado de aducción.

La ley de Ohm fue creada para la electricidad. Decía que cuando tenemos cierta concentración de partículas
y tenemos una resistencia muy grande, no va a haber flujo porque la resistencia es muy alta. Pero si esa
resistencia la liberamos, las partículas iban a fluir hacia un lugar de menor concentración (de P1 A P2).

En términos aerodinámicos esto está representado por:


La presión diferencial → Es la diferencia de presión entre dos puntos
Existe un potencial → P1 → P2
Para que exista flujo de partículas (en este caso, particular de aire) debe haber una presión diferencial
(diferencia ente p1 y p2). A la diferencia de presiones entre dos puntos, es lo que vamos a denominar
potencial.

Existe una relación entre la resistencia, el flujo y la presión diferencial que se explica por el principio eléctrico
conocido como la Ley de Ohm.
Ley de Ohm: Dicha ley dice que el voltaje es: VOLTAJE = CORRIENTE X RESISTENCIA
La corriente que aparece en la Ley de Ohm es flujo de electrones. La corriente es flujo.
La resistencia tiene que ver con pequeñas resistencias que oponen los circuitos eléctricos al flujo de
electrones.
El voltaje se refiere a la diferencia de concentración de electrones que existen entre las centrales eléctricas
y el enchufe de la casa. El enchufe de la casa tiene muy baja concentración de electrones y las torres de alta
tensión tienen muy alta concentración de electrones. Es por eso que los electrones fluyen desde esa central
hacia los enchufes de esos hogares. Porque existe una concentración diferencial. Eso permite el flujo de
electrones.
APLICACIÓN DE LA LEY A LAS MEDIDAS AERODINÁMICAS:
La ley de Ohm en términos aerodinámicos seria:

Presión diferencial (P1-P2) = Flujo (F) x Resistencia al flujo (R)


F = P1 – P2/R R = P1-P2/F

Psubglotica - Psupraglotica = Flujo x Resistencia glótica


Lo que a nosotros nos interesa es el flujo. Es el indicador más importante.

F=P1-P2/R

El flujo está directamente relacionado con la presión diferencial (Psubglotica-Psupraglotica).


EJ. presión subglótica 10 y la supra sea 1 = 9
Si nosotros tuviésemos más presión subglótica (porque hablamos más fuerte). Para hablar con mayor
intensidad se requiere mayor presión subglótica. (De hecho la presión subglótica es el elemento más
importante para elevar la intensidad de la voz).
Si la persona quiere hablar más fuerte, aumenta la presión subglótica. Ej. a 15 - 1 de la presión supraglótica
= 14
Al aumentar la presión subglótica → El flujo aumenta (sale más rápidamente)
(Es lo mismo que ocurre con una jeringa. Si presionamos el pistón despacio va a tardar el aire en salir. Pero
si lo apretamos fuerte sale rápidamente).

Por otra parte, el flujo esta inversamente relacionado con la resistencia. Si yo aumento la resistencia, el
flujo disminuye.

El tracto vocal cuando estamos hablando normalmente está en posición de tracto abierto. Eso produce que
la presión de aire del tracto vocal al hablar sea igual a la presión atmosférica. Porque son cavidades que
están conectadas.
En términos aerodinámicos fonatorios, la presión atmosférica se considera 0. Al igual que la presión intraoral
(supraglótica).
En términos fisiológicos pulmonares, se considera que la presión atmosférica es 0 como punto de referencia.

Entonces:
Psubglotica - Psupraglotica = Flujo x Resistencia glótica

Queda:
Psubglotica = flujo x resistencia glótica
Esta es la fórmula básica que tenemos que recordar.

F=P/R

Por ejemplo, si tenemos pólipo vocal grande unilateral.


Esa voz se escucha con escape de aire debido a que no hay cierre adecuado por la presencia del pólipo.
Cuando hay escape de aire, la resistencia estaría disminuida.
Pensando en la fórmula: F=P/R
Si la resistencia esta disminuida, el flujo va a estar aumentado y la voz de esa persona que tiene una masa
impidiendo el cierre, se va a escuchar soplada.
Cuando los pliegues vocales no cierran bien, el cuerpo compensa aumentando la fuerza en algún lugar →
Aumenta la presión. Y ahí es cuando se produce el esfuerzo fonatorio.

El esfuerzo fonatorio no es lo mismo que fatiga vocal. El esfuerzo fonatorio es el exceso de fuerza, de trabajo.
Que se mide normalmente en exceso de presión. Hacen más fuerza para producir voz.

Por lo que en una persona que lleva años con un pólipo, su cuerpo compensa y la presión va a estar
aumentada. → Pensándolo en términos aerodinámicos, un esfuerzo fonatorio se correlaciona con una
presión aumentada.

En la fórmula: F=P/R
Si aumentamos el numerador (presión), el flujo va a estar más aumentado.

Con este cuadro, un paciente además siente fatiga respiratoria, se siente agotado luego de hablar mucho
tiempo y se cansa corporalmente hablando porque todo el sistema muscular del cuerpo compensa.

*Importante! En la voz, el término fatiga no se tiene que asociar con lo muscular. Ni vocal ni respiratoria a
pesar de que los pacientes sienten fatiga vocal y respiratoria.
Pero los músculos de la respiración y los pliegues vocales son altamente resistentes a la fatiga. De hecho no
hay evidencia que los pliegues vocales y respiratorios realmente se puedan fatigar como producto de hablar.

Ej. Parálisis de cv. Una se puede mover y la otra está paralizada en posición paramediana. Tenemos un GAP
glótico.

Se escucha una voz muy soplada. Y se escucha una doble frecuencia porque una cuerda vocal vibra en una
frecuencia y otra vibra en otra.
La resistencia va a estar disminuida, el flujo va a estar aumentado.

Y además a este paciente le sacaron la tiroides hace dos semanas. Este paciente no tendría una gran
compensación porque no paso tanto tiempo desde la intervención por lo que la presión subglótica va a estar
normal. Sin tanta compensación
Pero si esa persona consulta tardíamente, después de 2/3 años, ese paciente ya llega con un grado de
compensación muy importante porque su cuerpo ya se dio cuenta que esa voz no le funcionaba. Entonces
tenemos un aumento de presión subglótica.

Además de disminución de la resistencia que ya tenía, se suma un aumento de la presión subglótica. Por lo
que el flujo va a aumentar todavía más. Y al paciente se le va a escapar el aire porque tiene un gran GAP
glótico.

Ej. Disfonía espasmódica produce una hiperaducción de las cv.


La resistencia va a estar aumentada. El flujo va a estar disminuido.
El cuerpo sabiamente para efectos comunicativos se da cuenta de que la compuerta está muy cerrada y lo
que quiere hacer es abrir la voz para que salga el flujo. El cuerpo aprieta el abdomen para aumentar la
presión subglótica.

Entonces en un paciente con disfonía espasmódica, también va a compensar abdominalmente.

Cualquier patología puede ser entendida con esta fórmula (F=P/R).


¿CÓMO SE OBTIENEN LAS MEDIDAS AERODINÁMICAS?
Hay dos formas de obtención:
• Como promedio durante un periodo de
fonación.
• Dependiendo de la fase del ciclo fonatorio
(para esta hay que hacer filtro inverso que es
un procedimiento de investigación).

La que vamos a ver es la primera (promedios

1. FLUJO:
El flujo se podía medir en Promedio de la velocidad de flujo y Volumen de flujo *No lo vamos a ver porque
no tiene mucha aplicación clínica.

• El Promedio de la velocidad de flujo se define con la velocidad con


que el aire pasa entre los pliegues vocales durante la fonación. Es
medido en ml/seg. Si existe una forma de ver en tiempo real el flujo,
se puede evaluar si el flujo es estable, si cae, si sube o si es irregular.

En el eje horizontal está el tiempo y en el eje vertical el flujo (ml/seg).


Entonces se puede observar cómo va cambiando.
En la imagen, se ve una que a medida que va pasando el tiempo va aumentando el flujo.
La fluctuación podría ser debido al aumento de presión a medida de ocurre la emisión.
Otra razón podría ser que disminuya la resistencia. Vemos al inicio de la curva un pico. Eso podría deberse a
un inicio vocal duro.
Podría haber un tercer caso, que podría haberse disminuido la presión y que también aumentara la
resistencia, provocando un aumento del flujo.

El promedio normal de velocidad de flujo es entre 800-200 ml por segundo.

Ej. si el paciente tiene 50 ml/seg de flujo. Es un flujo disminuido que puede deberse a:
• Aumento de la resistencia
• Disminución de la presión

Ej. Un paciente con disfonía espasmódica que no esté compensado con aumento de presión, puede tener
un flujo disminuido de 50 ml/seg.

Ej. un paciente con ELA tiene los músculos respiratorios (y los de todo el cuerpo) con una tonicidad
disminuida. Pierden fuerza, por lo que la presión va a estar disminuida. Entonces podemos tener un flujo
transglótico muy bajo que no siempre es porque la resistencia sea alta, sino que si vamos a la formula
también existe una presión subglótica muy disminuida. Y cuando está muy disminuida, el flujo pasa muy
lento.
Ej. El frito vocal también produce un aumento de la resistencia y por lo tanto un flujo disminuido.
Si vamos al otro extremo, por ejemplo un paciente que tenga 450 o 500 ml/seg. Podemos pensar en:
• Disminución de la resistencia
• Aumentada la presión subglótica
• o Ambas
Ej. parálisis de pliegue vocal.

En resumen:
• Los pacientes con incompetencia glótica tales como parálisis de pliegue vocal pueden tener un promedio
de velocidad de flujo muy alto (400-600 ml por segundo).

• Pacientes con hiperfunción severa o vocal fry pueden tener un promedio de velocidad de flujo muy bajo
(5-10 ml por segundo)

• Pacientes con problemas neurológicos o compromiso respiratorio pueden mostrar un flujo muy irregular
o inestable.

2) PRESIÓN
Cuando hablamos de presión, hablamos de una fuerza por unidad de área actuando perpendicularmente en
esa área. Se mide en cm de H20.
La presión subglótica actúa como fuerza debajo de los pliegues vocales hasta que supera la resistencia de los
pliegues vocales y estas comienzan la oscilación. Representa la energía disponible para la creación de la señal
acústica de la voz.

La presión subglótica es un arma de doble filo: porque sin la presión subglótica no hay energía, no hay fuerza,
no hay fonación. Pero a su vez la presión subglótica es la causante de todas las lesiones fono traumáticas.
Muchas veces, cuando decimos que lo que causa los nódulos, los pólipos y todas las lesiones por fono trauma
es el mal uso de la voz, es algo muy general. Porque en realidad lo que causa estas lesiones es el aumento al
estrés de impacto porque los pliegues chocan con mucha fuerza. Y este choque lo causa la presión subglótica.
Cuanto más presión subglótica se utilice, más choque, el estrés de impacto y por lo tanto mayor probabilidad
de fono trauma.

Hay dos elementos que determinarán cuanta presión subglótica es necesaria para iniciar la fonación:
• Viscosidad de los tejidos de cuerdas vocales
• Grado de aducción

Una persona con disfonía espasmódica lo que hace es aumentar el grado de aducción y ese grado de
aducción provoca automáticamente un aumento en la presión subglótica.

Una persona con parálisis de cuerdas vocales de dos años que ya compenso, como el cuerpo se da cuenta
que la voz no suena, la presión subglótica aumenta para sonar un poco más.
La presión subglótica siempre compensa. Siempre es una forma de compensar.

Por lo que la presión subglótica aumentada ocurre tanto en casos de mucha hiperfunción (disfonía
espasmódica), como en casos de mucha hipofunción (parálisis de cv bilateral abierto).
Siempre va a ocurrir una compensación con aumento de presión subglótica. EN el caso de la disfonía
espasmódica para poder vencer las cuerdas vocales que están firmemente aducidas o en el caso de la
parálisis de cv bilateral para lograr que el ruido que produce la voz suene un poco más fuerte (aire con más
fuerza).

En cuanto a la viscosidad de los tejidos: Ej. un edema de Reinke, la viscosidad de esos tejidos esta aumentada.
Entonces la cuerda vocal se pone más viscosa. La viscosidad es la resistencia que tiene un fluido para poder
moverse.
Todas y cada una de las lesiones fono traumáticas y procesos inflamatorios producen aumento de la
viscosidad de los pliegues vocales.
Si tenemos un fono trauma, este se produjo por exceso de presión subglótica pero como va a haber
inflamación (nódulos por ejemplo) entonces el cuerpo va a compensar con más presión subglótica y va a
haber más fono trauma. Cuanto más fono trauma, más compensación.

Rango de normalidad de presión subglótica en el habla conversacional: 5-10 cm H20.

Personas que apenas se le escucha (en una conversación) 5 cmH20. Pero personas que tienen una voz muy
poderosa (más resonantes) esa presión va a estar cercana a 10 cmH20.
En voces normales ya con 3 cm de H20 ya es posible producir voz.

La presión subglótica esta positivamente relacionada con la intensidad.

Como norma general: a medida que aumenta la presión subglótica aumenta la


intensidad, pero esto no es lineal.

SIEMPRE QUE HAYA AUMENTO DE LA INTENSIDAD, SIEMPRE VA A HABER


AUMENTO DE PRESIÓN SUBGLÓTICA.

Una persona que habla fuerte aumenta la presión subglótica y por lo tanto,
aumenta el estrés de impacto. Siempre.
El aumento del estrés de impacto no es malo. De hecho es bueno ya que si no fuera porque los pliegues
vocales chocasen más fuerte, no tendríamos la capacidad de cambiar la intensidad de la voz.

La rigidez de los pliegues vocales, la hiperfunción, la hipofunción, el cierre glótico incompleto, etc. afecta la
presión subglótica.
En estados patológicos como cáncer, parálisis de pliegues vocales, disfonía funcional hiperfuncional están
asociados con alta presión subglótica.

Ej1. En una parálisis que lleva años, la presión subglótica va a estar aumentada por compensación.
Ej2. Las cuerdas vocales no cierran pero tiene mucha constricción supraglótica. Hay mucha presión
subglótica.
Ej3. En el edema de Reinke el cierre no se ve afectado. Lo que aumenta la presión subglótica es la viscosidad.

CÓMO OBTENER LA PRESIÓN SUBGLÓTICA:


Se le pone la máscara al paciente. Si se observa en la imagen hay una manguerita metida en el labio que es
la que capta la presión subglótica.
Entonces el paciente va a hacer PA-PA-
PA-PA-PA y eso capta la presión intraoral
y desde la presión intraoral se estima la
presión subglótica.
(Para medir la presión subglótica de
forma no invasiva se mide la presión
intraoral durante la producción de una
consonante áfona bilabial explosiva (p).)
El equipo tiene una placa que es un transductor que transforma energía aerodinámica en voltaje que sale
por un cable.

La presión subglótica se estima desde la presión supraglótica porque al paciente se le pide hacer PA PA PA
PA PA PA. y cuando hacemos esto, ese evento tiene a su vez dos eventos:
el /p/ y el /a/

Cuando estamos en el /a/ los pliegues vocales están cerrados. Entonces la cavidad P1 (subglotis) de la cavidad
P2 (supraglotis) están separadas porque las cuerdas vocales están cerradas. Si en ese momento mido la
presión subglótica de la cavidad oral estoy midiendo presión intraoral. Si la medimos en este momento de
la /a/ vamos a estar midiendo la presión intraoral (supraglótica) porque las cavidades están separadas.

Pero si mido la presión de aire dentro de la boca en el momento de la /p/ (que es un sonido sordo), los
pliegues vocales están abiertos. Por lo que las cavidades P1 y P2 están conectadas. Por el principio de Pascal,
cuando dos cavidades están conectadas las presiones se igualan. Entonces cuando nosotros metemos esa
manguerita por la boca en este momento, estamos midiendo la presión intraoral que es igual a la presión
subglótica (P1) porque ambas cavidades están conectadas.

La presión subglótica es medida durante la silaba PA.

La estimación de la presión subglótica provee información de la función glótica.

Recordar:
• La presión subglótica excesivamente alta indica hiperfunción
• La presión subglótica excesivamente baja indica hipofunción

Ej. parálisis de pliegue vocal. Probablemente la parálisis de la cv si es reciente va a tener una disminución de
la presión subglótica. Pero si ya lleva muchos años, por compensación esta ya va a haber aumentado.

Ej. Los pliegues vocales no cierran bien pero hay una gran constricción de las bandas ventriculares. También
podemos tener un aumento de la presión subglótica.
Ejemplo:

Tenemos arriba el flujo transglótico y abajo la presión subglótica. Los picos son del PA PA PA.

El “Mean peak air preassure” es equivalente a la presión subglótica. Nos dice 8.66 (rango normal ya que la
normalidad estaba entre 5 y 10).

Umbral de presión de la fonación: Es la mínima presión subglótica requerida para que las
cuerdas vocales entren en oscilación (iniciar la fonación).

Se le pide al paciente que en vez de que haga PA PA PA a intensidad normal, debe hacerlo a
la mínima intensidad posible antes que sea susurrado. (no tiene que ser susurrado).
En esa fonación tan mínimamente suave se le mide la presión subglótica de la misma forma.
Y esa presión subglótica es el umbral de presión de la fonación.

En normalidad es entre 3 y 5 es el rango de normalidad. (Menos que el rango de presión de habla


conversacional). Si el umbral de presión lo tiene aumentado es porque requiere más fuerza, entonces ya se
considera patológico.
Una persona con cualquier patología vocal de la que sea va a tener un umbral de presión de la fonación
mucho más alto.

Por ejemplo un paciente con nódulos no va a poder hacerlo dentro del rango de normalidad. Porque los
nódulos impiden que con esa presión tan baja cierren. Por lo que va a tener que poner más presión. → Su
presión subglótica mínima para poder producir voz va a estar aumentada.

La presión de los pulmones debe exceder el umbral de presión de la fonación → la oscilación de los pliegues
vocales puede ser lograda.

El umbral de presión de la fonación puede ser afectado por:


• Las propiedades viscoelásticas de la mucosa de los pliegues vocales
• Por la configuración de la glotis (grado de aducción)

Exactamente lo mismo a lo que vimos en la presión subglótica ya que el umbral de presión de la fonación es
un tipo de presión subglótica.
El umbral de presión de la fonación es de vital importancia como predictor de las estructuras y de las
capacidades vibratorias de las cuerdas vocales.
Las personas que sienten esfuerzo fonatorio son las personas que requieren más presión para iniciar la
fonación. (UPF mucho más alto)
Mientras más sanas se encuentren los pliegues vocales, menor será el UPF.
Las condiciones más favorables para un bajo UPF es cuando la amplitud glótica prefonatoria es pequeña y el
borde libre de los pliegues vocales es relajado.
Ej. Pliegues vocales normales. Deberían tener un bajo UPF.

Ej. lesiones fono traumáticas (pueden ser nódulos vocales).


Se va a requerir más presión → Alto UPF.
Entonces: El UPF puede ser interpretado como la medida de esfuerzo necesitada para indicar la fonación. Es
una medida para objetivar el esfuerzo fonatorio.

Un UPF elevado puede estar relacionado con:


• Esfuerzo fonatorio • Fatiga vocal

*El umbral de presión de la fonación incrementa con la fatiga vocal


*Es sensible al incremento transitorio del edema de los pliegues vocales.
*El incremento de la viscosidad de los tejidos y la amortiguación de los pliegues vocales

Los individuos con alteraciones de la voz a menudo dicen tener problemas para iniciar la fonación.

El UPF provee una importante prueba del efecto de la terapia de la voz y de la cirugía.
después de una cirugía, el UPF debería disminuir siempre porque la persona debería disminuir su esfuerzo
fonatorio.
Hay una relación entre la hidratación sistémica y el UPF. Las personas hidratadas permanentemente
deberían disminuir el UPF porque la hidratación sistémica disminuye la viscosidad de los pliegues vocales. Y
pliegues vocales menos viscosos se mueven más fácilmente por lo tanto requieren menos presión.
UPF y calentamiento vocal: Se ha visto en algunos estudios que el calentamiento vocal antes de salir a actuar
en profesionales de la voz también pudiese disminuir el umbral de la fonación. Pero no hay tanta evidencia
como la que existe sobre la hidratación

3) RESISTENCIA
Es una medida derivada que combina las medidas de presión y de flujo.
La determinan los software porque hacen una formula → R=P/F

La resistencia laríngea elevada puede ser atribuible a:


• Excesiva presión subglótica • Insuficiente flujo • o ambos
transglotal

La resistencia está asociada a:


• Grado de aducción de los pliegues vocales • Mecanismo fonatorio (modal, falsete,
• Grado de rigidez y elasticidad de los frito)
pliegues vocales • Intensidad
• Frecuencia fundamental

Aclaración:
El concepto macro de laboratorio de voz incluye:
• Análisis acústico • Electroglotografía • Medidas aerodinámicas
5 ESQUEMA CORPORAL VOCAL DEL CANTANTE (ECV)

Es la apreciación consciente y constante de sus sensibilidades internas fonatorias, desencadenadas por su


propio esfuerzo* de emisión vocal y perceptible por casi todos los órganos, desde la musculatura pelviana
hasta región cervical (nasofaríngeo, facial).

*Propio esfuerzo: cuando uno produce sonido, ya sea hablando o cantando, porque trabajamos con otras
frecuencias, u otra extensión de frecuencia y otras intensidades, hay un montón de sensaciones internas que
se empiezan a desencadenar a diferentes niveles y empiezan a cambiar. Las sensaciones tienen que ver más
que nada con una vibración y con las sensibilidades personales y particulares (si al paciente le pareció más
fácil producir la voz, o más incómodo, etc.). Es algo que se intenta trabajar con ejercicios.
(En el libro de principios de foniatría hay un capítulo sobre el esquema corporal vocal del cantante. *Pero
con la definición anterior alcanza).

El ECV está relacionado con las sensaciones auditivas que percibe el cantante de su propia voz, las que a su
vez le permitirán mejorarlo y controlarlo. (uno ajusta su voz dependiendo de lo que escucha, quizás se hacen
variaciones de apertura de la voz, o velocidad, la intensidad, etc.).
Importante para esto tener oído musical, que vendría a ser la posibilidad de poder reproducir un sonido o
melodía, aunque sea sencilla. El oído musical le permitirá al cantante controlar en cada momento su emisión:
el uso correcto de las presiones subglóticas le permitirá afinar y no producir sonidos calantes* (cuando la
nota no llega a su afinación exacta, es algo muy frecuente) o crescentes (o crecido, es cuando la afinación se
pasa de la frecuencia a la cual tengo que llegar, muchas veces pasa por no tener técnica vocal, entonces una
persona llega al sonido pero muy forzadamente). La laringe está un poco más alta de lo normal). Por último,
también necesitamos de la memoria para poder repetir de manera correcta el mismo mecanismo fonatorio.

*calantes: muchas personas lo llaman desafinación, pero no es lo mismo, porque el calante no llega a la nota
por muy poco, un cuarto de nota para llegar. En cambio, la desafinación está muy lejos de la nota.

Sensorialidad auditiva: no es sino el oído musical que el cantante debe desarrollar en paralelo y simultáneo
con la adquisición del ECV.

Sensaciones internas:
• Región faringobucal: desde alvéolos, dientes superiores, zona palatina anterior (paladar duro) hasta
úvula y faringe, zona superior.
• Región laríngea: no se perciben a este nivel nada más que sensaciones difusas.
• Región nasofacial: conjunto óseo de la cara. (se le dice lleva a la voz a la máscara)
• Región torácica: no deben forzarse las sensaciones intensas en esta zona.
• Región pelviana y del perineo: están comprometidas en el canto a gran volumen y las notas más
agudas. (cantar desde una región muy baja).

Las vibraciones se dispersan a través de los huesos y llegan más allá que a una sola zona. Pero se puede hacer
terapia para llegar a lo ideal.
Hay que pensar en los 3 sistemas, parte respiratoria, la laringe y lo resonancial. Los 3 tienen que estar en
sincronía, para que el sistema total que es la fonación funcione correctamente. Ahora cuando uno sale de la
octava de extensión comienza a percibir otras sensaciones, por eso se describen las regiones.

Técnica vocal
Modo de utilizar los órganos fonadores en la voz cantada sobre la base de automatismos neurológicos
sensomotrices, adquiridos por entrenamiento y que permiten al sujeto un rendimiento vocal adecuado en
cuanto a fr., intensidad y timbre, sin fatiga vocal.
Todo entrenamiento vocal a lo que apunta es que uno pueda cantar todo el tiempo que quiera, todos los
años que quiera, sin generar daño vocal y sin fatiga. Por eso es tan importante la higiene vocal,
entrenamiento previo, el enfriamiento vocal posterior, cantar el repertorio adecuado para nuestra voz, no
es lo mismo canto lírico o clásico que popular.
*Soprano ligera: las más agudas. Soprano lírico: son la gran mayoría de los sopranos.

En el canto a gran volumen hay que tratar de proteger a la laringe, ejerciendo una mayor impedancia. Este
término se utiliza para calificar la resistencia fluida que se opone a la propagación de las ondas sonoras.

Esta impedancia puede lograrse:


• gran presión aérea.
• dilatación del fondo de la boca.

Acá podemos introducir el término de la cobertura o cubertura. Significa que si yo trato de, por ejemplo,
dilatar el fondo de la boca, lo que tengo que tratar de hacer es que la onda sonora, el aire que pasa por
medio de las cv, que va a generar esa corriente de aire que rebotará sobre las estructuras resonanciales,
amplificando esas frecuencias de la mejor manera, de acuerdo a la posición de la abertura de la boca, la
posición de los labios, la situación de la lengua y del velo del paladar, va a producir un sonido que va a ser
más bello a lo que se escucha y me va a permitir lograr una intensidad mayor sin que se esté exactamente
ejerciendo mucha presión de aire para generar un sonido intenso.
Entonces, por ejemplo, si se piensa la emisión con la forma de un megáfono invertido, la parte grande del
megáfono está hacia adentro, donde esta dilatación posterior, la elevación más excedida del velo del
paladar, el descenso de la lengua me va a permitir realizar un sonido que va a trabajar a una alta impedancia,
entonces el producto final es mucho más rico, por ejemplo, en armónicos.

Se sugiere estimular por lo tanto en el alumno:


1. desarrollo de la sensibilidad en la cincha abdominal y parrilla costal.
2. desarrollo de las sensibilidades palatales.
3. desarrollo constante de un control auditivo.
4. dicción clara. (dicciones claras en sonidos muy agudos es muy difícil).

Respiración
Desarrollo de la sensibilidad de la cincha abdominal (toda la zona costo diafragmática abdominal).

La presión subglótica variará:


1. con la intensidad vocal
2. con el carácter abierto o cerrado de la vocal
3. con la fr. emitida
4. con las intenciones expresivas
La presión que yo ejerzo, si bien a veces en el canto uno tiene que tratar un soplo uniforme, nunca es igual
de acuerdo a la altura de donde estoy cantando, no es lo mismo un sonido grave, medio o agudo, entonces
todo el sistema funciona de una manera distinta.
Lo importante es evitar hacer golpes o empujes desmedidos, es decir, hacer presión abdominal para que se
vaya más rápido el aire.

El tipo respiratorio costo-diafragmático-abdominal permitirá:


• espiración medida y controlada.
• conduce a la formación del ECV.
• conduce a una posición baja de laringe. Esto es importante porque el tubo vocal mide más o menos
17,5 cm en un adulto, entonces sí se va a las frecuencias agudas y la laringe hace un movimiento de
ascenso, ese tubo se acorta y la resonancia va a cambiar, ahora si trato que la laringe permanezca
estable y medial en el cuello durante todo el recorrido, entonces se va a tener una emisión mucho
más pareja, tanto en los agudos como en los graves. Es un gran tema en relación a la técnica vocal
académica. Cuando la laringe está alta se podría decir que es como una laringe montada o trepada,
y trabajar con una laringe así no es saludable, trae esfuerzo y fatiga, porque está toda la musculatura
supraglótica y suprahioidea más tensa y no es saludable.
Todo esto favorecido por la técnica del apoyo o apoggio (pujo y no empuje).
*Cuando uno dice que la laringe sube, sube muy poco, pero se siente.

Emisión
Desarrollo de las sensibilidades palatales:
La resonancia tanto en el habla como en el canto debe producirse espontáneamente y como resultado de la
coordinación entre la salida del aire y su pasaje por las cavidades que actúan como resonadores.

Volumen o Intensidad
Durante la ejercitación debe usarse una intensidad media, el F (forte) y FF (fortísimo) sólo deberán
practicarse cuando se haya logrado un pleno dominio del sostén abdominal.
*En piano la F es P. Es difícil cantar con piano. Cantar pianísimo requiere mucho entrenamiento.

Pasaje vocal
Pasar de un registro a otro. Se entiende de registro a una serie de tonos sucesivos que se realizan dentro de
una misma mecánica y se distinguen con otro registro por la mecánica distinta. Ej. voz de pecho con una
mecánica con activación del músculo ariaritenoideo y cuando hacemos un pasaje a un registro más agudo o
registro de falsete, o liviano, activamos además el cricotiroideo.
Normalmente hay un pasaje más marcado, sobre todo en mujeres, desde una voz de pecho, modal, grave o
hablado, a un registro agudo, liviano o falsete. Hay un gran salto, tirolés de cambio. Hay que tratar que no
haya un cambio grosero en los pasajes.
Lo que sucede en el pasaje es el movimiento de báscula laríngea que hace en los cartílagos, entonces el
tiroides se adelanta por sobre el cricoides.
El pasaje lo hacemos todos, incluso con técnica vocal o no. Lo que cambia es que el pasaje sea sutil o no.

• voz de pecho • falsete (abierto o cerrado)


• voz aguda • cobertura o cubertura.

Muchos maestros de canto trabajan la sensación del bostezo para generar la cobertura de la voz, porque al
inicio del bostezo la base de la lengua baja, el velo del paladar se levanta, entonces hay una sensación de
distensión de la laringe. Luego, el bostezo varía.
Sin embargo, hay otros ejercicios que generan mejor movilidad del velo del paladar, pero no cantar con la
sensación del bostezo, porque al cantar con esta sensación, es un movimiento tenso. Se puede usar solo
como recurso de práctica pero no para cantar.
El velo del paladar, si no hay ningún trastorno a nivel motor, tiene mucha movilidad. Hay que estimularlo.

Clasificaciones vocales
Características anatómicas: (no es una regla exacta)
1. tipo físico: personas bajas, voces agudas. personas altas y delgadas, voces graves.
2. apreciación largo y grosor de pliegue vocal, voces graves: p.v largo o delgado. Voces agudas: p.v corto y
gruesas.
3. forma y tamaño del paladar óseo, senos paranasales y resonadores supraglóticos. (por lo general se
espera con personas con cara redonda la resonancia es mejor, que si la cara es estrecha y fina).
4. características funcionales:
• Buscar dónde está la zona de pasaje.
• Dónde es la zona más confortable de la voz o tesitura.
• Cuál es la extensión total de la voz.
5. características acústicas:
• timbre: se refiere a la cualidad tímbrica de la voz en base a los armónicos; color claro (o
brillante) u oscuro.
• intensidad: en general este factor suele unirse a timbre y a la extensión total.

Las clasificaciones de las voces para la mujer son:


-SOPRANO: Do3 al Do5
-MEZZOSOPRANO: La2 al La4
-CONTRALTO: Fa2 al Fa4

Las voces masculinas se dividen en:


-TENOR: Mi2 al Do4
-BARÍTONO: La1 al Sol3 o La3
-BAJO: Fa1 al Fa3

Sin embargo, las clasificaciones vocales no se hacen solo una vez o de una sola vez. Hay que escuchar un par
de veces.
Tampoco es una clasificación tan tajante, se puede extender la extensión vocal. Son referencias para saber
más o menos dónde está la voz de una persona.
Los pasajes de las sopranos se hacen entre un fa3 y un si3 (aproximadamente), depende del tipo de soprano.
Se puede cambiar el movimiento de cambio de báscula laríngea en alguna de esas notas. Las mezzosoprano
pasan entre un re3 y mi3. Y las contralto entre un si2 y un do3.
En los varones el cambio no es tan preciso, porque su longitud de la laringe es distinta que las mujeres,
entonces su pliegue puede extenderse más.

Tiempo aprendizaje de la técnica vocal:


• La impostación de la voz hablada puede llevar de 2 o 3 meses de sesiones foniátricas, dos veces
semanales.
• La impostación de voz cantada lírica puede llevar entre 4 y 5 años, como mínimo.
• La impostación de voz cantada popular puede ser adquirida en el término de 1 año y medio o 2 años.

Cantante popular
- La técnica vocal que debe usar el cantante popular no difiere de la técnica del canto lírico.
- La zona de la voz que debe trabajarse es la gama de voz hablada, la respiración costo abdominal. Debe
buscarse la resonancia natural y espontánea.
- Tienen amplificación con el micrófono, por lo que no necesita trabajar el volumen, si no más la dicción, etc.
- Cualquiera sea el estilo musical, las bases fisiológicas de la emisión deben mantenerse: relajación o
bienestar muscular y apoyo respiratorio.

Uso del micrófono


El micrófono permite la amplificación de la voz. La audición es el principal elemento de control de su
emisión.
Un equipo de amplificación de armónicos, unido al monitor de retorno, es el medio más eficaz de protección
de la voz del cantante, sobre todo si actúa en locales carentes de acústica apropiada.

Preguntas en la clase:
*Correlación
Tiene que haber un correlato entre la voz hablada y cantada. Entonces, si hay poca posibilidad de sostener
el discurso hasta los finales de las frases, también se ve en el canto, hay un correlato en esto.
También puede haber falta de musicalidad que se escucha en el habla y en el canto.
La voz hablada también hay que pensarla como una música, hay que hacer variaciones entre la frecuencia e
intensidades.
Sin embargo, muchas personas cantan maravilloso y hablan feo. No siempre hay correlato en todos los
pacientes.
La voz hablada da mucha información. Porque la voz es la misma, la estructura es la misma, etc.

*Como cambia la voz en la menopausia


Entre los 45 y 55 años varía la voz, porque las hormonas dejan de actuar y viene un descenso progresivo de
la voz. Las mujeres completan la muda vocal (descenso de frecuencia) en la menopausia. Puede cambiar la
extensión vocal, donde los agudos cuestan más producirlos, justamente porque la voz se agrava.
*Ventajas que da un coro
Todo lo que es actividad vocal suma (curso de teatro, locución, etc.). El trabajo coral, estar con otros,
escuchar lo que cantan otras voces, cantar mezclado con distintos registros, escuchar otras armonías,
siempre es beneficioso y placentero.

*No es necesario ser cantante para ser terapeutas vocales.

Velt (cinturón) → se mezcla con la voz media, pero el velting se trata de una respiración costodiafragmática
pero que el aire no llegue tan abajo, y con muy poca presión de aire, porque lo que se sostiene es tratar de
nivelar las tensiones musculares entre el cricotiroideo y el tiroaritenoideo. Entonces respirar más alto y con
poca liberación de aire.
También depende del idioma, porque el inglés es muy nasal, y quizás con el español cuesta esta mixtura,
también se la llama voz mixta, porque no está super alto ni bajo, no hay un cambio entre los registros agudos
y graves.

*Comedia musical
Le ponen mucho brillo a la voz, pero es una voz más hablada, es una colocación diferente.
Spech speak singing.
Tienen que saber articular entre el habla y el canto, porque mezclan mucho esto todo el tiempo. Tienen que
ser cantantes y actores a la vez, y tener un gran dominio de la voz para poder pasar de un tipo de emisión a
otro.

*Registro de fritura: no se debería usar tanto al cantar, sino más bien cuando una persona habla y en las
frases finales. Lo que produce es un gran acortamiento del pliegue vocal, con mucha contracción y mucho
contacto.
Quizás mucha gente lo utiliza para hacer un cambio entre este registro y falsete. Y va variando entre fritura
y falsete, para ablandar la mucosa laríngea, por ejemplo luego de mucho impacto o después de mucha tos.
Si tenemos una voz muy disfónica quizás no está este registro de fritura.
16 DISFONÍAS FUNCIONALES EN EL CANTANTE CLÁSICO Y EL CANTANTE POPULAR

¿Qué es cantar?
Es el uso de la voz humana para producir sonido. El pulmón actúa como una reserva de aire y como un fuelle
que empuja el aire entre las cuerdas vocales haciendo que ellas vibren. El sonido resultante se amplifica al
resonar en las cavidades supraglóticas y se articula mediante los labios, dientes, lengua y paladar.
*Y sabemos que todo lo que vamos a hacer, sobre todo con la lengua, el paladar blanco y los labios, vamos
a hacer diferentes modificaciones de sonidos. Hay sutiles diferencias entre un tipo de cantante y otro.

¿Por qué alguien elige cantar?


• Para poder expresarse en todas las formas posibles que nos permite la voz humana.
• El canto es una actividad que implica atención, concentración, emoción y relativo esfuerzo físico (o mejor
dicho, un compromiso físico). *Cuando uno tiene que emitir un sonido y trabaja un profesional de la voz,
es difícil decir que todo tiene que ser desde un lugar de relajación, lo ideal es un estado eutónico, es
decir, lograr un equilibrio muscular que nos permita desarrollar estas actividades no con un grado de
tensión, pero tampoco con una sensación de laxitud muscular, porque no es la idea. No se puede
mantener una emisión que tenga cierta firmeza y resistencia si uno está totalmente relajado.
• *En una canción uno expresa e interpreta un montón de sentimientos, más que nada en lo que es el
canto popular. En el canto clásico nos permite hacer un gran despliegue de diferentes registros.

Diferentes estilos vocales


• La técnica estudiada, resonante y de gran proyección de los cantantes operísticos.
• Sonido relajado e íntimo de la música celta.
• El estilo cantado con tensión y melodías agudas y muy ornamentadas de los cantantes folclóricos.
• El canto relajado, sutilmente ornamentado y con rubato de los músicos de jazz y blues.
• El sonido tenso, electrónicamente distorsionado de gran parte del canto del rock.
Entonces hay una variedad en cuanto a la manifestación vocal o a los estilos vocales que hacen que cada uno
tenga un componente distinto, y que cada uno va a requerir diferentes tensiones o atención y diferente
dominio con respecto a la vocalidad.

¿Qué permite la educación vocal?


Permite al cantante desarrollar el control de la respiración, regular el grado de relajación o tensión del cuerpo
y hacer resonar y articular el sonido.
*Es necesario, indispensable, sobre todo los cantantes populares que tengan una formación o educación
vocal, porque es muy común que “se agarre la guitarra y empezar a cantar”, que son autodidactas, y no que
han recibido ningún apoyo fonológico, y no se sabe a qué tonalidad debe cantar, a qué clasificación
pertenece, si tengo más graves o más agudos, entonces pueden aparecer cuestiones relacionadas a la
incomodidad vocal. El cantante lírico si o si tiene que tener ese grado de formación, sino no puede abordar
ni una sola canción, se requiere un gran dominio del instrumento, la voz.

Canto coral
A menudo acompaña las labores manuales, expresa alegría o tristeza o bien forma parte del ritual religioso.
Entre las variadas y numerosas tradiciones del canto coral en el mismo está la polifonía o canto a varias
voces.
Hay una diferencia entre el unísono, que es cuando uno canta, o todo un grupo de gente canta pero lo mismo
con la misma melodía, y es lo que suele pasar en los cantos religiosos, que un grupo es guiado a cantar una
melodía pero no hay diferencias de voces, y entre lo que es la polifonía o canto coral, porque se puede cantar
a 3 voces, a 4, a 6, a 8, a 12, etc. pero se hacen subdivisiones dentro de las mismas clasificaciones, y esto
requiere un poco más de entrenamiento, porque ya el hecho de que haya una persona al lado cantando otra
cosa es un gran entrenamiento, no solo desde lo vocal sino también desde lo auditivo.
Música coral
• Cantada por un grupo de personas que cantan como una unidad. Generalmente el término de música
coral señala que hay dos o más cantantes por cada voz.
• La mayoría de la música coral está compuesta para un coro de mujeres u hombres, mixto, de niños o
adultos mayores.

¿Qué diferencia hay entre un cantante clásico y uno popular?


CANTANTE CLÁSICO CANTANTE POPULAR

• Clasificado vocalmente. SIEMPRE. • No siempre es clasificado.


• Posee técnica. • No siempre posee técnica.
• Prevalece el virtuosismo/calidad vocal. • No es imprescindible la calidad.
• Canta sin amplificación. • Canta con amplificación.
• Es más cuidadoso con su salud vocal. • Puede no ser tan cuidadoso.
• No requiere de la inteligibilidad, sino del • Requiere de la inteligibilidad de las
virtuosismo de poder lograr una palabra en palabras, debe llegar a la mayor
una nota difícil de lograr. cantidad de personas.

¿Qué debo observar en un cantante clásico?


• Verificar su clasificación vocal.
• Evaluar su técnica vocal y en caso de ser necesario ayudar a resolver el problema. Preguntar sobre el
estudio vocal.
• Evaluación de la VH (voz hablada) y su incidencia en la VC (voz cantada). Hay veces que hay mucha
disociación entre ambas voces, es decir, puede haber mucha presión en la voz cantada, pero en la
voz hablada está como abandonada. Hay que insistir que los mismos patrones o herramientas o
recursos que uno utiliza para el canto, se requieren y hay que trasladarlas a la voz hablada.
• Evaluar el tipo de repertorio, ambiente donde canta y horas de ensayo. No solo en cantantes, sino
también en cualquier profesional de la voz. La voz requiere descansos, aunque uno tenga técnica
vocal, no abusar y cantar 3 o 4 horas seguidas sin recreos por lo menos 20 min.

¿Qué debo observar en un cantante popular?


• Repertorio y estilo: melódico, folclore, jazz, tango.
• Lugares donde canta.
• Horas de entrenamiento. Es personal elegir el entrenamiento, entre 15-20 min.
• Retorno en el momento del show y durante los ensayos.
• Postura y técnica utilizada, si por ejemplo usan un instrumento a la vez que cantan, etc.

¿Es conveniente que el alumno sepa su clasificación vocal? Sí. Tiene que ver con un tema de salud y de
cuidado, no poniendo una limitación sino trabajar más dentro de las posibilidades de cada cantante.
Muchas veces lo que sucede es que algunas personas prefieren no decirles a los alumnos su clasificación
vocal, porque después creen que no van a cantar una canción que no esté dentro de su clasificación, sin
embargo, esto depende mucho del estilo de canto, ya que si es popular, uno puede cantar una canción de
un artista con otra tonalidad, ejemplo, si cristina aguilera canta más agudo, bajo la canción para que quede
cómodo para la persona que la va a cantar. Ahora bien, en el canto clásico esto no se puede hacer, las
partituras o escrituras están preparadas para una cierta clasificación vocal, y no se las puede modificar.

Cantante clásico Cantante popular

Se realiza la clasificación aunque no siempre de forma correcta. En general no se realiza.


Corista o Coreuta
Muchas veces la clasificación vocal tiene que ver con las necesidades del director de coro. Es común recibir
pacientes que trabajen en coros y llegan con molestias vocales, una porque a veces se terminan cantando
clasificaciones que no son las adecuadas para ciertas personas, o a veces se genera un ensordecimiento de
aquellas personas que cantan con la misma tonalidad, ejemplo que todas sean soprano, y escuchar a otras
personas cantar la misma línea puede generar un ensordecimiento y no escuchar lo que uno canta, y
empezar a acoplarse a lo que canta el otro y no lo que debo. Hay entonces que evaluar la distancia con la
que canta con sus compañeros, etc.

Patologías frecuentes que puedo encontrar en algunos cantantes


• esbozos nodulares (muy chicos, estadios anteriores a los →) - nódulos vocales.
• pólipos
• edema de cuerda vocal
• quiste
• hematoma
Muchos de ellos acompañados con reflujo.

Causas de la aparición de la patología


• multifactorial. Abusos vocales. Mal higiene vocal.
• incidencia de la voz hablada en la voz cantada.

¿Qué ocurre si el paciente debe someterse a una microcirugía?


La idea es que antes de la microcirugía se haga terapia y post cirugía también.

Cantante clásico Cantante popular

Temor a la cirugía por posibles cambios Prefieren la cirugía, para resolver rápidamente el
en la voz. problema.
Tienen mayor percepción de su aparato No es tanta la percepción y hay mayor abuso
fonador. vocal.

Voz hablada versus voz cantada


Voz hablada Voz cantada

• Mayor cantidad de horas de uso o • Menor cantidad de horas de uso vocal.


abuso vocal. • En general cantan en la clasificación que les
• En general hablan en frecuencias corresponde.
más graves que las que • Hay mayor expresividad, dinámica y cambios
corresponden. rítmicos.
• Falta de expresividad en el • Mayor o toda la conciencia respiratoria.
discurso. • En la mayoría de los casos cuando aparece
• Poca conciencia respiratoria. patología vocal la causante no es la voz
cantada sino la voz hablada.

Trabajo con la voz hablada


• Crear conciencia de la frecuencia a utilizar.
• Cuidar la posición laríngea dentro del cuello.
• Lograr una dinámica respiratoria.
• Emitir los sonidos en el registro modal y con posición laríngea cómoda.
• Ablandar la ATM.
• Realizar trabajo práxico para flexibilizar la articulación.
VOZ = EXPRESIÓN

De la voz cantada hacia la voz hablada


• Utilización de elementos y sensaciones conocidas.
• Concientización de la función vocal, durante las horas de habla.
• Recursos cotidianos para poder aplicar.

¿Cuál es mi objetivo principal?


• Trabajar con los elementos que me trae el alumno.
• Analizar en conjunto los pro y los contra de determinadas actividades.
• Crear nuevas conductas fonatorias.
• Administración de las horas de canto y habla.
• Pautas de relajación - postura.
• Modelo respiratorio → analizamos cuál es el mejor (hay uno solo mejor, pero indicarle que se toque con
las manos para más percepción, etc. Además hay muchas definiciones, a veces vienen con otras cosas
aprendidas), y controlamos la administración del aire.
• Diferentes ejercicios de resonancia: uso de la relajación de la ATM para mejorar la resonancia.
• Ubicar la frecuencia indicada de emisión.
• Dinámica vocal, inflexiones.
• Resistencia vocal. Se logra trabajando con el trabajo vocal y con la persistencia en ese trabajo. Hay que
hacer un entrenamiento diario y continuo.

Todos deberíamos hacer ejercicios de calentamiento vocal antes de hablar y obviamente antes de cantar.

Dificultad con el cantante popular


• El poco uso del registro del falsete durante el canto. Más que nada en mujeres, y algunos estilos de canto,
se rehúsan al uso del falsete.
• El estiramiento de la zona de pasaje.
• Uso de volumen demasiado elevado durante el canto. La intensidad de la voz no está relacionada a lo
que más llegue el cantante, con el micrófono esto no tiene que pasar. Ya hay voces que tienen una
intensidad propia y alta, pero no forzar a aquellas voces que no la tienen.

Dificultad con el cantante de coro


• Muchas veces está mal clasificado.
• Hay que trabajar más las sensaciones propioceptivas. Se tiene que saber a nivel de respiración,
vibraciones, si se está colocando bien la voz. Es necesario entonces conocer bien la mecánica, más si no
escuchan lo que están cantando por un ensordecimiento de otros cantantes.
• Muchas veces hay como un ensordecimiento entre todas las otras personas que están cantando, por
ende, elevan la voz los cantantes para escucharse así mismo.

Parte práctica:
Canción:
En la rama de un nogal canta y trina un zorzal / Trala la la la la la la la la la / trala la / trala la
Es una canción que pasa por una octava, en la primera frase puede empezar en un La2 y luego fue
disminuyendo

Ejercicios: ciertas posiciones mientras se están hablando y haciendo esfuerzo para que se entienda.
• Con la lengua empujando un cachete y luego el otro.
• Con la lengua entre los incisivos de arriba y el labio superior.
• Con los dedos apoyándolos en los cachetes y ponerlos entre los dientes.

Otro ejercicio es exagerar la articulación, los maxilares. Es para aflojarlos.


12 ESCALA RASAT

Escala perceptual. Es una adaptación de la escala GRBAS (grade, roughness, breathiness, astenicity, strain).
En el mundo se utiliza esta última. La RASAT es la que utilizamos en Argentina.
Ambas son importantes en el día mundial de la voz. El hospital de Clínicas tuvo una gran cantidad de gente
que se acercaba al mismo para atenderse en este día, donde el otorrino evaluaba las cuerdas vocales y al
lado una fonoaudióloga acompañando en la evaluación. Se hacía una detección temprana, y se brindaba un
cuestionario, en el cual aparecían preguntas tales como: ¿Hace cuánto tiene la disfonía?, ¿Es fumador?,
¿Tiene reflujo? cansancio vocal, toma medicamentos, etc. Se iban marcando con cruces y luego se hacía una
estadística. También se evaluaba la voz del paciente, con la escala RASAT. Por lo general, no es un solo
parámetro mal, sino que hay un conjunto o mezcla de aspereza, tensión, etc. Una vez que se veían algunos
parámetros dentro de lo anormal, se pedía que vuelvan a concurrir para un diagnóstico y seguimiento
correcto. Esto era solo una campaña de detección.
A veces no se podían hacer estas campañas, entonces pasaron a hacerse cursos de distintas charlas. Los
resultados de la campaña daban, del total de personas que concurrían, 2% patología premaligna, 1%
patología maligna. La patología más común que se encontraba eran los nódulos, pero se encontraban
muchas enfermedades. Por otro lado, se les entregaba a las personas un folleto con distintas
recomendaciones y pautas, tales como: Tomar agua, si tiene una disfonía de más de 15 días de evolución,
consulte. Cuando hay dolor o reflujo consulte. También se destacaba mucho que no se fumara, ya que era
uno de los precursores más comunes para que se generen patologías malignas.

EVALUACIÓN PERCEPTUAL DE LA VOZ

Consiste en la apreciación subjetiva de las características de la voz del sujeto en función de la experiencia
previa y de los conocimientos del examinador.

Valoración Subjetiva de la Voz:


Ignacio Cobeta y Faustino Nuñez, en el Libro “Patología de la voz” hacen referencia a cómo sería un método
ideal de evaluación perceptual. Proponen que debería cumplir 3 condiciones:

Evaluación perceptual: El Método ideal debería cumplir 3 condiciones:


1. Debe poder distinguir de un modo fiable las voces normales de las patológicas y ser útil para monitorizar
los cambios en la calidad vocal del paciente a lo largo del tiempo
2. Debe poder correlacionarse con la fisiopatología y los parámetros acústicos objetivos
3. Debe tener establecido el tipo y la cantidad del entrenamiento requerido por el clínico, así como el
aprendizaje del método.

Posible método fiable:


Para que un método de evaluación perceptual de la voz sea fiable, proponen que las dimensiones que se
tengan en cuenta tienen que poder reflejar un conjunto mínimo de parámetros que tengan significado a
nivel clínico.
Estos resultados que se obtengan a partir de la evaluación perceptual tienen que ser fáciles de poder obtener
y a su vez tienen que poder ser aplicables a diferentes afecciones vocales.
A su vez, las puntuaciones que se establezcan en un método de evaluación perceptual deberían presentar
fiabilidad en diferentes evaluaciones realizadas por un mismo observador (a nivel intra-observador) y por
diferentes observadores (a nivel Inter-observador) en los estudios de validación.
Deben utilizarse voces para realizar entrenamiento.

En la actualidad no hay un método que haya demostrado ser mejor que los demás para medir la calidad
vocal percibida. Hay diferentes escalas de evaluación perceptual.
Vamos a desarrollar las 2 más utilizadas: Una utilizada más utilizada a nivel nacional (RASAT) y otra a nivel
internacional (GRBAS).
No hay una que sea mejor que la otra pero las escalas de evaluación perceptual son indispensables en la
práctica clínica tanto fonoaudiológica como laringológica.
SI bien existen diferentes formas de evaluar la calidad vocal del individuo, es indispensable y fundamental
escuchar la voz de un paciente que llega con una queja vocal y poder hacer una evaluación perceptiva de
diferentes parámetros que podemos llegar a valorar de la voz de esa persona. Eso es lo que nos permite es
darnos una impresión diagnostica y en el seguimiento de esa persona, poder ir valorando los cambios de esa
persona a lo largo del tiempo.

ESCALA GRBAS.
• Escala creada por Phonatory Funtion Tests of the Japan Society of Logopedics and Phoniatrics en
1969 por Isshiki y cols., y divulgada por Hirano en 1981.
• Es la más utilizada internacionalmente
• De ella se realizaron variaciones como GRBASI, RASAT, RASATI, CAPE-V
Nos vamos a referir en la variación más utilizada en Argentina que es la escala RASAT (y su variación
posterior, RASATI)

La escala GRABAS analiza el grado de disfonía que puede tener una persona teniendo en cuenta cinco
aspectos:
1. GRADO: Calidad de la voz en general, haciendo una integración entre los diferentes parámetros
2. ROUGHNESS/ASPEREZA: Hace referencia a la impresión de irregularidad de los pulsos glóticos
(irregularidad de la vibración de los pliegues vocales) *Este parámetro genera cierta controversia en
cuanto a la traducción del termino
3. BREATHINESS/SOPLO: Hace referencia a un aumento de escape de aire a través de la glotis.
4. ASTHENIC/ASTENIA: Impresión de voz débil, con falta de potencia
5. STRAIN/TENSION: Nos da la impresión de una voz hiper funcionante.

Cada aspecto se mide en relación a la desviación de la normalidad


0: Normal
1: Leve
2: Moderado
3: Severa
*Estas valoraciones son subjetivas.

Cada parámetro se evalúa a partir de la emisión sostenida de una vocal /a/ o /e/ y habla conectada.
Es importante tener distintos tipos de pruebas. Ya que hay características que se ven más reflejadas en
emisiones sostenidas y otras en el habla conectada.
*Estas distintas valoraciones pueden realizarse en distintas instancias a lo largo del tratamiento. Y
obviamente al final del tratamiento.

En relación a la escala GRBAS se realizaron diferentes estudios en diferentes lugares a nivel internacional
donde se evalúa la fiabilidad intra e Inter-observador y quedó demostrado que las medidas: Grado,
Roughness (aspereza) Y Breathiness (Soplo) más fiables en las investigaciones, por lo cual, muchos autores
utilizan esta forma abreviada de la escala –GRB- (Webb y cols 2004).

A su vez, otros autores (Picchirillo, et al (1998)), juzgaron importante anexar a la escala GRBAS el tópico de
inestabilidad, llamando a la escala GRBASI.
Pinho y Pontes (2002): El termino Rough en la lengua inglesa generalmente es utilizado para caracterizar la
irregularidad de la vibración, genera cierta ambigüedad traducido. Por lo que puede ser percibido de
distintas maneras, entonces ellos sostienen que es impreciso para distinguir entre la ronquera y la aspereza.
Para alejarse de la controversia relativa a la escala GRBAS, proponen la adopción de una nueva sigla: RASAT
(que sí diferencia los parámetros de ronquera y aspereza)
ESCALA DE EVALUACIÓN PERCEPTIVA DE LA FUENTE GLÓTICA: RASAT

RONQUERA: Se justifica por la irregularidad vibratoria de la mucosa de las cuerdas vocales durante la
fonación debido a la presencia aislada de hendidura glótica, de alteración orgánica en la mucosa vibratoria
o ambas.
Un ejemplo característico de ronquera ocurre en las lesiones de masa. Esta situación genera ruido en bajas
frecuencias.
*Podemos diferenciar ese ruido en bajas frecuencias viéndolo en un espectrograma de banda angosta y
observando dónde se ubica el ruido entre los armónicos.

ASPEREZA: Se relaciona a la rigidez de la mucosa, que también causa cierta irregularidad vibratoria.
La calidad vocal es bien característica, cuya impresión es la de una voz seca y sin proyección. En el análisis
acústico se caracteriza por la presencia de ruidos en alta frecuencia.
*Es importante valorar varias tareas fonatorias, no solo una vocal sostenida.
*Estos dos parámetros comparten la irregularidad vibratoria.
*A diferencia de la ronquera, en la aspereza la voz suena agudizada.
En cambio en la ronquera, que se relaciona con una lesión de masa, en general se percibe como más
agravada. Separar estos parámetros nos sirven para poder identificarlos entre sí.

SOPLO: Ruido de fondo audible, cuya correlación fisiológica más frecuente Es la presencia de hendidura
glótica (Puede ser por ej. En una parálisis recurrencial en la cual los pliegues vocales no se juntan en la línea
media entonces queda una hendidura lotica de cierta dimensión y permite que ese aire salga a través de la
fonación. En algún pólipo chiquito también se puede escuchar cierto soplo si está en el borde libre y también
alguna otra lesión de masa que haga que haya una hendidura glótica o cierre glótico incompleto, que lo
vemos al mirar una fibroscopía).
Excepcionalmente, se puede encontrar soplo en casos de extrema rigidez de mucosa, como por ejemplo
puede ser la presencia de alguna leucoplasia o algún carcinoma incipiente.
*Se escucha sobre todo aire en la voz. En general cuando hay soplo la voz se escucha con un volumen menor.
Muchas veces se relaciona con el termino hipofonía o con una voz con un volumen más bajo del habitual. Ej.
En el caso de una parálisis recurrencial que es el caso más conocido asociado a la presencia de soplo.

ASTENIA: Correlacionada con hipofunción de las cuerdas vocales y poca energía en la emisión, como lo
observado en casos neurológicos, por ejemplo miastenia gravis.
*Falta de fuerza en la voz. Se puede observar en casos neurológicos o algunos pacientes con alguna otra
patología de origen neurológico o enfermedad degenerativa.
Es una característica de la voz que no es fácil de escuchar pero es una voz que nos da la impresión de que
necesitamos acercarnos a la persona para poder escucharla mejor. Es una voz que le falta fuerza o energía.

TENSIÓN: Asociada al esfuerzo vocal por aumento de la aducción glótica (hiperfunción), generalmente
relacionada al aumento de la actividad de la musculatura extrínseca de la laringe, causando su elevación.
*La tensión en general está asociada a la desviación en algún otro parámetro. Muchas veces la tensión
aparece por alguna actividad a nivel glótico.
*Muchas veces la tensión es muy observable en la actitud del paciente al fonar o en como está siendo la
emisión. No solo es audible sino observable en cuanto al uso de la musculatura de la laringe. A veces es más
evidente que otras.

Es importante observar para hacer una observación completa del paciente y no solo lo que se escucha.
En el año 2008 fue introducido en la escala RASAT la “I” referente a la inestabilidad vocal → RASATI

INESTABILIDAD. Lo que se percibe son variaciones de la frecuencia y del volumen de la voz. La imposibilidad
de mantener una emisión estable. Muchas veces asociado a tensión o a alguna patología neurológica que
generan que haya fluctuaciones en la voz.
* En relación a la inestabilidad, en algunos pacientes podemos escuchar que hacia el final de la frase, el
paciente va perdiendo volumen o se va como apagando la voz. La inestabilidad no solo en una vocal
sostenida (en donde es más fácil de percibir) se puede percibir sino en el habla encadenada también se
observa.
*Se pueden visualizar por ejemplo en la disfonía espasmódica: Lo que producen estas patologías
neurológicas son inestabilidades vocales pero también inestabilidades o movimientos anormales de otros
segmentos corporales por eso son fácilmente identificables. La INESTABILIDAD en estas patologías es la
característica más importante.

La escala RASATI también utiliza la graduación originalmente propuesta para la escala GRBAS en cada uno
de sus aspectos en 4 niveles:
0: Normal
1: Leve
2: Moderado
3: Severa

Las emisiones sugeridas para juzgar perceptivamente la voz son:


- Vocal /a/ prolongada (vocal más abierta)
- Vocal /e/ (por ser utilizada en el examen laringológico)
- muestra de habla encadenada

*En EL Htal. de Clínicas se toma:


a) la muestra de todas las vocales sostenidas,
b) los días de la semana
c) una muestra de habla espontanea
d) una frase
e) un glissando ascendente y descendente con una /u/ y una /a/
Con todo eso se realiza el análisis perceptual. Por lo que no se quedan con una sola tarea fonatoria. **Es
importante escuchar más de una vez la voz.

EJEMPLOS Y DUDAS:
¿Cómo diferencio aspereza de ronquera?
No es tan fácil diferenciar salgo que sea una voz muy ronca, muy agravada por ejemplo un edema de Reinke
que en ese caso no hay duda, pero en los casos en que hay irregularidad de la mucosa por ejemplo un quiste,
muchas veces se escucha aspereza y muchas veces ronquera.
Pero si la masa que esta sobre los pliegues vocales genera una voz muy agravada (como en el edema de
Reinke), se parece a lo que es un frito vocal.
A diferencia de la aspereza que se escucha como una voz más rasposa, agudizada.

Cómo comenzar a evaluar la voz:


Lo que podemos pensar es si estamos hablando de un ruido en frecuencias bajas o en frecuencias altas.
Si escuchamos ruido hay una irregularidad en el cierre de los pliegues vocales.
Después de pensar en el grado de desviación, pensamos cuál es el parámetro más sobresaliente, con el cual
caracterizaríamos la voz (con cuál lo asociamos más).

Lo importante que sepamos es:


- Que puede coexistir más de una característica
- Si decimos por ej. Decimos que la voz tiene una disfonía moderada, en ALGUNO de los parámetros tiene
que tener un 2 (Moderado). O si decimos que es una disfonía severa, en alguno de los parámetros tiene que
aparecer un 3 (Severo) de desviación.
Un fonoaudiólogo chileno que trabaja en el área de la voz dice que un fonoaudiólogo que trabaje en el área
de la voz tiene que tener mejor oído que voz. Es decir, tenemos que aprender a escuchar al paciente desde
que entra al consultorio. Qué le pasa con su voz, cuándo empezó su problema. Muchas veces todo lo que
nos cuenta nos hace ir sospechando de alguna orientación diagnostica o por dónde comenzar a buscar.

CONCLUSIONES:
• La valoración perceptiva de la calidad de voz hablada o cantada de un sujeto es uno de los pasos
primordiales en la evaluación clínica
• Si bien contamos con distintas escalas que nos permiten categorizar los aspectos percibidos en la
calidad vocal, es primordial la experiencia del clínico especialista en voz a la hora de realizarse la
evaluación perceptual
• Esta evaluación debe siempre complementarse con las otras medidas subjetivas y objetivas a fin de
orientar el diagnóstico y realizar un adecuado seguimiento del paciente durante el tratamiento.

*Esta evaluación perceptiva que realizamos la hacemos desde que conocemos al paciente.

FORMA DE TRABAJAR EN EL HOSPITAL DE CLÍNICAS:


Previamente a la pandemia, las fonoaudiólogas trabajaban junto con el otorrino en lo que se llama “la clínica
de la voz”. Los pacientes ingresan a hacer una imagen laríngea, previamente a hacer una fibroscopía se hace
una estroboscopia con el otorrino y luego van a un turno con las fonos en el cual se hace un análisis acústico
de la voz, se toman protocolos para valorar la afección en la calidad de vida que les ocasiona esa disfonía y
luego de tomar el análisis acústico se le hace una estroboscopia.
En estos estudios están presentes el otorrino y las fonoaudiólogas.

A partir de la pandemia, los estudios como generan un grado de aerolización muy alto fueron suspendidos
entonces los pacientes que ya estaban en atención presencial pasaron a hacer atención virtual.
Ante la imposibilidad de hacer un análisis acústico de la voz, se valieron mucho de lo que es el análisis
perceptual de la voz. Se trabaja con los pacientes a través de zoom o videollamadas. Pero la evaluación
perceptual de la voz en una etapa inicial, controles o al final de tratamiento se hacen a través de audios
grabados.
Es mejor si el paciente se puede descargar una grabadora de voz ya que los audios de WhatsApp filtran
algunas frecuencias o sonidos entonces es más fiable la grabadora de voz.
Se pide a los pacientes a través de un protocolo que le envían escrito, las tareas fonatorias a realizar y que
les envíen las muestras de voz grabadas.
Eso es lo que sirve para hacer una evaluación perceptual. Mas allá de lo que se escucha en cada sesión o
trabajo con el paciente.
Pero siempre se establece una muestra inicial, una muestra luego de algunas sesiones y una muestra hacia
el final del tratamiento.

Cuando la atención es presencial:


El paciente ingresa se ingresa con las Fonoaudiólogas quienes le toman los datos, se le hace preguntas sobre
qué sucede con su voz, por qué llego al servicio de Otorrino y Fonoaudiología. En ese momento y durante la
charla con el paciente ya se van haciendo las evaluaciones perceptuales. Vamos anotando qué características
en su voz percibimos.
Se realizan previo al análisis acústico.
Por último el paciente se hace la estroboscopia.
*Así y todo, también en la anamnesis y en la primera entrevista que tiene con una fonoaudióloga que es la
que va a iniciar su tratamiento, esa fonoaudióloga le toma una ficha vocal y le vuelve a tomar el análisis
perceptual. Porque son Fonoaudiólogas residentes y están en etapa de formación para ir entrenando su
oído.
Luego cuando en los ateneos se ven los casos, además de volver a escuchar la voz de la grabación inicial y si
tenemos de control también, se correlacionan todas las evaluaciones y estudios: La imagen laríngea, el
análisis acústico y la evaluación perceptual.
2–4–6–8–9 LABORATORIO DE VOZ

¿Cómo se produce la voz?


Necesitamos una musculatura, una corriente o flujo de aire (hay autores que piensan que la fuente de
emisión de la voz es el flujo de aire, la profesora coincide con esto. Otros autores piensan que las cv son la
fuente), un tubo de 17 cm de largo (promedio) llamado tracto vocal, que es angosto y curvo, y abarca desde
la laringe hasta la boca y nariz. Dentro de la laringe, por contacto de la cuerdas vocales, aparece la frecuencia
fundamental (F0), que son los ciclos por segundos, en Hertz, siendo la primera frecuencia dentro del rango
frecuencial, pero también se producen los armónicos, que son los múltiplos enteros de esa F0.
La F0 para las mujeres podemos encontrar un rango normal entre 200-250 Hz, más certero 220-230. Desde
los 18 años hasta los 50 años. Las porteñas suelen tener voz más grave, por eso hay que ver al paciente de
manera global para poder decir si tiene una F0 normal.
Si 220 Hz es la F0, el primer armónico es 440 Hz, el segundo es 660 Hz, etc. En el laboratorio de voz podemos
observar todo esto y muchos armónicos más, de 0 Hz a 5000 Hz hay una gran cantidad de armónicos.
En la ventana superior en el Anagraf vamos a ver los armónicos.
Todo esto se modifica gracias a los resonadores, dando origen a los formantes, que son formas particulares
del tubo vocal. Vamos a tener ciertas resonancias dependiendo de la apertura de la boca, con la lengua, y
con el velo del paladar. Esto se asemeja con los instrumentos, donde el tamaño y forma del mismo varía una
nota, es decir, una misma nota varía dependiendo del instrumento que se está tocando.

Es importante entender la diferencia entre formantes y armónicos, no sólo es importante para el área de la
voz sino también para lenguaje y audición. Incluso para la policía o gendarmería por ejemplo, para poder
detectar la voz, dependiendo de la musculatura y la apertura de la boca y composición de los armónicos y
reconocer a un culpable. Los formantes sirven para reconocer el habla, por eso tienen mejor resolución
temporal. En cambio, al paciente que tengo que analizar la voz y su evolución desde el inicio del tratamiento
y a los 2 meses por ejemplo, lo que se evalúa son los armónicos que tienen mejor resolución espacial en un
momento dado.

¿Qué se le toma al paciente cuando llega al consultorio?


• 3 muestras de A sostenida. Ya que la primera el paciente no sabe bien cómo hacerlo, entonces se
analizan las 3 o 2 mejores. El micrófono siempre a la misma distancia (ya evaluada la distancia correcta
con profesionales del hospital) y que sea unidireccional. Se graba 6, 7 u 8 segundos de grabación. Se le
marca el inicio, pero uno graba un poco antes y después que el paciente inicie y termine.
• Una E, I, O, U. Aunque no las evaluamos, las tenemos siempre tomadas. Por las dudas que luego otra
profesional quiere hacer un estudio con alguna de estas vocales y tiene todo grabado de los pacientes.
Por ejemplo, en Brasil trabajan todo con la E.
• Frases fonéticamente balanceadas. Siempre se toman las mismas para ver cómo se modifican. Con el
Anagraf como estudio acústico y con el fonetograma para el habla encadenada.
• Días de la semana, o que cante el cumpleaños feliz para ver la gama de voz cantada.
• Glissando, ascendente con la U, E, I, A. O por lo menos con dos vocales. Con la U es más fácil, pero en el
punto de pasaje por ejemplo a A o a la E hay corte.
En el hospital de clínicas, no se muestran los formantes en gráficos, sino se muestran los armónicos, y este
espectrograma se llama de banda angosta, por los filtros que se pone al sistema para lograr ver los
armónicos. El espectrograma de banda ancha es el que muestra los formantes.

¿Qué pasa en las cuerdas vocales con los cambios de frecuencia? Frecuencia no es lo mismo que tono.
En las frecuencias más agudas las cv se alargan y se afinan, mientras que en las graves trabajan engrosadas.
Entonces la mucosa que vibra es diferente dependiendo del registro o cambios en las frecuencias que haya.
Movimientos de elongación, acortamiento, ensanchamiento, angostamiento, si hay un triángulo más
marcado o grueso o más fino, todo esto va a depender del cambio de frecuencia. También los cambios de la
masa. Siempre el análisis de los registros para pacientes tiene que ser de manera espontánea. Nunca le
decimos primero, porque si no podría imitar.
ANÁLISIS ACÚSTICO DE LA VOZ

Frecuencia fundamental (F0): corresponde al componente frecuencial (1° armónico) más bajo de la señal.
Representa el n° de veces que las cv se abren y cierran por segundo, y se expresa en ciclos por segundo o Hz.

*Si una persona tiene una A de 220 Hz y estuvo hablando por una hora y media. La cantidad de veces que
las cv se movieron y abrieron y cerraron son muchísimas. El cansancio vocal es impresionante si uno no tiene
una pausa o descanso de las cv.
*Si una persona grita, va a ser la cantidad de veces que se mueven las cv más el choque brusco.

La laringe humana es capaz de producir una amplia gama de frecuencias (rango vocal, no le decimos
extensión para el análisis acústico sino para la parte artística), que varía en función de la edad y del sexo. Los
valores normales son alrededor de 125-150 Hz para el hombre, 250 Hz para la mujer y 350 Hz en la infancia,
dependiendo de su edad. *Estos valores normales tienen que ver con la contextura física, la altura (porque
tiene que ver con el tamaño de las cv) y con su edad.
*Dentro de los valores normales también tenemos que tener en cuenta su nacionalidad, su cultura, donde
vive geográficamente (el ejemplo de que las porteñas tienen una voz un poco más grave).

Se expresa en ciclos vibratorios u oscilatorios (podemos verlos en el Anagraf si ampliamos la forma de onda).
La duración de cada ciclo que compone la F0 se denomina periodo (T) y se mide en segs. Frecuencia y periodo
tienen una relación inversa, de manera que conociendo uno podemos averiguar el otro: T=1/F0 y F0=1/T.

Frecuencia (análisis acústico) /tono (uso artístico): la percepción psicoacústica del hecho físico de la
frecuencia es el tono vocal. Cuando aumenta la F0 el tono se hace más agudo, y cuando disminuye se hace
más grave. Estos cambios no son lineales y no percibimos igual el mismo aumento a una frecuencia baja que
a una frecuencia alta.
*Se dice que los cambios de frecuencia baja se perciben mejor que las altas frecuencias.

Variación de la F0: esta puede variar dentro de unos límites determinados, en función de:
• La masa de las cv, cuando la masa aumenta (por una patología, ej.: Edema de Reinke, gran
vascularización, masas intracordales) disminuye la F0 (la voz se hace más grave).
Por ejemplo, el paso de 100 a 150 Hz es más evidente para nuestros oídos que el de 2500 a 2550 Hz. Las
notas musicales reflejan este fenómeno de percepción y así el paso del Do de la primera octava al Do de la
segunda es de 32,7 a 65,4 Hz, (se percibe mejor) mientras que el paso del Do de la quinta al Do de la sexta
octava (más agudo) es de 523,2 a 1046,5 Hz: para subir una octava (12 notas entre tonos y semitonos) hay
que duplicar la frecuencia en el rango de las frecuencias altas. (Ej.: “La” con el que hablo es 220 Hz, si
aumento a la2 es 440, la3 660, y así sucesivamente.)

• La longitud y la tensión de las cv: lo normal es que ambas varíen conjuntamente, y con un aumento de
la longitud aumenta la tensión de la cuerda, lo cual se traducirá en una vibración más rápida y por lo
tanto en un aumento de la F0 produciendo un sonido más agudo (variación isotónica).
También puede aumentar la F0 sin aumentar la longitud, pero incrementando la tensión (variación
isométrica).

Perturbaciones de la frecuencia: esto se denomina Jitter. Se refiere a las variaciones involuntarias de la F0


que suceden de un ciclo a otro. Mide la variación de la F0 entre un ciclo vocal y el siguiente. Representa
también una medida de estabilidad de la fonación. Si está aumentado representa inestabilidad.
Se analiza en el laboratorio de la voz. Un Jitter alto nos indica que hay algo mal en las cv.

Jitter: entendido también como una medida de la variabilidad de la frecuencia. Las mediciones del Jitter son
variaciones relativas en tiempos pequeños.
Puede informar sobre el estado de la glotis.
Los valores se relacionan con las características perceptuales del sonido: áspero o soplados, y del estado de
las cv.

→ Ciclos vibratorios: su similitud y estabilidad demuestra la periodicidad oscilatoria de las cv. Si los ciclos
duran lo mismo o casi lo mismo entonces el Jitter va a presentarse sin alteración.

Entre un ciclo y otro tiene que haber una misma distancia en tiempo. Si hay mucha diferencia y distancia hay
cierta aperiodicidad.
Sin embargo, siempre va a haber una mínima alteración, por mejor cantante que uno sea, el Jitter no va a
tener un valor absoluto en producción humana, es decir que la perturbación de la frecuencia nunca va a ser
igual a 0, eso lo puede dar un instrumento musical o alguna emisión electrónica, sino siempre va a haber una
mínima perturbación de la frecuencia ya que nuestra oscilación no es absolutamente periódica en el tiempo,
en realidad es cuasi periódica.

*El más conocido es el Jitter pero también otro usado actualmente es el cepstrum.
Es una técnica de medición de la F0.

Amplitud de Cepstrum: medida del grado de periodicidad que tiene la señal en un instante determinado.
En las emisiones que presentan ruido, los valores de amplitud del cepstrum son menores. Para el Anagraf
tiene que ser mayor a 0.2. En el PRAAT será otro.

Parámetros de intensidad: la intensidad se define como la amplitud de la variación de la presión sonora


producida al transmitirse la voz en el medio aéreo, y se expresa en decibelios (dB).
La sensación psicoacústica del fenómeno físico de la intensidad es el volumen.
Tiene que ver con los picos de amplitud que se pueden observar en la foto anterior.
Para un adulto normal, la intensidad de la fonación durante la conversación está entre 75 y 80 dB (para la
profe Liliana esto es muy fuerte, para ella usamos más o menos 50 dB normalmente).
Su valor depende fundamentalmente de la amplitud de la vibración de las cv y de la presión subglótica:
cuando estos factores aumentan, también aumenta la intensidad de la voz.
Los factores que inducen una disminución de la intensidad incluyen un soporte respiratorio inadecuado, un
cierre glótico incompleto y unas cv poco flexibles.

Intensidad: al igual que la F0, la intensidad varía de forma involuntaria durante el habla, pero esta variación
es normal y útil para la correcta interpretación de los mensajes que se quiere hacer llegar al interlocutor, y
no es éste el ámbito del estudio de las perturbaciones. Para el análisis acústico le llamamos amplitud.

Perturbaciones de la amplitud: se denomina Shimmer. Mide la variabilidad de la amplitud ciclo a ciclo. Se


determina, al igual que el Jitter, a partir de sonidos vocálicos mantenidos sin variaciones voluntarias.
Representa también una medida de la estabilidad de la fonación.

Shimmer: las mediciones de esta sirven para cuantificar pequeños lapsos de inestabilidad vocal. Se miden
sobre la base de los grados de amplitud en cada ciclo fonador. Los picos de los ciclos si son parejos nos dan
una idea de una perturbación mínima de la amplitud.
El sistema lo hace automáticamente y nos da un valor normal o alterado. Una voz va a tener una pequeña
inestabilidad normal o esperable. Si hay una variación grande, hay una posible patología. Sin embargo, al
igual que el Jitter, no se ha podido vincular con una afección determinada.
>>>> Los valores de Jitter y Shimmer varían según el sistema que se use para analizar la voz <<<<
Parámetros de ruido: La relación armónico-ruido (HNR) es una medida que cuantifica la cantidad de ruido
en la señal de la voz. Es el cociente entre la energía de componentes armónicos de la señal y la
correspondiente al ruido.

El ruido espectral se muestra como puntos, con menor o mayor densidad, entre los armónicos. En el
espectrograma, especialmente en el de banda estrecha, lo primero que debemos fijarnos es en la agudeza
con que se perfilan los trazados horizontales de la F0 (si están estables) y los armónicos. En las voces
normales hay una gran riqueza de armónicos (negro) y escaso ruido interarmónico (gris), lo cual refleja un
buen cierre glótico.

Por lo contrario, en voces disfónicas, con predominio del componente aéreo o turbulencias, las líneas de los
armónicos están mal delimitadas y hay mucho ruido entre ellas. Aunque ninguna voz, por normal que sea,
tiene una ausencia absoluta de ruido, cuando más disfónica sea más ruido contendrá el espectrograma.

El valor normal (Para Anagraf, para otros programas el valor de índice armónico/ruido varía) es de 5 o mayor.

Esta vocal es una A.


Aparecen alteraciones arriba pero no
es patológico, puede deberse a un
vibrato, esa voz probablemente pueda
educarse y cantar.
Si las oscilaciones fueran más grandes
quizás se debiese a un temblor vocal en
alguna persona de mayor edad.

Voz normal: se tiene que tener de 18-


20 a 50 armónicos. Si mi F0 está en 220
Hz, cuando llego a 5000 Hz debo tener
18 armónicos. Pero si un nene con voz
normal me da una F0 280 Hz, no puedo
ver 20 armónicos, hay que cambiar algo en el sistema para poder ver, tengo que ampliar el espectro para
ver la cantidad de armónicos. (en controles está la opción de poder ampliar). Y así el límite superior en vez
de ser 5000 Hz, que sea 7000 Hz y se pueda contar la cantidad de armónicos que tiene ese nene.

Acá hay soplo. Se perciben claramente armónicos en las frecuencias graves y se desdibujan en las frecuencias
medio agudas por componente ruido.
Acá hay alteraciones, hay un gris difuso. Sin embargo, se ven los armónicos pero son pocos. La primera línea
negra de abajo es la F0, luego comienzo a contar para arriba, 5 más o menos. Lo de arriba gris es el
componente de ruido. Aparecen además subarmónicos (mitad de armónico) en el inicio fonatorio (voces con
aspereza) porque no hay buena oscilación de cv, y quizás están interviniendo estructuras supraglóticas en
esta oscilación (bandas ventriculares). Si uno mira el contorno de frecuencia en estas voces muchas veces
hay interrupciones.

Estudio acústico:
paciente: Alejandra, edad: 28 años, fecha: 12-4-2020, cv sin alteraciones, emisión de la /a/ sostenida.

El valor de F0 es de 209 Hz: levemente descendida. (normal 220-240 Hz según sexo y edad cronológica).
Puede variar el laboratorio de la voz porque no desayunó la persona, porque los movs. de ascenso y descenso
de la laringe permiten que la F0 se eleve por ejercicio deglutorio.
Lo verde es la forma de onda. Si yo amplio veo los ciclos.
Lo rojo es el contorno de amplitud.
El azul es el contorno de frecuencia. En el cuadro están todos los valores.
Esto me muestra el funcionamiento de las cuerdas vocales, de los ciclos vibratorios.
Lo verde no es absolutamente estable, no es perfecta la voz humana.
Se elige una porción para buscar los parámetros y resultados. Depende de cada profesional u hospital y se
eligen una cierta cantidad de segundos de esta porción, depende de la modalidad. Pero se tienen que
informar la cantidad de segundos que han sido utilizados.

Lo normal es tener de 20 a 50 armónicos, tener 50 es raro pero puede ser por ejemplo un cantante lírico.
Espectro LTAS (long term average spectrum (?) Gráfico de sección (se toma o selecciona un momento dado
de pocos segundos, no es a lo largo del tiempo) que muestra armónicos y formantes en forma vertical.
(clickear a la izquierda del sistema, donde dice Sec- LTAS, al LTAS se lo llama espectro de sección).
El espectro LTAS es más preciso y me permite ver si los armónicos y formantes tienen buena amplitud y si
los armónicos acompañan a los picos de los formantes. En este caso los acompañan.
Observo 4 formantes claros y sobre el final un último con un pequeño pico.
El primer formante tendría que ser igual en amplitud al segundo en una voz bien trabajada. Después van
disminuyendo alrededor de 12 dB por octava.

Algo importante: en la 4ta ventana del 1er gráfico del estudio acústico completo, el valor de armónicos/ruido
es:
H/N: harmonic/Noise: 6.39 dB: dentro de valores normales (normal > a 5 dB).

Los formantes son las ondas arriba de las líneas. →


Para saber que letra es se fijan en los primeros 3 picos, y sobre todo los primeros dos.
Las mujeres tenemos el primer formante más cerca de 900 Hz, porque el tracto vocal es
más corto. Los hombres tienen más cerca de 600 Hz, porque es más largo. Por ejemplo,
en los cambios de género nunca llegan a los Hz deseados por su tracto vocal que no ha
cambiado, aunque se operen las cv.

En cuanto a los contornos de frecuencia y amplitud del caso de Alejandra:

No tiene patología en cv, pero se observa muy leve inestabilidad en especial en el contorno de amplitud. Por
eso se habla de cuasi periodicidad y de aperiodicidad en caso de alguien que tenga todo alterado.
Los hablantes sin patología presentan cuasi periodicidad. Los valores del Jitter y Shimmer normales no son
iguales a 0. No producimos sonidos artificiales: un piano puede producir una nota estable en el tiempo y si
se analizara mostraría quizás algo más estable que nuestra voz. Lo mismo con el tono de un teléfono de
línea.

Índice de riesgo vocal o de perturbación integrado: con cuatro valores: Jitter, Shimmer, Cepstrum y H/N.

El cepstrum es otra forma de medir la perturbación frecuencial. Su valor normal debe ser mayor a 0.2.
Sirve para medir voces más “caóticas”, que no se pueden sostener en el tiempo (x ej, voces con disfonía
espasmódica, o con mucha aspereza).
Cuando todos los valores están dentro de la normalidad los 4, se ubican en este gráfico en el cuadrado
inferior.
Cuando están alterados, se ubican en el cuadrado superior a la izquierda.
En cuanto a lo numérico deben dar los cuatro un menor a 2 (esto se refiere al índice de perturbación
integrado).
En este caso dan 1.25: dentro de lo normal.

Dónde está la bolita verde es donde indica el cepstrum. Que en este caso está dentro de la normalidad.

Precisión Vocal Total: orientada a lo articulatorio en el tiempo. Tiene que ver con la posición de la lengua y
órganos fonatorios para los formantes.
Para esta /a/ sostenida debe dar > a 90%. En este perfil acústico da 93%: sin alteración. Si mi /a/ es más
cercana a una /o/ se me va a ir para arriba a la derecha, si es más cercana a una /e/ porque estoy sonriendo
por ejemplo, se me va a ir arriba a la izquierda. Voy a tener mayor precisión vocal cuánto más seguridad
tenga en la emisión y más estable sea esa nota durante el tiempo de emisión.

Aprovechamiento de energía: cuando los picos de armónicos coinciden con los formantes (LTAS) quiere
decir que hay un buen aprovechamiento de energía.
35%. Lo normal es mayor a 20%. No presenta alteraciones.
Hacemos un cambio a la izquierda del gráfico para investigar formantes (mayores concentraciones de
energía) se hace click en LPC. En la ventana superior se observa el espectro de banda ancha.

Podemos ver bandas de grises más oscuros y más claros. Sobre los más oscuros, se observa la línea de
puntos. Cada línea de puntos se sitúa en una frecuencia determinada.
Abajo, en la 4ta ventana de los cálculos o magnitudes, se observa: F1, F2, F3, F4 y F5: son las frecuencias de
los formantes. Se calculan en Hz. Y a la derecha hay otra información: B1, B2, B3, B4, B5: son los anchos de
banda.

F1: lo normal para una /a/ es que este cerca de 900 (en mujeres, en hombres más cerca de los 600 y en niños
está más cerca de 1000).
Si está alejado (200, 300) suele tener voz nasalizada, no levantó el velo del paladar correctamente, etc.
El paciente con patología compensa, trata de hablar como puede y el aire se le va a la nariz.

Las líneas blancas son los formantes (lo que veíamos antes en picos en el otro gráfico).
Cada formante tiene un pico y un ancho de banda, esto no lo informamos como terapeutas vocales.
Si yo bajo 5 decibeles del pico y trazo una línea horizontal me va a dar un ancho de banda. Cuanto más picudo
es el pico menor es el ancho de banda y viceversa. Una voz bien colocada va a tener un pico muy marcado,
de buena amplitud, si bajo 5 db me va a dar un ancho de banda angosto (más picudo), eso significa que hay
buen aprovechamiento resonancial. Si mi voz no está tan aprovechada o tuviese alguna patología el pico va
a ser más bajo y el ancho de banda va a ser más ancho (menos picudo).

La frecuencia de los formantes varía según sea la vocal que se emita. Existen valores de normalidad para
estos resultados de frecuencia de formantes según se emita /a/, /i/ o /u/. Asimismo para el resto de los
fonemas del habla.

Se relacionan con la función de transferencia del tracto vocal durante la


articulación del habla.
Observen la distribución de los formantes, en especial donde se encuentra
el primero y el segundo que sirven para identificar una vocal.
La frecuencia de la /a/ para la mujer del primer formante está entre 600 y
900 Hz y el segundo alrededor de 1500 Hz. La /i/ es más aguda y la /u/ es
más grave.
Los cambios dependen de la boca, de la lengua, apertura de la boca, descenso de lengua o ascenso, el velo
del paladar, etc.

Aquí vemos los picos de formantes situados en diferentes frecuencias dada las diferentes posiciones de los
órganos fonoarticulatorios. (Cada formante tiene un pico y un ancho de banda).

Armónicos y formantes se generan en las cuerdas vocales, no en el tracto.

Función de transferencia del tracto vocal (salida de la glotis a la boca)

El tercer dibujo muestra el formante, su pico frecuencial, su energía y el ancho de banda. En el estudio
acústico el ancho de banda se llama B1, B2, etc. según cada formante.
Cuanto más angosto es el ancho de banda hay un mayor aprovechamiento resonancial.

En la /i/ y la /u/ hay un tracto vocal semiocluido, en la /a/ está más abierto (deja escapar todo).

Formante del tracto indica su resonancia.


Van descendiendo, ya que los armónicos descienden alrededor de 12 dB por octava.
Análisis espectral: el filtro de banda ancha tiene baja resolución frecuencial y alta resolución temporal:
formantes. El de banda angosta tiene buena resolución frecuencial y baja resolución temporal: armónicos.

Espectro de banda ancha: oración fonéticamente balanceada.

Este estudio de reconocimiento de voz lo hace un fonetista, un lingüista o alguien de la policía federal.

Formante de cantante: los estudiantes de canto se enriquecen con armónicos y modifican muchísimo los
valores de frecuencia, energía y ancho de banda de los formantes y sus características de a medida que
estudian y entrenan. Mejoran el aprovechamiento resonancial.

Un estudioso de la voz cantada y la acústica ha sido Johan Sundberg, sobre la producción vocal de los
cantantes de ópera. Este autor introdujo el concepto de Formante del Cantante (1977) explicando que el
cantante produce un sonido con una resonancia especial, que lo ayuda a destacar su voz del
acompañamiento orquestal. En algunos teatros por ejemplo los cantantes de ópera tienen 100, 120 dB de
intensidad, no usan micrófonos y se los escucha ya que desarrollaron dicho formante.

Cerca de los 2000 y 3000 Hz aumentó la amplitud de este formante gracias a la educación vocal.
La tabla de valores en el análisis acústico para estos cantantes va a ir creciendo en vez de disminuir.
Otros sistemas de análisis acústico

PRAT
Es gratuito, puede bajarse de internet.

Aquí vemos:
En la primera ventana: la forma de onda.
En la segunda:
• los armónicos (filtro de banda angosta).
• Contorno de frecuencia en amarillo y contorno de amplitud.
• Valor del contorno de frecuencia (215 Hz) y valor del contorno de amplitud (energía) en dB.
Se miden de 0 a 5000 hz los armónicos.
Es excelente, pero tenemos que fijarnos en la distancia con el micrófono y ver que no haya ruido ambiente.

WAVE SURFER
También se baja de internet.

En la segunda ventana se ven los picos de los formantes en colores (espectro de banda ancha).
Las líneas en vertical (paralelas a los colores) son los ciclos por segundo.
En las ventanas de abajo puedo buscar los valores de los formantes. En este sistema son frecuencias no
exactas, aparecen con decimales.

GRAF
También se puede bajar de internet.
Me muestra armónicos en el tiempo.
La persona está diciendo algo por eso se resaltan unos armónicos al inicio y otros no.

DR. SPEECH
Recuadros de izquierda a derecha:
1° Jitter
2° Shimmer
3° Frecuencia
4° armónico/ruido
Líneas horizontales de abajo: “calidad vocal estimada”
1° voz ronca
2° voz áspera
3° voz con soplo

(cuadro a la izquierda)
En la segunda ventana veo la forma de onda.
En la primera ventana veo armónicos y componentes de ruido (difuso gris), es una voz patológica.

ZONA SPEECH de Kay elemetrics


Da un montón de valores

SISTEMA VOICE VISTA


Se ve el comienzo, sostén y final de la emisión (debajo de la forma de onda). En este gráfico vemos mucha
inestabilidad, sin embargo es una emisión de habla prolongada, así que no lo puedo comparar con lo
analizado anteriormente (en praat, o anagraf) quizás más con el graf.

OTROS SISTEMAS
• Pitcher
• Voice explorer
• Computerized speech research enviroment
• Computerized speech lab: CSL
• Multispeech

Emisión vocal
Es el resultado de la interacción de la fuente: cuerdas vocales y filtro: tracto vocal (parte superior de la
laringe más la parte inferior de la faringe que luego va a la boca y la parte superior de la faringe que va a la
nariz).

Teoría fuente - filtro


1° FUENTE
Sale de cuerdas vocales
Armónicos: bajan a razón de 12 dB por octava.
flecha hacia formantes
2° FILTRO
Va a la boca
(f1, f2): función de transferencia del tracto vocal
Latencia en la forma de onda

Paciente que le pido que haga una /a/.


Latencia en el comienzo de frecuencia, no puede juntar las cuerdas, debe tener algún esbozo nodular.

GLISSANDO
Hizo un glissando de la nota más grave a la más aguda y lo amplió, dejó solo el contorno de frecuencia. Da
de donde a donde se extiende.

Ciclos

Vemos un solo ciclo, cv se van cerrando (forma convergente) y abriendo (forma divergente).
El ciclo vibratorio, o la onda, va de abajo hacia arriba.

Análisis acústico:
• modelo lineal (de Fant)
• modelo no lineal: estudia medidas de caos.
ANAGRAF

Estudiante de canto, 22 años, con cierre glótico incompleto (CGI).


Con este estudio o análisis gráfico no se ven alteraciones, quizás un inicio más fuerte (no brusco, ya que
debería estar más marcado y de mayor amplitud el contorno de amplitud), pero sostiene la voz de forma
estable.
Esto sucede mucho cuando colocamos a un paciente al frente del micrófono y le pedimos que diga una /a/
prolongada. La primera de las grabaciones, como el paciente no sabe que hacer, lo va a hacer con más
energía y probablemente el inicio sea con una amplitud mayor que la que debería ser, no es controlada.

Gráfico que va a estar compuesto por 4 ventanas:


1. Empezamos por la de arriba que es el ESPECTRO. Este es de BANDA ANGOSTA. Tiene mayor resolución
frecuencial. Entonces vamos a tener a los armónicos y a la F0, las cuales se generan en las cuerdas
vocales. (Si hubiera sido ESPECTRO de BANDA ANCHA podríamos ver los formantes).
El tracto es un tubo que va desde las cv hasta la boca y la nariz, y va a modificar a la F0 y arm. por el
fenómeno de resonancia, porque los articuladores están en distintas posiciones y van a modificar ese
tracto vocal en longitud, ancho y en sus dimensiones.
Se pueden contar la cantidad de armónicos y decir si está dentro del rango de normalidad.
2. Lo que está en verde en el Anagraf es la FORMA DE ONDA. Si abrimos la forma de onda vamos a
encontrar los ciclos de apertura-cierre de la cv. Mientras más zoom realicemos más ciclos veremos.
A la izquierda de las ventanas están los controles, hay una lupa con un + y con un - y con esos controles
se puede ampliar la forma de onda.
3. En la ventana de abajo vamos a tener en rojo el CONTORNO DE AMPLITUD (o de energía en otros idiomas
lo llaman así). El de azul es el CONTORNO DE FRECUENCIA. Cuando hablamos de amplitud vamos a ver
el comienzo o inicio fonatorio (no hablamos de ataque vocal), el sostén y el final.
4. Abajo están las CUANTIFICACIONES.
A la izquierda va a decir la ENERGÍA total en dB. A la derecha de esto vemos la NOTA. A la derecha de
esto, se encuentran los valores de los FORMANTES (de f1 a f5). Los formantes pueden variar porque no
es lo mismo tener entrenamiento vocal y hacer una /a/ sostenida cubierta que una /a/ sostenida abierta.
Se le tiene que decir al paciente que diga una /a/ como si estuviera hablando y no una más cantada. Por
eso a veces la primera muestra no se toma para hacer el análisis y se descarta.
A la derecha están los ANCHOS DE BANDA, que son los 3 dB que se bajan del pico máximo, y esos anchos
de banda son interesantes para analizar cuando uno hace un trabajo en un conservatorio o escuela de
locución. A la derecha tenemos el INFORME, el valor de la F0 promedio y ciclo a ciclo, son dos formas de
medir lo mismo. Mientras más coincidan estas dos formas, más periódica será la emisión de este
paciente. El promedio es el que vamos a informar. En este ejemplo la estudiante tiene una F0 de 239
Hz. Con el Shimmer pasa lo mismo, hay dos formas. El Jitter es uno solo y el cepstrum también. Aparece
también el índice de armónico/ruido.
En el hospital de clínicas se tomó la decisión de tomar ventanas de análisis no muy grandes, pero hay otros
servicios que toman ventanas de análisis más grandes e incluso emisiones más largas. Se puede tomar la
ventana más a la izq o más a la der. O sacando de lado el inicio fonatorio, o a los 2 segundos que empezó
hasta el 1 seg previo a terminar de fonar. Son decisiones para que todos los estudios sean parejos. Por lo
general, si la emisión es estable se toma la parte media de la emisión. O si no es estable, elegir la más estable.
En todos los casos, se tiene que informar la parte que se seleccionó para la evaluación o análisis.

Hay un inicio más fuerte o desciende la amplitud. No llega a ser brusco.


El contorno de frecuencia tiene cierta inestabilidad, pero como no somos máquinas perfectas, todos
podemos tener esa inestabilidad o una esperada.

ESPECTRO LTAS: se observan armónicos y formantes. Espectro de sección


porque justamente es una sección un promedio, o un instante de la fonación
de la emisión de la /a/, con muy buena resolución.

Primero, segundo y tercer formante tienen picos altos, una muy buena
amplitud. Los armónicos también son muy estables, parejos y se pueden
contar, y tienen buena amplitud, salvo cuando miramos el primero, que no
coincide exactamente el pico del formante con los picos de los armónicos,
pero esto luego de trabajar un poco la voz, comienza a coincidir.

¿Qué dice la bibliografía sobre la aperiodicidad y cómo se manifiesta?


SEÑALES:

Se clasificaron 4 tipos de señal:


-La primera, paciente con voz normal.
-La segunda, puede haber nódulos no siempre.
-La tercera, puede ser un surco vocal, una parálisis (NO SIEMPRE)
-La cuarta, muchísimo ruido.

ÍNDICE DE LYAPUNOV
Es un índice para medir a la gente que tiene parálisis, una disfonía espasmódica, que le sacaron una cv, surco
vocal bilateral con una aspereza terrible.

Varias medidas de caos, modelo no lineal.


Cuantas más claros sean los espacios en blanco de ese retrato, mejor está la voz. A medida que el nivel de
aspereza y soplo aumenta, menos espacios se van a ver.

Realizar el análisis perceptual + acústico lineal + acústico no lineal con los coeficientes de Lyapunov
aplicados a la medición de voces con alta perturbación o caos fonatorio.

Los métodos tradicionales no cuantifican ciertos tipos de alteraciones. El modelo de fuente y filtro basado
en teorías acústicas dinámicas lineales no representa adecuadamente todas las alteraciones del habla.

Parálisis de cv izquierda:
inicio de la terapia vocal: Valores de jitter: 56.10% shimmer:
2.40 LME: -0.36
Todos los índices dan malos.

Control de la terapia:
jitter: 3.2% shimmer: 0.34 % LME: 0.43
No es voz normal pero es una mejoría.
Entonces, el informe con todos los estudios acústicos que realizamos a un paciente es:
Índices de perturbación que indican cuasi periodicidad o aperiodicidad
Índice de Lyapunov: 0.53

Indicadores de riesgo vocal:


Índice de perturbación integrador: 0.75 sin alteración (normal < a 2)
Jitter, Shimmer, armónico/ruido y cepstrum dentro de valores normales.

Aprovechamiento resonancial

19 armónicos hasta los 5100 Hz. No hay aprovechamiento del tracto vocal. Porque está por un lado la emisión
llevada hacia más una /o/ y aparece esa nasalidad.

Precisión vocal total: 79%: descendido (normal > a 90%). Indica nasalidad por la colocación vocal.

Rango vocal
-Emisión de vocales de fr. graves a agudas, en forma deslizada.
-Emisión de frecuencias agudas a graves*.
-Se informa el límite superior en el inferior, en Hz y en notas musicales.

*Muchas veces en pacientes, por ejemplo con una muda vocal incompleta, en chicos de 14/15 años, que
hablan en un falsetto, y no le da el límite inferior, entonces para hacer el rango vocal se pide que se haga de
agudo a grave, para poder bajar lo más posible, algo que no podía hacer sin esta forma deslizada.
La forma de buscar el rango vocal es esta:

FONETOGRAMA
Rango vocal del habla: 8 semitonos: disminuido (normal es 11 semitonos).
Frecuencia más utilizada: 231 Hz. s/p.
Oración fonéticamente balanceada: “digo rápido algunas palabras en español o
castellano, justamente la lengua que se habla en Argentina. Bueno, muchas
gracias”.
Rango vocal con /u/: 194 a 1137 Hz, de Sol2 a Do#5: cercano a 3 octavas de
emisión.
Abarca registros modal y falsete (e incluso una zona más aguda del falsete).

Continuando con rango vocal

Inicio de tratamiento: emisión de /u/ deslizada.


Rango vocal: 134 a 283 hz, interrupción posterior.
En notas musicales: de Do2 a Mi3, mayor a una octava.

Hay una interrupción en esta emisión.

Evolución de tto: emisión de /u/ deslizada


Rango vocal: 127 a 664 Hz.
Notas musicales: de Si1 a Mi4, mayor a dos octavas de emisión.
Emisión bastante estable.

Otros estudios que se pueden realizar:


Electroglotografías

Mide cociente de apertura y cierre de las cv. No se hace en el hospital por falta de equipo.

Tipos de onda EGG

1. onda normal
2. falla de cierre glótico (prolongación, fase abierta)
3. onda irregular, se presenta tanto en alteraciones orgánicas como funcionales.
4. Fonación en bandas: se ve doble pico, el mayor corresponde a la vibración de los pliegues verdaderos
y el menor a los falsos.
10 CHARLA CON JORGE GURLEKIAN
Ingeniero e investigador del conicet y creador del programa ANAGRAF.

Herramientas fonoaudiológicas para el análisis objetivo y subjetivo de la voz


• ANAGRAF: Sistema de análisis y graficación. Incluye el módulo de evaluación del Riesgo Vocal
(probabilidad que tiene un paciente de tener una disfonía) y un Curso personalizado de 12 hs.
Consultas: anagraf99@hotmail.com.
En este podemos encontrar el Cepstrum, que justamente sirve para calcular ese nivel de Riesgo.
Referencias: índices de perturbación, de precisión vocal y de aprovechamiento de energía para la
evaluación del riesgo vocal. Revista de logopedia, foniatría y audiología. Elsevier. 2012.

• ATR: Histograma de F0 (para saber la F0 que más utiliza el paciente dentro de los F0 por ejemplo en voz
hablada) y Fonetograma de la voz hablada y cantada. Antes se hacía de una manera más artesanal con
el teclado y el decibelímetro, pero ahora se puede hacer de manera digital.
También en este programa se calcula el cepstrum, pero es el cepstrum suavizado, que permite calcular
aspectos de cualidad de voz.
Referencias: fonetograma de la voz hablada: valores de referencia normal para hablantes masculinos y
femeninos. UBA. Facultad de Medicina. 2002.

• EVAPER: Sistema de evaluación perceptual de disfonías y entrenamiento. Permite entrenar a un alumno


de fonoaudiología para la evaluación de los atributos perceptuales, la aspereza, el soplo, la astenia, la
tensión y el temblor y quiebres en la voz, además del F0 y la intensidad.
Hay una autoevaluación, para evaluar el desempeño del alumno que se ha entrenado, y en dos semanas
se logran resultados que habitualmente lleva años.
También evalúa cepstrum.
Referencias: A Perceptual Method to Rate Dysphonic Voices. Journal of Voice. 2019.

• LIS: Prueba de inteligibilidad del habla en ruido para niños y adultos.


Referencias: desarrollo de una prueba de inteligibilidad de habla en ambientes ruidosos para niños en
edad escolar. Revista de logopedia, foniatría y audiología. Elsevier. 2008.

• FORENSIA: Sistema automático de identificación para pericias forenses de voz. www.blackvox.com.ar


Referencias: un sistema automático de identificación forense por voz. Researchgate. 2020.

Revistas científicas para leer:


• Journal of voice.
• Revistas de logopedias (para investigar sobre anagraf y otros programas de evaluación de voz).

CEPSTRUM
Dentro de las medidas objetivas se encuentra el cepstrum.

Es una medida de la armonicidad que tiene una emisión de habla. En una voz donde predomina el ruido, no
hay armonicidad, entonces el cepstrum ahí dará un valor muy bajo. Si hay una voz con poco ruido y muy
armoniosa, el cepstrum dará valores más altos. Entonces mide la calidad de la voz, sobre todo teniendo en
cuenta la presencia del ruido. Sin embargo, además del ruido, hay otros componentes que tienen que ver
con los armónicos, y si estos no están variando suavemente, el cepstrum también lo mide.

Se usa particularmente cuando hay alteraciones severas de la voz. No solo se usa para voces normales y poco
disfónicas. Habitualmente los métodos calculan la F0 a través de métodos frecuenciales o temporales, pero
como la F0 está muy deteriorada y destruida, estos métodos fallan o no pueden utilizarse directamente.
Pero el cepstrum se puede aplicar porque hasta puede evaluar ruido.
Lo mismo sucede con el Retrato de Fase - Lyapunov, o el LTAS (espectro promedio de largo plazo).
Entonces el cepstrum se encuentra dentro de esta trilogía de mediciones vinculadas con alteraciones
severas, pero también se puede usar en voces normales y poco deterioradas.

CEPSTRUM → SPECTRUM. Son palabras muy similares, justamente el spec es la inversa de ceps. O sea, el
espectro logarítmico deriva a cepstrum. CEPSTRUM es la inversa del espectro logarítmico de la señal. Pero
es simplemente una regla mnemotécnica.

En Praat se utiliza otro algoritmo, que calcula el cepstrum suavizado. Hay que saber los valores de normalidad
para un programa y para otro. Son lo mismo pero no miden de la misma manera.
En el Anagraf: abajo de todo hay unos botones amarillos que uno de ellos es el botón del cepstrum, que dice
aplitud del cepstrum. También hay otro botón en el panel de la izquierda que dice CP que calcula el contorno
de F0, cuando este está continuo aparece como una línea continua.

Cuando hay ruido, esta es una emisión con ataque vocal


soplado. Los métodos tradicionales están indicados con la
línea azul gruesa. Y el cepstrum está indicado con una línea
finita, y cuando hay F0 las dos líneas coinciden, pero cuando
no hay F0, el cepstrum también hace un cálculo cortado, que
están evaluando el escape de aire.

PROCESAMIENTO HOMOMÓRFICO

Tenemos una señal, y le calculamos el espectro. Aplicamos la transformación de cepstrum, que consiste en
hacer la inversa del espectro, entonces hacer la inversa me lleva a tener la onda de nuevo, pero en vez de
representarla como la señal y en función del tiempo como todas las frecuencias, esta inversa hace una
representación tal que se pone en escala logarítmica en función del tiempo. (Recordar que la frecuencia es
inversa del tiempo), entonces el tiempo que hay en la amplitud del pico de cepstrum, que sería el tiempo
mayor o de mayor duración, va a tener la frecuencia más baja, y la fr. más baja en una señal de habla es la
fundamental. Entonces ese máximo, en el eje del tiempo, corresponde al periodo fundamental. Si uno hace
la inversa del periodo fundamental, obtiene la F0. Y todas las otras frecuencias se amontonan al inicio de la
escala de tiempo.

Así que lo que hizo el CEPSTRUM es evidenciar si había una F0, y este máximo de este pico va a ser más alto
cuando más armónica sea la señal.
Se mide la altura de ese pico, desde el máximo hasta su base, y esa es la amplitud.
• Cuando la señal es totalmente periódica y no hay ruido, el máximo de ese pico va a ser 1.
• Cuando no hay F0 va a ser 0 o hasta negativo, porque el ruido puede ser mayor que ese máximo.

MODELO ACÚSTICO DEL HABLA


Considera tres componentes:

1. La fuente de Excitación (E) debida a un tren cuasi periódico de pulsos generado por la vibración glótica
de -12 dB/octava de caída en los armónicos, o debida a un ruido generado en cualquier punto del tracto
vocal. Para generar habla tenemos la fuente de excitación antes que nada. Pueden ser la F0 y sus
armónicos o puede ser ruido.

2. Un sistema lineal cuyos parámetros varían lentamente en el tiempo: el tracto


vocal (TV) con sus cavidades resonantes móviles. Favorece a algunas frecuencias y a
otras las atenúa.

3. Un componente de radiación desde los labios hasta el oído del receptor. Que
explica el realce de altas frecuencias +6 dB/octava al propagarse el sonido por el aire.
La contribución del tercer componente suele integrarse al primero.

TONO GLOTAL (lo primero), FORMA DE LA /a/, REALCE DE LAS ALTAS FRECUENCIAS.
CEPSTRUM
• Como la señal de habla es una combinación o convolución de los dos primeros componentes, una técnica
para estimar los parámetros del habla es separar o deconvolver la señal, teniendo en cuenta que las
características espectrales de los dos componentes son bien diferentes.
Es decir, el habla es una combinación de la excitación debida a la vibración de los pliegues vocales o
debido al ruido, y donde esa energía resuena, que es el tracto vocal. Entonces son dos componentes
espectrales muy diferentes, y a esa combinación se la denomina convolución (término matemático).
• El proceso de convolución implica transformar el producto de dos señales en su suma. Como esta suma
implica a dos señales con espectros diferentes, entonces las podemos separar mediante un filtrado lineal.
La transformación deseada es logarítmica.
• Esto se logra al obtener el espectro de Fourier de la señal combinada

E es el espectro de la excitación y Tv es la salida del tracto vocal, luego se realiza el filtrado mediante
la transformada inversa de Fourier.
• En síntesis, el Cepstrum de una señal es el resultado de calcular la transformada inversa de fourier
del espectro de fourier de la señal en escala logarítmica (dB).

AMPLITUD DEL PICO DE CEPSTRUM

1a. Gráfico de Cepstrum de una señal aperiódica. Valor de cepstrum muy bajo.
1b. Gráfico de una señal periódica sin ruido. Más cerca de 1 el cepstrum.
1c. Periódica con ruido. (Lo rojo sería el ruido).
1d. Periódica con mucho ruido. Da negativo, predomina el ruido.
La amplitud del pico de cepstrum se indica con la doble flecha.

Si fuera una señal perfecta, la señal sería 1.


• Si dos ciclos son idénticos la amplitud del pico es igual a 1.
• Si dos semejantes el valor del pico estará entre 0.8 y 0.3.
• Si la señal es ruidosa y/o los armónicos difieren entre ciclos consecutivos el valor estará entre 0.3 y
0.01.

Se compara el cepstrum con otros valores:


CONCEPTO DE RIESGO VOCAL
El jitter tiene el valor umbral del 1%. Entonces se toman voces normales y se le calcula el Jitter, y todos los
valores dan menos de 1. Pero algunas de esas voces tienen valores mayores a 1, entonces hay alguna parte
de la población que no va a cumplir con ese límite. Lo mismo con las voces con alteraciones, son pacientes
con jitter mayor a 1, pero algunos de ellos tienen valores menores de 1.
Entonces donde se cruzan las dos curvas, hay un rango de cierta indefinición, de duda. Y ese rango es el que
se denomina RIESGO VOCAL.

Entonces el cepstrum se utiliza en un esquema junto con el jitter, shimmer y armónico ruido, para definir lo
que es el riesgo vocal.

IPI → índice de perturbación integrado


Agrupa cuatro parámetros clásicos, dos fonatorios: jitter, shimmer, y dos fonatorios-articulatorios: relación
armónico ruido y la amplitud del cepstrum.
Las mediciones de perturbación vocal permiten clasificar a los hablantes en los grupos normal, de riesgo y
con alteración.

Acá encontramos los 4 parámetros en este gráfico, el cuadrado amarillo rodeado del circulo verde es el del
parámetro de normalidad, y sobre la diagonal, hay distintos parámetros en distinta zona, representados por
los círculos de colores.
El cuadrado verde significa super normal, y la parte amarilla ya implica una zona de riesgo.
El cuadrado rosa es de alta alteración, y la zona amarilla es de riesgo vocal.
Entonces lo que permite este esquema, es que cuando miramos los parámetros y alguno contradiga a otro,
cada uno va a ser evaluado dependiendo de a dónde caiga en este esquema. Cuál va a ser la contribución al
índice de perturbación. Si cae en la zona verde, la contribución va a ser 0. Si cae en la zona rosa, la
contribución va a ser 5.
Si cae en otro lado, irá aumentando mientras más cerca al cuadrado rosa esté.

Entonces, de acuerdo al valor del Shimmer, jitter, amplitud del cepstrum y armónico-ruido, va a haber
distinta contribución, y lo que se hace es promediar la contribución de estos parámetros, y eso nos da un
valor promedio.
Si la contribución es menor a 2, es una voz normal. Si es mayor a 3 hay alteración. Y si cae entre 2 y 3, está
en riesgo.

EJEMPLOS:

Índice de perturbación:
El 1° ejemplo: 0.25, por ende es normal.
El 2° ejemplo: 2.25 ya está en zona de riesgo.
El 3° ejemplo: 3.50 ya hay alteración.

Se promedian los valores porque hay algunos que pueden dar normal y
otros que no, y no se puede tomar objetivamente si está o no en riesgo,
por esa razón se promedian y de acuerdo al valor nos indicará cómo se
encuentra el paciente.

Otro aspecto interesante es el de la precisión articulatoria, que tiene


que ver con la posición de los formantes. Si se le pide al paciente sin
alteración que emita una vocal sostenida, se espera que los formantes
estén parejos.
En el gráfico se está graficando el formante f1 y f2 y están todos
concentrados los puntos rojos bordeados de negro. Entonces puedo
medir el grado de precisión articulatoria que a veces se deja de lado.
El valor normal es >90% (mayor a 90) y acá da 98%.
CEPSTRUM SUAVIZADO CPPs
• Algoritmo de Hillenbrand.
• Se utiliza en habla continua para evaluar la calidad de la voz.
• Valores de normalidad: mayor a 4. A diferencia del otro algoritmo.

¡RECORDAR!
La amplitud va a depender tanto de lo inarmónico de los armónicos, como de la presencia de ruido. El
cepstrum mide ambas cosas porque se mide la amplitud respecto a la envolvente que está dada por la
energía de la vocal y del ruido.

En cuanto al cepstrum en voz cantada:


En una voz entrenada seguro se van a obtener valores más alto del cepstrum, porque en una voz entrenada
hay menos escape de aire, hay mayor armonicidad y los valores darán más alto.
Hay que tener en cuenta que el cepstrum mide de un ciclo a otro, entonces si uno tiene un glissando, no se
va a tener un análisis de baja frecuencia respecto al de altas, o viceversa, sino la variación de un ciclo a otro,
y en esta variación si hay poco ruido, el cepstrum va a dar alto, y si los armónicos guardan su relación, más
allá que vayan cambiando su valor, van a dar un cepstrum más alto.

Jitter y Cepstrum
Cuando la frecuencia fundamental está cortada o interrumpida, el Jitter va a dar cada vez más alto, mucho
mayor a 1. Entonces se empezó a ver que el uso del jitter en voces altamente disfónicas, en realidad no
estaba dando ninguna información interesante, era de suponer que iba a dar más alto el jitter, con el propio
oído te das cuenta, y que de 2, 3, 5, es lo mismo, ya que no está midiendo correctamente. El jitter necesita
el F0.
Entonces, el jitter se usa para voces normales o levemente disfónicas. No para voces con alta alteración y
donde el F0 no está. Y revisando en los algoritmos, se dieron cuenta que había que usar el cepstrum (en
ingeniería se usa este concepto, no es una medida nueva, sino que viene a salvar los errores que se cometían
con el jitter).

Por otro lado se utiliza el jitter solo donde se cree que es confiable, y se pinta la onda en cierto segmento. A
Gurlekian esto no le pareció correcto, porque se da un valor a solo un segmento y no a toda la onda, sin que
uno sepa cuál era ese segmento. Entonces de ahí surgió la idea de comparar el cálculo de F0 por dos métodos
(el método temporal y un método espectral) y si son iguales o dentro de una cercanía quiere decir que era
confiable.

Pero se dieron cuenta que con el cepstrum se supera este problema, o por lo menos daba una información
que se sumaba a la del jitter. El cepstrum tolera que no haya F0.
7 CLASIFICACIÓN DE LA SEÑAL

National Center for Voice And Speech (1995), Clasificó los tipos de señales. Esta clasificación tiene que ver
con el ruido en esa voz.
Señal 1: Señal cuasi periódica que no presenta alteraciones cualitativas en el segmento analizado, si existen
modulaciones o subarmónicos su energía tiene magnitud inferior a la energía de la frecuencia fundamental.
Son voces normales o levemente alteradas. índices de perturbación confiables. (Puedo confiar en ese valor
numérico ya que la frecuencia fundamental se distingue claramente y eso hace que el sistema lo pueda
calcular sin ningún problema).
Señal 2: Señal acústica con alteraciones cualitativas, subarmónicos, intermitencias, diplofonía y
modulaciones. La amplitud de los subarmónicos es tan alta que no existe f0 única en la mayor parte del
segmento. Esta señal permite visualizar el trazado con dificultad y no permite realizar mediciones confiables,
salvo en algún pequeño segmento estable. El análisis visual de trazado es descriptivo y depende de la
experiencia del evaluador. La mayor parte de las voces patológicas producen esta señal sonora.
*Son las señales que mayormente tenemos en la clínica.
*Si pude tomar un segmento estable de por ejemplo 1 segundo de emisión los valores, en ese segmento los
puedo considerar confiables. Siempre cuanto más tiempo de análisis tengo para los valores de perturbación,
mejor.
Señal 3: Señal sin estructura periódica aparente. Es aperiódica o casi caótica que no permite realizar
mediciones confiables y el análisis visual es acotado. Es en pacientes con disfonías espasmódicas, disfonías
por CA.
*No podemos realizar mediciones confiables. únicamente vamos a poder hacer un análisis visual del
espectrograma y los diferentes tipos de gráficos que nos otorgan los sistemas como para hacer un informe.
*Tienen que ver con disfonías moderadas a severas, disfonías espasmódicas, disfonías por cáncer,
cordectomías, etc. Son voces que no se pueden analizar desde lo numérico.

Hay que tener en cuenta el tipo de señal que estamos analizando para saber si los parámetros que estoy
analizando, son confiables o no.
Ej. En una voz muy ruidosa donde la frecuencia fundamental el sistema no la puede extraer claramente
porque hay mucho ruido. ¿Cómo sé si ese valor que me tira el Jitter y Shimmer son confiables? Teniendo en
cuenta el tipo de señal, yo voy a poder saber si puedo considerar confiable o no ese valor.

ÍNDICES DE PERTURBACIÓN:
• Son medidas de variabilidad de la señal ciclo a ciclo. A corto plazo. (Las variaciones ciclo a ciclo no se
perciben como variación de tono o la intensidad sino que se perciben como ruido).
• No son percibidas por el oído como variación, sino como ruido
• No es posible corregirlas voluntariamente.
• Se miden por lo general en la vocal sostenida /a/, sin variación de tono o intensidad
• Se toma para su medición el segmento más estable, evitando inicio y final
• JITTER: (Local, local absoluto, rap, ppq5, ddp)
• SHIMMER: (Local, local-Db, apq3, apq5, apqll, dda)
• HNR-NHR

JITTER:
• Evalúa la perturbación del periodo ciclo a ciclo (frecuencia)
• Es un índice de estabilidad del sistema fonatorio, evalúa la cantidad vibratoria de los pliegues vocales
(cuan periódica es la vibración de esos pliegues vocales)
• Tiene relación inversa con la F0 y la amplitud (Al subir la F0, baja el Jitter; Cuando sube la amplitud,
disminuye el Jitter). *Es importante tenerlo en cuenta cuando hacemos reevaluaciones.
• Sensible a las alteraciones aerodinámicas, de tejidos o control neuromuscular
• Se expresa con un porcentaje (en el PRAAT) *Por lo general en pacientes donde haya lesiones fono
traumáticas o lesiones de masa en las cuerdas vocales o alteraciones neurológicas, por lo general el Jitter
va a dar alterado.

SHIMMER:
• Evalúa la perturbación de la amplitud ciclo a ciclo. No se percibe como variación
• Tiene relación inversa con la F0 y la amplitud
• Casi siempre cuando aumenta el jitter también aumenta el Shimmer
• Cuando hay ruido en la voz se aumenta, relación con la resistencia glótica (ruido de soplo).
• Se expresa en porcentaje o dB (dependiendo cual sea el tipo de Shimmer que se va a utilizar).

HNR: Relación armónicos ruido.


• Según Yumoto en todas las voces hay ondas periódicas y aperiódicas (que generan ruido). *Por eso
hablamos de voces cuasi periódicas. En voces normales el ruido es de baja amplitud.
• Mide la amplitud de los armónicos en relación a la amplitud del ruido.
• En voces sanas es alto y bajo en voces disfónicas.
• Es mayor en varones que en mujeres (En el caso de los varones tienden a hablar más intensamente con
una frecuencia fundamental más baja y con mayor contacto a nivel de los pliegues vocales.
• Es mayor en el registro modal que en falsete. (En el caso del registro modal también hay mayor contacto
a nivel de los pliegues vocales que en el falsete. Por eso es más alta la relación armónico ruido en ese
registro).
• Se expresa en dB.

CEPSTRUM:
• Es una medida espectral que mide la estabilidad del periodo, pero a partir del espectrograma (F0). Es
más confiable en voces ruidosas que el Jitter, por eso a nivel mundial se está utilizando más el
CEPSTRUM que los índices de perturbación. *Lo que hace es medir la energía del primer armónico.
• Se logra por medio de una doble transformada de Fourier
• Cuanto más periódica es la voz, mayor será la amplitud del pico cepstral y más agudo en su ángulo.
• El cepstrograma es un gráfico de amplitud por tiempo (quefrency = periodo) para calcular la
frecuencia (Calculo de la F0: 1/Periodo) 1/0.004204 = 237.8686

*El CEPSTRUM hoy por hoy es la medida por excelencia para medir estabilidad en la voz en la frecuencia
fundamental sobre todo.
17 INVESTIGACIÓN DE LA FONOAUDIÓLOGA
Relación entre el diagnóstico morfo-funcional de la laringe y los parámetros acústicos de la voz en un
grupo de pacientes que asisten al servicio de estroboscopia de una clínica de la ciudad de Cali.

Contenido de la investigación:
1. Introducción
La voz en el proceso comunicativo involucra muchos elementos, no solo en el componente anatomo-
fisiológico. También tenemos que tener en cuenta el componente lingüístico, físico-acústico y social-
comunicativo.
Es importante entender la anatomía y la fisiología de la voz para poder entender porque se aplica una técnica
u otra al trabajar con pacientes. Es vital conocer este componente, pero este no se desliga del componente
lingüístico, donde se debe tener una competencia para poder hacer determinados sonidos como lo exige la
lengua, en este caso el español, y tener una competencia con relación al contenido del lenguaje que se está
manejando, a la argumentación del lenguaje, etc. que son componentes que se pueden evaluar. Otro
componente es el físico-acústico, teniendo en cuenta que la voz es el punto del cambio de energía
aerodinámica que ocurre en todo el sistema respiratorio, y luego de pasar por las cv se convierte en energía
acústica, la cual se puede medir, evaluar, cuantificar, describir cualitativamente. Todo esto es importante,
pero no hay que dejar de lado el componente social-comunicativo, que es de vital importancia ya que no es
lo mismo trabajar una voz de un cantante, profesor, locutor, que una persona que se dedica a ser vendedor
ambulante, donde tienen la misma importancia pero el componente social y las competencias que necesitan
para desarrollarse en cada espacio son variadas.
Entonces en ese sentido, cuando evaluamos a pacientes hay que tener en cuenta todos estos componentes
y elementos, para poder adaptar la terapia a las necesidades de cada persona.

Prevalencia de los problemas de la voz


Farias dice que la prevalencia de estos problemas va a depender de la forma en como los identifiquemos.
Con la Fibroscopía solo se identifican el 2% de los problemas de voz. Y con la evaluación perceptual se
identifican el 90%.

Evaluación Clínica de la voz


LARINGO ESTROBOSCOPIA ANÁLISIS ACÚSTICO DE LA VOZ

Valoración morfo-funcional de la laringe. Valoración funcional de la laringe.

Estudio dinámico por imágenes. Datos numéricos. Datos gráficos.

Método invasivo. Método no invasivo.

Diagnóstico etiológico. Diagnóstico funcional y predictivo.

Permite la valoración de la vibración y el estado del borde Permite el análisis de los parámetros
libre de los pliegues vocales. acústicos que componen la voz.
*Hay que pensar en dos dx:
• dx del otorrino: dx médico de estructura y función.
• dx de fono: dx de la voz y como afecta en la comunicación.

*El análisis acústico no vino para reemplazar el análisis perceptual. Sigue siendo de vital importancia el oído
para dar un dx.
Entonces, también tenemos que tener en cuenta en la evaluación clínica de la voz:
• Evaluación perceptual, aerodinámica y acústica.
• Métodos técnicos y tecnológicos con mejores grados de confiabilidad.
• Alto grado de variabilidad intra e inter observador.
2. Planteamiento del problema y justificación.
• El análisis acústico de voz es reconocido como una prueba diagnóstica complementaria y poco relevante
por la comunidad médica en la detección de alteraciones de la voz.
• No se ha establecido la relación entre los datos obtenidos por laringoestroboscopia y el análisis de voz.
• Escasos elementos de análisis para establecer una relación entre los hallazgos estroboscópicos de la
valoración morfo-funcional de la laringe y los parámetros acústicos de la voz.
• Es importante formar a los otorrinos para que pidan estos exámenes acústicos porque son muy
importantes y no suelen pedirlos, o lo hacen recién después de pasar por muchos otros estudios.
• Promoción de la salud vocal y la detección temprana de alteraciones de la voz, donde se ampliaría esto
a partir de usar el análisis acústico.
• Uso y aplicación de análisis acústico de voz como ayuda diagnóstica.
• Interdisciplinariedad en el abordaje de la voz.

Diagnóstico morfo-funcional a través de estroboscopia laríngea

Es importante saber la anatomía de las cuerdas y la teoría cuerpo-cubierta, donde está conformado por el
epitelio, por la capa superficial, intermedia y profunda de la lámina propia. De estas 3 la capa superficial y el
epitelio forman la cubierta, y el cuerpo se forma a partir de la capa intermedia, profunda, por el ligamento
vocal y el músculo vocal. En la estroboscopia se puede observar cómo se mueve el músculo, pero también
se ve vibrar esa cubierta o mucosa.

Por otro lado, algo muy importante a tener en cuenta es cómo se lleva a cabo el ciclo glótico: este siempre
va a depender de la presión subglótica, los pliegues vocales siempre van a fonar de abajo hacia arriba, de
adelante hacia atrás.

A su vez, para el dx se requiere


tener en cuenta la amplitud de la
onda y la onda mucosa.
La A se mide para cada uno de
los lados de las cv y se puede
decir en el plano horizontal que
tanto vibra la mucosa desde el
borde libre hacia el lateral.
También se evalúa si esa onda
mucosa logra mantenerse en
ambos pliegues vocales desde
hacia adelante hasta hacia atrás. La mucosa en el estroboscopio se ve muy brillosa por la luz estrober que se
utiliza.
Entonces tener en cuenta todas estas variables:
• Amplitud: normal, disminuida, interrumpida (cuando hay una lesión o hemorragia sobre la onda
mucosa, sobre la cubierta).
• Oclusión glótica: completa o incompleta.
• Onda mucosa: normal, aumentada, disminuida, interrumpida (va de la mano con la amplitud).
• Periodicidad: periódica o aperiódica (si se ve o no que va vibrando de la misma manera).
• Simetría: simétrica o asimétrica.
• Frecuencia fundamental. No es una variable que demuestren características significativas o distintas
en una u otra alteración o lesión. Sólo se pudo realizar un rango.

1. Conclusiones y recomendaciones
Conclusiones
• La estroboscopia laríngea permitió detectar asimetrías vibratorias, alteraciones estructurales,
diferencias en la oclusión glótica y otras condiciones que son poco visibles con otros métodos de
valores clínica usados para establecer el diagnóstico morfo-funcional.
• Los parámetros acústicos de Shimmer, relación armónico/ruido y amplitud del pico de Cepstrum,
mostraron consistencia en las mediciones clásicas de perturbación utilizadas para discriminar grupos
con distintos grados de alteración vocal.
• El índice de perturbación vocal integrado facilitó la clasificación en voces normales, en riesgo y voces
alteradas en la población evaluada. Este índice puede facilitar la detección temprana de riesgo vocal
y ser útil en la toma de decisiones clínicas reduciendo los costos para el control y el seguimiento del
tratamiento de las alteraciones de la voz.
• Los parámetros acústicos y el índice de perturbación vocal integrado presentaron una relación
estadística significativa con las alteraciones detectadas a través de la estroboscopia, específicamente
con las variables de amplitud de la vibración, el cierre glótico, periodicidad y asimetría en la vibración.
• El estudio permitió establecer la relación entre el dx morfo-funcional de la laringe y los parámetros
acústicos de la voz.

Recomendaciones
• Es pertinente proyectar la aplicación del análisis acústico en las pruebas diagnósticas en los casos de
disfonía, en la detección temprana de las alteraciones de la voz y en los programas de prevención.
• Implementar este estudio como modelo para futuras investigaciones con poblaciones específicas
como en casos con disfonía asociada a laringitis crónica.
• El estudio de las voces con un índice de perturbación vocal integrado mayor a 3, se debe
complementar con la valoración perceptual y el análisis espectrográfico.
• Fortalecer la participación del fonoaudiólogo durante la prueba de estroboscopia laríngea.
• Fortalecer la investigación interdisciplinar.
19 ELECTROGLOTOGRAFÍA
La voz es un fenómeno complejo que tiene muchas aristas para poder estudiarla.
La voz es un proceso biomecánico que tiene que ver con un proceso de
transducción que comienza con un fenómeno aerodinámico para convertirlo
en un estímulo sonoro que luego a través de varias modificaciones va a dar
lugar a nuestra voz.
Tiene que ver con una mecánica bioespecífica de base que cumple su rol
gracias a la acción de los pliegues vocales.
Estos pliegues vocales además se accionan gracias a esta energía
aerodinámica (presión subglótica de aire) que las pone en movimiento y
genera diferentes tipos de patrones en relación a este fenómeno.

Cuando hablamos de evaluación vocal, J. Stemple habla de ciertos pasos a seguir respecto a la evaluación
del paciente.
Comenzando siempre por el examen médico otorrinolaringológico para el diagnóstico y visualización
laríngea.
A partir de ahí, el fonoaudiólogo comienza con una entrevista inicial, una evaluación perceptual y por último
una evaluación instrumental.
Dentro de esta evaluación instrumental contamos actualmente con muchas herramientas.
Los avances tecnológicos durante las últimas décadas nos permitieron contar con muchas opciones de
evaluación instrumental.

Nos vamos a centrar en la evaluación objetiva de la voz. Dentro de esta evaluación objetiva de la voz, en el
análisis instrumental podemos incluir tres tipos de pruebas que son:
1. Mediciones aerodinámicas
2. Mediciones acústicas
3. Mediciones electroglotográficas

En la evaluación fonoaudiológica se implementaron en los últimos 60 años nuevos recursos para lograr hacer
más objetiva información que antes solo se analizaba desde lo perceptual en el análisis clínico de la voz.
Esta evaluación objetiva viene a traer aportes a la clínica pero no reemplaza a la evaluación perceptual sino
que es un complemento de todas las demás herramientas.

EVALUACIÓN INSTRUMENTAL OBJETIVA DE LA VOZ


• análisis acústico
• medición aerodinámica
• Electroglotografía
Estas pruebas se aplican para complementar la información sobre la calidad vocal del paciente en el caso
del diagnóstico de patologías vocales. Es útil para visualizar el trabajo y evaluación en voces y su registro.
Proporciona una retroalimentación visual.

Dentro de la evaluación morfo-funcional de la laringe, tenemos métodos de visualización indirecta. Dentro


de este grupo se encuentra un gran grupo de pruebas que son las glotografías.

ESTAS GLOTOGRAFÍAS PUEDEN SER DE DIFERENTES TIPOS:


• Electroglotografía (EGG)
• Fotoglotografía (FGG)
• Glotografía mediante ecografía
• Glotografía inversa

Las que realizamos como fonoaudiólogos son las electroglotografías y vienen a complementar lo que es la
información del análisis acústico.

ELECTROGLOTOGRAFÍA
Es un método no invasivo para conocer el
patrón vibratorio de los pliegues vocales.
Es una técnica complementaria al análisis
acústico y a las medidas aerodinámicas pero
que se basa específicamente en la descripción
del patrón de vibración de los pliegues vocales.

Cuando hablamos del patrón vibratorio de los pliegues vocales tenemos que tener en cuenta que lo que
hace al funcionamiento laríngeo podríamos considerar distintos tipos de funcionamiento por registros.
Estos registros determinan diferentes modos, no solo patrón vibratorio de pliegues vocales sino también
diferentes tipos de acomodaciones del tracto vocal.

La electroglotografía no es una técnica nueva. En 1957 Fabre describe por primera vez este procedimiento
utilizando la aplicación de un método basado en el fenómeno de impedancia aplicado al examen de la
función laríngea, específicamente del movimiento de los tejidos relacionados a los pliegues vocales.

La electroglotografía es un procedimiento que por ser objetivo durante los últimos años ha sido utilizando
en muchos reportes en la evidencia científica. Actualmente contamos con reportes tanto de investigación
como para la clínica. Se utiliza tanto para voces normales como para voces patológicas.

Según Rothenbertg (1988) el termino electroglotografía (EGG) “es aceptado como el nombre genérico para
designar a un dispositivo mediante el cual se puede visualizar los movimientos de los pliegues vocales
mediante una corriente eléctrica muy pequeña que pasa por el cuello a nivel del cartílago tiroideo en la
laringe, usando dos o más electrodos de superficie en el cuello
que van puestos de a pares”

La EGG es un método objetivo y de alto impacto en la descripción


de las características del ciclo glotal.

Se ha considerado a esta prueba de muy alto impacto para la


descripción de las características del ciclo vocal.

Capta los movimientos propios del tejido.


Basándonos en los ciclos glotales podríamos considerar las modificaciones de presiones (Teoría
aerodinámica - efecto Bernoulli).
La presión subglótica genera el fenómeno de la resistencia glótica que hace que los pliegues vocales aducen
a la línea media. Cuando lo hacen, se genera un fenómeno nuevo de resistencia glótica el cual comienza a
ser vencido por la presión subglótica que cada vez es mayor y al vencer esta resistencia se va a ir
disminuyendo la resistencia y al disminuir se
produce el tercer parámetro aerodinámico que es el flujo transglótico por el cual el aire es expulsado a través
de los pulsos glóticos por los pliegues vocales generando de esta manera, estos diferentes momentos en los
ciclos glotales.

Estos ciclos glotales los conocemos como:


1. Fase de apertura
2. Fase de cierre

A través de la electroglotografía los


podemos subdividir y obtener 4 grandes
momentos.

CICLO GLOTAL
En la fase abierta tenemos:
• En apertura
• Abierta
• En cierre

En la fase cerrada tenemos:


• Cerrada

Este ciclo glotal se va a ir repitiendo a lo largo del tiempo y el dispositivo va a permitir es sacar valores
estadísticos en relación a estos ciclos glóticos.

UTILIDADES DE LA EGG
La electroglotografía es capaz de indicar: por un lado sobre el momento donde la glotis se cierra y cuándo
se abre en cada ciclo glotal y además, la forma o patrón que utiliza para su realización.

Muchos autores han descripto el uso de la electroglotografía. Autores como Baken 1992, Titze 1990, Le
Huche & Allali 1994 detallaron que:
• Es una evaluación de tipo OBJETIVA y permite de forma no invasiva obtener información sumamente
relevante sobre los patrones de contacto a nivel glótico.
• Es una señal esencialmente libre de influencia supraglótica y puede ser de enorme valor para
conocer patrones diferenciados en relación a la fuente-filtro en la producción vocal. *La
electroglotografía nos aporta información referente a la fuente.
• Su forma de onda permite además obtener de forma sencilla la frecuencia fundamental de la voz.
• Permite indagar aspectos relacionados a la función de los pliegues vocales que no se pueden obtener
a través del análisis acústico como el cociente de contacto. (Gran importancia)

La gran diferencia entre el análisis acústico y la electroglotografía es que el análisis acústico nos va a dar
información sobre no solo lo que tiene que ver con la fuente sino también con el filtro. En cambio la
electroglotografía se va a basar en información sobre la fuente.
Diversos autores se han referido a la EGG y su utilidad dentro de la evaluación y la terapéutica de la voz
normal y la patológica.
Su uso ha sido reconocido para el seguimiento de deficiencias vocales de tipo funcional y orgánico a partir
de intervenciones quirúrgicas y/o terapéuticas. (Zagólski & Carlson, 2002)
También se ha reportado evidencia de la EGG en la clínica vocal utilizando la retroalimentación de los sujetos
para la optimización fonatoria, tanto en voces patológicas como en voces normales con la utilización de
diferentes registros e inclusive en voz cantada.
Se ha reportado a la EGG con el uso suplementario de un transductor de presión intranasal colocado debajo
del velo del paladar brindando información adicional sobre aspectos medibles en deglución.

Este estudio tiene limitaciones:


• El lugar de los electrodos sobre las alas tiroideas, la distancia y el ángulo son cruciales para la
obtención de una onda electroglótica valida. La señal electroglotográfica puede alterarse
simplemente por movimientos de cabeza o ascensos de la laringe durante la deglución.
• No se puede obtener señal electroglotográfica en cuellos de personas con abundante tejido graso
subcutáneo ya que ello reduce la conductividad de la energía eléctrica que se precisa para la EGG
• Las laringes de dimensiones anatómicas muy reducidas podrían ser causa de una insuficiente
amplitud de la onda electroglotográfica.

GENERALIDADES SOBRE EL FUNCIONAMIENTO


Para realizar la electroglotografía se colocan electrodos a nivel del cartílago tiroideo, pasando
entre ellos una pequeña corriente eléctrica. Esos electrodos generan un flujo eléctrico que se
describe a través de la Ley de Ohm (habla de los elementos de impedancia)

Cuando existe aumento de la impedancia eléctrica los pliegues vocales se encuentran en fase
abierta disminuyendo la conductancia y cuando estos se aproximan durante la fase de cierre
disminuye la impedancia eléctrica (la energía se transmite de un electrodo a otro) y aumenta la conductancia
entre los mismos.

*Esta impedancia que vamos a generar en los tejidos se va a modificar cuando los pliegues vocales se
aproximan o se separan. Vamos a tener un fenómeno que se llama conductancia que se va a producir de
manera directa cuando los pliegues vocales están juntos.
La energía eléctrica va a pasar de un lado hacia el otro cuando estos pliegues vocales estén juntos y cuando
los pliegues vocales se vayan separando esta conductancia va disminuyendo y vuelve a aumentar cuando los
pliegues vocales vuelven a unirse.
Esto es lo que sucede a través del paso de los electrodos y el paso de esta energía eléctrica que genera
impedancia y conductancia a través de las diferentes fases del ciclo glotal.

Cuando esta resistencia se aplica a tejidos vivos surgen además algunos otros interrogantes que se
relacionan con las circunstancias y las restricciones que este fenómeno produce aplicado al funcionamiento
real de la laringe.
Las personas a las cual se le ve a realizar este estudio suelen querer saber cuál es la cantidad de voltaje que
van a recibir, si lo van a sentir, si podría causarles daño.
Cuando hablamos de electroglotografía hablamos de paso de energía por los tejidos. Por lo tanto las
características eléctricas de los electroglotografos son muy específicas:

La cantidad de corriente utilizada en el caso de la EGG es aproximadamente de 0.5 Watts (Vatios) y no podría
causar ningún tipo de daño ya que la magnitud de la corriente eléctrica es muy pequeña.
La persona no percibe nada cuando se realizan. A diferencia de otros electrodos que se utilizan en otras
pruebas.
Solo percibe el collar que va bastante ajustado al cuello pero no percibe el paso de la energía eléctrica.
Si la intensidad de la corriente eléctrica es baja, se genera el transporte de la misma de forma variable según
el material en el cual se aplica, pero si la misma es demasiado intensa provoca una reacción del tejido, lo
cual no es el objetivo de la EGG. Esto en cambio seria material de estudio si nos referidos a campos
relacionados con la electroestimulación de tejidos. En el caso de la electroglotografía no hablamos de
electroestimulación sino simplemente de transporte de energía eléctrica.
FUNCIONAMIENTO Y PROCEDIMIENTO:
Para la evaluación electroglotográfica es necesario de una interfaz que permita el registro de las
modificaciones en la actividad glótica.
Existen diferentes empresas que fabrican este dispositivo para la evaluación electroglotográfica entre los
más difundidos se encuentran:
• Electroglottography by Donald Miller (es el más accesible)
• VoceVista, Electrography by lingWaves
• Electroglotograph by Dr. Speech
• EG2-PCX2 (Glottal Enterprises)
*Necesitamos no solo del electroglotógrafo sino también de una placa que digitalice esta señal y la lleve a
un Software adecuado.

Componentes respecto al uso del electroglotógrafo:


• Electrodos que se colocan con un collar bien ajustado en el
cuello a nivel del cartílago tiroideo (así los electrodos quedan lo
más fijos posibles)
• Procesador que es la interfaz, que permite la conversión de la
señal de análoga a digital, para poder ser analizado por un
software especifico
• Cables de conectividad desde la interfaz del EGG a la
computadora

Se deben considerar los siguientes pasos para la grabación de la señal:


1. Colocar los electrodos de superficie a ambos lados de la escotadura del cartílago tiroideo, a la altura
teórica de los pliegues vocales
2. Es importante que los electrodos se encuentren ajustados y esto se logra a través de una banda de velcro
que permite un ajuste preciso a la dimensión del cuello
3. Con los electrodos debidamente colocados y la cinta de velcro bien ajustada se le pide al sujeto la emisión
de la tarea fonatoria asignada, que pueden ser en general vocales sostenidas, voz hablada o cantada

Parámetros Electroglotográficos
La señal obtenida a través del electroglotógrafo genera una gráfica: se denomina electroglotograma y es
proporcional a la superficie de contacto entre ambos pliegues vocales.
El electroglotograma es como el oscilograma que vemos en el análisis acústico. Debemos saber analizarlo
porque es muy útil en relación a la clínica y en relación al patrón.
Así como el análisis acústico, la electroglotografía nos va a dar
información cuantitativa y cualitativa. Entrega resultados como Gráficos
o parámetros numéricos según el caso.

Análisis de Aspectos Cualitativos en EGG:


• Regularidad de la Frecuencia y Amplitud de movimiento
• Estudio de las Fases del Ciclo Glotal
• Existencia de Oscilaciones o Doble Pico en el trazado (importante
para el diagnóstico diferencial de ciertas patologías)

La señal obtenida a través del electroglotógrafo se denomina


electroglotograma. Existen dos modelos clásicos de representación de la
onda electroglotográfica de Rothenberg: la fase de cierre se refleja con
una disminución de la impedancia y por lo tanto una deflexión de la onda
hacia abajo. Rothenberg es una de las primeras personas que propone
esta lectura del electroglotograma.
En base a sus estudios a las primeras graficas en base a la electroglotografía se las conoce como Onda
electrográfica de Rothenberg.
La lectura que se podía hacer a partir de este tipo de graficas es un poco distintas al tipo de lectura que
actualmente se utiliza porque lo que planteaba es una curva inversa a la del día de hoy.
Es decir, lo que captaba el electroglotógrafo que utilizaba Rothenberg es una curva que dibujaba en su parte
inferior la fase de cierre y en su parte superior la fase de apertura. De esa manera determinaba el patrón de
vibración de los pliegues vocales con sus diferentes niveles de impedancia.

Actualmente, se utiliza la onda electroglotográfica de Fourcin o también denominada como Registro Lx.
Fourcin llama registro Lx a la onda donde la fase de cierre en los pliegues vocales produce una deflexión de
la señal hacia arriba reflejando mayor conductividad y contacto.
La onda LX es proporcional a la superficie de contacto entre ambos pliegues vocales y el análisis debe
realizarse tanto cualitativa como cuantitativamente.

*Esta onda lo que hace es determinar la fase de apertura hacia abajo de la curva y la fase de cierre a nivel
superior de esta grafica.

De esta manera se van describiendo las gráficas


en donde nosotras podríamos ver muchos
elementos.
Podemos ver cada ciclo glotal donde vamos a
analizar todo lo que tiene que ver con la fase en
cierre, cerrada, en apertura y abierta,
dividiéndolo en estas dos grandes fases que son
la fase cerrada y la fase abierta. Pero además
nos permite ver la amplitud de la onda (relacionado con los niveles de impedancia) y podemos ver la forma
de la onda que nos va a dar mucha información sobre el tipo de patrón que tiene la persona para fonar.
Por lo que los electroglotografía actuales nos dan información que se evidencia a través de este tipo de onda
electroglotográfica de Fourcin.

Vemos los momentos subdivididos en relación a la electroglotografía

Cuando hablamos de los diferentes patrones en relación a la electroglotografía,


decimos que es un elemento importante que permite saber sobre la apertura y
cierre sino también los diferentes tipos de patrones con lo que esto se producía.
Esto está relacionado al uso de los diferentes registros en relación a la fisiología
vocal.
Cuando hablamos de los diferentes patrones de lo que hace a la
electroglotografía podríamos dividir estos cuatro tipos principales de gráficos:
a. Ensanchamiento del pulso glotal: hay un mayor tiempo de aducción. Podríamos decir que es una
curva donde la fase cerrada se mantiene bastante tiempo. Esta curva podría evidenciar el uso de una voz en
registro modal con un patrón de contacto no demasiado elevado pero si bastante fuerte.
b. Voz en falda abultada. Es una especie de meseta que evidencia que la fase de cierre es demasiado
larga. Puede darnos información de que o la persona está realizando un contacto cordal demasiado elevado
con una voz hiperfuncional o que hay algún tipo de superficie engrosada a nivel del borde libre de los pliegues
vocales.
c. Curva de pico sesgado. La curva en lugar de tener una posición media se produce antes de lo que
debería. Esto tiene que ver con mayor convergencia de la glotis para ir al ciclo glotal. Esto evidenciaría no
solo una voz hiperfuncional sino también cierto ataque en el comienzo vocal.
d. Curva en falda de rampa: Vemos una curva prácticamente cuadrada. Evidenciamos a nivel de la clínica
o lo que escuchamos en la voz perceptual del paciente es que se producen cambios muy rápidos entre la
fase abierta y la fase cerrada. Es muy abrupto el paso entre la fase abierta y la fase cerrada.
En relación a las patologías vocales, también se describen diferentes formas que nos podrían servir en el
diagnóstico de ciertas patologías. Para el diagnostico diferencial o diagnostico complementario. Lo
aconsejable es comenzar con la observación otorrinolaringológica y visualización de la laringe. EN muchos
casos cuando ocurren ciertas dudas diagnosticas sobre la visualización se pueden realizar diagnósticos
complementarios. Uno de ellos es la electroglotografía. Nos puede arrojar diferentes tipos de curvas.

Vemos las que están descriptas normalmente en la literatura actual:


- Se describen las curvas de nódulos con una pequeña disminución al momento
del cierre y vuelve a cerrar.
- En los pólipos una curva muy irregular del momento de cierre propiamente
dicho
- En voces con hipofunción se observa un poquísimo contacto cordal
- En la hiperfunción lo que vemos es una curva muy aumentada que comienza
mucho antes de lo que debería ser en relación a lo normal y vemos un gran pico
de cierre, una meseta que está relacionado claramente con la hiperfunción en
la voz.

PATRONES ELECTROGLOTOGRÁFICOS
Hay diferentes patrones que podemos determinar además del análisis de la onda.
Estos patrones los podemos analizar en forma numérica y en algunos casos podemos verlo también en
forma gráfica.

- Tiempo de contacto de los pliegues vocales (CQ)


La electroglotografía analiza por cada ciclo glotal, la apertura y el
cierre y a partir de esto saca un valor de promedio que tiene que
ver con el tiempo de contacto de los pliegues vocales que se
evidencia a través de un porcentaje. Porcentaje de tiempo que los
pliegues vocales se encuentran juntos en cada ciclo vocal. Este
porcentaje se puede ver gráficamente en la línea azul. Que en este
caso indica que en menos de la mitad del tiempo total del ciclo los
pliegues vocales han estado juntos.
También podríamos analizarlo numéricamente. Y ese es el patrón de Cociente de Contacto (CQ)
- Cociente de Contacto (CQ) Es el tiempo que los pliegues vocales permanecen juntos del total del
tiempo del ciclo vibratorio.
Tiene relación con la aducción de los pliegues vocales:

También está muy relacionado con patrones aerodinámicos como la presión subglótica y la resistencia.
Cuando tenemos muy aumentado el cociente de contacto tenemos que pensar que existe un nivel
demasiado elevado de presión subglótica y demasiado elevado de resistencia glótica.

Lo que podemos ver es que la forma de onda y el CQ se ven influenciados según la frecuencia, la intensidad
y el registro primario (registro pulso, modal o elevado).
Vamos a hablar que el cociente de contacto va
a ser mucho mayor cuanto menor sea la
frecuencia.
En el cociente de contacto por ejemplo en el
funcionamiento del registro/pulso,
podríamos hablar de que al tener menor
frecuencia, lo que se puede ver a través de
EGG es que el cociente de contacto es muy
elevado. En lo que es vocales se encuentran
en fase de cierre mucho tiempo.
A diferencia de registro elevado donde
podríamos tener un contacto mucho menor
y tendríamos que hacer una subdivisión (que
tiene más que ver con la voz cantada) y lo que
algunos autores denominan registros
secundarios que tienen que ver con la
configuración glótica. Diferentes tipos de
configuración glótica para producir el distinto
tipo de registro elevado.
Entonces ahí el cociente de contacto varía
según el tipo de configuración que el cantante utilice en una misma frecuencia.

A MAYOR FRECUENCIA → VA A HABER MENOR COCIENTE DE CONTACTO


A MENOR FRECUENCIA → MAYOR COCIENTE DE CONTACTO

El análisis de la forma de onda es información sumamente valiosa y que permite completar lo obtenido en
la evaluación instrumental objetiva de forma cuantitativa. Vamos a entender claramente cuál es el patrón
de funcionamiento que está realizando esa persona.
La imagen es un ejemplo de un glissando en una
voz cantada. Se puede ver que a medida que va
aumentando en la escala tonal, la curva se va
disminuyendo en su grosor y el CQ también va
disminuyendo.

*Aunque hay muchos reportes en relación a la EGG


no hay valores límites como los que encontramos
por ejemplo en relación al análisis acústico donde
tenemos tablas de valores de media, de valores
límites y valores patológicos. Cuando hablamos de
EGG hay valores estimativos de literatura actual
pero no estandarizados.

Los valores normales del CQ también varían de


acuerdo a factores relacionados a las
características del equipo EGG; pero en general se
considera para emisiones en registro modal
valores aproximados a 40%.
En la práctica entre 35 a 50% es lo que
encontramos normalmente en voces
perceptualmente normales en registro modal.
Menor de 35 encontramos voces perceptualmente
muy sopladas, cuanto más disminuye el CQ van a
ser voces más sopladas.
Si encontramos voces de CQ mayor a 50/55% por
lo general son voces que perceptualmente suenan
muy apretadas. Voces hiperfunciones.

- Cociente de Apertura - Open Quotient (OQ)


Es el cociente obtenido a partir del tiempo durante
el cual los pliegues vocales se encuentran en fase de apertura durante cada ciclo
glotal, teniendo una relación inversa con el CQ.
A través del OQ es posible estimar una relación directa con el flujo transglótico, por
lo tanto: a mayor cociente de apertura existe un mayor flujo transglótico.
> OQ = > MFR

- Periodo total - T (period)


- Es el intervalo de tiempo considerado entre cada fase de cierre, es decir, la duración total de cada ciclo
glotal. Se mide en segundos. La regularidad o semejanza entre los ciclos es un indicador de cierta
estabilidad en el proceso biomecánico de la emisión vocal.

La línea en verde es el periodo de cada ciclo glotal. También se arroja a través de


valores numéricos en segundos.
El periodo en este caso, comparándolo con el análisis acústico, sería la medida de
perturbación que podemos analizar dentro de la EGG. No está definido como una
medida de perturbación pero nos servirá para identificar en la clínica
modificaciones porque lo que nosotros podemos medir es la semejanza o
diferencia en relación al tiempo de cada uno de estos ciclos glotales.
La semejanza tiene que ver con ciclos glotales que son normales.
En casos de patologías vocales se podría realizar un análisis según el patrón funcional de la siguiente forma:

En voces hipofuncionales por lo general encontramos bajo nivel de contactos, porcentajes muy bajos. Por
lo tanto el coeficiente de apertura es bastante elevado. Esto se relaciona con un elevado flujo transglótico,
una baja presión subglótica y muy poca resistencia a nivel glótico.

En cambio, en voces hiperfuncionales estamos hablando de cocientes de contacto que son muy elevados y
por lo tanto coeficientes de apertura muy bajos. Esto va a ser igual a flujo transglótico bajo, resistencia
glótica muy elevada y presión subglótica también muy elevada.
La resistencia y la presión son directamente proporcionales.

- Nivel de Criterio - Criterion Level (CL)


Es el porcentaje obtenido a partir de la impedancia del ciclo analizado. Se calcula de forma automática a
partir de un cociente entre la amplitud mínima y máxima de la señal, siendo su nivel estándar un 35%.

Podríamos decir que si nosotros obtenemos niveles de criterio demasiado elevados, la impedancia es
demasiada y los niveles inferiores al 35% nos estarían hablando de poca impedancia.
Muchas veces esto podría estar influenciado por el registro con el que está fonando la persona.

Consideraciones finales:
Este tipo de herramienta debe ser utilizada de forma complementaria a otros procedimientos y protocolos,
para determinar de forma fehaciente las posibilidades vocales de la persona evaluada, conociendo en detalle
el funcionamiento de todos los elementos implicados en la biomecánica de la función vocal.
22 EVALUACIÓN DE LA VOZ
• Imagen laríngea (fibro, estrobo, etc.)
• Análisis acústico de la voz (en lo posible cercano a la fecha que se tomó la imagen laríngea)
• Medidas aerodinámicas (entre algunos de ellos medidas de eficiencia glótica como TMF, o índice S/Z)
• Anamnesis y ficha vocal
• Análisis perceptual
• Medidas de autovaloración de la voz (nos dan mucha información acerca del motivo de consulta del
paciente, cuál es su queja, y como impacta en diferentes dominios de su vida cotidiana).

CALIDAD DE VIDA (OMS)


Cuando hablamos de la autovaloración de la voz primero hacemos un paréntesis y hablamos del impacto
que puede tener el problema de su voz en su calidad de vida.
La calidad de vida:
“Se define en función de la manera en que el individuo percibe el lugar que ocupa en el entorno cultural y
en el sistema de valores en que vive, así como en relación con sus objetivos, expectativas, criterios y
preocupaciones. Todo ello matizado por su salud física, su estado psicológico, su grado de independencia,
sus relaciones sociales, los factores ambientales y sus creencias personales”.
Entonces, la calidad de vida no se puede medir de la misma manera para todas las personas.

Calidad de vida y la voz


Lo que queremos ver es cómo impacta la voz en estos diferentes parámetros subjetivos.
Se toman cuestionarios de calidad de vida relacionados con la voz que nos permiten cuantificar el impacto
percibido por un sujeto afectado por un trastorno vocal en los ámbitos de la propia función vocal, en la
capacidad física relacionada con ella y en las emociones que provoca la disfonía. Todo esto ligado a que el
individuo acude a la consulta porque tiene una queja vocal.

Utilidad (cuestionarios)
• Permiten medir/valorar el impacto subjetivo de un trastorno vocal.
• Ayudan al especialista en terapia vocal para diseñar estrategias terapéuticas adaptadas a las
necesidades de cada sujeto.
• Brindan información sobre el impacto de la disfonía en la comunicación del paciente, para poder
buscar recursos con el fin de minimizarlo.
• Útiles para el monitoreo del paciente.

PROTOCOLOS DE AUTOVALORACIÓN
DE LA VOZ
Todos son similares en cuanto a
afirmaciones acerca del impacto del
trastorno de la voz en diferentes
dominios y es importante trabajar con
protocolos que hayan sido traducidos y
validados.

VOICE HANDICAP INDEX (VHI-30)


• Es la herramienta más utilizada mundialmente para evaluar el impacto de la calidad vocal en la vida
del sujeto.
• Fue diseñado por Jacobson y col. (1997) en el idioma inglés.
• Validado al español en el año 2007 por Núñez-Batalla y cols. Es importante usar cuestionarios
validados al idioma español, no hacer una traducción propia.
• Objetivo principal es medir la autopercepción de la alteración vocal.
• Tiene alta especificidad (97,9%)
DEBE SER COMPLETADO POR EL PACIENTE.
• El cuestionario consta de 30 afirmaciones, divididas en 3 dominios: funcional (como impacta la voz a
nivel de la función vocal), físico y emocional.
• La escala para indicar la respuesta va de 0 a 4 puntos en relación a la frecuencia con la que el paciente
refiere que le sucede cada una de las afirmaciones propuestas por el cuestionario. Hay 5 opciones: 0
(nunca), 1 (casi nunca), 2 (a veces), 3 (casi siempre), 4 (siempre).
• El puntaje por subescala puede variar de 0 a 40 puntos (10 afirmaciones para cada subescala, son 3
subescalas).
• El puntaje total del cuestionario puede variar de 0 a 120 puntos.

Subescalas:

Para cada uno de los resultados posibles se les indica un índice de incapacidad vocal que va de leve a grave.
VHI – 10: VERSIÓN CORTA DEL VHI-30 Rosen, 2004

Las primeras 5 afirmaciones corresponden a la parte funcional, hay 3 afirmaciones de la parte física, y 2
afirmaciones de la parte emocional. No pierde validez por ser una versión acortada.
De estos cuestionarios se desprendieron otros que tienen aplicaciones para distintas poblaciones más
específicas como es el caso del Singing VHI, o el VHI pediátrico.

SINGING VHI
Evalúa más que nada la población de los profesionales de la voz, en particular los cantantes, quienes tienen
ciertos requerimientos y ciertas exigencias vocales que no son las mismas de cualquier paciente con otro
tipo de actividad diaria en la cual utilizan su voz.
Se da con las mismas respuestas que el anterior, pero sin los números (versión en inglés, en español si tiene).
Tiene 36 preguntas, es más largo. Tiene también los 3 dominios mezclados. También está la versión reducida:
S-VHI (Versión 10) Puede complementarse con el VHI normal.

VHI PEDIATRICO
Índice de discapacidad vocal pediátrico.
En 2007 aparece, en 2015 se realizó la
adaptación y validación al español, en 2019
fue adaptado y validado al español de
Argentina.

Esta es la primera versión en español que


apareció, que utilizábamos antes de que se
haga la validación al español de Argentina.
Es completado por los padres.

Índice de discapacidad vocal pediátrico


(Argentina)
Hay un cuadradito arriba de todo: para
poner el número total que arroja cada uno
de los apartados.
Este cuestionario no tiene una tabla de valoración como tiene el VHI de adultos donde se divida la
incapacidad en leve, moderada, severa. Sino que se consigna el total de cada subescala y el total general.
También es importante que se registre quien contesta el cuestionario. La primera parte establece que el
padre califique la capacidad de habla del niño. (1 es extremadamente callado y 7 es extremadamente
hablador). Luego se evalúan las 3 subescalas. Al final del cuestionario hay un índice global de severidad de
la discapacidad de la voz en el cual se pide a los papás que marquen con una cruz el lugar donde les parece
que se ubica la severidad de su hijo (normal moderada severa).
Evaluar los resultados a nivel global y por cada subescala, charlar con los padres para realizar seguimiento.
Algunas patologías que pueden afectar estos índices pueden ser: parálisis de CV, membranas laríngeas
congénitas, también puede ser alguna patología adquirida como por ejemplo los nódulos vocales. De todas
formas, siempre depende de la capacidad del niño y de impacto que tenga en su vida cotidiana.
Lo que ocurre mucho con las patologías de alteraciones estructurales mínimas es que pasan bastante
desapercibidas porque son las características vocales de los niños y muchas veces los papás no consultan
porque no se dan uenta, a diferencia de algo más notable como una parálisis de CV.

CONSIDERACIONES FINALES
Recordar que, tanto en niños como en adultos, el impacto en la calidad de vida no va a estar directamente
relacionado con el tamaño de una lesión o agravado por la severidad de una patología, sino que cada uno lo
va a percibir distinto de acuerdo el impacto que tenga en la calidad de vida.
• Dice la OMS: “la evaluación de la calidad de vida puede servir para medir los resultados en la
investigación relativa a los beneficios comparativos de los diferentes métodos terapéuticos”.
• En investigaciones alrededor del mundo las escalas subjetivas toman un papel primordial a la hora de
mostrar cambios o diferencias significativas en relación a la comparación de diferentes técnicas de
rehabilitación.
• Valoración de los resultados de cualquier intervención terapéutica.
• La aplicación de cuestionarios como el VHI resultan fundamental en la terapia vocal para diseñar un plan
terapéutico y monitorear la evolución del paciente.

En general en el hospital toman el VHI al inicio, cuando el paciente hace su primera consulta, luego de algunas
sesiones, y al alta del paciente. Lo interesante es también tomarlo a largo plazo. Incluso sirve para realizar
alguna investigación.
20 LARINGECTOMIZADOS
Inicio en la atención de pacientes laringectomizados en el año 1977 (pacientes con cáncer), al ingreso como
Fonoaudióloga al Servicio de ORL del Hospital de Clínicas, a cargo del Prof Dr. Juan Carlos Arauz.

Hospital de clínicas:
• Centro de referencia de derivación de pacientes con patología laríngeas
• Se realizaban muchas laringectomías
• Aprendían a hablar con voz esofágica (con el segmento faringo esofágico) o voz erigmofónica (lo
inventaron a partir de la palabra “eructo” ya que el paciente aprende a hablar a través de ellos).

La primera presentación se dio en un Congreso de ORL en el año 1978: “nuestra experiencia con el paciente
laringectomizado”. Fonoaudiólogas Nilda Corradini y Liliana Sigal: enseñanza del método deglutorio. (El
paciente tragaba y eructaba).

Año 1991: Primeras reuniones de pacientes LT.


• Con los pacientes en grupos, para que se conozcan, escuchen experiencias de vida, de continuidad
en el trabajo, de comunicación interpersonal, familiar, etc.
• Los familiares tenían reuniones con una psicóloga.

Modalidad de abordaje:
• Entrevista prequirúrgica (los pacientes iban primero a fono para que se les explicara que no iban a contar
con su laringe, sino que va a poder comunicarse con un habla proveniente del esófago, y se le mostraban
ejemplos de otros pacientes).
• Rehabilitación fonoaudiológica (después de operado a los 15 días)
• Reuniones de pacientes y familiares (en un principio se mandaban a CROL (centro de rehabilitación de
operados de laringe) pero luego dejo de tener tanta importancia y empezaron a tenerla las
fonoaudiólogas del hospital Roffo y del hospital María Curie, hospitales oncológicos).

Asesoramiento:

Explicarle que no cuenta más con su laringe y cómo va a estar fonando de ahí en adelante, pueden ocurrir
tres casos:
Caso 1: va a tener un traqueostoma, orificio en el cuello por el cual va a respirar.
Detrás de ese orificio tiene el esófago y por arriba hay un segmento que va a representar las CV que tenía
antes, algunos autores la llaman neoglotis, pero en realidad es el segmento faringo esofágico, de más o
menos 11 cm de longitud. Está conformado por los músculos cricofaríngeo (en la parte superior del esófago)
y el constrictor inferior y medio de la faringe. Ese segmento va a moverse y originar un sonido que va a ir por
la faringe hasta la boca, donde va a articularlo. Al principio va a salir un sonido similar un eructo solo de corta
duración, pero luego esto se va a prolongar.
Caso 2: Le pueden colocar una prótesis de silicona que va de la tráquea al esófago y los comunica. En ese
caso el paciente va a hablar con voz traqueo esofágica. En el año 1991 en Argentina la prótesis todavía no
estaba colocándose a todos, entonces se usaban todos los recursos que se pudieran para que el paciente
pueda hablar con la mejor voz esofágica posible.
Caso 3: Puede usar un laringófono o laringe artificial, que es un vibrador que se coloca en el cuello en las
partes blandas. Cuando yo apreto, el vibrador trasmite el sonido por partes blandas hacia la boca donde lo
artículo. En ese caso el paciente contará con voz “robótica”.
• Informar sobre los diferentes métodos y el tiempo de tratamiento que es incierto, puede durar de 2
meses a un año depende del tiempo que quiera el paciente.
• Contactarlo con otro paciente laringectomizado para que escuche su nueva voz
• Otorgar una entrevista postquirúrgica durante el periodo de internación para asegurar el bienestar
del paciente con respecto a:
a) Modo de comunicación con su familia, canalizar sus dudas
b) Informar sobre la importancia de la protección del traqueostoma
c) Cuidados de la cánula traqueal
d) Tiempo que transcurrirá entre el postoperatorio inmediato y la rehabilitación propiamente dicha
• Aplicar la terapia rehabilitadora para el logro del habla alaringea.

Inicio del tratamiento


Explicar al paciente como era su aparato fonador antes de la cirugía y cómo es su anatomía actual.

La voz antes y después de la intervención

Existen protectores que se venden, tejidos o


de alguna gaza para cubrirlo. Es importante
proteger ese traqueostoma (agujero) ya que
todo aquello que entra del exterior genera
secreciones.

Laringe Artificial:
• Uso de laringófono manual con un diafragma vibratorio que se coloca firmemente contra el cuello para
que funcione.
• Las vibraciones se trasmiten a través de la piel hacia el interior de la hipofaringe.
• Se requiere de una buena articulación para una mejor emisión.

Desventaja:
• Requiere el uso de una mano
• Voz robótica.

Voz erigmofónica o esofágica:


Se produce insuflando o inyectando aire al esófago (tomar una burbuja de aire y retenerla bajando la cabeza)
y luego permitiendo que ese aire sea soltado, haciendo que el segmento faringoesofágico vibre y produzca
un tono que pueda ser usado como fuente sonora.

Métodos para la adquisición de habla esofágica:


• Inyección: Mediante vocales, a partir de toma de aire bucal. (tomar una burbuja de aire y retenerla
bajando la cabeza, se elonga la faringe y esófago y entra ese aire). Inyección consonántica: Se basa en el
principio de que la articulación es tanto más fácil cuando mayor sea el número de consonantes explosivas
que se utilizan: /p/, /t/, /k/, y las oclusivas /b/, /g/. Se le pide al paciente que cierre su boca con la
máxima cantidad de aire posible. Con la constricción que producen estas consonantes el aire se
impulsa hacia abajo, de un área de mayor a una de menor densidad
• Presión glosofaríngea: La lengua forma un fuerte contacto con el reborde alveolar, presionando hacia
arriba y atrás contra el paladar. El aire es bombeado por la lengua hacia el esófago (tomar un poco de
aire, poner la lengua contra el paladar presionando hacia arriba sin tragar y eso hace que el aire que
tomé se vaya a la faringe gracias a esa presión).
• Inhalación: Se aprovechan los cambios de presión intraesofágica producidas durante los movimientos
respiratorios (llevar la cabeza para atrás, tomar un poco de aire y volver con la cabeza al centro. El aire
entra también por el traqueostoma entonces cuando va a querer eructar va a ser un eructo con salida
de aire por la estoma también, va a ser ruidoso).
• Deglución: Es eficaz pero debe ser enseñado como facilitador únicamente, cuando no se logra sonido
con los otros métodos descriptos. De otro modo el paciente deberá deglutir cada vez que quiera
fonar (no es el mejor sin embargo si ninguno de los otros sirve se utiliza y se pide que el paciente tome
algo con gas para ver que pueda eructar)

Si obtiene la voz esofágica:


• Primeras sesiones trabajar con vocales
• Luego prolongarlas y agruparlas
• Palabras monosilábicas (la que mejor funciona es “pa” por la presión que hace con ambos labios para
hacer la “p”, después incorporaba “ta” o “ka” etc).
• Incorporar palabras (1° bisilábicas, después trisilábicas, etc.) y producciones automáticas (facilitadoras)
• Listas de palabras
• Frases cortas (oraciones)
• Diálogo
• Se debe practicar varias veces al día, en segmentos.

Cuando no sale el habla esofágica:


• Habla faríngea (habla tipo “pato Donald”)
• Enseñarle a articular claramente
Suelen ser pacientes que no solamente les sacaron la laringe, sino que tuvieron que hacer una resección
mayor.

Se puede investigar la elasticidad del segmento faringoesofágico mediante el test de insuflación, cuando el
paciente no obtiene el sonido en el entrenamiento de la voz esofágica.
Asimismo para evaluar si podrá ser un buen hablante de habla traqueoesofágica. (Video Test de insuflación).

Diferencias de esta voz con la producida por cuerdas vocales.


• El sonido se produce en el segmento faringoesofágico comprendido por los músculos cricofaríngeo y
constrictores inferior y medio de la faringe.
• La intensidad de la voz va a ser menor con dificultades iniciales para comunicarse en ambientes ruidosos
o para hablar en público.
• También va a ser menor la duración de la emisión sonora afectando la fluidez.

Mecanismo de producción:
• El aire, previamente deglutido o introducido en esa porción del esófago, es eructado o soplado hacia la
faringe hacia la cavidad oral, produciendo un sonido (eructo), que será articulado por los órganos
articulatorios de igual forma que lo era el soplo pulmonar tras pasar por la glotis.
• Acerca de la resonancia: el sonido creado en la pseudoglotis al pasar por el tubo faringo-bucal se
amplificará según la posición en que se coloquen la lengua y el velo del paladar en estas cavidades. Es
importante relajar la faringe para producir la voz con el mínimo grado de tensión muscular del cuello.
• Por último, otro factor diferenciador va a ser la entonación (interrogaciones, exclamaciones).
• Con la práctica se logra desarrollar el tono muscular consiguiendo aumentar tanto la intensidad, la
duración y la entonación.
En resumen, en la producción de voz esofágica:
• La fuente de aire la constituye el esófago (músculo cricofaríngeo que está en la boca del esófago)
• La estructura estrecha, flexible y elástica con capacidad para vibrar, la constituye la neoglotis (segmento
faringo esofágico)
• Las cavidades de resonancia son las mismas que antes de la laringectomía.
• El aprendizaje de la voz erigmofónica supone un gran logro para el paciente laringectomizado, ya que le
permite recuperar una herramienta fundamental en la comunicación con otras personas; pero su
adquisición no es fácil y sus características, intensidad, duración, timbre, fluidez y entonación, difieren
mucho de la voz laríngea que poseía el paciente, por lo que necesita un periodo de adaptación y de
identificación como su propia voz.
• La impresión que el propio paciente tiene de su nueva voz y la funcionalidad de la misma para mantener
una comunicación oral, se muestran como variables que pueden incidir en su estado emocional, más allá
de las características físico-acústicas que pueda presentar en cada paciente.

Tiempo de aprendizaje:
Cuanto tardaron en adquirir voz esofágica

Total: 40 pacientes de la Asociación de Navarra de Laringectomizados. (publicación de 2012

*frecuencia: pacientes.

Una de las causas que puede generar que tarden más tiempo en aprender puede ser:
• Otra operación luego de la primera por recidiva.
• Aplicación de rayos, la radioterapia endurece los tejidos entonces les cuesta más, no permite esa
elasticidad del segmento faringo – esofágico.

¿Cómo comenzar el tratamiento?


Con qué sonidos se inicia la práctica:
• Vocales
• Sílabas precedidas por /p/, /t/, /c/, y /ch/ (esa explosión hace salir mejor a la voz).
Se sugiere la práctica diaria en el hogar, breve pero reiterativa.

21
Dudas:
Qué pasa con la función de protección de la laringe: Cerraron la faringe en el cuello. Entonces el paciente
mastica, traga, va a faringe, orofaringe (no tiene que ir a nasofaringe porque el velo del paladar funciona).
*Recordar que laringofaringe ya no se llama porque laringe no hay. Sino la porción inferior de la faringe sigue
por el esófago y va todo al estómago donde se digiere.
Ya no hablamos de que la laringe se cierra, de que la glotis se cierra para que los alimentos no pasen por ella.
Al no haber laringe, los alimentos pasan a la laringe y al esófago.
Se respira por la tráquea. Se termino la encrucijada aerodigestiva. Solo hay respiración por el agujero que se
abrió de la tráquea al cuello y hay alimentación boca-faringe-esófago. No hay nada en el paso del alimento.
Si hubo un tumor grande y la faringe está muy estrecha (porque sacaron el tumor y tuvieron que sacar más
tejidos, debiendo cerrar apretadamente la faringe), el paciente tiene dificultad para tragar.
También a veces aparece la dificultad para tragar cuando hay una recidiva. Así como cierta disminución en
la intensidad de la voz. (cuando aparece de nuevo un cáncer después de varios años).
Entonces: el paciente mastica, traga y se va el alimento hacia abajo. Luego respira y tiene que tener ese
agujero abierto siempre.
Cuando al paciente lo operan, le colocan una cánula. La cánula tiene que estar un tiempo. Se usa 1 mes todos
los días mañana, tarde y noche. Al mes, se puede probar sacarla de día pero a la noche se le dice al paciente
que la use, para que no sienta que se ahoga.
La cánula tiene una forma curva (aprox. 10 cm) parecida a la curvatura de la tráquea. Debe usarse. El paciente
saca la cánula, la higieniza y se la vuelve a colocar. Esto para que tenga la vía aérea disponible siempre porque
por ahí va a respirar. Ya no va a tomar aire por boca o por nariz para respirar. Sino que lo va a hacer a través
de la tráquea: del traqueostoma o estoma, que es por donde entra el aire.
Mientras que va a seguir comiendo por la boca. (boca-faringe-esófago).
Lo que se va a compartir, va a ser:
- el esófago (parte superior)
- constrictores inferior y medio de la faringe para hablar
Por eso el paciente va a tomar un poco de aire por la boca (por el método de inyección o por el método de
presión-gloso-faríngea (gloso-palatina)). Que es lo mismo movimiento que nosotros hacemos cuando vamos
a tragar, que levantamos la lengua hacia el paladar.
Con estos dos métodos, que son los mejores para poder hablar, en el sentido que no están dependiendo de
un tercer elemento (ej. tener que estar tragando agua), el paciente va a fonar bien.
También hay un tercer método que es el de la inhalación: abrir la boca y tratar de tomar un poquito de aire.
Pero el aire al inhalar va a entrar por tráquea. Y cuando se exhala, se saca el eructo y va a salir el aire por
tráquea entonces se va a escuchar como un escape de aire por el traqueostoma.

El otro método que se enseñaba al principio cuando la profesora entro al hospital, es el método de deglución:
trago y eructo. Pero fue algo que empezaron a usar por intuición porque notaron que al tomar un vaso de
soda, era más fácil eructar. Entonces si al paciente en la primera sesión y segunda sesión veo que no le sale
inyectar o la presión glosopalatina o inhalar, con un vaso de coca o algún líquido que contenga gas, va a
poder eructar y es lo que queremos lograr. (Liliana dice que ella apoya esto, que ella es menos rígida en
cuanto a que no se puede o no se debe, sino que hay que poder aprovechar recursos para lograrlo).

Entonces luego se inhibe la deglución (para que no esté todo el tiempo tragando para poder emitir) y
educamos con inyección, con presión glosopalatina o con inhalación (Para Liliana de los 4 métodos, este
último no sería el mejor, prefiere los primeros 3. Es decir, inyección, la presión glosopalatina y si no le sale
que degluta, pero estar aspirando por boca para tratar de eructar va a salir aire por el traqueostoma también
y se va a escuchar un escape que resulta molesto). *Luego cada uno elige viendo al paciente que le sale y
que no, cual es la mejor forma.

*Entonces ya vimos el método de voz esofágica o Erigmofónica (como lo llaman en España).


Los pacientes que utilizan una prótesis también pueden usar la voz esofágica porque si aprendieron a fonar
con prótesis, van a ser excelentes fonadores de voz esofágica también.
*según Liliana, la laringe artificial es ideal tenerla

VOZ TRAQUEOESOFÁGICA
Prótesis que comunicaba la tráquea con el esófago. El médico cirujano que realizaba las operaciones era
Singer y el fonoaudiólogo era Bloom. Se creo una empresa que fabricaba esas prótesis.
Voz Traqueoesofágica:
Pasaje de aire pulmonar de tráquea a esófago a través de la fístula creada por el cirujano:
• Fístula primaria: se efectúa en el mismo acto quirúrgico de la LT)
• Fístula secundaria: operación posterior
La prótesis vocal que se coloca en la fístula es un tubo de silicona hueco que se abre cuando al ocluir con el
dedo y exhalar, aumenta la P+ en la VA permitiendo el flujo de aire hacia el esófago → Se activan superficies
mucosas del segmento faringoesofágico produciéndose el sonido.
Prótesis fonatoria
• Prótesis de silicona que se coloca en una fistula creada quirúrgicamente en la pared traqueoesofágica.
*La fistula es un canal que va desde la tráquea al esófago. Hay una separación de las vías digestiva y
respiratoria. Las rayitas del grafico en color rosa, indican dónde el medico hizo la fisulta. Abrió un
agujerito (un canal) que comunica tráquea y esófago. En esa fistula es donde se va a colocar la prótesis
de silicona.
• El pasaje de aire pulmonar desde la tráquea al esófago activa las superficies del segmento
faringoesofágico produciéndose el sonido.
*El paciente toma aire por el traqueostoma (el agujero que esta hacia el exterior) ese aire va hacia los
pulmones. Realiza el recorrido: tráquea - bronquios - pulmones. Luego se exhala: Pulmones - bronquios
- tráquea. Si el paciente pone un dedo en el traqueostoma, ese aire no tiene por donde salir y si hay un
canal o fistula que comunica la tráquea con el esófago, ese aire se va por ese canal hacia el esófago:
esófago-faringe-boca. Al abrir la boca digo una /a/. Pasa el aire de los pulmones hacia el esófago, es decir
el aire está desviado → ESTO PASA POR UNA FISTULA. (Importante pregunta de final).

Recordar que estos pacientes, no pueden tomar aire por nariz porque no hay conexión entre nariz que va
hacia laringe, tráquea, bronquios pulmones. Porque no tiene la laringe. Al sacarle la laringe, la nariz y la boca
están separadas de la función respiratoria. El paciente pierde olfato porque no le entra aire por nariz.
Igualmente se educa después. Están separadas la vía respiratoria de la digestiva. Se pierde la encrucijada
aerodigestiva. Entonces le paciente siempre va a tomar aire por traqueostoma (el agujero que hay en el
cuello) que es el resultado de la tráquea suturada al cuello.
Si usa la voz esofágica, no va a haber ninguna conexión entre la parte respiratoria y la parte digestiva. No
hay ninguna conexión y el paciente va a hablar tomando una “burbuja de aire” (toma pequeñita de aire) por
boca. Utilizando los métodos inyección, presión, inhalación o deglución. Esa es la forma que tiene el paciente
de hablar. Esa es la voz esofágica. El mecanismo de voz normal desapareció.
Con la voz traqueoesofágica, lo que ocurre es que inventaron la prótesis fonatoria de Erin Singer que se
coloca en el canal que el medico cirujano hacia entre tráquea y el esófago. El agujero se realiza 5 mm por
debajo del borde superior de la tráquea. Se realiza un canal o fistula con el paciente dormido. Se realiza
mediante una punción primaria o punción secundaria.

• Punción primaria: En los últimos tiempos, se realizaba esta. Sacan la laringe y dejan al paciente preparado
para colocarle una prótesis. Entonces en la misma operación de laringectomía total, dejan la fistula hecha
para que al paciente le coloquen un par de días después la prótesis.

• Punción secundaria: Es una fístula secundaria a la laringectomía total. Ej. Un paciente operado de una
laringectomía total y tuvo algún problema en esa operación. Quieren mandarlo a hacer voz esofágica y
no le sale. Al mes de operado de laringectomía total, puede ser nuevamente operado (una pequeña
intervención donde abren ese canal o fístula de tráquea a esófago). Le da la posibilidad al paciente 3
meses a ver si aprende el habla esofágica y si no le sale prueban con la prótesis. Puede realizarse la
intervención al mes, 3 meses, al año. Pero la diferencia es que no se realiza en la misma intervención que
la laringectomía.
Ambas opciones son válidas.

*Por la fistula se pueden producir aspiraciones, por eso hay que colocar una
sonda. Si no, se producen aspiraciones (se va la comida o parte del líquido
que traga el paciente hacia la tráquea). Esto se evita con la sonda o
colocando la prótesis.
Funcionamiento de la Prótesis:

1 2
La imagen de la derecha muestra la utilización de una prótesis de silicona blanda. Se utilizaban cuando ella
viajo a USA en 1994. Luego se reemplazaron por las prótesis de la imagen izquierda que son prótesis más
resistentes y más duraderas.

Prótesis blanda: tenía una duración de 3 a 5/6 meses.


Prótesis de la izquierda: Duración de 1 año.

Se observa como en la imagen de la derecha el paciente una vez que tomo aire por la tráquea, coloca un
dedo para tapar el traqueostoma y lograr que el aire espirado (que viene de los pulmones) vaya a través de
la prótesis al segmento faringo-esofágico. Y luego vuelva en forma de sonido.
El de la imagen de la izquierda tiene una válvula exterior que se abre para que el paciente respire, y se cierra
automáticamente por un juego de presiones. El aire va a la prótesis y de la prótesis a faringo esófago y se
produce el sonido.
En síntesis: A la derecha lo hace el paciente con su dedo y a la izquierda se hace automáticamente mediante
una válvula.
**Aclaración: Los médicos muchas veces al explicarle al paciente dicen que se le pone una “valvulita”,
llamando así a la prótesis. En realidad, es una prótesis y no una valvulita. Lo que sí es una válvula es lo que
se ve a la izquierda que se coloca en el traqueostoma para el habla sin usar las manos.

Prótesis Funciones:
• Mantener abierta la fístula. Para eso está la prótesis. Si no coloco la prótesis, se cierra la fistula.
• Permitir que el aire pase de la tráquea al esófago para la producción de habla. Va de tráquea →
Traqueostoma → A esófago para producir habla.
• Prevenir la pérdida de alimento o escape de fluido del esófago a la tráquea durante la deglución. Si dejo
un canal o fistula abierta se van a ir los alimentos a la vía aérea.

Importante! Si el paciente tosió y se le salió la prótesis, tiene que ir inmediatamente a cualquier centro de
salud para que le coloquen una sonda y no se le cierre la fistula. Si se cierra hay que abrirla nuevamente. Si
no hay prótesis, toda herida en el cuerpo tiende a cerrarse
*Antes se daba a elección si querían colocarse la prótesis o no. Con el dólar 1 a1 eran económicas. Con la
crisis del 2001 se complicó la compra de las prótesis y aumento también mucho su valor.
Luego se creó la Ley de Discapacidad, las personas laringectomizadas se presentaban como discapacitados y
el gobierno debía que proveerles todo. Las obras sociales podían orientarlos que a través del certificados de
discapacidad podían acceder a las prótesis. Hoy en día debe ser más difícil acceder a las prótesis.

PRÓTESIS (clase 18/06)


Una parte está del lado del traqueostoma, y del otro lado está el esófago. La prótesis atraviesa la pared
traqueoesofágica. En la parte de la prótesis que va al esófago hay una válvula o lengüeta que está
normalmente cerrada pero que se abre si yo mando aire.
La prótesis tiene anillos de retención en ambos extremos que evitan el movimiento de la misma, para que
no se vaya para afuera o que no la ingiera.
Antes tenían una lengüeta para poder insertar justamente un insertador que sostenía la prótesis y de esa
forma poder colocarla, ahora ya no.
En un principio cuando la colocación de prótesis era secundaria (ósea posteriormente), el paciente salía de
la operación con una sonda que mantenía la fístula abierta. Esta sonda iba de la fístula hacia el esófago, y se
pegaba en el cuello o la clavícula para sostenerla.
La prótesis no es que se coloca para que no se cierre la fístula, sino que es una consecuencia directa, al estar
está colocada no se va a cerrar. La función es más que nada para que pueda respirar y que pueda lograr la
voz traqueoesofágica.

Hay diferentes longitudes de la pared traqueoesofágica:


Se debe medir el grosor de la pared traqueoesofágica antes del cambio de prótesis. Si la fistulización y
colocación ha sido en forma primaria, es posible que la segunda prótesis tenga que ser más corta.

Cuando fistulizan y colocan la prótesis en forma primaria, es posible que la segunda prótesis tenga que ser
más corta. Las que más se usan son las de 10 mm pero hay prótesis un poco más cortas y protesis de 15 mm
también.
La pared traqueoesofágica puede estar muy inflamada por la operación si es en forma primaria y es posible
que la segunda prótesis tenga que ser más corta.
Si el medico coloca una prótesis larga, es incómodo para el paciente porque al tapar, empujan la prótesis
hacia atrás y le puede producir tos por estar tocándole la pared posterior y producirse inflamación o picazón.
Además se moviliza si es muy larga y puede abrir la fistula.
*Cuando se hacía en forma secundaria se media el grosor de la pared traqueoesofágica.

Duración de la prótesis:
En general alrededor de 12 meses, aunque hay pacientes que han referido una duración de hasta 15 meses.
Cuando se empieza a gastar, cuando el límite posterior se empieza a consumir o achicar y el paciente empieza
a sentir que cuando habla le pasa líquido a la vía respiratoria, es porque la prótesis se está fundiendo.
La parte posterior de ambas prótesis tiene un diámetro más grande que la prótesis en sí. Tienen un límite
posterior y uno anterior. Ambos tienen un diámetro mayor para que la prótesis no se mueva. En el límite
anterior de la prótesis, que da a la tráquea, está la entrada de aire (es un circulito que está abierto).
El límite posterior de la prótesis está parcialmente cerrado. Cuando pasa el aire se abre.

*El límite anterior está siempre abierto pero el límite posterior tiene una lengüeta que se abre para dejar
pasar el aire. Si ésta estuviese todo el tiempo abierta, cuando el paciente traga comida o liquido ese líquido
pasaría a través de la prótesis hacia la tráquea y los bronquios y el paciente se aspiraría.
Cuando pasa una determinada cantidad de meses y la lengüeta de la parte posterior de la prótesis se
empieza a gastar, puede ser que pase liquido hacia la vía aérea.
Los pacientes recién operados, muchas veces tienen hongos. Uno de los hongos comunes en esa zona es
Cándidas. La candidiasis lesiona la parte posterior de la prótesis porque la candidiasis se asienta en la parte
posterior de la faringe. Esto se produce por una disminución de las defensas, por el cáncer, por la operación
posterior, en la época de recuperación posterior. El paciente con voz esofágica no se entera de esto. Pero al
paciente con voz traqueoesofágica se le arruina la prótesis.
Otra cosa que arruina las prótesis es la ingesta de líquidos muy calientes.
Entonces además de cambiar la alimentación hay que indicarles que no tomen tanto mate durante el día y
si toman, no puede ser a una temperatura muy alta porque si no se destruye la parte posterior de esas
prótesis.
Con el paso del tiempo se han hecho prótesis cada vez más resistentes. Duran cada vez más.
El paciente se da cuenta que la prótesis no le sirve más porque se empieza a destruir la lengüeta del orificio
posterior y empieza a pasar liquido hacia la vía respiratoria.

Selección de pacientes para este método:


• Buena comprensión para entender el manejo del sistema
• Cercanía de un centro de salud.
• Cobertura social para la adquisición de la prótesis. Explicarle que puede sacar el carnet de discapacidad
y para qué le sirve.
• Ocupación laboral que no obligue al paciente a tener las manos ocupadas. Si tiene que estar tapando con
un dedo cada vez que quiere hablar y además necesita trabajar con las manos, le impide la colocación
de la prótesis, salvo que me coloquen una válvula exterior.
• Buena elasticidad del segmento faringoesofágico. Es tanto para la voz esofágica como para la
traqueoesofágica.
• Buena psicomotricidad y visión. Hay que observar cómo está la prótesis, hay que limpiarla todos los días
con un cepillito.
• No sufrir de enfermedad pulmonar severa con abundantes secreciones. Si el paciente está tosiendo todo
el tiempo va a expulsar probablemente la prótesis al exterior.

*Si se la colocan a cualquier paciente no hay forma de seleccionar. Pero si el paciente viene para voz
esofágica al consultorio y le enseñamos, es nuestra obligación contarle de que existe una prótesis. Que si
alguna vez se la puede colocar va a hablar con mucha más fluidez. Pero que también puede hablar con mucha
fluidez con voz esofágica.
Si tiene dificultad para hablar con voz esofágica no hay mejor resolución que una prótesis. Para eso tiene
que haber una buena comprensión para entender el manejo del sistema y tiene que vivir cerca de un centro
de salud.
Un señor que le colocaron una prótesis y vivía en el interior de la provincia de rio gallegos, y no tenía como
llegar a un centro de salud. Por eso es tan importante tener criterio para los casos.

Contraindicaciones para la colocación de prótesis


•Espasmos del cricofaríngeo
• Excesivas secreciones (Obturación de prótesis)
• Macrostoma
• Microstoma
• Presencia de micosis
• Fallas en motricidad fina
• Actividad laboral que obligue a tener manos libres
• Excesiva distancia de un centro urbano para control o recambio de prótesis
• Imposibilidad económica

• No debe haber un segmento faringoesofágico con hipertonía o espasmo. Esto se produce por
enfermedad neurológica (espasmo de cierre). Cuando el paciente tiene que utilizar el musculo
cricofaríngeo que está en la parte superior del esófago, puede pasar que haya un espasmo de cierre y no
salga la voz, pero tampoco va a tragar bien.
La hipertonía puede producirse porque esta tan cerrado, el cáncer fue importante y el medico cerro los
tejidos y todo está apretadamente.
• Presencia de candidiasis que destruye la zona valvulada de la prótesis (la válvula o lengüeta posterior de
la prótesis se destruye)
• Tamaño del traqueostoma, excesividad de secreciones, granulomas. Un paciente que tiene un
traqueostoma muy grande y utiliza el dedo para obturar, no puede terminar de tapar porque el
traqueostoma es muy grande. O puede que el traqueostoma es muy chiquito. Si quedo muy chiquito y
se le coloca una prótesis, el paciente siente dificultad para respirar.
Las excesivas secreciones provocan que se le tape siempre la tráquea, se le meten las secreciones por
delante hacia la prótesis.
Granulomas se producen cuando se coloca una prótesis que es un cuerpo extraño y resulta que el
paciente es alérgico a los plásticos (silicona) y forma granulaciones alrededor del traqueostoma o
alrededor de la prótesis y hay que estar curándoselas. No es un buen candidato.
• Dificultad en la obturación: El paciente tiene dificultades, no sabe hacerlo, se apura, pierde aire, destapa
antes de terminar la frase o no obtura el estoma al comenzar a hablar. A pesar de que obtenga el habla
en la primera sesión, necesita un periodo corto de entrenamiento.
* Un paciente con Parkinson, que tiene un temblor en la mano, no va a poder tapar correctamente.

Cánulas:

•Uso postoperatorio inmediato


• Mantiene el estoma abierto en pacientes con tendencia al cierre del estoma.

Esto es lo que se usa por fuera. Es una cánula que se coloca al paciente después de operado.
Hay cánulas que van con un tapón afuera que tiene agujeritos y en este tapón se coloca un pedacito de goma
espuma, esto sería par aun paciente con un laringectomía total y este tapón hace que se proteja cuando hay
demasiado viento, demasiada humedad afuera para conservar el calor de su vía respiratoria. Porque de los
36 grados de temperatura corporal, al pasar a tener un agujero abierto, baja muchísimo la temperatura y
aumentan las secreciones entonces se crean este tipo de tapones.
También hay tapones para las válvulas free-hands.

Como se coloca todo esto:


1. Primero un anillo circular de silicona que se pega al cuello, al traqueostoma
2. Se coloca luego la cánula y el tapón exterior

Filtros:

• Facilita la oclusión manual.


• Mejora la higiene.
• El aire inhalado se calienta directamente.

Conservan la temperatura y la humedad. Se coloca en el traqueostoma. Tiene una porción abierta (lo que se
ve en la parte superior del rosa) y una goma espuma para conservar la humedad.

La recomendación del filtro. Es muchísimo


mejor la temperatura a la que entra el aire
que va a los pulmones y también la humedad
porque se protege. Sino se les seca mucho la
tráquea, los bronquios y el paciente está muy
molesto. Por lo tanto si utiliza estos filtros va
a estar muchísimo mejor, por lo tanto hay
que proponérselo al paciente.
Prótesis Indwelling o Permanentes
a. Provox
b. Blom Singer

Antes se colocaban prótesis de siliconas. Luego empezaron a colocarse prótesis de silicona pero mucho más
duras. Antes eran blandas.
Vemos en la imagen de la izquierda (fondo violeta). La parte de la derecha va hacia el traqueostoma (exterior)
y a la izquierda está el lado que va hacia el interior.
Después del anillo de retención (círculos anterior y posterior de mayor diámetro) vemos la válvula o lengüeta
que se abre y se cierra para que pase el aire hacia el esófago. Esto es en la prótesis Provox.
En la Blom Singer (derecha) no se distingue donde está la lengüeta, se distingue mejor en la Provox. Estos
son los dos modelos.

Prótesis Provox Vega con tres diámetros para maximizar el flujo de aire.
No solamente las prótesis tienen distintas longitudes de 10 mm porque la pared traqueoesofágica tiene 10
mm pero pueden ser más largas o más cortas.
También pueden tener distintos diámetros. SI el paciente tiene una hipertonía del segmento
faringoesofágico porque le cerraron apretadamente los tejidos o un cáncer que hubo que sacar mucho y
cerraron apretadamente los tejidos, hay distintos diámetros para maximizar el flujo de aire.

A la prótesis Blom-Singer se le colocaron anillos de titanio. Para que salga en la rx y poder ver que este bien
colocada la prótesis.

Cepillos para limpieza:

Todos los días hay que limpiar la prótesis para limpiar las secreciones que provienen de la tráquea.

Esto sirve para echar un poco de agua y lavar la prótesis.


Free Hands: Tiene una válvula exterior que se cierra y está siempre abierta para que
el paciente pueda respirar. Se cierra para que el paciente pueda hablar. Entonces no
necesita el dedo.

VENTAJAS DE LA VOZ TRAQUEO-ESOFÁGICA:


•Fluidez de la emisión vocal sin interrupciones
• Posibilidad de comunicación rápida y eficiente

DESVENTAJAS DE LA VOZ TRAQUEOESOFÁGICA:


• Se necesita utilizar un dedo para obturar el traqueostoma en el momento de la emisión.
• Desplazamiento de la válvula.
• Alteración de la válvula (proliferación de cándida).
**importante saber bien como quedo la anatomía del paciente laringectomizado.
**Mirar muchas imágenes del pre y post.

ACLARACIONES:
• Habla esofágica es: Laringectomía total + traqueostoma
• Habla traqueoesofágica: Laringectomía total + traqueostoma + prótesis
*Tosen sin sonido, se ríen sin sonido. Más que nada se tapan para reírse pero sino es sin sonido.
24 EL PACIENTE LARINGECTOMIZADO

MODALIDAD DE ABORDAJE:
• Entrevista prequirúrgica: les ofrecen si quieren usar la prótesis o quieren quedarse con la voz
esofágica. *Las obras sociales en la actualidad tardan en proveer la prótesis y se hace una punción
secundaria y no primaria. Se lo duerme y se le hace el canal o fístula entre la tráquea y el esófago, y
para que ese canal no se cierre se le coloca una sonda.
• Rehabilitación fonoaudiológica. *Siempre.
• Reuniones de pacientes y familiares. *En este momento se hará por zoom.

ASESORAMIENTO:

− Informar sobre los diferentes métodos.


− Contactar con otro paciente laringectomizado para que escuche la nueva voz.

Segmento que vibra: Se mueve y vibra el segmento faringoesofágico, compuesto por el músculo
cricofaríngeo y los constrictores inferior y medio de la faringe.

• ¿Cómo vibra o cómo se mueve?


- 1° método: Se mueve porque uno manda hacia abajo el aire que entra por la boca, entonces vibra ese
segmento al volver el aire mandado hacia el esófago. Ej. la manera de comprobarlo es a través de eructar,
ya que se mueve ese segmento faringoesofágico. Dura un corto tiempo. (como los eructos que duran
muy poco).
- 2° método: Poner una prótesis que va de tráquea a esófago. La voz tráqueo-esofágica puede durar mucho
(TMF es largo) porque es el aire que va desde los pulmones al esófago y faringe. Y vibra ese segmento
faringoesofágico que está conformado por el m. cricofaríngeo o boca del esófago que va a producir el
sonido y tiene que estar elástico. (Puede no estar elástico cuando el médico suturó demasiado cerrado
o también cuando extirparon mucho tejido, y se produce hipertonía o espasmo de ese músculo
cricofaríngeo. Incluso por problemas neurológicos que falla cuando tiene que abrir y el músculo cierra).
- 3° método: El uso de la laringe artificial o laringófono. A veces la voz traqueoesofágica tiene muy poco
volumen o intensidad, entonces les viene bien el laringófono. Por esto, es importante asesorar al
paciente acerca de los tipos de métodos que puede elegir uno o pueden ser combinados (los 3 juntos).
− También se requiere tener una entrevista postquirúrgica durante el período de internación para
asegurar el bienestar del paciente con respecto a:
• modo de comunicación con su familia, canalizar sus dudas.
• informar sobre la importancia de la protección del traqueostoma.
• cuidados de la cánula traqueal. (no es la prótesis, es la cánula que se les pone a todos para
que no se les cierre el traqueostoma → agujero grande).
• tiempo que transcurrirá entre el postoperatorio inmediato y la rehabilitación propiamente
dicha. Va a depender del paciente y de cada caso.
− Aplicar la terapia rehabilitadora para el logro del habla alaríngea.
INICIO DEL TRATAMIENTO:
Explicar al paciente cómo era su aparato fonador antes de la cirugía y cómo es su anatomía actual.
Se perdió la encrucijada aerodigestiva que significa que ahora toma y saca aire por el traqueostoma
(mecanismo de respiración cambió), y sigue comiendo igual que antes (mecanismo de deglución no cambió).

LARINGE ARTIFICIAL:
• Uso de laringófono manual con una
diafragma vibratorio que se coloca
firmemente contra el cuello para que
funcione. (Sin embargo, luego de la
operación si ya tiene el laringófono, como
está todo vendado, se lo pone mientras en
la mejilla)
• Las vibraciones se transmiten a través de la
piel (a través de las partes blandas) hacia el
interior de la hipofaringe, hacia la boca.
• Se requiere de una buena articulación para una mejor emisión.

Desventajas:
• Requiere el uso de una mano.
• Voz robótica.

VOZ ERIGMOFÓNICA O ESOFÁGICA:


Se produce insuflando aire al esófago y luego permitiendo que este aire sea soltado, haciendo que el
segmento faringoesofágico vibre y produzca un tono que pueda ser usado como fuente sonora. Se lo llama
en algunos lugares neoglotis.

MÉTODOS PARA LA ADQUISICIÓN DE HABLA ESOFÁGICA:


• Inyección/inyección consonántica. *(ej. haga una burbuja de aire y saque una /a/ tipo eructo - tomo un
poco de aire, bajo la cabeza para que el aire se vaya un poco para atrás. Si es consonántica en vez de una
vocal es un /pa/ por ejemplo, que son más fáciles). Se puede probar con todo para ver que se le hace
más fácil.
Inyección: mediante vocales, a partir de toma de aire bucal.
Inyección consonántica: se basa en el principio de que la articulación es tanto más fácil cuando mayor sea el
número de consonantes explosivas que se utilizan: /p/ /t/ /k/, y las oclusivas /b/, /g/.
Es todo un juego de presiones, y no hay una presión transglótica porque no hay glotis, pero si hay una presión
que está en la boca y la faringe.
• Presión glosofaríngea (levantar la lengua, pegarla contra el paladar y el aire va para atrás).
La lengua forma un fuerte contacto con el reborde alveolar, presionando hacia arriba y atrás contra el
paladar. El aire es bombeado por la lengua hacia el esófago.
• Inhalación (como si fueran a tomar aire por boca pero les entra aire por traqueostoma y luego les hace
ruido). (llevar cabeza para atrás como si tomaran aire pero les entra por el agujero y cuando saquen el
sonido se va a escuchar escape por el traqueostoma). No es el mejor método pero si no le sale los otros
se hace. Se aprovechan los cambios de presión intraesofágica producidos durante los movimientos
respiratorios.
• Deglución (tragar por ejemplo soda o coca-coca y luego tratar de sacar sonido).
Es eficaz pero debe ser enseñado como facilitador únicamente, cuando no se logra sonido con los otros
métodos. De otro modo, el paciente deberá deglutir cada vez que quiera fonar.

SI OBTIENE LA VOZ ESOFÁGICA:


• Primeras sesiones trabajar con vocales, luego prolongarlas y agruparlas. (las abiertas cuestan menos)
• palabras monosilábicas
• incorporar palabras (1° bisilábicas, después trisilábicas, etc.)
• Listas de palabras.
• Frases cortas (oraciones)
• Diálogo
• Se debe practicar varias veces al día, en segmentos de escasa duración.

CUANDO NO SALE EL HABLA ESOFÁGICA:


• Habla faríngea → *la voz de pato donald.
• Enseñarle a articular claramente.
*No les sale porque pueden tener hipertonía o espasmo. Entonces está bueno que acceda a una prótesis
que facilitará tener habla esofágica.
Se puede investigar la elasticidad del segmento faringoesofágico mediante el test de insuflación, cuando el
paciente no obtiene el sonido en el entrenamiento de la voz esofágica. Asimismo para evaluar si podrá ser
un buen hablante de habla traqueoesofágica.
*Muchas veces le ponen la prótesis de una y no le hacen este test, donde en este test el aire va de la tráquea
a través del tubo a la nariz y de la nariz va hacia la faringe (rinof., orof. y hacia abajo al segmento
faringoesofágico).

VOZ TRAQUEOESOFÁGICA:
Pasaje de aire pulmonar de tráquea al esófago a través de la fístula creada por el cirujano:
• Fístula primaria: se efectúa en el mismo acto quirúrgico de la Laringectomía Total.
• Fístula secundaria: operación posterior.
La prótesis vocal que se coloca en la fístula es un tubo de silicona hueco, que se abre cuando al ocluir con el
dedo y exhalar, aumenta la P+ en la VA permitiendo el flujo de aire hacia el esófago → se activan superficies
mucosas del segmento faringoesofágico produciéndose el sonido.
*Es un tubito que un extremo da al exterior, y el otro extremo da hacia el esófago, que tiene una válvula o
lengüeta que se abre por el paso del aire, por la presión de la misma, entonces el paciente toma el aire por
traqueostoma, y cierra con un dedo para que el aire pase por la prótesis a través del tubo y va atravesando
el espacio conformado por el segmento faringoesofágico.
Si no hubiera lengüeta, el líquido que toma el paciente, si el tubo está abierto en los dos extremos, pasaría
a la tráquea, entonces tiene que tener un cierre posterior.
*A veces es mejor esperar unos días para la prótesis vocal por todo el proceso de cicatrización, a veces la
primaria es medio invasiva.

FUNCIONES DE LA PRÓTESIS:
• Mantener abierta la fístula
• Permitir que el aire pase de la tráquea al esófago.
• Prevenir la pérdida de alimento (sobre todo el líquido) o escape de fluido del esófago a la tráquea
durante la deglución.
*Nos damos cuenta que hay fallas cuando esa lengüeta no está funcionando y el paciente empieza a sentir
que pasa líquido.

La prótesis tiene una longitud apropiada.

CONTRAINDICACIONES PARA LA COLOCACIÓN DE PRÓTESIS:


• Espasmos del cricofaríngeo.
• Excesivas secreciones (obturación de prótesis).
• Macrostoma → traqueostoma inmenso que no pueda tapar con el dedo.
• Microstoma → muy pequeño el agujero, con la prótesis va a sacar espacio y le costará respirar y
estará incómodo.
• Presencia de micosis. Se les da medicación contra esto para prevenir luego de la operación, sobre
todo luego de la primaria.
• Fallas en motricidad fina, con parkinson o acv no sirven.
• Actividad laboral que obligue a tener manos libres.
• Excesiva distancia de un centro urbano para control o recambio de prótesis.
• Imposibilidad económica.

VENTAJAS DE LA VOZ TRAQUEOESOFÁGICA:


• fluidez de la emisión vocal sin interrupciones
• posibilidad de comunicación rápida y eficiente

DESVENTAJAS DE LA VOZ TRAQUEOESOFÁGICA:


• se necesita utilizar un dedo para obturar el traqueostoma en el momento de la emisión
• desplazamiento de la válvula
• alteración de la válvula (proliferación de cándida)
*Ahí nomás que el paciente es fisturizado se le coloca la sonda. Ahí nomas que se le saque la sonda y se
coloque la prótesis, hay que enseñarle a tapar y que saque sonido. No hay que esperar. VER QUE LA PRÓTESIS
FUNCIONA.

DIFERENTES LONGITUDES:
Se debe medir el grosor de la pared traqueoesofágica antes del cambio de prótesis. Si la fistulización y
colocación ha sido en forma primaria, es posible que la segunda prótesis tenga que ser más corta. (si es muy
larga, el paciente tapa y la prótesis se va para atrás, y cuando come la prótesis puede irse para adelante, y
ese movimiento produce que se le abra un poco el diámetro de la fístula y cuando trague filtre líquido
alrededor de la prótesis). (Incluso si se tapa la prótesis larga, y se dirija para atrás le dé sensación de querer
toser, porque en vez de llegar solo a la pared anterior del esófago, llega hacia atrás y molesta).

El cambio de prótesis es fácil. Se le coloca una cápsula de gelatina en la pared posterior


que se disolvía en 3 minutos y la prótesis, en su extremo posterior se abría. Hoy pueden
usar otros métodos.

La prótesis tiene una lengüeta larga que va hacia el cuello, y la parte de arriba es el anillo de retención, y es
ahí donde se colocaba una cápsula, y luego se abría la prótesis.
Hoy en día hay colocadores en la parte posterior que luego se saca y ahí se amplía la prótesis.

También existe la prótesis provox. donde en la lengüeta tiene una división y se corta un extremo.

CÁNULAS, donde el de la derecha tiene agujeros


(cánula fenestrada) que sirven para poder enseñarle a hablar,
para que pase aire por la cánula, el paciente tapa la cánula y
el aire va del exterior a la prótesis. Si es el de la izquierda, no
va para ponerlo con una prótesis porque no pasa aire a la
prótesis.
Los primeros 3
meses tiene que usar cánula, y después si el agujero tiende a
cerrar, tiene que usarla de noche. HAY QUE SEGUIR AL
PACIENTE. La cánula no se engancha en la prótesis, se saca y se
coloca para limpieza, etc.
Cuando el paciente puede comprarlo. Se compran estos filtros,
que calientan y mejora la higiene de la cánula.
SELECCIÓN DE PACIENTES PARA ESTE MÉTODO - LA PRÓTESIS:
• Buena comprensión para entender el manejo del sistema
• cercanía de un centro de salud
• cobertura social para la adquisición de la prótesis
• ocupación laboral que no obligue al paciente a tener las manos ocupadas
• buena elasticidad del segmento faringoesofágico (no con hipertonía)
• buena psicomotricidad y visión (para que pueda taparse y poder verse para limpiarse de manera
independiente)
• no sufrir de enfermedad pulmonar severa con abundantes secreciones (porque se le meten en la
cánula, o en la prótesis, o porque tose de tal manera que se sale la prótesis).

DURACIÓN DE LA PRÓTESIS:
En general alrededor de 12 meses, aunque hay pacientes que han referido una duración de hasta 15 meses.

CEPILLOS PARA LIMPIEZA:


Va dentro de la prótesis y se gira para limpiarla. Se puede meter agua dentro de la prótesis pero hay que
tener cuidado porque se puede ir a la tráquea.

FREE HANDS:
Válvula que se abre y cierra sola. Es para pacientes que ya no usan la cánula. Hay
pacientes que no la toleran.
Por juego de presiones la lengüeta se abre y cierra. Cuando no habla, la válvula
está cerrada que permite que respire. Es muy cara.

El paciente pierde olfato porque entra menos aire por la nariz. Se recupera a partir del mecanismo de
inhalación (y no va a entrar como antes, por cambio de presiones), pero el olor va a entrar, entonces se
trabaja con café, o aromas fuertes, porque si no pierde el olfato.

EJERCICIOS PARA FAVORECER EL OLFATO:


• Utilización de esencias y fragancias fuertes.
• ejercitar la discriminación olfativa.
• sugerir una rutina para el hogar, de reconocimiento de distintos aromas.

TERAPIA FÍSICA POSTERIOR A LA CIRUGÍA:


• Mantener una buena postura → enderezar los hombros e inclinar levemente el mentón hacia el pecho.
• No cargar peso en el inicio, para cualquier método.
• Practicar movimientos de cabeza, cuello, elevación de brazos, de hombros, acercamientos de omóplatos,
ejercicios respiratorios.
• Trabajar físico en general: Caminar, gimnasia.

INDICACIONES PARA EL PACIENTE Y SU FAMILIA:


• Sugerir al paciente la consulta psicológica para sobrellevar la pérdida de la laringe, y los cambios en su
vida social, familiar y principalmente su intimidad y sexualidad con su pareja.
• Respecto al regreso al trabajo, aparece el miedo al rechazo por traqueostoma, o a la nueva voz.
• La decisión de no retornar a la actividad laboral y tramitar un certificado de discapacidad es angustiante.

INDICADORES PARA EL CUIDADO PERSONAL:


• Utilización de protectores para el cuello, filtros para mantener la temperatura y humedad.
• Humidificar el hogar con un vaporizador.
• Mantener el estoma libre de secreciones.
• Darse los gustos, actividades que durante el periodo laboral no tenía tiempo.

También podría gustarte