Está en la página 1de 21

Journal of Voice, Vol. ■■, No.

■■, 2016

EVALUACIÓN DE LA VIBRACIÓN VOCAL CON IMAGEN LARÍNGEA.


Configuración: Confiabilidad de evaluación estroboscópica
usuarios confían y de
en el software cuantitativo, o
videoendoscopía de alta velocidad que los médicos consideran que el HSV
Bruce J. Poburka, †Rita R. Patel, and ‡Diane M. Bless, todavía es Minnesota,
*Mankato, experimental. Sin importar
†Bloomington, la
Indiana, and
‡Madison, Wisconsin

Introducción
La estroboscopía y videoendoscopía de alta justificación subyacente, la falta de
velocidad (HSV) revela información sobre la estandarización es una problemática, ya que el
compleja interacción entre las estructuras HSV se está utilizando cada vez más en
laríngeas, fuerzas aerodinámicas, la mecánica clínicas de voz como un medio para superar
de los tejidos y patrones de uso muscular. En algunos de los desafíos que surgen de la
teoría, los resultados obtenidos de la mecánica videoestroboscopía, como la mala resolución
vibratoria desde la estroboscopía y HSV, temporal y la pobre extracción del tono o el
pueden ser evaluados cuantitativa y rastreo de las voces severamente alteradas. El
cualitativamente, sin embargo, tienen sus aumento de la resolución temporal del HSV en
limitaciones. Las evaluaciones cuantitativas del comparación con la estroboscopía (por
videoestroboscopía y HSV están disponibles, ejemplo, 8000 pfs frente a 30 fps), puede
pero no han sido ampliamente adoptados en la utilizarse para capturar fenómenos vibratorios
clínica, ya que el software desarrollado a en individuos con trastornos graves de la voz.
medida no está disponible y es demasiado Sin embargo, sin estándares y confiabilidad de
lento para la mayoría de las prácticas clínicas calificación, el potencial de HSV para superar
diarias. La evaluación cualitativa, está llena de las fallas estroboscópicas no puede ser
problemas debido a la falta de estándares para completamente realizado. Se acepta, que para
la comparación intra e inter institucional y los que las clasificaciones perceptuales visuales
juicios intra e interdisciplinarios. sean significativas, deben alcanzar niveles
Sin embargo, para propósitos clínicos, los satisfactorios de inter e intra confiabilidad. Se
juicios cualitativos son utilizados dice que numerosos factores relacionados con
frecuentemente. La evaluación de la imagen el evaluador- y escalas psicométricas- influyen
laríngea, a través de la vía visual-perceptual de en las clasificaciones visuo-perceptuales de la
los marcadores anatómicos y los parámetros imagen laríngea; sin embargo, solo unos pocos
de movimiento que reflejan tanto la estructura han sido sometidos a investigaciones
como la función de los pliegues vocales, empíricas para una clasificación visoperceptiva
continúa siendo comúnmente utilizada. en la videoestroboscopía. Por razones de
Aunque, muchas formas visual-perceptuales investigación, Rosen, evaluadores limitantes
se han desarrollado a priori como un sugestivos para individuos con una
instrumento para calificar la confiabilidad mayor que 0.80 interevaluador, y
que se tome en cuenta la evaluación
videoestroboscopía, casi ninguna existe para estadística previa al estudio de la variabilidad
HSV. Esto se puede deber quizás, a que la de los datos. Clínicamente, se ha mencionado
tecnología del HSV es usada con menos que la capacidad de las valoraciones
frecuencia que la videoestroboscopía, que los visoperceptuales han mejorado con una serie
1
Journal of Voice, Vol. ■■, No. ■■, 2016
de factores, como el uso de un formulario de fueron escogidos de aquellos acostumbrados a
calificación computacional, el uso de un valor por videoestroboscopía, a pesar que las
método de rastreo de grillas calibrado, y diferencias resultantes desde el mejoramiento
mediante el control de factores como la de la resolución que dicta diferencias en la
descripción clara de los parámetros de imagen observación; y (2) evaluadores, quienes a
y un entrenamiento al evaluador. Poburka y menudo tienen una formación de observación
Bless, mencionan que después de 4 a 5 horas limitada para utilizar HSV. En consecuencia,
entrenamiento con una calificación mantenemos que el primer paso en la
computarizada, los sujetos sin experiencia investigación sistemática de los factores que
previa con la calificación de videos influyen en las clasificaciones perceptuales
estroboscópicos completaron clasificaciones visuales del HVS, es el desarrollo de una
que se correlacionaron altamente con las de forma estandarizada y la capacitación del
los expertos. A pesar de décadas de uso de la evaluador. Una vez que sean logrados,
videoestroboscopía en la clínica, todavía estudios consecuentes podrían investigas
existen estándares para los parámetros de factores específicos de influencias como el tipo
calificación o confiabilidad del juicio clínico, ya de patología, la experiencia clínica y la
que las formas existentes varían en la información concurrente obtenida del historial
combinación de los parámetros utilizados. Las clínico y la señal auditiva.
escalas de clasificación que usan los
Para mitigar los problemas discutidos
formularios también varían desde ser una
anteriormente, en este documento, una nueva
escala de calificación de tres puntos hasta ser
forma de calificación y un protocolo de
una escala de calificación de cinco puntos.
capacitación que incorpora clasificaciones
Además, los formularios disponibles están
visoperceptuales tanto de la
limitados por la falta de una definición clara de
videoestroboscopía como el HSV. Esta nueva
los parámetros de la imagen, la capacitación
herramienta visoperceptuales se denomina
estructurada y el sesgo del observador.
“Protocolo de evaluación de la voz vibratoria
Para un mejor entendimiento, la literatura es con imágenes laríngeas” (VALI). El protocolo
escasa sobre el desarrollo de formas de VALI fue desarrollado como una actualización
clasificación visoperceptuales y aspectos del “Protocolo de examinación
relacionados con mejorar la confiabilidad de estroboscópica”. El protocolo y el
clasificación utilizando video de alta velocidad. entrenamiento son inseparables. Juntos, tienen
El HSV ha sido utilizado para evaluar las una serie de características que están
características vibratorias en sujetos sanos y destinadas a mejorar la confiabilidad de las
en varias patologías vocales; y para diferenciar clasificaciones tanto para la estroboscopía
a individuos con voz sana de aquellos con como para el HSV. Para cada parámetro de
patologías vocales, pero la confiabilidad de calificación, las características del protocolo
una calificación cualitativa ha variado VALI son: (1) una definición de lo que se está
ampliamente, así como los juicios perceptivos valorando, (2) instrucciones de calificación que
de la evaluación auditiva. Se requiere un alto es exclusiva del parámetro, (3) gráficos de alta
grado de confiabilidad para la generalización calidad para ilustrar el fenómeno estructural o
de los hallazgos. Aunque, puede haber vibratorios que se está evaluando, y (4)
múltiples factores que contribuyen a la muestras de video (utilizadas con
varianza, dos factores probables son (1) los capacitación). El propósito del estudio actual,
parámetros de calificación, que a menudo fue evalúa la confiabilidad de calificación entre
2
Journal of Voice, Vol. ■■, No. ■■, 2016
e intra evaluadores que utilizan el protocolo y fueron capturadas utilizando PENTAX Medical
entrenamiento para utilizar videoestroboscopía (Montvale, NJ) modelo RLS 9100b
y videos en alta velocidad. El propósito del (estroboscopio con cámara) y 9710 (sistema
estudio es valorar la confiabilidad en la de video de alta velocidad con cámara)
evaluación utilizando el VALI intra e inter respectivamente. Las grabaciones se
evaluador con videoestroboscopía y HSV. La capturaron mientras los participantes
confiabilidad inter e intra evaluador fue realizaban la fonación de una /i/ sostenida en
evaluada secuencialmente obteniendo su tono e intensidad habitual. Un endoscopio
grabaciones de videoestroboscopía y HSV rígido de 70 grados fue utilizado para hacer las
siguiendo los siguientes parámetros: amplitud, grabaciones. No fue utilizada anestesia local
onda mucosa, porción no vibratoria, actividad por ningún participante. Las grabaciones con
supraglótica, fase de cierre, simetría, videoestroboscopía fueron capturadas en 30
periodicidad, cierre glotal, nivel de verticalidad, cuadros por segundos con resolución espacial
y contorno libre de la cuerda vocal. de 640x480 pixeles, mientras que la grabación
en blanco y negro con HSV fue capturada en
Método
4000 cuadros por secundo con una resolución
Un total de 30 (hombre=10, mujeres=19, niños espacial de 256x512 pixeles. Las grabaciones
=1) participantes con disfonía proporcionar en HSV fueron capturadas utilizando cámara
muestras de videos para el estudio. Los en blanco y negro en vez de cámara a color.
participantes con disfonías fueron reclutados Las grabaciones de HSV y de
por la Universidad Clinica de fisiología vocal de videoestroboscopía fueron capturadas durante
Kentucky e laboratorio de imagen, posterior a la misma visita utilizando: las mismas
la finalización de la junta de revisión instrucciones, posición física, y endoscopio.
institucional aprobó los formularios de
consentimientos informados. El rango de edad
de los participantes fue entre 10 y 80 años, con Evaluadores
una media de edad de 49.8 años. Table 1
Basado en el poder de análisis, se determinó
característica de los participantes en términos
que era necesario que los evaluadores
de edad, género, y patología vocal. Se realizó
tuvieran el poder suficiente para abordar las
una evaluación inicial acústica perceptual a los
preguntas planteadas. El poder de análisis
participantes a través del GRBAS (Grado,
indica que existe un 80% de posibilidad de
Ronquera, soplosidad, astenia y tensión).
detectar una diferencia significativa de 0.05 de
Cada parámetro del GRBAS fue calificado
nivel de significancia con nueve evaluadores.
utilizando una escala de 4 puntos donde 0=
Nueve patólogos de lenguaje y habla fueron
normal, 1= leve anormalidad, 2= anormalidad
reclutados para servir como evaluadores.
moderada, y 3= anormalidad severa. Los
Estos profesionales evaluaron inicialmente el
participantes fueron colocados en diferentes
patrón vibratorio de las cuerdas vocales,
grupos dependiendo del grado de su disfonía
incluyendo los movimientos, la sincronización
(G): 0, n=3; grado 1, n=6; grado 2, n=9; y
del patrón y juicio sobre el cierre glotal.
grado 3, n=12. Los participantes con un grado
Además, pudieron necesitaron muchas horas
0 tienen quejas principalmente de esfuerzo
para completar el entrenamiento y las
vocal, fatiga vocal, o dificultad con las notas
clasificaciones. El promedio de experiencia de
altas al cantar.
los evaluadores con imagen laríngea fue de
Las grabaciones de videoestroboscopía y HSV
3
Journal of Voice, Vol. ■■, No. ■■, 2016

Evaluación de la voz-vibratoria con imágenes laríngeas (VALI)- estroboscopia


Poburka, B., Patel, R., y Bless, D. 2016
Caso #: Confirmar caso #:

4
Journal of Voice, Vol. ■■, No. ■■, 2016

12.8 años, con un rango entre 2-25 años.


Ninguno de los autores participo como
evaluador para el estudio. Antes de participar
en el estudio, la experiencia de los

5
Journal of Voice, Vol. ■■, No. ■■, 2016
evaluadores evaluaciones visuo perceptual fue aprobación antes de participar en el estudio.

exclusiva con videoestroboscopía; ninguno


tenía experiencia con el HSV. Todos los
evaluadores completaron un consentimiento de
6
Journal of Voice, Vol. ■■, No. ■■, 2016

7
Journal of Voice, Vol. ■■, No. ■■, 2016

8
Journal of Voice, Vol. ■■, No. ■■, 2016

Entrenamiento a los evaluadores


Un grupo de entrenadores fueron los
encargados de entrenar a los evaluadores para
usar el VALI. Dos tipos de entrenamientos
9
Journal of Voice, Vol. ■■, No. ■■, 2016
estuvieron disponibles: uno fue presencial, y basada en los parámetros sugeridos en la
otro fue realizado vía online a través de video literatura y que se utilizan habitualmente al
conferencia. 5 evaluadores realizaron el realizar calificaciones visoperceptuales. La
entrenamiento presencial, mientras que 3 duración del entrenamiento duro entre 2 a 2,5
completaron el entrenamiento online, y un horas.
evaluador completó su entrenamiento con una
Proceso de Evaluación
combinación de ambas formas.
Independientemente de la forma, en ambas se Los evaluadores fueron cegados al diagnóstico
utilizó materiales idénticos, los mismos y a la clasificación del GRBAS y fueron no
expositores, y similar duración de las sesiones. fueron familiarizados con la forma de
calificación antes del entrenamiento. Las
El entrenamiento requirió definir cada
evaluaciones se realizaron en fonaciones
parámetro, proporcionando muestras de videos
sostenidas. Para hacer que los videos sean lo
de los puntos finales para cada característica
más comparables posibles, la fonación
tanto para estroboscopía como para el HSV,
sostenida de un tono y volumen habitual fue
entregando instrucciones para el uso del VALI,
segmentada tanto en las grabaciones
y oportunidades para realizar preguntar en una
estroboscópica como en las de HSV. Todas las
discusión abierta acerca del proceso de
grabaciones tenían una vista completa de la
evaluación. Por cada parámetro, a los
glotis sin obstrucción epiglótica.
evaluadores se les proporciono una definición
y un video como ejemplo del final de cada
punto para cada característica.

Los parámetros escogidos para la clasificación


estroboscópica y la grabación de HSV fue
10
Journal of Voice, Vol. ■■, No. ■■, 2016
identificadas y al azar con desordenes vocales.
Ninguno de los casos fue repetido durante las
sesiones de entrenamiento. Cada caso
Al concluir el entrenamiento, se les consiste en un par de videos, un que fue
proporcionó a los evaluadores un folleto con la grabado con estroboscopio y otro con HSV,
calificación de cada caso, las instrucciones resultando un total de 60 videos. La
para acceder a los videos en línea a través de presentación de los 60 archivos fue aleatoria.
un enlace seguro, sugerencias para entorno de Los evaluadores evaluaron un total de 66
evaluación y ritmo, e información de contacto
secuencias de videos aleatorios. Para
del investigador principal.
propósitos de confiabilidad de intrajueces, el
Las grabaciones HSV tienen una reproducción 10% (3 casos, 6 videos) fueron repetidos y
estimada de 20 cuadros por segundo, mientras distribuidos aleatoriamente entre los 60 videos,
que la grabación estroboscópica fue de 30 resultando un total de 66 videos. Se
cuadros por segundo. Ya que la vista del HSV proporcionaron dos formularios por separado
requiere de un cuadro más lento, es imposible para cada uno de los 33 videos, un formulario
colocar simultáneamente el audio con para la videoestroboscopía y el otro para las
grabaciones en HSV de 20 cuadros por
grabaciones de HSV. Los siguientes
segundos. Por lo tanto, para poder realizar
parámetros fueron evaluados para la
grabaciones comparables entre el HSV y la
calificación de las grabaciones de
videoestroboscopía el audio de este último
videoestroboscopía: cierre glótico, amplitud,
fueron desactivados.
onda mucosa, nivel de verticalidad, porción no
La eliminación del audio de la vibratoria, actividad supraglótica, contorno libre
videoestroboscopía también evitaría cualquier de la cuerda vocal, periodicidad, simetría, y
influencia o sesgo adverso de la calidad de la fase de cierre. La clasificación de HSV se
voz durante evaluación visoperceptuales de las
características vibratorias.

Los evaluadores accedieron a los videos vía


online desde una página segura que les fue
otorgada solo a ellos. Había 30 voces no realizó en los siguientes parámetros: cierre
11
Journal of Voice, Vol. ■■, No. ■■, 2016
glotal, onda mucosa, amplitud, nivel de del evaluador sobre la evaluación de la onda
verticalidad, porción no vibratoria, actividad mucosa y otro que buscaba aclaraciones sobre
supraglótica, contorno libre de la cuerda, la naturaleza de la calificación de la porción
periodicidad del ciclo glotal, simetría, y fase de vibratoria.
cierre. También ambos formularios proveen de Análisis estadísticos
un espacio para informar observaciones no
vibratorias (varices, edema, hemorragia, etc) y Todas las calificaciones fueron ingresadas a
cualquier tipo de observación que no necesite una hoja de cálculo utilizando Excel Microsoft.
Para los parámetros con dato de escalas
análisis estadístico ya que el objetivo del
(amplitud, onda mucosa, porción no vibratoria,
estudio fue evaluar la confiabilidad inter e intra
actividad supraglótica, simetría y periodicidad
evaluador en nueve parámetros reportados
de las cuerdas vocales), fueron ingresadas
comúnmente en la estructura y función del directamente sin modificaciones. Para
plegamiento vocal. Por cada parámetro, el parámetros con datos nominales (cierre glotal,
nivel de verticalidad, y contorno libre de la
formulario provee una pequeña definición,
cuerda vocal), fueron convertidas utilizando un
gráfico en alta calidad, y/o una secuencia de
esquema de codificación para facilitar el
imágenes sacadas desde el video. El protocolo
análisis estadístico. El esquema de
de estroboscopio está en color, mientras que el codificación asignado fue un número a cada
HSV está blanco y negro acorde a la grabación posible calificación. Por ejemplo, una
que también será de las mismas tonalidades. calificación de cierre glotal “completo” se
En los casos en que los evaluadores no codificó con el número 1. En el parámetro de
pudieron especificar los parámetros porque el fase de cierre se requiere que los evaluadores
estroboscopio presentaba errores o había deben colocar una marca # a lo largo de una
alguna obstrucción fisiológica (compresión de escala continuo que va des “predomina la fase
las bandas ventriculares, adelantamiento de abierta” hasta “predomina la fase cerrada”.
los aritenoides, etc.) los evaluadores fueron Para convertir la localización de la marca a la
instruidos para escribir “no se puede observar” escala de datos, se creó una superposición
para especificar el parámetro. transparente para permitir la localización de la
marca y convertirla en número. La escala
Las clasificaciones fueron hechas a su propio sobre superposición califica desde +10
ritmo hasta que todas las clasificaciones fueron (predomina la fase de cierre) a -10 (predomina
hechas. El periodo de clasificación no fue la fase de apertura). El punto medio de la
regulado; el tiempo desde el entrenamiento escala fue cero, el cual corresponde a “casi
hasta la finalización de las calificaciones osciló igual”.
entre varias semanas y varios meses
Las calificaciones para la confiabilidad de
dependiendo del evaluador. Si se encontraron
intrajueces fue evaluado usando el programa
preguntas de calificación o dilemas, se ordenó
SPSS Statistics 22 (IBM, Armonk, NY). Los
a los evaluadores que contactaran a los
parámetros de amplitud, onda mucosa, porción
autores para aclarar los procedimientos de
no vibratoria, actividad supraglótica, fase de
calificación, pero no se proporcionó ningún
cierre, simetría, y regularidad producida en una
asesoramiento específico de un caso. Solo uno
escala de datos. Fueron evaluados con
de los evaluadores tuvo una pregunta: uno
correlación intraclase (ICC). Estas estadísticas
relacionado con la incertidumbre de larga data
se eligieron para medir la confiabilidad entre
12
Journal of Voice, Vol. ■■, No. ■■, 2016
los nueve evaluadores porque analiza los
datos que están estructurados como grupo y
Resultados
no como observación pareada.
En el estudio actual, el 40%-85% de los casos
Las calificaciones del cierre glotal, nivel de
involucró dificultad de calificación donde uno o
verticalidad, y contorno libre de la cuerda
vocal, producen datos nominales. En más evaluadores no pudieron calificar un
consecuencia, la estadística de Fleiss kappa parámetro (indicado “no se puede observar”)
fue utilizada porque medie la confiabilidad de debido a errores de seguimiento del
las calificaciones para un número fijo de estroboscopio u obstrucciones resultantes de
evaluadores que están asignando sus anormalidades o compensaciones. Cuando un
observaciones a las categorías. La evaluador es incapaz de completar una
confiabilidad intra jueces fue evaluada con el calificación, the ICC requiere omisión del c aso
estadístico Spearman rho para parámetros con desde el análisis, por la falta de valores en al
datos de escala. Spearman rho en una prueba menos uno de los parámetros. La eliminación
no paramétrica que no supone que los datos de listas redujo el tamaño de la muestra para
se distribuyan normalmente como fue el caso la confiabilidad entre jueces. El tamaño de
en este estudio. Los parámetros con datos muestra reducido, aumentó el ancho del
nominales requerían una prueba no
intervalo de confianza. Para los parámetros
paramétrica. En consecuencia, se evalúo el
seleccionados, el IC fue demasiado amplio
acuerdo entre jueces utilizando el porcentaje
para permitir una interpretación válida o las
de concordancia. Este es un recuente simple
de la frecuencia con que los jueces lograron un correlaciones deben interpretarse con
acuerdo exacto con ellos mismos al calificar el precaución. Los cuatro parámetros afectados
mismo caso dos veces. fueron (1) amplitud (izquierda y derecha), (2)
onda mucosa (izquierda y derecha), (3)
actividad supraglótica (mediolateral), (4)
porción no vibratoria (izquierda). La
confiabilidad entre jueces para los parámetros
con datos de escala varió de 0.57 a 0.96 para
la estroboscopia y de 0.81 a 0.94 para el HSV.

Los parámetros de HSV (n = 11) con


datos de escala mostraron ICC que eran
muy fuertes, lo que indica un fuerte
acuerdo entre los evaluadores. Con la
estroboscopia, la amplitud (derecha), la
onda mucosa (derecha) y la onda mucosa
(izquierda) mostraron una ICC moderada;
la amplitud (izquierda), la parte no
vibratoria (izquierda) y la actividad
supraglótica (mediolateral) mostraron
una fuerte ICC; y el resto de los
parámetros mostró ICC muy fuerte. La
13
Journal of Voice, Vol. ■■, No. ■■, 2016
significación estadística (P ≤ 0.05) fue valores moderados de la correlación de
alcanzado para todos los parámetros Spearman rho coeficiente, mientras que
independientemente del método de la correlación fue fuerte para el
imagen, indicativo de consistencia parámetro de la parte no vibratoria
(conformidad) de las (derecha) y fue muy fuerte para el
parámetro de la parte no vibratoria
(izquierda). Para los parámetros con
datos nominales (n = 4), el porcentaje de
concordancia varió del 44% al 78% para
la estroboscopia y del 52% al 89% para
HSV.

mediciones realizadas por múltiples


evaluadores. Para los parámetros
nominales (n = 5), las correlaciones
variaron de 0.18 a 0.35 para la
estroboscopia y de 0.13 a 0.33 para HSV.
Las correlaciones de confiabilidad intra-
juez para los parámetros con datos de
escala (n = 11) variaron de 0.19 a 0.87
para la estroboscopia y de 0.28 a 0.85
para el HSV. La significación estadística
(P ≤ 0.05) se logró para 7 de 11
parámetros en estroboscopia, mientras
que se alcanzó la significación para 9 de
11 parámetros para HSV. En la
estroboscopia, cinco de los siete
parámetros (amplitud-derecha, amplitud-
izquierda, onda-derecha de la mucosa,
cierre de fase y regularidad) alcanzaron
14
Journal of Voice, Vol. ■■, No. ■■, 2016
más alta que la de nuestro estudio anterior que
compara videoestroboscopía con HSV. Este
hallazgo único de alta confiabilidad intra e intra
juez de HSV en comparación con la
videoestroboscopía se puede atribuir a una
formación específica y a definiciones claras de
los parámetros en el formulario. En Patel et al,
23 un total de 126 participantes (252 videos)
fueron evaluado usando clasificaciones
visoperceptuales por tres evaluadores para
investigar el valor clínico de HSV. A pesar de
que Patel et al, el estudio tenía un mayor
número de casos, las formas de calificación
eran simples escalas de calificación analógica
categórica o visual en blanco y negro sin
definiciones claras en los formularios de
calificación. Además de la claridad de la forma
de calificación, la mayor confiabilidad en este
estudio podría atribuirse a una mayor tasa de
muestreo de 4000 fps en comparación con
2000 fps en el estudio de Patel et al. Deliyski et
al37 informaron que la clasificación visual-
perceptual del parámetro "borde glotal" no fue
Discusión afectados a tasas de fotogramas de 4000 o
más, y los parámetros de onda mucosa,
Este estudio reveló que la forma y el
aperiodicidad y contacto de pliegue vocal se
entrenamiento de VALI pueden usarse para
vieron afectados mínimamente entre 4000 y
hacer juicios clínicos confiables de al menos 8
5333 fotogramas por segundo, en un estudio
de 15 parámetros en estroboscopia y 11 de 15
en el que tres evaluadores evaluaron a 14
parámetros en grabaciones de video de alta
pacientes y 14 controles con HSV en
velocidad. En comparación con la
reproducciones de 60 y 30 fps. Aunque existen
estroboscopia, HSV tuvo niveles más altos de
diferencias sutiles en la definición de los
confiabilidad entre jueces y jueces
parámetros entre el estudio actual y el estudio
intraparoscópicos para casi todos los
de Deliyski et al 37, se obtuvo una alta
parámetros. Este hallazgo es similar al
confiabilidad intraevaluador comparable para la
hallazgo de un mayor acuerdo entre jueces
onda mucosa, la regularidad y cierre glotal en
para el VHS (54%) en comparación con la
el estudio actual utilizando HSV capturado a
videoestroboscopía (42%) informado por
4000 fps con una reproducción de 20 fps. En el
Olthoff et al. Olthoff et al no informaron la
estudio actual, cuando se comparó el HSV con
confiabilidad intrajueces.
la estroboscopia, hubo considerablemente
Además, los valores de interjueces e menos casos en los que los evaluadores no
intrajueces la confiabilidad en este estudio es pudieron evaluar un parámetro cuando usaron
15
Journal of Voice, Vol. ■■, No. ■■, 2016
HSV. Es probable que la discrepancia esté disfonía en la clasificación GRBAS para los
relacionada con las diferencias en la forma en casos difíciles de clasificar fue 1,75, lo que
que las dos técnicas obtener imágenes. Con sugiere que las dificultades no fueron creadas
HSV, no hay dependencia de la extracción de por disfonía severa.
tono, y la resolución temporal es muy alta. Con
la estroboscopia, el seguimiento adecuado De hecho, los parámetros con las instancias
más altas de dificultad de clasificación fueron
depende de la extracción exacta de tono, y la
la actividad supraglótica-mediolateral y
resolución temporal es menor porque las
anteroposterior. En estos casos, la experiencia
imágenes se obtienen mediante muestreo. En
previa con la estroboscopia puede haber
consecuencia, la estroboscopia es más introducido algún sesgo sobre cómo se juzgó
propensa a los problemas cuando la disfonía la compresión supraglótica. Con la
moderada a grave o severa interfiere con el estroboscopia, el video se puede reproducir en
seguimiento. En este estudio, cuando tres o tiempo real, mientras que debido a la alta
más evaluadores no pudieron evaluar al resolución temporal de HSV, los videos deben
menos un parámetro mediante estroboscopia, verse a una velocidad de reproducción lenta de
el grado general promedio de disfonía en la 10 a 30 fotogramas por segundo. Esta alta
escala GRBAS fue de 2.92, lo que resolución temporal de HSV puede haber sido
corresponde a disfonía moderada a severa o un obstáculo, porque los movimientos de las
severa. El corte de tres o más evaluadores de estructuras supraglóticas son muy lentos en
un total de nueve evaluadores se determinó comparación con movimiento de la cuerda
empíricamente para calcular el grado general vocal. En consecuencia, la actividad
supraglótica puede no ser aparente porque se
de disfonía, ya que sería poco probable que
necesitarían muchos cuadros de video para
factores únicos de un evaluador individual
apreciar el movimiento lento de las estructuras
pudieran ser un factor para la calificación "no
supraglóticas. Además, debido a que la
se podía evaluar". parámetros con instancias experiencia previa de los evaluadores fue solo
más altas de dificultad de calificación en con estroboscopía, el movimiento muy lento
estroboscopia eran la onda de la mucosa estructuras supraglóticas pueden haber sido
(izquierda y derecha), la parte no vibratoria una desviación espectacular de su experiencia
(izquierda y derecha), la amplitud (izquierda y previa y las expectativas de cómo se ve el
derecha), el cierre de fase, la simetría y la movimiento supraglótico, lo que sugiere que se
regularidad. Estos parámetros reflejan todos incluyan instrucciones adicionales en la
los aspectos dinámicos del movimiento capacitación sobre este parámetro.
vibratorio de los pliegues vocales en Comparado con estudios previos que
comparación con los parámetros estáticos evaluaron videoestroboscopía las formas de
como borde vibratorio y son consistentes con calificación, se lograron correlaciones más
los hallazgos reportados por Patel et al, lo que fuertes usando el VALI, en particular para los
sugiere que el HSV podría ser mejor que la parámetros de cierre de fase y
regularidad18,20. Poburka y Bless18
estroboscopia para evaluar la onda mucosa, la
informaron correlaciones de 0,54 y 0,71 para el
amplitud, el cierre de fase, la periodicidad y la
cierre de fase y la regularidad,
flexibilidad del tejido en casos con disfonía
respectivamente. En el estudio actual, las
severa. Cuando la dificultad de clasificación se correlaciones fueron 0.88 y 0.96. Rosen20
experimentó con el VHS, el grado promedio de
16
Journal of Voice, Vol. ■■, No. ■■, 2016
informó una correlación de 0.58 para la durante el examen. La categoría de "cierre
duración (cierre de fase en el estudio actual) y variable" no fue una de las opciones para los
correlaciones de 0.37 y 0.46 para la patrones de cierre glotal. Modificaciones
periodicidad de los dobleces vocales derecho e apropiadas en el formulario de calificación y
izquierdo, respectivamente (regularidad en el capacitación El protocolo debería mejorar las
estudio actual). Debido a que todos estos correlaciones para el cierre glotal. Para el nivel
estudios emplearon alguna forma de de verticalidad, las correlaciones se
entrenamiento, postulamos las correlaciones atribuyeron a variabilidad insuficiente en los
más fuertes en el estudio actual puede casos de video para este parámetro. Para un
deberse, al menos en parte, a las ilustraciones contorno de borde libre, los evaluadores
gráficas de VALI y al entrenamiento específico informaron que este parámetro es difícil de
de la forma. Los gráficos ayudaron a ilustrar evaluar porque el entrenamiento exigía que el
los patrones temporales y temporales borde se calificara durante la abducción del
complejos asociados con los parámetros que doblez vocal o respirando. Sin embargo, las
se deben calificar. El entrenamiento específico muestras de video proporcionadas para las
fue proporcionado antes de la calificación con clasificaciones no incluyeron ninguna vista de
discusión para ayudar a asegurar que todos secuestro y está hecho calificación del
los evaluadores estuvieran buscando las contorno del borde libre difícil. Los parámetros
mismas características. Además, la presencia de la onda mucosa y la parte no vibratoria
de definiciones claras de parámetros de tuvieron un gran número de casos en los que
formulario de calificación, incluidas las los evaluadores no pudieron calificar un caso,
indicaciones en cuanto a qué tarea facilita la especialmente para la estroboscopia. Entre el
calificación (p. ej., la tarea de fonación normal 61% y el 85% de los casos se excluyeron del
de tono normal para el cierre glotal, pliegues análisis para estos parámetros. Esto era
vocales completamente abducidos para el probable debido a problemas con la resolución
contorno de borde libre), podrían ser razones temporal y el seguimiento que resultó de una
adicionales para las correlaciones más fuertes disfonía grave.21,23 En el estudio actual,
para las calificaciones videostroboscópicas en aproximadamente el 40% de los participantes
comparación con estudios previos. recibió un grado auditivo perceptual de 3, lo
Inesperadamente, se obtuvieron correlaciones que indica disfonía severa y 30% presentó
entre jueces débiles para cierre glotal, nivel disfonía moderada. En nuestro estudio
vertical y contorno de borde libre en ambas anterior, el 100% de los participantes con
técnicas. Debido a que los evaluadores disfonía severa y el 64% de los participantes
tuvieron todas sus preguntas abordadas con disfonía moderada no pudo ser juzgado
durante el período de entrenamiento y sintieron visualmente en estroboscopia para parámetros
que pudieron calificar estos parámetros, no se vibratorios. El estudio actual tuvo un hallazgo
pensó que la discrepancia estuviera similar. Como se informó anteriormente, el
relacionada con el entrenamiento, sino con la grado general promedio de disfonía en la
forma en sí misma. Por ejemplo, la baja escala GRBAS fue de 2.92 para los casos en
correlación para el cierre glotal puede haber que tres o más evaluadores no pudieron juzgar
ocurrido porque la forma VALI carecía de una al menos un parámetro. Además, cuando un
forma de evaluar el cierre glotal cuando el evaluador no puede completar una calificación,
patrón de cierre era variable (es decir, el ICC requiere la omisión de la calificación
presencia de más de un cierre patrón) 17 caso del análisis (eliminación en lista), y este

17
Journal of Voice, Vol. ■■, No. ■■, 2016
tamaño de muestra reducido. El tamaño la práctica clínica típica, mejora las
reducido de la muestra contribuyó a CIs más calificaciones o introduce un sesgo sería de
amplios, por lo tanto, correlaciones para los interés. En este estudio, no limitamos las
parámetros de estroboscopia de amplitud calificaciones a ninguna categoría de
(derecha), la onda mucosa (izquierda y diagnóstico en particular. Futuros estudios
derecha) y la parte no vibratoria (izquierda) no dirigidos a investigar patologías específicas
pueden interpretarse válidamente. Del mismo también podrían ayudar a aclarar por qué
modo, las correlaciones para la amplitud algunos parámetros tenían mayor fiabilidad
(izquierda) y la actividad supraglótica que otros. En esto estudio, no limitamos las
(mediolateral) deben interpretarse con categorías de diagnóstico. Futuros estudios
precaución (Tabla 5). Además, se podría dirigidos a investigar patologías específicas
argumentar que debido a que se usó la podrían ayudar a aclarar por qué algunos
deleción lista, los casos más difíciles de parámetros se clasificaron de forma más fiable
clasificar se eliminaron del análisis y las que otros e iluminar aún más la utilidad de este
correlaciones fueron más altas de lo que entrenamiento y calificación para mejorar la
serían si todos los casos hubieran sido confiabilidad de las clasificaciones visual-
incluidos en el análisis. A pesar de un tamaño perceptuales de las imágenes laríngeas.
de muestra menor, se alcanzó la significación Además, investigar las calificaciones según se
para la mayoría de los parámetros. Los relacionan con los niveles de severidad de la
estudios futuros deberían requerir la disfonía y/o trastornos específicos podrían
calificación de todos los casos, incluso si se delinear aún más qué forma es la mejor para
requiere un "mejor intento". calificar los parámetros de movimiento
laríngeo.
Aunque este es un estudio prospectivo, existen
varias limitaciones. Claramente, sería ideal un Conclusiones
número mayor de muestras de video y
El formulario de evaluación VALI y el protocolo
evaluadores, incluidos otros usuarios
de capacitación es el primero que puede
frecuentes de imágenes laríngeas como
usarse para hacer una evaluación confiable
otorrinolaringólogos y profesores de canto. Sin
visoperceptuales de la estructura de doblado
embargo, esto puede ser difícil de lograr
vocal y la función de HSV. La nueva forma de
debido al compromiso del tiempo para el
calificación y el protocolo de capacitación se
entrenamiento combinado y la calificación
desarrollaron no solo para evaluación visual
posterior de los casos. Para este estudio
perceptiva del HSV, sino también incluye un
controlado, los análisis se limitaron a una
formulario actualizado para la evaluación de la
fonación sostenida sin audio y cruzaron varios
videoestroboscopía, ya que, en la actualidad,
trastornos y niveles de gravedad. Los casos de
el uso clínico de rutina del HSV como única
video no incluían tareas de respiración en
modalidad de imagen está limitado debido a la
reposo ni abducción, y a los evaluadores les
limitada disponibilidad comercial de esta
resultó difícil calificar el contorno de libre de la
tecnología para uso clínico y la excesiva
cuerda vocal. Incluirlos proporcionaría una
cantidad de tiempo requerida para ver los
mejor gama de tareas para la evaluación de
videos de alta velocidad de cuadro. Además, el
los diversos estáticos de doblado vocal, así
almacenamiento de datos de las grabaciones
como características dinámicas. Determinar si
de HSV sigue siendo engorroso para una
la inclusión de audio con modalidades de
clínica ocupada debido a su alta velocidad de
imágenes laríngeas, que simula más de cerca
18
Journal of Voice, Vol. ■■, No. ■■, 2016
fotogramas. El formulario VALI incluye una interinstitucional de los movimientos laríngeos
definición del parámetro que se está tanto del VHS como de los videos
evaluando, instrucciones de calificación para estroboscópicos.
cada parámetro, gráficos de alta calidad y REFERENCES
entrenamiento muestras de video Los 1. Hirano M, Bless D. Videostroboscopic
resultados de este estudio prospectivo inicial Examination of the Larynx. San Diego, CA:
sugieren que la forma de VALI combinada con Singular Publishing Group, INC.; 1993.
entrenamiento puede usarse para hacer juicios 2. Zanartu M, Mehta DD, Ho JC, et al.
cualitativos confiables de videoestroboscopía y Observation and analysis of in vivo vocal
VHS. Un refinamiento adicional de la forma y la fold tissue instabilities produced by
capacitación podría mejorar su utilidad y nonlinear source-filter coupling: a case
probablemente daría como resultado niveles study. J Acoust Soc Am. 2011; 129:326–
aún más altos de confiabilidad para los 339.
parámetros seleccionados. 3. Woo P. Quantification of
El video de alta velocidad surgió como una videostrobolaryngoscopic findings—
técnica de imagen superior en comparación measurements of the normal glottal cycle.
con la estroboscopia. La estroboscopia tiene Laryngoscope. 1996;106(2 suppl 79 3
limitaciones inherentes que limitan su utilidad pt):1–27.
en casos de disfonía severa. Para los 4. Elidan G, Elidan J. Vocal folds analysis
parámetros seleccionados, los problemas con using global energy tracking. J Voice.
la extracción de tonos y el seguimiento dieron 2012;26:760–768.
como resultado un gran número de casos en 5. Hanson DG, Jiang J, D’Agostino M, et al.
los que los evaluadores no pudieron hacer un Clinical measurement of mucosal wave
juicio. Tales problemas fueron superados en velocity using simultaneous
gran parte con el uso de HSV. Además, las photoglottography and
correlaciones para la confiabilidad entre jueces laryngostroboscopy. Ann Otol Rhinol
y entre jueces fueron más altas para HSV. Laryngol. 1995; 104:340–349.
Aunque uso de HSV mejoró la capacidad de 6. Saadah AK, Galatsanos NP, Bless D, et
nuestros evaluadores para completar las al. Deformation analysis of the vocal folds
evaluaciones visoperceptuales, la técnica from videostroboscopic image sequences
también tiene desafíos que limitan su uso of the larynx. J Acoust Soc Am. 1998;
práctico en entornos clínicos. Por ejemplo, su 103:3627–3641.
alta velocidad de fotogramas requiere grandes 7. Sercarz JA, Berke GS, Arnstein D, et al. A
cantidades de almacenamiento digital y la new technique for quantitative
visualización de una totalidad El examen measurement of laryngeal
requiere una cantidad excesiva de tiempo. En videostroboscopic images. Arch
la actualidad el tiempo, el uso primario de la Otolaryngol Head Neck Surg. 1991;
estroboscopia, con el uso selectivo de 117:871–875.
imágenes de alta velocidad para resolver las 8. Yan Y, Chen X, Bless D. Automatic tracing
difíciles condiciones de imagen parece ser más of vocal-fold motion from high-speed
efectivo. Por lo tanto, aunque no todos los digital images. IEEE Trans Biomed Eng.
parámetros son igualmente fáciles de calificar, 2006; 53:1394– 1400.
la forma proporciona un medio para 9. Lohscheller J, Toy H, Rosanowski F, et al.
proporcionar clasificación clínica intra e Clinically evaluated procedure for the
19
Journal of Voice, Vol. ■■, No. ■■, 2016
reconstruction of vocal fold vibrations 19. Poburka BJ. A new stroboscopy rating
from endoscopic digital high-speed form. J Voice. 1999;13:403–413.
videos. Med Image Anal. 2007; 11:400– 20. Rosen CA. Stroboscopy as a research
413. instrument: development of a perceptual
10. Patel R, Donohue KD, Unnikrishnan H, et evaluation tool. Laryngoscope.
al. Kinematic measurements of the vocal- 2005;115:423–428.
fold displacement waveform in typical 21. Olthoff A, Woywod C, Kruse E.
children and adult populations: Stroboscopy versus high-speed
quantification of high-speed endoscopic glottography: a comparative study.
videos. J Speech Lang Hear Res. 2015; Laryngoscope. 2007;117:1123–1126.
58:227–240. 22. Mehta DD, Deliyski DD, Zeitels SM, et al.
11. Mehta DD, Deliyski DD, Quatieri TF, et al. Voice production mechanisms following
Automated measurement of vocal fold phonosurgical treatment of early glottic
vibratory asymmetry from high-speed cancer. Ann Otol Rhinol Laryngol.
videoendoscopy recordings. J Speech 2010;119:1–9.
Lang Hear Res. 2011;54:47–54. 23. Patel R, Dailey S, Bless D. Comparison of
12. Ikuma T, Kunduk M, McWhorter AJ. high-speed digital imaging with
Advanced waveform decomposition for stroboscopy for laryngeal imaging of
high-speed videoendoscopy analysis. J glottal disorders. Ann Otol Rhinol
Voice. 2013; 27:369–375. Laryngol. 2008;117:413–424.
13. Yamauchi A, Imagawa H, Yokonishi H, et 24. Patel RR, Liu L, Galatsanos NP, et al.
al. Evaluation of vocal fold vibration with Differential vibratory characteristics of
an assessment form for high-speed digital adductor spasmodic dysphonia and
imaging: comparative study between muscle tension dysphonia on high-speed
healthy young and elderly subjects. J digital imaging. Ann Otol Rhinol Laryngol.
Voice. 2012;26:742–750. 2011;120:21–32.
14. Krausert CR, Liang Y, Zhang Y, et al. 25. Patel RR, Pickering J, Stemple J, et al. A
Spatiotemporal analysis of normal and case report in changes in phonatory
pathological human vocal fold vibrations. physiology following voice therapy:
Am J Otolaryngol. 2012;33:641–649. application of high-speed imaging. J
15. Yiu EM, Wang G, Lo AC, et al. Voice. 2012;26:734–741.
Quantitative high-speed laryngoscopic 26. Deliyski DD, Hillman RE. State of the art
analysis of vocal fold vibration in fatigued laryngeal imaging: research and clinical
voice of young karaoke singers. J Voice. implications. Curr Opin Otolaryngol Head
2013;27:753–761. Neck Surg. 2010;18:147– 152.
16. Woo P. Objective measures of laryngeal 27. Mendelsohn AH, Remacle M, Courey MS,
imaging: what have we learned since Dr. et al. The diagnostic role of high-speed
Paul Moore. J Voice. 2014;28:69–81. vocal fold vibratory imaging. J Voice.
17. Bless DM, Hirano M, Feder RJ. 2013;27:627–631.
Videostroboscopic evaluation of the larynx. 28. Yamauchi A, Yokonishi H, Imagawa H, et
Ear Nose Throat J. 1987;66:289–296. al. Quantification of vocal fold vibration in
18. Poburka BJ, Bless DM. A multi-media, various laryngeal disorders using high-
computer-based method for stroboscopy speed digital imaging. J Voice.
rating training. J Voice. 1998;12:513–526. 2016;30:205–214.

20
Journal of Voice, Vol. ■■, No. ■■, 2016
29. Yamauchi A, Yokonishi H, Imagawa H, et
al. Visualization and estimation of
vibratory disturbance in vocal fold scar
using high-speed digital imaging. J Voice.
2016;30:493–500.
30. Peppard RC, Bless D. A method for
improving measurement reliability in
laryngeal videostroboscopy. J Voice.
1990;4:280–285.
31. Uloza V, Vegiene A, Pribuisiene R, et
al. Quantitative evaluation of video
laryngostroboscopy: reliability of the basic
parameters. J Voice. 2013;27:361–368.
32. Otto KJ, Hapner ER, Baker M, et al.
Blinded evaluation of the effects of high
definition and magnification on perceived
image quality in laryngeal imaging. Ann
Otol Rhinol Laryngol. 2006;115:110–113.
33. Kendall KA. High-speed laryngeal
imaging compared with videostroboscopy
in healthy subjects. Arch Otolaryngol
Head Neck Surg. 2009;135:274–281.
34. Inwald EC, Döllinger M, Schuster M, et
al. Multiparametric analysis of vocal fold
vibrations in healthy and disordered
voices in high-speed imaging. J Voice.
2011;25:576–590.
35.
36. Hirano M, ed. Clinical Examination of
Voice. New York: Springer-Verlag; 1981.
37. Association AS-L-H. The roles of
otolaryngologists and speech-language
pathologists in the performance and
interpretation of strobovideolaryngoscopy
(Relevant Paper). 1998. Available at:
Www.asha.org/policy. Accessed
November 11, 2016.
38. Deliyski DD, Powell MEG, Zacharias
SRC, et al. Experimental investigation on
minimum frame rate requirements of high-
speed videoendoscopy for clinical voice
assessment. Biomed Signal Proces.
2015;17:21– 28.
39. Bonilha HS, Deliyski DD, Gerlach TT.

21

También podría gustarte