Documentos de Académico
Documentos de Profesional
Documentos de Cultura
■■, 2016
Introducción
La estroboscopía y videoendoscopía de alta justificación subyacente, la falta de
velocidad (HSV) revela información sobre la estandarización es una problemática, ya que el
compleja interacción entre las estructuras HSV se está utilizando cada vez más en
laríngeas, fuerzas aerodinámicas, la mecánica clínicas de voz como un medio para superar
de los tejidos y patrones de uso muscular. En algunos de los desafíos que surgen de la
teoría, los resultados obtenidos de la mecánica videoestroboscopía, como la mala resolución
vibratoria desde la estroboscopía y HSV, temporal y la pobre extracción del tono o el
pueden ser evaluados cuantitativa y rastreo de las voces severamente alteradas. El
cualitativamente, sin embargo, tienen sus aumento de la resolución temporal del HSV en
limitaciones. Las evaluaciones cuantitativas del comparación con la estroboscopía (por
videoestroboscopía y HSV están disponibles, ejemplo, 8000 pfs frente a 30 fps), puede
pero no han sido ampliamente adoptados en la utilizarse para capturar fenómenos vibratorios
clínica, ya que el software desarrollado a en individuos con trastornos graves de la voz.
medida no está disponible y es demasiado Sin embargo, sin estándares y confiabilidad de
lento para la mayoría de las prácticas clínicas calificación, el potencial de HSV para superar
diarias. La evaluación cualitativa, está llena de las fallas estroboscópicas no puede ser
problemas debido a la falta de estándares para completamente realizado. Se acepta, que para
la comparación intra e inter institucional y los que las clasificaciones perceptuales visuales
juicios intra e interdisciplinarios. sean significativas, deben alcanzar niveles
Sin embargo, para propósitos clínicos, los satisfactorios de inter e intra confiabilidad. Se
juicios cualitativos son utilizados dice que numerosos factores relacionados con
frecuentemente. La evaluación de la imagen el evaluador- y escalas psicométricas- influyen
laríngea, a través de la vía visual-perceptual de en las clasificaciones visuo-perceptuales de la
los marcadores anatómicos y los parámetros imagen laríngea; sin embargo, solo unos pocos
de movimiento que reflejan tanto la estructura han sido sometidos a investigaciones
como la función de los pliegues vocales, empíricas para una clasificación visoperceptiva
continúa siendo comúnmente utilizada. en la videoestroboscopía. Por razones de
Aunque, muchas formas visual-perceptuales investigación, Rosen, evaluadores limitantes
se han desarrollado a priori como un sugestivos para individuos con una
instrumento para calificar la confiabilidad mayor que 0.80 interevaluador, y
que se tome en cuenta la evaluación
videoestroboscopía, casi ninguna existe para estadística previa al estudio de la variabilidad
HSV. Esto se puede deber quizás, a que la de los datos. Clínicamente, se ha mencionado
tecnología del HSV es usada con menos que la capacidad de las valoraciones
frecuencia que la videoestroboscopía, que los visoperceptuales han mejorado con una serie
1
Journal of Voice, Vol. ■■, No. ■■, 2016
de factores, como el uso de un formulario de fueron escogidos de aquellos acostumbrados a
calificación computacional, el uso de un valor por videoestroboscopía, a pesar que las
método de rastreo de grillas calibrado, y diferencias resultantes desde el mejoramiento
mediante el control de factores como la de la resolución que dicta diferencias en la
descripción clara de los parámetros de imagen observación; y (2) evaluadores, quienes a
y un entrenamiento al evaluador. Poburka y menudo tienen una formación de observación
Bless, mencionan que después de 4 a 5 horas limitada para utilizar HSV. En consecuencia,
entrenamiento con una calificación mantenemos que el primer paso en la
computarizada, los sujetos sin experiencia investigación sistemática de los factores que
previa con la calificación de videos influyen en las clasificaciones perceptuales
estroboscópicos completaron clasificaciones visuales del HVS, es el desarrollo de una
que se correlacionaron altamente con las de forma estandarizada y la capacitación del
los expertos. A pesar de décadas de uso de la evaluador. Una vez que sean logrados,
videoestroboscopía en la clínica, todavía estudios consecuentes podrían investigas
existen estándares para los parámetros de factores específicos de influencias como el tipo
calificación o confiabilidad del juicio clínico, ya de patología, la experiencia clínica y la
que las formas existentes varían en la información concurrente obtenida del historial
combinación de los parámetros utilizados. Las clínico y la señal auditiva.
escalas de clasificación que usan los
Para mitigar los problemas discutidos
formularios también varían desde ser una
anteriormente, en este documento, una nueva
escala de calificación de tres puntos hasta ser
forma de calificación y un protocolo de
una escala de calificación de cinco puntos.
capacitación que incorpora clasificaciones
Además, los formularios disponibles están
visoperceptuales tanto de la
limitados por la falta de una definición clara de
videoestroboscopía como el HSV. Esta nueva
los parámetros de la imagen, la capacitación
herramienta visoperceptuales se denomina
estructurada y el sesgo del observador.
“Protocolo de evaluación de la voz vibratoria
Para un mejor entendimiento, la literatura es con imágenes laríngeas” (VALI). El protocolo
escasa sobre el desarrollo de formas de VALI fue desarrollado como una actualización
clasificación visoperceptuales y aspectos del “Protocolo de examinación
relacionados con mejorar la confiabilidad de estroboscópica”. El protocolo y el
clasificación utilizando video de alta velocidad. entrenamiento son inseparables. Juntos, tienen
El HSV ha sido utilizado para evaluar las una serie de características que están
características vibratorias en sujetos sanos y destinadas a mejorar la confiabilidad de las
en varias patologías vocales; y para diferenciar clasificaciones tanto para la estroboscopía
a individuos con voz sana de aquellos con como para el HSV. Para cada parámetro de
patologías vocales, pero la confiabilidad de calificación, las características del protocolo
una calificación cualitativa ha variado VALI son: (1) una definición de lo que se está
ampliamente, así como los juicios perceptivos valorando, (2) instrucciones de calificación que
de la evaluación auditiva. Se requiere un alto es exclusiva del parámetro, (3) gráficos de alta
grado de confiabilidad para la generalización calidad para ilustrar el fenómeno estructural o
de los hallazgos. Aunque, puede haber vibratorios que se está evaluando, y (4)
múltiples factores que contribuyen a la muestras de video (utilizadas con
varianza, dos factores probables son (1) los capacitación). El propósito del estudio actual,
parámetros de calificación, que a menudo fue evalúa la confiabilidad de calificación entre
2
Journal of Voice, Vol. ■■, No. ■■, 2016
e intra evaluadores que utilizan el protocolo y fueron capturadas utilizando PENTAX Medical
entrenamiento para utilizar videoestroboscopía (Montvale, NJ) modelo RLS 9100b
y videos en alta velocidad. El propósito del (estroboscopio con cámara) y 9710 (sistema
estudio es valorar la confiabilidad en la de video de alta velocidad con cámara)
evaluación utilizando el VALI intra e inter respectivamente. Las grabaciones se
evaluador con videoestroboscopía y HSV. La capturaron mientras los participantes
confiabilidad inter e intra evaluador fue realizaban la fonación de una /i/ sostenida en
evaluada secuencialmente obteniendo su tono e intensidad habitual. Un endoscopio
grabaciones de videoestroboscopía y HSV rígido de 70 grados fue utilizado para hacer las
siguiendo los siguientes parámetros: amplitud, grabaciones. No fue utilizada anestesia local
onda mucosa, porción no vibratoria, actividad por ningún participante. Las grabaciones con
supraglótica, fase de cierre, simetría, videoestroboscopía fueron capturadas en 30
periodicidad, cierre glotal, nivel de verticalidad, cuadros por segundos con resolución espacial
y contorno libre de la cuerda vocal. de 640x480 pixeles, mientras que la grabación
en blanco y negro con HSV fue capturada en
Método
4000 cuadros por secundo con una resolución
Un total de 30 (hombre=10, mujeres=19, niños espacial de 256x512 pixeles. Las grabaciones
=1) participantes con disfonía proporcionar en HSV fueron capturadas utilizando cámara
muestras de videos para el estudio. Los en blanco y negro en vez de cámara a color.
participantes con disfonías fueron reclutados Las grabaciones de HSV y de
por la Universidad Clinica de fisiología vocal de videoestroboscopía fueron capturadas durante
Kentucky e laboratorio de imagen, posterior a la misma visita utilizando: las mismas
la finalización de la junta de revisión instrucciones, posición física, y endoscopio.
institucional aprobó los formularios de
consentimientos informados. El rango de edad
de los participantes fue entre 10 y 80 años, con Evaluadores
una media de edad de 49.8 años. Table 1
Basado en el poder de análisis, se determinó
característica de los participantes en términos
que era necesario que los evaluadores
de edad, género, y patología vocal. Se realizó
tuvieran el poder suficiente para abordar las
una evaluación inicial acústica perceptual a los
preguntas planteadas. El poder de análisis
participantes a través del GRBAS (Grado,
indica que existe un 80% de posibilidad de
Ronquera, soplosidad, astenia y tensión).
detectar una diferencia significativa de 0.05 de
Cada parámetro del GRBAS fue calificado
nivel de significancia con nueve evaluadores.
utilizando una escala de 4 puntos donde 0=
Nueve patólogos de lenguaje y habla fueron
normal, 1= leve anormalidad, 2= anormalidad
reclutados para servir como evaluadores.
moderada, y 3= anormalidad severa. Los
Estos profesionales evaluaron inicialmente el
participantes fueron colocados en diferentes
patrón vibratorio de las cuerdas vocales,
grupos dependiendo del grado de su disfonía
incluyendo los movimientos, la sincronización
(G): 0, n=3; grado 1, n=6; grado 2, n=9; y
del patrón y juicio sobre el cierre glotal.
grado 3, n=12. Los participantes con un grado
Además, pudieron necesitaron muchas horas
0 tienen quejas principalmente de esfuerzo
para completar el entrenamiento y las
vocal, fatiga vocal, o dificultad con las notas
clasificaciones. El promedio de experiencia de
altas al cantar.
los evaluadores con imagen laríngea fue de
Las grabaciones de videoestroboscopía y HSV
3
Journal of Voice, Vol. ■■, No. ■■, 2016
4
Journal of Voice, Vol. ■■, No. ■■, 2016
5
Journal of Voice, Vol. ■■, No. ■■, 2016
evaluadores evaluaciones visuo perceptual fue aprobación antes de participar en el estudio.
7
Journal of Voice, Vol. ■■, No. ■■, 2016
8
Journal of Voice, Vol. ■■, No. ■■, 2016
17
Journal of Voice, Vol. ■■, No. ■■, 2016
tamaño de muestra reducido. El tamaño la práctica clínica típica, mejora las
reducido de la muestra contribuyó a CIs más calificaciones o introduce un sesgo sería de
amplios, por lo tanto, correlaciones para los interés. En este estudio, no limitamos las
parámetros de estroboscopia de amplitud calificaciones a ninguna categoría de
(derecha), la onda mucosa (izquierda y diagnóstico en particular. Futuros estudios
derecha) y la parte no vibratoria (izquierda) no dirigidos a investigar patologías específicas
pueden interpretarse válidamente. Del mismo también podrían ayudar a aclarar por qué
modo, las correlaciones para la amplitud algunos parámetros tenían mayor fiabilidad
(izquierda) y la actividad supraglótica que otros. En esto estudio, no limitamos las
(mediolateral) deben interpretarse con categorías de diagnóstico. Futuros estudios
precaución (Tabla 5). Además, se podría dirigidos a investigar patologías específicas
argumentar que debido a que se usó la podrían ayudar a aclarar por qué algunos
deleción lista, los casos más difíciles de parámetros se clasificaron de forma más fiable
clasificar se eliminaron del análisis y las que otros e iluminar aún más la utilidad de este
correlaciones fueron más altas de lo que entrenamiento y calificación para mejorar la
serían si todos los casos hubieran sido confiabilidad de las clasificaciones visual-
incluidos en el análisis. A pesar de un tamaño perceptuales de las imágenes laríngeas.
de muestra menor, se alcanzó la significación Además, investigar las calificaciones según se
para la mayoría de los parámetros. Los relacionan con los niveles de severidad de la
estudios futuros deberían requerir la disfonía y/o trastornos específicos podrían
calificación de todos los casos, incluso si se delinear aún más qué forma es la mejor para
requiere un "mejor intento". calificar los parámetros de movimiento
laríngeo.
Aunque este es un estudio prospectivo, existen
varias limitaciones. Claramente, sería ideal un Conclusiones
número mayor de muestras de video y
El formulario de evaluación VALI y el protocolo
evaluadores, incluidos otros usuarios
de capacitación es el primero que puede
frecuentes de imágenes laríngeas como
usarse para hacer una evaluación confiable
otorrinolaringólogos y profesores de canto. Sin
visoperceptuales de la estructura de doblado
embargo, esto puede ser difícil de lograr
vocal y la función de HSV. La nueva forma de
debido al compromiso del tiempo para el
calificación y el protocolo de capacitación se
entrenamiento combinado y la calificación
desarrollaron no solo para evaluación visual
posterior de los casos. Para este estudio
perceptiva del HSV, sino también incluye un
controlado, los análisis se limitaron a una
formulario actualizado para la evaluación de la
fonación sostenida sin audio y cruzaron varios
videoestroboscopía, ya que, en la actualidad,
trastornos y niveles de gravedad. Los casos de
el uso clínico de rutina del HSV como única
video no incluían tareas de respiración en
modalidad de imagen está limitado debido a la
reposo ni abducción, y a los evaluadores les
limitada disponibilidad comercial de esta
resultó difícil calificar el contorno de libre de la
tecnología para uso clínico y la excesiva
cuerda vocal. Incluirlos proporcionaría una
cantidad de tiempo requerida para ver los
mejor gama de tareas para la evaluación de
videos de alta velocidad de cuadro. Además, el
los diversos estáticos de doblado vocal, así
almacenamiento de datos de las grabaciones
como características dinámicas. Determinar si
de HSV sigue siendo engorroso para una
la inclusión de audio con modalidades de
clínica ocupada debido a su alta velocidad de
imágenes laríngeas, que simula más de cerca
18
Journal of Voice, Vol. ■■, No. ■■, 2016
fotogramas. El formulario VALI incluye una interinstitucional de los movimientos laríngeos
definición del parámetro que se está tanto del VHS como de los videos
evaluando, instrucciones de calificación para estroboscópicos.
cada parámetro, gráficos de alta calidad y REFERENCES
entrenamiento muestras de video Los 1. Hirano M, Bless D. Videostroboscopic
resultados de este estudio prospectivo inicial Examination of the Larynx. San Diego, CA:
sugieren que la forma de VALI combinada con Singular Publishing Group, INC.; 1993.
entrenamiento puede usarse para hacer juicios 2. Zanartu M, Mehta DD, Ho JC, et al.
cualitativos confiables de videoestroboscopía y Observation and analysis of in vivo vocal
VHS. Un refinamiento adicional de la forma y la fold tissue instabilities produced by
capacitación podría mejorar su utilidad y nonlinear source-filter coupling: a case
probablemente daría como resultado niveles study. J Acoust Soc Am. 2011; 129:326–
aún más altos de confiabilidad para los 339.
parámetros seleccionados. 3. Woo P. Quantification of
El video de alta velocidad surgió como una videostrobolaryngoscopic findings—
técnica de imagen superior en comparación measurements of the normal glottal cycle.
con la estroboscopia. La estroboscopia tiene Laryngoscope. 1996;106(2 suppl 79 3
limitaciones inherentes que limitan su utilidad pt):1–27.
en casos de disfonía severa. Para los 4. Elidan G, Elidan J. Vocal folds analysis
parámetros seleccionados, los problemas con using global energy tracking. J Voice.
la extracción de tonos y el seguimiento dieron 2012;26:760–768.
como resultado un gran número de casos en 5. Hanson DG, Jiang J, D’Agostino M, et al.
los que los evaluadores no pudieron hacer un Clinical measurement of mucosal wave
juicio. Tales problemas fueron superados en velocity using simultaneous
gran parte con el uso de HSV. Además, las photoglottography and
correlaciones para la confiabilidad entre jueces laryngostroboscopy. Ann Otol Rhinol
y entre jueces fueron más altas para HSV. Laryngol. 1995; 104:340–349.
Aunque uso de HSV mejoró la capacidad de 6. Saadah AK, Galatsanos NP, Bless D, et
nuestros evaluadores para completar las al. Deformation analysis of the vocal folds
evaluaciones visoperceptuales, la técnica from videostroboscopic image sequences
también tiene desafíos que limitan su uso of the larynx. J Acoust Soc Am. 1998;
práctico en entornos clínicos. Por ejemplo, su 103:3627–3641.
alta velocidad de fotogramas requiere grandes 7. Sercarz JA, Berke GS, Arnstein D, et al. A
cantidades de almacenamiento digital y la new technique for quantitative
visualización de una totalidad El examen measurement of laryngeal
requiere una cantidad excesiva de tiempo. En videostroboscopic images. Arch
la actualidad el tiempo, el uso primario de la Otolaryngol Head Neck Surg. 1991;
estroboscopia, con el uso selectivo de 117:871–875.
imágenes de alta velocidad para resolver las 8. Yan Y, Chen X, Bless D. Automatic tracing
difíciles condiciones de imagen parece ser más of vocal-fold motion from high-speed
efectivo. Por lo tanto, aunque no todos los digital images. IEEE Trans Biomed Eng.
parámetros son igualmente fáciles de calificar, 2006; 53:1394– 1400.
la forma proporciona un medio para 9. Lohscheller J, Toy H, Rosanowski F, et al.
proporcionar clasificación clínica intra e Clinically evaluated procedure for the
19
Journal of Voice, Vol. ■■, No. ■■, 2016
reconstruction of vocal fold vibrations 19. Poburka BJ. A new stroboscopy rating
from endoscopic digital high-speed form. J Voice. 1999;13:403–413.
videos. Med Image Anal. 2007; 11:400– 20. Rosen CA. Stroboscopy as a research
413. instrument: development of a perceptual
10. Patel R, Donohue KD, Unnikrishnan H, et evaluation tool. Laryngoscope.
al. Kinematic measurements of the vocal- 2005;115:423–428.
fold displacement waveform in typical 21. Olthoff A, Woywod C, Kruse E.
children and adult populations: Stroboscopy versus high-speed
quantification of high-speed endoscopic glottography: a comparative study.
videos. J Speech Lang Hear Res. 2015; Laryngoscope. 2007;117:1123–1126.
58:227–240. 22. Mehta DD, Deliyski DD, Zeitels SM, et al.
11. Mehta DD, Deliyski DD, Quatieri TF, et al. Voice production mechanisms following
Automated measurement of vocal fold phonosurgical treatment of early glottic
vibratory asymmetry from high-speed cancer. Ann Otol Rhinol Laryngol.
videoendoscopy recordings. J Speech 2010;119:1–9.
Lang Hear Res. 2011;54:47–54. 23. Patel R, Dailey S, Bless D. Comparison of
12. Ikuma T, Kunduk M, McWhorter AJ. high-speed digital imaging with
Advanced waveform decomposition for stroboscopy for laryngeal imaging of
high-speed videoendoscopy analysis. J glottal disorders. Ann Otol Rhinol
Voice. 2013; 27:369–375. Laryngol. 2008;117:413–424.
13. Yamauchi A, Imagawa H, Yokonishi H, et 24. Patel RR, Liu L, Galatsanos NP, et al.
al. Evaluation of vocal fold vibration with Differential vibratory characteristics of
an assessment form for high-speed digital adductor spasmodic dysphonia and
imaging: comparative study between muscle tension dysphonia on high-speed
healthy young and elderly subjects. J digital imaging. Ann Otol Rhinol Laryngol.
Voice. 2012;26:742–750. 2011;120:21–32.
14. Krausert CR, Liang Y, Zhang Y, et al. 25. Patel RR, Pickering J, Stemple J, et al. A
Spatiotemporal analysis of normal and case report in changes in phonatory
pathological human vocal fold vibrations. physiology following voice therapy:
Am J Otolaryngol. 2012;33:641–649. application of high-speed imaging. J
15. Yiu EM, Wang G, Lo AC, et al. Voice. 2012;26:734–741.
Quantitative high-speed laryngoscopic 26. Deliyski DD, Hillman RE. State of the art
analysis of vocal fold vibration in fatigued laryngeal imaging: research and clinical
voice of young karaoke singers. J Voice. implications. Curr Opin Otolaryngol Head
2013;27:753–761. Neck Surg. 2010;18:147– 152.
16. Woo P. Objective measures of laryngeal 27. Mendelsohn AH, Remacle M, Courey MS,
imaging: what have we learned since Dr. et al. The diagnostic role of high-speed
Paul Moore. J Voice. 2014;28:69–81. vocal fold vibratory imaging. J Voice.
17. Bless DM, Hirano M, Feder RJ. 2013;27:627–631.
Videostroboscopic evaluation of the larynx. 28. Yamauchi A, Yokonishi H, Imagawa H, et
Ear Nose Throat J. 1987;66:289–296. al. Quantification of vocal fold vibration in
18. Poburka BJ, Bless DM. A multi-media, various laryngeal disorders using high-
computer-based method for stroboscopy speed digital imaging. J Voice.
rating training. J Voice. 1998;12:513–526. 2016;30:205–214.
20
Journal of Voice, Vol. ■■, No. ■■, 2016
29. Yamauchi A, Yokonishi H, Imagawa H, et
al. Visualization and estimation of
vibratory disturbance in vocal fold scar
using high-speed digital imaging. J Voice.
2016;30:493–500.
30. Peppard RC, Bless D. A method for
improving measurement reliability in
laryngeal videostroboscopy. J Voice.
1990;4:280–285.
31. Uloza V, Vegiene A, Pribuisiene R, et
al. Quantitative evaluation of video
laryngostroboscopy: reliability of the basic
parameters. J Voice. 2013;27:361–368.
32. Otto KJ, Hapner ER, Baker M, et al.
Blinded evaluation of the effects of high
definition and magnification on perceived
image quality in laryngeal imaging. Ann
Otol Rhinol Laryngol. 2006;115:110–113.
33. Kendall KA. High-speed laryngeal
imaging compared with videostroboscopy
in healthy subjects. Arch Otolaryngol
Head Neck Surg. 2009;135:274–281.
34. Inwald EC, Döllinger M, Schuster M, et
al. Multiparametric analysis of vocal fold
vibrations in healthy and disordered
voices in high-speed imaging. J Voice.
2011;25:576–590.
35.
36. Hirano M, ed. Clinical Examination of
Voice. New York: Springer-Verlag; 1981.
37. Association AS-L-H. The roles of
otolaryngologists and speech-language
pathologists in the performance and
interpretation of strobovideolaryngoscopy
(Relevant Paper). 1998. Available at:
Www.asha.org/policy. Accessed
November 11, 2016.
38. Deliyski DD, Powell MEG, Zacharias
SRC, et al. Experimental investigation on
minimum frame rate requirements of high-
speed videoendoscopy for clinical voice
assessment. Biomed Signal Proces.
2015;17:21– 28.
39. Bonilha HS, Deliyski DD, Gerlach TT.
21