Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE INGENIERÍA
PROGRAMA DE INGENIERÍA EN MECATRÓNICA
FORMATO PROPUESTA TIPO 3
N
Código Nombre
o
1 1803180 Jorge Steban Moreno Lozano
1. TÍTULO
2. ANTECEDENTES
Estudios realizados sobre PVH encontró diferencias entre sujetos de control sanos
y pacientes enfermos, utilizando características estadísticas de distribución como
curtosis y sesgo, en características de cierre glótico basado en las diferencias entre
el primer y segundo armónico con un clasificador multidimensional [27][28]. En [22]
se plantea realizar la misma estrategia para NPVH debido a que otras técnicas para
identificar NPVH han fallado por su parecido a la voz normal en pruebas
ambulatorias a corto plazo [29] [22].
3.1 IDENTIFICACIÓN
Para que soporte o ayude a los profesionales de la salud a tomar las decisiones de diagnostico…..
Sin embargo, es posible realizar otro tipo de análisis, la cual permite encontrar
indicadores cuantitativos para que los profesionales de la salud tomen una decisión
en el diagnostico de manera más acertada y confiable. El desarrollo de este tipo de
análisis de la voz se hace de manera asistida por computadora, utilizando algoritmos
de IA, que permite analizar rápidamente grandes cantidades de datos para el
diagnóstico, al mismo tiempo reduce la carga de trabajo de los profesionales de la
salud y al no ser invasiva para el cuerpo, resulta cómoda para los pacientes [4].
3.2 DESCRIPCIÓN
El uso de algoritmos de IA, como Machine Learning y Deep Learning, han sido
desarrollados para análisis de voz con el fin de clasificar ciertas patologías de la
voz, obteniendo buenos resultados y definiendo una nueva manera de diagnosticar
estas patologías [2][3][4]. Sin embargo, NPVH es una patología que no ha sido
utilizada mayormente en estos estudios y análisis por sus características parecidas
a la voz normal en sesiones cortas de muestro de la voz. En cambio, al usar
sesiones largas de muestreo, es posible aplicar estos algoritmos para su
clasificación, teniendo en cuenta características de la voz ambulatorias [5].
3.3 PLANTEAMIENTO
¿Cómo clasificar entre voces sanas y patológicas con NPVH, mediante un algoritmo
de Inteligencia Artificial, cuyas entradas sean parámetros ambulatorios de la función
vocal?
4. JUSTIFICACIÓN
Este trabajo busca brindar una alternativa de apoyo diagnóstico para la detección
de voces hiperfuncionales no fono traumáticas en etapa temprana de la patología,
con el objetivo de brindar a los profesionales de la voz una herramienta cuantitativa
al momento de tomar una decisión. El uso de IA permite analizar fácilmente los
parámetros aerodinámicos y acústicos, que caracterizan la función vocal con
respecto a métodos tradicionales no invasivos, por su parecido con la voz normal
[27].
5. OBJETIVOS
7. MARCO REFERENCIAL
7.1 MARCO CONCEPTUAL
1. Inteligencia Artificial
3. Aprendizaje de máquina
Los datos y la experiencia pueden ayudar a un programa a aprender de
manera más efectiva. Esto se debe a que las técnicas de aprendizaje,
también llamadas aprendizaje automático, permiten que un programa infiera
o aprenda comportamientos [21]. Tener más datos o experiencia para
trabajar puede mejorar el aprendizaje [22].
Para el desarrollo de este proyecto se debe tener ciertos conceptos clínicos, serán
explicado a continuación con el fin aclarar conceptos para la lectura del documento.
Meses/días
Tareas Realizada
Septiembre Octubre Noviembre Diciembre Enero
Evaluación base de
datos
Análisis estadístico
Identificaciones
variables
Selección algoritmo
Definición de la
arquitectura
Desarrollo del
algoritmo en Python
Entrenamiento y
pruebas
comparación de
resultados
Producción escrita
10. PRESUPUESTO
12. BIBLIOGRAFÍA
[1] Daniel S. Kermany, Michael Goldbaum, Wenjia Cai, ..., M. Anthony Lewis, Huimin
Xia, Kang Zhang(2018). Identifying Medical Diagnoses and Treatable Diseases by
Image-Based Deep Learning(1-5)
[2] Muhammad Khalid Khan Niazi PhD, Anil V Parwani MD Metin N Gurcan PhD
(2019). Digital pathology and artificial intelligence.(1-6)
[5] Fang S.-H., Tsao Y., Hsiao M.-J., Chen J.-Y., Lai Y.-H., Lin F.-C., Wang C.-
T.(2019). Detection of pathological voice using cepstrum vectors: A deep learning
approach(634-641).
[6] Alhussein M., Muhammad G(2018) Voice pathology detection using deep
learning on mobile healthcare framework.
[7] Jonas Gehring, Michael Auli, David Grangier, Denis Yarats, and Yann N.
Dauphin. Convolutional sequence to sequence learning. arXiv preprint
arXiv:1705.03122v2, 2017.
[8] Denny Britz, Anna Goldie, Minh-Thang Luong, and Quoc V. Le. Massive
exploration of neural
[10] Robert E. Hillman, Cara E. Stepp, Jarrad H. Van Stan, Matías Zañartu and
Daryush D. Mehta.(2020).
[11] Hillman, R. E., Stepp, C. E., Van Stan J. H., Zañartu, M., & Mehta, D. D. (2020).
An Updated Theoretical Framework for Vocal Hyperfunction. American Journal of
Speech-Language Pathology.
[12] Stepp, C. E., Lester-Smith, R. A., Abur, D., Daliri, A., Pieter N., J., & Lupiani, A.
A. (2017). Evidence for Auditory-Motor Impairment in Individuals With
Hyperfunctional Voice Disorders. Journal of Speech, Language, and Hearing
Research: JSLHR.
[13] Lee, S. H., Yu, J. F., Fang, T. J., & Lee, G. S. (2019). Vocal fold nodules: A
disorder of phonation organs or auditory feedback? Clinical otolaryngology: official
journal of ENT-UK; official journal of Netherlands Society for Oto-Rhino-Laryngology
& Cervico-Facial Surgery.
[16] Cesari U., De Pietro G., Marciano E., Niri C., Sannino G., Verde L. (2018)Voice
disorder detection via an m-Health system: Design and results of a clinical study to
evaluate Vox4Health.
[17] M. Kim, B. Cao, K. An, J. Wang,(2018) Dysarthric speech recognition using
convolutional LSTM neural network.
[19] Janet Baker.(2009) The role of psychogenic and psychosocial factors in the
development of functional voice disorders.
[20] Martins RHG, do Amaral HA, Tavares ELM, Martins MG, Gonc ̧alves TM, Dias
NH,(2016) Voice disorders: etiology and diagnosis, Journal of voice 30.
[21] S. Russell, P. Norvig and M. Chang, Artificial intelligence, 3rd ed. Harlow,
England: Pearson Education Limited, 2016, pp. 10-20.
[23] Robert E. Hillman, Cara E. Stepp, Jarrad H. Van Stan. (2020). An Updated
Theoretical Framework for Vocal Hyperfunction.
[24] Espinoza, V. M., Mehta, D. D., Van Stan, J. H., Hillman, R. E.,& Zañartu, M.
(2017). Uncertainty of glottal airflow estimation during continuous speech using
impedance-based inverse filtering of the neck-surface acceleration signal. The
Journal of the Acoustical Society of America.
[25] Ziethe, A., Petermann, S., Hoppe, U., Greiner, N., Bruning, M.,Bohr, C., &
Dollinger, M. (2019). Control of fundamental frequency in dysphonic patients during
phonation and speech. Journal of Voice.
[26] Cortés, J. P., Espinoza, V. M., Ghassemi, M., Mehta, D. D., Van Stan, J. H.,
Hillman, R. E., Guttag, J. V., & Zañartu, M. (2018). Ambulatory assessment of
phonotraumatic vocal hyperfunction using glottal airflow measures estimated from
neck-surface acceleration.
[27] Marks, K. L., Lin, J. Z., Burns, J. A., Hron, T. A., Hillman, R. E., & Mehta, D. D.
(2020). Estimation of subglottal pressure from neck surface vibration in patients with
voice disorders. Journal of Speech, Language, and Hearing Research.
[28] Van Stan, J. H., Mehta, D. D., Ortiz, A. J., Burns, J. A., Toles, L. E., Marks, K.
L., Vangel, M., Hron, T., Zeitels, S., & Hillman, R. E. (2020b). Differences in
weeklong ambulatory vocal behavior between female patients with phonotraumatic
lesions and matched controls. Journal of Speech. Language, and Hearing Research.
[29] Stepp, C. E., Lester-Smith, R. A., Abur, D., Daliri, A., Pieter Noordzij, J., &
Lupiani, A. A. (2017). Evidence for auditory-motor impairment in individuals with
hyperfunctional voice disorders. Journal of Speech, Language, and Hearing
Research.
[31] M.V. Valueva, N.N. Nagornov, P.A. Lyakhov, G.V. Valuev, N.I.
Chervyakov,(2020). Application of the residue number system to reduce hardware
costs of the convolutional neural network implementation,Mathematics and
Computers in Simulation.
[33] Titze, I. R. (2021). Simulation of Vocal Loudness Regulation with Lung Pressure,
Vocal Fold Adduction, and Source-Airway Interaction.
[35] Chang A, Karnell MP. (2004). Perceived phonatory effort and phonation
threshold pressure across a prolonged voice loading task: A study of vocal fatigue.
J Voice.
[36] Guzman M, Calvache C, Romero L, Muñoz D, Olavarria C, Madrid S, et al. Do
(2015) Different Semi-Occluded Voice Exercises Affect Vocal Fold Adduction
Differently in Subjects Diagnosed with Hyperfunctional Dysphonia.
[37] Colton RH, Casper JK, Leonard RJ. (2015). Understanding voice problem: A
physiological perspective for diagnosis and treatment: Fourth edition.
[38] Titze IR, Švec JG, Popolo PS.( 2003) Vocal dose measures: Quantifying
accumulated vibration exposure in vocal fold tissues. J Speech, Lang Hear Res
[39] Calvache-Mora CA. (2020) Parámetros vocales para definir la severidad de una
disfonía. Revista
de Investigación e Innovación en Ciencias
de la Salud
COMENTARIOS: