Aplicación Del Análisis Acústico en La Clínica Vocal

Luis Alberto Cecconello Aplicacién del andlisis acustico en la clinica vocalIndice SE] Prefacio Prologo por el Ing. Jorge Gurlekian Capitulo 1: Capitulo 2: Capitulo 3: Capitulo 4: Capitulo 5: Capitulo 6: Capitulo 7: Capitulo 8: Capitulo 9: Capitulo 10: Capitulo UI: Capitulo 12: Capitulo 13: Capitulo 14: Bibliografia Analisis actistico, Laboratorio de voz. Estudio objetivo de la voz? Conociendo Anagraf Pardmetros actisticos Manejo de Anagraf Interpretacion de ventanas de andlisis Coordinaci6n fono-respiratoria Informacion provista por formantes Coincidencia arménicos-formantes Medicién del vibrato Valoracién del Singing Formant Registros vocales Analisis de formantes en frecuencias agudas Relacién de valoracién perceptual y actistica El informe fonoaudiolégico 29 39 55 63 1 wi) 83 87 93 97 103 108Prefacio a En la actualidad, el andlisis actistico ha Hegado a tomar un lugar de gran importancia en la clinica vocal internacionalmente. Todavia no existe demasiada bibliografia que explique de un modo detallado la aplicacién de esta tecnologia para el andlisis de la voz. El objetivo de este libro es el de aportar una guia para los profesionales que se dedican al analisis actstico de la voz en el area clinica y en investigacion. En la presente obra presento mi experiencia con el programa Anagraf, programa con el cual inicié mis estudios en el andlisis actistico, posteriormente de- sarrollé mi tesis de doctorado y actualmente continto utilizando junto a otros programas de andlisis, tanto en clinica, educaci6n e investigacién. Si bien todos los casos son analizados con este programa, muchas de las aplicaciones aqui desarrolladas pueden aplicarse con otros programas de anélisis actistico que se encuentran en el mercado. E] libro esta formado por 14 capitulos donde se describe el programa Anagraf y su funcionamiento, los parametros de andlisis actistico obtenidos con el programa Anagraf y con otros programas, la interpretacién de las ventanas de andlisis, la valoracion de la coordinacién fono-respiratoria, la informacién provista por los formantes, la coincidencia arménicos formantes, la medicién del vibrato, la valoracién del singing formant, los registros vocales, el andlisis de formantes en frecuencias agudas, la relacién entre valoracién perceptual y acustica y el informe fonoaudiolégico. Este libro esta dirigido fundamentalmente a quienes se dedican a la valora- ci6n, tratamiento e investigacién de la voz, como es el caso de fonoaudidlogos, logopedas, médicos otorrinolaringélogos, foniatras y a todo aquel que se interese por los aspectos involucrados en la produccién vocal. Luis Alberto CecconelloCapitulo 1 Analisis acistico. Laboratorio de voz. Estudio objetivo de la voz? El anilisis actistico de la voz, a veces llamado “Laboratorio de la voz”, es un estudio no invasivo, ya que consiste en grabar frente a un micréfono, una serie de vocalizaciones y de este modo, obtener datos cualitativos y cuantitativos sobre la calidad y funcionalidad vocal. Algunos autores emplean el término “Laboratorio de voz” para referirse a una serie de examenes de la voz, donde se incluyen: analisis perceptual, andlisis actistico, estroboscopia laringea, electroglotografia, etc. En este libro, el término Laboratorio de voz sera utilizado como sinénimo de Anilisis acistico de la voz. Las utilidades del andlisis actstico son: * Estudios de voz: Normal y patoldgica. * Evaluacién y soporte del diagndstico en disfonias: El andlisis actistico, realizado como tinica valoracién, no permite realizar un diagndstico, pero es de utilidad como soporte al diagnéstico médico, permitiendo aportar datos de importancia para realizar un diagndstico diferencial. * Comparacién de la voz antes y después de la cirugia: Es posible medir las diferencias de la voz antes de efectuar una cirugia y luego de la misma. De este modo podremos determinar si la misma produjo mejoras en la voz. * Comparacién de la voz antes y después de la terapia de radiacién de la glotis o de la incorporacién de teflon * Efectos del entubamiento endotraqueal en las caracteristicas de la voz. * Documentacién de las mejoras en la voz luego del tratamiento fonoaudio- I6gico: con el objeto de documentar las mejoras de la voz producidas luego del tratamiento fonoaudioldgico realizando una comparacién pre-post tratamiento. * Estudios de las voces profesionales: Estudios a cantantes, locutores, acto- res, oradores, docentes, etc. * Estudios de la voz cantada: Estudio del timbre, vibrato, apoyatura, defini- cidn de las cualidades vocales, andlisis de los diferentes registros, determi- naci6n de la colocacién vocal, etc.* Anilisis del avance en la técnica vocal: Aplicable en estudiantes de canto, de locucién, etc. Para medir los progresos en los indicadores de la técnica vocal, por ejemplo el manejo de los cambios de frecuencia (rango vocal) y energia (rango dinémico) en locutores, también es posible medir el progre- so en el apoyo respiratorio en cantantes, la colocacién vocal, etc. + Entrenamiento de técnica vocal con refuerzo visual: Mediante apoyo visual de diferentes componentes del laboratorio de voz (Curvas de FO, energia, espectograma) es posible realizar entrenamiento en tiempo real. Esto significa que a medida que la persona intenta realizar un ejercicio con las instrucciones dadas por el terapeuta o el profesor de canto, puede observar en tiempo real como es su produccién vocal y de este modo modificarla inmediatamente. * Mayor comprensién de un problema vocal: Permite realizar una asociacién de la valoracién perceptual-aciistica y laringoscépica y de este modo tener una comprensién mas amplia del problema. + Investigaci6n: El analisis aciistico es una herramienta importante para el desarrollo de investigaciones en el rea vocal, sirviendo como complemen- to a otros métodos de valoracién vocal. El laboratorio de voz fue considerado hasta el momento como un estudio objetivo de la voz, por la posibilidad de cuantificar los resultados, Actualmente se considera que este estudio no es objetivo, siendo por supuesto menos subjetivo que el andlisis perceptual de la voz. La razén por la cual no es un estudio objetivo, es porque el ser humano participa en menor 0 mayor medida en el anilisis, donde se requicre la interpretacién de los resultados obtenidos; de este modo, los resultados quedaran sujetos a la experiencia y conocimientos de quien realiza el andlisis. Mas alla de este dato, se debe considerar, que la importancia del Laboratorio de voz, radica en que permite bajar a tierra, informacién que era abstracta hasta el momento, siendo una forma de convertir a papel o en una pantalla, la informacion que antes solo podiamos obtener desde la perceptualidad, sumado a datos cuantitativos por medio de los cuales se realiza una interpretacién de diferentes aspectos involucrados en la produccién vocal.Capitulo 2 Conociendo Anagraf El programa Anagraf (Gurlekian, 1997) fue desarrollado por el Laboratorio de Investigaciones Sensoriales (L.I.S.) dependiente del CONICET de Buenos Ai- res, Argentina, dirigido por el Ingeniero Jorge Gurlekian. El laboratorio esta formado por 3 médulos principales que comparten un pro- tocolo comin en el acceso de datos (Gurlekian, 2002). * Editor de audio: Provee herramientas para realizar operaciones de entrada y salida de informacion analégica hacia y desde la computadora. * Médulo de analisis actistico del habla: A través de este médulo podemos obtener una descripcién del habla en base a diversos pardmetros actisticos caracteristicos de la misma. Se utilizan los algoritmos y técnicas de andlisis mds apropiadas para determinar los valores de cada parametro. 1. Espectro de corto tiempo: evalta la intensidad sonora sobre distintas bandas espectrales. CaAlculo de coeficientes de prediccién lineal: obtiene pardmetros repre- sentativos de un modelo de tracto vocal y determina las frecuencias de resonancia del mismo (formantes, Fl , F2 .F3 .F4.....). 3. Procesamiento homomérfico: estima la frecuencia de vibracién de las cuerdas vocales (frecuencia fundamental). 4. Los valores de los diferentes parametros son suministrados a intervalos regulares por estos algoritmos, generando contornos temporales que son almacenados en un archivo para su posterior utilizacion. * Sistema de graficacién: Toda la informacién proporcionada por el médulo de andlisis se aplica para la graficacién de la forma de onda en sincronia con los contornos de la Energia Total Relativa, la Frecuencia Funda- mental (FO) y las frecuencias de resonancia del tracto (Formantes) gra- ficados en el espectograma en los ejes de energia, frecuencia y tiempo. Ofrece ademas las facilidades de visualizacién, audicién y edicién de un editor de audio comim. Se puede observar la forma de onda completa, el desplazamiento sobre segmentos con distinta expansién temporal, el con- catenamiento de segmentos y el monitoreo actstico simultaneo con la re- presentacién espectral seleccionada. 2.En la figura 2.1 se presenta la pantalla principal del programa Anagraf, la cual se divide en ventanas de gréficos, datos y botones de funcién a la izquierda. Las ventanas de grdficos son 4: En la ventana superior se grafica la onda completa en negro, en la segunda ventana el espectograma (en este caso de banda ancha), en la tercer ventana la forma de onda (wave) en verde y en la ventana inferior se grafican los contornos de Energia total (rojo), Frecuencia-F0 (azul) y Cruces por cero (verde), todos sincronizados en el tiempo. wonndte auTedestsayidiate A continuacién se presentan los botones de funcién y la ventana de datos numéricos. <>) Abrir un archivo-guardar un archivo > iniciar la grabacién-detener la grabacion —> pausa-reproducir la grabacién cortar-volumen de reproduecién —p copiar segmento de onda-pegar segmento de onda —p Invertir onda- eliminar Ia componente continua presente en la seital — zoom menos-zoom mas aplicado a la onda verde —> Waveform. Forma de onda completa |b narrow band. espectoGRama de banda angosta -» wide band, espectograma de banda ancha |» LPC Rpw Peaks. Picos maximos de los formantes |p Section spectra, Seccién 0 espectro instanténeo-LTAS (Long Term average spectra) > waveform segment. segmento de la onda * |» Zero crossings. Cruces por cero-Energia total Overall energy, Root Mean Square. RMS Se] eo] #2 [> FO calculada por: Cp: cepstrum. ce: ciclo a ciclo, FO: Método de auto correlacién y programacion dinamica|p Etiquetas de Misceléneas > Alfabetos sampa e ipa > Ventana de Configuracién, —p Ventana de datos numéricos-puerta de salida Foie Pad ten Foret 26) Smet 595 | a (eoy v7 Shimmer aE 36 | Ventana de DATOS NUMERICOS. se subdivide en 6 sectores: * Sector 1: Valor de energia total, derivada de la energia total y energia ins- tanténea, * Sector 2: Nota musical correspondiente a la frecuencia de fonacién, FO, Barks, ERBs, frecuencia instantanea y Mels. * Sector 3: Valores de frecuencia de los primeros 5 formantes * Sector 4: Valores de banda de los primeros 5 formantes * Sector 5: Tiempo, frecuencia instantanea en el espectro, amplitud de onda, duracién, amplitud del cepstrum y cruces por cero. * CAL: Botén de calculo de los principales parametros de voz * Sector 6: FO promedio, f0 ciclo a ciclo, relacién arménico ruido, Jitter promedio, jitter ciclo a ciclo y shimmer. CON EL ANALISIS ACUSTICO DE LA VOZ, LOS RESULTADOS BRINDAN GRAFICOS Y VALORES NUMERICOS SOBRE: * VOZHABLADA: 1. Inicio vocal 2. Cuerpo de la emisién 3. Liberacién o final de la emisién 4. Frecuencia fundamental 5. Rango frecuencial en Hz 6. Rango frecuencial en semitonos 7. Energia Total RelativaLuis Alberto Cecconello 8. Temblor (trémolo) en Hz 9. Temblor (trémolo) en dB 10.Jitter (cc) 11. Jitter (pr) 12. Shimmer (%) 13. HNR (relacién arménico- ruido) 14. Amplitud Cepstrum 15. Cruces por Cero 16. Quiebres de voz 17. Presencia de ruido 18. Presencia del Formante Nasal 19. Estudio de formantes, anchos de banda y energias 20. Calidad vocal- colocacién vocal: coincidencia de valores de formantes con valores de arménicos. VOZ CANTADA: 1. Inicio vocal 2. Cuerpo de la emisién 3. Liberacién o final de la emisién 4, Frecuencia fundamental 5. Energia Total Relativa 6. Amplitud Cepstrum 7. Cruces por Cero 8. Vibrato en Hz 9. Vibrato en dB 10.Fluctuacién de la frecuencia fundamental en Hz 11. Fluctuacién de la frecuencia fundamental en semitonos 12.Quiebres de voz 13.Estudio de diferentes registros vocales 14.Presencia del Formante Nasal 15.Presencia del Singing Formant (formante del cantante) 16.Apoyo diafragmatico en la emision 17.Estudio de formantes, anchos de banda y energias 18.Calidad vocal-colocacién vocal: coincidencia de valores de formantes con valores de arménicos.Capitulo 3 Parametros acisticos “Frecuencia fundamental (FO): Es la frecuencia mas baja de un sonido complejo. Es indicada en la literatura mas antigua por c/s (ciclos por segundo) y en Hz en la literatura mAs moderna. La frecuencia fundamental (FO) de una voz posee el mismo valor de la frecuencia glética (Fg). Los datos experimentales apoyan el concepto de que la frecuencia de vibracién de los pliegues vocales, llamada también tono glotal o laringeo, frecuencia fundamental o FO varia de acuerdo a la tensién longitudinal de los pliegues vocalicos, de la masa del tejido implicado en la vibracién y de la presion subglotica. A mayor presién subglotica y tension, mayor frecuencia de vibracién (Borzone de Manrique, 1980). Existen varias estrategias para la lectura de FO como el conteo de picos (pick- peaking), cruces por cero (zero-crossing) y cepstrum, siendo los primeros dos métodos los mas empleados. La estrategia del conteo de picos tiene en cuenta que existe un pico positivo y uno negativo para cada ciclo, numerandose los ciclos en una misma direccién. Cruces por cero considera que el voltaje de onda cruza la linea cero dos veces, una en sentido positivo y otra negativo, en cada ciclo, por lo tanto puede contarse el ntimero de veces que la onda cruza la linea cero en una direccién o en otra (Behlau et al, 2004). El calculo del cepstrum resulta en la determinacién del pico de mayor amplitud en una escala temporal, lo que permite calcular el valor de la frecuencia fundamental (Cecconello, Farias & Gurlekian, 2008). De acuerdo a Behlau et al (2004), el cepstrum es un método extremada- mente poderoso para la medicién de FO, basado en el dato de que la sefial vocal es una interaccién de la sefial de la fuente (laringe) y de la respuesta del tracto vocal (sistema de resonancia). Baken! (1987) explica que el espectro se la sefial vocal es un producto complejo del espectro de la fuente glotica y de la funcién de transferencia del tracto vocal: F[f(t)] = F[s(t)] x F[h(t)]. El método cepstrum inicia filtrando los componentes agudos del espectro, convirtiendo las ondas en valores numéricos de 10000 lecturas por segundo, descubriendo los componentes de frecuencia y sus amplitudes. La onda es procesada y de este modo se llega al + Citado en Behlau, M., Madazio, G., Feijé, D., Pontes, M, Voz O Livro do Especialista. Volume I. Ed. Revinter. waliac&o de voz. En: Behlau, io de Janeiro, 2004, pp 141.Luis Alber ‘0 Cecconello calculo de cepstrum que es formada por una reversi6n parcial del espectro. Anagraf posee tres métodos de andlisis de FO: 1, FO: Método de auto correlacién y programacién dinamica (método espectral). 2. Cp: calculo de FO por cepstrum (método cepstral) 3. Cc: calculo de FO ciclo a ciclo (método temporal). Cp es recomendable para estudios de voz, FO para estudios de habla. Los primeros dos métodos se consideran mas confiables ya que promedian segmentos de la onda segiin la ventana de anilisis. E| método estandar (FO) permite ver el contorno de FO solo en los segmentos de la sefial que son altamente confiables (amplitud suficiente y periodicidad comprobable). Su utilizacién es mas de uso fonético que foniatrico. El calculo de FO por cepstrum da mayor informacién para fines foniatricos. En las zonas de ausencia de FO o de ruido, grafica una nube de puntos sin continuidad. El cdlculo de FO ciclo a ciclo es altamente impreciso, por tener menos res- tricciones para la medicién. Puede ser itil como método mas arriesgado, cuando los otros dos métodos se inhiben o no muestran valores que serian esperables (Gurlekian, 2008). De acuerdo a Behlau et al (2004), las medidas de FO obtenidas del habla enca- denada, han sido cuestionadas y consideradas cientificamente inadecuadas debido a variaciones inherentes al material de habla y a las caracteristicas de prosodia del texto utilizado en el andlisis. Cecconello (2007) realizé un trabajo en el que compar6 el valor obtenido de FO mediante valoracién subjetiva con dos métodos aciisticos (andlisis de una vocal prolongada y andlisis de una frase fonéticamente balanceada) en 70 sujetos, encontré mayor coincidencia entre el método subjetivo y el anlisis acustico de la frase fonéticamente balanceada (95,5%), en el andlisis de la vocal prolongada solo se obtuvo un 21,4% de coincidencia con el método subjetivo. Concluye que para obtener Ia frecuencia mas utilizada (habitual) del paciente resulta ms exacto extraerla a través del andlisis de una frase. Esto tiltimo no quiere decir que deba reemplazarse un método por otro, ya que el analisis de la vocal es necesaria para obtener medidas de perturbacién, pero para conocer la frecuencia de uso habitual de una persona se sugiere analizarlo a través de una frase. El valor de FO varia con el sexo y la edad, los valores mas frecuentes son de 125 Hz en hombres, 250 Hz en mujeres y 350 Hz en nifios (Jackson Menaldi, 1981). De acuerdo a Behlau et al (2004) el valor de FO en hombres varfa de 80 a 150 Hz, en mujeres de 150 a 250 Hz y en nifios se observan valores superiores a los 250 Hz, alcanzando los 400 Hz en bebés. Cecconello & Golub (2009) encontraron en una investigacién realizada con nifios de Argentina sin y con alteracién vocal una media de 247, 16 Hz en nifios con voz normal y una media de 232,94APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL. TRABAJANDO CON ANAGRAF Hz en nifios con alteracin vocal. De acuerdo a Farfas (2007), en voces patolé- gicas se observa un descenso de FO debido a la lesién de masa como nédulos, pélipo, edema, etc, lo que produce una disminucién de la vibracién cordal, algo similar ocurre en disfonias sin lesién cordal donde el aire se escapa sin hacer vibrar los pliegues vocales o haciéndolos vibrar menos de lo esperable. De acuerdo a Behlau et al (2004), la frecuencia fundamental (FO) de una persona est determinada fisiolégicamente por el niimero de ciclos gléticos que se repiten, por ende, cualquier ajuste que reduzca los ciclos gloticos reducira también la frecuencia fundamental. Cabe agregar por otro lado, que en patologias especificas como por ejemplo: mutacion incompleta, falsete de conversién, sulcus, etc, se obtendrd el efecto opuesto (incremento de FO). *Energia total (Et): Es la representacién de la onda, basada en la sumatoria de los valores de amplitud al cuadrado de todos los componentes de frecuencia durante un corto tiempo (Gurlekian, 2002). La energia esta relacionada al loudness. Se considera como valor de normalidad > 20 dB. Puede existir disminucién de la energia total ante problemas neu- rolégicos donde se vea disminufda la aduccién gléotica, problemas respiratorios, etc. El incremento de la energia suele ocurrir ante mal uso vocal, problemas au- ditivos, etc. *Derivada de la energia total (Det): Es el cociente entre la variacién de energia (comienzo y primer pico) y un tiempo minimo de referencia (ej: 40 mseg.) (Gurlekian, Facal & Salvatori, 1996). Es una medida implementada por Anagraf para medir el inicio vocal’. Cuando el valor es superior a 1 concluimos que el inicio vocal es duro, en caso contrario pueden pasar dos cosas, que el inicio vocal sea equilibrado (normal) o soplado; para diferenciar entre estos dos tiltimos necesitaremos recurrir a otros elementos de analisis como por ejemplo el espectograma. *Medidas de perturbacién Las medidas de perturbacién pueden clasificarse en corto plazo y largo plazo de acuerdo con su variacién en el tiempo. Los indices de perturbacién a corto plazo reflejan fendmenos de comparacién ciclo a ciclo y presentan gran importancia ® Es aconsejable no utilizar el término Ataque vocal ya que lleva a la idea de algo for- zado, ademés es redundante hablar de ataque duro, por eso se recomienda utilizar el término Inicio.clinica (Behlau ct al, 2004). En esta categoria podemos incluir el jitter y el shimmer. En cambio, los indices de perturbacién a largo plazo manifiestan fendmenos de perturbacién lentos o relativamente lentos; on esta categoria se incluyen el tremor y el vibrato. Jitter: E| jitter mide la variabilidad de la frecuencia fundamental ciclo a ciclo. Mide cuanto difiere un perfodo dado de su periodo consecutivo, de este modo, el jitter es una medida de la variabilidad de frecuencia sin tener en cuenta los cambios voluntarios de la frecuencia fundamental, Valores pequefios de jitter se consideran normales, en cambio valores grandes se consideran patdlégicos (Jackson Menaldi, 1981). La palabra jitter fue incorporada hace mucho tiempo a la jerga de la teleco- municaci6n y recientemente al vocabulario de 4 fonoaudiologia (Vieira & Costa e Rosa, 2006). El estudio de los parametros de la frecuencia fundamental y sus variaciones en altura intensidad (jitter y shimmer) tienen como una de sus funciones la de proveer dato para el diagndstico, control, tratamiento y acom- pafiamiento de personas que presentan o no disturbios de voz (Pinto Spinelli & Behlau, 2001). Las vibraciones de personas con lesién en los pliegues vocales presentan aumento en aperiodicidad, lo que es refiejado en valores aumentados de jitter y si bien este pardmetro no refleja la etiologia de la disfonia, su magnitud refleja la extensi6n de la alteraci6n registrada (Behlau et al, 2004). En la figura 3.1 se observa la medicién de jitter con el programa Anagraf, en una persona sin alteraci6n vocal obteniéndose un valor bajo de jitter y en la figura 3.2 se observa la medicién de jitter en un nifio con nédulos, en el cual se obtiene un valor incrementado de jitter indicando mayor aperiodicidad. i ncn e“le nt oe neon Figura 3.1, Ejemplo de medicién de jitter de una vocal sostenida con el programa Anagraf en una persona sin alteracién vocal. Los corchetes rojos poseen el mismo tamafio, puede observarse la similaridad de los sucesivos ciclos. Jitter = 0,7% fe fap A, ws fpf Nh , Daf] hs ah Af Figura 3.2 Ejemplo de medicién de jitter de una vocal sostenida con el programa Anagraf en un nifio con nédulos. Los corchetes rojos poseen el mismo tamajio, puede observarse la diferencia entre los sucesivos ciclos. Jitter = 13,43%.APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL, TRABAJANDO CON ANAGRAF Existen varios métodos de medida de jitter, absolutos y relativos, la tendencia actual es la de emplear medidas relativas. Las medidas absolutas son los valores de perturbacién del periodo que ignoran la frecuencia fundamental, expresa la diferencia media absoluta entre los periodos secuenciales medidos durante la fo- nacidn continuada, se expresa en segundos, milisegundos 0 microsegundos. Hay varios indices absolutos pero nunca resultaron populares, por ejemplo el factor de perturbacién y el factor de perturbacién direccional (Behlau et al, 2004). El indi- Ce propuesto por Liberman, llamado factor de perturbacién (FP) es el porcentaje de todas las perturbaciones iguales o mayores a medio milisegundo. Otra medida es la propuesta por Heckel y Kreul (1971)°, llamado factor de perturbacién direccional (FFD),’es independiente del valor absoluto de las perturbaciones de los periodos, relacionandose solamente con el ntimero de veces que la frecuencia cambia el sentido del desplazamiento. El FFD se define como el porcentaje del niimero de veces que se produjo un cambio de signo de las diferencias de periodos consecutivos (Jackson Menaldi, 1981). De acuerdo a Behlau et al (2004), las medidas relativas de jitter consideran la frecuencia fundamental media, existiendo varias medidas relativas de jitter: + Factor medio de jitter, se obtiene dividiendo la perturbacién media por la duracién media de onda, multiplicado por 100. * Proporcién de jitter, idem al factor de jitter pero en relacién al perfodo multiplicado por 1000. * Indice de variabilidad de los periodos, derivado de estadistica descriptiva. + Jitter RAP- Perturbacién media relativa (Relative Average Perturbation), también llamado cociente de perturbacién de frecuencia, emplea una medida de tres puntos y desconsidera las alteraciones lentas que no son de interés y que inflan las medidas. * Jitter PPQ- Cociente de perturbacién de frecuencia (Period Perturbation Quotient), emplea una medida de cinco puntos. + Desvio de linearidad, medida parecida al jitter RAP, con calculos adicio- nales. Las medidas relativas se expresan en porcentajes, los valores de normalidad dependeran del programa utilizado y de los algoritmos, en el programa Anagraf se considera como valor limite de normalidad 1% para el Jitter cc. Otra medida de jitter que puede obtenerse con Anagraf es el jitter promedio, pero no posee datos normativos. Se considera de mayor confiabilidad el jitter cc. En la figura 3.3 se presenta el algoritmo utilizado para la medicién del jitter cc en el programa Anagraf. ° Citado en Jackson Menaldi, C.: La voz normal. Ed. Panamericana. Buenos Aires, Ar- gentina, 1981, pp 149.12 Luis Alberto Cecconello N-1 Jitter (%) = 100 / (N-1) F S_ Mod (Fi -Fi+1) Figura 3.3. Algoritmo de Jitter cc del programa Anagraf. De acuerdo a Colton, Casper & Leonard (2010), la perturbacién de frecuencia puede ser también medida por medio dv grebaciones oscilograficas, pero esto exige una serie de medidas manuales ademis de ser una tarea tediosa y poco practica. El jitter se encuentra alterado especialmente con la falta de control en la vibra- cidn de los pliegues vocales, como sucede por ejemplo en disfonias neuroldgicas. E| jitter se correlaciona con la aspereza (Behlau et al, 2004). -Shimmer: E] shimmer mide la variacion de la amplitud, es una medida basada en la amplitud de cada ciclo fonador. De acuerdo a Behlau et al (2004), el shimmer representa las alteraciones irregulares en la amplitud de los ciclos gléticos, de un ciclo al otro. Las perturbaciones de la amplitud son medidas en base a los picos de amplitud de cada ciclo fonatorio, lo cual es muy diferente del valor promedio de la amplitud, usado como base del SPL (Sound level pressure), que no debe con- fundirse con los picos de amplitud que deseamos medir (Jackson Menaldi, 1981). En la figura 3.4 se observa la medicién de shimmer con el programa Anagraf, en una persona sin alteracién vocal obteniéndose un valor bajo de shimmer y en la figura 3.5 se observa la medicién de shimmer en un nifio con nddulos, jen el cual se obtiene un valor incrementado de shimmer indicando mayor perturbacién de amplitud. Ww NWN WW Ww ye Nyt yh fl | Figura 3.4. Ejemplo de medicién de shimmer de una vocal sostenida con el programa Anagraf en una persona sin alteracién vocal. Puede observarse la similaridad de los picos de los sucesivos ciclos. Shimmer = 0,12%.Apu ANALISIS 13 me ne vy yy a yy Figura 3.5. Ejemplo de medicién de shimmer de una vocal sostenida con el programa Anagraf en un nifio con nédulos. Puede observarse la diferencia en los picos entre los sucesivos ciclos, Shimmer = 0,97%. Existen varias medidas de shimmer como: * Shimmer medio en decibeles, es la diferencia media absoluta * Shimmer medio en porcentaje, es la diferencia media absoluta dividida por la amplitud media + Shimmer APQ- Cociente de perturbacién de amplitud (Amplitude Perturba- tion Quotient), es semejante al RAP o al PPQ del jitter.(Behlau et al, 2004). Las medidas reltivas de shimmer se miden en porcentajes. El valor limite de normalidad en el programa Anagraf es 0,5%. En la figura 3.6 se presenta el algoritmo utilizado para la medicién del shimmer en el programa Anagraf. N-1 Shimmer (%) = S / Mod (20 log Ai / Ai+1) / (N-1) Figura 3.6. Algoritmo de Shimmer del programa Anagraf. Tanto el jitter como el shimmer deben ser medidos por medio del anilisis de vocales sostenidas, en una frecuencia, sin variacion musical o de intensidad, emitidas de modo habitual, eliminandose el inicio y el fin de la emisién por sus caracteristicas irregulares. Para el andlisis del shimmer es importante mantener fija la distancia de la boca al micréfono, generalmente se utiliza un microfono de aire de alta calidad (Jackson Menaldi, 1981). De acuerdo a Behlau et al (2004), existen variaciones intrinsecas del jitter y del shimmer en cada vocal, ademas los valores sufren vaia- ciones de acuerdo al sexo y a la edad. El shimmer se correlaciona con el jitter (r = 0,71) (Vieira, 1997), 0 sea que al variar el jitter, varia el shimmer proporcionalmente, esto puede suceder del + Citado en Vieira, M., Costa e Rosa, L.: Avalacao actistica na pratica fonoaudiolégica. En: Pinho, S., Tsuji, D., Bohadana, S.: Fundamentos em Laringologia e Voz. Revinter. Rio de Janeiro, 2006, pp 43.siguiente modo: si pensamos que con la perturbacién de frecuencia, las oscilaciones al final de los ciclos de la sefial acistica tendrin diferentes amplitudes, de forma que la superposicién con el inicio de los siguiente ciclos sera variable causando perturbacién de amplitud (Vieira & Costa e Rosa, 2006). EI shimmer se altera especialmente cuando existe reduceién de la resistencia glotica, lo que sucede en parilisis de pliegues vocales; fallas de contacto glético también producen valores de shimmer elevados, al igual que sucede en presencia de lesiones de masa y ante edema difuso. El shimmer se correlaciona con la presencia de ruido (ronquera) y con soplosidad (Behlau et al, 2004). -Tremor El tremor se define como una modulacién de 1 a 15 Hz de un parametro cicli- co (frecuencia o amplitud) de la sefial de voz, la cual puede tener un origen neuroldgico o ser una combinacién entre propiedades biomecanicas de los pliegues vocales y factores neuroldgicos. De acuerdo a Tosi & Behlau (1999), se producen movimientos involuntarios, relativamente ritmicos y sinusoidales que afectan ya sea una o varias porciones del habla, puede ser en el nivel respiratorio, fonatorio 0 articulatorio. El tremor neurolégico puede variar ampliamente, ocurriendo de modo lento, aproximadamente 1 a 2 Hz, es llamado Wow y asociado frecuentemente a un tremor rapido de 10 Hz, en una oscilacién compleja, en personas con esclerosis miltiple; en el Parkinson encontramos un tremor medio de 3 a 7 Hz, y en el tremor esencial entre 5 a 7 Hz. En la esclerosis lateral amiotr6fica se produce un rapido tremor, entre 10 y 20 Hz, llamado flutter (Kent, Weismer, Kent, Vosperian & Duffy, 1999)'. Existen pocos trabajos sobre el tremor en personas sin alteracion vocal, Char- pied & Grillone (1997) estudiaron el tremor en 60 hablantes, 30 hombres y 30 mujeres, encontraron 2,51 Hz de tremor de frecuencia y 4,98 Hz de tremor de amplitud. Tosi & Behlau (1998), en 50 mujeres sin alteracién vocal, obtuvieron una media de FO tremor de 2,42 Hz y de amplitud tremor de 2,32 Hz. Cecconello & Golub (2009) analizaron 104 nifios, 48 sin alteracién vocal y 56 con disfonia, encontraron con el programa Dr Speech, en el grupo sin alteracién vocal una media de FO tremor de 2,46 Hz y una media de 2,6 Hz de amplitud tremor, en el grupo con alteracién vocal encontraron una media de FO tremor de 4,25 Hz y una media de amplitud tremor de 4,16 Hz. * Citado en Behlau, M., Madazio, G., Feijé, D., Pontes, P.: Avaliag&o de voz. En: Behlau, M. Voz O Livro do Especialista. Volume I. Ed. Revinter. Rio de Janeiro, 2004, pp 145 Citado en Tosi, D., Behlau, M.: Indice de perturbacdo da frectiéncia fundamental a Curto e a longo prazo em mulheres sem alteracdo vocal, Séo Paulo, 1998. Monogra- fia-especializacéo-Centro de Estudios Da Voz. En Behlau, M.: A voz do especialista, Vol II. Ed. Revinter, 2005, pp 69.APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA vt CON ANG 15 El tremor fisiolégico normal puede amplificarse en situaciones de frio, ner- vios, emocién, estrés 0 en alteraciones relacionadas a la edad, como en la presbi- fonia. El tremor patolégico es una modulacién irregular e indeseada que da una caracteristica trémula y oscilante a la cualidad vocal. Enfermedades de origen neuroldgico pueden tener una amplificacién del tremor (Behlau et al, 2004). Si bien el programa Anagraf no implementa medidas de tremor, mediante andlisis de las curvas de frecuencia y energia es posible analizar el mismo. En el capitulo 9 se puede observar un ejemplo de tremor y su medicién. -Vibrato Seashore, quien inicié el estudio del vibrato en la Universidad de Lowa, define en 1932 al vibrato como “Una pulsacién de la frecuencia que se acompaiia generalmente de pulsaciones sincrdnicas de intensidad y de timbre, de forma que dan una flexibilidad agradable, ternura y riqueza al sonido”. En el canto operis- tico occidental se utiliza un tipo de vibrato caracterizado por una ondulacién de la frecuencia fundamental. Un factor significante en la produccién de este tipo de vibrato parece ser las contracciones pulsatiles del misculo cricotiroideo. En cambio, en el canto popular y en el canto de algunas culturas no occidentales, se escucha frecuentemente otro tipo de vibrato el cual parece conducido por una pulsacién de la presién subglotica (Sundberg, 1994). De acuerdo a estudios realizados con EMG (Electromiografia), concluyen que el musculo cricotiroideo es el encargado de la modulacién de frecuencia (Mason & Semlin, 1966; Shipp, Leanderson & Haglund, 1982; Shipp, Doherty & Haglund, 1990; Hirano, Hibi & Hagino, 1995). Se observaron modulaciones del cricoari- tenoideo lateral y del tiroaritenoideo. Un aspecto importante es que el masculo cricotiroideo adelgaza el borde de las cuerdas vocales y es necesario un incremento simultaneo del misculo tiroaritenoideo para minimizar cambios en el grosor del borde de la cuerda vocal y como consecuencia la disminucién del sonido a nivel glético. El misculo interaritenoideo mantiene un nivel de actividad durante el vibrato, pero este mtsculo no participa de modo significativo en el control de la frecuencia, intensidad y calidad vocal. Los misculos respiratorios parecen no realizar oscilaciones durante el vibrato. Si bien el flujo aéreo oscila, se supone que no es causado por modulaciones de la presién pulmonar, sino por modulaciones de la resistencia glética (Hirano, Hibi & Hagino, 1995). Titze (1989) mostré en sus tra bajos que el flujo aéreo medio en los tonos con vibrato es un 10% superior, aproximadamente, que en los tonos sin vibrato producidos con una misma frecuencia y nivel de intensidad, de este modo, los tonos sin vibrato se asocian a una resistencia glotica media superior que los tonos con vibrato. Se ha observado que muchas estructuras del érgano vocal como el velo, la base de la lengua, la epiglotis y la pared lateral oscilan en sincronia con el vibrato. Consideran que su participacién en la modulacién de frecuencia es insignificante. Los movimientos del tracto cuando son16 is Cecconello moderados y adecuados en extensién, parecen ser adecuados para evitar tension y tigidez en los ajustes del tracto vocal. Oscilaciones excesivas del tracto vocal pueden causar un vibrato desfavorable (Hirano, Hibi & Hagino, 1995). Otros autores también han observado los movimientos de estructuras del tracto vocal que algunas veces oscilan en sincronia con el vibrato (Ondrackova, 1969; Selkin)’ Caracteristicas actisticas del vibrato: * Rate (Velocidad): Se refiere a la frecuencia de la modulacién de la frecuencia fundamental, al numero de ondulaciones por segundo. Una frecuencia inferior a 5,5 Hz o superior a 7,5 Hz se considera poco esté- tica y sintomatica de patologia vocal. Por debajo de 5 ciclos/segundo se percibe la ondulacién de la nota y no se percibe con claridad un tono uniforme, es lo que puede ocurrir en la senectud o en voces forzadas. Por encima de 7 ciclos/segundo el tono parece nervioso, inestable, tembloroso, voz caprina (Cobeta 1996, Pere- 116 & Caballé, 1982). Mas que ningiin otro aspecto audible del timbre. vocal, el vibrato rate es un indicador de la produccién vocal libre o de la produccién vocal ineficiente, un vibrato adecuando es signo de salud, voz cantada bien producida. Cuando el vibrato rate es demasiado rapido, el timbre sufre de trémolo, el cual es producto de hiperfuncién, con presién subglotica demasiado intensa para la respuesta normal de la laringe y cuando el vibrato rate es demasiado lento, los italianos Io Ilaman “la voce oscilla”, “la voce balla”, el término oscillazione describe el wooble, usualmente se produce por debilidad de los pliegues vocales, por insuficiente resistencia al flujo de aire (Miller, 1986). 4 El vibrato rate depende de varios factores, como el sexo y la edad y la impli- cancia emocional del cantante (Shipp et al 1980)*. + Extent (Extensién): La extensién o modulacién de la amplitud del vibra- to es la distancia de incremento y descenso de la frecuencia de fonacion durante un ciclo de vibrato (+/- 1 0 2 semitonos, o alrededor del 6% de oscilacién). Una extensién superior se considera inaceptable. El tono y la intensidad inffuyen en la magnitud de la extensi6n del vibrato pero hay una marcada variabilidad interindividuos (Cobeta, 1996, Perellé & Caba- Ilé, 1982). De acuerdo a Sundberg (1994), la extensién es generalmente menor a | semitono, correspondiendo a una frecuencia de oscilacién del 6% aproximadamente. Los cantantes de coro muestran velocidad de vibrato irregular con muy pequefia extensin, promediando no més de 0,1 semitonos. Cecconello (2009) realizé una investigacién donde se estudio 7 Citado en Sundberg, J. The science of the singing voice. Northern Illinois University Press, Dekalb, Illinois, 1987, pp 166. 8 Citado en Sundberg, J.: Acoustic and Psychoacoustic aspects of vocal vibrato. Speech, Music and Hearing: Quarterly Progress and Status Report 35,2-3: 45-68, 1994,las caracteristicas acusticas del vibrato en coreutas y encontré vibrato de gran irregularidad, con poca variacién de amplitud (0,9 dB) y extensién pequefia (0, 18 semitonos). Se considera que el vibrato actia en detrimento de la entonacién coral (Herald & Sten, 2004). Numerosos autores encontraron que la extensién del vibrato varia con el incremento de la intensidad (Winckel, 1953; Schultz Coulon & Battmer, 1981; Mi- chel & Myers, 1991). ; ¢ Regularity (Regularidad): La regularidad es considerada un signo de destreza vocal del cantante: cuanto més regular es el vibrato, mas habilidoso se considera al cantante. Por otra parte, en cantantes bien entrenados la regularidad generalmente no es influenciada apreciablemente ni siquie- ra en los casos en que el retorno (feedback) es enmascarado por el ruido (Schultz-Coulon, 1978)°. Robison, Bounous & Bailey (1994), estudiaron el concepto de “Belleza vocal”, solicitaron identificar las caracteristicas que a la percepcién de los oyen- tes correspondan con una voz entrenada. Las muestras fueron tomadas de 19 cantantes masculinos con entrenamiento.clésico y 8 mujeres cantantes belting. Concluyen que las voces mas hermosas tuvieron algunas caracteristicas actisticas en comin, como un contante y parejo vibrato rate con extensién moderada. La regularidad es considerada el mejor reflejo de destreza del cantante. « Waveform (Forma de onda): La forma de onda de las ondulaciones del vibrato es generalmente mas o menos similar a una onda sinusoidal, sin embargo desviaciones considerables de esta forma de onda ocurren (Sundberg, 1994), * Amplitude (Amplitud): La curva de intensidad muestra variaciones de amplitud. La modulacién de la amplitud o intensidad del vibrato no puede en- tenderse sin tener en cuenta la teoria aciistica de la produccién vocal. Las ondulaciones de la frecuencia fundamental producen una variacién sincrénica de los arménicos en toda la amplitud del tono. La intensidad dependera de si el mayor arménico es mayor 0 menor que la frecuencia del primer formante (Marqués et al, 2006). El vibrato de intensidad rara vez supera los 3 dB. La significacién perceptual de la amplitud del vibrato es a menudo sobres- timada. Si la amplitud del vibrato es muy pequefia, lo cual sucede cuando el parcial mas fuerte esta lejos del primer formante, la impresidn es casi la misma que cuando el parcial mas fuerte esta muy cerca del primer formante y la amplitud del vibrato es considerablemente grande. Todo esto da la impresién general que la amplitud del vibrato no es importante para la percepcién (Sundberg, 1987; Sundberg, 1994). ® Citado en Sundberg, J. The science of the singing voice. Northern Illinois University Press, Dekalb, Illinois, 1987, pp 163.18 Luis Alberto Cecconello * The phase relationship (Relacidn de fase): La relacién de fase entre vibrato de amplitud y vibrato de frecuencia depende de la relacién de frecuencia entre el primer formante y el mayor arménico, asi la variacién de la frecuencia del vibrato es suficiente para producir variaciones en la intensidad. Asimismo la forma del tracto vocal condiciona las frecuencias de los formantes (Marqués et al, 2006). El resultado de la modulacién de la frecuencia de fonacién es que la frecuencia de todos los sobretonos varian regularmente y en sincronia con la modulacién de la frecuencia fonatoria. Todas estas variaciones en las frecuencias de los parciales del spectro son acompafiadas por variaciones en la amplitud general. Por dos razones, esto no sorprende, Primero, la amplitud general del sonido de una vocal es normal- mente idéntico con la amplitud del parcial mas fuerte del espectro. Segundo, como también es bien conocido por nosotros, la amplitud de cada parcial del espectro es determinada por su distancia de las frecuencias fc formanticas; si un parcial aprovecha un formante, la amplitud del parcial se incrementara (Sundberg, 1987). Podemos inferir con seguridad que el vibrato puede causar que la amplitud general varie; cuando la frecuencia fundamental se incrementa en el ciclo del vibrato, la frecuencia del parcial mas fuerte podrd, o bien traer este parcial mas cerca del primer formante para que la amplitud de ese parcial y por lo tanto el nivel sonoro general se incremente, o puede traer el parcial més lejos del primer formante. Si un parcial aprovecha un formante cercano cuando la frecuencia se incrementa, amplitud y frecuencia variarén en fase y viceversa. Si el arménico mas fuerte es ligeramente inferior o ligeramente superior a la frecuencia del primer formante, en el primer caso, frecuencia fundamental y amplitud variaran en fase, en el segundo caso fuera de fase (contra-fase) (Sundberg, 1987). En la figura 3.7 se ilustra en A variacion en fase y en B en contra-fase. * Onset (Inicio): El inicio del vibrato se refiere a la cantidad de tiempo luego del comienzo de un tono hasta la ocurrencia de a modulacién del vibrato. En un estudio, jueces expertos, clasificaron el vibrato como significativamente mas bajo cuando se produce mas de 0,5 segundos después del inicio de la vocal, y el onset tardio tambign hizo probablemente que los jueces bajaran sus valores de otras caracteristicas perceptuales (Elkholm, Papagiannis & Chagnon, 1998). * Presence (Presencia): La presencia del vibrato es considerada como el porcentaje del tiempo de canto que la modulacién de frecuencia esta presente. Entre los cantantes clasicos altamente capacitados se encontré que se pro- ducia modulacién de frecuencia en el 95% del tiempo de canto en promedio, mientras que modulacién de amplitud presentaron del 50 al 70% del tiempo de canto aproximadamente (Mason, 1965)'° ** Citado en Reese, L.: Laryngeal-Level amplitude modulation in vibrato. Thesis for the degree of Master of Science. Department of Communication Disorders. Brigham Young University. December, 2006, pp 5.APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL, TRABAJANDO CON ANAGRAF 19 SS Fundamental frequency Frequency z 5 WS ww coseB . | Pia A 33 z= » es Frequency rer time Figura 3.7. En A, el arménico més fuerte es ligeramente inferior a la frecuencia del primer formante, frecuencia fundamental y SPL varian en fase. En B el arménico més fuerte es ligeramente superior a la frecuencia del primer formante, frecuencia fundamental y SPL varian en contra-fase. Adaptado de Sundberg, 198411. SPL Cecconello & Guzman (2009) investigaron la influencia de los parametros aciisticos en la percepcion de la calidad del vibrato. La muestra fue tomada de 15 cantantes masculinos de épera famosos, todos tenores. Un jurado conformado por 10 fonoaudidlogos especializados en voz cantada, profesores de canto y cantantes liricos profesionales realizaron valoracién perceptual, clasificando la calidad del vibrato en una escala de 5 puntos. Encontraron una alta correlacién negativa entre la calidad del vibrato y el vibrato jitter que es una medida de regularidad del vibrato, concluyen que la regularidad es el principal parémetro que influye en la percepcién del vibrato. *Formantes: La glotis constituye una fuente de pulsos periédicos que excitan las frecuencias de resonancias naturales del tracto vocal, a estas frecuencias se las llama Formantes. Todo formante posee tres dimensiones fisicas: frecuencia, ancho de banda y nivel de intensidad. Las frecuencias formanticas son alteradas por cambios en la forma del tracto vocal, incluyendo modificacién de la posicién de la lengua, apertura o cierre de la mandibula, redondeo o apertura de los labios y elevacién o descenso de la laringe (McCoy, 2006), Hombres, mujeres y nifios generalmente difieren en el largo del * Citado en Sundberg, J.: Acoustic and Psychoacoustic aspects of vocal vibrato. Speech, Music and Hearing: Quarterly Progress and Status Report 35.2-3: 45-68, 1994, pp 55.Luis Alberto Cecconello tracto vocal lo que significativo para las frecuencias de los formantes, es por ello que los valores las frecuencias de los formantes en la misma vocal serén diferentes en hombre, mujeres y nifios (Sundberg, 1987). El ancho de banda de un formante se define como el ancho del pico 3 dB por debajo del pico de amplitud. EI nivel o intensidad del formante es la intensidad o nivel de la envolvente correspondiente a la frecuencia del formante, Este valor se expresa en decibeles relativos a un nivel de referencia arbitrario, como por ejemplo, el nivel del primer formante de la vocal /o/ (Borzone, 1980). Los formantes corresponden a las frecuencias de resonancia de las cavidades que componen el tracto vocal ordenadas de menor a mayor. Cuando los armé- nicos se posicionan en valores préximos al valor de un formante pueden recibir distintos grados de amplificacién siendo esta mayor cuando coincide la frecuencia del arménico con la del formante (Gurlekian, 2010). *Espectografia acistica La espectografia acistica existe desde los afios 40, siendo utilizada por los americanos en la segunda guerra mundial, con el objeto de detectar el desplazamiento de las tropas, a través del andlisis de la voz del operador de radio. Luego de la guerra, el espectégrafo perdié su utilizacién inicial y termind siendo utilizado como recurso de ayuda en el desenvolvimiento del lenguaje de sordos o en laboratorios de fonética y lingtiistica (Potter, Kopp & Green, 1966)", El uso del espectégrafo como medio de comunicacién para los sordos no produjo los resultados esperados, répidamente se descubrié que la lectura de un registro espectografico era muy lenta y presentaba muchas dificultades debido a que un sonido no tenia siempre las mismas propiedades acisticas, sino que cam- biaban de acuerdo al contexto fonico (Borzone de Manrique, 1980). Generalmente son utilizados dos anchos de filtro de pasabanda: uno de banda ancha, de 300 Hz y otro de banda angosta, de 45 Hz. El andlisis de banda ancha provee de una mejor resolucién temporal de los fendmenos del habla, mientras que el filtro de banda angosta, una resolucién de frecuencia adecuada para estudiar los arménicos de las emisiones sonoras (Borzone de Manrique, 1980). En la figura 3.8 puede observarse el espectograma de banda ancha y angosta de una nifia cantante. Con el espectro de banda ancha podemos identificar claramente los formantes y con la banda estrecha (angosta) podemos visualizar el componente armonico y especialmente el vibrato. ¥ Citado en Behlau, M., Madazio, G., Feij6, D., Pontes, P.: Avaliag&o de voz. En: Behlau, M. Voz O Livro do Especialista. Volume I. Ed. Revinter. Rio de Janeiro, 2004, pp 151.2 AVEVITATEEEINEA Figura 3.8, Espectograma de una nifia cantante. A. Espectograma de banda ancha caracterizado por bandas verticales, puede observarse claramente los formantes. B. espectograma de banda angosta, caracterizado por bandas horizontales, puede observarse los diferentes arménicos y el vibrato producido en cada uno de ellos. Los espectogramas se basan en la transformacién de Fourier. Jean Baptiste Fourier fue un matematico francés quien demostré en el siglo XIX que las ondas periédicas pueden ser analizadas en sus diferentes componentes sinusoidales. Cuando el proceso se realiza por computadora, se llama Fast Fourier Transform (FFT) (Transformacién rapida de Fourier), produciendo un espectro que muestra la amplitud de cada arménico (Behlau et al, 2004).22 Alberto Cecconello El método de prediccién lineal, Linear Predictive Coding (LPC) se basa en conocimientos estadisticos y de ingenieria. Utiliza cdlculos basados en el dato de que cualquier muestra digitalizada de voz puede ser previsible a partir de sus componentes inmediatamente predecesores (Behlau et al, 2004). El clisico espectro de FFT es un espectro que nos muestra todos los arménicos, es utilizado para describir mejor la modificacién de los arménicos (hay de 20 a 50 arméni- cos) en el tracto vocal y para observar las anti-resonancias en sonidos nasales y fricativos. En cambio, el espectro de LPC, es mas adecuado para describir las resonancias mas importantes del tracto vocal, Ilamados Formantes (hay de 4 a 6 formantes). Desde el punto de vista perceptual es mas correcto interpretar un espectro de LPC ya que el ofdo no distingue més de 6 0 7 frecuencias simulténeas (Gurlekian, 2002). Al mostrar el espectro de FFT se puede superponer en el espectrograma el espectro de maximos de LPC. De este modo podemos observar si hay coincidencia entre los arménicos de la frecuencia fundamental y las frecuencias de resonancia del tracto vocal (Formantes). Si hay buena coincidencia, hablamos de maximo aprovechamiento de energfa. Esta coincidencia la mediremos con los anchos de banda de los formantes. A mayor aprovechamiento de energia menor valor de B (ancho de banda) y viceversa (Gurlekian, 2002). En la figura 3.9 se observa de modo simulténeo los métodos FFT y LPC en una nifia con nédulos, esto resulta de utilidad para identificar la coincidencia ar- ménicos- formantes, a mayor coincidencia, mejor calidad vocal. A medida que la nifia asciende de frecuencia se registra peor coincidencia armonicos- formantes, volviéndose estos tltimos cada vez mas inestables indicando que la calidad vocal empeora con el ascenso de frecuencia. Otro tipo de registro es el de la Seccidn. Las secciones o registros de frecuencia e intensidad se pueden obtener en cualquier punto elegido del registro de tiempo- intensidad-frecuencia. La seccién permite cuantificar las diferencias de intensidad entre los componentes espectrales del sonido (Borzone de Manrique, 1980). En la figura 3.10 se observa el LPC y la seccién en una persona con un formante extra nasal.APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL. TRABAJANDO CON ANAGI 23 3 eeseaszee fhm toh f__ot__Ja_ fi | Figura 3.9. Espectros FFT y LPC (puntos blancos) de modo simultdneo en una nifia con nédulos, Puede observarse que al ascender de frecuencia, hay cada vez peor coincidencia de arménicos y formantes, volviéndose los Ultimos cada vez més inestables. Figura 3.10. A la izquierda se observa la presencia de un formante extra nasal (linea horizontal inferior blanca) mediante el LPC. La linea vertical azul es el punto donde seleccionamos para obtener la seccién, la cual observamos a la derecha, donde se presenta en el eje horizontal la frecuencia y en el vertical la energia, los diferentes picos son los formantes. Puede registrarse el formante extra nasal también en la seccidn entre los 250 y los 350 Hz24. El Long Term Average Spectrum (LTAS), espectro promedio a largo plazo, emplea ventanas mucho mayores a los 100 milisegundos, tipicamente de 10 a 30 segundos y emplea la promediacién de espectros obtenidos con ventanas de andlisis cortas. Para su utilizacién es necesaria la eliminacién de sectores de si- Iencio, ya que de otro modo, influirian en el nivel global de energia al comparar emisiones de distintas personas (Cecconello & Gurlekian, 2009). Algunos autores han descripto su utilizacion en voces disfénicas. Gauffin y Sundberg (1977) encontraron correlacion significativa entre la pendiente espectral medida como una diferencia de niveles de distintas bandas de frecuencia, por ejemplo entre el rango 0-2 KHz y el de 2-5 KHz. En voces con escape de aire o hipofuncionales, el rango de 2-5 KHz es mds bajo en niveles de amplitud que el medido en vqces laringealizadas 0 con frito vocal. Cecconello & Gurlekian (2009) estudiaron 30 nifios con disfonia y 30 nifios sin alteracién vocal, analizaron cada vocal aislada con LTAS y como método original, se propuso la combinacién de las 5 vocales con LTAS. Obtuvieron valores de formantes mas elevados en el grupo de nifios disfénicos lo que se relacionaria con acortamiento del tracto vocal en este grupo por ascenso laringeo, ademas se registré valores de energia mas bajos en el grupo de nifios disfénicos tanto en las vocales valoradas aisladamente con LTAS como con la combinacion de las 5 vocales, indicando que la prueba propuesta fue efec- tiva para diferenciar voces normales de voces alteradas. En la figura 3.11 puede observarse el LTAS en dos nifios, uno disfénico y el otro sin alteracién vocal, puede observarse en el primer nifio que el rango de los 3-4 KHz no supera los 10 dB y en el nifio sin alteracién vocal supera los 15 dB. ; | | 5 TETEVET TEE TST eee ee “ila a nal Teng 0271 eae araErmgeta) 10s || Soe] se Figura 3,11. LTAS de las 5 vocales, a la izquierda de un nifio disfénico y a la derecha en un nifio sin alteracién vocal. Puede observarse que en el nifio disfénico, el rango de los 3-4 KHz no supera los 10 dB y en el nifio sin alteracién vocal, supera los 15 dB. Adaptado de Cecconello & Gurlekian (2009)APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL. TRABAJANDO CON ANAGRAF *Medidas de ruido El ruido es una energia aperiddica aleatoria en la voz, que puede ocurrir en toda la extensién de frecuencia de la voz. o en determinadas franjas de frecuencia (Colton & Casper, 1996)", Los primeros estudios de ruido en el espectro vocal fueron realizados en la década del 60 (Isshiki, Yanagihara & Morimoto, 1966; Hiroto, 1967; emanuel & Sansone, 1969)'*, los primeros métodos de anélisis computarizado de ruido nacen en la década de los 80 (Kitajima, 1981; Kojima, Gold, Lambiasi & Isshiki, 1980)", los célculos eran demasiado complejos y por la gran cantidad de tiempo necesaria para su aplicacién, restringian su empleo con fines cientificos. Yumoto en 1983, desarrolla un método més simple de célculo llamado HNR (Bebilau et al, 2004), *HNR- Relacién Arménico-Ruido (Harmonics-to-Noise-Ratio): Relacién Arménico-Ruido (Yumoto 1983; Yumoto, Gould & Baer, 1982: Yu- moto, Sasaki & Okamura, 1984) es la relacién de la energia armonica y la energia de ruido. De acuerdo a Behlau et al (2004) HNR contrasta la sefial regular de los pliegues vocales con la sefial regular se los pliegues vocales y del tracto vocal. El algoritmo para la medici6n de la relacién Arménico/Ruido en el programa Anagraf, esta basado en el algoritmo publicado por Yumoto, Gould & Baer (1982). Para la implementacién en Anagraf se mejoré la medicién del inicio y fin de cada ciclo utilizando la cuenta de cruces por cero. Yumoto, Gould & Baer (1982) proponen el valor de 7,4 dB como valor de referencia normal. Los ensayos con voces normales de la Argentina con el programa Anagraf, mostraron valores con un leve incremento de los componentes de ruido, siendo nuestra referencia el valor 5-6 dB. En ambientes ruidosos puede aceptarse 4 como limite inferior ninen f° P4(rar / & Stn -tanpar. Figura 3.12. Algoritmo de Arménico/ruido. Adaptado de Yumoto, Gould & Baer (1982). *NNE- Energia de Ruido Normalizada (Normalized Noise Energy): Energia de Ruido Normalizada (Kasuya, Ogawa & Kikuchi, 1986) es una medida de la energia de ruido turbulento producida durante la vocalizacién y es obtenida utilizando un comb filter. © Barros, A., Carrara, E.: Andlise acistica da voz. En: Dedivitis, R.A., Barros, A.P.: Métodos de Avaliacao e Diagnéstico de Laringe e Voz. Ed. Lovise, Sao Paulo, 2002, pp 215-217. * Citado en Behlau, M., Madazio, G., Feij6, D., Pontes, P.: Avaliacio de voz. En: Behlau, M. Voz O Livro do Especialista. Volume I, Ed. Revinter. Rio de Janeiro, 2004, pp 146. ** Citado en Behlau, M., Madazio, G., Feijé, D., Pontes, P.: Avaliaco de voz. En: Behlau, M. Voz O Livro do Especialista. Volume I. Ed. Revinter. Rio de Janeiro, 2004, pp 146.26 Luis Alberto Cecconello Esta medida se obtiene substrayendo la energia armonica de la sefial de la energia vocal total (Huang, 1995). Algunos autores concluyeron que NNE es mas sensible que HNR en detectar la presencia de ruido glotico y en discriminar voces patoldgicas (Huang, Minifie & Lin, 1992; Kasuya, Ogawa & Kikuchi, 1986). De acuerdo a Behlau et al (2004), este método parece ser un indice ms sensible en la diferenciacién de voces normales y patolégicas que-el HNR, quizas por tener como base el componente de ruido en si. Cecconello, Farias & Gurlekian (2008), en un estudio realizado en 169 personas, 51 con buena calidad vocal y 118 con calidad vocal alterada, encontraron valores de HNR similares en ambos grupos y conchuyen que la medida HNR result6 confiable para medir voces periédicas pero en el caso de voces aperiédicas, los valores resultaron poco confiables por la alteracin del jitter. Esto ultimo coincide con lo expresado por Yumoto et al (1982) “si el jitter es alto, la medida HNR no es valida”. *SNR- Proporcion Seftal-Ruido (Signal.to-Noise-Ratio): Proporcién Sefial-Ruido es la relacién de la energia total de la sefial y la energia de ruido. Esta medida fue poco utilizada en la clinica (Behlau et al, 2004). Recientemente se realiz6 un estudio comparativo entre nifios sin alteracion vocal y nifios con disfonia. La muestra estuvo constituida por 104 nifios, 48 sin alteracién vocal y 56 con disfonia. Se utilizaron como medidas de ruido (HNR, NNE y SNR). Las tres medidas mostraron diferencias significativas entre los dos grupos de estudio, indicando que fueron sensibles en la diferenciacién de voces normales y patolégicas, siendo NNE la medida que presenté mayor significacién. El valor de SNR en el grupo con voz alterada fue 15,24 dB y en el grupo con voz normal 20,13 dB (Cecconello & Golub, 2009). *NHR- Relacién Ruido-Arménico (Noise-to-Harmonic Ratio): Relacién Ruido-Arménico corresponde a la proporeién ruido-arménico, es una valoracién general de la presencia de ruido en la sefial, incluyendo variaciones de amplitud y frecuencia, ruido de turbulencias, componentes sub-arménicos y quiebres de voz (Barros & Carrara, 2002). *VTI- Indice de Turbulencia Vocal (Voice Turbulence Index): Indice de Turbulencia Vocal posee relacién con los componentes de turbulencia que corresponden a alteraciones en la aduccién gldtica (Barros & Carrara, 2002). *S§PI- Indice de Fonacién Suave (Soft Phonation Index): Indice de Fonacién Suave evalia la falta de componentes arménicos de alta frecuencia, lo cual puede sugerir alteraci6n en el cierre glotico (Barros & Carrara, 2002)APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL. TRABRIANDO CON ANAGRAF a7 Otras medidas que pueden ser utilizadas para estimar el ruido: *ZC- Cruces por Cero (Zero crossing): Cruces por Cero se basa en la cantidad de veces que Ia sefial cruza el nivel cero de referencia, es un método de medicién estandar en el dominio temporal Mide los contenidos de frecuencias presentes en la sefial. Las sefiales periddicas presentan un valor de ZC de dos a tres veces menor que el de ruidos, conside- rando que estos presentan mayor cantidad de componentes de alta frecuencia (Gurlekian, 2002). *CPA- Amplitud del pico del Cepstrum (Cepstral peak amplitude): El calculo de Cepstrum resulta en 1) la determinacién del pico de mayor amplitud en una escala temporal, lo que permite calcular el valor de FO y 2) la amplitud del pico de Cepstrum da informacién del grado de periodicidad de la sefial de mas baja frecuencia en relacién a otros componentes periddicos 0 ruidosos presentes (Cecconello, Farias & Gurlekian, 2008). El método Cepstrum consiste en aplicar dos transformadas de Fourier al sonido (Jackson Menaldi, 2002). De- jonckere (1998) encontré en una investigacién realizada en 18 sujetos normales y 68 pacientes disfinicos que la magnitud del pico cepstral resulté sensible a la aperiodicidad de vibracién de los pliegues vocales, al igual que al insuficiente cierre de los pliegues vocales y al excesivo escape de aire turbulento. Cecconello, Farfas & Gurlekian (2008) encontraron en un estudio realizado en 169 sujetos (51 con calidad vocal normal y 119 con calidad vocal alterada) una media de 0,46, con el programa Anagraf, en el grupo sin alteracién vocal y una media de 0,20 en el grupo con calidad vocal alterada, concluyendo que el Cepstrum demostré ser un método eficaz para distinguir voces periddicas de voces aperiédicas y que al ser valorado de modo conjunto con otros métodos como el jitter, shimmer y HNR incrementa el nivel de confiabilidad en la medicién de la sefial actistica.Capitulo 4 Manejo de Anagraf Grabacion y reproduccién El programa viene configurado para realizar la grabacién en 16 bits y 16000 Hz, pero puede modificarse accediendo a la pantalla de configuracién. Mediante esta pantalla podemos no solamente seleccionar la frecuencia de muestreo sino también convertir una sefial grabada en determinada frecuencia de muestreo por otra (Figura 4.1), por ejemplo, si tenemos una sefial grabada en 44100 Hz, podemos seleccionar 10000 y presionar el botén “convertir”, de ese modo conver- tiremos la sefial de muestreo en 10000 Hz. Es importante tener en cuenta que debemos convertir a seffales de muestreo mas pequefias y no a més grandes. - © RoNe Gite Color™ Vee © Rohe ile © vent C Rote Get Contaste_20 Brille 240 A SE 4, Daracon dol Vente soz) CR CHC IRC mE Re CM OR Free ep FSET te Poel ae joe mE sera e FOMae [SS He Mie [5D_ He Mont (ere co Pent Ae | Uimasmitols TOBI& COT Macon miles | Rm Cth Ot Won ie Tek Pei ts2 796 Pst Poe rs ~ Seleccién de frecuencia | u : ‘Onde Fear) | RewtOnG | Resto | de muestreo | mae i recnnaes * Cals Conversién de frecuen- | eee g RANT aictieleteye cla de muestreo | roms) Figura 4.1. Pantalla de configuracién. Una vez abierto el programa, se debe presionar el botdn de grabacién o A continuacién, el paciente debe realizar la emisién solicitada; luego el pro- fesional presionard el botén para detener la grabacién iz)30 Luis Alberto Cecconello Tip: Durante la grabacién, existen ventanas en tiempo real, donde podemos observar la onda sonora y el espectograma. De este modo es importante cuidar de que la sefial no sature, se debe controlar entre varios factores, la distancia de la boca del paciente al micréfono. En la figura 4.2 se presenta el ejemplo de una onda saturada a la izquierda y una onda no saturada a la derecha. Figura 4.2. Onda saturada (izquierda) y onda no saturada (derecha). Para escuchar la onda, existen dos opciones: 1. Si se desea escuchar la grabacién completa, se debera hacer click en [= 2. Si se desea escuchar un segmento determinado, se deberé pintar una por- cin de onda y presionar el botn derecho del mouse. Salvar el archivo Una vez realizada la grabacion, se debe salvar el archiv a onda de color negro en la parte superior y presionar Previamente a ello, es recomendable haber creado una carpeta destinada a guardar las ondas grabadas, con un nombre de facil reconocimiento, ejemplo: “Pacientes”. De este modo accederemos a esta carpeta y guardaremos la onda obtenida indicando el apellido y nombre del paciente, fecha y cualquier otro dato que pudiera ser de utilidad. Por ejemplo, como se observa en la figura 4.3 “Cec- conello Luis, vocal a pre tratamiento, 25 de noviembre de 2010”. para ello debe pintar Analisis cualitativo En primer lugar se debe buscar la onda que se desea analizar, para ello se debe presionar el botén [a=] buscar la carpeta donde se encuentra la onda que deseamos analizar y luego hacer click sobre la onda. De ese modo obtendremos en la ventana superior la onda completa en negro (Figura 4.4). Lo siguiente es seleccionar una porcién de la emisién, para ello debemos pintar el segmento deseado y de ese modo obtendremos de modo ampliado la onda en color verde, el espec-APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL, TRABAJANDO CON ANAGRAF a4 tograma y las curvas de frecuencia y energia. Como se muestra en la figura 4.5, hay 5 emisiones (las 5 vocales), como deseamos analizar la vocal /e/, que en este caso es la segunda, es la que seleccionamos y es analizada por las diferentes ventanas. En algunos casos deberemos seleccionar la ventana de la onda completa (onda negra), por ejemplo cuando tenemos solo una vocal, en otros casos, donde hay emisiones largas, como segmentos hablados 0 cantados, sera conveniente seleccionar una porcién, ya que de otro modo no podremos ver detalles, como por ejemplo del espectograma. Figura 4.3. Salvando un archivo. | ~— i a Ga ebb by i fa Bee32 Luis Alberto Cecconello ladda a i ibaa fet i BL aL Uh Figura 4.5. Seleccién del segmento de onda que se desea analizar. Presione los botones de la columna de la izquierda para ocultar 0 mostrar segun su preferencia: —> Contomo de FO y Energia Total —> Datos De este modo, si se desea visualizar por ejemplo detalles del espectograma es conveniente ocultar las demas ventanas para obtener una imagen mas grande del mismo.APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL. TRABAJANDO CON ANAGRAF 33 Configuracién del espectograma: Para aumentar la resolucién temporal, se debe hacer clic en el botén Wide Band (Banda Ancha) de la pantalla principal o seleccionando ventanas de du- racidn pequefias en el menti de configuracidn. Del mismo modo, para aumentar la resoluci6n frecuencial, se debe hacer click en el botén Narrow Band (Banda Angosta) 0 seleccionando ventanas temporales mas grandes en los respectivos menties. Ademas, mediante la configuracién es posible seleccionar diferentes tonalidades de colores, modificar el brillo y el contraste. El indicador “Frecuencia Top” permite modificar la maxima frecuencia del espectograma, de este modo si queremos analizar detalles de los formantes bajos, podemos seleccionar como frecuencia maxima los 2000 Hz, en otro caso, si deseamos estudiar ruido de alta frecuencia, podemos seleccionar hasta 8000 Hz. En la figura 4.6 se observa un espectograma con sub-arménicos, la seleccién de la maxima frecuencia del espectograma esta en 5000 Hz, en la figura 4.7 cam- biamos la frecuencia maxima a 2692 Hz con el objeto de ver con mayor detalle los sub-arménicos. (sia Figura 4.6. Espectograma con sub-arménicos. La frecuencia maxima el espectograma es de 5000 Hz.g = Benemo Figura 4.7. Espectograma con sub-armonicos. La frecuencia maxima del espectograma es de 2692 Hz. Configuracién de FO y Energia total: Es posible cambiar la FO minima y maxima. En el caso de analizar voces excesi- vamente graves, con emisién en frito, seré necesario disminuir la FO minima y cuando analizamos cantantes, especialmente de sexo femenino, sera necesario incrementar el valor maximo de FO. También puede modificarse el valor maximo de Energia total. Es posible visualizar al mismo tiempo los tres métodos de FO: cepstral (cp), temporal (cc) y espectral (FO). Presione los botones correspondientes para ocultar o mostrar segtin su preferencia Formantes: Para visualizar los formantes mediante el método LPC presione [ee] Si desea ocultarlos, vuelva a presionar el mismo botén. Secci6n-LTAS: Para obtener la Seccidn o Espectro instantaneo, se debe hacer click en el ins- tante deseado y presionar Para obtener el LTAS (Espectro promedio a largo plazo), se debe pintar un segmento en la pantalla principal y presionar el boton Es posible conservar el grafico apretando “MEM”. Puede sacar o agregar los arménicos apretando “FFT”. En la figura 4.8 se observan los Espectros de formantes superpuestos con la tecla MEM y FFT inactivo. En rojo la vocal /a/, en azul la /e/, en verde la /i/, en amarillo la /o/ y en negro la Av.Figura 4.8. Espectros de los formantes de las vocales superpuestos. Andlisis cuantitativo Para analizar los diferentes parametros de una vocal mantenida, pinte una zona central de la onda, lo mas larga posible, pero sin tomar los sectores inicial y final. En la figura 4.9 se muestra un ejemplo del sector a evaluar. Una vez pintada la onda, presione el botén “Cal”, por medio de este proceso se obtienen los valores de: -Fo (Pr) -Jitter (pr) -FO (ce) -Jitter (cc) -H/N -Shimmer Se iii36 Luis Alberto Cecconello Para lograr mayor confiabilidad en 1a medici6n del Jitter, en el LIS (Labora- torio de Investigaciones sensoriales) se propuso realizar una comparacién entre el método espectral y el método temporal de FO (Frecuencia fundamental); si el valor de FO por ambos métodos es exactamente el mismo se dice que el jitter es “confiable”, por el contrario, si los valores son diferentes, se dice que el jitter es “no confiable”. En el caso de que los dos métodos de FO sean diferentes, dismi- nuya la superficie pintada hasta que los valores sean iguales. Si bien la busqueda de la coincidencia de los dos métodos de FO puede Ilevar cierto tiempo, especialmente en voces irregulares, esta propuesta original permite elevar el nivel de confiabilidad del anilisis de jitter cc. Podemos observar en el grafico anterior, que se obtuvo un valor de jitter cc de 0,57% y los valores de FO mediante ambos métodos fueron exactamente iguales (133 Hz), lo que indica que fue una medicién confiable. Para obtener el valor de energia total se debe hacer click en un punto inter- medio de la emisién. El mismo proceso debe realizarse para obtener el valor de Cepstrum y de Cruces por cero, pero antes debe presionarse el botén que activa la curva de FO por el método cepstral y el botén que activa la curva de cruces por cero[=] Para obtener los valores de frecuencia y banda de los formantes se debe acti- var LPC [=] Raw Peaks (puntos blancos), se medirdn los valores de los formantes en donde este posicionado el cursor vertical. Se leeran las Frecuencias, Fl a F5 en Hz, y los Anchos de Banda B1 a BS en Hz. Es recomendable seleccionar un sector medio de la emisién donde suele haber mayor estabilidad (Figura 4.10). free i i fo Pe ft Bt a Figura 4.10. Medicién de valores de frecuencia y.banda de los formantes.APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL. TRABAJANDO CON ANAGRAF Edicion Si desea cortar una poreién de la sefial, por ejemplo cortar los silencios, debe seleccionar el segmento que se desea eliminar en la onda completa (negra) y presionar como se muestra en la figura 4.11. [x] Figura 4.11. Edicién de una onda. A la izquierda se selecciona el segmento que se desea eliminar, a la derecha la onda luego de eliminar el segmento de silencio. Si desea copiar una sefial y pegarla junto a otra para comparar por ejemplo un pre-post tratamiento, se puede realizar lo siguiente: pinte la sefial post tratamiento cépiela [J , (Figura 4.12a), a continuacién abra la onda pre tratamiento [3] luego marque con el puntero un punto a la izquierda de la nueva onda (Figura 4.12b) y finalmente pegue la sefial que copio previamente del pre tratamiento [J ; de este modo, tendré en la misma pantalla el pre y el post tratamiento (Figura 4.12c). a Figura 4.12. Edicién de dos ondas para realizar una comparacién. a) Copiado de la sefial post tratamiento. b) Seleccién de un punto a la izquierda de la onda pre tratamiento. c) Pegado de la sefial post tratamiento Micréfono El micréfono utilizado podra ser dinémico o de condensador. Es importante que el micréfono posea un rango de respuesta amplio (20 a 20000 Hz) y una curva38 Alberto Cecconello de respuesta plana. Muchos micr6fonos disponibles en el mercado no poseen curva plana con lo cual las grabaciones obtenidas resultan inadecuadas para analisis actistico ya que resalta determinadas frecuencias. En la figura 4.13 se presenta la curva de respuesta del micréfono dinamico Shure SM 58, puede observarse que la curva de respuesta no es plana, presentando incremento en frecuencias agudas; por lo tanto, este micrdfono no es éptimo para anilisis de voz. En la figura 4.14 se presenta una curva de respuesta plana, perteneciente al micréfono de condensador Shure SM 81. RELATIVE RESPONSE IN a FREQUENCY (W He Figura 4.13. Curva de respuesta del micréfono dindmico Shure SM 58. +10 23456789 2 3 456789 1000 2 50 100 10000 20000 Hz Figura 4.14, Curva de respuesta del micréfono de condensador Shure SM 81 Es necesaria la utilizacién de una placa de sonido de 16 bits, como la Sound Blaster Live. Ademés resulta recomendable la utilizacién de pre-amplificador para aplicacién en clinica y especialmente en investigacién, Se aconseja realizar las grabaciones en una sala con tratamiento actistico.Capitulo 5 Interpretaci6n de ventanas de anAlisis Anilisis de la curva de frecuencia ANALISIS ANALISIS oe CUALITATIVO CUANTITATIVO “Vemos si la FO = FRECUENCIA aparece fuera its shen FUNDAMENTAL del rango esperado een ena para la persona Por medicién del jitter oe -El valor normal dependerd IRREGULARIDAD | variacionesréplaas | 51 aiaortmo Implemented por el programa utilizado. En Anagraf es <1% DOBLE CONTORNO DE FO -Se observan dos contornos que alternan segmentos de FO -Por medicién directa de FO en ambos contornos AUSENCIA DE FO -En el contorno de FO se encuentran multiples irregularidades co es inexistente -Por medicién del jitter El valor normal dependerd del algoritmo implementado por el programa utilizado. En Anagraf es <1% RANGO VOCAL AUMENTADO © DISMINUIDO -Se observan las variaciones entre el valor maximo y minimo de FO -Por medicién directa de los valores maximo y minimo de FO En la figura 5.1 se puede observar con el programa Anagraf, una curva de FO irregular, en la misma se registran variaciones répidas en el tiempo. En la figura 5.2 se observa doble contorno de FO, el mismo es alternante, lo que indica Bitonalidad. En la figura 5.3 no se presenta curva de FO, esto indica afonia. Con el método Cepstrum se observan miltiples puntos por la presencia de ruido. En la figura 5.4 a Ja izquierda, un hombre que presenta una curva casi plana de FO, con 6 semitonos (Rango vocal disminuido), a la derecha un hombre con mayor variacién de la curva de FO presentando 10 semitonos (Rango vocal normal).40 Luis Alberto Cecconello {aman $$ quammane— qos rnin ye, hidprenerecey Teen | Mie bn i Mate yee Figura s:2. Uuue comuniy UE TusAPLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOC: TRABAJANDO CON ANAGE If li ial bey 7 SW tN rand ty Y Vi i a sy Cet ¥ r v i i iy i 5 r T 7 Y r i ¥ ¥ r v i 7 5 r z ' r i t Ausencia ae curva Ge FU. igura 5, figura 96% Curva Ue FU LUI puta varialivit dia iequiciua y curva de FO con variacién normal a la derecha.42 Anilisis de la curva de energia o intensidad Luis Alberto Cecconello ASPECTO AALS VO LITA” | ANALISIS CUANTITATIVO ~Se compara en forma | _-Por medicién directa relativa ENERGIA relativa al nivel de al nivel de ruido de fondo ruido de fondo -Valor normal > 20dB CURVA DE ENERGIA CON CORTES -Se observa la falta de continuidad en el contorno ~Con la medicién directa del shimmer -El valor normal dependeré del algoritmo implementado por el programa utilizado, En Anagraf es <0,5% CRECIMIENTO RAPIDO DE ENERGIA -Se observa un crecimiento abrupto de la energia -Por medicién directa de la pendiente de ET (Anagraf) -Valor normal <1 CURVA DE ENERGIA IRREGULAR - Se observan variaciones répidas y repetidas de intervalos breves =Con la medicién directa del shimmer -El valor normal dependera del algoritmo implementado por el programa utilizado. En Anagraf es <0,5% En la figura 5.5 se presenta una mujer con parilisis bilateral. No se observa curva de FO y la energia se encuentra disminuida (16 dB), con momentos de corte. TARTVESU REESE SR IAD lesa fol Tele, ‘ieee. Figura 5.5. Curva de FO ausente y energia disminuida.A®LICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL, TRABAIANDO CON ANAGRAF 43 En la figura 5.6 se observa una curva de energia con cortes. Se puede observar en los momentos de corte de energia la ausencia de la curva de FO. {a Wr Re Figura 5.6. Curva de energia con cortes. En la figura 5.7 se observa crecimiento abrupto de la energia, lo que indica inicio vocal duro, este dato es corroborado por el crecimiento abrupto de la onda sonora. a la 2 WFR i MA | | iy wy =|n| ox o_o fH Het Ea a Bt ffs att Sb St fa te Figura 5.7. Crecimiento abrupto de la energia.Luis Alberto Cecconello En la figura 5.8 se observa una curva de energia irregular. =H | | | NI =i! i a ' i | ts bo i ro a oa i ovo ot ot Foo ie Figura 5.8. Curva de energia irregular. Analisis de espectogramas Separaremos el andlisis del espectograma de banda ancha y angosta ya que cada uno de ellos nos brindara informacién importante para la valoracién vocal. El espectograma de banda ancha nos permitira analizar especialmente formantes y de este modo extraer informaci6n sobre la articulaci6n, estabilidad, volumen y mordiente. El espectograma de banda angosta nos permitira analizar en detalle los arménicos y de este modo brindara informacién sobre la presencia 0 no de tuido, la ubicacién del mismo; ademas nos permitiré analizar en detalle el vibra- to y la presencia de tremor. Hay aspectos del andlisis que pueden ser obtenidos mediante ambos tipos de espectogramas, como la presencia del Singing Formant (Formante del cantante), la presencia de alta energia en la region aguda y/o grave del espectro. El programa Anagraf permite realizar la superposicién del espectro FFT con el LPC, de este modo podemos superponer al espectograma de banda angosta el LPC y obtener informacion sobre la coincidencia armonicos- forman- tes, lo que nos dara informacion de la colocacion o impostaci6n vocal. Del mismo modo podemos combinar la utilizacion del espectograma de banda angosta y la seccién y observar la coincidencia arménicos formantes pero en un punto espe- cifico de la emisién, personalmente le doy a este proceso el nombre de “Corte sagital de la voz”.APUICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL, TRABAJANDO CON ANAGRAF 45 Anillisis de espectograma de banda ancha ASPECTO [ANALISIS CUALITATIVO | _ANALISIS CUANTITATIVO Gepost -Por medicién de la VALORES DE FORMANTES pitta frecuencia del formante DESPLAZADOS ee y comparéndola con valores esperados valores de referencia EI formante Por medicion de la energia presenta tonalidades de los formantes peat mas claras, ~Se registran de 10 a 20 dB lo que indica menos que los valores menor energia de referencia ~Por medicién del ancho de El formante BANDAS DE F3-F4 AUMEN- es mas difuso, ee TADAS presentando ee incrementados respecto a los valores de referencia -Por medicién del HNR : -El valor normal dependeré PRESENCIA DE RUIDO ane del algoritmo implementado Por el programa utilizado. En Anagraf es >5dB energia disminuida En la figura 5.9 se observa un espectograma de banda ancha con los primeros 4 formantes con alta energia. aeRGvenOsanitaete Seanuasnn S0dAREILAVIUEIOIEE) Figura 5.9. Espectograma de banda ancha. Presencia de alta energia en los primeros 4 formantes.46 Luis Alberto Cecconello En la figura 5.10 se observa un espectograma de banda ancha con tonalidades claras en los formantes altos, solo los primeros dos formantes presentan energia estable. Cabe esperar que si las energias de los formantes altos se encuentran disminuidas, los valores respectivos de banda se encuentren incrementados. Este es un concepto importante a tener en cuenta “a mayor valor de banda, menor valor de energia y viceversa”. En el mismo ejemplo puede observarse la presencia de estrias verticales (imagen lluviosa), especialmente en los formantes altos, indicando ruido en la emisién. iu) ii Figura 5.10. Espectograma de banda anche. Tonalidades claras en los formantes altos. Al realizar andlisis de banda ancha, donde pretendemos valorar especialmente formantes, es de utilidad relacionar con el método LPC y la seceién; para ello debemos seleccionar un punto medio de la emisién donde suele haber mayor estabilidad. Siguiendo el ejemplo anterior, vemos en la figura 5.11 que los valores de banda se encuentran incrementados, especialmente B3 a B5, en el grafico de la seccién vemos como las energias del tercer al quinto formante se encuentran notoriamente disminuidas. De esta forma podemos relacionar los datos obtenidos mediante valoracién cualitativa del espectograma con la valoracion cuantitativa que nos aporta el método LPC. Para cuantificar el ruido, realizamos la medicién de HNR, el mismo resulta disminuido (1,30 dB).APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL, TRABAJANDO CON ANAGRAF 47 Figura 5.14 Espectograma de banda ancha, LPC y Seccién. Anilisis de espectograma de banda angosta ASPECTO. ANALISIS CUALITATIVO ANALISIS CUANTITATIVO INTEGRIDAD DE AR- MONICOS -Observamos si tenemos una total integridad de arménicos 0 si existe pérdida de arménicos en un determinado rango frecuencial -Por medicién del HNR -El valor normal dependeré del algoritmo implementado por el programa utilizado. En Anagraf es >SdB -Por el registro del rango frecuencial afectado*2 PRESENCIA DE SUB- ARMONICOS -Se observan armonicos © vestigios de arménicos en medio de dos arménicos - Por medicién directa del valor de frecuencia del sub-arménico PRESENCIA DE RUIDO ESCALA TEMPORAL, - Se registra ruido inter-arménico o reemplazo de arménicos por ruido en momentos especificos de la emision (inicio, cuerpo, final) -Por medicién del momento espe- cifico donde se registra ruido*1 PRESENCIA DE RUIDO ESCALA FRECUENCIAL -Se registra ruido inter-arménico 0 reemplazo de arménicos por ruido en un determinado rango frecuencial -Por medicién del HNR -El valor normal dependeré del algoritmo implementado por él programa utilizado. En Anagraf es >5dB -Por el registro del rango frecuencial afectado*2 “1-61 ruldo puede registrarse solo en un momento 0 en varies. Por ejemplo, puede haber ruido en el inicio y en el final de la emisién, pero en el cuerpo (centro de la emisién) no, o puede haber ruldo en e) cuerpo de la emisién y no presentar ruido en el inicio y final *2-¥a sea que tengamos presencia de ruldo o pérdida de componente arménico, es aconsejable utilizar una escala con l objeto de cuantificar le alteracién. En lo personal utlizo la siguiente escala para la pérdida de componente arménico.48 Luis Alberto Cecconello * 0-5000 Hz: Afonia. Son los casos de no presencia de estructura arménica * 500-5000 Hz: Alteracién severa. Cuando presenta solo la frecuencia fundamental. * 1000-5000 Hz: Alteracién moderada a severa * 1500-5000 Hz: Alteracién moderada a severa * 2000-5000 Hz: Alteraci6n moderada * 2500-5000 Hz: Alteracién moderada * 3000-5000 Hz: Alteracién leve a moderada * 3500-5000 Hz: Alteracion leve * 4000-5000 Hz: Alteracion leve * 4500-5000 Hz: Alteracién minima En la figura 5.12 se presenta un espectograma de banda angosta; en el mismo. se observa pérdida de componente arménico de los 2000 a los 5000 Hz. En la figura 5.13 se observa un espectograma de banda angosta dominado por sub-armonicos. En la figura 5.14 se observa el mismo caso anterior, donde se realiza la me- dicién del valor de frecuencia del sub-arménico. La medicién puede realizarse directamente desde el espectograma a través de la ventana de analisis 0 desde la seccién como fue realizado en este caso. Puede observarse que el sub-armoénico se encuentra exactamente en el medio entre 1° y el 2° arménico, lo que puede corroborarse por los valores de frecuencia. En la figura 5.15 se observa un espectograma de banda angosta, el cual presenta ruido inter-arménico a lo largo de la emisién, el mismo se incrementa hacia el final, esto se confirma por la pérdida del componente arménico agudo, el cual es reemplazado por ruido. Pérdida de componente arménico en el rango de 2000-5000 Hz.[ies EEF [HH | Le Cs HELE i Tes |#] =] +] ¢]« Gtgtateh fs Se a See “a Figura 5.13. Espectograma de banda angosta dominado por sub-arménicos. ey cel ‘SvHseHUpEASGAAGUGAATSUGAAUEUNAOUAERATAAA SORERSEEOS & Figura 5.14. Medicién manual de la frecuencia del sub-arménico.Luis Alberto Cecconello or TEE TUEAE Figura 5.15. Espectograma de banda angosta con ruido inter-arménico. A continuacién se presenta un caso de una mujer con paralisis cordal: Mujer de 61 afios, docente. Al realizarse una operacién de tiroides queda con afonia. El médico tratante le comunica que se trata solo de una paresia y le recomienda “reposo de voz”. La paciente al ver que su voz no mejora, realiza tratamiento fonoaudiolégico, en total con 4 fonoaudidlogos, sin resultados favorables en cuanto a su calidad vocal. El dia mundial de la voz decide realizar un examen vocal. Se realiza exdmen perceptual y actistico. A continuacién se realiza video- fibroscopia y video-estroboscopia valorada conjuntamente por ORL y fonoau- didlogo especializado en voz. En la video-fibroscopia se observa paralisis cordal unilateral de cuerda vocal izquierda. Mediante una maniobra fonoaudioldgica, se analiza una mejora vocal inmediata, por lo cual se considera que el pronéstico es favorable con una reeducacién vocal correctamente encaminada. Se comienza reeducacién vocal. En la figura 5.16 se presenta el andlisis actistico de Ja paciente pre-tratamiento, donde puede observarse en la ventana superior, el espectograma, en el cual se puede ver que el primer arménico (fundamental) es el que posee mayor energia, esto lo analizamos cualitativamente por la coloracién de los diferentes armédnicos, esto dependerd de los colores utilizados por el software, en este caso los arménicos azules son los que poseen menos energia y los amarillos los que poseen mayor energia. Los demas arm6nicos presentan irregularidad, quiebres de energia, ademas puede observarse falta de componente arménico superior debido a la falla de contacto glotico (eclipse blanca). En la ventana intermedia, puede observarse la irregularidad de la onda y en la ventana inferior, irregularidad de la energia e irregularidad de la frecuencia.ICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL. TRABAJANDO CON ANAGRAF 51 Figura 5.16. Analisis acistico de la paciente pre-tratamiento. En la figura 5.17 se presenta el analisis acistico de la paciente luego de rea- izar una maniobra laringea. Puede observarse en la ventana superior la mayor energia de los diferentes arménicos, especialmente hasta el arménico n° 9. En el sector superior del espectro se observa que comienzan a aparecer arménicos que no se encontraban en el examen anterior, con lo cual se deduce que el cierre gldtico comienza a producirse con mayor eficacia (elipse blanca). En la ventana intermedia se observa mayor periodicidad de la onda sonora y crecimiento de la misma por el incremento de la intensidad, En la ventana inferior, podemos ver mayor estabilidad de la energia e incremento de la frecuencia fundamental, asi como mayor regularidad de la misma. raceteitTETATETOEUIOELE saa ob wf fo fb. ob bo fbb of ee Figura 5.17. Andlisis acUstico de la paciente luego de realizar una maniobra laringea durante la consulta.52 Luis Alberto Cecconello En la figura 5.18 se presenta el andlisis actistico de la paciente luego de una sesién de tratamiento fonoaudioldgico. En las tres ventanas puede observarse inicio glotico duro, o sea un ataque vocal, que es un buen sintoma, ya que el cierre glético comienza a lograrse. En esta etapa no es el objetivo corregir el inicio glotico duro, sino por el contrario lograr mayor contacto de las cuerdas vocales, En el espectograma, se observa mayor estabilidad de los arménicos superiores, con pérdida de energia hacia el final de la emision. {bho hoon eb bee no an ak bo Figura 5.18. Anilisis actistico de la paciente luego de una sesién de reeducacién vocal. Finalmente en la figura 5.19 se presenta el andlisis acuistico de la paciente luego de 10 sesiones de tratamiento. El inicio glético duro desaparecié, esto se puede corroborar por el espectograma, por la forma de onda sonora, la pendiente de la energia total! , etc. En el espectograma de banda angosta se observa una gran ganancia de energia de los diferentes arménicos, especialmente del sector medio agudo, con lo cual corroboramos la ganancia de mordiente (brillo) analizado per- ceptualmente. Mediante examen fibroscépico se obtuvo que la cuerda vocal derecha realizo durante el tratamiento una compensacién, Ilegando a contactar suavemente con el pliegue vocal izquierdo. En examen estroboscdpico se registré cierre glético completo y predominio de fase abierta. La paciente se encuentra actualmente de alta, en actividad laboral como docente En el capitulo 6 se describen las técnicas para analizar el inicio vocal.APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL, TRABAIANDO CON ANAGRAF 53 Figura 5.19. Andlisis actistico de la paciente luego de 10 sesiones de reeducacién vocal.Capitulo 6 Anilisis de la coordinacién fono-respiratoria El analisis de la coordinacién fono-respiratoria est4 formado por tres instan- cias: Inicio Vocal El anilisis del inicio vocal es uno de los aspectos més importantes a valorar tanto desde el punto de vista perceptual como actistico, ya que un comportamien- to inadecuado en este parametro podra desencadenar un trastorno vocal. El inicio vocal podra ser: * Soplado * Duro + Equilibrado o normal Clasicamente, el inicio vocal es analizado por la forma de onda o por la pendiente de la energia o intensidad. Estos dos métodos pueden llevar a una lectura incorrecta, por ejemplo cuando las ondas aparecen comprimidas, indicando que el inicio vocal es duro cuando en realidad no lo es. Es por ello que Cecconello & Golub (2008), proponen el anilisis integral del inicio vocal; el mismo se basa en una serie de herramientas cualitativas y cuantitativas, de este modo resulta de mayor confiabilidad el andlisis efectuado ya que un método sirve de soporte al otro. Los métodos cualitativos y cuantitativos sugeridos son:56 Luis Alberto Cecconello NTITATIVO UALITATIVO 1-Forma de onda 2-Fomaide la energie total 6-Derivada de la energia total | 3-Cruces x 0 7-Energia de arménicos 4-Analisis espectografico (Cecconello, 2008) 5-Cepstrum 1- Analisis de la forma de inicio de la onda sonora: Es el método mas utilizado pero el menos confiable, ya que una onda comprimida puede dar una imagen errénea de inicio vocal duro. Es recomendable su utilizacién solo como complemento de las otras medidas. Se considera inicio vocal duro cuando hay mayor amplitud de onda en el inicio de la emisién, comparandola con el resto de la onda. 2- Anilisis de la forma de inicio de la energia total: Este método se utiliza en la mayoria de los programas de andlisis actistico, se analiza la forma que adopta la energia total. El inicio vocal duro se caracteriza por un ascenso en linea recta de la energia formando un angulo de 90°, esto es indicativo de un crecimiento abrupto de la energia. De modo similar al método anterior puede dar errores de lectura cuando la curva aparece comprimida. En algunos casos se considera confiable este método, cuando aparece un extra pico al comienzo, indicando un exceso de energia en el inicio de la emisién. 3- Cruces por cero: Mide los contenidos de frecuencias presentes en la sefial. Se basa en la cantidad de veces que la sefial cruza por el nivel cero de referencia. No hay valores de normalidad. Con este método podemos hacer una valoracién cualitativa y comparativa del nivel de ruido. Se observa la curva a lo largo de toda la emisién y se registran los sectores en que se incrementa dicha curva; eso significa que en esos sectores hay incremento de ruido. Sefiales periddicas poseen un valor bajo de cruces por cero en comparacién con sefiales aperiddicas. Un inicio vocal soplado o uno duro posee valores incrementados de cruces por cero en comparacién con un inicio equilibrado. En el programa Anagraf, la curva de cruces x 0/es graficada de color verde. 4- Andlisis espectogrfico (banda ancha o angosta) Ya sea mediante banda ancha o angosta, podemos observar en el inicio, un incremento de energia en comparacién con el resto del espectro indicande inicio vocal duro 0 ausencia de arménicos en el comienzo de la emision indicando inicio soplado. En el caso de utilizar banda ancha, el inicio dure‘APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL. TRABAJANDO CON ANAGRAF 57 se caracterizara por un marcado incremento de energia especialmente en el los primeros formantes. 5- Amplitud del pico de Cepstrum La amplitud del pico de cepstrum mide el grado de periodicidad de la se Sal de més baja frecuencia en relacién a los componentes periddicos 0 ruidosos presentes. El calculo se fundamenta en hallar el pico de maxima amplitud en la funcién del cepstrum. En el programa Anagraf, se observa en el comienzo de emisién pequeftos puntos, los cuales son indicadores de presencia de ruido. El célculo de FO por el método cepstral que utiliza el programa Anagraf se extrajo de Rabiner and Schafer (1978). 6- Derivada de la energia total: Es el cociente entre la variacién de energia (comienzo y primer pico) y un tiempo minimo de referencia como el de 40mseg (Gurlekian, 1996). El valor normal es menor a 1, Un valor superior indica un inicio vocal duro. 7- Medici6n de la energia de los arménicos en dos momentos: Es un método original, propuesto por Cecconello (2008). Consiste en la medicién de la energia de los arménicos en dos momentos, uno al inicio de la emisién y otro a los 300 milisegundos. De esta forma podemos comprobar la diferencia de energia; por ejemplo un inicio duro, en un primer momento, tendra mayor energia que en el segundo momento, por el contrario, un inicio soplado, tendré en un primer momento menor energia que en el segundo momento. Estas diferencias son mayores a 4 dB. La energia de los arménicos puede obtenerse por medio de la ventana de andlisis, sector | (E inst), colocando el puntero sobre los respectivos arménicos en los dos instantes. Quizas este método sea de mayor aplicabilidad para investigacién que para clinica, ya que el aporte es la corroboracién de la diferencia de energia marcada entre los dos instantes, diferencia que puede obtenerse de un modo menos exacto a través de la valoracién cualitativa del espectograma de banda angosta. En la figura 6.1 se presenta un caso con inicio vocal soplado. En la ventana superior, puede observarse en el espectograma de banda angosta, la presencia de ruido inicial (eclipse blanca). En la ventana inferior puede observarse el incremen- to de la curva de cruces x 0 (verde) indicando que hay mayor proporcién de ruido en el sector inicial en comparacién al resto de la emisién, lo mismo pasa con la curva de cepstrum (azul) donde se visualizan puntos en el sector inicial.58 Luis Alberto Cecconello Figura 6.1. Inicio vocal soplado. En la figura 6.2 se presenta un caso con inicio vocal duro, donde puede observarse en la ventana superior, en el espectograma de banda ancha, el incremento de energia especialmente en los primeros dos formantes, en la ventana intermedia la forma inicial de onda, la cual muestra incremento de amplitud en el sector inicial y en la ventana inferior se observa el comienzo abrupto de la energia total. Por medicién cuantitativa se obtiene un valor de 1,570 de la derivada de la energia total, lo que es indicativo de inicio vocal duro. En la figura 6.3 se presenta el mismo caso anterior, pero esta vez analizado con espectograma de banda angosta. Puede observarse el exceso de energia en el comienzo de los diferentes armonicos. En la misma ventana se presenta la medi- cién de la energia de los arménicos en dos momentos. Puede observarse que en este caso con inicio vocal duro, se produce una diferenciacién superior a los 4 decibeles entre la medicién en el comienzo de la emisién y la medicién a los 300 milisegundos en la mayoria de los arménicos.APLICACION DEL ANALISIS ACUSTICO EN LA CLINICA VOCAL. TRABAJANDO CON ANAGRAF 59 Figura 6.2. Inicio vocal duro. Espectograma de banda ancha. Figura 6.3. Inicio vocal soplado. Espectograma de banda angosta.60 Luis Alberto Cecconello Cuerpo de la emision: El cuerpo de la emisién puede ser: + Regular « Trregular + Entrecortado + Tembloroso En la figura 6.4 se presentan dos emisiones, la primera con un cuerpo regular, indicando un buen soporte respiratorio (apoyo). Se debe tener en cuenta que solo una voz sintetizada poseera una linea de energia casi recta, una voz humana poseera pequefias perturbaciones. La segunda emision es irregular y entrecortada (con quiebres), es este caso se observa una gran irregularidad en la curva de energia y la presencia de quiebres vocales. La curva de eruces x 0 es mas elevada en este Ultimo caso e inestable, indicando mayor aperiodicidad. pcm Irregular-entrecortado Figura 6.4, Cuerpo de la emisién regular-irregular. Final de emision El final o liberacién de la emision puede ser: * Soplado * Abortado + Equilibrado o normal Todos los métodos desarrollados para analizar el inicio vocal pueden ser utilizados para la valoracién del final de emision.

Aplicación Del Análisis Acústico en La Clínica Vocal

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Aplicación Del Análisis Acústico en La Clínica Vocal

Cargado por

Copyright:

Formatos disponibles

También podría gustarte