Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis Acustico de La Voz PDF
Analisis Acustico de La Voz PDF
RESUMEN
L
a fiabilidad del anlisis acstico de la voz es una cuestin retest obtenida en cada par de medidas. Los datos muestran una
relevante poco estudiada todava. Se presenta aqu un es- alta estabilidad intra-sujeto en los parmetros de Frecuencia
tudio correlacional sobre la fiabilidad de los parmetros de Fundamental; estabilidad aceptable en los parmetros de Pertur-
la voz en una muestra de 148 adultos sanos. El anlisis se llev bacin de Frecuencia y de Amplitud, Ruido, Subarmnicos e Irre-
a cabo mediante el MDVP- Multi-Dimensional Voice Program ins- gularidad de la voz; y una consistencia muy baja en los parme-
talado en una unidad de CSL-Computerized Speech Lab de Kay tros de Temblor. Los parmetros relacionados con el shimmer
Elemetrics. Por cada sujeto se obtuvieron 29 parmetros de voz son ms fiables que los relacionados con el jitter. De acuerdo
a partir de dos registros de la vocal /a/ sostenida. Se ofrecen los con los resultados obtenidos se extraen conclusiones tiles para
resultados generales separados por gneros y la fiabilidad test- la prctica clnica.
ABSTRACT
A
correlational study of the reliability of acoustic voice para- liability in each pair of measures was calculated. Data show a
meters was made of 148 healthy adults. Acoustic analysis high intra-subject stability of Frequency Fundamental parameters;
was performed with MDVP- Multi-Dimensional Voice Pro- acceptable stability in parameters of Frequency and Amplitude
gram implemented in a CSL-Computerized Speech Lab of Kay Perturbation, Noise, Subharmonics and Voice irregularities; and a
Elemetrics. A set of 29 voice parameters were obtained from two very low consistency in Tremor parameters. Parameters related
samples of sustained vowel /a/ recorded from each subject. Ge- with shimmer were more reliable than parameters related with jit-
neral results separated by sex are showed and the test-retest re- ter. According to results several conclusions are reported.
Correspondencia: J. Gonzlez. Departamento de Psicologa Bsica, Clnica y Psicobiologa. Universidad Jaume I. 12080 Castelln
E-mail: gonzalez@psb.uji.es
Fecha de recepcin: 17-9-2001
Fecha de aceptacin: 3-1-2002
Por otra parte, los datos normativos que acom- sis un fragmento de 3 segundos de la parte ms
paan al MDVP son de origen americano y corre- estable de la seal, desechndose en todo caso
ponden a un nmero muy limitado de casos (siete los primeros 250 milisegundos, en los que el ata-
varones y ocho mujeres)8. Para llenar esa laguna, que de la voz confiere inestabilidad a la seal.
en este trabajo se proporcionan los resultados ob-
tenidos en una muestra amplia de voces sanas Anlisis
pertenecientes a adultos jvenes de ambos gne-
ros, al tiempo que se evala la fiabilidad test-retest El anlisis acstico se realiz de forma automa-
de las medidas mediante la comparacin de dos tizada por medio del programa MDVP, obtenindo-
registros de voz consecutivos obtenidos en cada se por cada muestra un total de 29 parmetros
individuo. clasificados en las siguientes dimensiones: Par-
metros de Frecuencia Fundamental, de Perturba-
cin de Frecuencia, de Perturbacin de Amplitud,
Parmetros de Ruido, Parmetros de Temblor, de
MATERIAL Y MTODOS Componentes Subarmnicos, Parmetros de Ape-
riodicidad y de Interrupcin de la voz (ver Apndi-
Sujetos ce).
Tabla 1: Resultados de los Parmetros del MDVP (Multi-Dimensional Voice Program) obtenidos al analizar
la fonacin sostenida de la vocal /a/ en una muestra de 148 sujetos de ambos gneros
nsimas de segundo) ciclo a ciclo, ha sido uno de resante considerarlo de forma relativa a la misma,
los ms empleados en la clnica y cuenta con una en trminos porcentuales (Jitt). La muestra total
larga tradicin en la literatura cientfica. El valor de sujetos presenta un promedio de 0,83% de va-
medio de todos los sujetos se sita en 52,35 mi- riabilidad respecto al perodo fundamental, siendo
crosegundos (ms) con un amplio rango compren- sta significativamente mayor en las mujeres
dido entre 5,84 y 192,23 ms, si bien el 75% de la (0,94%) que en los hombres (0,68%). Estos datos
muestra se coloca por debajo de 66 ms y el 90% se sitan entre los obtenidos en otras investiga-
por debajo de 95 ms. Estos valores son ligera- ciones. Hollien et al.11 obtienen 0,48% para varo-
mente inferiores a los ofrecidos en el manual del nes con una frecuencia fundamental Fo en torno
MDVP como normativos (83,2 ms) y ms en con- a 102 Hz, y 0,76% para varones con Fo en torno
sonancia con los que aporta la literatura anterior. a 142 Hz. Orlikoff12 obtiene 0,42% en varones de
Por otra parte, como el jitter guarda relacin con 26-33 aos.
la frecuencia fundamental de la voz, es ms inte- Es creciente la tendencia a usar medidas de
Tabla 2: Resultados de los Parmetros del MDVP (Multi-Dimensional Voice Program) separados
por gneros
(*) Diferencia significativa en la prueba Mann-Whitney con p<0,05. (**) dem p <0,01. (***): dem p<0,001.
perturbacin de frecuencia con un cierto grado de al que encuentran en Espaa con otro programa
suavizacin, que no sean tan sensibles a posibles (Dr Speech Science) Fernndez Liesa et al 2 en
alteraciones errticas entre dos ciclos consecuti- una muestra de 154 adultos no fumadores
vos, o a los errores que pueda cometer el algorit- (PPQ=0,23), e incluso al del grupo de fumadores
mo de extraccin de perodos. Las preferencias se del estudio de Damborenea et al. 13 (PPQ=0,27).
decantan por el promediado de 3 perodos conse- Tambin es superior al del estudio de Walton y Or-
cutivos (RAP), o 5 perodos (PPQ). Cuando se likoff14 (RAP=0,28) y est ms prximo a los valo-
aplican estos suavizados los valores se rebajan res encontrados por Preciado et al.15, 16 en su grupo
sensiblemente, ofreciendo 0,49 para ambos par- control de 64 docentes espaoles (RAP=0,35), o
metros en nuestra muestra total, inferiores a los los trabajos de Dwire y McCauley17 en sujetos nor-
datos normativos del manual del MDVP (0,68 para teamericanos (RAP=0,38 para varones y
RAP y 0,84 para PPQ). Nuestro dato es superior RAP=0,89 para mujeres, ambos de 18-25 aos de
edad) o Takahashi y Koike18 para japoneses varo- muestra de no fumadores de los trabajos de Fer-
nes (RAP =0,57) y mujeres (RAP=0,61). Las dife- nndez 2 y Damborenea 13 arrojan APQ=2,02%, y
rencias significativas entre gneros encontradas los fumadores de este ltimo estudio, 2,56%. En
en nuestros parmetros de perturbacin frecuen- trabajos extranjeros, el "clsico" de Horii19 con 31
cial Jita (test Mann-Whitney, p<0,05), Jitt (p<0,01), hombres y 20 mujeres obtiene shimmers de 0,47
RAP (p<0,001), y PPQ (p<0,01), apunta en la l- dB y 0,33 dB respectivamente para la vocal /a/, sin
nea de lo declarado por Baken y Orlikoff en su re- diferencias significativas entre los gneros. Orlikoff
ciente revisin de 20001: "la evidencia preliminar y Kahane20 demuestran que el shimmer se reduce
seala la posibilidad de que las mujeres adultas cuando la intensidad de la voz aumenta; sus datos
podran tener ms jitter vocal que los hombres, al promedio para voces masculinas a una intensidad
menos para algunas vocales. Afortunadamente, moderada, equivalente a nuestro nivel confortable,
las diferencias observadas entre los gneros no se sitan en 0,31 dB.
son lo suficientemente grandes como para dar lu-
gar a errores diagnsticos". Parmetros de ruido
Si el promediado se realiza a travs de 55 pe-
rodos consecutivos (sPPQ), la variabilidad fre- Los parmetros basados en la relacin entre la
cuencial no alcanza significacin entre los gne- energa armnica y la energa de ruido tienen una
ros. De nuevo, el promedio (0,72%) es inferior al extensa aplicacin en la clnica de la voz, por su
umbral ofrecido por el manual (1,02%). Tampoco estrecha relacin con muchas disfonas 21-23. Por
surgen diferencias inter-gnero en la variacin de otra parte, son muy sensibles a los sistemas de
largo recorrido de Fo, medida a travs del parme- registros empleados ya que stos pueden introdu-
tro vFo. cir niveles de ruido ajenos a los que comportan la
propia voz, alterando los resultados. La formula-
Perturbacin de la amplitud cin concreta de estos parmetros vara de unos
algoritmos a otros: HNR o Harmonic-to-noise ratio,
Los parmetros que miden la perturbacin de o su recproco, NHR Noise-to-Harmonic ratio, co-
amplitud a travs de los ciclos de la voz (ShdB, mo es el caso del programa MDVP. El promedio
Shim, APQ, sAPQ, y vAm) tienen, al igual que sus de NHR a travs de los 148 sujetos es 0,13 (es
homlogos frecuenciales, una relevante significa- decir, la energa del ruido equivale a un 13% de la
cin clnica. Sus valores se presentan en las Ta- energa armnica); el 70% de los sujetos tienen
blas 1 y 2, sin diferencias estables entre gneros, valores igual o inferiores a 0,14; el 90% de los su-
a excepcin de vAm. Los valores medios de shim- jetos se sita por debajo de 0,16. Estos datos son
mer absoluto y relativo a travs de los 148 sujetos ligeramente inferiores al 0,19 dado como umbral
(0,34 dB y 3,86%, respectivamente) son muy se- de normalidad por el manual del MDVP. La exigua
mejantes a los valores normativos del manual diferencia que surge en nuestra muestra entre va-
(0,31 dB y 3,81%). En nuestra muestra el 75% de rones (0,14) y mujeres (0,13), es significativa (test
los sujetos tienen ShdB y Shim inferiores a 0,39 Mann-Whitney, p<0,01) porque aparece de forma
dB y 4,54% respectivamente; y el 90% est por bastante sistemtica a travs de los individuos, si
debajo de 0,53 dB y 5,98%. El suavizado matem- bien no tiene significacin diagnstica.
tico a travs del promedio de 11 perodos conse- NHR incluye globalmente toda la energa inar-
cutivos, o de 55 perodos, arrojan valores medios mnica, o de ruido, que se produce en la fonacin
de APQ=2,95% y sAPQ=5,02%, respectivamente. desde orgenes diversos: irregularidades en los
La variacin de la amplitud a largo plazo en la fo- perodos vibratorios, subarmnicos, ruido por tur-
nacin sostenida de la vocal se mide con el par- bulencia, etc. El parmetro VTI-Voice Turbulence
metro vAm, como el cociente, en trminos porcen- Index, o ndice de Turbulencia de Voz, pretende
tuales, entre la desviacin tpica y el promedio de medir selectivamente el ruido que se produce por
la variacin de amplitud ciclo-a-ciclo. En este para- la turbulencias del aire cuando el cierre de las
mtro, la diferencia entre vAm=12,38% para los cuerdas vocales es incompleto o laxo. Como la
varones y vAm=15,83 % para las mujeres es signi- mayor parte de los componentes de este ruido son
ficativa (test Mann-Whitney, p<0,001), presentando de alta frecuencia, el parmetro slo considera la
esta ltima una mayor variacin de la amplitud a lo energa de ruido en la regin 2800-5800 Hz. Los
largo de la fonacin sostenida. A efectos compara- datos obtenidos en nuestro estudio arrojan un pro-
tivos con sujetos espaoles, conviene recordar medio de 0,05; el 75% de los sujetos obtiene pun-
que los sujetos controles de Preciado et al.15 dan tuaciones iguales o inferiores a 0,06; el 90% igual
un valor medio de APQ =5,01%; mientras que la o inferior a 0,07. Estos datos no se apartan del
umbral de normalidad del MDVP, que lo sita en presenta componentes subarmnicos. De los 148
0,06. sujetos de nuestra muestra, 130 no tienen ningn
El SPI- Soft Phonation Index, o ndice de Fona- subarmnico en su voz, mientras que 18 sujetos -
cin Blanda, es otro parmetro original de Kay 15 mujeres y 3 varones- presentan un nmero va-
Elemetrics, propuesto por primera vez en esta ver- riable de los mismos. Esto da lugar a los valores
sin de 1993 del programa MDVP. Da una medida promedios de NSH=0,57 y DSH=0,61%. Es evi-
del predominio de componentes armnicos de baja dente que en un parmetro de esta naturaleza el
frecuencia y se calcula dividiendo la energa arm- valor medio no es una adecuada aproximacin
nica en el rango 70-1600 Hz entre la energa ar- desde el punto de vista clnico, pero se incluye en
mnica en el rango 1600-4500 Hz. No se trata, por la tabla general con el fin de estudiar su fiabilidad
tanto, de un parmetro de ruido, pero el MDVP lo test-retest.
agrupa con los anteriores por la semejanza de su
frmula de clculo y aqu mantenemos el mismo Interrupcin de la periodicidad
enfoque clasificatorio. El umbral de normalidad,
14,12, proporcionado por el manual del MDVP a Las mismas consideraciones deben hacerse en
partir de tan slo quince sujetos se sita ligera- relacin con los ndices NUV y DUV. Se refieren
mente por encima de nuestros datos. El promedio respectivamente al nmero y porcentaje de seg-
de los 148 sujetos es de 8,54; el 75% de los suje- mentos sordos en los que la seal deja de ser pe-
tos punta por debajo de 10,69; y el 90% por de- ridica y el algoritmo de clculo no puede extraer
bajo de 13,53. Tanto en SPI como VTI no hay dife- la frecuencia fundamental. En voces normales, y al
rencias entre gneros. tratarse de la fonacin sostenida de una vocal, no
deberan arrojar valores distintos de cero. En
Parmetros de temblor nuestra muestra, 10 sujetos presentan alguna inte-
rrupcin accidental en su fonacin lo que da lugar
Los parmetros de temblor, tanto frecuenciales a valores no nulos y, en consecuencia, los prome-
como de amplitud, (Fftr, Fatr, FTRI, ATRI) dan va- dios son tambin distintos de cero.
lores numricos en slo 129 del total de 148 suje-
tos; en los restantes el MDVP arroja valores au- Fiabilidad de las medidas
sentes al no poder extraer un patrn cclico de
modulacin de la voz. Salvo en ATRI, no hay dife-
rencias entre varones y mujeres. El MDVP ofrece Ms all de la obtencin de valores normativos,
umbrales de normalidad en dos de ellos, el objetivo principal de este trabajo ha sido evaluar
FTRI=0,95% y ATRI= 4,37%, que no estn lejos el grado de fiabilidad de las medidas obtenidas,
de los promedios obtenidos en nuestra muestra. estudiando la estabilidad de los parmetros en una
prueba test-retest mediante el anlisis de dos
Subarmnicos muestras consecutivas de voz tomadas en cada
sujeto. En la Tabla 3 se ofrecen por cada parme-
Otro rasgo de gran relevancia en el estudio cl- tro la correlacin de Pearson obtenida entre am-
nico de la voz es la presencia de componentes su- bas medidas a travs de todos los sujetos. Tam-
barmnicos de baja intensidad situados entre los bin, siguiendo la metodologa de Kent, Vorperian
armnicos24, 25. Esta alteracin acstica suele apa- y Duffy7, se han extrado las discrepancias, o dife-
recer en disfonas causadas por plipos o edemas rencias en valores absolutos entre ambas medi-
de Reinke, en las que pueden producirse irregula- das, y en la tabla se ofrecen la media, desviacin
ridades asimtricas en la oscilacin de las cuerdas tpica y el rango de la distribucin de esas discre-
vocales y la aparicin de dos o ms patrones si- pacias a travs de los sujetos.
multneos de vibracin que dan lugar a la bifona- Los parmetros de la frecuencia fundamental
cin o diplofona. El MDVP proporciona dos par- (F0, Fhi, Flo) muestran una gran consistencia a
metros, el NSH, o Nmero de componentes travs de las dos muestras analizadas, con corre-
Subarmnicos, y el DSH o Grado de Subarmonici- laciones superiores a 0,90 y pequeas discrepan-
dad, consistente en la relacin porcentual entre los cias entre cada par de valores. Cuando se pide la
componentes subarmnicos y los componentes ar- fonacin sostenida de una vocal a un tono e inten-
mnicos de Fo. En principio la voz normal debera sidad confortable, parece que cada sujeto tiene
tener valores nulos en ambos parmetros, pero una frecuencia fundamental de la voz caractersti-
existe un pequeo porcentaje de personas, princi- ca que vara poco de un ensayo a otro. As el pro-
palmente mujeres, cuya voz, sin ser patolgica, medio de discrepancia de Fo es slo de 3,53 Hz,
Tabla 3: Fiabilidad test-retest de los Parmetros del MDVP (Multi-Dimensional Voice Program). Correlaciones
de Pearson y Diferencias absolutas entre los valores obtenidos por dos muestras de voz de cada sujeto
lo que supone un 2,12% del valor medio de Fo en grabacin. La estabilidad, sin embargo, cae nota-
todos los sujetos (166 Hz). Por otra parte, la distri- blemente cuando se considera la desviacin tpica
bucin de las discrepancias es muy asimtrica, (STD) de la frecuencia de cada muestra, o sus
siendo relativamente unos pocos los que ofrecen rangos fonatorios (PFR).
dos fonaciones con tonos muy dispares, al tiempo Entre los parmetros de Perturbacin de Fre-
que la mayora muestran una alta estabilidad to- cuencia, los valores de jitter (Jita, Jitt), RAP y PPQ
nal: de los 148 sujetos, 109 presentan una discre- muestran una estabilidad moderada con correla-
pancia inferior a 4Hz entre la primera y la segunda ciones comprendidas entre 0,62 y 0,70; siendo el
Cociente de Perturbacin de Tono (PPQ) el par- la prcticamente nula correlacin entre los dos en-
metro ms estable. Parece que la incoporacin de sayos (r=0,124, no significativa), parece que dicho
un factor de suavizado de 5 perodos en PPQ, comportamiento de la frecuencia fundamental es
propuesto por Koike et al. 26, consigue dotar a la ms bien de carcter episdico y dependiente de
medida de una mayor estabilidad, mostrando una cada fonacin sostenida, antes que una caracters-
consistencia entre ensayos algo superior a las me- tica estable de la fonacin de un sujeto.
didas no suavizadas (Jitter absoluto y relativo) o Los Parmetros de Perturbacin de Amplitud
suavizadas con 3 perodos (RAP). Un factor de exhiben, en trminos generales, una consistencia
suavizado de 55 perodos, sin embargo, no tiene superior a la de los Parmetros de Perturbacin
la consecuencia de ms estabilidad; antes al con- de Frecuencia. Salvo en sAPQ y vAm, las correla-
trario, la correlacin entre los dos medidas de ciones entre la primera y segunda muestra de voz
sPPQ cae a 0,492. son superiores a 0,70 y la oscilacin entre ambas
Si se observan los promedios de las diferencias viene a estar por debajo de una quinta parte de la
absolutas entre los dos ensayos, podemos tener medida. As, una discrepancia media de 0,06 dB
una idea de las consecuencias diagnsticas de la en ShdB representa el 17,6% del valor medio para
variacin entre medidas. Una diferencia promedio todos los sujetos (0,34); la discrepancia de 0,70
de 17,33 ms entre dos jitters consecutivos es un para Shim es el 18,1% del total; la discrepancia de
30% de la media general (Jita=57,53 s). En algu- 0,50 para APQ representa el 16,9% del total. De
nos sujetos con valores prximos al umbral de nuevo, al igual que observbamos en los parme-
normalidad, puede suponer que una muestra de tros de perturbacin frecuencial, podemos extraer
voz arroje un dato por debajo de ese umbral y en las siguientes conclusiones: a) un factor de suavi-
una segunda muestra, tomada en las mismas con- zado moderado confiere a la medida mayor estabi-
diciones, dicho umbral sea superado. En tminos lidad, por lo que APQ es el parmetro con ms fia-
generales, esta diferencia de 17,33 s no parece bilidad test-retest; b) un factor de suavizado
dramtica, pero su distribucin es altamente asi- grande (55 perodos para sAPQ) no otorga ms
mtrica. De los 148 sujetos, la mitad de ellos pre- estabilidad a la medida; c) la variacin de amplitud
sent diferencias inferiores a 10 s entre los dos a largo plazo dentro de la fonacin, o vAm, es el
medidas de Jita; pero en el otro extremo de la dis- parmetro menos fiable, como as sucede con su
tribucin, 16 sujetos obtuvieron discrepancias por homlogo frecuencial.
encima de 40 s, el cual es ciertamente un valor La fiabilidad de los parmetros de ruido nos
importante. Se constata tambin la tendencia, lgi- obliga a diferenciar entre NHR y VTI, por una par-
ca por otra parte, a que el jitter vare ms en los te, y SPI, por otra. Los dos primeros presentan co-
sujetos con valores ms altos. En los otros para- rrelaciones inter-muestras moderadas, de 0,649 y
mtros las diferencias son de un tenor semejante: 0,607, respectivamente, con unas discrepancias
0,27 de diferencia entre las dos medidas de Jitt re- medias relativamente inferiores en NHR (un 10%
presenta el 32,5% de la media general (0,83); 0,17 del total) que en VTI (un 20% del total). Las distri-
es el 34,7% de la media de RAP (0,49); 0,16 es el buciones de estas discrepancias son bastante asi-
32,7% de la media de PPQ (0,49); 0,17 es el mtricas. Dada la importancia diagnstica de NHR,
23,6% de la media de sPPQ (0,72). Es decir, po- conviene detenerse en la distribucin de sus dis-
demos concluir que en lneas generales dos medi- crepancias entre ambas muestras de voz: de los
das consecutivas de la Perturbacin de Frecuencia 148 sujetos, 127 obtienen discrepancias inferiores
van a presentar una oscilacin en torno a la terce- a 0,02, lo cual tiene poca significacin clnica si re-
ra parte de las mismas. Si adems se tiene en cordamos que el promedio total de NHR es 0,13 y
cuenta que en ciertos sujetos esta variacin va a el umbral de normalidad propuesto por el MDVP
ser bastante mayor, el corolario parece obvio: se- es 0,19. De los 21 sujetos restantes, 20 varan por
ra aconsejable que tanto en la evaluacin diag- debajo de 0,06, y los dos con mayores discrepan-
nstica de la voz como en los estudios del progre- cias alcanzan 0,07 y 0,08, respectivamente. Es de-
so post-tratamiento, se obtuvieran al menos dos cir, aunque la correlacin entre muestras de NHR
medidas por cada paciente y se utilizar el prome- es moderada, en general la disparidad entre los
dio de ambas. valores es pequea y tiene poca significacin clni-
Por otra parte, llama la atencin la escasa con- ca. Consideraciones similares caben efectuar res-
sistencia de los datos de Variacin de la Frecuen- pecto a VTI, o ndice de Turbulencia de Voz, par-
cia Fundamental medida a travs de vFo. Dicho metro nuevo propuesto por la casa Kay en un
parmetro refleja la variacin de Fo a largo plazo intento de objetivizar el grado de soplado (breathi-
dentro de la muestra de voz analizada. A la luz de ness) de la voz producido por un cierre laxo e in-
completo de las cuerdas vocales. Por su novedad, mento, y el resto difieren en ms de un segmento
no disponemos an de valores normativos en la li- aperidico.
teratura profesional.
Por su parte, el SPI, o ndice de Fonacin Blan-
da, parece un parmetro interesante y prometedor CONCLUSIONES
si bien, al ser muy reciente, no cuenta hasta la fe-
cha con estudios sobre su potencialidad diagnsti- De acuerdo con los resultados obtenidos al
ca. Ms all del mbito clnico, promete ser un indi- analizar dos muestras consecutivas de voz de 148
cador objetivo de cierta cualidad de timbre vocal: la sujetos normales con el MDVP o Multi-Dimensional
fonacin "blanda", o voz con predominio de los Voice Program, pueden extraerse las siguientes
componentes armnicos graves. Pruebas percepti- conclusiones sobre la fiabilidad de las medidas.
vas informales revelan una estrecha corresponden- 1. Los Parametros de Frecuencia Fundamental
cia entre sus resultados numricos y la impresin (Fo, Fhi, Flo) son muy consistentes a travs de las
cualitativa de voz "blanda" o poco estridente, lo dos muestras de voz, con correlaciones test-retest
que es un acicate para futuros estudios sistemti- muy altas. Segn las caractersticas fonatorias de
cos. Este hecho tiene relevancia si tenemos en cada sujeto, ste tiene una frecuencia de vibracin
cuenta la escasa relacin directa que en general preferente que tiende a reproducir en distintas fo-
encontramos en la investigacin sobre timbre vo- naciones sostenidas de la misma vocal, al menos
cal, entre medidas numricas y la percepcin cuali- cuando se producen a un tono e intensidad confor-
tativa e integrada de la cualidad vocal. En este table. Esta consistencia, sin embargo, cae drsti-
sentido, sorprende favorablemente su alta estabili- camente cuando se mide la variabilidad y el rango
dad entre muestras, con una correlacin de 0,848 frecuencial dentro de cada fonacin (STD y PFR).
entre ambas, que es la mxima despus de las 2. Los Parmetros de Perturbacin de Amplitud
medidas de frecuencia fundamental (Fo, Fhi y Flo). son ms consistentes que los Parmetros de Per-
Los parmetros de Temblor presentan una es- turbacin de Frecuencia, superndoles en algo
cassima consistencia entre ensayos. A excepcin ms de 0,10 puntos en la correlacin test-restest.
de Fftr, cuya baja correlacion entre muestras 3. Dada la gran variabilidad de la voz humana,
(0,301), resulta estadsticamente significativa, los ambos tipos de parmetros presentan discrepan-
dems parmetros obtienen correlaciones prctica- cias entre las dos muestras de cada sujeto. En tr-
mente nulas y no significativas. Tal vez en voces minos generales, los Parmetros de Perturbacin
patolgicas en las que el rasgo de temblor sea un de Frecuencia varan en torno a una tercera parte
componente importante (temblor esencial, enfer- de su valor, y los Parmetros de Perturbacin de
medad de Parkinson) puedan encontrarse niveles Amplitud varan en torno a una quinta parte de su
superiores de consistencia entre ensayos, pero en valor. En los casos limtrofes con la voz patolgica
lo que se refiere a las voces normales los resulta- esta variacin podra tener significacin clnica, por
dos obtenidos en la primera muestra de voz son lo que sera recomendable en la prctica diagns-
muy distintos de los que se obtienen en la tica registrar al menos dos medidas y obtener el
segunda. Esto quiere decir que los aspectos medi- promedio de ambas.
dos por los cuatro parmetros -frecuencia y ampli- 4. Un factor de suavizado moderado en el c-
tud de modulacin de la voz- tienen una naturale- culo de de ambos tipos de parmetros incrementa
za marcadamente episdica ligada a cada la consistencia de los mismos; siendo el PPQ
fonacin particular, con una fiabilidad escasa en (Pitch Perturbation Quotient) o Cociente de Pertur-
cuanto a la caraterizacin de un rasgo estable de bacin de Tono, con un factor de suavizado de 5
la voz de un individuo. Esto al menos en voces no perodos, el ms consistente de los Parmetros de
patolgicas. Perturbacin Frecuencial, y su homlogo el APQ
Los parmetros que analizan los componentes, (Amplitude Perturbation Quotient) o Cociente de
DSH y NSH ofrecen correlaciones test-retst prxi- Perturbacin de Amplitud, con un factor de suavi-
mas a 0,80. De los 148 sujetos, 122 no presentan zado de 11 perodos, el ms consistente de los
subarmnicos en ninguna de las dos muestras re- Parmetros de Perturbacin de Amplitud. Por el
gistradas, 10 difieren en un subarmnico entre las contrario, un factor fuerte de suavizacin hace ba-
dos muestras, y el resto difieren en ms de un su- jar la consistencia, como es el caso de sPPQ
barmnico. La consistencia de los parmetros de (Smoothed Pitch Perturbation Quotient) o Cociente
aperiodicidad es ligeramente superior a 0,80. Aqu, Suavizado de Perturbacin de Tono, y de sAPQ
136 sujetos no tienen segmentos aperidicos, o (Smoothed Amplitude Perturbation Quotient) o Co-
sordos, en ninguna muestra, 6 difieren en un seg- ciente de Perturbacin de Amplitud Suavizado,
ambos con un factor de suvizado de 55 perodos. frecuencia fundamental para todos los perodos
Ahora bien, estos dos parmetros miden aspectos extrados de la onda acstica.
distintos al de los dems por lo que, pese a su in- Frecuencia Fundamental ms Alta (Fhi-Highest
ferior consistencia, son tiles porque reflejan las Fundamental Frequency) /Hz/. La frecuencia fun-
perturbaciones a largo trmino de la fonacin, tan- damental ms alta alcanzada en todos los pero-
to en frecuencia como amplitud vocal. dos extrados de la onda acstica.
5. Los parmetros de variacin frecuencial Frecuencia Fundamental ms Baja (Flo-Lowest
(vFo) y de Amplitud (vAm) a lo largo de la fona- Fundamental Frequency) /Hz/. La frecuencia fun-
cin sostenida presentan grandes discrepancias damental ms baja alcanzada en todos los pero-
entre las dos muestras de voz, por lo que su con- dos extrados de la onda acstica.
sistencia es baja para un mismo individuo. Desviacin tpica de la Frecuencia Fundamen-
6. Los Parmetros de Ruido, NHR (Noise to tal (STD-Standard Deviation of Fo) /Hz/. La desvia-
Harmonic Ratio) o Razn Ruido/Armnicos y VTI cin tpica de Fo dentro del rango analizado.
(Voice Turbulence Index) o ndice de Turbulencia Rango Fonatorio en semitonos (PFR-Phonatory
de Voz, exhiben una consistencia moderada, con Fo-Range). Rango entre Fhi y Flo expresado en
correlaciones test-retest entre 0,60 y 0,70. Dada semitonos.
su importancia en la prctica clnica, especialmen- Parmetros de Perturbacin de Frecuencia:
te del primero, sera aconsejable la obtencin de Jitter Absoluto (Jita-Absolute Jitter) /us/: Da una
dos medidas promediadas, en la misma lnea de lo evaluacin in microsegundos (ms) de la variabili-
sealado anteriormente. dad perodo-a-perodo de la frecuencia fundamen-
7. El parmetro SPI, Soft Phonation Index, o tal dentro de la muestra analizada. Este parmetro
ndice de Fonacin Blanda es un parmetro re- y sus derivados son ampliamente usados en la cl-
ciente que apenas cuenta con datos sobre su po- nica e investigacin sobre la voz 27, siendo muy
tencialidad diagnstica. Sin embargo plantea inte- sensible a las variaciones que ocurren entre pero-
resantes posibilidades tanto en la prctica clnica dos consecutivos.
como en la investigacin sobre el timbre vocal, no Jitter Porcentual (Jitt-Jitter Percent) /%/: Varia-
slo por su aparente relevancia perceptiva sino bilidad relativa perodo-a-perodo expresado en
por su gran consistencia entre muestras de voz de porcentaje.
un mismo sujeto. De hecho, se ha revelado como Perturbacin Relativa Promedio (RAP-Relative
el parmetro ms fiable despus de los parme- Average Perturbation) /%/: Introducida por Koike et
tros de frecuencia fundamental. al.26, este parmetros mide la variabilidad perodo-
8. Los parmetros de Temblor ofrecen una con- a-perodo con un factor de suavizado de 3 pe-
sistencia muy baja entre las dos muestras de un rodos.
mismo sujeto con voz normal. Queda abierta la Cociente de Perturbacin de Tono (PPQ-Pitch
posibilidad de una mayor consistencia en voces Perturbation Quotient) /%/: Introducido por Koike et
patolgicas en los que el temblor constituya un al.26, da la variabilidad perodo-a-perodo con un
componente importante de la disfona. factor de suavizado de 5 perodos.
9. Los parmetros de Subarmnicos y Aperiodi- Cociente Suavizado de Perturbacin de Tono
cidad son estables en lneas generales, si bien un (sPPQ-Smoothed Pitch Perturbation Quotient) /%/:
pequeo porcentaje de sujetos arrojan discrepa- Da la variabilidad perodo-a-perodo con un factor
cias importantes entre sus dos muestras de voz. de suavizado de 55 perodos.
Variacin de la Frecuencia Fundamental (vFo-
Fundamental Frequency Variation) /%/: La desvia-
AGRADECIMIENTOS cin tpica relativa de la frecuencia fundamental.
Refleja la variacin de Fo a largo plazo dentro de
Este trabajo han sido financiado por el Proyec- la muestra analizada.
to P1A99-01 de la Fundaci Caixa-Castell y la Parmetros de Perturbacin de Amplitud:
Universidad Jaume I de Castelln. Shimmer Absoluto (ShdB-Shimmer) /dB/: Medi-
da en dB de la variabilidad entre perodos conse-
cutivos de la amplitud pico-a-pico de la onda de la
APNDICE muestra de voz analizada. Como en otros parme-
tros, las reas de ruptura de voz, sin naturaleza
Parmetros de Frecuencia Fundamental: peridica, son excluidas del cmputo. Este par-
Frecuencia Fundamental Media (Fo-Average metro tambin ha sido y es ampliamente usado en
Fundamental Frequency) /Hz/. El promedio de la la prctica clnica27.
bre la Salud de los Espaoles: 1998 del Ministerio poblacin general, los datos de ese mismo ao
de Sanidad y Consumo, la prevalencia del hbito para el grupo de edad 16-24 aos son el 39,7% y
tabquico en 1997 se situaba en el 35,7% de la para 25-44 aos, 52,3%.
REFERENCIAS
1.- Baken R, Orlikoff, R. Clinical Reliability of the Multi-Dimensional cues in the vocal signal. J Speech 21.- Yanahigara, N. Significance of
measurement of speech and voi- Voice Program for the analysis of Hear Res 1994; 37: 738-45. harmonic changes and noise com-
ce. Second Edition. San Diego, voice samples of subjects with dy- ponents in hoarseness. J Speech
15.- Preciado JA, Garca R, Infante
CA: Singular Publishing Group, sarthria. Am J Speech-Lang Pathol Hear Res 1967; 10: 531-41.
JC. Anlisis multidimensional de la
2000. 1999; 8: 129-36.
funcin vocal. Estudio de casos y 22.- Yumoto E, Gould W, Baer Th.
2.- Fernndez R, Damborenea D, 8.- Kay Elemetrics Corp. Multi-Di- controles. Acta Otorrinolaring Esp Harmonic to noise ratio as an index
Rueda P, Garca E, Leache J, Cam- mensional Voice Program. MDVP 1998; 49(6): 467-74. of the degree of hoarseness. J
pos MA, Llorente E, Naya MJ. An- Model 4305B. New Jersey 1993. Acoust Soc Am 1982; 71: 1554-60.
16.- Preciado JA, Fernndez S. El
lisis acstico de la voz normal en 9.- Deliyiski D. Acoustic model and anlisis digital de la seal acstica 23.- Nieto A, Cobeta I, Gamboa FJ,
adultos no fumadores. Acta Otorri- evaluation of pathological voice pro- en el diagnstico de la patologa vo- Vegas A. La relacin armnico/ruido
nolaringol Esp 1999; 50(2): 134-41. duction. Kay Elemetrics, 1993. cal. Sensibilidad y especificidad de y el anlisis espectrogrfico en la pa-
3.- Read Ch, Buder E, Kent R. Spe- 10.- Kay Elemetrics Corp. Compute- las medidas del shimmer y del jitter. tologa de abuso vocal. Acta Otorri-
ech Analysis Systems: An evalua- rized Speech Laboratory. CSL Mo- Acta Otorrinolaringol Esp 1998; nolaringol Esp 1996; 47(5): 370-76.
tion. J Speech Hear Res 1992; 35: del 4300-B. New Jersey 1994. 49(6): 475-81.
314-32. 24.- Omori K, Kojima H, Kakani R,
11.- Hollien H, Michel J, Doherty E. 17.- Dwire A, McCauley R. Repea-
Slavit DH, Blaugrun SM. Acoustic
4.- Parsa V, Jamieson D. A compa- A method for analyzing vocal jitter ted measures of vocal fundamental
characteristics of rough voice: Sub-
rison of high precision Fo extraction in sustained phonation. J Phonetics frequency perturbations obtained
harmonics. J Voice 1997; 11: 40-47.
algorithms for sustained vowels. J 1973; 1: 85-91. using de Visi-Pitch. J Voice 1995; 9:
Speech Hear Res 1999; 42: 112-26. 156-62. 25.- Nez F, Surez C, Muoz C,
12.- Orlikoff R. Heartbeat-related
5.- Buder E. Acoustic analisys of 18.- Takahashi H, Koike Y. Some per- Baragao L, lvarez MJ, Martnez
fundamental frequency and amplitu-
voice quality: A tabulation of algo- ceptual dimensions and acoustical A. Estudio espectro-grfico de la
de variations in healthy young and
rithms 1902-1990. En R Kent y M correlates of pathologic voices. Acta disfona: subarmnicos. Acta Otorri-
elderly male voices. J Voice 1990;
Ball. Voice Quality Measuremets. Otolaryngol Suppl 1975; 338: 1-24. nolaringol Esp 2000; 51(1): 52-56.
4: 322-28.
San Diego: Singular Publishing 26.- Koike Y, Takahashi H, Calcate-
13.- Damborenea J, Fernndez R, 19.- Horii Y. Fundamental frequency
Group, 2000. ra, T. Acoustic measures for detec-
Llorente E, Naya MJ, Marn C, Rue- perturbation observed in sustained
6.- Corina J, Hilgers F, Verdonck I, da P, Ortiz A. Efecto del consumo phonation. J Speech Hear Res ting laryngeal pathology. Acta Oto-
Koopmans F. Acoustical analysis de tabaco en el anlisis acstico de 1979; 22: 5-19. laryngol 1977; 84: 105-17.
and perceptual evaluation of trache- la voz. Acta Otorrinolaringol Esp
20.- Orlikoff R, Kahane J. Influence 27.- Iwata S, von Lenden H. Pitch
oesophageal prosthetic voice. J Voi- 1999; 50(6): 448-52.
of mean sound pressure level on jit- perturbations in normal and patholo-
ce 1998; 12: 239-48.
14.- Walton J, Orlikoff R. Speaker ter and shimmer measures. J Voice gical voices. Folia Phoniatr 1970;
7.- Kent R, Vorperian H, Duffy J. race identification from acoustic 1991; 5: 113-19. 22: 117-28.