Está en la página 1de 13

sumario

Acta Otorrinolaringol Esp 2002; 53: 256-268

INVESTIGACIN CLNICA APLICADA

ANLISIS ACSTICO DE LA VOZ: FIABILIDAD DE UN CONJUNTO


DE PARMETROS MULTIDIMENSIONALES

J. GONZLEZ*, T. CERVERA**, J. L. MIRALLES**


*UNIVERSIDAD JAUME I DE CASTELLN. **UNIVERSITAT DE VALNCIA.

RESUMEN

L
a fiabilidad del anlisis acstico de la voz es una cuestin retest obtenida en cada par de medidas. Los datos muestran una
relevante poco estudiada todava. Se presenta aqu un es- alta estabilidad intra-sujeto en los parmetros de Frecuencia
tudio correlacional sobre la fiabilidad de los parmetros de Fundamental; estabilidad aceptable en los parmetros de Pertur-
la voz en una muestra de 148 adultos sanos. El anlisis se llev bacin de Frecuencia y de Amplitud, Ruido, Subarmnicos e Irre-
a cabo mediante el MDVP- Multi-Dimensional Voice Program ins- gularidad de la voz; y una consistencia muy baja en los parme-
talado en una unidad de CSL-Computerized Speech Lab de Kay tros de Temblor. Los parmetros relacionados con el shimmer
Elemetrics. Por cada sujeto se obtuvieron 29 parmetros de voz son ms fiables que los relacionados con el jitter. De acuerdo
a partir de dos registros de la vocal /a/ sostenida. Se ofrecen los con los resultados obtenidos se extraen conclusiones tiles para
resultados generales separados por gneros y la fiabilidad test- la prctica clnica.

PALABRAS CLAVE: Anlisis acstico. Fiabilidad. Parmetros de voz. MDVP.

ABSTRACT

ACOUSTIC VOICE ANALYSIS: RELIABILITY OF A SET OF MULTI-DIMENSIONAL PARAMETERS

A
correlational study of the reliability of acoustic voice para- liability in each pair of measures was calculated. Data show a
meters was made of 148 healthy adults. Acoustic analysis high intra-subject stability of Frequency Fundamental parameters;
was performed with MDVP- Multi-Dimensional Voice Pro- acceptable stability in parameters of Frequency and Amplitude
gram implemented in a CSL-Computerized Speech Lab of Kay Perturbation, Noise, Subharmonics and Voice irregularities; and a
Elemetrics. A set of 29 voice parameters were obtained from two very low consistency in Tremor parameters. Parameters related
samples of sustained vowel /a/ recorded from each subject. Ge- with shimmer were more reliable than parameters related with jit-
neral results separated by sex are showed and the test-retest re- ter. According to results several conclusions are reported.

KEY WORDS: Acoustic analysis. Reliability. Voice parameters. MDVP.

Correspondencia: J. Gonzlez. Departamento de Psicologa Bsica, Clnica y Psicobiologa. Universidad Jaume I. 12080 Castelln
E-mail: gonzalez@psb.uji.es
Fecha de recepcin: 17-9-2001
Fecha de aceptacin: 3-1-2002

256 Acta Otorrinolaringol Esp 2002; 53: 256-268


ACTA OTORRINOLARINGOLGICA ESPAOLA

INTRODUCCIN pueden ser dependientes de los algoritmos usados


por el software especfico que los calcula3,4, lo que
El anlisis acstico de la voz ha alcanzado un hace ms necesario, si cabe, el disponer de nor-
importante desarrollo en los ltimos tiempos gra- mas especficas de los principales programas em-
cias, entre otras razones, al progreso y difusin pleados en la clnica.
experimentados por los medios informticos que lo Junto a esta necesidad, una propiedad que de-
hacen posible. Entre sus ventajas destaca el ser be disponer todo instrumento de medida es el de
un mtodo no invasivo de evaluacin de la voz y una fiabilidad adecuada que permita confiar en la
el ofrecer la oportunidad de objetivizar la evalua- estabilidad de los valores obtenidos. En la extrac-
cin en unos parmetros numricos. Uno de los cin de parmetros de la voz no podemos esperar
problemas principales en el diagnstico perceptivo una coincidencia absoluta entre dos medidas su-
de la voz por el odo del clnico es que el sistema cesivas del mismo individuo y, dada la enorme va-
auditivo humano est preparado fundamentalmen- riabilidad de la voz humana, tanto entre individuos
te para percibir la voz o el habla como un todo in- como intraindividualmente, es aceptable cierta va-
tegrado, lo cual es altamente beneficioso desde el riacin siempre que sta se mantenga dentro de
punto de vista de la comunicacin lingstica. Aho- ciertos lmites. No obstante, la robustez y validez
ra bien, esta capacidad se ve limitada cuando se clnica de los parmetros descansa necesariamen-
trata de tomar conciencia de componentes acsti- te, como condicin previa, en el grado de consis-
cos individualizados que, sin embargo, son rele- tencia de sus valores. Dos medidas repetidas de
vantes desde una perspectiva clnica1. En muchas la voz del mismo individuo en las mismas condi-
ocasiones existe dificultad en determinar por un ciones de registro deberan ser lo suficientemente
procedimiento exclusivamente perceptivo el origen semejantes para que podamos confiar en ellas.
de ciertas anomalas o particularidades de la voz. El trabajo que aqu se presenta se centra en
Por ejemplo1, algunos rasgos del tono o pitch son uno de los intrumentos ms completos y utilizados
ms el producto de las resonancias del tracto vo- en el anlisis acstico de la voz5-7: el MDVP o Mul-
cal que de la frecuencia de vibracin de las cuer- ti-Dimensional Voice Program, de Kay Elemetrics8,9.
das vocales. La hipernasalidad percibida en una Este sistema calcula rpidamente hasta un total de
voz puede ser la consecuencia de una desincroni- 33 medidas de la funcin vocal pertenecientes a
zacin en los tiempos de oclusin velar antes que distintas dimensiones y las representa grficamen-
una oclusin incompleta. Es decir, un mismo atri- te en relacin a valores normativos que el progra-
buto o alteracin de la calidad vocal puede tener ma incorpora. A travs de esta representacin se
su origen en subsistemas distintos difcilmente ais- visualiza fcilmente la significacin clnica de un
lables por la mera audicin. En otras ocasiones, amplio conjunto de parmetros, gran parte de los
una adecuada percepcin no puede matizarse con cuales son de uso estndar en la clnica de la voz,
el grado de precisin que ofrece una medida nu- pero otros son novedosos y propuestos reciente-
mrica. As, en una voz percibida como soplada mente9.
puede establecerse el grado de aspiracin, o "bre- Kent et al. en un trabajo7 muy reciente sobre
athiness", a travs del parmetro pertinente (ndice el empleo del MDVP en el estudio de la voz en
de turbulencia de voz). En este sentido, junto a la 32 pacientes disrtricos de diversa etiologa (ce-
evaluacin subjetiva por parte del clnico experi- rebrovascular, parkinsoniana, cerebelar y otras),
mentado, el diagnstico se enriquece y gana preci- concluyen con el reconocimiento de la utilidad del
sin cuando se complementa con la medida objeti- instrumento en el habla disrtrica y encuentran
va de parmetros relevantes de la voz. Las que algunos parmetros parecen poseer especial
ventajas de ello se traducen en una mayor objetivi- valor en la descripcin de la calidad vocal de es-
dad en el informe o la comunicacin de los datos y te grupo de pacientes. En el mismo estudio se
en una mayor exactitud en la evaluacin del pro- evala la fiabilidad del MDVP a travs de la com-
greso teraputico, especialmente cuando ste es paracin de pares de medidas dentro de cada su-
lento. jeto. Observando las discrepancias intrasujeto y
Para poder evaluar la voz disfnica a travs de ponindolas en relacin con la significacin clni-
parmetros numricos, es importante definir pre- ca de los datos, los autores consideran que la
viamente la voz normal o no disfnica y disponer fiabilidad es relativamente buena si bien "cual-
de valores normativos de comparacin. Como al- quier conclusin en este aspecto debe ser hecha
gunos autores sealan2, en nuestro mbito geogr- con la apropiada comparacin de la variabilidad
fico son muy escasos los estudios llevados a cabo ensayo-a-ensayo en sujetos control neurolgica-
en este sentido. Por otra parte, algunos valores mente normales".

Acta Otorrinolaringol Esp 2002; 53: 256-268 257


J. GONZLEZ ET AL. FIABILIDAD DE LOS PARMETROS DE LA VOZ

Por otra parte, los datos normativos que acom- sis un fragmento de 3 segundos de la parte ms
paan al MDVP son de origen americano y corre- estable de la seal, desechndose en todo caso
ponden a un nmero muy limitado de casos (siete los primeros 250 milisegundos, en los que el ata-
varones y ocho mujeres)8. Para llenar esa laguna, que de la voz confiere inestabilidad a la seal.
en este trabajo se proporcionan los resultados ob-
tenidos en una muestra amplia de voces sanas Anlisis
pertenecientes a adultos jvenes de ambos gne-
ros, al tiempo que se evala la fiabilidad test-retest El anlisis acstico se realiz de forma automa-
de las medidas mediante la comparacin de dos tizada por medio del programa MDVP, obtenindo-
registros de voz consecutivos obtenidos en cada se por cada muestra un total de 29 parmetros
individuo. clasificados en las siguientes dimensiones: Par-
metros de Frecuencia Fundamental, de Perturba-
cin de Frecuencia, de Perturbacin de Amplitud,
Parmetros de Ruido, Parmetros de Temblor, de
MATERIAL Y MTODOS Componentes Subarmnicos, Parmetros de Ape-
riodicidad y de Interrupcin de la voz (ver Apndi-
Sujetos ce).

Se han analizado dos muestras consecutivas


de voz de un total de 148 sujetos (62 hombres y RESULTADOS Y DISCUSIN
86 mujeres) de la Comunidad Valenciana con un
edad media de 23,32 aos (sd: 5,33) y rango com- En la Tabla 1 se presentan las medias, desvia-
prendido entre 20 y 43 aos. La mayor parte de ciones tpicas y rango de valores de los parme-
los sujetos eran bilinges - castellano/valenciano tros del Multi-Dimensional Voice Program (MDVP)
parlantes - y todos refirieron la ausencia de cual- de Kay obtenidos en la muestra de 148 sujetos.
quier trastorno de la voz, habla o audicin. Los su- En la Tabla 2 se ofrecen separados por gneros,
jetos fueron seleccionados al azar de entre los indicndose aquellos en los que surgen diferencias
cursos de Psicologa y otras licenciaturas. El por- significativas entre varones y mujeres. No se inclu-
centaje de fumadores era del 48,6% (25,6% fuma- yen los resultados de los parmetros de Interrup-
ban 1-10 cigarrillos diarios; 23%, ms de 10 ciga- cin de la voz ya que, al ser voces normales, to-
rrillos diarios) (ver NOTA 1) dos los sujetos obtienen NVB y DVB con valor
cero en las dos muestras, tratndose de fonacio-
Procedimiento nes sostenidas sin interrupcin vocal.
La grabacin se llev a cabo en una sala acs- Frecuencia fundamental
ticamente aislada de los laboratorios de la Univer-
sidad Jaume I de Castelln, a travs de un micr- La media de la frecuencia fundamental (Fo) es
fono cardiode SHURE SM58 de alta calidad de 120 Hz para los varones y 200 Hz para las mu-
dispuesto a una distancia aproximada de 10-12 cm jeres, con importantes variaciones en ambos gru-
de los labios y un ngulo de 30-45. Las muestras pos. Como caba esperar, aparecen diferencias
consistieron en dos registros consecutivos, espa- entre gneros para todos los parmetros relacio-
ciados entre s por un minuto de descanso, de la nados con la frecuencia fundamental (Fhi, Flo,
fonacin sostenida de la vocal /a/ durante al me- STD y PFR), siendo en todo caso la variabilidad
nos tres segundos en un tono e intensidad confor- mayor en el grupo de las mujeres, como as lo in-
tables para el sujeto. La seal de voz era directa- dican los valores de STD y PFR y las desviacio-
mente introducida y digitalizada en el equipo de nes tpicas de Fo, Fhi, y Flo. El rango de valores
anlisis CSL (Computerized Speech Lab) de Kay que presenta la frecuencia fundamental (Fo) se
Elemetrics10, donde se encontraba instalado el pro- extiende entre 83 a 153 Hz para los varones y 158
grama MDVP Multi-Dimensional Voice Program a 274 Hz para las mujeres.
modelo 4305B8. Este programa trabaja nicamente
con dos frecuencias de muestreo: 25 y 50 kHz. La Perturbacin de la frecuencia
digitalizacin se realiz con una frecuencia de
muestreo de 50 kHz, que es la recomendada para Dentro de los parmetros de perturbacin de
las vocales sostenidas, y una cuantizacin de 16 frecuencia, el Jitter, o el promedio de variacin
bits. En cada muestra se seleccion para el anli- entre perodos, medido en microsegundos (millo-

258 Acta Otorrinolaringol Esp 2002; 53: 256-268


ACTA OTORRINOLARINGOLGICA ESPAOLA

Tabla 1: Resultados de los Parmetros del MDVP (Multi-Dimensional Voice Program) obtenidos al analizar
la fonacin sostenida de la vocal /a/ en una muestra de 148 sujetos de ambos gneros

Parmetros Total (N = 148)


MDVP Media ds rango
Frecuencia Fo (Hz) 166 44,49 83 - 274
Fundamental Fhi (Hz) 176 49,57 85 - 303
Flo (Hz) 156 41,85 70 - 263
STD (Hz) 2,50 5,55 0,73 - 68,21
PFR (semit.) 3,03 2,13 1 - 21
Perturbacin Jita (s) 52,35 33,32 5,84 - 192,23
de Jitt (%) 0,83 0,53 0,15 - 3,83
Frecuencia RAP (%) 0,49 0,33 0,07 - 2,28
PPQ (%) 0,49 0,31 0,08 - 2,26
sPPQ (%) 0,72 0,36 0,30 - 3,61
vFo (%) 1,48 3,17 0,60 - 39,26
Perturbacin ShdB (dB) 0,34 0,14 0,11 - 0,91
de Shim (%) 3,86 1,59 1,33 - 9,58
Amplitud APQ (%) 2,95 1,12 1,09 - 7,06
sAPQ (%) 5,02 1,78 1,87 - 11,06
vAm (%) 14,39 6,82 4,75 - 47,83
Ruido NHR 0,13 0,02 0,06 - 0,24
VTI 0,05 0,01 0,02 - 0,10
SPI 8,54 4,43 2,23 - 29,71
Temblor Fftr (Hz) 2,87 2,71 1,01 - 18,18
Fatr (Hz) 2,72 1,55 1,05 - 7,54
FTRI (%) 0,46 0,82 0,07 - 10,06
ATRI (%) 4,60 2,58 0,89 - 13,85
Subarmnicos DSH (%) 0,61 2,82 0 - 24,74
NSH 0,57 2,71 0 - 24
NSH 0,57 2,71 0 - 24
Aperiodicidad DUV (%) 0,28 2,07 0 - 24,49
NUV 0,28 2,03 0 - 24

nsimas de segundo) ciclo a ciclo, ha sido uno de resante considerarlo de forma relativa a la misma,
los ms empleados en la clnica y cuenta con una en trminos porcentuales (Jitt). La muestra total
larga tradicin en la literatura cientfica. El valor de sujetos presenta un promedio de 0,83% de va-
medio de todos los sujetos se sita en 52,35 mi- riabilidad respecto al perodo fundamental, siendo
crosegundos (ms) con un amplio rango compren- sta significativamente mayor en las mujeres
dido entre 5,84 y 192,23 ms, si bien el 75% de la (0,94%) que en los hombres (0,68%). Estos datos
muestra se coloca por debajo de 66 ms y el 90% se sitan entre los obtenidos en otras investiga-
por debajo de 95 ms. Estos valores son ligera- ciones. Hollien et al.11 obtienen 0,48% para varo-
mente inferiores a los ofrecidos en el manual del nes con una frecuencia fundamental Fo en torno
MDVP como normativos (83,2 ms) y ms en con- a 102 Hz, y 0,76% para varones con Fo en torno
sonancia con los que aporta la literatura anterior. a 142 Hz. Orlikoff12 obtiene 0,42% en varones de
Por otra parte, como el jitter guarda relacin con 26-33 aos.
la frecuencia fundamental de la voz, es ms inte- Es creciente la tendencia a usar medidas de

Acta Otorrinolaringol Esp 2002; 53: 256-268 259


J. GONZLEZ ET AL. FIABILIDAD DE LOS PARMETROS DE LA VOZ

Tabla 2: Resultados de los Parmetros del MDVP (Multi-Dimensional Voice Program) separados
por gneros

Parmetros Varones (N = 62) Mujeres (N = 86)


MDVP Media ds rango Media ds rango
Frecuencia Fo*** 120 14,70 83 - 153 200 24,38 158 - 274
Fundamental Fhi*** 125 16,03 85 - 167 213 27,90 166 - 303
Flo*** 115 14,20 81 - 148 186 27,43 70 - 263
STD*** 1,35 0,54 0,73 - 4,46 3,34 7,17 1,16 - 68,21
PFR** 2,48 1,08 1-7 3,42 2,57 2 - 21
Perturbacin Jita* 57,53 33,43 20,57 - 167,39 48,61 32,92 5,84 - 192,23
de Jitt** 0,68 0,39 0,25 - 2,14 0,94 0,59 0,15 - 3,83
Frecuencia RAP*** 0,39 0,24 0,14 - 1,31 0,57 0,37 0,07 - 2,28
PPQ** 0,40 0,22 0,15 - 1,21 0,55 0,35 0,08 - 2,26
sPPQ 0,68 0,23 0,38 - 1,52 0,75 0,42 0,30 - 3,61
vFo 1,12 0,41 0,60 - 3,26 1,73 4,14 0,64 - 39,26
Perturbacin ShdB 0,33 0,14 0,11 - 0,74 0,34 0,15 0,11 - 0,910
de Shim 3,82 1,58 1,33 - 8,33 3,89 1,61 1,33 - 9,58
Amplitud APQ 3,06 1,17 1,34 - 7,06 2,87 1,08 1,09 - 5,97
sAPQ 4,87 1,66 2,69 - 9,31 5,13 1,86 1,87 - 11,06
vAm** 12,38 6,03 4,75 - 31,43 15,83 7,02 5,89 - 47,83
Ruido NHR** 0,14 0,02 0,10 - 0,23 0,13 0,02 0,06 - 0,24
VTI 0,05 0,02 0,02 - 0,10 0,05 0,01 0,02 - 0,09
SPI 8,78 3,28 2,87 - 17,51 8,36 5,12 2,23 - 29,71
Temblor Fftr 2,71 2,61 1,01 - 12,50 2,98 2,79 1,01 - 18,18
Fatr 2,72 1,83 1,05 - 7,54 2,72 1,34 1,07 - 6,78
FTRI 0,39 0,18 0,13 - 0,86 0,51 1,06 0,07 - 10,06
ATRI* 3,98 2,50 0,92 - 13,85 5,04 2,56 0,89 - 11,17
Subarmnicos DSH* 0,07 0,31 0,00 - 2,00 1,01 3,65 0,00 - 24,74
NSH* 0,06 0,31 0-2 0,94 3,51 0 - 24
Aperiodicidad DUV 0,55 3,14 0,00 - 24,49 0,10 0,52 0,00 - 3,16
NUV 0,53 3,07 0 - 24 0,09 0,50 0-3

(*) Diferencia significativa en la prueba Mann-Whitney con p<0,05. (**) dem p <0,01. (***): dem p<0,001.

perturbacin de frecuencia con un cierto grado de al que encuentran en Espaa con otro programa
suavizacin, que no sean tan sensibles a posibles (Dr Speech Science) Fernndez Liesa et al 2 en
alteraciones errticas entre dos ciclos consecuti- una muestra de 154 adultos no fumadores
vos, o a los errores que pueda cometer el algorit- (PPQ=0,23), e incluso al del grupo de fumadores
mo de extraccin de perodos. Las preferencias se del estudio de Damborenea et al. 13 (PPQ=0,27).
decantan por el promediado de 3 perodos conse- Tambin es superior al del estudio de Walton y Or-
cutivos (RAP), o 5 perodos (PPQ). Cuando se likoff14 (RAP=0,28) y est ms prximo a los valo-
aplican estos suavizados los valores se rebajan res encontrados por Preciado et al.15, 16 en su grupo
sensiblemente, ofreciendo 0,49 para ambos par- control de 64 docentes espaoles (RAP=0,35), o
metros en nuestra muestra total, inferiores a los los trabajos de Dwire y McCauley17 en sujetos nor-
datos normativos del manual del MDVP (0,68 para teamericanos (RAP=0,38 para varones y
RAP y 0,84 para PPQ). Nuestro dato es superior RAP=0,89 para mujeres, ambos de 18-25 aos de

260 Acta Otorrinolaringol Esp 2002; 53: 256-268


ACTA OTORRINOLARINGOLGICA ESPAOLA

edad) o Takahashi y Koike18 para japoneses varo- muestra de no fumadores de los trabajos de Fer-
nes (RAP =0,57) y mujeres (RAP=0,61). Las dife- nndez 2 y Damborenea 13 arrojan APQ=2,02%, y
rencias significativas entre gneros encontradas los fumadores de este ltimo estudio, 2,56%. En
en nuestros parmetros de perturbacin frecuen- trabajos extranjeros, el "clsico" de Horii19 con 31
cial Jita (test Mann-Whitney, p<0,05), Jitt (p<0,01), hombres y 20 mujeres obtiene shimmers de 0,47
RAP (p<0,001), y PPQ (p<0,01), apunta en la l- dB y 0,33 dB respectivamente para la vocal /a/, sin
nea de lo declarado por Baken y Orlikoff en su re- diferencias significativas entre los gneros. Orlikoff
ciente revisin de 20001: "la evidencia preliminar y Kahane20 demuestran que el shimmer se reduce
seala la posibilidad de que las mujeres adultas cuando la intensidad de la voz aumenta; sus datos
podran tener ms jitter vocal que los hombres, al promedio para voces masculinas a una intensidad
menos para algunas vocales. Afortunadamente, moderada, equivalente a nuestro nivel confortable,
las diferencias observadas entre los gneros no se sitan en 0,31 dB.
son lo suficientemente grandes como para dar lu-
gar a errores diagnsticos". Parmetros de ruido
Si el promediado se realiza a travs de 55 pe-
rodos consecutivos (sPPQ), la variabilidad fre- Los parmetros basados en la relacin entre la
cuencial no alcanza significacin entre los gne- energa armnica y la energa de ruido tienen una
ros. De nuevo, el promedio (0,72%) es inferior al extensa aplicacin en la clnica de la voz, por su
umbral ofrecido por el manual (1,02%). Tampoco estrecha relacin con muchas disfonas 21-23. Por
surgen diferencias inter-gnero en la variacin de otra parte, son muy sensibles a los sistemas de
largo recorrido de Fo, medida a travs del parme- registros empleados ya que stos pueden introdu-
tro vFo. cir niveles de ruido ajenos a los que comportan la
propia voz, alterando los resultados. La formula-
Perturbacin de la amplitud cin concreta de estos parmetros vara de unos
algoritmos a otros: HNR o Harmonic-to-noise ratio,
Los parmetros que miden la perturbacin de o su recproco, NHR Noise-to-Harmonic ratio, co-
amplitud a travs de los ciclos de la voz (ShdB, mo es el caso del programa MDVP. El promedio
Shim, APQ, sAPQ, y vAm) tienen, al igual que sus de NHR a travs de los 148 sujetos es 0,13 (es
homlogos frecuenciales, una relevante significa- decir, la energa del ruido equivale a un 13% de la
cin clnica. Sus valores se presentan en las Ta- energa armnica); el 70% de los sujetos tienen
blas 1 y 2, sin diferencias estables entre gneros, valores igual o inferiores a 0,14; el 90% de los su-
a excepcin de vAm. Los valores medios de shim- jetos se sita por debajo de 0,16. Estos datos son
mer absoluto y relativo a travs de los 148 sujetos ligeramente inferiores al 0,19 dado como umbral
(0,34 dB y 3,86%, respectivamente) son muy se- de normalidad por el manual del MDVP. La exigua
mejantes a los valores normativos del manual diferencia que surge en nuestra muestra entre va-
(0,31 dB y 3,81%). En nuestra muestra el 75% de rones (0,14) y mujeres (0,13), es significativa (test
los sujetos tienen ShdB y Shim inferiores a 0,39 Mann-Whitney, p<0,01) porque aparece de forma
dB y 4,54% respectivamente; y el 90% est por bastante sistemtica a travs de los individuos, si
debajo de 0,53 dB y 5,98%. El suavizado matem- bien no tiene significacin diagnstica.
tico a travs del promedio de 11 perodos conse- NHR incluye globalmente toda la energa inar-
cutivos, o de 55 perodos, arrojan valores medios mnica, o de ruido, que se produce en la fonacin
de APQ=2,95% y sAPQ=5,02%, respectivamente. desde orgenes diversos: irregularidades en los
La variacin de la amplitud a largo plazo en la fo- perodos vibratorios, subarmnicos, ruido por tur-
nacin sostenida de la vocal se mide con el par- bulencia, etc. El parmetro VTI-Voice Turbulence
metro vAm, como el cociente, en trminos porcen- Index, o ndice de Turbulencia de Voz, pretende
tuales, entre la desviacin tpica y el promedio de medir selectivamente el ruido que se produce por
la variacin de amplitud ciclo-a-ciclo. En este para- la turbulencias del aire cuando el cierre de las
mtro, la diferencia entre vAm=12,38% para los cuerdas vocales es incompleto o laxo. Como la
varones y vAm=15,83 % para las mujeres es signi- mayor parte de los componentes de este ruido son
ficativa (test Mann-Whitney, p<0,001), presentando de alta frecuencia, el parmetro slo considera la
esta ltima una mayor variacin de la amplitud a lo energa de ruido en la regin 2800-5800 Hz. Los
largo de la fonacin sostenida. A efectos compara- datos obtenidos en nuestro estudio arrojan un pro-
tivos con sujetos espaoles, conviene recordar medio de 0,05; el 75% de los sujetos obtiene pun-
que los sujetos controles de Preciado et al.15 dan tuaciones iguales o inferiores a 0,06; el 90% igual
un valor medio de APQ =5,01%; mientras que la o inferior a 0,07. Estos datos no se apartan del

Acta Otorrinolaringol Esp 2002; 53: 256-268 261


J. GONZLEZ ET AL. FIABILIDAD DE LOS PARMETROS DE LA VOZ

umbral de normalidad del MDVP, que lo sita en presenta componentes subarmnicos. De los 148
0,06. sujetos de nuestra muestra, 130 no tienen ningn
El SPI- Soft Phonation Index, o ndice de Fona- subarmnico en su voz, mientras que 18 sujetos -
cin Blanda, es otro parmetro original de Kay 15 mujeres y 3 varones- presentan un nmero va-
Elemetrics, propuesto por primera vez en esta ver- riable de los mismos. Esto da lugar a los valores
sin de 1993 del programa MDVP. Da una medida promedios de NSH=0,57 y DSH=0,61%. Es evi-
del predominio de componentes armnicos de baja dente que en un parmetro de esta naturaleza el
frecuencia y se calcula dividiendo la energa arm- valor medio no es una adecuada aproximacin
nica en el rango 70-1600 Hz entre la energa ar- desde el punto de vista clnico, pero se incluye en
mnica en el rango 1600-4500 Hz. No se trata, por la tabla general con el fin de estudiar su fiabilidad
tanto, de un parmetro de ruido, pero el MDVP lo test-retest.
agrupa con los anteriores por la semejanza de su
frmula de clculo y aqu mantenemos el mismo Interrupcin de la periodicidad
enfoque clasificatorio. El umbral de normalidad,
14,12, proporcionado por el manual del MDVP a Las mismas consideraciones deben hacerse en
partir de tan slo quince sujetos se sita ligera- relacin con los ndices NUV y DUV. Se refieren
mente por encima de nuestros datos. El promedio respectivamente al nmero y porcentaje de seg-
de los 148 sujetos es de 8,54; el 75% de los suje- mentos sordos en los que la seal deja de ser pe-
tos punta por debajo de 10,69; y el 90% por de- ridica y el algoritmo de clculo no puede extraer
bajo de 13,53. Tanto en SPI como VTI no hay dife- la frecuencia fundamental. En voces normales, y al
rencias entre gneros. tratarse de la fonacin sostenida de una vocal, no
deberan arrojar valores distintos de cero. En
Parmetros de temblor nuestra muestra, 10 sujetos presentan alguna inte-
rrupcin accidental en su fonacin lo que da lugar
Los parmetros de temblor, tanto frecuenciales a valores no nulos y, en consecuencia, los prome-
como de amplitud, (Fftr, Fatr, FTRI, ATRI) dan va- dios son tambin distintos de cero.
lores numricos en slo 129 del total de 148 suje-
tos; en los restantes el MDVP arroja valores au- Fiabilidad de las medidas
sentes al no poder extraer un patrn cclico de
modulacin de la voz. Salvo en ATRI, no hay dife-
rencias entre varones y mujeres. El MDVP ofrece Ms all de la obtencin de valores normativos,
umbrales de normalidad en dos de ellos, el objetivo principal de este trabajo ha sido evaluar
FTRI=0,95% y ATRI= 4,37%, que no estn lejos el grado de fiabilidad de las medidas obtenidas,
de los promedios obtenidos en nuestra muestra. estudiando la estabilidad de los parmetros en una
prueba test-retest mediante el anlisis de dos
Subarmnicos muestras consecutivas de voz tomadas en cada
sujeto. En la Tabla 3 se ofrecen por cada parme-
Otro rasgo de gran relevancia en el estudio cl- tro la correlacin de Pearson obtenida entre am-
nico de la voz es la presencia de componentes su- bas medidas a travs de todos los sujetos. Tam-
barmnicos de baja intensidad situados entre los bin, siguiendo la metodologa de Kent, Vorperian
armnicos24, 25. Esta alteracin acstica suele apa- y Duffy7, se han extrado las discrepancias, o dife-
recer en disfonas causadas por plipos o edemas rencias en valores absolutos entre ambas medi-
de Reinke, en las que pueden producirse irregula- das, y en la tabla se ofrecen la media, desviacin
ridades asimtricas en la oscilacin de las cuerdas tpica y el rango de la distribucin de esas discre-
vocales y la aparicin de dos o ms patrones si- pacias a travs de los sujetos.
multneos de vibracin que dan lugar a la bifona- Los parmetros de la frecuencia fundamental
cin o diplofona. El MDVP proporciona dos par- (F0, Fhi, Flo) muestran una gran consistencia a
metros, el NSH, o Nmero de componentes travs de las dos muestras analizadas, con corre-
Subarmnicos, y el DSH o Grado de Subarmonici- laciones superiores a 0,90 y pequeas discrepan-
dad, consistente en la relacin porcentual entre los cias entre cada par de valores. Cuando se pide la
componentes subarmnicos y los componentes ar- fonacin sostenida de una vocal a un tono e inten-
mnicos de Fo. En principio la voz normal debera sidad confortable, parece que cada sujeto tiene
tener valores nulos en ambos parmetros, pero una frecuencia fundamental de la voz caractersti-
existe un pequeo porcentaje de personas, princi- ca que vara poco de un ensayo a otro. As el pro-
palmente mujeres, cuya voz, sin ser patolgica, medio de discrepancia de Fo es slo de 3,53 Hz,

262 Acta Otorrinolaringol Esp 2002; 53: 256-268


ACTA OTORRINOLARINGOLGICA ESPAOLA

Tabla 3: Fiabilidad test-retest de los Parmetros del MDVP (Multi-Dimensional Voice Program). Correlaciones
de Pearson y Diferencias absolutas entre los valores obtenidos por dos muestras de voz de cada sujeto

Fiabilidad de los Parmetros MDVP (N = 148)


Correlacin Diferencia Absoluta
1-2 muestra 1-2 muestra
r Media sd rango
Frecuencia Fo (Hz) 0,990 3,53 5,52 0 - 52,28
Fundamental Fhi (Hz) 0,976 6,77 8,68 0 - 46,11
Flo (Hz) 0,940 7,28 12,54 0 - 124,62
STD (Hz) 0,216 0,95 5,35 0 - 65,24
PFR (semit.) 0,428 1,05 1,76 0 - 15
Perturbacin Jita (ms) 0,627 17,33 21,93 0 - 131,88
de Jitt (%) 0,685 0,27 0,34 0 - 2,71
Frecuencia RAP (%) 0,686 0,17 0,21 0 - 1,67
PPQ (%) 0,704 0,16 0,19 0 - 1,46
sPPQ (%) 0,492 0,17 0,29 0 - 2,90
vFo (%) (NS) 0,124 0,55 3,11 0 - 37,95
Perturbacin ShdB (dB) 0,740 0,06 0,08 0 - 0,53
de Shim (%) 0,738 0,70 0,89 0 - 6,07
Amplitud APQ (%) 0,749 0,50 0,59 0 - 3,64
sAPQ (%) 0,605 1,13 1,04 0 - 6,26
vAm (%) 0,489 4,68 4,48 0 - 24,57
Ruido NHR 0,649 0,01 0,01 0 - 0,08
VTI 0,607 0,01 0,01 0 - 0,03
SPI 0,848 1,66 1,81 0 - 12,61
Temblor Fftr (Hz) 0,301 2,06 2,55 0 - 13,44
Fatr (Hz) (NS) 0,067 1,93 1,94 0 - 12,26
FTRI (%) (NS) 0,018 0,20 0,80 0 - 9,82
ATRI (%) (NS) 0,201 2,58 2,43 0 - 11,79
Subarmnicos DSH (%) 0,780 0,50 1,74 0 - 13,00
NSH 0,781 0,47 1,68 0 - 13
Aperiodicidad DUV (%) 0,800 0,28 1,60 0 - 18,42
NUV 0,825 0,26 1,56 0 - 18

(NS): correlacin no significativa.

lo que supone un 2,12% del valor medio de Fo en grabacin. La estabilidad, sin embargo, cae nota-
todos los sujetos (166 Hz). Por otra parte, la distri- blemente cuando se considera la desviacin tpica
bucin de las discrepancias es muy asimtrica, (STD) de la frecuencia de cada muestra, o sus
siendo relativamente unos pocos los que ofrecen rangos fonatorios (PFR).
dos fonaciones con tonos muy dispares, al tiempo Entre los parmetros de Perturbacin de Fre-
que la mayora muestran una alta estabilidad to- cuencia, los valores de jitter (Jita, Jitt), RAP y PPQ
nal: de los 148 sujetos, 109 presentan una discre- muestran una estabilidad moderada con correla-
pancia inferior a 4Hz entre la primera y la segunda ciones comprendidas entre 0,62 y 0,70; siendo el

Acta Otorrinolaringol Esp 2002; 53: 256-268 263


J. GONZLEZ ET AL. FIABILIDAD DE LOS PARMETROS DE LA VOZ

Cociente de Perturbacin de Tono (PPQ) el par- la prcticamente nula correlacin entre los dos en-
metro ms estable. Parece que la incoporacin de sayos (r=0,124, no significativa), parece que dicho
un factor de suavizado de 5 perodos en PPQ, comportamiento de la frecuencia fundamental es
propuesto por Koike et al. 26, consigue dotar a la ms bien de carcter episdico y dependiente de
medida de una mayor estabilidad, mostrando una cada fonacin sostenida, antes que una caracters-
consistencia entre ensayos algo superior a las me- tica estable de la fonacin de un sujeto.
didas no suavizadas (Jitter absoluto y relativo) o Los Parmetros de Perturbacin de Amplitud
suavizadas con 3 perodos (RAP). Un factor de exhiben, en trminos generales, una consistencia
suavizado de 55 perodos, sin embargo, no tiene superior a la de los Parmetros de Perturbacin
la consecuencia de ms estabilidad; antes al con- de Frecuencia. Salvo en sAPQ y vAm, las correla-
trario, la correlacin entre los dos medidas de ciones entre la primera y segunda muestra de voz
sPPQ cae a 0,492. son superiores a 0,70 y la oscilacin entre ambas
Si se observan los promedios de las diferencias viene a estar por debajo de una quinta parte de la
absolutas entre los dos ensayos, podemos tener medida. As, una discrepancia media de 0,06 dB
una idea de las consecuencias diagnsticas de la en ShdB representa el 17,6% del valor medio para
variacin entre medidas. Una diferencia promedio todos los sujetos (0,34); la discrepancia de 0,70
de 17,33 ms entre dos jitters consecutivos es un para Shim es el 18,1% del total; la discrepancia de
30% de la media general (Jita=57,53 s). En algu- 0,50 para APQ representa el 16,9% del total. De
nos sujetos con valores prximos al umbral de nuevo, al igual que observbamos en los parme-
normalidad, puede suponer que una muestra de tros de perturbacin frecuencial, podemos extraer
voz arroje un dato por debajo de ese umbral y en las siguientes conclusiones: a) un factor de suavi-
una segunda muestra, tomada en las mismas con- zado moderado confiere a la medida mayor estabi-
diciones, dicho umbral sea superado. En tminos lidad, por lo que APQ es el parmetro con ms fia-
generales, esta diferencia de 17,33 s no parece bilidad test-retest; b) un factor de suavizado
dramtica, pero su distribucin es altamente asi- grande (55 perodos para sAPQ) no otorga ms
mtrica. De los 148 sujetos, la mitad de ellos pre- estabilidad a la medida; c) la variacin de amplitud
sent diferencias inferiores a 10 s entre los dos a largo plazo dentro de la fonacin, o vAm, es el
medidas de Jita; pero en el otro extremo de la dis- parmetro menos fiable, como as sucede con su
tribucin, 16 sujetos obtuvieron discrepancias por homlogo frecuencial.
encima de 40 s, el cual es ciertamente un valor La fiabilidad de los parmetros de ruido nos
importante. Se constata tambin la tendencia, lgi- obliga a diferenciar entre NHR y VTI, por una par-
ca por otra parte, a que el jitter vare ms en los te, y SPI, por otra. Los dos primeros presentan co-
sujetos con valores ms altos. En los otros para- rrelaciones inter-muestras moderadas, de 0,649 y
mtros las diferencias son de un tenor semejante: 0,607, respectivamente, con unas discrepancias
0,27 de diferencia entre las dos medidas de Jitt re- medias relativamente inferiores en NHR (un 10%
presenta el 32,5% de la media general (0,83); 0,17 del total) que en VTI (un 20% del total). Las distri-
es el 34,7% de la media de RAP (0,49); 0,16 es el buciones de estas discrepancias son bastante asi-
32,7% de la media de PPQ (0,49); 0,17 es el mtricas. Dada la importancia diagnstica de NHR,
23,6% de la media de sPPQ (0,72). Es decir, po- conviene detenerse en la distribucin de sus dis-
demos concluir que en lneas generales dos medi- crepancias entre ambas muestras de voz: de los
das consecutivas de la Perturbacin de Frecuencia 148 sujetos, 127 obtienen discrepancias inferiores
van a presentar una oscilacin en torno a la terce- a 0,02, lo cual tiene poca significacin clnica si re-
ra parte de las mismas. Si adems se tiene en cordamos que el promedio total de NHR es 0,13 y
cuenta que en ciertos sujetos esta variacin va a el umbral de normalidad propuesto por el MDVP
ser bastante mayor, el corolario parece obvio: se- es 0,19. De los 21 sujetos restantes, 20 varan por
ra aconsejable que tanto en la evaluacin diag- debajo de 0,06, y los dos con mayores discrepan-
nstica de la voz como en los estudios del progre- cias alcanzan 0,07 y 0,08, respectivamente. Es de-
so post-tratamiento, se obtuvieran al menos dos cir, aunque la correlacin entre muestras de NHR
medidas por cada paciente y se utilizar el prome- es moderada, en general la disparidad entre los
dio de ambas. valores es pequea y tiene poca significacin clni-
Por otra parte, llama la atencin la escasa con- ca. Consideraciones similares caben efectuar res-
sistencia de los datos de Variacin de la Frecuen- pecto a VTI, o ndice de Turbulencia de Voz, par-
cia Fundamental medida a travs de vFo. Dicho metro nuevo propuesto por la casa Kay en un
parmetro refleja la variacin de Fo a largo plazo intento de objetivizar el grado de soplado (breathi-
dentro de la muestra de voz analizada. A la luz de ness) de la voz producido por un cierre laxo e in-

264 Acta Otorrinolaringol Esp 2002; 53: 256-268


ACTA OTORRINOLARINGOLGICA ESPAOLA

completo de las cuerdas vocales. Por su novedad, mento, y el resto difieren en ms de un segmento
no disponemos an de valores normativos en la li- aperidico.
teratura profesional.
Por su parte, el SPI, o ndice de Fonacin Blan-
da, parece un parmetro interesante y prometedor CONCLUSIONES
si bien, al ser muy reciente, no cuenta hasta la fe-
cha con estudios sobre su potencialidad diagnsti- De acuerdo con los resultados obtenidos al
ca. Ms all del mbito clnico, promete ser un indi- analizar dos muestras consecutivas de voz de 148
cador objetivo de cierta cualidad de timbre vocal: la sujetos normales con el MDVP o Multi-Dimensional
fonacin "blanda", o voz con predominio de los Voice Program, pueden extraerse las siguientes
componentes armnicos graves. Pruebas percepti- conclusiones sobre la fiabilidad de las medidas.
vas informales revelan una estrecha corresponden- 1. Los Parametros de Frecuencia Fundamental
cia entre sus resultados numricos y la impresin (Fo, Fhi, Flo) son muy consistentes a travs de las
cualitativa de voz "blanda" o poco estridente, lo dos muestras de voz, con correlaciones test-retest
que es un acicate para futuros estudios sistemti- muy altas. Segn las caractersticas fonatorias de
cos. Este hecho tiene relevancia si tenemos en cada sujeto, ste tiene una frecuencia de vibracin
cuenta la escasa relacin directa que en general preferente que tiende a reproducir en distintas fo-
encontramos en la investigacin sobre timbre vo- naciones sostenidas de la misma vocal, al menos
cal, entre medidas numricas y la percepcin cuali- cuando se producen a un tono e intensidad confor-
tativa e integrada de la cualidad vocal. En este table. Esta consistencia, sin embargo, cae drsti-
sentido, sorprende favorablemente su alta estabili- camente cuando se mide la variabilidad y el rango
dad entre muestras, con una correlacin de 0,848 frecuencial dentro de cada fonacin (STD y PFR).
entre ambas, que es la mxima despus de las 2. Los Parmetros de Perturbacin de Amplitud
medidas de frecuencia fundamental (Fo, Fhi y Flo). son ms consistentes que los Parmetros de Per-
Los parmetros de Temblor presentan una es- turbacin de Frecuencia, superndoles en algo
cassima consistencia entre ensayos. A excepcin ms de 0,10 puntos en la correlacin test-restest.
de Fftr, cuya baja correlacion entre muestras 3. Dada la gran variabilidad de la voz humana,
(0,301), resulta estadsticamente significativa, los ambos tipos de parmetros presentan discrepan-
dems parmetros obtienen correlaciones prctica- cias entre las dos muestras de cada sujeto. En tr-
mente nulas y no significativas. Tal vez en voces minos generales, los Parmetros de Perturbacin
patolgicas en las que el rasgo de temblor sea un de Frecuencia varan en torno a una tercera parte
componente importante (temblor esencial, enfer- de su valor, y los Parmetros de Perturbacin de
medad de Parkinson) puedan encontrarse niveles Amplitud varan en torno a una quinta parte de su
superiores de consistencia entre ensayos, pero en valor. En los casos limtrofes con la voz patolgica
lo que se refiere a las voces normales los resulta- esta variacin podra tener significacin clnica, por
dos obtenidos en la primera muestra de voz son lo que sera recomendable en la prctica diagns-
muy distintos de los que se obtienen en la tica registrar al menos dos medidas y obtener el
segunda. Esto quiere decir que los aspectos medi- promedio de ambas.
dos por los cuatro parmetros -frecuencia y ampli- 4. Un factor de suavizado moderado en el c-
tud de modulacin de la voz- tienen una naturale- culo de de ambos tipos de parmetros incrementa
za marcadamente episdica ligada a cada la consistencia de los mismos; siendo el PPQ
fonacin particular, con una fiabilidad escasa en (Pitch Perturbation Quotient) o Cociente de Pertur-
cuanto a la caraterizacin de un rasgo estable de bacin de Tono, con un factor de suavizado de 5
la voz de un individuo. Esto al menos en voces no perodos, el ms consistente de los Parmetros de
patolgicas. Perturbacin Frecuencial, y su homlogo el APQ
Los parmetros que analizan los componentes, (Amplitude Perturbation Quotient) o Cociente de
DSH y NSH ofrecen correlaciones test-retst prxi- Perturbacin de Amplitud, con un factor de suavi-
mas a 0,80. De los 148 sujetos, 122 no presentan zado de 11 perodos, el ms consistente de los
subarmnicos en ninguna de las dos muestras re- Parmetros de Perturbacin de Amplitud. Por el
gistradas, 10 difieren en un subarmnico entre las contrario, un factor fuerte de suavizacin hace ba-
dos muestras, y el resto difieren en ms de un su- jar la consistencia, como es el caso de sPPQ
barmnico. La consistencia de los parmetros de (Smoothed Pitch Perturbation Quotient) o Cociente
aperiodicidad es ligeramente superior a 0,80. Aqu, Suavizado de Perturbacin de Tono, y de sAPQ
136 sujetos no tienen segmentos aperidicos, o (Smoothed Amplitude Perturbation Quotient) o Co-
sordos, en ninguna muestra, 6 difieren en un seg- ciente de Perturbacin de Amplitud Suavizado,

Acta Otorrinolaringol Esp 2002; 53: 256-268 265


J. GONZLEZ ET AL. FIABILIDAD DE LOS PARMETROS DE LA VOZ

ambos con un factor de suvizado de 55 perodos. frecuencia fundamental para todos los perodos
Ahora bien, estos dos parmetros miden aspectos extrados de la onda acstica.
distintos al de los dems por lo que, pese a su in- Frecuencia Fundamental ms Alta (Fhi-Highest
ferior consistencia, son tiles porque reflejan las Fundamental Frequency) /Hz/. La frecuencia fun-
perturbaciones a largo trmino de la fonacin, tan- damental ms alta alcanzada en todos los pero-
to en frecuencia como amplitud vocal. dos extrados de la onda acstica.
5. Los parmetros de variacin frecuencial Frecuencia Fundamental ms Baja (Flo-Lowest
(vFo) y de Amplitud (vAm) a lo largo de la fona- Fundamental Frequency) /Hz/. La frecuencia fun-
cin sostenida presentan grandes discrepancias damental ms baja alcanzada en todos los pero-
entre las dos muestras de voz, por lo que su con- dos extrados de la onda acstica.
sistencia es baja para un mismo individuo. Desviacin tpica de la Frecuencia Fundamen-
6. Los Parmetros de Ruido, NHR (Noise to tal (STD-Standard Deviation of Fo) /Hz/. La desvia-
Harmonic Ratio) o Razn Ruido/Armnicos y VTI cin tpica de Fo dentro del rango analizado.
(Voice Turbulence Index) o ndice de Turbulencia Rango Fonatorio en semitonos (PFR-Phonatory
de Voz, exhiben una consistencia moderada, con Fo-Range). Rango entre Fhi y Flo expresado en
correlaciones test-retest entre 0,60 y 0,70. Dada semitonos.
su importancia en la prctica clnica, especialmen- Parmetros de Perturbacin de Frecuencia:
te del primero, sera aconsejable la obtencin de Jitter Absoluto (Jita-Absolute Jitter) /us/: Da una
dos medidas promediadas, en la misma lnea de lo evaluacin in microsegundos (ms) de la variabili-
sealado anteriormente. dad perodo-a-perodo de la frecuencia fundamen-
7. El parmetro SPI, Soft Phonation Index, o tal dentro de la muestra analizada. Este parmetro
ndice de Fonacin Blanda es un parmetro re- y sus derivados son ampliamente usados en la cl-
ciente que apenas cuenta con datos sobre su po- nica e investigacin sobre la voz 27, siendo muy
tencialidad diagnstica. Sin embargo plantea inte- sensible a las variaciones que ocurren entre pero-
resantes posibilidades tanto en la prctica clnica dos consecutivos.
como en la investigacin sobre el timbre vocal, no Jitter Porcentual (Jitt-Jitter Percent) /%/: Varia-
slo por su aparente relevancia perceptiva sino bilidad relativa perodo-a-perodo expresado en
por su gran consistencia entre muestras de voz de porcentaje.
un mismo sujeto. De hecho, se ha revelado como Perturbacin Relativa Promedio (RAP-Relative
el parmetro ms fiable despus de los parme- Average Perturbation) /%/: Introducida por Koike et
tros de frecuencia fundamental. al.26, este parmetros mide la variabilidad perodo-
8. Los parmetros de Temblor ofrecen una con- a-perodo con un factor de suavizado de 3 pe-
sistencia muy baja entre las dos muestras de un rodos.
mismo sujeto con voz normal. Queda abierta la Cociente de Perturbacin de Tono (PPQ-Pitch
posibilidad de una mayor consistencia en voces Perturbation Quotient) /%/: Introducido por Koike et
patolgicas en los que el temblor constituya un al.26, da la variabilidad perodo-a-perodo con un
componente importante de la disfona. factor de suavizado de 5 perodos.
9. Los parmetros de Subarmnicos y Aperiodi- Cociente Suavizado de Perturbacin de Tono
cidad son estables en lneas generales, si bien un (sPPQ-Smoothed Pitch Perturbation Quotient) /%/:
pequeo porcentaje de sujetos arrojan discrepa- Da la variabilidad perodo-a-perodo con un factor
cias importantes entre sus dos muestras de voz. de suavizado de 55 perodos.
Variacin de la Frecuencia Fundamental (vFo-
Fundamental Frequency Variation) /%/: La desvia-
AGRADECIMIENTOS cin tpica relativa de la frecuencia fundamental.
Refleja la variacin de Fo a largo plazo dentro de
Este trabajo han sido financiado por el Proyec- la muestra analizada.
to P1A99-01 de la Fundaci Caixa-Castell y la Parmetros de Perturbacin de Amplitud:
Universidad Jaume I de Castelln. Shimmer Absoluto (ShdB-Shimmer) /dB/: Medi-
da en dB de la variabilidad entre perodos conse-
cutivos de la amplitud pico-a-pico de la onda de la
APNDICE muestra de voz analizada. Como en otros parme-
tros, las reas de ruptura de voz, sin naturaleza
Parmetros de Frecuencia Fundamental: peridica, son excluidas del cmputo. Este par-
Frecuencia Fundamental Media (Fo-Average metro tambin ha sido y es ampliamente usado en
Fundamental Frequency) /Hz/. El promedio de la la prctica clnica27.

266 Acta Otorrinolaringol Esp 2002; 53: 256-268


ACTA OTORRINOLARINGOLGICA ESPAOLA

Shimmer Porcentual (Shim-Shimmer Percent) Parmetros de Temblor:


/%/: Variabilidad relativa entre periodos consecutivos Frecuencia Moduladora de Temblor de Fo (Fftr-
de la amplitud pico-a-pico, expresada en porcentaje. Fo-Tremor Frequency) /Hz/: En la oscilacin peri-
Cociente de Perturbacin de Amplitud (APQ- dica de la Frecuencia fundamental (Fo) de la voz a
Amplitude Perturbation Quotient) /%/: Introducido consecuencia de temblor, este parmetro muestra
por Takahashi et al.18 y Koike et al.26, mide la varia- la frecuencia de modulacin de Fo.
bilidad relativa de la amplitud pico-a-pico con un Frecuencia Moduladora de Temblor de Amplitud
factor de suavizado de 11 perodos. Este suaviza- (Fatr-Amplitude Tremor Frequency) /Hz/: En la os-
do reduce la sensibilidad a los errores producidos cilacin peridica de la Amplitud de la voz a con-
en la extraccin de los perodos. secuencia de temblor, este parmetro muestra la
Cociente de Perturbacin de Amplitud Suaviza- frecuencia de modulacin de la misma.
do (sAPQ-Smoothed Amplitude Perturbation Quo- ndice de Intensidad de Temblor de Fo (FTRI-
tient) /%/: Mide la variabilidad relativa de la ampli- Fo-Tremor Intensity Index) /%/: En la oscilacin
tud pico-a-pico con un factor de suavizado de 55 peridica de Fo a consecuencia de temblor, este
perodos. parmetro muestra la magnitud de dicha frecuen-
Variacin de Amplitud (vAm-Peak-Amplitude cia moduladora en respecto a la magnitud de fre-
Variation) /%/: Da la desviacin tpica relativa, cal- cuencia total de la seal analizada.
culada perodo a perodo, de la amplitud pico-a-pi- ndice de Intensidad de Temblor de Amplitud
co de la onda. Refleja las variaciones de amplitud (ATRI-Amplitude Tremor Intensity Index) /%/: En la
de largo trmino a travs de la muestra analizada. oscilacin peridica de la Amplitud de la voz a
Parmetros de Ruido: consecuencia de temblor, este parmetro muestra
Razn Ruido/Armnicos (NHR-Noise to Harmo- el porcentaje de intensidad del temblor respecto a
nic Ratio): Una evaluacin general de la presencia la amplitud total de la seal.
de ruido en la seal de voz. Este ruido puede te- Parmetros de Componentes Subarmnicos:
ner diversos orgenes: variaciones en la frecuencia Nmero de Componentes Subarmnicos (NSH-
o la amplitud, ruido por turbulencia, presencia de Number of Subharmonic Segments): Nmero de
componentes subarmnicos, o existencia de ruptu- componentes subarmnicos encontrados durante
ras de voz. El parmetro consiste en el cociente el anlisis. Se trata de un indicador de diplofona o
entre la energa inarmnica en el rango 1500-4500 bifonacin.
Hz y la energa armnica en el rango 70-4500 Hz. Grado de Subarmonicidad (DSH-Degree of
Es semejante a otros parmetros que relacionan la Subharmonics) /%/: Relacin entre los componen-
energas de ruido y armonicidad (HNR, SNR, etc.), tes subarmnicos y los componentes armnicos
de gran uso en el anlisis de la voz. de Fo.
ndice de Turbulencia de Voz (VTI-Voice Turbu- Parmetros de Aperiodicidad de la Voz:
lence Index): Cociente entre la energa inarmnica Nmero de segmentos sordos (NUV- Number
en el rango 2800-5800 Hz y la energa armnica of Unvoiced Segments): Nmero de segmentos sin
en el rango 70-4500 Hz. Este parmetro mide el naturaleza armnica detectados durante el anli-
nivel relativo de energa del ruido de alta frecuen- sis.
cia, en un intento de calcular de modo especfico Grado de sordera (DUV- Degree of Voiceless)
el ruido de turbulencia producido por la aspiracin /%/: Porcentaje de las reas no armnicas en la
o breathiness de la voz. Por otra parte, es un pa- muestra de voz.
rmetro nuevo que no cuenta con datos normati- Parmetros de Interrupcin de la Voz:
vos en la literatura cientfica. Nmero de interrupciones de la voz (NVB -
ndice de Fonacin Blanda (SPI-Soft Phonation Number of Voice Breaks): Nmero de veces en
Index): Cociente entre la energa armnica en el que Fo resulta interrumpida en la muestra de voz
rango 70-1600 Hz y la energa armnica en el ran- analizada.
go 1600-4500 Hz. En realidad no se trata de un Grado de interrupcin de la voz (DVB - Dergree
parmetro de ruido, pero el MDVP lo agrupa con of Voice Breaks) /%/: Porcentaje de la longitud de
los anteriores por la semejanza de su frmula de las reas que representan interrupciones de voz
clculo. Bastante sensible a la estructura formnti- respecto a la longitud total de la muestra analizada.
ca de la vocal empleada, es un indicador de fona-
cin "blanda" en la que predominan los componen- NOTA 1
tes armnicos de baja frecuencia. Tambin es un El porcentaje de fumadores de la muestra no
ndice de reciente aparicin, por lo que apenas se aparta sensiblemente de la prevalencia de la
cuenta con datos normativos. poblacin espaola, pues si, segn el Informe so-

Acta Otorrinolaringol Esp 2002; 53: 256-268 267


sumario

J. GONZLEZ ET AL. FIABILIDAD DE LOS PARMETROS DE LA VOZ

bre la Salud de los Espaoles: 1998 del Ministerio poblacin general, los datos de ese mismo ao
de Sanidad y Consumo, la prevalencia del hbito para el grupo de edad 16-24 aos son el 39,7% y
tabquico en 1997 se situaba en el 35,7% de la para 25-44 aos, 52,3%.

REFERENCIAS
1.- Baken R, Orlikoff, R. Clinical Reliability of the Multi-Dimensional cues in the vocal signal. J Speech 21.- Yanahigara, N. Significance of
measurement of speech and voi- Voice Program for the analysis of Hear Res 1994; 37: 738-45. harmonic changes and noise com-
ce. Second Edition. San Diego, voice samples of subjects with dy- ponents in hoarseness. J Speech
15.- Preciado JA, Garca R, Infante
CA: Singular Publishing Group, sarthria. Am J Speech-Lang Pathol Hear Res 1967; 10: 531-41.
JC. Anlisis multidimensional de la
2000. 1999; 8: 129-36.
funcin vocal. Estudio de casos y 22.- Yumoto E, Gould W, Baer Th.
2.- Fernndez R, Damborenea D, 8.- Kay Elemetrics Corp. Multi-Di- controles. Acta Otorrinolaring Esp Harmonic to noise ratio as an index
Rueda P, Garca E, Leache J, Cam- mensional Voice Program. MDVP 1998; 49(6): 467-74. of the degree of hoarseness. J
pos MA, Llorente E, Naya MJ. An- Model 4305B. New Jersey 1993. Acoust Soc Am 1982; 71: 1554-60.
16.- Preciado JA, Fernndez S. El
lisis acstico de la voz normal en 9.- Deliyiski D. Acoustic model and anlisis digital de la seal acstica 23.- Nieto A, Cobeta I, Gamboa FJ,
adultos no fumadores. Acta Otorri- evaluation of pathological voice pro- en el diagnstico de la patologa vo- Vegas A. La relacin armnico/ruido
nolaringol Esp 1999; 50(2): 134-41. duction. Kay Elemetrics, 1993. cal. Sensibilidad y especificidad de y el anlisis espectrogrfico en la pa-
3.- Read Ch, Buder E, Kent R. Spe- 10.- Kay Elemetrics Corp. Compute- las medidas del shimmer y del jitter. tologa de abuso vocal. Acta Otorri-
ech Analysis Systems: An evalua- rized Speech Laboratory. CSL Mo- Acta Otorrinolaringol Esp 1998; nolaringol Esp 1996; 47(5): 370-76.
tion. J Speech Hear Res 1992; 35: del 4300-B. New Jersey 1994. 49(6): 475-81.
314-32. 24.- Omori K, Kojima H, Kakani R,
11.- Hollien H, Michel J, Doherty E. 17.- Dwire A, McCauley R. Repea-
Slavit DH, Blaugrun SM. Acoustic
4.- Parsa V, Jamieson D. A compa- A method for analyzing vocal jitter ted measures of vocal fundamental
characteristics of rough voice: Sub-
rison of high precision Fo extraction in sustained phonation. J Phonetics frequency perturbations obtained
harmonics. J Voice 1997; 11: 40-47.
algorithms for sustained vowels. J 1973; 1: 85-91. using de Visi-Pitch. J Voice 1995; 9:
Speech Hear Res 1999; 42: 112-26. 156-62. 25.- Nez F, Surez C, Muoz C,
12.- Orlikoff R. Heartbeat-related
5.- Buder E. Acoustic analisys of 18.- Takahashi H, Koike Y. Some per- Baragao L, lvarez MJ, Martnez
fundamental frequency and amplitu-
voice quality: A tabulation of algo- ceptual dimensions and acoustical A. Estudio espectro-grfico de la
de variations in healthy young and
rithms 1902-1990. En R Kent y M correlates of pathologic voices. Acta disfona: subarmnicos. Acta Otorri-
elderly male voices. J Voice 1990;
Ball. Voice Quality Measuremets. Otolaryngol Suppl 1975; 338: 1-24. nolaringol Esp 2000; 51(1): 52-56.
4: 322-28.
San Diego: Singular Publishing 26.- Koike Y, Takahashi H, Calcate-
13.- Damborenea J, Fernndez R, 19.- Horii Y. Fundamental frequency
Group, 2000. ra, T. Acoustic measures for detec-
Llorente E, Naya MJ, Marn C, Rue- perturbation observed in sustained
6.- Corina J, Hilgers F, Verdonck I, da P, Ortiz A. Efecto del consumo phonation. J Speech Hear Res ting laryngeal pathology. Acta Oto-
Koopmans F. Acoustical analysis de tabaco en el anlisis acstico de 1979; 22: 5-19. laryngol 1977; 84: 105-17.
and perceptual evaluation of trache- la voz. Acta Otorrinolaringol Esp
20.- Orlikoff R, Kahane J. Influence 27.- Iwata S, von Lenden H. Pitch
oesophageal prosthetic voice. J Voi- 1999; 50(6): 448-52.
of mean sound pressure level on jit- perturbations in normal and patholo-
ce 1998; 12: 239-48.
14.- Walton J, Orlikoff R. Speaker ter and shimmer measures. J Voice gical voices. Folia Phoniatr 1970;
7.- Kent R, Vorperian H, Duffy J. race identification from acoustic 1991; 5: 113-19. 22: 117-28.

268 Acta Otorrinolaringol Esp 2002; 53: 256-268

También podría gustarte