Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Basso Percepción Auditiva 2006 OCR
Basso Percepción Auditiva 2006 OCR
Percepción auditiva
Rect or
Dan iel G o rnez
(t)
Vicerrector
Un íversídad
Nac ion a l
Jorge Flores • ele Qu ilmes
. Editor ial
Colección Música y Ciencia
D irigida po r OscarPablo Di Liscia
Indice
Basso, G ustavo
Percepc ión auditiva - la ed. - Berna l : Universidad Nacional
de Quilrnes, 2006.
288 p. : il. ; 15x21.5 cm
(Música y cienc ia dirigida por Pablo Di Liscia) Presen tació n, por Oscar Pablo Di Liscia 15
El arte sonoro, las modalid ades y géneros de co municación que invol ucran so-
nido , las técn icas y tec no logías de proceso de son ido y mús ica y la in vest iga-
c ión sobre per cepci ón aud itiva, se viene n desarrolla ndo de ma nera
interde pend iente y signi ficat iva desde el siglo pasado. Cada un a de las áreas
men cionadas ha impre gn ado de dud as y ce rtezas a las ot ras, a l participar de un
formida ble proceso interactivo que continúa acele rándose en la ac tu alidad.
Este libro presenta una exploración de los avances en el campo de la per-
cepción aud itiva. Su título tien e e! grado de det erminación y de generalidad que
requier en tanto e! dinamismo com o la varied ad de! campo de estud io invol ucra-
do. Por otra parte, no puede negarse que su autor ha sido fiel a su triple condi-
ción de músico, cien tífico y docente, al generar un texto que expone de manera
muy did áctica y eficaz los resultados más sign ificat ivos de la investigación en su
área, en una constante realimentación con la reflexión sobre e! arte sonoro.
Una de las cuest iones medul ares de la in vest igación ac tua l en esta área es
la det erminación del ámbito (físico-fisiológico) en el q ue se llevan a cabo los
procesos de decodificación de la se ñal acúst ica. En otras palabr as: ¿es el fabu-
'1
1, loso diseñ o de nue stro o ído in terno y exte rno , o son los proc esos neur ales de
alto nivel los responsabl es de que percib am os det erminados eventos so noros
de determ inada man era ? ¿Y si son ambos, có mo se repart e la tarea y cómo se
explica y modeliza su funci onami ento ?Así es que, por ejemplo, algunos auto -
res (v éase Bregman, 1994) hacen referencia a proce sos neurofisiológicos de
1" "alto ni vel" o de "bajo niv el" co mo responsable s de determinadas tareas de de-
cod ificac ión y otros (M alham , 2000), co incidenrernenre, den ominan "combi-
unci ón o ído-cerebro " al sistema auditivo en gene ral. Y por cita r un solo
ejemp lo de este trabajo, Basso escribe en el capítu lo V I: "[,.. ]la constancia del
I imhrc só lo puede ser ex plicada en func ión de complicados procesos en las
l'l:lpaS superiores del tratami ento neural" .
Los avances en esta dirección han sido tensados por la necesidad de invo-
11I<T:lr dentro del estud io de la psicoac ústic a a secuenc ias sonoras co mplejas,
15
que van más allá de los eventos individuales. Se involucran así, procesos de
eve ntos sonoros de muy variada naturaleza y complejidad, como la percepción Prólogo
de secuencias de habla (capítulo IX) , evaluació n de recint os y localización de
fuentes sono ras en movimiento (capítulo v ), segregación y fusión de estratos
sonoros simultá neos y sucesivos (capítulo VlII ), o, finalmente, los estudios so-
bre el desplazamiento entre el tiemp o físico y el fenoménico (capítulo IV).
Una de las dificultades que hubo de enfrentar el auto r de este libro es la
secuenc iaci6 n de los co ntenidos, dada su interdependencia. Es así que, por
ejemplo, en el capítulo referid o a la "sono ridad" (capítulo 11) se pregunta: "Pe-
ro, ¿es legítimo con siderar a la sonoridad com o un rasgo autó no mo, que se
puede est udiar de manera independ iente, separada del resto de las caracterís-
tic as que definen un' son ido real ?" Este libro fue con cebido inicia l ~en te como una publ icación int erna para un
y qué decir del capítulo dedicado al "t imbre" (cap ítulo VI), una de las no- semina rio de posgrado que se dictó en el año 2000 en la Universidad N acion al
cion es más interdependientes y cambiantes en toda la histori a del sonido y la de Quilmes, Ese origen exp lica, en parte, el conte n ido y la secuenc ia de los ca-
música. En su tratamiento, el auto r pone en evidenc ia, además, el rol de los pítul os. Su objetivo prin cipal es el de expone r los elementos, principios y pro-
aportes de las técnicas y tecn ologías de son ido propias de la electroacústic a: cesos que intervienen en la percepción del son ido. Nu estra int enci ón no es
"Los modelos de aná lisis por síntesis h an demostrado ser eficaces para gene rar presentar los temas como si formasen part e de un conjunto de conoc imientos
conocimiento científico y técn ico, reducir la cantidad de inform ación necesa- definitivos, sino integrar las dificult ades propias de una disciplina en la que los
ria para exp resar una seña l ac ústica , producir var iantes y modificacion es nun - mismos dat os experimentales llevan much as veces a la creación de modelos ex-
ca experimentadas y controlar la prosodi a musical en tiemp o real. [...] Una plicativos totalmente diferentes.
descripci ón detallad a de las técnicas empleadas contendría la historia de la Quizá la confusión más habitual en cualqui er texto sobre ac úst ica tien e
electroacústica dur ante los últimos 60 años ." origen en la ambigüedad de la definición de son ido . Según el autor o e l text o
Por todo lo antedicho , este libro const ituye un trabajo valioso para explo- que trate mos, el t érmino sonido se puede referir a un fenó meno físico -como
rar ante s que para simplemente "leer", para que el lector realice múltiples reco- una vibración o una onda en el espacio- o a un fenómen o psicológico. Aquí
rridos en los que puede y debe encontrar variados puntos de entrada-salida y de llamarem os son ido a la representación mental asoc iada a la percepción , y se-
relación, a despecho de la necesaria secuenc ia que impon e el texto escrito. ñal ac ústica al estí mulo físico que lo origina. La psicoacúst ica tradici on al es-
ludia dir ect amente la relación entre las seña les acúst icas de ent rada y los
sonidos, co loca ndo los procesos int ermedios en un a especie de caja negra cu-
O sear Pablo Di Liscia yo mecani smo no con sidera de su incumbencia. La fisiología de la percepción
y In neurobiología, por su part e, se interesan especialmente por los procesos de
I ransducció n que operan ent re la seña l ac úst ica y la representación ment al
asociada . En nuest ro caso predomina la prim era aproximación, pero no evita -
remos mencion ar los aspec tos fisiológicos inv olucrad os cuand o lo crea mos ne-
cesarlo. El prim er ca pítulo, por ejemplo, está dedicado por completo a la
fisiología de la audició n.
Este tex to está conceb ido com o parte de un programa complet o de ac ús-
I ica destinado a músicos e inv estigadores en tem as relacio nados co n el soni -
.111. A unque los aportes de la psicología y de las cien cias médicas result an
('s\'llciales, nuestra aproximació n al tema adopta decidid amente la perspecti-
va espec ífica de la cien cia ac ústica. Si bien se supone que el lec tor está fami-
16
17
liarizado con los conc epto s básicos de la ac úst ica general, en la bibli ografía al
fina l del libro se menciona n algunas referencias para quien necesite refrescar
alguno de e llos y en los apéndices se describen brevemente dos temas que no Capítulo 1
siempre aparece n en los tex tos de acúst ica habituales: e! teorema de Fou rier y Sistema auditi vo periférico y fisiología de la audición
e! principio de indetermi nación. Toda vez que fue posib le se emp learo n los
términ os téc n icos en español y en algunos casos las exp resiones se presentan
tambi én en e! idioma de orige n para faci lita r la consulta en la bibliografía es-
pecia lizada.
M i más sincero agradec imiento al profesor Pab lo Di Liscia -direct or de la
co lecc ión Música y C ienc ia- por e! apoyo que le brind ó al proyect o desde su
inicio, al profesor Juan Pamp in y al profesor Emanue! Bon nie r - responsab le de
la realización de los gráficos. Mi grat itud a los int egrantes de! equipo de inves-
El oído -{) sistema auditivo per iférico- com ienza en el pabellón auricular y lle-
tigación en ac ústica de la Facul tad de Bellas A rtes de la Universidad N acion al
ga hasta la cóclea. Su misión es co nvert ir las vibraciones mecánicas en impul-
de La Plat a. Y a los co legas y alumnos que, di rect a o ind irec ta mente, parti ci-
sos nerviosos para q ue sea n procesados en el ce rebro. Es muy pequ eñ o y
paro n en las cha rlas y en los inn umerables intercambios de corre o sobre per-
delicado y se halla prot egido en el int erior del hu eso temp oral. En la figura 1
cep ció n auditiva de los últimos años. Sin su estí mu lo este libro no hub iera sido se lo representa esq uemát icamente.
posible.
Cóclea
Ventana
redonda
Conducto auditivo
11 I1
Oido externo Oido medio Oido interno
1,'
Fi¡:ura 1. Siste ma aud itivo periférico
18
19,
dad de los eventos físicos y neurales invo lucrados en la percepci ón del son ido,
desde el siste ma audit ivo periféric o hasta la corteza cerebral.' Hélix ------~
En lo qu e sigue ana lizaremos ana tó mica y fisiológicamente cada una de Fosa del hélix - - - - / --/-- - - -
Antitrago - - - - - --''r-.>.,-J
El oído exte rno, junto a la ca beza y la parte superior del torso, form a part e del
Hendidura del trago ~_-f
siste ma receptor de vibrac iones q ue aco pla el t ímpano con el cam po ac ústico
Lóbulo - - -- - - - - - ' ' < --
externo. Adem ás de protegerlo ante posib les agresiones mecáni cas, filtra y
mod ifica las seña les que le llegan del exte rior y contribuye decisivamen te en
la tarea de localización espac ial de las fuentes ac ústicas.
Una descripción ana tó mica del oído exte rno , de ade ntro hacia afuera, in-
cluye e l can al auditivo exte rno, la co ncha y el pabell ón auricular. El canal au-
ditivo exte rno es un a estructu ra tubular irregular de aprox imada mente 26 mm
de largo por 7 mm de anc ho y un vo lume n de 1 cm', con un eje ce n tral sin uo-
so, que conecta el pabellón co n el tímpano. Su pared está co nfor mada por una
porció n cartilaginosa (móvi l) y una ósea. La parte carti laginosa, continuació n
de la est ruc tura del pabellón auricular, es de mayor lon gitud q ue la ósea y es-
tá cubie rta por piel co n fol ículos pilosos, glándulas ce ruminosas y sebáceas . En
cambi o, la piel qu e recubre la región ósea del ca na l auditivo externo , en la
parte más profund a adhe rida al tím pan o, es muy delgada.
La parte externa del canal audit ivo exte rno se ensa nc ha notablemente
formando una cav idad en forma de taza llamada conc ha, con un vo lumen in- Figura Z. Vista lateral y corte esquem ático superior del o ído exrem o
terno de aproxi mada mente 4 cm", En la figura 2 se pueden aprecia r una vista
lateral y un corte del oído exte rno.
El pabellón auricular (la o reja ) es un a estruc tu ra cartilaginosa que actúa 20
íD
como un filtro dir eccion al de las seña les que llegan del exte rior. Es muy dife- ~ 15
o
rente al de otros mamí feros, por ejemplo el de los felin os, q ue poseen pabello- e
ro
a.
nes cónicos q ue puede n enfoca r hacia un punto del espacio de man era
ª
10
independ iente por medio de músculos de contro l específicos . Qj
e
Los efectos del pabe llón auricular (6 cm), de la cabeza (22 cm ent re oí- Ql 5
.'!l
dos) y de los hombros (15 cm de anc ho ) se vuelven significat ivos cuand o las '"
Ql
:J
a. O
lon gitud es de onda son co mparables con la dim ensión de las estruct uras. El sis-
o::'"
Ql
I La parte de la ac ústica que estudia la fisiología de la audición se de nomi na {¡sioacústica. Figura 3. Función de transferencia del o ído'exrem o ame un esrímulo difuso de ruido blanco
20 21
tro espectral que prod uce e! oído externo. La tran sferencia máxima, a una fre- te en calibrar los aur iculares en su posición de uso en un oído rea l. Primero se
cuenc ia de aprox imadamente 2.800 H z, se debe a la reson an cia del cana l au- mide, con un micrófon o muy pequeño colocado den tro de l canal audi t ivo, la
ditivo externo. presión sonora pro vocada por una fuen te acústica de espectro plano alejada de
La comp leja forma de la curva se debe a la co ncurrenc ia de los fenóme- la cabeza de! oyente (ca mpo libre ). La señal en e! micrófon o correspo nde
nos de reflex ión, difracc ión y reson an cia en difere ntes part es de l oído exte r- exac tamente a la fu nción de transferencia -o HRTF- de ese oído exte rno en par-
no . Como curiosidad, en la figura 4 se reproduce e! expe rimento de Goode, en t icu lar. é La curva de tran sferen cia obtenida se repro duce en e! oído ecua lizan -
e! que se compara la tra nsferencia de un oído norm al con un modelo en e! que do la salida del auricular en posición de uso. De este modo se puede lograr la
e! tímpano queda a ras de una esfera, como ocurre en e! caso de algunos sau- misma respuesta espectral que en e! campo libre para cada pareja auricu lar-oí-
rios (Goode, R. L. et al., 1994) : es eviden te la comp leja acción espectral de! do . Como el proced imiento es complicado, se ofrecen cientos de curvas HRTF
oído ex te rno sobre las seña les q ue le llegan de! exte rior. En e! ca pítulo sobre -que se pueden obtener, por ejem plo, en internet- que cada usuar io escoge de
percepción aud itiva de! espac io nos det endremos a estudiar con detalle este acue rdo a su tipo logía particular.
efecto y sus consec uenc ias. U na de las características más notables de la audición a través de auric u-
lares es la excelente respuesta en bajas frecuencias, imposible de conseguir con
Audición con auriculares los mismos auriculares ubicados en e! campo libre, lejos de la cabeza de! oyen-
te. Este efecto se exp lica por la diferencia en e! acop le ac ústico entre ambas
C uando los estímulos _se presentan a través de auric ulares las característ icas situac iones . Con la fuente en e l campo libre actúa e! filtro de! oído externo en
de! cam po libre son reem plazadas por la in teracción entre e! auricular y e! oí- toda su capacidad: la ene rgía de baja frecuencia llega ate nuada al tímpano
do externo de l oyen te. Esta in teracción incluye efec tos propios de la mecá ni- pues difract a alrededor de la cabeza. Cuando se co loca un auric ular se c ierra la
ca de ondas que son muy d ifíciles de contro lar, especia lmente a altas comun icació n con e! cam po libre y se crea un a cav idad esta nca comp uesta po r
frecue ncias . U n méto do que permite acop lar con precisión el sistema cons is- e! volumen in terno de! auricular más e! volu men interno de! oído externo. En
la figura 5 se puede ver este caso.
El vo lumen es ahora co nstante y posee ún icamente dos superficies mó -
.... viles, e! altavoz de! auric ular y e! tímpano . Cualquier desp lazam iento net o
.... Limite teóri co
.... +10
10
"".... )..' /4rc de l altavoz se va a tra nsmit ir íntegramente a l tí mpano amp lificado por la re-
....
....
E O ldo com pleto
.... ....
~ ....
oUJ .... .... O
.2 .... E
i5 u
o
a. UJ
E -10 Q)
ro 0,1 Qj
u .o
c: -13
Q)
Tlmpano con esfera Q) Area del Area del
c: o ....-t-* limpan o
·0
.~
oUJ 0,01 -20
altavoz
-----....
.o
«
Volumen consta nte
0,001 -30
0,2 0 ,5 2 5 10 20
Frecuencia (kHz ) Figura 5. Acople ent re un aur icular y el oído externo
Figura 4. Compa rac ión entre las func iones de tra nsferenc ia de un oído comp leto y de un
tímpa no adosado a una esfera 1 Heaarelated tmnsfer functions ( HRTF). Este tema será estud iado en detalle en el capítulo VII.
22 23
5,1
lación entre sus áreas, 4:1 a favor del a lta voz en un caso promedio. Dicha / 1,2
tran smisión es ind ependiente de la frecu encia , pue s act úa como un a prensa / 2,8
// //1 1"1'1í'i~~ 4,4
neum át ica y exp lica la no table efic ienci a en bajas frecu encias del siste ma .
5,9
Lamentablemente, e l dispositiv o de aj uste esta nco que permite tan buen
7 ,5
rendimiento en graves es un o de los factores qu e con vierte a los aur icul ares 5,1
" 8 ,2
en ca usa pot en cial de h ipoacusia po r ruido, sobre to do si se los usa incorrec -
rarnente.!
El oído med io permite aco plar las seña les acústicas entre el cana l aud itivo y el
oído interno. Ocupa un a ca vidad en el hue so temporal den om inada caja tim- Martillo Yunque
pánica y está con stitu ido por el tímpan o, la cade na de hu esecillos -rnart illo,
yunque y estribo- con sus ligamentos y músculos de control, la trompa de Eus-
taq uio y las ventanas oval y redonda, que lo comunican con el oído in te rno ."
Su princi pal función es la de permi tir q ue las vib raciones acús ticas lleguen a
la cóclea con suficiente ene rgía. S i las seña les llegasen dir ectamente al oído
interno a través de la ventana ova l, casi tod a la ene rgía se reflejaría a ca usa de
la diferen cia ent re las propiedades mecáni cas del medio aé reo exterior y del
med io líquid o de la cóclea. En los verte brados terrestres el oído medi o actúa
como un siste ma de acople que adapta ambos medios, permitiendo un a efec- Tlmpano Estribo
tiva transferenc ia de energ ía. T écnicamente, es un ada ptador de impedancias
y como tal lo ana lizaremos más adela nte. Figura 7. Ca dena de huesecillos del oído medio
Tímpano
J A lgunos de los facto res que aumenta n el riesgo de hlpoacusia son el uso de auriculares en
amb iente s con gran nivel de ruido de fondo, por ejemplo la vía pública, y el empleo de am-
plificadores de aud io de baja calidad, con deriva estática y alto porcentaje de "rurnble" (rui-
do de muy baja frecuenc ia).
4 Esta estr uctura es similar a la de casi todos los verte brados terrestres. Las especies que no
poseen membrana timpáni ca, co mo las salamandras y las serpientes, son la excepción. Figura 8 . Forografía del estr ibo
25
24
Cadena de huesecill os La impedancia es un a magn itud que permite evaluar la resistencia al movi-
miento de un siste ma . En nue stro caso se verifica que la impedan cia acúst ica
Las vibrac iones del tímpano se transmiten hacia el oído in terno a través de en el tím pan o es mucho menor que en el oído interno.
tres pequeños hu esecillos: el martillo, el yunque y el estribo. El mart illo posee Veamos el proceso en det alle. Con la exc epción de las frecuencias más al-
una parte promi nente, "el man ubr io, que se inserta entre las lám inas de la tas, por enci ma de 5 kH z, la dim ensión tran sversal del cana l audit ivo ex te rno
mem brana timpán ica. A su vez, el martill o y el yunque están cone ctados en- es pequeñ a frente a las longitudes de onda y, por lo tan to , la presión sono ra re-
tre sí y a la pared ósea por medio de ligamentos. El yunq ue se vinc ula con el sulta aproximadamen te constante sobre el área del tí mpan o. En este caso la
estribo a través de otro ligamento, y el pie del estri bo se conecta por medio de interacción acúst ica puede describirse en tér minos de dos var iables: la presión
un ligamento an ular a la venta na oval. sonora en el tímp an o PT y su velocidad de volumen UT . El movimiento del
Dos músculos contribuye-n a sostener los h ueseci llos y permiten controlar tímpan o se transmite a través de la cadena de huesecillos a la ventan a ova l.
la rigidez de la caden a osic ular. El tensor del tím pan o está ligado al mart illo y Aquí tam bién la int eracción acústica puede describ irse a partir de la presión
el estapedial al est ribo. Tal como veremos, estos múscu los funci ona n como un sonora en la ventana oval Pva y su veloc idad de volumen Uva. En la figura 9
control de ganancia varia ble del oído medio. se ve un esque ma muy simplificado del sistema de tran smisión .
En una primera aprox imación, la cadena de huesecillos act úa como un sis-
C avidad timp án ica y t rompa de Eustaquio tema de palancas. Para vibrac iones de amplitud moderada, el estribo ejerce una
fuerza 1,3 veces mayor sobre la ventana ova l que la que ejerce el tímp ano sobre
La tromp a de Eustaqu io, que cone cta el oído medio con la cav idad nasofarín- el martill o. Co mo el área de la ventana ova l - unos 4 mm 2- es mucho menor que
gea, es un conducto de paredes bland as que está cerrado la mayor part e del la del tímp an o -de alrededor de 60 rn rrr -- en ella puede aplicarse una presión
tiem po y que se abre al tragar, masticar o bostezar. Su función es la de permi- hasta treinta veces mayor que en el tímpano. Y como la int ensidad es función
tir la ecualización de la presión estática a ambos lados del tímp an o. G racias a del cuadrado de la presión , la diferen cia de int ensidad puede llegar a ser de mil
este mecani smo el aire en el interior ejer ce la misma presión que la atmósfera
desde el exterior. Se resuelv e así la parado ja que inqui ere por qué la presión Músculo
del estribo
atmosférica, de un valor superior a los 100 kPa, no se oye mien tras que una se-
_.
(stapedius )
ñal acús tica de sólo 20 Pa nos result a de una intens idad intolerable. La res- Estribo
Ventana oval
puesta es senc illa: la presión at mosfér ica, práct icame nt e está t ica, no mueve al Pared del
tímpano pues se ejerce co n igual va lor en sus dos caras gracias a la acción de canal (óse~'
la tro mpa de Eustaqui o. La presión dinámica, que vibr a a frecu en cias superio - Membrana
res a 16 H z, se aplica con facilid ad sobre la ca ra externa del t ímpan o pero lle - basilar
,~
Función acústica del oído medio
La funci ón principal del oído medi o es transmi tir la mayor cantidad de ener-
gía desde el canal auditivo ext erno h asta la cóclea. Para lograr este fin la ca-
dena de huesecill os debe adaptar la impedancia del siste ma tímpano-aire con
la del sistema ventana oval-perilinfa. Como ya seña lamos, si las ondas acúst icas
.,.
Membrana
timpánica
pasasen del tímp an o a la ventan a ova l, casi tod a la ene rgía se reflejaría por la
gran diferen cia de impedanc ia existente entre los dos medi os de propagación. Figura 9. Esquema del sistema de transmisión del oído med io
26 27
10
veces, equiva lente a una ganan cia de unos 30 dB. En realidad, el movimi ent o es
más complicado que el de una simple rotación y el manubrio del mart illo no se iiJ
~
mueve como un cuerpo rígido a altas frecuencias. En la figura lO se puede apre- o O
i5
ciar la curva real de tran sferen cia de presión entre el tímpano y la ventan a ova l. Ql
E
En la funci ón de transferencia se ve que se obt iene una gana ncia de o
"O
20-3 0 dB en el ran go medio. La variación espec tral de la curva demu estra qu e 'O - 10
ro
"O
la caden a de hu esecillos no actúa como una palan ca lineal.
.~
En cuanto a la tran sferencia net a de pot en cia, se co nsidera que en el oí- ro -6- 500 Hz
~ -20
do medio se pierde alrededor del 50% de la energía: al menos la mitad de la ro • 1000Hz
:2 .... 2000 Hz
pot enci a recibida por el tímpan o' no llega al oído interno. ro
en -O- 3000 Hz
-30
Alteraciones en el sistema de transmisión del oído medio
-20 -10 O 10 20
Una alte ración frec uente en la gana ncia del sistema de tran smisión se da cuan- Presión en el oído medío (cm H,O)
do la trompa de Eustaquio perm an ece ce rrada y la presión atmosférica varía Figura 11. Variación de la transferencia de energfa del oído medio en función de la presión
rápid amente, por ejemp lo en el interior de un avión mientras se presuriza la está tica
cabina, o al sume rgirse a varios metros de profun didad en el agua. La diferen-
cia net a de presión está t ica curva al tí mpano, aumenta la tensión mecán ica de
pende de la frecuencia y gene ra la sensac ión de sordina que expe rimentamos
la mem bran a y mod ifica la capacid ad de transferencia de energía del oído me-
al ten er los oídos "tapados".
dio. Por ejemplo, una diferenci a de 1 kPa -que equi vale a una co lumna de 10
O tra fuente de variación en la gana nc ia del sistema la apo rta la acció n de
cm de agua o a 0,0 1 atm- produc e ca mbios detect ables en la sens ibilidad au -
los músculos de oído med io. Estos músculos se cont raen, en una acción den o-
ditiva. Como se puede aprecia r en la figura 11, la profundi dad del efecto de-
minada reflejo acúst ico, ante estí mulos acústicos de gran intensidad, antes y
dur ant e la fonaci ón y, en gene ral, du rant e los movimientos cor porales de me-
40
diana y gran amplitud. El esta ped ial es de acción rápid a -el reflejo acúst ico
aparece ent re 10 y 20 ms después del est ímulo- mientras que el te nsor del tím-
pan o respond e más len tamente - tarda un os 100 ms en ac tivarse. El ret ardo del
30 sistema de pro tecc ión lo vuelve ineficaz cuand o el est ímulo es de tipo impul-
sivo, po r eje mplo el esta llido de un petardo. Los dos músculos co mbinados lo-
iiJ
~ gran ate n uar la seña l alrededor de 20 dB. Como se puede ver en la figura 12,
20
¡{"
el reflejo acúst ico no posee respuesta plana y su efecto es mayor a bajas fre-
cuencias .
¿ 10 La supresión patológica del reflejo acúst ico t ien e, ent re o tras, las siguien -
les consecuenc ias: 1) disminuye la discriminación del habla a altas int ensida-
des, 2) inc rement a la pérdid a de audición ant e estímulos prolon gados de alta
O
int en sidad y 3) aument a el en mascara mient o simultá neo. El dañ o audiol ógi-
l'o provocado por el uso inadecuado 'de auriculares es similar a l inducido por
0,1 0.5 5 10
la supresión patológica del reflejo acústico.
Frecuencia (kHz) Es int eresante marcar que la func ión de transferenci a desde el pabe llón
auricular hasta la ventana oval define casi completa mente la in versa de la cur-
Figura 10. Func ión de tra nsferenc ia de presión ent re la venta na ova l y el tímpano
28 29
i: 85 Superior
O Canales ,
semicircula res Posterior
al [
~ -2
e Lateral
-o
'00
'E -4
(/)
e
~ -6
~
e
Q)
-8 Nivel del estimulo Ventana oval
o
:o en dB Vesli bulo
E
ro -10 Ventana redonda
Ü
-12
400 500 800 1000 2000 Figu ra 13 . Esquema del laberin to óseo
Frecuencia (Hz)
Figura 12 . Reflejo acúst ico en fun ción de la inten sidad del estím ulo bién conocido como ca raco l memb ran oso, forma una espiral de dos vueltas y
media de tej ido conect ivo que sigue el desarroll o de la espiral ósea del caraco l.
El laberin to está inervado por el nerv io auditivo -octavo par crane al- que
va de sensibilidad auditiva en el ser h umano (en la figura 30 de este capítulo en su interior se divide en dos ramas: el nerv io coclea r, que es el nervi o vincu-
se puede ver la curva de transferencia completa ). A partir de este punto el pro- lado a la audición , y el nervio vestibular, que perten ece al sent ido del equilibrio.
ceso comp leto parece comportarse de manera lin eal. Los estím ulos que llegan En la porción central del laberinto está n los ca na les semicirculares, q ue
por la ventana oval producen los mismos pat ron es cocleares que los que lle- poseen células receptoras y cr istales de ca lcio que respond en a la gravedad y a
gan por vía ósea, aunque am bas funciones de tran sferencia difieran notable- la acelerac ión , inform and o al cerebro sobre la posición y el movimiento de la
men te en tre sí. ca beza. So n tres co nd uctos semicirculares orientados en cuadratura según las
1res dimens ione s espac iales. A l mover la ca beza se produ cen movimientos re-
lativos entre el líquido y los crista les de calcio en suspens ión que est imulan a
3. OíDO INTERNO las células sensibles que tap izan el tejido int erior de los canal es. Así , además
de las estructuras prop ias del sentido de la audición, el laberinto óseo contie-
El oíd o interno es parte de una cav idad irregular del hueso temporal que reci- ne también los órgano s del sen tido del equ ilibri o.
be el nombre de laberinto óseo y comprende el vestíb ulo, el caracol y los ca- El tamaño de los elementos del oído int erno es extra ordinariamente peque-
nales semicirc ular es. Sus paredes está n formad as por h ueso recubierto de Ii(l . La base del caraco l mide menos de 9 mm y el diámetro del conducto que for-
epitel io y contiene un líquido acuo so parecid o al líquido amn iótico. Gr an par- lila la cóclea es de alrededor de 1 mm en su parte media, estrechándose a med ida
te del espacio in terior está ocupad o por un sistema de finos cond uctos y sacos que se acerca al vértic e. En su int erior, el conducto cocle ar -o scola rnedia- es
que constituyen una segunda capa, de paredes tapizadas por tejido conectivo aún más pequeño, ya que la cóclea está dividida en tres partes o scolos como se
blando, llamado laberinto membrano so. La porc ión del laberin to óseo que si- puede ver en la figura 14. La membrana basilar (MB) sigue la forma en espiral de
gue a la ventana ova l se denom ina vestíbu lo, que a su vez está dividido en dos la c óc lea y forma el piso del conducto coclear. En su desarro llo describe dos vuel-
partes, el ut rículo y el sáculo. Mientras la base del estribo cubre casi co mple- 1; IS y media y, totalmente extendida, mide alreded or de 35 mm de largo.
ta mente la ventana ova l, la ventan a redonda se halla recubierta por una del - En la membran a basilar se en cuentra el órgano de C ort i, q ue con t iene las
gada membrana de tejido conect ivo. U n estrecho ca na l conduce del sácu lo al ,'( llIlas ciliadas respons ab les de con vertir las vibraciones mecánicas en impu l-
conducto coclear, situado en el interior del carac ol. El cond ucto coclear, tarn- l.' IS nervio sos. Durante mucho tiemp o se creyó que la cócle a era ún icamente
30 31
Scala Ve stibuli
(per ilinfa )
Hueso
Ganglio
espiralado :
Cápsu la de una
cél ula ganglionar
un órgano recep tor que procesaba las seña les ac ústicas para tran sform arlas en
pote nciales eléc tricos e impulsos nerviosos. Hoy sabe mos, gracias a num erosos Scala Tympan i
estudios, como los de Kem p y Zwicker, que también posee propiedades moto- (per ilinfa )
ras que le oto rgan la ca pac idad de ac tuar sobre las seña les que llegan desde el
Figu ra 15 . Det alle del conducto coclear
exte rior.
Fisiología de la cóclea vian a y delgada no actúa mecán icamen te sob re el mov im iento de los fluidos
cocle ares. Su función principal es la de separar la endolinfa de la perilinfa
El movimi ento de la cade na de huesecill os del oído med io se aplica a tr avés para mantene r una dife rencia de potencial eléct rico de un os SO mV entre
del estribo a la ventan a ova l. Co mo el laberinto está lleno de líquid o y sus ambos medios.
parede s son óseas, el conjunto result a prácti cam ente incom presible. El mo- La membrana basilar es una membran a elástica en la q ue se ubica el ór-
vimiento del estri bo sería poco menos q ue nul o de no ex isti r la ventana re- gano de Cort i. Posee alrede dor de 3.500 células ciliadas internas dispuestas en
donda, que perm ite q ue el volumen de líquid o en la cóclea se mantenga una fila y de tres a cinco filas con aprox imadamente 25.000 células ciliadas ex-
co nsta nte y -que, por o tanto, se comp en sen exacta men te los movimientos te rnas en cada oído. Tal co mo veremos, las células int ern as son aferen tes - en-
netos de la ventan a ova l y de la ventan a redonda. La ene rgía acústica llega vían información al cerebro a tra vés del nervi o auditivo- y las células externas
en to nc es a la cócl ea qu e, como se puede ver en el corte de la figura 15, est á son eferent es - reciben impul sos ner viosos desde el cerebro. La membrana tcc-
d ividida en tres com par timi entos. La scola tympani co mienza en la venta na r órea cubre las este reoci lias de las células ciliadas ayuda ndo a su excitación
ova l y está llen a de perilinfa, un líquido rico en sodio. La scala vestibula na- mecá nic a. En la figura 16 se puede ver una imagen del órgano de C ort i toma-
ce en la ventana redonda y se comun ica co n scola tympani a tr avé s de un a da con un micro scop io electrónico de barrido.
abert ura, el heli cotrerna, que permite el paso del líquid o perilinfáti co en el
extre mo superior o apex del caracol. Entre ambos co nductos se encuentra la l )rgano de Corrí
scola media o co nd ucto coclear, q ue está a islado de los anteriores por la mem -
brana bas ilar y por la membran a de Re issner y que co ntiene en do linfa -un I ~I ógano de C orti es una compleja estruc tura-compuesta, ent re otros elernen -
líquido viscoso rico en potasio. Como la mem brana de Re issner es muy li- l OS, por células nerviosas transducroras, cé lulas de soporte y fibras n erviosas.
32 33
Zona Iimbica Zona media Zona marginal
Figura 16 . Imagen del órgano de Corti to mada con un microscopi o electr ón ico de barrido .
J, 2 Y3: células c iliadas externas; CC!: cé lulas ciliadas internas; Te: túnel de Corti ; Figu ra 17. Cé lulas sensor iales y de sopor te en e l órgano de Co rti. A : pilares in tern os;
MI3: mem brana basilar E: pilares externos
Las cé lu las ciliadas son neuronas alta mente especializadas y se dispo ne n con las células cil iadas externa s. C ada cé lula interna se comunica co n alrede-
en dos arcos sepa rados por el túnel de Corti, En el arco exterio r se agrupan dor de 20 neu ron as afe rentes de t ipo 1 y cada ne uro na aferente de t ipo II se re-
un as 25.000 cél ulas ciliada s externas, cada un a co n cerca de 140 este reoc ilias parte en tre varias cé lulas cili adas ex te rnas . En ca mbio, las fibras efe rent es que
interc onectadas En el otro arco h ay ce rca de 3.500 cé lulas c iliadas in te rnas, parten de l ce rebro se co n ectan sólo co n las célu las ci liadas externas, aunq ue
cada un a co n alr ede dor de 40 estereocilias interconec tadas. La mem bran a tec - algunos invest igado res suponen qu e puede n ta mb ién ac tuar, au nq ue indirec-
tórea cubre las célu las de Cort i y se sabe que entra en contacto co n las este - lam ente, sobre las cé lulas internas.
reoci lias de las cé lulas extern as, pero ac tualme nte se d iscute si también lo El punto de contacto a través del cual la infor maci ón pasa de un a neuro-
ha ce co n las de las cé lulas internas . na a otra se denomina sin apsis. La sinapsis entre una cé lula ci liada y un a fibra
Las cél ulas de sopo rte proveen apoyo estructu ral y metabólico a las cé lu- afe ren te se caracteriza por un ade lgazamie nto de la mem bran a cel ular y la pre-
las cil iada s. Se pueden d ivid ir en dos grupos: el de las célu las con filamentos scucia de peq ueñas vesíc ulas en la célula ci liada que co nt iene n las sustan cias
y microtúb ulos que co ntro lan la rigidez de la mem bran a basilar y que son en qu ímicas necesarias para transmi tir la señal. Por el co nt rario, en la sinapsis en-
parte responsables de la distr ibuc ión espacial de la frec ue nc ia de resonan ci a a 1re un a fibra efere nte y una cé lula c iliada las ves ículas se enc uentran en la fi-
lo largo de la membrana ; y el de las cé lulas que poseen orgá nu los capaces de hra tran smiso ra.
sin tetiza r las proteínas y de tr ansportar los iones necesarios para el meta boli s-
mo del órgano de Cort i. ( :élulas ciliadas
El ó rgano de C ort i se vincula co n el siste ma nerv ioso ce n t ral por medi o
de dos t ipos de fibras nerviosas: las aferen tes llevan inform ac ión desde el oíd o b isten dos clases princ ipa les de cé lulas ciliadas, las internas y las exte rn as,
intern o h aci a el cerebro y las efe rentes lo h acen en el senti do co n trario, 'l ile difie ren nota blem ente entre sí. Las cé lulas ciliadas internas t ienen forma
desde e l cere bro ha cia el o ído in terno . Existen dos t ipos de fibras aferentes. 1:1.ibular con el núcleo ubicado en el centro y est án sop ortadas lat e ralmente
Las del tipo 1 constituyen el 95 % de l total y contactan únicamente a las cé lu- por células de sostén. La part e infe rior de cada célula interna está en co ntac-
las cili ad as internas, mientras que las del tip o II -el 5% restante- se conectan to directo con las fibras nerviosas q ue se proyectan h ac ia el sistema n ervioso
34 35
Endolinfa cen tral. C omo las fibras aferentes que parten de las células internas forman el
95% de las fibras afere n tes de l nerv io aud it ivo , se supo ne que éstas actúan co-
mo los receptores primarios de la cócl ea a l convertir los movimientos mecá-
n icos en impulsos neurales. Las fibras eferen tes, q ue llevan infor mación desde
el cerebro hacia e l órgano de C orti, están en co ntac to con las fibras aferentes
pero no co n las cé lulas ciliadas internas.
Las cé lulas c iliadas exte rnas son largas y de forma cil índ rica, co n el nú -
cleo situado en su parte inferi or. Más de cuatro vece s más n umerosas q ue las
células interna s, forma n de tres a c inco filas a lo largo de la membran a basilar.
Se hallan en contac to d irecto tanto co n fibras aferen tes co mo eferentes. Du-
rante la est imulación con tensión eléctrica, las cé lulas externas se aco rta n y
alargan a un a frecu enc ia est able. A raíz de esta capac idad motora se ha suge-
Fibras eferentes
rido que son las responsables de los procesos cocleares ac t ivos, que incl uyen la
capacidad de sinton ía de ban da angosta y la gene rac ión de em isiones o toac ús-
Perilinfa ticas. Como ex iste n cerca de 1.S00 fibras ne rviosas eferentes que llevan infor-
mación hacia la cóclea desde el co mplejo olivar superior, se supone que en las
primeras etapas del análisis aud itivo perifér ico actúan centros elevados de pro -
Figura 18. Cé lulas ciliadas int ernas y extern as cesamiento y co ntro l.
La perilinfa, rica en sod io , es sim ilar a los fluidos que ocupa n el espacio exte-
rior a las células del organ ismo , mien tras que la endo linfa, con un a gran con -
cen trac ió n de po tasio , se asemeja al med io líquido interior de las cé lulas. Dada
su ubicación en la membrana basilar, las cé lulas del órga no de C ort i están ex-
puestas a la end ol infa en su parte supe rior y a la perilinfa en la infer ior, con
una diferen c ia de po tenc ial de alrededo r de SO mV en tre ambos extremos. Du-
rante la est imulació n acúst ica el movim iento de la mem brana basilar se trans-
mite a través de d iferen tes clases de células de soporte, en un ión solida ria con
las células sensor iales. Las este reocilias de estas últ imas se mu even entre la
memb rana basilar y la masa gela t inosa de la membrana tect órea , excita ndo
mecá n ica mente las cé lulas c iliad as e in iciando el proceso de tran sducci ón en-
tre vibraci ón e impulso ner vioso.
Tod as las estereocilias de una cél ula están un idas entre sí. Se supone que,
co mo éstas son rígidas y pivot an sobr e su base, el movimien to en una d irec -
ció n abre canal es selectivos de iones a través de los que fluyen ion es de pota -
sio hacia el interi or y la cé lula se despolariza. La co rrien te ión ica, que fluye
desde la escala media haci~ e l in terior de las cé lulas c iliadas interna s, está mo -
Figura 19. Tres filas de cé lulas ci liadas externas to madas con un microscopi o elect rón ico dulada por la deflexión del haz de este reoc ilias en relación con un eje de má-
de barrid o
x ima sens ibilidad.
36
37
El período refract ario de un a cé lula es muy grande en relación con los pe-
ríodos característicos de las señ ales acúst icas: una sola célula es incapaz de
captu rar la variación temporal, pues no puede seguir con suficiente veloc idad
sus ascensos y caídas. Sin emba rgo, las células ciliadas internas pueden respon -
der ante cie rtos valores de la forma de onda del est ímulo. Si varias cé lulas dis-
paran ante la misma seña l a diferentes niveles o fases, el conjunto de la
Inh ibición Exci tación informac ión permite reconstruir la forma de onda or iginal aunque ésta posea
una frecue nci a muy elevada.
Figu ra 20 . DeAex ión de la estereoci lias en un a cé lula c iliada int ern a La inform ación de fase del estí mulo también es codific ada en el patrón
te mpora l de disparo de las cé lulas ci liadas in ternas. Los intervalos en tre dispa-
Los movimientos en direcci ón de la fila más aira provocan un aumento ros son, aproximadament e, mú ltipl os enteros del período del estí mulo. Una
en la conductancia de l siste ma y los que van en sent ido contrario la dism in u- célula aislada no dispara necesariamente en cada ciclo de! est ímulo pero,
yen , mien tras que los movimientos ortogonales al eje no la altera n . La co- cuando ocurre, lo hace siempre a la misma fase de la form a de onda . El patrón
rrient e ión ica está constituida principa lmente por iones positivos de potasio temporal de disparo de un grupo de neuronas contien e inform ación clara so-
(K +) pues su co nce nt rac ió n en la endolinfa de la scala media es muy alta . La bre e! per íodo del estímulo porq ue ex iste siempre algún disparo en cada ciclo
t ransd ucc ión en las cé lulas ciliadas es no lineal. Los desplazamientos simétri- de! mismo. En la figura 22 se ve que e! intervalo entre disparos es siempre un
cos del haz de este reoci lias desde la posición de reposo, de la misma magn itud múltip lo entero de l período de la seña l de entrada.
pero en sent idos opuestos , generan ca mb ios de co nd ucta nc ia asimétricos. La sensib ilidad a la fase desapa rece por encima de 5 kH z. El límite supe-
In mediat ament e después de un disparo la cé lula ciliada in terna entra en rior no está determinado por la tasa máxima de disparo de las neuron as, sino
un estado refractario, en el cua l se reaj usta químicamente, de una du rac ión por la prec isión con que e! impu lso ner vioso "enga nc ha" una fase parti cular
aprox imada de 1 ms. No pod rá dispa rar nuevamente hasta haberlo superado. de! estí mulo. A 5 kH z la variabilidad estoc ástica de enganc he es comparable
En la figura 21 se puede apreciar el co mpo rta mie nt o temporal de una cé lula con el períod o de la onda.
de Cort i durante un disparo .
120
120 A
120 B e
850 Hz 1.000 Hz
406 Hz
: 178/5 182/5
50 E NA++ 72/5
60 60
60
••••_-_. -._.- -_••••••-••••• ~ ••• •••••••••••• •• Nivel del pico
5' <J)
.s
O
O
O
ro
<:al 10 15 20
O
O 10 15 20 10 15 20
.~
ro E
~ al
"O
ro
'0
Potencial postsin ápuco O
120
-50 excitatorio Q:; 120 120 F
e O E
al E 2 .300 Hz
o
a.
' :J
z 1.500 Hz 2.00 0 Hz
178/5 83 /5
234/5
60 60
..
60
-100
E K+
O
..
O O 10
-4 0 -30 -20 -1 0 O 1 2 3 4 5 6 15 20 O 5 10 O
O 10
Tiempo (ms) Duración del intervalo (ms)
Figu ra 2 1. Diferenci a relat iva de potencia l entre el interior y el ex ter ior de un a neurona Figura 22. Int ervalos int erd isparo para una neuro na audit iva am e estímulos de diferentes
especializada ame un potencial de acc ión variab le frecuen c ias
38
39
Mu chos investigad or es acep tan q ue n uest ra ha bil idad para local izar son i-
Sinapsis
dos depen de en parte de la comparación de la infor mación tempor al de los dos dendr ita-dendrita
llícllls; pe ro la relevancia de la in formación tempor al en el en masca ram iento y
en la pe rcepció n de la alt ura tonal es todav ía debatida acaloradamente, tal co-
mo ve re mos más ade lante.
En 1983 Brownell desc ubr ió qu e las célu las c iliadas externas aisladas pued e n
camb iar de lon gitud ante un cambio en el po tenc ial eléctrico de polar ización
(Bm wn ell, W E., 1985 ). A pesar de que el mecanismo n o se conoc e en deta-
lle, se supone que el estímulo efectivo lo pro vee una varia ción en el potencial Sodio (Na ++). .~.-..-...-..~
...,,",..~·--~"'i
e n la membrana celula r y no , co mo en el caso de las cél ulas cili adas in ternas , *+~~¡~ +++- + ++ + + + !
una cor rien te i ónica. El cambio de longitud tota l se logra sumando los ca m- - - - - - - -- -+ + + + + --- - - -
hios geo mé tricos de gran cantidad de estructuras senso motoras independ ien- Potencial Direcc ión del impulso
Potasio (K+) de acción Interior del axón
tes alojadas en el pl asma de la me mbrana celular. La membrana de las cé lu las
ciliadas externas posee gran ca ntidad de m itocondrias adyacentes q ue le per - - - - - - - - - +1+1++ + Membrana celular
miten tra nsfor mar las mo léc ulas orgán icas para o bten er la energía ne cesar ia de
+ ++ ++++ ++ ::-r- - - - +++ + ++ ~ Medio externo
acu erdo al ciclo de Krebs . Pasajes de iones por concentración y por gradiente eléctrico
Las cé lul as c iliadas externas actúan como pequ eño s mús culos q ue agregan Figu ra 2 3. N euro na tfpi ca y tran sm isión de un potencial de acción en el axón de un a
ene rgía mecánica a la onda progresiva en la membrana bas ilar. Se c ree qu e la n euro na
fracción de en ergía agregada pu ed e ser co ntro lada po r los centros ele vad os de
pro cesa m iento a tr avés de la in for mació n que v iaja por las fibras eferentes de l
\' la resiste nc ia eléctrica de la membran a cel ular muy pequeña, resu lta un co n -
nervio auditi vo . A ct úan co mo una "res istenc ia negativa" q ue compensa la
du ctor eléctrico inefi ciente. En consecuencia, la ca rga posttiva inyectad a en el
energía perdida en el proce so de vibración. Este con tro l de ganancia tamb ién
axón se disip a tra s uno o dos milíme tros de recorrido . Para que la seña l recorra
puede reducir la respu esta ante estímulos muy intensos, y actúa con muc ha
distancias mayores es necesari o regenerar frecuentemente el potencial de .a_c-
mayo r velocidad qu e el reflejo del músc ulo estaped ial. La realimentació n po -
c ión a lo largo del camino a pa rt ir del intercambio iónico . A sí, la in fo rm ac i ón
sitiva q ue tien e lugar per m ite sor tear las lim ita c iones prop ias de un sistema pa-
sivo impuestas por el prin ci pio de indeterminación acús t ico . 5 viaja a lo largo de los axo nes e n for ma de bre ves imp ulsos eléctr i~os qu e son ~l
resultado del despl azam iento a través de la membrana celular de Iones de sodio
Las células ciliadas ex tern as afec tan la transducci ón de las células c iliadas in-
dotados de carga positi va. En la figura 23 se puede o bserva r un esq uema del pro-
ternas prin cipalmente a través de la vibrac ión ind ucida de la membran a basilar.
ceso de tra ns m isión .
Característ icas del n ervio a udi tivo Un pu lso n erv ioso que viaja por un axó n es pot enciado cada ta nto a través
de discontinuidades en las va ina s m íelínicas llamados nódul os de Ranvier. La ne-
cesidad de reforzar repetidam ente la corriente eléctrica lim ita la ve locid ad máxi-
El nervio aud iti vo se di vide en dos ramas ana tó mica y fisiológicamente d iferen -
ma de viaje de los impulsos. Para axo nes de 2 mm de diám etro la velocidad d~
tes, la rama vestibular -o n erv io del equi librio- y la rama coclear. Está form a-
. cond ucción es de 10 mis, mientras qu e para axo nes de 20 mm llega a los 120 mis.
do prin cipalmen te por los axones de las ne uronas conectadas con las cé lulas de l
órgano de Corrí. C o mo la resisten cia eléctrica a lo largo del eje es muy grande
roLe to ma cerca de un quint o de segundo a un me nsaje llegar desde la cab eza ~e un orga-
, A lgo simi lar oc urre cuando un percusion isra "apaga" el sonid o de un timbal. nista hasta sus pies --en un pasaje rápido éste debe compensar este retard o ind ic ándol e a sus
pies qué hacer an tes que suene la not a.
40
41
4. T EORÍA DEL LUGAR cia mecán ica de la memb rana basilar. Recordemos que , para un sistema discre-
to, la frecuencia de resonancia fR dep ende direct amente de dichos pará metros a
Como los pulsos nerviosos que nacen en las células ciliadas int ernas no son lo part ir de la relación f El =vr¡¡;; , en la que k represe nta la rigidez y m la masa del
suficientement e rápid os co mo para seguir la forma de onda exacta de una se- sistema. La variación de la elasticidad en funci ón de la posición, en una razón
ñal acúst ica (las vent anas que definen poseen anc hos de banda limi tados), de- de 1:100 en tre ambos ext remos, es la principal cara cte ríst ica física que ex pli-
ben existir necesariamente otros mecan ismos q ue per mitan cod ificar dichas ca el mapeo frecuencia-espacio que tien e lugar en la cóclea . La est ructura del
seña les. De todos los propuestos se destacan la teorí a del lugar y las teorí as órgano de Cort i, a su vez, ca mbia co nt inua ment e a lo largo de su desa rrollo.
temp orales. Desarrollaremos aquí la primera de e llas y estudiaremos las teorías C erca del apex, en la zona sensible a las bajas frecuencias , las cé lulas son más
tempor ales en el capítu lo dedic ado a la altu ra tona l. grandes y las estereoci lias más largas que en la región cercana a la base, sensi-
El descub rimiento de la mecán ica de la membran a basilar, fundamen to de ble a las altas frecuencias.
la teor ía de l lugar -o teoría to no tó pica-, se deb e a G eo rg Va n Békésy (B ékésy, Si el estribo empuja muy lent amente a la ventana ova l, la peri linfa pasa
G . Va n , 1960). Su magnífico trabajo, que le valió el Premio N obe! de Fisiolo- a través del heli cotrern a y el volu men tot al de líquido permanece constante al
gía y Med icina en e! año 1961 , es e! fundamento de casi todas las invest iga- desplazarse hacia fuera la ventana redond a. Pero si empuja rápidamente a la
cio nes poster iores sobre la fisiología de la audición. La teoría del lugar postul a ven tana ova l, la deflexión en la mem brana basilar co mpensa el cambio de vo-
que cada punto de la membran a basilar vibra a una frecuenc ia partic ular, las lumen y no ex iste flujo a través de! helicotrema, En esencia, una onda de una
más agudas en la zona ce rcana a la base de la cóclea y las más graves en la re- frecuenc ia definida no puede viaja r más allá de un determ inado "punto de cor-
gión próx ima al apex, en una espec ie de mapeo frecuenc ia-espacio ." te" en la cóclea . A medid a que se aprox ima a ese punto, la onda progresiva se
Cu and o vibra el estribo, la onda gene rada en la venta na oval se propaga hace más lenta, la amplitud aumenta y su energ ía es absorbida por el movi-
rápidament e por el fluido coclea r y llega al apex en apenas unos microsegun- miento de la memb rana basilar. En la figura 24 se aprecia una onda prog resi-
dos. Pero tambi én se propaga tran sversalmente a lo largo de la mem bran a ba- va en la membran a basilar generada por un estím ulo sinuso ida l de 200 H z.
silar con una velocidad mucho menor, recor riendo su exte nsi ónen algunos El gradien te espac ial que define el com porta miento tonotópico de la mern -
milisegun dos. La velocida d de propagación en la membrana basilar no es un i- hrana basilar se man ifiesta también en la pendiente de la onda progresiva.
forme y varía en funci ón de la distan cia a la base de la cóclea. Ce rca de la ven - Se puede pensar en la membran a basilar co mo un filtro en el cua l la res-
tan a ova l la veloc idad es rápid a y la lon gitud de onda comparat ivament e puesta máxim a ante una seña l sinusoida l se mueve hacia el extremo apical a
grande. En el apex , por e l co nt rario, la ve locidad y la lon gitud de onda son
much o men o res. La velocid ad finita de la o nda progresiva implica un ret ardo
acumulado en función de la distan cia desde e! estr ibo que produc e un corri- +
miento de fase, tambi én ac umulat ivo, de gran import an cia en algunos proce-
sos de transducc ión coclear.
Esta característ ica mecán ica de la mem brana basilar se debe a q ue funcio-
na co mo un a estructura de sopor te con parámetros que se mod ifica n gradual-
"~
:J
01---":;""------"""----4:---f--f-'-----¡
E
ment e a lo largo de su exte nsión. Es más angosta, gruesa y rígida en su base y <1:
devien e progresivament e más ancha, delgada y elást ica a med ida que se acer-
ca a su extremo ap ica l. La rigide z aumenta progresivamente hacia la base de
la cóclea , mient ras que su masa decrece en la misma d irecc ión. Este grad ien-
.te de rigidez y masa permite la variación grad ual de la frecuenci a de resonan - 20 22 24 26 28 30 32
Distancia desde el estribo (mm )
7 En e l tec lado de un piano se realiza un mapeo espacio-frecuenc ia: cada punto del espac io
-cada tecl a- co rrespo nde a un a frecuen cia diferente. En esta an alogía la membra na basilar Figura 24 . Dos instantes diferentes de una onda progresiva gene rada por una exc itación
vend ría a ser un a espec ie de anti -piano, sinuso idal de 200 Hz
42 43
med ida que la frecuen cia disminuye. En otras palabras, existe una conve rsión 11 kHz 2 kHz 500 Hz 200 Hz
frecuencia-espacio , ta l como se aprecia en la figura 25.
A l margen de la frecuenc ia del estímulo, la form a de la envolvente tem-
pora l de la vibración en cada punto de la membrana basilar sigue isom órfica-
mente la de la vibración en la ven tan a oval. A nte estímulos sinusoidales tod a
la mem bran a basilar vibra de manera aproximadament e sinusoida l, a la fre-
cuenc ia de la seña l de ent rada. Por eje mplo, si se ap lica un a sinusoide de 1.000
Hz, cada punto de la memb ran a que se mueve lo hace a esa frecuenci a, con un Base 10 20 30 Apex
desplazam iento máxim o en el plinto de reson ancia correspond iente a 1.000 Hz. Dista ncia a la base (mm)
El patrón de vibració n de la membrana basilar no depen de del punto so-
bre el cual se localiza la exc itación: vibracio nes que llegan a la cóclea desde Figura 25 . Resonan cia de la membrana basilar en función de la frecuencia
y de la d istanc ia a la base de la cóclea
los hu esos de la cabeza generan respuestas similares a las que prov ienen de la
ventana ova l.
Retardo
Exci tació n de la membran a basilar con un impulso acústico
A
o
C uando se ap lica un impulso al estribo aparece una perturbación ce rca de la 'E
ventana oval q ue se prop aga la lo largo de toda la membran a basilar. C ada
punto de la mem bran a se comp o rta como un filtr o de banda pasante cuya fre-
Ql
'E
~ O
1 AA
Vv v ~
'\
ro
a.
en
cuencia ce ntral cor responde a la frecuen cia de reson anci a característ ica en ese Ql
o
pun to. La form a de onda y el espec tro var ían cont inuamente con la posición ,
hecho que afecta nu estra habilidad para discriminar son idos de ca rác te r tran-
síto r ío .f En la figura 26 se puede ver la respuesta al impu lso en un punto par-
ticu lar de la membran a basilar. O 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0
A su vez, la respuesta ante un clic de las células inte rna s en un punto de- Tiempo (ms)
ter mina do de la mem bran a basilar se puede ver en la figura 27.
('il:ura 26 . Respuesta mecánica ante un impulso de l pun to de la membrana basilar
Los picos múltiples aparece n debid o a las oscilaciones aten uadas del filtro ,', .rrespond iente a una frecuenci a de resonancia de 10.000 Hz
basilar co rrespondiente: el intervalo tem pora l ent re picos es el in verso de la
frec uenc ia carac te rística de la zona de la mem bran a basilar. Si la polaridad de l 256 r - -- - - -- -- - -- --,
clic se inv ierte, el patrón se desplaza en el t iemp o de modo que los picos apa-
recen donde an tes se local izaban los valles, efec to muy import ante a la ho ra ~ 192 ..
de local izar espacia lmente una fuente ac úst ica. ~
Estos hec hos tam bién se relac iona n con la percepción de señale , periód i- ~ 128 .
'O
ro
cas. [avel mostró q ue una porción de la actividad de las células ciliadas int er- 'O
.¡¡;
e
nas que responde a los armón icos de una seña l periódica es sensible a la fase ~ 64
.!:
de repetición de la onda complet a, que co inc ide con la fund amental de Fou-
rier de la señal (j ave l, E., 1980) . 0 1-...,..- .,......-,1-.,........
O 2 3 4 5 6 7 8
Tiempo de respuesta (ms)
8 El co mporta mient o de la membra na basilar en este caso es similar al definido por la rrnns-
fonnada wavelet (Basso, G., 200 1a). ¡' jl:ura 27 . H istograma posest ímulo en un punto de la MB ante un clic
44 45
5. C OMPORTAMIENTO ACTIVO DE LA MEMBRANA BA SILAR alinea lidad coclea r se verifica al excitar un oído co n dos sinusoides de frecue n-
Y EMISIONES OTOACÚST ICAS
cias f l y [z- El eco coclear que aparece coincide en frecuenc ia con el son ido de
combinación principal 2fl - f2. Este resultado prueba la disto rsión armón ica o
De acuerdo con la teor ía del lugar clás ica, tal co mo la en unció Von Békésy, la alinea l que actúa duran te el proceso de transducción (Basso, G., 2001 a).
membrana basilar actúa co mo un ana lizado r lineal de Fourier con un poder de La alinea lidad ocurre prin cip almente en los lugares de la memb ran a basi-
resolución insuficiente para ex plicar la resolu ción en frecuencia del o ído hu- lar próximos a la frecu enci a de reson an cia cor respondi ente. En un cadáver la
mano. En otras palabras, el ancho de banda de la resonan cia de la memb ran a respuesta es siempre lin eal, tal como con stató Von Békésy en sus experimen -
es much o mayor que el qu e se mide en los expe rimentos psicoacústicos. Por tos, ya que desaparecen los procesos celulares ac t ivos aportados fundamenta l-
ejemplo, de ac uerdo con la teoría del lugar clásica, al excita r la mem bran a ba- mente por la motr icidad de las células ciliadas exte rnas . La alinea lidad se
silar a una frec uencia central de 1.000 Hz apa rece una banda de 100 Hz de ex- pierde con el daño fisiológico y con la muerte: los ecos cocleares sólo se ob-
tensión , cien veces más grande que la resolución real, que es del orde n de 1 servan en sujetos en buen a cond ición fisiológica. Están relacionad os con pro-
Hz para dich a frecuen cia ce ntral. La ca usa de esta enorme discrepan cia es, lo cesos vulne rab les y las hi poacusias temporarias o pe rmanentes, c iertas drogas
sabemos aho ra, la existencia de un mecanismo act ivo en el órgano de C orti y otros trasto rnos fisiológicos los inh iben.
q ue Von B ék ésy, a l trabajar exclusivamente con cadáveres, no pudo descubrir. En aproxi mada ment e el 30% de las person as aparece n emisiones o to ac ús-
En 1978 Kemp enc ontró que al estimu lar e l t ímpano de un individuo vi- ticas espon táneas, que suceden en ausencia de estímulos acúst icos exte rnos .
vo con un impulso de baja int ens idad se detect a un eco generado en el int e- Los tinnitus o acúsfenos son , en esenc ia, emision es otoacú stic as espontáneas .
rior del oído (Kem p, D. T., 1978) . Co mo estas seña les poseen un ret ardo
comprendido ent re 5 y 60 ms se sugirió que tenían un or igen coclear. Actual-
men te se las conoce como ecos cocleares, ecos de Kemp o emisiones o toacús- 6. FUNCI ON ES DE T RA NSFERENCIA DEL SIST EMA AUDIT IVO PERIFÉRICO
ticas evocadas. El nivel relat ivo de la reflex ión es mayo r a men ores n iveles de
exc itac ión , lo que reve la una operación no lineal. En ocasiones, la ene rgía re- Es posible reunir toda la inform ación descripta hasta aho ra para ana lizar có -
flejada supe ra a la energía incidente ev idenc iando un proceso ac tivo de arn - mo el sistema audi t ivo periférico mod ifica las seña les acúst icas que llegan a ca-
plific ac ión biológica. Las emisiones o toacústicas provien en de la ac tividad da oído. El resultado final es la función de transferencia del sistema auditivo
mo tora de las células ciliadas exte rnas . f¡eriférico, q ue relacion a la presió n acústica de la fuente ex te rior p(t ) co n la vi-
El desc ubrimien to de Kem p modificó profundamente el co noc imiento hración que llega hasta la membran a basilar S(t ).
que tenemos sobre la fisiología del oído. Los procesos coclea res activos posibi- Si hd Y h¡ son las señales ac úst icas a la ent rada de los pabellon es auditivos
litan la sin to n ía de banda angosta que se observa n en las experienc ias psicoa- derecho e izquierdo y &J(t ) y g¡(t) las respuestas al impu lso del espac io acúst i-
cústi cas y que las teorías anteriores basadas en el oído como un receptor pasivo co entre la fuente y las dos ent radas auditivas, hd y h¡ se pueden obtener de las
--como la teoría clásica del lugar- , no podían expl icar. El comp ortamien to ac- expresiones qu e siguen (el símbolo * denota convolución) :
tivo del oído int erno permit e su asombrosa resolución en frec uenci a, su gran
sens ibil idad ant e est ímulos déb iles y ex plica el efecto de supresión de un to no hJ(t) = p(t ) * &J(e)
por otro, temas que desarrollaremos más adelante. h¡(t ) = p(t ) * g¡(t)
La act ividad coclear puede ente nderse tambi én como una relación alineal
ent re las señales mecáni cas de entrada y salida. Numerosos trabajos en ind ivi- Una part e de las respuestas gd (t) Yg¡ (e) está dada por las caracte rísticas del a rn-
duos vivos han demostrado que la respuesta de la memb rana basilar es alinea l, hiente acúst ico exte rior y otra part e por las funci on es de transferenc ia defini-
es decir que la salida no respond e proporcionalmente a la entrada. A niveles das por los homb ros, la form a y tamañ o de la cabeza y el pabellón auricular.
de seña l de entrada por debajo de 60 dB, un mecanismo biológico act ivo am- Los efectos de estas piezas ana tómicas se vuelv en sign ifica tivos cuando las lon-
plifica la respuesta coclear. A medida que el n ivel crece la amplificación dismi- gitudes de onda son comparables con sus dim en sion es a causa del fen ómeno
nu ye y, para altos niveles en la seña l de entrada, ce rcanos a 90 dB, el .Ic difracción , tal como veremos en el capítulo V II . Para simplificar la exposi-
mecanismo act ivo deja de operar y el sistema deviene lineal. Una prueba de la á -m, obviaremos desde aquí las diferenc ias entre los oídos de recho e izq uier- .
46
47
20
do y utili zaremos la tran sformada de Fourier H(w) para simbolizar la respues -
ta espectral de la entrada auditiva h(t).
En el trayecto del estímulo interviene a continu ación la funci ón de tran s-
ferencia del ca na l auditivo externo E(w), que al co mbina rse con H(w) modi - s
fica la señal de ent rada de la man era que se ve en la figura 28.
w:S
;[ -10 .._ .._ --_ _ _ _ ._ _._ _ .... _ ..
En seguida aparece la acció n del sistema de palancas y filt ros del oído me-
dio, cuya func ión de tran sferen cia promedio , C( ro), se aprec ia en la figura 29. -20 L.... _ _L....._---L_--..l '--_-'-.........J
S i se co mbina n las tres funci ones de tran sferenc ia anteriores se obt iene la 0,2 0,5 2 5 10 15
funci ón de transfere nci a total entre la fuen te acústica y la entrada de la cóclea Frecuencia (kHz)
5(W):9
5(w ) = H(w) E(w) C (w ) Figura 28. Función de tra nsferenc ia co mbinada H(oo) E(oo)
Existe ev idencia de que conc urren grupos de de tectores neurales alta mente es- o
'O
pecializados en los niveles superiores del sistema aud it ivo. Ap arentemente, en '0
ID
la cor teza cerebral se ana liza algo más que la frecuencia o la int en sidad de las 'O
o
seña les q ue le llegan . A lgun as neuronas cort icales parecen respond er dir ect a- 'C
al
ment e a los tra ns itor ios de la seña l de ent rada; otras reaccion an an te cambios E
ec.
un idireccion ales de frecuenc ia (se las den omi na "frequen cy sweep detectors" 'O
lO
.......
en la literatu ra especializada) ; otras son sens ibles a la tasa de modul ación (im- ~
:o
.¡¡;
porta nte q uizá para la inteligibilid ad del hab la); otras a los dat os necesarios c:
al
para la localización espacial, etcétera. La mayoría de los investigadores opina 10 dB (/)
que la ton ot op ía de la memb ran a basilar llega hasta el cerebro , pero no cree LI----+---+----ii-----i-----l
0,2 0,5 2 5 10
que la relación iso m órfica se co nse rve plenamente y propon e un rnapeo m úl-
Frecuencia (kHz )
y La relación expuesta es valida sólo para fuentes acúst icas localizadas frente al oyente . En Figura 30. Función de transferenci a ent re el campo extern o y la cóclea 5 (00 ) (pun tos)
el capítulo VII se ana lizará el caso gene ral. "tlmparada con la sensibilidad promedio del oído hum ano (línea)
48 49
o dB r---,----r---r-- ¡ - - - - , - --,---,------, Hem isfe rio Hemisferio
izqu ierdo derecho
-20
"-
•Cl.Q'" '" r
·~ · t '" ?
-40 "'tt} . 'Q. '" ?
~ '~ ~ ?
-60 ~ ········¿.r ~ t
~ ~ ~~...?
-80 .~ rf c/J
.; A b
-100
tiple entre ambos siste mas. En todos los casos, e! mape o ocurre entre un siste - Núcleos
. . . . ; ·· · · 0
~~ ••• ::
ma unidimensional, la cóclea, y otro bid imen sion al, la co rteza ce rebra l. Aun- cocleares~
ven trales Oido derecho
que nos representamos al cereb ro co mo una estructu ra tridi mens iona l, qu izá Oído izquierdo
50 51
.!B ro
'" :;:;
ID >
::J cu
C- "-
'" .Q
cu ::J Capítulo II
a:: '"
o
c: c:
Sonoridad
-o ro
'13 §
~..c:
:.= o
ro ~
.~ ~
C- cu
w
'" _
U
cu
"O
o
0"0
a. ro .Q
Es razonab le relacionar la sono ridad - una magn itud perceptual- con la inten-
~ :;"'O
cu U cu sidad de la seña l física que la origina. El mecan ismo parece claro: una onda
8 'c cu E acúst ica produce c ierta presión dinámica en e l aire a la entrada de l oído ex -
Ol
52 53
sensación aud itiva en té rminos del cual los son idos pueden ser orde nados en rítmica, el decibel, much o más adecu ada para describir la relación ent re la
una esca la que se extie nde del silencio a lo muy sonoro". 1 energía del estímulo físico y la son or idad resultante.t De aquí se obtie ne una
En esta defin ición , la sonori dad aparece co mo un at ributo gene ral del so- de las magnitudes más usadas en acústica , el nivel de presión sonora (NPS) ,5 cu-
nido y se refiere, ant e todo, a la sono ridad globa l de un objeto acústico. Más ya unid ad es el decibel (d B):
adelant e la ampliaremos para ana lizar la sonoridad de los diferentes elemen-
tos q ue co mpone n dichos objetos.
N PS = 20 laglO _ P- [dB]; con Pref = 20 pPa
Pref
l. R ELACi ÓN ENTRE AMPLITUD E INTENSIDA D
En esta relac ión p es la presión acústica en un punto del espacio y Pref es una re-
En el caso de una onda sinusoida l, la amplitud no es más que una man ifesta- ferenc ia convenc iona l estandarizada. Hay varios elementos a destacar en esta
ción de la can tidad de en ergía presente en el siste ma . Como esta ene rgía no se ecuación: en primer término, e! nivel compara dos presion es dinámicas entre sí,
puede medir direct amente y es muy difícil determinar la amplitud de! movi- indicand o cuál de ellas es mayor y en qué proporción. En segundo lugar, para po-
miento de las molécu las, se acostumbra medir algún parámetro más acces ible. der comparar dos nivel es de presión en dB éstos deben haber sido tomados se-
De todos los parámetros relacionados con la energía de la onda, el más senc i- gún una misma presión de referencia (Pref) ' El estándar internac iona l estipula
llo de evaluar es la presión dinámica (p), que puede ser medid a empleando di- que la referencia debe co incidir con el umbral de audibilidad a 1.000 Hz, que
recta mente los micrófon os de presión clásicos. La presión es una magnitud que corresponde a una presión de 20 IlPa. Así se consigue vincular de manera direc-
vincula una fuerza con la superficie sobre la que se aplica, y la unid ad que le co- ta una unidad física, el decibel, con una de las principales características de la
rresponde es e! pascal -que equivale a una fuerza de un newton aplicada sobre aud ición humana. Por último, e! eno rme rango físico presente en los est ímulos
una superficie de un met ro cuad rado. Una onda acústica que se propaga en el acúst icos, en e! que la mayor presión audible supera un millón de veces a la me-
aire está form ada por una sucesión de zonas de presión por enc ima (p positiva) . nor, se reduce considerablemente al ser expresado en decibeles. En la figura 1 se
y por debajo (p negat iva) de la presión atmosférica media. La presión atmosfé- ' aprecia la relación ent re la presión din ám ica de la seña l, exp resada en pascales,
rica norm al, a nivel del mar, es de aprox imadamen te 101.300 Pa y se mantie- y el n ivel de presión sonora en decibeles. Para que el lector pueda vincular es-
ne relativamente consta nte du rante interva los de tiemp o breves. 2 tos valores con los son idos cotid ianos, en la cuarta columna se hace referenci a
a los contextos acústicos con los que habitualm ente se asocian. Se observa que
Decibeles el valor de OdS correspo nde a una presión de 20 IlPa, e! umbra l de audibilidad,
y no a presión cero . Por su part e el umbral de dolor ronda los 120 dS , aunque
Se sabe que para obte ner increm entos de sono ridad en pasos perceptu alm en- este límite varía apreciablemente según la sensibilidad de cada indiv iduo.
te iguales los incrementos en la presión del est ímulo deben ser cada vez ma-
yores. 0, con mayor precisión , para percibi r un aumento de sono ridad Pot encia e intensidad acústica
consta nte ha y que aumen ta r el estímulo un porcentaje también co nsta nte. A
mediados de l siglo XIX Web er y Fechner-' condensa ron mat emát icamente este Toda onda acústica nace en una fuente cuya función es transferir ene rgía al me-
comp ortamiento en dos leyes que permitieron la creación de una unid ad loga- dio. La cant idad de energía (E) que ent rega por unidad de tiempo se denomina
/)()tencia (P) y constituye una de sus característ icas más importantes. La potencia
1 Algunos auto res llaman "inte nsidad subjetiva" a la sono ridad. Por ejemplo, véase el artí- se mide en watts (W) y se vincu la con la energía a través de la siguient e relación:
culo de Plack y Ca rlvon en el que emplean los términ os loudness y subjective mtensíry (Moa -
re, B., 1995) .
P = !1E /!1t [W) = [lou lej/[s]
2 Son los \. 013 hPa (hect opascales) que informa el servicio meteorológico como presión
at mosférica normal.
J Ernst Heinrich Weber (1795-1878) y G ustav Theodor Fechner (1801-1887), fisiólogos ,1 Un poco más adelante vamos a volver sobre este punto.
alemanes pion eros de la psicología ex perimenta l y creadores de la psicofísica. " En inglés se lo deno mina sound pressure leve! (SPL).
54 55
Presión dinámica Intensidad Nivel de presión sonora Situaciones típicas I =P/ A
1~,.
2 Pa
1 wlm 2
10- 2 wlm 2
120 dB
100 dB
---? Umbra l de dolor
I
20 uPa 10-' 2 wl m 2 OdB ---? Umbral de audibilida d NI = 10 logIo - - [dB]; con Irej = 10 - 12 W / m2
[re[
Fuente acústica Potencia acústica máxima l.a sonoridad es una magni tud perceptual y como tal" no puede med irse d irec-
I amen te a partir de sensores físicos. Puesto que todas las técnicas indirect as de
Ca nta nt e (ten or) 0.04W medic ión aportan sus propi os presupuestos y limitac iones, nuestra discusión
Flaut a 0.05W
Trom peta 0,2 W incluirá neces ar iamente una descr ipción de la metod ología aplica da en cad a
Trom bón 6 W 111 10 de los casos expuestos. Quizá la menos con tro vert ida de las técnic as de
Orquesta sinfón ica (fff) 60 W medici ón sea la de comparación de sonoridades , en la que un oyen te debe variar
1;1 intensidad de un est ímulo hasta cons eguir igualarlo en sonoridad con otro
La ene rgía to tal que radia la fuente se propaga en muchas di recci ones . En par- "sl<índar de intensidad fija. En este método el oído se usa com o un detector de
ticu lar, a nosotros nos va a interesar la q ue atrav iesa det ermi nada área (por n-ro y es capaz de revelar cóm o otros parámetros de la señal, tale s como la fre-
ejemplo, el t ímpano de una persona) . Otra magn itud, la intensidad acústica (1). ,'llcncia o el ancho de ban da, afectan la sono ridad. Tamb ién sirve para de tec-
da cuenta de la pote ncia que atravies a un área A: I al' la mane ra en que alguna característica particular del oyen te, como un a
I',;rdida de sensibilidad aud itiva, influye sobre su percepc ión de la sonoridad.
(, La potencia instant ánea se ca lcula a part ir de la derivada de la energía con respecto al
tiempo: Pi = dE/dt. I "",md inte115ity level (IL) en inglés.
56 57
90
Umbrales absolutos
80
•••••• MAP (monoaural)
El umbr al absoluto de int ensidad - la intensidad a part ir de la cua l comenza- - - - MA F (monoa ural)
mos a percibir son ido- fue det erminado por prim era vez en la segunda mitad iD
~ - - MAF (bínaural)
del siglo XIX. Se lo midió a una frecuencia central de 1.000 Hz y se supuso que .9
:J
,
el oído human o mantenía un co mporta miento parejo a lo largo de todo el ran - o
VI
40 \
\
.o \
go audible. Hoy sabemos que, para una seña l sinusoida l de 1.000 Hz, la mayo- ro 30 \
ría de las person as con oído sano co mienza a o ír cuando la inte ns idad alcanza ~
.o 20
\
,,
E -c
un os 10- 12 W/m 2• Esta intensidad equivale a una presión sono ra de 20 millo- :J 10 "
int en sidades aún menores oiríamos el ruido provocado por la agitación térmi- Frecuencia (kHz)
ca de las moléculas del a ire. C uando compa ramos nuestros oídos con los de al-
Figu ra 2. Mínimas int en sidades ac úst icas audib les (umbrales MAr y MAF)
gunos an ima les nocturnos, como los gatos o las lechu zas, no deb emos buscar
en una mayor sensibilidad absoluta la razón de sus excele ntes capacidade s au-
ditivas (no al men os a 1.000 Hz). En cuanto a los límit es de audibilidad para bajas frecuen cias, podemos
La variación del umbral de audición en func ión de la frecuencia del estí- apu ntar que Wh itde midió en 1972 los umbr ales ent re 3,5 y 50 Hz y concl u-
mulo se obt iene hab itu almente a part ir de dos métodos: el de la presión míni- yó que forman un continuum con las curvas a frecuencias medias (a 3,5 Hz se
ma audible (MAr), que se evalúa con auriculares, y el del mínimo campo audible necesi ta n 120 dB para llegar al umbral) (Whiu\e, L. S. et al., 1972) . En 1974
(MAF), que se mide con altavoce s y que incluye los efec tos de filtro del ca na l [on son sugirió, no obsta nte , que para son idos de men os de 16 Hz lo que se oye
audit ivo ex te rno y del pabellón auricular (de gran importancia para definir los es el prod ucto de la distorsión armó n ica del oído (j ohnson y Gierke, 1974) . El
filtros HRTF). 8 La figura 2 permite aprec iar, junto a estos umbrales, el co rres- límite para situacio nes normales parece ser de alrededor de 16 Hz, frecuen cia
pond iente al mínimo campo audible binaural (MAF bina ura l), que es alrededo r cercana a la más baja que produce un a sensac ión clara de altura to na l.
de 2 dB menor que el mon oaural. En la prácti ca clín ica los umbrales se toman co n relación a los con sidera-
Se cons ideran sujetos con aud ición norm al aqu ellos que presentan um- dos "estadíst ica mente normale s" y se miden en niveles de umbral (HL) : un um-
brales de hasta 20 dB por enc ima de la curv a ant erior. Para frecuencias supe- hral de 40 dB HL a 100 Hz sign ifica que está 40 dB por encima del umb ral
riores a los 1.000 H z las diferen cias in rerindivi dua les son apreciables. normal a dicha frecuen cia. En el aud iograma de la figura 3 se puede n ver los
Es notable la semejanza de forma que existe ent re la sensibilidad del oído niveles de umbral HL para ambos oídos.
derivada de los filtros del sistema auditivo periférico (figura 30 de l capítu lo 1) y La sensibilidad del oído human o a la int ensidad es destacable tanto en t ér-
la inversa de la curva umbral que acabamos de presentar. Ad emás de proporcio- minos absolutos como en términ os del rango de valores al que respond e (del
nar la identificación puntual de la causa de cada reson an cia y de cada factor de orde n del billón de veces entre la máxim a y la mínima int en sidad percepti ble,
pond eración espectral, la semejanza aludida permite supone r una codificación " del millón si lo medim os en presiones acús ticas }." El moti vo de semeja nte
espectral "plan a" en los n iveles superiores de procesamiento neural, a partir del ¡;lIlgo hay que buscarlo en el conjunto de son idos habitu ales en los tiempos en
flujo de información que asciend e por el nerv io auditivo. Así, podem os inferir l.,s que estas ca pacidades se fijaron biológicam ente. La gran sensibilidad ant e
que tanto la sensibilidad máxim a del oído alrededor de los 3.000 Hz, como la ('sl únulos minúsculos, del orden del dec ibel, nos permitía oír por ejemplo el an-
ca racte rística de filtro pasa altos que presenta hasta los 5.000 Hz, se origina n dar distante de un depr edador o de una pequeña presa. En aquellos t iemp os
principalmente en la reson ancia acústica del co nducto auditivo externo. r.uuhién exist ían estímulos de gran ene rgía, com o el son ido de un truen o o de
8 Funciones de tra nsferenc ia relati vas a la ca beza (Head Relared Transfer Func uons) . " En números, un a relac ión de 10 12/ 1 en intensidad, o de 106/1 en presión acús tica.
58 59
-10 120 r-r-1r--"F;¡:nrrr--r--r"-rrrTTr---'~,......,r-rrn...,..,
r-- >---
~
R t>
/-.
><
O ................0:~.;.;.:.::~~)l
................ ~ ~ f- .... 110
100
<-------3
~~~>:.,
- -- - ---~ ~
Í'
10 ................... ................... ...~.~.~.~.:.:::."I -,
[-<...... ......... ........ ......... ....... 90
ro <,
<,
ro SO
~
20 ................... ................... ................... ......... ........ ....... ....... ~ 70
\~
T§ El 60
.o o oe
E 30 ...................
Oído dere cho .......... .................. ....,.... ...... o 50
::J / ,,'
Q)
"O X Oído izquierdo :~' '">
Q; 40
Q; 40 ................... .......... ,........ .\. ... ........ .......
30
- Z
>
Z
Oíd o normal
"\ (./-·:7J... ......... ...... 20
50 ................... ---_. Deterioro causado ...... ..\~ 10
60 ...................
- - ~F"'O'T,, ~~r ......... ......... ........ ....... O
60 61
rno ya sabemos, este máximo de sens ibilidad se or igina en la resonancia del exac tam ente una esca la logar ítm ica similar a la paut ada en la esca la de decibe-
conducto aud itivo externo . les: un estí mu lo de SOdB deb ería tener una sonoridad dob le que uno de 40 dB.
• Si se gene ra un a señal sin usoidal que recorra completamente una de las O qu e a cada ad ición de 10 dB le debería cor respo nde r un paso siemp re igual
curvas de igual sonoridad se oye un glissando perfecto, de sono ridad consta nte . en sonor idad. Como veremos a con tin uación , nu evas mediciones psicoac úst i-
U na co nsecue nc ia de las cur vas is ófo n as, muy co mún en el ca mpo de la cas refut aron estas afirmac iones.
mús ica, es el con tro l de sonoridad --o loudness- que poseen algunos prea rnpli-
ficadores de audio. Las grabaciones de piezas de música se realizan por lo ge- La sonoridad
ne ral a n iveles altos, donde la sens ibilidad del oído es plan a. S i se reproduce n
a n iveles menores cambi a el ba lanc e espectra l al ca mbiar nu est ra sens ibilida d A pesar de qu e las técn icas qu e emplean al oído co mo un detector de cero -co-
auditiva: o ímos debi litadas las regiones más graves y agudas del espec tro . Para rno la de compara c ión de sono ridades- han prob ado ser útil es en la determi-
cor regir este efecto algun os equipos de aud io vienen equipados con un co ntrol nación de los facto res que afec tan la sono ridad, no proveen un a med ida
de sonoridad qu e refuerza los extremos del espec tro a bajos n iveles de ampli- d irecta de la sensac ión percibida. Uno de los procedimientos empleados pa ra
ficac ión . La salida del pream plificador co n el contro l de sonor idad ac ti vado si- resolve r el prob lem a fue aplicar la técnica de estimación de magnitudes, en la
gue de mod o más o menos fel iz la curva umbral de aud ibilida d. que el oye nte debe simplemen te asigna rle un n úmero a cada son ido de d ife-
rente intensidad. Una alte rnativa co ns iste en emp lear la técnica de producción
Escala absoluta de sonoridad de magnitudes en la qu e, a la in versa, el oye nte debe ajusta r la in ten sidad de un
estímulo de acue rdo a un número dado de antemano. Durante la décad a de
El n ivel de sonori dad en fones toda vía se refiere, sin emba rgo, a la seña l físi- 1950 Steve ns empleó ambos mét odos para desarroll ar sus esca las de sonoridad,
ca . Só lo proporcio na un a esca la co mpa rativa y no perm ite descr ibir la sono ri - que descr iben la relac ión entre sonoridad - pe rcep tua l- e int en sidad - física-
dad prop iam ente d ich a. ¿Cuán to más sonoro es un son ido de 70 fone s qu e uno (Stevens, S. S. , 1959) . Los prob lem as met od o lógicos que encon tró fueron
de 50 fones ?Con los elem entos ha sta aquí evalu ados no se puede dar respues- muy gra ndes pues resulta d ifícil cuan tificar la so nori da d que es, co mo ya sabe-
ta a esta pregunta. H ace falta definir un a unidad auté n t icamen te perceptua l, mos, un a magnitud en te ramente percep tual. S teve ns tu vo qu e defini r un a
que per mita medi r la magn itud de las percepciones en sí mismas y no con re- nueva unidad , el son, para cuan t ificar d irect am ente la sonoridad. El son es, fi-
lación a referencias externas. nal mente, un a un idad lin eal : un soni do de 2 sones posee el dobl e de sonori-
dad que un o de 1 son, y un o de 3 sones e l tri ple. A l igual qu e la altura, la
La ley psicofísica sonor idad es un a magnitud perce ptu al y de bería definirse a partir de un a un i-
dad de referencia estab le. Pero com o la esta bilidad en el ca mpo de las sensa -
Este problema se enca ró in icial mente en la segunda mi tad del siglo XlX. Los fi- ciones es muy poco confiable, se tom a un a referen cia física exte rna: una seña l
sió logos alema nes W eber y Fechner propu sieron una ley psicofísica que pre- 1.000 Hz y 40 dB (40 fones) produ ce por defini ción un son ido qu e posee un a
tendía vincular los est ímul os co n las percepciones a través de un a relaci ón SI mon dad de 1 son (para la a ltura también se tom a una referencia física ex te r-
común a todos los sent idos . Esta ley fue co nside rada ade cuada y se la reprodu- un: 440 Hz definen el La en m úsicaj .l ''
jo en la mayo ría de los tex tos especializados hasta no hace much o t iemp o. A partir de los trabajos de Steve ns se encon tró q ue la relación estí mulo-
Aunque dio lugar a un a varieda d de técnicas y un idades de medición entre las rvspuesta sigue aprox imada mente un a ley de potencia, diferente a la ley laga-
que se enc uentra el decib el, en la mayorí a de los casos no es ni apro ximad a- I (u n ica de los psicofísicos. Propu so la siguiente relación ent re la sono ridad (S)
men te co rrec ta. La definición más difundida de la ley psicofísica estable ce que y la intens idad (1):
la magn itud psicológica percibi da es prop orcional al logar itm o del estímu lo fí-
sico. Es dec ir, que multiplicaciones sim ilares en la magn itud del estímulo ge- s = k [ 0,3 [son es]
neran adic iones prop orc ionales en la respuest a perc eptual, transformand o un a
esca la geomé trica en un a escala aritmé t ica. En el caso del son ido , lo an ter ior 1" El co nt exto es aquí de gra n impo rta nc ia. 40 fone s originan un son ido de 1 son só lo si en
sign ifica simplemen te que nu estro s juicios sobre la sono ridad deben seguir 1"" instantes prev ios el oyente se enc uent ra en un ambie n te ex tremada mente silen c ioso .
62 63
20
El valor de la constante 1< depe nde de las cond iciones experimentales y de las
10
unidades empleadas. El gráfico de la figura 5 muestra la relación de S tevens (n o
5
hay que olvidar que es consecuencia de exper imentos realizados con ond as si- 2
nusoidales y no con est ímulos complejos). Se puede observar que a un aumen-
(ñ
to de 10 dB en el est ímulo le corresponde una duplicación de la son or idad . g 0,5
A unq ue la relación anterior ha sido ratificada para seña les mayores a 40 dB, .e 0,2
"O
se le hacen varias crític as: existen diferencias individuales muy grand es, y el re- ~ 0,1
sultado se obtuv o a partir de medias de poblaciones muy grandes y dispersas. 0g 0,05
Warren encontró que la duplic ación de la sonor idad corresponde a un aumento e5l 0,02
de la int ensidad de 6 dB, en vez de los 10 dB de Stevens (Warren, R. M., 1970). 0,01
Además, aunq ue las técnicas de estimación y de producción de magn itudes tie- 0,005
nen la ven taja de permit ir la obtenci ón de una relación directa ent re un paráme- 0,002
0,001 L.J._ _ ~ .J
tro físico y un rasgo perceptual, a diferencia de la técn ica de comparación de O 20 40 60 80
magn itudes, ambas asumen que los oyentes pueden usar los números para califi- Intensidad (dB)
car sus percepciones de un modo cons iste nte. Existen varias razones que permi-
Figura 5. Relac ión de Steve ns ent re int en sidad y sonoridad
ten suponer que esto último no siempre es así, que los oyent es polarizan y sesgan
sus juicios de estimación acerca de la son oridad que perciben . Sin embargo, asu-
miendo que el riesgo existe y extremando los cuidados metodológicos, la técnica compensación "A " sigue de man era aproximada la curv a de respuesta del oído
dc estimación de magn itud es es usada ampliamente para medir la sonoridad. para un niv el de sonor idad de 30 fon es, en compensac ión "B" la de 70 fones, y
Existe una objec ión aún más impor ta nte: algunos auto res desaprueban el Vil compensac ión "C" es práctic amente lineal. Cas i toda la normati va relacio-
hecho de preguntar por la sonoridad en sí misma. De ordinar io, evaluamos nada con acústica ambien tal está especificada en decibeles A . Por ejemplo , el
ciertas caract er ístic as de las fuentes acús tica s co mo un todo que invo lucra al nivel equivalent e de ruido aceptable en zonas residenciales no debería superar
contex to, a la perspect iva y a muchos otros factores circunsta nciales. La est i- los 65 dBA en horarios de actividad diurna ni los 50 dBA durante la noche.
mación aislada de la sono ridad parece una abstracción muy difícil de rea lizar. Si se tom an dos lectu ras de una misma seña l, una en dB lineales y otra en
Helmholtz escribió: "[oo.] estamos muy bien entrenados para eva luar los obje- .IBA, por lo general la últ ima da rá un valor inferior pues se filtran las bandas
tos que nos rodea n, pe ro fallamos completamen te cuando inten ta mos obser- ,:raves del espec tro de ruido.
var las sensaciones per se [oo.]" (Helmholtz, H . va n , 1885).11 Los medidores de n ivel sono ro, sin emb argo, sólo son confi ab les cuando
~! ' los emplea para med ir seña les co nt in uas de larga dur ación. Las respuestas
Medidores de nivel sonoro I\(' rceptuales ante seña les impulsivas o muy cortas no corresponden a la mag-
nirud que indican. Los med idores tampoco proveen lecturas sat isfacto rias de
Los instr umentos de medició n más tradicio nales en acústic a son los medidores 1;1 sonor idad de est ímulos compuestos muy separados en frecuencia. Y, por su-
de nivel sonoro.V que permiten det erminar el nivel de presión sonora . Por lo ge- puesto, no está n ca librados en sones, la uni dad que debe emplearse para eva -
neral, tie nen un banco de filt ros en la etapa de entrada que permite med ir la luar la sonoridad propi amente dich a.
señal acústica tal co mo llega al micrófono - respuesta.p lana o lineal- o com-
pensada según cierto pat rón espectral. Así, un medidor de nivel sonoro en Sumario de unidades relacionadas con la sonoridad
ll c.un ino que nos llevó de la amplitud de las ondas en el aire a los sones es co rn-
1I Traducción de GB. Hermann Ludwig Ferdinand van Helmho ltz ( [821·[ 894 ) fue un cien-
I,I! 'jo Y se podría suponer de una dificultad inn ecesaria. Sin embargo, la aut én-
tífico alemán de destacada actu ació n en el campo de la fisiología, la ópt ica, la acústica y la
electrod inámica. I jl :1 complejidad está dada por la multipl icidad de mecanismos que act úan en la
12 Co noci dos popularmente como "decibelímetros". I od iíicaci ón auditiva de la int ensidad. Para ilustrar esta situac ión volvamos a las
64 65
curvas isófonas de la figura 4: se las esque matizó en dos dimensiones -nótese que
no aparece la dimen sión sonoridad- , pero en realidad deberían haber sido repre-
senta das en tres dimension es. En la figura 7 se puede ver una porción de la re-
presentación trid imension al, más adec uada pero mucho más difíci l de leer.
Para sin te t izar e l camino q ue llevamos recorrido, la siguien te tab la enu-
mera las diferentes un idades relacion adas con la sono ridad, co n sus unid ades
y carac te ríst icas part iculares.
Tab la 1. Magnitudes relacion adas co n la sono ridad (pa ra ondas acústicas plan as)
Lim en de intensidad
13 JND, del inglés just IlOticeable difference. I-I\'"r;, 7. Representación tridimension al de las cu rvas is ófonas
66 67
En todas ellas 1 es la int ensidad de la seña l de base (el pedestal) y L'lI la int en- 8 kHz
sidad del menor incremento detectable por el oyen te. 1,5
Para med ir el limen de intensidad se emplea con frecuencia el método de ¡¡¡
elección forzada entre dos alternativas (2 AFC) , en la q ue cada sujeto de be op - ~
a. 1,0
tar obligator iament e por alguno de los sonidos q ue oye, aún cua ndo le parez- <!
o
can indi stinguib les. El umbral de discri minac ión se obtiene cua ndo la 0,5
diferencia L'lI en e l est ímulo prod uce el 75% de respuestas correc tas. Esta téc-
nica se ap lica a part ir de tres métod os prin cipales: método de detección de
modul ación , de det ecci ón de incrementos y de discriminación de estímulos 40 60 80
pulsantes. En la detección de modulación los oyentes deben not ar la presenc ia Nive l de intensidad sonora
de una peq ueña modulació n en amp litud en una seña l dad a. En la detección de Figura 8 . DAP en int en sidad
incrementos y en la discriminación de estímulos pulsantes deben percibir un cam-
a) b)
bio en la intensidad de un est ímulo está nda r (e l pedesta l). r--- - - - - - - ---,
100 _ Le y de Web er ·4
.. .. Desvio
La Ley de Web er
80 ·6
.'
Para ruido de banda anc ha se co mprobó que el mínimo cambio de int en sidad ~ 60 ~ ·8
el
det ectable es una fracc ión constante de la intensidad del estí mulo. En otras pa- .Q
el
o
o 'O 0 .10
labras, la razón L'lI/I se mantiene con stante. Éste es un buen ejemplo partic ular
de la con oc ida Ley de Weber, que establece que nu estro sistema perceptivo dis- 20 ·12
crimina cambios porce ntuales con stant es. La relación L'll/l se llama fracción de
·14
Weber y es habi tualmen te expresada en dB como L'lL = 10 log (MIl). En el ran -
20 40 60 80 100 20 40 60 80 100
go de 20 a 100 dB el valor de L'lL permanece entre 0,5 y 1 dB. Ce rca del um- 1010g(l )
1010g(l )
bral de audibilidad la fracción de Weber aumenta drásticamente, en part icular
a frecuencias po r deba jo de los 200 Hz. Fi ~ura 9. Ley de Weber y desv ío de la Ley de Weber para est ímulos sinusoida les
68 69
Ley de Fechne r para la sonoridad
Como ya sabemos, la sonor idad es el correlato perceptual de la in ten sidad físi- donde lL es el umbra l para un pul so de larga duración y r es un a co nsta nte
ca, al men os en una pr imera aprox imac ión . Podemos suponer, por lo tanto, la que repr esenta el "t iempo de integración " del siste ma aud itivo . La relación
existencia de alguna relación ent re la discriminación de la sonoridad y la habi- an te rior es válid a sólo para inten sidade s ce rcanas al umbr al. Lejos del mismo
lidad de los oyentes para det ect ar diferenc ias de int en sidad. La Ley de Fech ner no se puede asegurar la form a que ado pta la integración de la en ergía, So la-
va un paso más allá proponiendo que la fracc ión de Weber, !ll/l, está asociada mente se puede decir que, para una int ensidad dada, la sonoridad crece has-
a un inc remento const ante de la sonoridad !lS (Fechner, G., 1860): ta los 200 ms de dur ación . Para menos de 80 ms de dur ación se puede afirmar
que, aprox imada men te, energía cons tan te = sonoridad constan te. Aqu í la frac-
LlS = k LlI/ [ ción de Weber disminuye 3 dB cada vez qu e se duplica la dur ación del estí-
mulo. Más allá de un a cierta dur ación crít ica Ar la fracción de We ber deviene
en la que k es una constante. Aunque esta relaci ón fue defendida dur ante más constante. Para dur acion es mayores a 500 ms los umbr ales son independien -
de un siglo, se ha com pro bado que es incor rec ta, tal co mo advertimos antes, tes de la dur ación .
en este mismo ca pítulo (Zwislocki y [ord an, 1986 ). El va lor crí tico !lt es función de la frecuenc ia: decrece al aumenta r esta
últ ima y to ma valores que van desde 100 ms a 250 Hz hasta 10 ms a 4 kH z. A l
parecer, int egramos mejor los impulsos de alta frecuencia.
4. O TROS FAcrORES QUE INTERVIEN EN EN LA PERCEPCIÓN DE LA SONORIDA D En el órgano de tubos no se puede mod ificar la inten sidad de cada son i-
do porque las teclas sólo abren o cierran las válvu las que distr ibu yen el flujo
Integración te mporal de aire. S in embargo, la int egración temp oral a ene rgía constan te le permite
al organ ista modul ar agógicamente la sonor idad, actuando úni cam ente sobre
Garner y Miller enco ntraro n q ue el umb ral de audición de la sonor idad corres- la du ración -al menos en los pasajes veloces.
ponde más a un a ca nt idad const ante de ene rgía que a una can tid ad consta n-
te de potencia - o de int ensidad-, al men os sobre cierto ran go de dur acion es Factores espectrales
(G arner y Miller, 1947) . Tiemp o después, Hen ni ng descubr ió q ue para estímu-
los de corta dur ación la ene rgía del men or incremento det ect able (!lE) se En un ex perimento desarrollado en la década de 1950 , Zwicker, Flottorp y
mantiene constan te , contra la creenc ia generalizada de la constanc ia de la in- Stevens le pidieron a un grupo de oyentes que igualasen la sonor idad de una
tensidad .!" banda de ruido con la de un to no sin usoida l está ndar (Zwicker, Flot torp y S te-
En 1995 Moore co mpro bó que para dur acion es men ores a 200 ms la in- vens, 1957) . Los autores concl uyeron que si la sonor idad en cada band a críti -
tensidad necesaria para la det ección del estímulo se incrementa a medid a que ca sigue la ley de la pot encia S = k [ 0,3, al distribuir la misma int ensidad de la
la duración disminuye (Moore, B., 1995) . Pareciera que el oído integrara la señal en n band as crít icas se debe obtene r un incremen to en la sonor idad to-
energía de la señal: ral simplemente porqu e:
En la que [ es el umbr al de intensidad para un pulso de du ración t. En la prác- En la actualidad se realiza el siguien te aná lisis para calcul ar la sono ridad tota l
tica la siguiente expre sión da mejores result ados: de un conjunto de est ímulos sinusoida les combinados.
1. Nunca se suman los niveles de presión sono ra o los niveles de intensi-
14 G . B. H enning (19 70) . Este hech o ya había sido nota do por Exner en 1876: "Tam o [os dad direct amente: dos est ímulos de 80 dB jamás gene ran juntos 160 dB.
umbra les absolutos en sonor idad como la sonoridad en sí misma depend en de la duración 2. Si se desean sumar señales de frecuencias cercan as - amb as dentro de la
del est ímulo." misma banda crí tica- se deben sumar en prim er término las intensidades efi-
70 71
caces, pues la in fo rmación de fase no es relevante. 15 Con este resultado se pue-
30 ~------------1
de ob ten er el nivel de intens idad en dB . A continuación se extrae de las c ur-
vas isófonas (figura 4 ) el n ivel de sonoridad en fones y, por fin, de la relación
25
de Stevens (figura 5 ) se ob tiene la sonoridad tota l. Po r eje mp lo, si se suma n
do s seña les de 100 y 120 Hz co n e l m ismo n ivel de inten sidad de 80 dB, el re- <ñ 20
sultado da un NI de 83 dB, equivalentes a 77 fones q ue correspo nd en aprox i- Q)
<::
o
madamente a una son o ridad de 12 sones . :; 15
ce __.. __ __. .. .. . __ _
3 . S i se des ea sumar señales de la m isma frec uencia el procedimiento es "O
simi lar, pero en pri me r luga r deben suma rse las amplitudes por q ue aquí la in-
s
(l)[[nación de fase resulta decisiva al aparecer el fenómeno de interferencia de S 10 . Sonoridad de cada señal (13 sones)
o nda s: dos señales de 80 dB de la misma frec uencia puede n dar lugar a un a 5 _ _ Sonoridad combinada
co mbinación cuyo nivel tenga entre O y 86 dB (Bas so , G ., 200 1a).
4 . S i la d ifere nc ia de frecuencia en tre los estímulos supera un a banda cr í- o L,--,---,- - - , , - , - ¡ - ¡ - ¡ - ¡ - ¡ - ¡ - ¡- j
rica, en la práctica es usua l sumar directamente las sono ridades en sones . Sin 024 6 8 10 12 14 16 18 20 22 24 26
e mba rgo, e l escenario es algo más complicad o, y sigue la curva de la figura 11. Separación de alturas en 1/12 de octava
5. Si los est ímulos están m uy separados en frec uenc ia, en más de tres oc -
lav as, se co mpo rtan indepen die nte men te uno del .o tro y no p uede ha blarse Figu ra 11. So nor idad co mbinada de dos siuusoides de l3 sones cada un a. La frecuencia de
C( In pro pieda d de un a verdadera sum a de sono ridades. la señal base es de 300 Hz
il~~
sonora de 85 dB.
Observamos que la sensibi lidad auditiva se recupera tota lmente sólo 48
horas después de la supresión de la fuen te de ruido. Si una persona, por ejem-
plo, reac tiva la fuente a las ocho horas de haberla suprimido, su umb ral desde
Tiempo (s) el reinic io será 10 dB mayor que .e! norm al a ca usa de la fatiga auditiva, obl i-
gándola a aumen ta r 10 dB la potenc ia de la fuente acústica para alcanzar e!
11~t:::: ~
nivel deseado: su oído verá multi plicada por diez la ene rgía recibida. Este pro-
ceso puede realimen tarse varias veces hasta alcanza r niveles capaces de provo -
car daños no reversibles. Algunos de los mecani smos fisiológicos involucrados
en la pérd ida temp oraria de la audició n son los mismos que producen la pér-
Tiempo (s) dida permane nte de la capac idad audit iva. La diferencia es sólo una cuestión
de grado .
il__ r----
I
Tiempo (s)
. 1
En la actua lidad (nor mas ISO ) se consi de ran seguros ni veles de ha sta 85
dBA, ocho horas por día. A part ir de este va lor a cada incremento de +3 dB
en la in tensidad de! estímulo le corresponde un a disminución a la mit ad de!
tiempo de ex posición per mitid o. l ? Por ejemplo, si se aplica esta regla una per-
sona podr á expo nerse sin riesgo auditivo hasta dos horas por día a un nivel
fl-oo---t:- ,~
contin uo de 91 dB. En algunas norm as se est ipula un n ivel máximo, por ejem-
plo 115 dBA, que no debe superarse en ninguna circunsta nc ia.
Tiem po (s)
16 Del inglés Temporary Thre$holdShifr.
17 Ya no se emple a la "regla de los 5 dB" propiciada por ciertas industr ias.
Figu ra 12. A dap tación auditiva (gráficos esquemáticos )
75
74
aumentar el intervalo tempor al entre a mbas seña les y de saparece luego de un os
iD poc os cientos de mili segundos. El efec to es mayor si los dos est ím ulos tienen la
~ 15
~
m isma frecu encia y si son expuesto s al mism o oído (o a los mismos oídos ).
.o
E
:J
Patologías auditivas
Los efec tos del ruid o sobre el sistema aud it ivo humano se pueden di vidir en
des plazam ien tos tempora rios del umbral de aud ibilida d (p érdid as tem pora rias
11Il:l'cltl cn w de la sonoridad o reversibl es, TIs ) yen despl azam ientos perm anentes de dicho umb ra l (pér di-
das permanentes o irreversibles, PTS) .19 Estos últ imos pueden ser causados por
la destrucción inmediat a de las estr uc t uras físicas del oído, en cuyo caso esta -
I!ll co n rrnstc co n la redu cci ón de la sono rida d
. l '
ducid id
pro UCI a por SO Ill os pre sent
suuu rnneam enre co n el son ido de prueba (enm iento) I . es mos en presenc ia de un trauma acústico, o por el efec to ac umu lat ivo de suce -
asca ram len to os son idos qu e sivas expos iciones durante un per íodo relativamente pro longa do .
:Ip:lrl'cell a n tes del de prue ba pueden a veces produc í . '
. l i S' . ucir un mcremento en su so-
I H)I"I( al , I el pnmer estímulo es por ejernpl o 20 dB _ . I
1 l ' ' , mas mtenso qu e e segun -
1 o , os cxperune n ros muestran qu e este último pued . . 18 La palab ra "desborde" no es una traducción literal de "overshoo t" (exceder, rebasar, so-
I I . e m crementar su sonorlda d
J:lsla a eq uIvalente a un aume n to en intens ida d de 15 dB El e d brepasa r), pero creemos que describe mejor el fen óm en o alud ido.
. electo ec rece al 19 Del inglés Pennanent Threshold Shift.
76
77
Condición Umbral 50 .,-- - - - - - - - - - '71
40 horas semanales
durante 10 años
a) Bajo _ 40
en
:3-
ro
Alto 'g 20
E
ro
'C
e) - Bajo ~
o(J) 10
a.
Bajo
O-fC-- - - - ---r- - - ---;
80 90 100
Alto Nivel sonoro en dBA
- --- -
\
\ al 10
:3- 20
l'érdida /Jcm tancntc de sensibilidad ro
'6
ID
E
30
__ 5 años
,
ro 40 \
Las pérd idas auditivas permane ntes puede n dividirse en dos grandes grupos: 'C
~ 50 \
las cond ucti vas y las sensone uralcs (o percep tuales). Las co nd uctivas llevan a o(J)
a. GO
- - - 35 años ...
.. - - - - ~
1111 alimen to en el umbral más o menos parejo en func ión de la frecuenc ia,
70
mientras que las sensoneurales son más complejas . 125 250 500 1000 2000 3000 4000 GOOO 8000
El co nocimien to que posee mos del desplazamiento perman ente de l um- Frecuencia (Hz)
lirnl de audibilídad o PTS se basa en estud ios rea lizados en industrias y en ex-
Figura 17 . Pérdid a perm an ente de aud ic ión en fun ción de l período de exposic ión
peri men tos con ani males. De ellos se desprend e que existe una relación
aprox imada mente lineal entre las pérdidas de sensibilidad y el n ivel sonoro de
la ex posición por encima de los 85 dBA, ta l co mo se observa en la figura 16. la ene rgía en frecuenci as relati vamente bajas: las personas acude n al médico
Se considera que los n iveles infer iores a 80 dBA no prod ucen efectos nocivos. sólo cuando tien en dificultades en la comun icaci ón oral, etapa en la que el
La relación entre el tie mpo de exposición y la variación espectral de las proceso ya mani fiesta un gran ava nce .
pérdid as es más compleja. Es comú n que apa rezca dur ante los primeros años En las figuras 18 y 19 se pueden ver microfotografías de la membrana basilar
una disminución de la sensibilidad a lrededo r de los 4.000 Hz, ampliándose en las que se aprecia el deterioro que sufren las células de Co rti a causa del ruido.
co n el co rrer del t iempo ha sta oc upar la banda co mprend ida entre los 3.000 y
los 6.000 Hz. Este proceso se muestra en la figura 17. Reclutamiento auditivo
Vernos que las frecu enci as más altas (entre 3.000 y 4.000 Hz) son afecta-
das en los primeros añ os de exp osición, mientras que las men ores (entre 1.000 El reclutamiento auditivo ocurre cuando el umbr al de audibilidad de una perso-
y 2.000 Hz) son alcanz adas con pérdid as sign ificativas al cabo de 20 años o más. na está por encima del norm al, pero su audici ón es normal a altos niveles de
En los gráficos de las figuras 16 y 17 se ve con claridad que e l oído es má s sonoridad. En el sujeto con reclutamiento, la sonor idad aumenta más rápid a-
sensible, y por lo tanto más frágil, en la región de altas frecu en cias que en la mente con la inten sidad de lo que ocurre en un oyente con oído promedio - al
de bajas. Este he cho es el causante de la det ección tardía de la hip oacusia pro- men os en las frecuencias afectadas. Se podría asimil ar a una suerte de compre-
vocad a por ruido, dado que la inteligibilid ad de la palabra hablada depend e de sión del rango de sono ridad .
78 79
Moore relacion a el reclutamiento auditivo con un dañ o en las cé lulas ci- S. CODIFICAC IÓN DE LA INTENSIDA D
Ijadas exte rnas de la membran a basilar, que impid e la correct a cod ificación del
rallg(l din ámico del estímulo acústico (Moore , B., 1997).
El estudio de la codificac ión de la intensidad t ien e por objet ivo exp lica r la
fo rm a qu e tiene el oído de informarle al cerebro sobre cuán intenso es un es-
t ímulo. 0, más específicamen te, por la man era en qu e se configura la repre-
sentación mental de la int ensidad física de una seña l a partir de la ac t ividad
de las células nerviosas del siste ma audi t ivo. Se ha verificado que la cod ifica-
ción de la intens idad está vinc ulada di rectam ente co n nu estr a habilid ad pa-
ra discriminar entre estímulos de d iferente intens idad. Si podemos dis tingu ir
entre dos sonidos, la dife renc ia debe esta r representada en todos los n iveles
de la cadena aud itiva , desde la cóclea hasta los ce ntros superiores de decisi ón.
Los experimentos de d iscri minación de la intensidad son , por lo tanto, la he-
rram ienta base para c rear modelos de codificac ión de la inten sidad .
U n primer modelo, muy simplificado , establece q ue la int ens idad de un
\ est ímulo sinusoida l es codificada simplemente por la tasa de disparo de las fi-
hras de Co rti sinton izadas a la frecuen cia del est ímulo: a mayor inte nsidad ,
mayor cantidad de disparos por unid ad de tie mpo. Este modelo, sin embargo,
presenta var ios incon venientes.
JOi,:ura I H. Cé lulas de Con i en un o ído sano Co mo hemos visto, el sistema auditivo h umano es capaz de detectar diferen-
cias en la int ensidad de los estí mulos sob re un gran rango din ámico, ta n gran-
de co mo 120 dB en oyentes co n oído sano. La mayor ía de las células nerviosas
audit ivas, aque llas que present an una tasa de disparo relat ivamente alta, tie-
nen bajos umb rales de excitación y ran gos dinámi cos co mpara t ivamente pe-
queños. Casi todas se satu ran al llegar a una int ensidad de aprox imada mente
60 dB cuando son esti muladas a sus frecue nc ias característ icas. La proporció n
de fibras en e l nervio audi tivo q ue present an un amp lio rango di námic o (60
dB o más) es muy baja , de alrededor de l 10% del total. Por lo tanto, se supo-
ne que interviene más de un mecani smo dife rente en la discrim inaci ón de la
intensidad. Los cambios en intensidad pod rían ser codificados por cambios de
la tasa de desca rga de las ne uro nas que ocupan el ce ntro de l patró n de exc ita-
ción , por una extensión del patrón de exci tac ión (más neuron as entra n en
operación ), o por una combinación entre ambos mecan ismos. La sensibilidad
a la fase tambi én parece int ervenir en el proceso .
La importa nte Ley de Weber para ruido de band a anc ha, que cont inúa ac-
tuando para altas int en sidades, debe proven ir de la operación de l siste ma audi-
tivo, no de propie dade s estadísticas de l estímulo. Pero no se puede exp licar a
JOi,:u ra ) 1). C é llll:.s de Corri en un oído dañado por ruido
partir de la infor mación cod ificada por una sola neurona por los motivos antes
KO
81
apunt ados. Es nece sario enco nt rar un model o que combine la tasa de disparo las siempre en la zona de actividad, lejos de la saturación. Estamos famili ari-
de un número pequeño de neuronas, cuyos umbrales y cambios dinámicos es- zados con algo similar, el contro l automát ico de gan ancia en la vista, que nos
tén esca lonados de man era tal que permitan cubrir el rango dinám ico total del permite ver bien tan to a pleno sol como en la relati va oscuridad de un cine.
siste ma auditivo. La informació n de las neu ron as que respond en a frecuencias En el caso de la vista la recuperación es bastante lenta y necesitamos un buen
ca racterísticas similares podría combinarse y operar en un "cana l" indep en- tiemp o para adapta r nuestra sensibilidad al pasar de una situa ció n lumínica a
diente. La ley de Weber parece responder a cada un o de estos cana les, sinton i- otra diferente. En el caso de la audición, sin embargo, tenemos que ser capa-
zado a un rango de frecuencias dado y en paralelo con los demás. ces de procesar sonidos que varían dramáti camente en inten sidad sobre un in-
Buscando una respuesta a est e probl ema, C arlyon y Moore sugirieron que tervalo de tiempo muy breve: nec esitamo s disponer del ran go dinámic o
en la codificació n periférica intervienen neu ron as de diferente umbr al de dis- completo "a l instante".20
paro : a int ensidades moderadas int ervienen las neuronas de bajo umbra l, lue- La supresión es un proceso no lin eal en el cual un a inte nsa exci tac ión en
go éstas se saturan y son reemplazadas paulatinam ente por las de alto umbr al una región de la membrana basilar reduc e la excitación en las region es veci-
de disparo (C arlvon y Moore, 1984) . En la misma direcci ón , Delgut e indic ó nas. Al tener una con stante de tiemp o muy pequeña ocurre solamen te cuan-
que son pocas las neuronas necesarias para dar cuenta de la discriminación en do se presen ta n simultá nea mente el estímulo supresor y el suprimido. Es
inte ns idad (Del gute, B., 1987). Según este autor, el número requ erid o es de posible que el mecani smo que prod uce la supresión ac túe tam bién com o un
aprox imadamente 100 neuronas. Si se extiende esta conclusión a la totalid ad con tro l automáti co de gana ncia para est ímulos de band a ancha, y ayude a dar
de las célul as que oc upan la cóclea, la discriminación deber ía ser much o ma- cuenta del gran rango dinámic o del siste ma auditivo .
yor que la que ten emos (podría ser de menos de 0,1 dB a 1.000 Hz). De ser
cierta esta hip ót esis, la lim itación no depend ería de la información que tran s- Codificación por sincronización neural
porta el ne rvio audit ivo sino de los nivel es centrales de procesami ento.
Carlyon y Moore sugiriero n que, en ciertas circunstancias, la int ensidad pue-
Codificación por extensión del patrón de excitación de ser cod ificada por la estruc tura de seguimiento de fase en las cé lulas audi-
tivas: un incremento en la int ensidad de un est ímulo sinusoidal en presencia
Una explicación posible para la aparente paradoja es que, al men os para estí- de ruido puede gene rar un aumento de la ca nt idad de células sincron izadas
mulos de band a angosta , la información sobre la int en sidad se obtiene ta mbién con la estructura fina del est ímulo, diferente de la del ruido (C arlyon y Moo-
de las cé lulas auditivas sint on izadas a frecuenc ias por encima y por debajo de re, 1984) . Los experim en tos mostra ron , sin emb argo, qu e este mecani smo por
la frecuencia del estímulo. A pesar de que las células correspond ientes a la fre- sí solo no pued e ser respon sable del gran ran go din ámic o presente en el siste-
cuenc ia del estímulo se satu ren, las que tien en frecuencias centrales diferentes ma audi t ivo.
reciben men os excitac ión y continúan dentro del rango de funcion amiento. Se
ha sugerido que estas célul as "fuera de frecuencia" son las respons ables de la co- Modelos basados en funciones intensidad-tasade disparo
dificación a alt as intensidades (Zwicker y Fastl, 1990) . Sin embargo, los resul-
tados de los experimentos sobre enmascaramiento demostra ron que, a pesar de Una hipót esis diferente esta blece que las células de Cort i con altas tasas de
que la extensión lateral de la zona de excitación puede ayudar a discriminar a disparo son respon sables de la codificación a bajas intensidades, mientras que
altas intensidades, el sistema aud itivo puede codificar la int en sidad sobre un las cé lulas de Cort i co n bajas tasas de disparo se destinan a codific ar los estí-
gran rango din ámico emp leand o sólo la inform ación proveniente de una pe- mulos a altas inten sidades, por enc ima de la sat urac ión de las anteriores. Los
queña banda de frecuencias centrales en la membran a basilar. model os basados en esta hip ót esis se denominan modelos de doble población. La
principal dificultad que enc uent ran es la de explica r la constancia de la frac-
El papel de la supresión y de la adaptación
20Plack y Ca rlyon dan un muy buen eje m plo r. pode mos oír el grito: "¡El psicópata está
Una posible solución sería que el sistema aud itivo pudi era ajusta r el rango de bajando al co rredo r!", y a co nt inua ció n los débiles sonidos de sus pasos en la escalera
operación de las cé lulas de acuerdo al nivel de ent rada, de modo de mantener- (Moore, B., 1995).
82 83
ci ón de Weber a lo largo de casi todo el ran go dinámico . Esta d ificultad se in- Memoria de la intensidad
c rc rnc n ta al con stat arse que hay muchas más cé lulas con altas que con bajas
tasas de disparo. Muchos experimentos de discr iminación de la int ensidad emp lean secuenci as
En uno de estos model os de doble población se simularon las codificacio- en las que dos interva los de observac ión están sepa rados por un intervalo inter
ncs basándose en el núme ro de células necesarias para cubrir el rango dinámi- estímulo ( HE). La ausencia de un efecto sustancial de este interva lo en las ta-
co co mpleto a una frecuencia dada: co n sólo d iez cé lulas combinadas es reas de discrim inación ci tadas suste nta la hip ótesis de que los oyent es emplean
posible imita r al siste ma audit ivo (Vieme ister, N . E , 1988). Sin embargo , po- la memori a de largo té rmino para hacer las comparac iones ent re el prime ro y
sccmos más de 50 para la misma funci ón . Es decir, tenemos a la salida del ner- el segundo de los est ímulos. Un almacena miento en la memor ia de corto tér-
vio auditivo inform ación más que suficien te para cod ificar los est ímulos sobre mino debería decaer en el t iempo, generando un a gran dependencia con la du-
II n gran rango de intensidades. Qu izá la pregunta no deba ser, entonces, por ración del int ervalo inter est ímu lo. Como un eje mplo extremo , Pollack
qllé es tan buena la cod ificación a altas int ensidades, sino por qué no es me- empleó un HE de 24 horas y prácticamente no encont ró det er ioro en la tarea
jor de lo que es a bajas inten sidades. de discriminación de la int ensidad (Pollack , 1., 1953 ).
La memoria de largo término puede ser anu lada variando al azar, ent re
Límit es a la discriminación en intensidad pruebas, la int ensidad de los estímulos en los inte rva los de observac ión. C uan-
do esto ocurre, el éxito en las tareas de discriminació n de la in ten sidad baja
Hemos trazado los caminos que pueden servir para representa r la int ensidad notab lemente al aumenta r el HE. Por ejemplo, la fracción de Weber aumen ta
en el siste ma audit ivo periférico . A hora consideraremos el caso de los límites de 2 a 5 dB cuand o el HE crece de 250 ms a 8 s. Este ca mb io se debe, presumi-
impuestos por las transformacion es que ocurren en los ce ntros de procesa- blernente, al deterioro del almace na miento en la mem oria de corto término.
mien to neura!. En esta etapa debe incorporarse una descripción del mecan is-
mo que permite que las intensidades puede n ser almacenadas en la memor ia y Codificac ión de rasgos y codificación contextua l
de có mo [as limitaciones de la memoria afecta n los resultados en las tareas de
discrim inación . Durlach y Braida distinguieron dos modos dife rentes de operac ión de la me-
moria relacionada co n la discr imina ción de la int ensidad: la codificación de ras-
Limitaciones periféricas y centrales gos y la codificación conrextual (Durlach y Bra ída, 1969). En la primera son
almace nadas las sensaciones dire ctas -inmediat as- producidas por e l est ímu-
Los ex pe rimen tos reali zad os par a de terminar las car act er íst icas de la d is- lo, que tienden a decaer en el tiem po (son afectadas por la d uración del HE).
c riminac ión de la intensidad, para exc itac iones q ue ab arca n una so la fre- En el modo de codi ficación contextual, por otra parte, la int ensidad es codi-
cue nc ia ce n t ra l en la membran a bas ilar, arroja n resultad os contradi ctor ios. ficada en relación con una int ensidad de referencia exte rna o con relación a
Mie nt ras los modelos de doble pob laci ón sug iere n qu e la discr imi na ci ó n una referenci a int erna "fuerte", como el umbral de audibilidad o el umbral de
csl:í ca racterizada po r la fracc ión de Weber, los modelos fisiológicos predi- molest ia.
ce n mejor disc riminac ión a baj as y media s in tensidades q ue a gra ndes in - En ci rcunsta nci as norm ales la memor ia de rasgos es suficientemente rica
I e ns ida des. co mo para ser relativamen te inmune a la degradación con el tiempo. Pero si
La riqueza de la infor mación presente en el nervio auditivo y la falla de la información en la memor ia de rasgos es reducida gradua lmente, el sistema
los modelos de cod ificación basados en las propiedades de las fibras audit ivas, se apoya cada vez más en la codificación co ntex tual - aunque ésta no es efec-
en Sil intento por exp licar el éx ito de la Ley de W eber, implican qu e en algún tiva a intensidades medias debid o a la d istancia que separa al estím ulo de los
plinto del proceso neural central no se hace un uso completo de la informa- lím ites perceptuales de referen cia.
c i ón q ue circula a nive les periféricos (C arl yon y Moore, 1984) . Presum ible- Es evidente que el siste ma auditivo necesita cod ificar la int ensidad de
ment e, esta lim itación cen tral det ermina el dese mpeño de los oyentes en las modo relati vo en muchas ocas iones , simplemente porque los objetos aud itivos
ta reas de d iscriminación de la intensidad, y ev ita q ue el siste ma audit ivo ten - (co mo los fon ema s en el habla) se defin en por su intensidad relativa, ya sea
ga un rendimiento superior a bajas int ensidades. ent re co mpone ntes espec trales o ent re eve n tos sucesivos. La intensidad abso-
84 85
lula no afecta la identidad de los objetos auditivos en la mayoría de los casos
- juzgalllos que es e l mismo perro el que ladr a a Z o a 50 m de d istancia. Es ló-
gico pensa r, por lo tanto, qu e el siste ma aud itivo deba extrema r su eficienc ia
l'ar;1 las co mparacio nes entre est ímulos cerc an os en el tiempo an tes que para
1, IS separa dos por más de un os cientos de mi lisegund os.
_)~~
•
Estímu lo
~ -
. la función de
transferencia
d 1 ld
e 01 o .
externo/medio
I ,,
~
Filtro fijado a
'
Transformar
el espectro
en patrones q~
de excitación
Transforn~ar
la excítaci ón
en soncridad
especifica
"
-
Calcular el
área bajo
el palrón
lli
especr ~co
de sonoridac
• •
Se han elaborado varios model os formale s que intentan describi r cuant ita t i- En la figura 20 se pued e ver el model o en bloq ues de Brian Moor e en su
v.nuc nrc la percepci ón de la sono ridad. Zwicker desarrolló un model o de so- versión de 1997 (M oore, B., 1997) . La sono ridad to ta l es proporcional al área
no ridad basado en la distribución del patrón de excitació n en la mem brana bajo un patrón de sono ridad específico. Este esquema se ha incorp or ado a cier-
hasilar (Zwicke r y Fastl , 1999). En su modelo el est ímulo es co nve rtido en un a tos med idores de sonoridad -no de inten sidad o presión ac úst ica-, y de ac uer-
.100 IOrit.1ad eS¡Jecífica por banda. crítica (N ') a través de un a ley de pot encia: do co n los informes parece que funciona razonabl emente bien .
Al gun os paquetes de software para acústica de salas emplean modelos si-
milares para brinda r inform ación sobre predi cción de sono ridad y con ellos es
posible ca lcular los ecog ramas en una esca la de sones. En la figura Z1 se ap re-
En la que N ' es la sonor idad por ban da crítica, E es la inten sidad de la exc i- cia un ejemp lo de esos ecogramas.
t ac i ón ,y C y o. son co nsta ntes con o. < 1.
Esrc model o fue modificado por Moore y Glasber g, qui enes asumen q ue,
Sa no
(l( Ir debaj o de 1 kHz, la forma del filt ro aud itivo es igual al contorno isofóni- e
Cll correspond iente a 100 fones, y que por enc ima de 1 kH z la form a de l filtro
('Sl;í determ inada por la inversión de la curv a umbr al de aud ibilidad (M oore y
_ _ ~_--+ _ _l_,~ _ _,
( Jlasherg, 1986).21 La exc itac ión es con vertid a en sonori dad específica por
hand a crít ica a partir de la siguiente expresión:
1I En Moorc, B. (1995).
H6 87
Capítulo 111
El oído como analizador espectral
En los ca pítu los precedentes menc ion amos muchas veces las nociones de ban -
da crí tica, análisis en frecuencia, discriminac ión espectral y enrn ascaramien-
ro. Ha llegado el momen to de analizar estos conceptos con det alle.
La habilidad para separar o resolver los compone nt es espectra les de una
señal co mpleja es co nsecuencia de la capacidad de aná lisis en frecuencia del
siste ma aud it ivo. Por ejemplo, si dos flautas afinadas a dife rentes frecuencias
se soplan simultánea mente , es posible oí r a l mismo tiempo dos sonidos dife-
rentes. Se sabe que el aná lisis en frecuenc ia dep end e en gran medida de la ex-
plorac ión espectra l que oc urre directam ente en la cóclea . Toda seña l
compleja, como la que gene ra la voz human a o un inst rumento de música, es
procesada en esta temp rana eta pa de la cadena audit iva. Los comp on entes si-
nusoida les o de band a angosta son separados, cod ificados y tran smitidos de
modo ind ependi ent e por el nervio aud itivo . Más aún , esta etapa temprana del
aná lisis no puede ob viarse: todas las seña les sufren necesariament e dicho pro-
ceso. Por esto, la percepción de un son ido como un todo cohe rent e depende
del rearmado que tien e lugar en algún punto superi or de l sistema nervi oso.
U na de las preguntas ele men tales relacion ada co n el tema es la que inquiere
sobre nuestra habilidad para discriminar entre dos seña les cuyas frecuencias son
ligeramente diferentes. La respuesta , obtenida a part ir de un procedimiento psi-
cofísico clásico, int roduce el concep to de diferencia apenas perceptible ( DAP o
JND) I en frecuenc ia, o limen de frec uencia . Para medirla se realiza un expe ri-
mento en el cual los sujetos oyen alternat ivamente dos sinusoides de igual so-
norid ad; mientras una de e llas mantien e constante su frecuenc ia la otra la
89
modifica levement e. El objeto es dete rminar la mín ima diferencia en frecuen- Detectable Más dificil de detecta r Sin cambio
cia necesaria para distinguir ent re ambas seña les. En las figuras 1 y 2 se pue-
den ve r los va lores de la DAP en frecuencia en funci ón de la frecuenc ia de base.
El resultado puede sintet izarse diciend o qu e la DAP en frecuen cia se man -
t ien e ce rcana a 1 H z para frec uencia s por debajo de 1 kH z y que crece paula-
• Ruido enmascara nte de ancho de banda varia ble • Señal sinusoidal de prueba
16
,.
N 10
14
12 -
-
/ Figura 3. Esquema de l experi mento de Flet ch er
;S
''::¡ 8
b t iname nt e a partir de esta frecuencia. Por encima de 5 kHz la DA P aument a
--
)
más rápid ament e, y más allá de los 10 kHz, n uestra habilidad para discriminar
6 - _ o -
entre diferentes frecuencias prácticamente desaparece.
4 La c uest ión cambia si en lugar de sinusoides emp leamos seña les periódi -
.... . .,.. '
2 -
cas co mplejas. Tal como veremos en e! capítu lo v, en estos casos la DA P pue-
de llegar a ser tan pequ eñ a com o 0, 1 Hz.
64 125 250 500 1000 2000 4000 8000
Frecuencia (Hz)
2. B AN DAS CRÍT ICAS
Figura 1. DAr absoluta en frec uenci a; a ) obten ida a partir de seña les sinusoida les de inten-
sidades medias, ent re 60 y 80 d B, b) obten ida a part ir de seña les sin usoidales de int en sida- Ya a mediados de! siglo XIX a lguno s in vestigadores supo nía n qu e e! sistema
des ce rcanas al umbral de aud ibilidad (Wi er, [esteadt y G reen, 1977a ) audit ivo no func iona en bloqu e y q ue divide las seña les para su trat ami en to
de ta llado . Una hip ót esis tempran a planteaba la presencia de alguna clase de
0.9 aná lisis de frecuenc ia a niv el del siste ma aud it ivo periférico. Este proceso de
0.8, aná lisis en frec uencia se h a estud iado indirectam ente a part ir .del fenómeno
0.7
de en mascaramiento, que ocurre cuando un son ido en mascara o "tapa" a ot ro de
diferente frecuenc ia. El fenóme no de enmascarami ento se ana lizará con deta -
0.6
lle en e! punto 4 de este capítulo.
~
-<i 0.5
90 91
sinusoide y su potencia acúst ica se incrementaba a medid a que crecía el an- 76
cho de banda.
El expe rimento de Fletch er, que fue repet ido gran cantidad de veces des- 75
de entonces , reveló aspectos descon ocid os de nu estro siste ma audit ivo. En la ¡íJ
~ 74
figura 4 se aprecia un resumen de dicho experimento, realizado por Moore y ro
oc
su equip o en 1993 (Mo ore, B., 1997 ). En el gráfico se observa que el umbral al
lJ)
de detección para una seña l sinusoi da l de 2.000 H z aumenta al princ ipio a me- al 73
"O
dida que crece el ancho de band a del ruido, pero a partir de un va lor determi- ~
.o
E 72
nado -400 Hz en la figura- se prod uce un quiebre marcado de la c urva de :J
umbra l, que deviene práct icamente consta nte . 71
Pa ra dar cuenta de esta singular caracte ríst ica, Fletcher sugirió , si-
guiendo a Helmho ltz, q ue el siste ma a ud itivo peri fér ico se co mpo rta co mo 70
si estuv iera co mpue sto por un banc o de filtros pasaband a en pa ralelo ( lla- 50 100 200 400 800 1600 3200
mados filtros auditivos), c uyas bandas se tr aslapan. C uando trat am os de de- Ancho de banda del ruido enmasca rante (Hz)
tec ta r un a seña l en un ambien te ruidoso, usam os el filtro cuya frecuencia
Figura 4 . U mbral para una sinusoide de 2.000 Hz en función del ancho de banda del ruido
central ( Fe ) se acerca más a la frecu encia del est ímulo: la seña l pasa pe ro
en mascarante
ate n uamos gran parte de l ruido de fo ndo, corr espondie nte a los o t ros filtros.
Sólo la porción de ruid o que at rav iesa el filtro centrado en la seña l la afec -
ta sign ificat iva men te. Co mo es de esperar, si se increm enta e! anc ho de • C uando un oyen te intenta detecta r una señal en un entorno de ruido
banda del ruido a umen ta la po tencia de ruid o q ue pasa por ese filtro en par- emplea un filt ro aud it ivo centrado a la frec uencia de la seña l. En gene ral es el
t icular. Pero una vez q ue el ancho de banda del ru ido supera al del filtro a u- filtro que en trega una mayo r relac ión seña l/ruido de sa lida.
ditivo su capac ida d en mascara n te deja de crece r. La parte del ruid o q ue cae • So lamente una band a angosta de frecuen cias que rodea al estímulo,
fuera de! filtro sin to n izado co n la seña l no afecta nu estra habi lidad pa ra de- aquéllas q ue caen dentro de la oc, contribuye a enmascararlo.
tectarla. • El umb ral de detección de la seña l está determinado por la cantidad de
Se asume q ue el umbral de detección para una seña l sinusoi da l está deter- ruido que pasa por e! filtro audi t ivo correspond ien te . La pote nc ia del estí mu-
min ado por la ca nt idad de ruido que atraviesa el correspondiente filtro aud i- lo P divid ida por la poten cia del ruido dentro de la banda crítica es consta nte
tivo. Más específicamente, el umbral estaría vinc ulado a una cierta relación (k) .
señal/ruido a la salida de! filtro . Este modelo es co nocido co mo el modelo del
espectro de potencia, en el cua l los estí mulos está n representados por su espec- k =P /(\'(/xN o) IXI = ancho de la banda crí tica, en Hz.
tro de largo tiempo, sin fluctuaciones transitorias que invo lucre n camb ios en w = P / (k x No) No = densidad de potencia del ruido, en watts/Hz
las fases relativas. (la potencia en una banda de 1 Hz de anc ho) .
El térm ino banda crítica (Be), acuñado por Fletc he r, gene ralmente se re-
fiere a un hipotético filtro rectangular q ue simula el comportamie nto de los Mid iendo P y No es posible esti mar W. Según Fletcher, la constant e k vale
filtros auditivos rea les. El ancho de bandarectangular equivalente (ERB) es el an- aprox imadament e 1, aunque med icione s recientes la sitúan en 0,4. La d iferen-
cho de banda de un filtro rect an gular ideal que posee igual máxim o de tran s- cia tie ne que ver con el conto rno espec tra l del ERB equ iva lente , que no fue to-
misión que el filt ro real y por el que pasa la misma potencia total ant e un a mado en cuenta por Flet ch er.
entrada de ruido blanc o. Fletch er esta bleció las siguientes h ipót esis, que defi- Sa bemos qu e n ingun a de las h ipót esis an ter iores es est ricta men te co-
nen su modelo del espectro de potencia: rrccta : los filtros no son lin eales, los oyentes combi na n la información de
• El siste ma audi tivo per iférico cont ien e un banco de filtro s pasaba nda var ios filtros para aumentar la capacid ad de det ecció n y el ruido que cae fue-
lineales. ra de la banda pasant e del filt ro aud it ivo afecta a l umbra l de detec c ión. Pe-
92 93
ro estas imperfecciones no implican que la hipótesis ce n tral del modelo es- 5000
té equivo cada . De hecho, gran parte de los ava nces en el ca mpo se han ba-
sado en ella . Ñ
;S 2000
La forma rectan gular del filt ro audit ivo propuesta por Fletcher merece un o
co mentario aparte . Si el filt ro fuese perfectamente rect an gular el umbr al de ~ 1000
<;
ro
detección debería crecer a una tasa de 3 dB por cada duplicación de la band a "O
e
ro
de ruido . En la figura 4 se puede ver q ue la curva de crecimi ento tiene una .o
Q)
500
pend iente much o menor. Este desvío del va lor teórico se deb e probablemen- "O
O
s:
te a dos factores: el filt ro no es rect an gular, y las pequeñ as fluctu acion es del o
e 200
<l:
ruido afecta n la det ección de una man era apreciable.
100 1--- - - - .....-:- ~ - - - - - - 100 Hz
Refinamiento del modelo de Fletcher
0.05 0.1 0.2 0.5 2 5 10 20
Frecuencia (kHz)
El modelo del espectro de potencia se emp lea como punto de partida para el
desarrollo de modelos más precisos. S i el ruido en mascaran re se representa por Figu ra 5. A nc ho de banda crítico en func ión de la frecuencia central. Las líneas de puntos
su espec tro de pot en cia estaciona rio N(f) y la form a espect ral de l filtro audi- indican aproximaciones line ales pam baja y a lta frecuencia (Zwicker, Flottorp y Stevens,
t ivo por W(f) , la pot en cia de la seña l en su umbral P se puede ca lcular co n la 1957)
siguiente expresión:
P = k fo~ W(f) N (f) df En la figura 5 podemos aprec iar el anc ho de band a crítico en función de
la frec uenci a ce ntral de banda . Para frecuencias medias, la band a crítica t iene
Midiend o los ca mbios en el umbral de det ección de P en func ión del anc ho una exte nsió n de alrededor del 15% de la frecuenc ia central (corre spond e a
de band a del ruido, es posible eva luar la form a del filt ro aud it ivo W (f) . un intervalo musical a medio camino ent re un tono - segund a mayor- y un to -
En gene ral se elige n ruid os de banda angosta en vez de sinusoides co mo no y medio -tercera men or) .
en masca rant es a fin de ev ita r los batidos que se generarían co n la seña l en-
mascarada. Para ruid os de band a muy angosta, sin emb argo, apa rece n fluctu a- Método de supresión de bandas por cobertura
cio nes qu e pueden ser oídas . Otro motivo por el cua l se eligen ruid os de
band a co mo enmascarantes es que much as veces el filt ro aud it ivo que gene - Para sat isfacer las cond iciones impuestas por elmodelo de Flet cher es necesa-
ra la mayor respuesta es uno ce nt rado a una frecu en cia difer ente de la fre- rio, entonces, usar un ruid o en rnasca ran te que evite la aud ición fuera de fre-
cuencia de la seña l a detect ar. Esta importante ca rac te rística, en la qu e el cuencia, y que ade más limite el ran go alrededo r del cual la relación
oído exp lora el camp o audible "mov iendo" su ventan a espectral para buscar seña l/ruido mantien e valores sign ificat ivamente altos. El ruido en mascaran te
la mejor respuesta, se denomina audición fuera de frecuencia.3 Para desactivar diseña do por Patterson , cuyo espec tro se puede apreciar en la figura 6, cumple
este efec to se coloca ruid o a ambos lados de la zona de ex ploración con el mé- con ambos requi sito s (Patterson, R. D., 1976) . La forma del filt ro audit ivo
todo de supresión de bandas por cobertura de Patterson, que se descr ibe en el puede estudiarse midiendo el umbral de pot encia P para la seña l en función
apar tado siguiente. del ancho de la muesca en el espectro del ruido.
O tro métod o muy empleado para estudiar la selectividad en frecu encia El empleo de ruidos enmascaran tes de esta clase es muy común en el es-
del oído con siste en medir las curvas de afinación psicoacústica, en las que se tud io de seña les tran sitorias, pues las bandas lat erales "cubren" los puentes es-
emplea ruid o de band a angosta para evita r la int erfer en cia de los batid os. pectrales provocados por las transiciones rápid as de la señal, que aparecen
como consecuenc ia del princ ipio de ind et erm inación ac ústico (Basso, G.,
) Off-frequency Ustening en inglés. 1999, 200 1a).
94 95
+r-- - - - - - - - - - - - - - - - ---, Extremo basal
Extremo apical ]n
) .:::::.:::::;:¡:;:::::=~ .
'" Banda de ruido Banda de ruido
0~=========@
ri
Ul
enmascarante enmascarante
.~ 31mm 28 24 20 17 13 mm Dista ncia
.!!!. (¡j 1,0 al estribo
~
'c:"
' (3
"O
Ol :J
~ '[ 0,5
E
«
o Frecuencia (escala lineal) +
0,0 ~-'-~---':::::J..-....L.....1..-'-L---l~-I.-L..L.J....--+
20 30 50 100 200 300 500 1k 2k 5k
Figura 6. Esquema del ruido enmasca rante usado por Patt erson para est imar la forma
del filt ro aud itivo Frecuen cia (Hz)
N
E. 1000
_
e
Ol
.!!1 500
res la frecuencia central de la band a en Hz. Cada ERB corresponde a una distan -
Ol ",
"O> cia de alrededor de 0,89 mm en la membrana basilar. La conjetura de Gree nwood
m "S
"00"
c:W
se basa en las medic iones realizadas algunos años antes por Van Békésy.
'Ol" :;
~
.o ",
200
Si el filtro audit ivo fuese lin ea l su forma no ca mbiaría con la inte nsidad
~ g' 100 del estí mulo. Pero no es así: a bajos n iveles de excitació n es aprox imada rnen-
-5C:Ol
~ le simétrico, pero deja de serlo a medid a q ue aumenta la pot en cia de la señal.
« e:: 50
En el gráfico de la figura 9 se puede ver la forma del filt ro auditivo en fun ción
.~
ii: de la inte nsidad. En particular, la extensión de baja frecuenci a posee un an-
20 +rnr---....,..-"rrrTTT--.--.--,--,r-rr-rrl cho de band a mayor que la de alta frecuen c ia.
0,05 0,1 0.2 0,5 1 2 5 10
Frecue ncia central (kHz)
Está ace ptado que las band as críticas son continuas pues no ha y ev iden-
cia expe rimental de disco ntinuidad en tre e llas. Podemos hablar de la existen -
Figu ra 7. Estimació n del anc ho de band a del filtro rec tan gular equivalente en funció n cia de una banda crít ica alrededo r de cualq uier frecuencia audib le.
de la frecuenc ia ce ntra l A veces, es útil especifica r la esca la de frec uenc ias de un expe rimento to-
mando el anc ho de l filtro rect angular equivalent e co mo un idad:
Exper iment os com o los ant eriores, y otros similares, han llevado a los invest i- En la actualidad se puede predecir a parti r de qué n ivel una señal complej a
gadores a form ular que e l filtro rectangular equiva lente sigue aproximadamen- puede ser det ectad a en un amb iente de ruido ca lculando los umbrales de sus
te los valores de la figura 7. parciales más prom inentes. Para frecuenc ias med ias el crite rio dice que con
Greenwood propuso en 1961 que el ancho del filtro rect an gular equivalen- una relación seña l/ruido de -4 dB la seña l com ienza a oírse. Es dec ir, que el es-
te represent a una distan cia consta nt e a lo largo de la membrana basilar. La re- tímulo debe superar el n ivel a -4 dB del ruido de salida del filtro auditivo q ue
lación de G reenwood , corregida por G lasberg y Moore (1990) , es la siguiente: le corresponde. Un modelo que aplica co nside rac iones similares fue usado con
éxito en el dise ño de siste mas de co municación en aeropuertos, a medi ados de
ERB = 24,7 (4,37 f + 1) la década de 1990.
96 97
90
Suma toria de sonoridad
80 90
80
enol>
ro
~
60
g
e 70
u 60
ro'"
50
----
:2
s'"
u
(/)
e 50
ol>
u 40 o
(/)
a; ol> 40
> u
Z 30 a;
> 30
20 Z
20 dB
20
10
10
50 100 200 500 1000 2000
Ancho de banda (Hz)
Frecuencia (Hz)
Figura 10 . N ivel de sonoridad para un ruido de banda cen trado en 1.000 Hz en función
l : il~l1 f.'a 9. Formu del filtro audit ivo cen trado a 1.000 Hz en función de la intensidad
del ancho de banda
dd c-rfru ulo , de 20 a 90 dB en pasos de la dB
El! el apartado 4 del capítulo 11 analizamos la infl uenci a de los factor es espec- C uando dos estímulos sinusoidales poco separados en frecuen cia se presentan
I rules qu e inte rv ienen en la percepción de la sonorid ad. Podemos ahora exa- jun tos, puede o írse son ido aun cuand o cada estímulo por sí mismo esté ubica-
minar el tem a desde otra perspectiva. do por debajo de! umb ral. Gassl er propuso que , dentro de una banda críti ca,
C onsideremos un a señal acúst ica de intensidad fija y ancho de banda va - las energías de los com ponent es de un est ímulo complejo se suman algebraí -
riable 'Y/o Mientras W se mantenga menor que la banda críti ca BC la sonori- camente.! Spie gel, por e l cont rario, sugiere que e! oído es cap az de integrar la
dad será más o menos independiente de W, e igual a la de un tono puro de energía sobre anchos de ban da mayores q ue una BC (Spiegel, M. E, 198 1).
igu;ll int en sidad situado en la frecuenc ia centra l de la banda. C uan do W su- Algunos experimentos rea lizados con sinusoides muy separadas confirman es-
pera la Be, la son oridad com ienza a incrementarse. Por lo tanto , para una to últ imo.
determinada cantidad de energía la sonoridad es mayor si la energía se repar-
l e s( .hre un número de bandas críticas, en vez de esta r contenida en una sola
Sensibilidad a la fase
de el las. En la figura 10 se aprecia el aumen to de sonoridad aludido. 4
Este efec to es muy importante en música ya que e! aume nto de sonoridad En un célebre ex per iment o real izado por Zwic1cer y repet ido casi medio siglo
\le pende de la suma de las sonoridades específicas en las diferentes bandas. Por más ta rde por Sek se emplearon dos seña les esta cio n arias, un a mod ulada en
e-jemplo , do blar un bajo a la oc tava es mucho más efectivo, desde e! pun to de amplitud con un índice de mod ulación m y ot ra mod ulada en frecuencia co n
vista de la sonoridad, que dob larlo al unísono aunque la en ergía física puesta un índice de modulación b (Se 1c, A. , 1994 ). Si se igualan los índices de mo-
en juego sea la misma , du lación (m = b) y b es pequ eño, el espect ro de po tenc ia de las señales es
I A lgunos au tores lo denominan "suma de sonor idad" (loudness summatio n ). I Gassler (195 4), en Moore, B. (1995 ).
99
idént ico . Las co mponentes de las señ ales sólo difi eren en sus fases relat ivas. 4. ENMASCARAMIENTO
El resultado de este experime nto muestra que so mos sensibles a las fases rela-
t ivas de una seña l estac ionaria cuand o las co mpo ne ntes caen dent ro de un a El enmascaramiento acústico es un fenómeno habitual en nue stra vida cotidia-
misma ban da crít ica. Por el contrario, cuando las co mpone ntes se encuen- na. C uando elev amos la voz para ser oídos en una reunión , cuando perdemos
tran separadas en frecue nc ia por una d istancia que supe re el valo r de un a part e de una conve rsación que es "ta pada" po r el paso de una motoc icleta con
banda crítica , las fases rela tivas dej an de pe rcibirse. Sólo en este caso parece d esca pe libre, o cuand o el ruido de una aspirado ra nos impide seguir un d iá-
válida la ley acústica de Oh m , que postu la la insens ibilidad a la fase del siste - logo en el te levisor, lo estamos experim entando. La cuestión puede plantear-
ma aud it ivo." se de la siguient e man era: si alguien está oyendo un son ido int en so a una
cierta frecuenc ia, ¿q ué int ensidad deb erá tener otro sonido, a una frecue ncia
Discrim ina ción de par ciales en sonidos complejos diferente, para que lo podamos perc ibir? El en mascaramiento se define co mo
I) el proceso que provoca un aument o de! umbral de aud ibilidad para la seña l
La ley ac úst ica de O hm ta mbién esta blece q ue el oído es capaz de percibir los enmascarada o 2) la ca nt idad de aume nto del umbral ex presada en dB.
compone ntes sin usoida les en un son ido complejo. Plomp encontró q ue esta Wegel y Lan e pub licaron el primer trabajo sistemático de invest igación
habil idad llega, según la frecuencia de la funda men tal, hasta el quinto u oc ta- " ,hre el en mascaramien to de un ton o por otro, pero sus resultados se co mpli-
vo parcial (Plomp, R., 1976) . Co n su méto do -diferente al de Flet ch er- esti- caron por la aparición de batidos entre las seña les (Wegel y Lane, 1924 ). Pa-
1: 1 supera r el problema en los experimentos recientes se emplea ruido de banda
mó un va lor para la banda crí tica algo menor a la medid a por el método de
enmascaramiento . Plornp int rodujo la hi pótesis ad iciona l de que un parcia l .mgosta tanto para las seña les enmasca rante co mo en mascarada.
puede ser oído en el entorno de otros parciales si se en cuentra separado de es- Los patrones de enm ascaramiento obten idos ex perimentalmente mues-
I mn una pendiente más abrupta en la zona de baja frecuen cia que en la de al -
tos últ imos por lo meno s en 1,25 veces el valor del ERB del filtro audit ivo que
1:1 frecuencia , tal com o se aprec ia en la figura 11.
le corresponde.
Los experimentos de Soderq uist parecen pro bar que los músicos poseen Los gráficos ant eriores ponen en evidencia e! uso simultá neo de más de
\1 11 filtro aud itivo. Una ex plicación posible es interpret ar esta for ma como un
band as críticas men ores a las de los no músicos (Soderquist, D. R., 1970) . Sin
embargo, Fine y Moore mostra ron que no hay ta l diferen cia (Fine y Moore, uulicador de l model o de exci tación de l ruido enmascarante: e! pat rón de en -
1993). La int erpretaci ón más aceptada es la que presu me la existencia de al- uursca ramien to sería paralelo al patrón de la exc itac ión , pero desp lazado ver-
I ¡,,:dmente una pequeña cantidad de dB. En la práctica la cuestión no es ta n
gún meca n ismo, más entrena do en los músicos, que actúa a niveles no pe rifé-
ricos en la de tecc ión de parci a les. "" lIcilla, pues también int erviene n los factores propi os de! mecanismo de "oír
IIl1 a frecuenc ia d iferente" y la det ección de los produ ctos de combinación en-
111' la señal y el ruido en rnascaran te.
Selectividad en frec uencia en oídos dañados
Moore y G lasberg describieron una for ma de derivar las curvas de enmas-
Hay co nsidera ble ev idencia de que la selectiv idad en frecue nc ia d ismin uye , :lIallliento usando el con cepto de filt ro audit ivo (figura 12), en la que supo-
111'11 que e! an cho de band a de los filtros aumenta al aumentar la frec uenc ia
por daño en la cóclea. U na consecuencia es la gran sensi bilidad al enmasca-
• \ ' 111ml FC (Moore y G lasberg, 1983).
ram iento que poseen las personas con lesiones cocleares, con la consiguient e
dificultad para oír en amb ientes ruidosos. U n imped imento ad iciona l aparece ¡\ la descr ipción anterior se le deb e agregar la acción de las ondas progre-
ante el análisis perceptual de sonid os comp lejos como la pa labra y la música, oIV:I:, en la membrana basilar según el esquema de Van Békésy. Una frec uen-
1. 1 ele vada produce un máximo de vibración en la mem bran a basilar cerca de
por eje mplo en la dismin ución de la habilidad para distin guir entre diferentes I
timbres. C on los audífonos con vencion ales no mejoran estas dificultades pues, LI ve n ta na oval, mientras que una de baja frecue ncia se esparce práct icame n-
aunq ue conv iert an en audibles las señales, no se recupera la selec t ividad en 1, I" ,r I oda la memb ran a. Esta característica de "enmasca rar ha cia las frecuen -
1.1', agudas" se puede ver en el gráfico de la figura 13.
frecuencia perdi da . I
( :II IIl O se observa en la figura 13, la segunda señal se perc ibe con facilidad
I u lrccuen cia está alejad a de la frec uencia de la señ al enmascarante, pero la
6 Ohm (1843) , en Moore, B. (1995) .
100 101
'/00 I---'---r--'---r---'---~~
100 -,-- -----¡-- - - --,---- - - , -- - - -,-- --.,
a Umb ral de audibilidad
so Intensidad del ruido
de banda angosta 80 b Aume nto del umbral cau sado
. . . . . por una banda de ruido
tn
~ 60_
.9 tn 60 e _ _ Aumento del um bral causa do
e ~ por una sinusoi de
<1l
E 40
eo
~ § 40
rl so
lj)
E 20 Q;
>
...................................
e Z 20
W ......
................................
. :.
250 500 1000 2000 4000 8000
400 800 1600 1200
Frecue ncia (Hz)
Frecuencia (Hz)
FiJ.:lIn1 [ lo I'ntrones de enm ascaram iento para ruido de banda angosta cen trado en 500 Hz
Figur a 13. C urvas de enmascaramiento: a ) umbral de aud ibilidad , b) aumen to de/umbral
causado por una banda de ruido \' e) aumento de/ um bral causado por una sinusoide
o
dificultad crece apreciable ment e a med ida que ambas señales se acerc an . Esto
tn -"10 no debería sorprende rnos pues sabemos que, si com parten una misma banda
~
g; crítica, dos señales se perturban mutuamen te y la más débil no se perci be a
¡¡= -20
Q;
el
menos que posea un porce n taje aprec iable de la ene rgía de la más intensa, al-
e
-o -30 go así co mo 6 u 8 dB por debajo de la erun ascarante. C uan do la segunda señal
'ü
¡¡; est imula una banda crítica dife rente, sin emb argo, e! estímulo llega al ce rebro
<1l
u -40 por un can al separado y todavía no ocupado: la señal enmascarada puede per-
e
O
Q..
cibirse estando aun 30 o 40 dB por de bajo de! ruido .
-50
0,5 1,0 1,5 2,0
Frecue ncia (I<Hz) R elación entre las bandas crí ticas y el mecanismo de enmascaramiento
O Hay much as semej anzas en tre las selec tividades en frecue nc ia med idas ta n-
to en la membrana basilar como a partir de experime ntos psicofisíol ógicos
-10
(Moore, B., 1995) : cad a an cho de ban da rectangular eq uivalente (ERB) co-
tn -20 - rresponde a alrededor de 0,9 mm en la membrana basilar, sin que importe
~
e e! centro de frecuenc ia co nsiderado . Sin embargo, a pesar de la bue n a co -
-o
'ü
s -30 rresponde n ci a en tre el comportamiento de la cóclea y la med ida de los
'ü
x ERB, es posi ble que exista un mecanism o de "afinac ión " del an cho de banda
l1J
-40 en et apa s superiores de proces amie n to . Esto pod ría lograrse a través de me-
-50
can ismos de supresión o inhibic ión la teral. Si la banda crít ica depende de
0,5 1,0 1,5 2,0 un proceso ne ur al inhibitorio, se puede esperar que el mismo de more algu-
Frecu encia (kl-iz) nos milisegundos en actuar: la banda crítica para señales cortas debería ser
mayor que pa ra señales largas. Los datos experim entales en este punto se
FiJ.:IIf'" 12. I ),' ri v:tC i"'1l de l I' :tl rón de enm ascaramiento seg ún Moo re y G lasberg
con trad icen.
102
103
Modelos de cobertu ra y sup resión la salida de un filt ro audit ivo centrado a la frecuencia de la seña l. En general,
se supone que la prest ación se basa en la salida del filtro que prove e la mayor
Ha y dos model os que explican el proceso de enmascarami en to . El model o de relaci ón seña l/ruido y que los umbrales corresp onden a una relación seña l/rui-
ClJ /Jertura involucra la saturación de la ac tividad neur al evocada por la señal. do consta nt e. Las fases relati vas de las compone ntes y las fluctuacion es de cor-
S i el ruido enmascarante prod uce una ca n tida d sign ificativa de act ividad en to tiempo del ruido enrnascaran te son igno radas. Este modelo funciona bien
la banda crítica que normalmente responde a la señal, ent onces la ac tividad en much as situac iones, pero no en todas. En particular, hay ev idencia de que
ugregada por la seña l resultará cu biert a y no se la podrá de tectar. Considére- los oyentes a veces realizan com paraciones entre d iferentes filt ros aud itivos.
se, por ejemplo, el caso de un tono junt o a un ru ido de banda ancha . El urn- Más aún , ciert as fluctu acion es temporales del ruido enmasca rante pueden te-
hral del tono está a -4 dS por deb ajo de l nivel del ruido en su banda crí t ica. ner efectos import antes.
La exc itación combi nada del to no y el ruido es 1,5 dS mayor que el ruido sa-
lo: 1,5 dS representa el incremento mínimo necesario para la detecció n del Re ducción del enmascaramiento por comodulación
to no (por ejemplo, si el ton o estuviera a -20 dS , el nivel total hab ría aumen -
tado 0 ,05 dS y no sería aud ible ). Hall de mostró que las comparacio nes entre filt ros auditivos puede n aumentar
El segundo meca n ismo posible, desarro llado por el model o de supresión, la de tección de seña les sin usoida les en presen cia de ruido (H all , D. et al.,
se basa en la hi pó tesis de que el ru ido en mascarante supri me la actividad ne u- 1984) . Para qu e ocurra este efecto debe ex istir una fluctu ación coh erente o
ral que la señ al pro duciría de estar sola. cor relaciona da entre diferentes band as del ruido enrnasca ran te , fen óm en o al
Por el mom ento no hay evidenci a fuert e q ue permi ta descartar alguno de q ue Hall llamó comodulación.7 En la figura 14 se aprecia el resultado de su ex-
los dos mecan ismos, aunque qu izá se combinen amb os. Sin embargo, el éxi- perimento.
to de los modelos lineales de combinación de filtros aud iti vos en la exp lica- Hall usó ruido de una banda de anc ho variab le. Tam bién se pueden em-
ció n del patró n de enmasca ramien to inclina la balanza hac ia los mecanismos plear dos o más bandas de ruido, incl uso una en cada oído, sin que varíe el re-
de cobe rtura, pues la supresión es un proceso a lta men te alineal. sultado.
Se asume usualm ente que la redu cción del en masca ramiento po r como-
Modelos temporales de en mascaramien to du lación depende de la comparación entre las salidas de diferentes filt ros au-
dit ivos. Sin emba rgo, tam bién se produc e un efecto similar cuan do la
Existen da tos que apoya n la hip ó tesis del uso de los patrones temporales de dis- fluctuació n cae dentro de una sola banda cr ítica , aunq ue en ese caso la dismi-
paro neurona l en el análisis de estímulos comp lejos (una sinusoide produce nución del umbral result e men or. La reducci ón de l enmascaramiento por co-
disparos neurales cuyo int erva lo temp oral es un múlt iplo entero de su perío- modulación es mayor cuan do la variación del ruido enmasca rante es lenta y
do). S i la regularidad temporal es men or q ue cierto va lor -como ocurre con el cuando éste cubre un gran anc ho de band a. Para seña les de hasta 100 ms de
ruido aleat or io- la sin usoide será en mascarada . El mecan ismo tem poral pare- duraci ón la reducción del en masca ramien to por comodulación pued e llegar a
ce efec tivo únic amente pa ra frecuenc ias por debajo de los 4 o 5 kHz y cabe su- 11 dS. Esta disminución alcanza los 14 dS en el caso de ruido enmascarante
pone r la acció n de un dispositivo sensible a la fase. de dos bandas cuando la banda agregada se ub ica cerca de la frecuenc ia de la
O tro ele ment o que posiblement e se emplee en la detección de un a señ al primera banda. También aumenta hasta llegar a un máximo de 16 dS cuando
sinuso idal en un fondo de ruido es e l cambi o en la envolvente de la onda com- hay más de dos bandas en juego. La magn itud de la redu cción del enmasca ra-
binada, que fluct úa menos en prese nci a de la señal sinusoidal. miento por comodulació n no ca mbia con la frecuen cia ce nt ral del estí mulo.
La co mparac ión entre las diferentes envolve ntes temp orales de los filtros
audit ivos parece ser un hecho co mún en el an álisis de los patrones audi ti vos.
5. A NÁLISIS ESPECTRO- TEM PORA L COMBIN A DO Apa rente men te juega un papel muy importante en la extracción de seña les
El model o del espectro de potencia asume que , cua ndo tratamos de detectar 7 Hoy se lo denomina reducción del enmascaramiento por co modulación o CMR (conmodu-
una seña l sin usoida l en presencia de un ruido en mascarant e, hacemos uso de /(l[ion masking release).
104 105
entre las señales qu e afecta a los sujetos co n poca prác t ica. De hech o, oye ntes
entrena dos -músicos y técnicos de aud io entre otros- obtie ne n mejores por -
iD 60 R
I
centajes de detección qu e los suje tos promedio. Por o tro lado , el en mascara-
:3. miento "ha cia del ante", con el ruid o en mascarante preced iendo a la señal, es
uno de los tres pro cesos qu e alte ran el um bral de una seña l qu e t ien e lugar des-
pués de otro son ido . Los o tros dos son la fatiga y la ada ptac ión . Se disti ng ue
de ellos po r estar limitado a seña les que apa rece n dentro de los 200 ms des-
pués del momento en que cesa el ruid o en masca rante.
El enmascar am iento hacia del ante tien e las siguientes particularida des :
1) es mayor cuanto más cerca en el tiempo se sucede n ambas seña les; 2) los
45 inc rementos en el niv el del ruido en masca ran te no co rresponde n a increm en-
L---'----'----'------'-_---''---¡fj--'--_--'
tos iguales en el umbral de la seña l (a diferenc ia del enmascaram ien to simul-
Ancho de la banda enmasca rante (kHz) táneo, qu e respond e a un a relación seña l/ruido constante), y 3 ) depende de la
relación de frecuencias entre ambas seña les (igual que en el en mascaram ien-
Figu ra 14 . Resultad o del expe rimen to de Hall . Los puntos marcad os "M" cor respo nden a to simultán eo) . Los procesos que dan cuen ta del enmascarami ento no simul-
los umbrales obten idos con ruido en mascarante mod ulado en amplitud con una se ñal irre- tá neo no se conocen co n exac ti tud, aunque prob ablemente sea n con secuencia
I~ u lar que varía lent amente de la co mbina c ión de varios a la vez. La superposic ión temporal de pat rones
de vibrac ión en la membran a basilar -una suerte de cola de resona nc ia o "rin-
ging"- parece ser imp ortante, así co mo la ada ptac ión de co rto té rmi no ta n to
de ambien tes ruid osos y en la discriminación en tre var ias fuentes ac úst icas .
en el nervio aud itiv o com o en los ce ntros neurales super iores.
Tambi én da cuenta, al menos en parte, del "efecto de cafetería" ("cocktail
pnrrv effecr").
Supresión lateral en el enmascaramiento no simultáneo
Hay dos clases de modelos qu e intentan ex plica r la reducción del en mas -
caramiento po r comodulación. Los qu e integran el primer grupo asumen qu e
Los expe rime n tos sobre en mascaramiento simultáneo puede n ser exp licados a
el siste ma audit ivo co mpara los pat rones de modulación de las envo lve ntes de
part ir de la superpos ición de filt ros audit ivos apro xi madame nte lineales. S in
las salidas de los diferentes filt ros aud it ivos: la presencia de un a seña l es rev e-
embargo, las respuestas neurales son marcadam ente alinea les. En particul ar, es
lada por la d isparidad en la modulac ión entre los filtros.
importante destacar el hecho de que la respue sta a una seña l puede ser supri -
Un segundo grupo de modelos sugiere qu e la fluctuación de las envolve n-
mida por otra de diferente frec uenc ia en el fen óm eno de supresión entre dos to-
tes a la salida de los filtros aud itivos indican los momentos ópt imos en los que
nos, que describe el hecho de qu e la respue sta ante un estím ulo sin uso idal
se debe escucha r la señal. Es decir, durante los mínimos de la envolve nte del
puede an ularse por la presencia de un segundo est ímulo. En la figura 15 se
cn masca ran te.
aprec ia este importante efecto.
Estos modelos no son mutuamente excluyentes y no parece que la reduc-
Los efectos de la supresión co m ienzan y cesan muy rápida me nte , dentro
C i<'1I1 del en masca ramiento por comodulación dependa de un único mecanis-
de unos pocos mili segundos luego del comienzo o fin del segundo est ímulo.
111 0 simpl c,
Para señales más complejas, el fenóm eno toma el nombre de supresión /a-
teral, en la que una fuerte act ivida d a una frecuenci a central puede suprimir
Enmascaramiento no simultáneo
una actividad menor a una frecuencia adyacente. Las crest as del patrón de ex -
citación son resaltadas por los vall es que las rod ean .
LlIs l'fecl llS de l tiempo sobre el enmascaramiento han sido estudiados en deta-
La pregunta es ¿po r qu é la supresión lateral no se revela en el en masca-
lle por IlIll11CroSOS investigadores. El enmascaramiento "hacia atrás", con la se-
ramiento no simultá neo ? Houtgast estudió extensamente el caso a partir del
ñul preced iendo a l ruido en masca ran te, parece provenir de una confusión
umbral de pulsación (Houtgast , T., 1972) . En el en mascaram iento simultáneo
l Oó
107
Enm ascarami en to binaural
80
El umbra l de enmascaramiento puede ser marc adamente menor cuando la se-
ñal se oye con ambos oídos. La diferen cia de nivel entre la audic ión b ínaural
50
y la mon oaural se conoce como nivel de enmascaramiento diferencial (MLD). El
ro MLD llega a ser de 15 dB para bajas frecuen cias y se reduce a sólo 2-3 dB para
E
a;
>
seña les de 1.500 H z. N o es casua l qu e el límite de 1.500 Hz sea el mismo que
Z 40 el de nu estra capacid ad para com parar las fases de las seña les entre los dos oí-
dos dur ante la locali zación espac ial. En la figura 16 se aprecia cualita tivamen-
te un experimento clásico en este ca mpo.
20 Para qu e el efecto ten ga lugar se debe agregar el mismo ruido a los dos oí-
dos (o al menos deben esta r correlacionados o provenir de la misma fuente) .
2000 5000 10k 15k Se ha observado enmascarami ento binaural en seña les sin usoidales, en clics y
Frecuencia de los esll mulos (Hz) en el hab la. En situ acion es rea les aparece cuando la seña l y el ruido provienen
de diferentes posicio nes en el espacio y se relacion a fuert emente con el efec-
Fi¡:ura 15 . Á reas de supresión de un estí mulo por otro to "cocktail party". La band a del ruid o enmascarante que act úa en las condi-
cion es de enmascaramiento diferencia l es la que cor respond e a la frecuencia
la supresión se man ifiesta porque cua lq uier reduc ción en la actividad del rui- de la seña l. Ha ll sugirió que los filt ros aud it ivos que interv ien en en la detec-
do cnmasca rante en la región de frecu en cias de la señ al se aco mpaña con un a ción mon oaural y bin aural son los mismos, pero que la det ección bin aural de -
redu cción similar en la ac t ividad de la seña l enmascarada. En otras palabras, pende de la salida de más de uno de ellos en paralelo.
la razón "seña l enmascara da /ruido enrnasca rante" no es afectada por la supre- La inteligibilid ad del habla en co ndiciones de ruido ambienta l mejora
si ón . En el en mascaramiento no simultá neo la supresión afecta al ruido en- co n seña les an tifásicas , en espec ial a niveles cercanos al umbral. Las co nd icio -
mnsca rante pero no a la seña l. nes ant ifásicas no sólo mejoran la capacid ad de detecci ón de seña les, sino que
Otra diferencia importante es qu e la select ividad en frecu encia del en- ta mbién inc rementan la hab ilidad para discrim inar seña les.f Los procesos de
mascaramiento no simultá neo es mayor que en el simultá neo (med ido por en masca ramiento y de localización espacial, sin emba rgo, parece n procesa rse
eje mplo a partir de la curva de afinación psicofísica o PTs). de man era separada .
Los model os más recientes, como los de C olbum, S te rn y Trah iotis, asu-
Examen del perfil espectral men que las tasas de d isparo de los diferentes filt ros aud it ivos prove nie ntes de
los dos oídos son comp arad as por detectores de coinc idencia que proveen una
Grccn y sus co legas dem ostraron en 1988 que los oyentes comparan la salida especie de salida bidimension al, co n una dimensión caracterizada por las fre-
de diferentes filtros audit ivos para mejorar la detección de una señal específi- cuencias centrales de los filtros aud itivos y la otra por el retardo interaural
ca, :nín en los casos en los que el ruido y la señal fluctú an sincrón ica men te. (C olburn, H . S., 1995). Un co mplejo model o, el de Yoichi Ando, da cuenta
Sugiriero n que se percibe un cambio ent re el perfil espectral de l ruid o en pre- con bastante detalle del proc eso de evaluación interaural y fue utilizado en el
scnc in de la seña l y el perfil en ausencia de la misma. El an álisis es más efec- diseñ o de salas para música no amplificada (Ando,Y. et al., 1997a) .
1ivo cuando : 1) el ruido de fond o posee un gran ancho de band a; 2) hay varias
\.'t uuponcnrc s de la señal dentro del rango espectral del ruid o y 3) el ruido de
li nulo se co mpone de bandas de simi lar intensidad.
En IIn sentido e l examen de l perfil espectral no sorpre nde: la forma de l es- s U n parámetro uti lizado en el estudio de salas para música y palabra, el coeficiente de corre-
p( ' CII'O es uno de los factores relevantes a la hora de identificar una vocal o un lación cruzada interauTal ( IACC), cuanti fica la correlación existente entra las seña les que lle-
I imhrc musica l. gan a los dos oídos.
10H 109
a)~.~ resulta ntes, pero en la práctica son audibles solamen te los de men or frec uen -
cia. Se los puede clasificar de acuerdo con la cantidad de veces que aparecen
las frecuencias de los estímulos fl y fz en la fórmul a correspo ndiente. En la ta-
bla de la figura 17 se indica n los soni dos de combinación de men or orden.
b)~.~ En la tercera columna está n los armón icos de cada un o de los componen-
tes prim arios. Por lo general, los son idos de combinación de las dos primeras
co lumnas no siguen una estructura armón ica. 10
<} Aunque aquí adop tamos la denom in ación tradic iona l de sonidos diferenciales y de sonidos
de combinación, no los debem os confundi r con las seña les físicas que los causan ni con las 10 Una exce pción se da cuando una frecuencia primaria es igual o múltipl o de la otra. Por
frecuencias de dichas seña les físicas. ejemplo, fz = N t, (Basso, G., 200 Ia ).
110 111
Primarias r, t2 So n idos de co mbinación de tercer orden
Secundarias t 2 - r, t2 + t, 2t, . 2t 2 El espec tro de los son idos de co mbi nación de tercer o rden o cúbicos, gen e-
rados por un sistema regul ar con d istorsión cúb ica, se pued e apreciar en la
Tercer orden
2t , - t2 .2t2 - t , ar, + f 2 . 2t 2 + t, 3t, . 3t 2 figura 19.
Los son idos ad icio na les cú bic os de alta frecu encia (2fl + fz) y (2f2 + f ,)
3t, - t2 . 3t 2 - t, . 3t, + t 2 . 3t 2 + t, .
Cuarto orden son extrema da me n te di fíciles de oí r. Los sonidos d iferenc iales cúbico s (2f , - fz)
2t, - 2t 2 2t, + 2t2 4t, . 4t 2
y (2fz f, ) poseen e l triple de amp litud que los terceros armó n icos (3fl) Y(3f2)
... ... ... de los co mpo nen tes prima rios. En ci ertas circunst an cias el más bajo de ellos,
(2f1 - fz), es tan audi ble co mo el diferencial cu adrát ico (f2- f¡).
Figura 17. Frecuen cias cor respond ientes a los son idos de combinación de men or orden . Se Sin embargo, en este caso la rel ación entre niv el es de entrada y sono ri-
presupone f2 > f l dad percibida no sigue un a ley tan simp le com o en el caso de los son idos de
comb inac ión de segundo ord en. El difer encial cúb ico (2f, - f2) persiste a nive-
les de estímulo muy bajos y su aud ibilidad depende en gran medida de la fre-
cuenc ia de los componentes primarios. Por ejemp lo, dec rece rápidamente en
sono ridad cuando la d iferenci a entre fz y f l supera un valor ce rcano al 30 %.
Estos h echos revelan la ex istencia de un a alinealidad esencial, en la que el sis-
te ma no se puede apro xima r a un siste ma lin eal para pequ eñas amp litudes de
, 1
señal. Se sabe que el orige n de esta alinealidad ese ncial aparece más all á del
oído medi o. Se supo ne que surge de la activ idad de las células motoras en la
cóclea o en a lgún centro de procesami en to neural supe rior.
(2 - ( , (, (, 2f, (, + (, zr,
En la figura 20 se aprec ia el co mporta miento de los son idos di ferenci ales
Frecuencia
l11<l S audibles en fun ción de la difer encia de frecuencia en tre los compo ne ntes
Figura 18. Distor sión cuadrática pura a parti r de dos componentes primarios de frecuencia primarios y en la figur a 21 se grafican en notac ión musical apro x imada los di-
f 1 y fz ferenc iales cuad ráticos y cúbicos presentes en algunos interva los sencillos.
112 113
Frecuencia En primer lugar, los arch ivos de audio, generalmente en dos cana les PCM de
44,1 kHz de muestreo y 16 bits de resolución , son transformados en frecuen cia
2f, . ----------------------- y separados en 18 sub-bandas por cana l. Ca da sub-banda reproduce aproxi ma-
Estímulo f2 damente el tamañ o de un anc ho de banda crít ico. La tasa de transmisión se fi-
(Frecuencia variable ) ja a un valor menor al de un cn de audio para limitar intencio na lmente la
3/2 f,
cantidad de bits dispon ibles y forzar la compresión. A part ir de un modelo psi-
Estimu lo f, coac ústico se exa mina cada sub-banda y se dec ide a cuá les se destina la mayor
f, (Frecuencia fija) cant idad de bits. Por eje mplo, las bandas que son enmascaradas por otras más
pote ntes reciben men os bits porqu e en ellas no se va a percibir el ruido de cuan-
fe l =f 2 - f , tizaci ón, prod ucto inevitable de la menor resolución. En otros térm inos, se re-
: Sonidos diferenciales
mueve la part e de la seña l que no vamos a poder oír al quedar enmasca rada .
le2= 2f, - f 2
A la salida del cod ificado r psicoacústico se agrega un codificador por re-
l- ~ - - + -- *-_. Frecuencia dunda nc ia, por ejemplo uno de Huffm an, que permite llevar la tasa de com-
r, 3/2 r, zr, del estímulo
Unisono Quinta Octava variable presión a un valor final de hasta 12:1 sin que se degrade sign ifica tivamente la
calidad de audio. En la figura 22 se puede aprec iar un diagrama en bloque s del
Figura 20. Diferenci ales cuadrát icos y cúbicos en función de la diferen cia de frecu en cia proceso co mpleto .
ent re los co mpone ntes prim arios (tom ado de Roed erer, 1997 ) La profundidad de compresión depend e de la calid ad de audio requerida
,
y del t ipo de seña l que se va a codificar. Por lo gen eral, una tasa de tran smi-
sión de 128 kbps se cons idera suficien te para alcanzar la ca lidad de audio de
:
un C D, al men os si se emplea un siste ma de monitoreo de ca lidad media y la
: : I
..a.
~?++ música no posee gran ran go d inámic o.
Es muy impo rta nte tomar en cuenta que la codificac ión MP3 y todas las
O- O-
que emp lean esta clase de procesami ento psicoacúst ico son técni cas a pérdida
~ ()
O
() () de informac ión . La seña l codificada no puede vo lver a su estado o rigina l una
vez fina lizado el proceso.
Figura 21. Notació n musical aproxi mada de los sonidos dife renciales más des tacados
114 115
Capítulo IV
Procesamiento temporal de señales
Decir que los son idos del ambiente, de la música y del habla dependen , nece-
sitan y, en última instan cia, está n hechos de tiempo, es en unc iar una verdad
de Perogrullo. La nat uraleza del son ido es el devenir y el estudio de sus rasgos
esenciales ha planteado, y plantea, arduos probl emas filosóficos. De las mu-
chas experiencias que nombramos con el término "ti emp o", algunas invo lu-
cran nociones relacionadas con la sucesión, el presente, el pasado y el futuro.
O tras con las ideas de instantan eidad , simulta ne idad y duración . Tambi én es-
tán las que tienen que ver co n la flecha temp oral y la irreve rsibilidad del trán -
sito del pasado al futuro. De la noción de tiemp o se deriv an de form a más o
menos direct a ot ras co mo movimiento, velocidad, pulso o ritm o. La dificultad
del llamado probl ema del tiempo radica en art icular semejante variedad de fe-
nómenos y conceptos dentro un sistema coherente.
So n abundantes y variadas las soluciones propuestas ha sta ah ora para re-
solverlo. Pero es posible recon ocer en la h istori a del pensamiento dos grandes
tendencias. La prim era ---que cuenta en sus filas a Ari stóteles, Newt on y Eins-
tein- considera al tiemp o como un he cho físico al que se adapta la mente hu -
man a. La segunda supone que el tiemp o es un fen ómeno que pertene ce a la
mente human a y que el de los físicos es un constructo prov eniente de la idea -
lizac i ón de los co nte n idos mentales. Se pueden situar en esta últ ima línea a
pensadores com o San Agustín, Brentan o o Hu sserl. Para Paul Ricceur estas
opcio nes no se solapan por entero: a la perspecti va física le falta la capaci dad
de conce bir un presente a part ir del instan te, y a la perspectiva psicológica le
falta suste nto a la hora de explica r de forma sat isfactoria el dur ar.
En la actualidad, la mayoría de los investigadores conjeturan que el tiemp o
no responde a un modelo de tipo unívoco, sino que con stituye una ent idad que
se debe pensar desde varias perspectivas diferentes. Según Fraser (1992), existen
al menos seis categorías temp orales: 1. Atemporalidad: en un universo en el que
solament e hay radiac ión electromagnétic a el tiemp o no existe. La emisión y la
absorción de un fotón ocurren, en lo que se refiere al fotón , simultá neamente.
117
2. l' rot oternporalid ad: en un universo de partícu las elementales el tiempo tectar cambios en el estímulo a med ida q ue transcurre el t iempo. La otra, la in-
\'s fragmentario. N o fluye y carece de dirección . Los sucesos se pueden sit uar tegración temporal, es la capacidad de agregar informa ción a medida que tran s-
de forllla estadística porq ue la sing ularizació n de un instante concreto ca rece curre el tiemp o y permi te aumentar la capacidad de discriminaci ón ante un
de sigu ificado. estímu lo de larga duración . La mayoría de los estud ios psicoacús ticos se orien-
3. Eotempora lidad: en e! un iverso macroscópico de la materia dot ada de ta hacia temáticas relacionadas con la resolución temp oral. Sin embargo, la in -
Illasa el tiempo es continuo, pero in móvil y sin d irección. N o se le aplican los tegración temporal juega un rol dest acado en ciertos géneros y esti los musicales
co nceptos irreversibles de pasado, presente y futuro. Es el tiemp o de las leyes q ue emp lean la aliteración de son idos en los que algún parámetro deriva len -
de la mecánica clásica. tamente.' La mayoría de los autores concuerdan en que la resoluci ón tempora l
4. Biotemporalidad: es el tiempo de los an imales. Tiene dirección y existe dep end e principalmente de dos procesos afines. Por un lado se realiza un aná -
un pasado, un presente y un futur o, pero sus horizont es son limitados. Los bor- lisis del patr ón temp oral dentro de cada ca na l del filtro aud itivo y, por el o tro,
des del presente son estables y probab lemente caract erísticos de cada espec ie. se comparan los patrones temp orales correspondientes a cana les diferentes.
S. Nootemporalidad: es el tiemp o de la mente h umana. Existe una clara La mayor dificu ltad al int entar medir la resolución temp oral es consecuen-
noción de pasado, presente y futuro y sus horizont es son ilimitados. El presen- cia de la inevitab le relación entre tiemp o y frecuencia propi a de tod o fen óme -
le tien e bordes difusos, que varían según la ate nc ión . no ondulato rio, que depend e direc tamente de l principio de indeterminación
6. Sociotemporalidad: es el t iempo co lect ivo q ue regula el ritmo soc ial. acústico . Los camb ios en el patrón tempora l de una señal está n acompañados
Lo organ izan los relojes y los calendarios. generalmente de una modificación en su espectro. Por ejemplo, al interrum-
El esq uema de Fraser, aunq ue simple y parci al, sirve para entende r que pir brevemente una sinusoide aparece un espectro de banda ancha que se oye
el pro blema del tiempo no pued e abarca rse por completo desde una sola como un clic muy sonoro . En la figura 1 se aprecia n los gráficos temporales y
perspectiva. sonog ramas co rrespo ndientes.
A l margen de las espec ulaciones conceptuales, el tiem po es un parámetro Puede ocurrir que una aparente detección temp oral sea en realidad un a
acúst ico importante pues casi todos los son idos fluctúan durante su desarrollo. detección espec tral -por ejemplo, el espec tro de potencia de un par de cl ics
Miis aún , para sonidos que co nt iene n inform ación, co mo la palabra y la músi- muy cercanos en el tiemp o es diferente del espectro de poten cia de uno solo
ca, ésta aparece en los ca mbios antes que en las part es estables. En estos casos de ellos. Para ev itar esta clase de confusiones, en las pruebas exp erim enta les
es conven iente distingu ir algunas escalas tem porales diferentes: 1) la microes- se ado ptan dos estrate gias diferent es. La primera consiste en empl ear seña les
ca la, que va desde alguno s milisegun dos a varios cie ntos de milisegundos y que de espectro inv ariante ant e cambios en su pat rón temporal. El ruido blan co,
port a la estructur a fina del sonido ; 2) una esca la que contemp la los camb ios por ejemp lo, conserva el espectro plan o aunque se lo seccio ne repentinamen -
más lent os, caracterizados por las envo lven tes temporales de los parámetros te, ta l como se aprecia en la figura 2.
acústicos, que va desde un as décimas de segundo hasta algunos segundos; 3) La segunda estrategia emplea estímulos cuyos espectros se modific an al al-
otra que conten ga las estructuras compuestas que tom an varios segundos en terarse los patro nes tem porales -como ocurre con las seña les sin usoidales. Pa-
desarrollarse, como palabras y motivos musicales, y 4) la macroescala tempo- ra evitar la confusión ent re detecci ón temp oral y espec tral, a la seña l de base
ral, q ue pued e abarcar minutos enteros y en la que se despliegan oraciones y se le agrega ruido de fond o a fin de enmasca rar las band as de frecuen cia qu e
(rases musicales. Esta últim a escala depende directamente de la memori a de surgen en cada tr ansición. El ruido de Patterson, ya visto en el punto 2 del ca-
co rto término. En los grandes desarrollos musicales, com o el de la forma sona- pítu lo 111, es un o de los más eficaces ya que no altera a la seña l en su banda
ta, tambi én juega un rol deci sivo la memoria de largo término. central (Patrerson, R. D., 1976) . En la figura 3 se puede apreciar la técnica de
Patterson para enmascarar las bandas lat erales que aparecen en las transicio-
nes en una señal sin usoidal.
I . R ESOLUCIÓN E INT EGRACIÓN TEMPORAL
Much as veces se confunden dos noc iones relacion adas con el procesamiento 1 Hay n umerosos eje mplos en la música de l sudeste asiático. En occident e. la integración
temp oral de seña les. Una de ellas, la resolución temporal, es la habilid ad para de- tempora l constituye un proceso cen tra l en el minimalismo.
118 119
+r-- ------------------,
ro
~'"
ro Banda de ruido Banda de ruido
~ enmascarante enmascarante
~'" Señal
ro
T;
c:
o'"
a.
Tiempo (ms)
2. R ESOLUCiÓN TEMPORAL EN SEÑALES DE BAND A A NCHA
120 121
a)
"C
~~~~~~~ iD
E
"C
ro Señal de
"
"C
"C
.¡¡¡
c: I ¡ entrada
.¡¡¡
~
c:
~~~~~~~~
Q)
:g ¡ E
Tiempo (ms )
O 5 10 15 20 25 30
b)
~
"C
~~~~~~.~ m
E
"C
ro
ro Salida "C
.¡¡¡
"C
.¡¡¡ I
:
:: del filt ro c:
i
Q)
c:
s ¡ :g
E
~~~~~~~~ Tiempo (ms)
Tiempo (ms) F igu ra 5 . Seña les de banda ancha empleadas para det erminar el umbra l de det ección de
discont in uidades
Figura 4. Respuesta simulada de un filtro audit ivo de Fe = 1.000 Hz ant e una sinuso ide
secc ionada de 1.000 Hz
de corta duración no cambia si ésta es in vert ida temporalmente. Por lo tant o, D etección de discontinuidades en ruido de banda angosta
si la segunda señal es muy breve y se la distingue auditivamentc de la original
debe ser por la diferencia en su patrón temporal. El umbral de detección entre Para señales de banda angosta mod erada el paráme tro de comparaci ón es el
dos señales de banda anc ha que cambian de amp litud a la mitad de su desarro- anc ho de ba nda del filtro audit ivo que le cor respo nde . Ta l como hem os vis-
110 (de A a 2A ), pasadas al "derecho" e inverti das, es de 2 a 3 ms, valor que to, la detección de disconti n uidades debería ser peor a baja frecuencia por -
coinc ide con el ha llado por Plomp . Los sujetos no se dan cuenta del camb io de que en esa región espectral el ancho de banda de los filt ros aud it ivos es
ampl itud, pero percibe n un camb io tímbrico (oyen "tick" y "tock"). En el grá- menor. Los umbr ales de de tecc ión deberían dis minuir a medida qu e aum en-
fico de la figura 5 se puede n ver las señales ut ilizadas en el experimento citado. ta la frecuencia y por lo tan to el anc ho de band a del ruido, ha sta llegar a l
A lgunos autores ha llaron valores sign ificativamente menores para el um- va lor de la banda crít ica co rrespo nd ien te. A part ir de este punto , un au-
bral de de tección , entre 0,25 y 1,8 ms, pero no se conoce la causa de la discre- mento en el ancho de ban da no debería mej orar la detecci ón de la d iscon-
pancia entre ambos grupos de medic iones . t in uidad . S in e mba rgo, los da to s expe rim ent al es co ntrad ice n esta
afirmación : cuando se introd uce un a discontinuidad su gran des arro llo es-
pec t ra l afec ta sinc ró n icamen te a un a ca n t ida d de filtro s audit ivos - cosa q ue
3. RESOLUCIÓN TEMPORAL EN SEÑA LES DE BANDA A NGOSTA no oc urre co n las va riac iones de amp litud prod ucto de la alea toriedad pro -
pia del ruido . La exc ita ción en par al elo de vari os filt ros auditivos permite
Para seña les de banda angosta, la introducción de una discontinuidad implica que el umbral de detección resul te menor qu e el qu e se obte ndría si sólo un
"desparramar" el espec tro por efecto del principio de indeterminación acústi- filtro fuese puesto en juego . Las mediciones ex pe rimental es co nfirman esta
co. De todos modos, la situac ión es difere nte si se trata de señales de banda h ipó tesis, pues par a ru ido de ba nda angos ta, cuya frecue nc ia centr a l varía
angosta moderada o con espectro de línea, como es el caso de las sin usoides . en tr e 30 y 1.000 H z, los umbrales de det ección de discontinu idade s dismi -
A con tin uación se analizan. amb as posibilidades. nu yen desde un va lor de 40 ms hast a caer por debaj o de 10 ms. Este efec to
122 123
vx de gran impo rtanc ia par a exp licar la paradoja acústica temporal qu e ana-
lizaremos m ás adela n te .
('ar;¡ evita r la co nfusión en tre dete cc ión tempor al y espectral, las sin usoides se
presentan ju n to a un ru ido continuo co n una muesca espect ral sinton izad a a
la frecuencia de la sin uso ide (figura 3). De este modo se co nsigue en mascara r
la disp ers ión del espec tro ocas iona da en la discontin uidad .
En un cé leb re ex perime nto, S ha iler y Moore estud iaro n la detecc ión de
discontinuidades en sin uso ides en foca ndo la atenc ión en la fase de reinicio
de la señal (Shailer y Moor e, 1987). Explicaron sus resultados, que co ntradecían 10 ms
:1 la literatura sobre el tem a, sobre la base de la cola de resonancia ("ring ing" ) Figura 6. Tres condiciones de fase diferente s usadas en el experimento de Shailer y Mame
del filtro aud itivo: cuando la sinusoide cesa, el filtro audi tivo sin to n izado a su
frecu en c ia continúa respo nd iendo por un t iemp o. S i el re in icio de la señal
co inc ide en fase co n esta respuesta del filtro, la det ecci ón de la disco n ti n ui-
dad es más d ifícil. En las figuras 6 y 7 se mu estran las seña les emp leadas y las Señal con discontinuidad Salida del filtro auditivo
respuestas del modelo an te discontinu idades de d ifere nte d uración.
En ·Ios casos en los qu e la seña l "e nga nc ha" en fase co n la respu esta del
nitro aud itivo , Sh ailer y Moore midi eron umbra les de 4,5 ms, co ns iderable-
ment e mayores a los 2 o 3 ms esperados.
AJvdJ'v - AJ\fvvvvv\NV
~-rvvvvwvvvv
4. M ODELOS DE RESOLUC IÓN TEM PORAL
La resp uesta del filtro a ud itivo a n ivel coclear es muy rápid a para altas fre-
f\Jk;!\fv - W\JVVVV\M
~ - W\JVVVV\M
cuenc ias y, por lo tan to , se supo ne q ue debe exis ti r un limitador a otro ni vel
de procesamiento n eur al, En general, se asu me q ue los ca mbios ráp idos so n
suav izados en alguna de las etapas superio res del proc eso . Casi todos los mo-
delos elaborados para dar cu enta de la reso lución tempora l co nstan de cua tro
l'lapas, similares a las qu e se ap recian en la figura 8. ~ - W\JVVVV\M
• En primer lugar aparece un filt ro pasabanda que corresponde a cada uno
dl' los filtros aud itivos co nectados en paralelo.
• A co n tin uac ión, la seña l es procesada po r a lgún d ispositi vo n o lin eal.
• Luego pasa por un in tegrado r tem poral , que puede caracterizarse como
~ -rvvvvwvvvv
1111 f¡ It ro pasabajos.
• l' o r últ imo , el producto de los primeros tre s bloqu es entra a un módulo
~- AJ\fvvvvv\NV
de dec isi ón que det erm ina qué es lo que se va a perci bir ante la d iscontinuidad .
Figura 7. Salida de un filt ro aud itivo simulado con Fe ; 400 Hz en respuesta a una sinu-
ES I·os bloqu es co rrespo n de n a d iferentes pro ce sos q ue tr ansforman la soide, con d iscontinuidades de 1,2 a 3,7 rns en la condició n de fase está ndar (experim ento
se ña l del cst ím u ]o. De tod os ellos , el módu lo de decisión es quizá el más de Sha iler y Moore)
124 125
S. OTROS PROCESOS T EMPORALES
Estimulo
I Zó 127
iia !. Esta regla se cu mple tan to para la d iscriminac ión de la dur ac ión en son i- que esgrime pa ra defender dicha hipótesis es la del des plazamie nto temporal
d"s co mo en silencios en tre son idos. Valores típicos de ~T son de 1,7 ms pa- de est ímulos ac ústicos extremos: tom an do la sec uencia [al - b - azl en el t íem -
ra T = 25 ms y de 15 ms para T = 32 0 ms (Di ven yi y Danner, 1977 ). La />0 físico t, si el est ímulo central b tie ne un a frec uencia que difie re de forma no-
fracción de Weber, ~Trr, decrece levem ente al aumentar T. Como con cas i rab le - por eje mplo cuatro octavas- de los estím ulos laterales y escogemos
I"dos los paráme tros qu e cuantifican la discriminación aud iti va, se encontró estímulos muy breves -del orden de los SO m ilisegundos- , lo que se oye en el
que ~T aumen ta a intensidad es próximas al umbral de audíbilidad. tiempofenoménico T es un a sucesión d ist inta [Al - A z - B], Los sonid os más agu-
Estos va lores se correlacionan con los de integración temporal de la sono - dos se oyen seguidos y el sonid o intermedio, más grave, se ve relegado a l final
ridad , en part ic ular con el postulado de Henning que establece qu e, al eva luar de la sucesión (V icario, G . B., 1997). En la figura 10 se puede ver un esquema
la sonoridad en est ímulos de corta duración, prevalece la cantidad to tal de de l experimento. La dife rencia entre las frecue ncias de al Y az corresponde a
energía en lugar de la intensidad de la seña l, tema q ue tratamos en el capítu- un intervalo de segunda mayor desce ndente.
lo 11 , pu nto 4 (Henning, G . B., 1970). Vicario co mpro bó q ue en el caso de que los estímulos al Y az sea n nota-
bleme nte más exte nsos q ue b el fen óm en o se hace más ev ide nte, incl uso de -
saparece la noción de "local ización temporal" de b, que parece flotar sob re los
(l. JUICI OS SOBRE EL ORDEN TEMPORAL dos son idos agudos . Llega a la co ncl usión de qu e las sec uenc ias de estí mulos
no hom ogéneos son más propi cias para la producc ión de despl azami entos
La habilidad para juzgar el orden tempora l en una sec uencia de sonidos dep en- te mpo rales.
de en gra n med ida de la tar ea asignada al sujeto : una cosa es la identificación El desplazami en to tem poral no se puede atribuir a ni ngún proceso fisioló-
de l orden que ocupa cada son ido dentro de la sec uencia y otra la discrimina- gico y no parece senc illo exp licar de qué modo relacion es específicas no tem -
cirín ent re secu enc ias con distinto orde n, sin q ue se pueda precisar la ubic a- porales -como semejanza o disim ilaridad- pueda n interaccionar con relacion es
c ió n de cada son ido en el co nj unto. temporales ta les co mo antes/después. La exp licación más d ifundida supone que
En el caso de la identificación del o rde n temporal, Hirsch encontró q ue la posición de los son idos en el tiempo feno ménico se decidiría luego de ha-
sujetos entrenados ne cesitaban al men os 20 ms por son ido para det erminar el ber o ído todos los estí mulos. La operación , preconscien te , tendría lugar en el
orden en una secuenc ia (Hirsch, 1. J., 1959) . En el caso de la discriminación lapso de aproximadamente 200 ms que va desde la llegada de las seña les al
en tre secuencias la reso lución es más fina, y se neces itan entre 2 y 7 ms por tímpano y la pe rcepción consciente de las mismas (Frai sse, P., 1967).
so n ido. Estos valores son de gran importancia para com pren der el desplaza-
mie nt o ac ústico temporal, que prese n tamos a co n tinuación.
Las pruebas exp erimentales refer idas a l desplazamiento entre el tiempo físico
y el feno mén ico fueron ini c iadas por Whilhem Wundt y co n t in uadas luego
por Edga rd Rubi en, qu iene s logra ron tran sform ar un fen óm eno de simu lta ne i-
O
I
a , =1.800 Hz
I
80
b =66 Hz
Tiempo (ms )
I
160
a, = 1.600 Hz
l.
240
dad física en un a sucesión psicológica. Varias hipótesis fuero n propu estas por
en tonc es para dar cuenta del fen ómeno, y ent re ellas prevalec ió la q ue supo-
¡lía que la hetero geneidad de los estímulos const ituye el factor responsable de A, A,
le IS desplazamientos temporales. B
En la década de 1970 el psicólogo ita liano Giov anni Brun o Vicario desa-
rrolló una serie de trabajos sobre el fenó meno del de splazamiento tempo ral en Tiempo
la aud ición, en los q ue plantea la imposibilidad de est abl ecer un a correspo n-
den cia biun ívoc a entre el tiempo físico y el psico lógico. Una de las ev idencias Figu ra 10 . Esquem a Jet exp er imento de Vicari o
128 129
Límites de validez delfenómeno a)
U na cond ición neces aria para la ocurrencia del desplazami ento temporal es
que las dist intas seña les no deb en conec ta rse espectralmente en las tran sicio-
nes. De hecho, la reproducción literal del experimento de Vicario no da el re-
sultado espera do. El mot ivo h ay que buscarlo en el perfil d inámico de las
señales: si las transicio nes son bruscas (figura 11a) aparece un gran anc ho de
banda q ue destru ye la separac ión espec tral est ipulada en la hip ótesis origina l.
La aparente anomalía se debe simplemente a que no puede ser quebrantado el
límite imp uesto por el princ ipio de ind eterminación acústico . El efecto se
aprecia claramente en el diagrama tridimensional de la figura 11 b.
Si se suav izan las tran sicione s en tre las señales, por eje mplo con ventan as Tiempo
te mpo rales gaussianas, se eliminan los puentes espectrales que conec tan la re-
495 ,92 ms
gión aguda con la grave y el fenómen o de desplazamiento temp oral se percibe
520,23 ms
con claridad . En la figura 12 se observa la señal de prueba modificada y el efec- : . . . . - - - - 544,54 ms
to espectral derivado. Se ve cla ramente la mayor independ en cia (separación
espec tra l) entre las seña les al Y a2 con respecto a la seña l b, que corresponde
Frecuencia (Hz)
a la condición de no homogeneidad de los est ímulos postulada en los trabajos
in ici ~ les (Basso, Guillén y Liut , 2000). Figu ra 12. a ) Deta lle de la secuenc ia te mporal con transiciones gaussianas largas. b) Gr á-
fico TEF de la misma secuencia
a)
A plicación musical
"O
ro
"O
.~ o Estas experiencias controladas --como reco nocen casi todos los invest igadores
'"
E que parti cipan de ellas- , por su simplicidad d istan basta nte de lo que sucede
en la vida cotidiana . Es posible, sin embargo , encontrar en muchas obras de
música el uso -inten cion al o no- de alguna de estas peculi ar idades de la per-
cepció n audi tiva. Por trat arse de situac iones musicales reales (esto es, dentro
del con texto de un a "puesta en obra") no tienen la in ten sidad y la claridad
b)
que se puede lograr en el marco ascét ico de un laborat orio.
De ac uerdo con sus objetivos y con los presupuestos est ilísticos involucra-
Tiempo dos, un compositor puede decidir el modo de aplicació n del desp lazamiento
~_ O , O m s
acúst ico temp oral. Si su int ención es ind ependizar y desv inc ular difere ntes ele-
57,32 ms
mentos de un conjunto, la estrategia planteada permite desdoblar la estructura
171,97ms
en dos tramas temporales separadas y autó no mas. U n eje mplo que ilustra esta
téc n ica se enc uent ra en la pieza para orq uesta reducida Homenajea GarcíaLar-
344 689 1033 1378 1722 2067 2411 2756 ca (1936 ) de Silves tre Revueltas, en la que la misma melodía se interpreta en
Frecuencia (Hz) paralelo con una tuba y una flaut a piccolo a distancias de cuatro y cinco octa-
FiJ.:llra 1 l. G r ñflco temporal y tie mpo-e nergía-frecuencia (TEF) de la seña les de la secuen- vas. Aunque el paralelismo absoluto de alturas y duracion es debería ayudar a
d a original fundir perceptualmente los instrum entos, la eno rme separación de los registros
130 131
Capítulo V
Tiempo
Percepción de la altura tonal
._ 15.06 ms
> - - - - - 1,391 s
Frecuencia (Hz)
Figura 13. G ráfico T EF del fragrnento citado de Homenaje a Garcfa Larca de Silvestre
La altura tonal se define técn icamente co mo "aquel atrib uto de la sensación
Rev ue ltas audit iva en té rminos del cua l los sonidos puede n ser orde nados en una escala
musical" (A merican Sta nda rds Associati on , 1960) .1En otras palabras, una se-
cuenc ia de sonidos que varían de altura to na l t iene el carác ter de una melo-
y la ausencia de puentes espectra les rompen la relación temporal entre ellos. A l día . Un ejemplo quizá ayude a delimitar este conce pto .
oí r el pasaje se percibe una ambigua sensación de "desajuste", provocado por el Si se alte ra la ec ualización en un siste ma de audio cam bia el brillo del so-
dcsfasaje ent re tie mpo físico y psico lógico prop io del fen ómen o bajo aná lisis. nido y, en cierto senti do, algún aspecto relacion ado con su altura. Pero hay
En la figura 13 se puede ver un gráfico TEF de dic ho fragmento. otros elementos que no se mod ifican , pues el ca mbio en la ecualización no ha -
Por el contrario, si el propós ito de l auto r se dirige a la fusión de estructu- ce que el Do de una flauta se sustituya por un Re, n i que el fragmento module
ras, el fenó meno de desplazamiento temp oral debe ser evitado. Ad emás de re- a otra to na lidad. Estas características -que perman ecen invariantes frente a los
ducir la distancia espectral que separa a los estímulos, es necesario agregar dato s cambios en la distr ibución de energía del espectro- definen la altura to na l pre-
espectrales que sincro n icen las secuencias en las zonas de tran sición . C iertas ar- sente en los son idos llamados tónicos (Sc ha effer, P., 1966) . La tonicidad de un
ricul aciones y ataques destruyen la paradoja tem poral, sincronizando el tiempo sonido es el rasgo perceptua l que permi te que se lo ident ifique con un o de los
físico con el psicológico. Aquí una cu idadosa elección de los medios instru- grados de la escala musical. Lo que cambia al modificarse la posición de los cur-
mentales, que incluye tan to los instrumentos mismos co mo las demás var iables sores de un ecualizador es la distribución de energía en el espec tro de la seña l.
invo lucradas -registro, mati z, art iculación , etc.- result a decisiva. Esta distribución de energía se asocia con la percepción de la altura espectral del
son ido: dos guitar ras que emiten la misma not a, una de son ido met álico y la
otra de sonor idad oscura, producen la misma altura tonal pero distintas alturas
espec trales (es habi tual decir que la primera es "más aguda" que la segunda ).
El grado de to n icidad varía de un son ido a otro: una flauta genera son idos
muy tóni cos, una marim ba son idos de to n icidad intermedia y un tambor ge-
nera seña les de ton icidad nul a. En una primera aprox imació n podemos esta -
blece r qu e el grado de tonicidad guarda relación con el anc ho de ban da de la
seña l física: a mayor anc ho de banda menor tonic idad, y viceve rsa. El princi-
pio de indet erminación acústico gob ierna la relación frecuencia/du ración en
los casos anteriores. La altura ton al se conside ra co mpleta o "fuert e" cuand o
permite la form ación de aco rdes y funciones tonales, e incomp leta o "débil "
In 133
l'u:lIldu no lo hace. Por ejemplo, co n tres torn-toms de band a angosta se pue- o . 1__ _
.-_.. __._._-
........
-6
d(' gene rar una secuencia melódica Do-Mi -Sol, pero si se los ejecuta sirn ult á- -12
-18
nc.uucntc no se forma el aco rde de do mayor: los torn-torns poseen altura -24 - -í - -- - --- ,-,-- - -' ..
al -36
En general, las seña les per iódicas son perc ibidas como son idos tóni cos, a ~ -42
-e -48 ::.L -'
l, .s que se puede asigna r un valor de altura to na l definido que se correlaciona - -
=ª
~-
-54
ií
d irectamente con la fund amental de Four ier de la seña l. Se presenta aquí una E -60
<t: -64
de las propiedad es más notables del sent ido de audición: percibimos con una -72
·78
nltlira tonal úni ca los son idos ca usados por est ímulos periódicos, al margen de -64
la co mplejidad armón ica que posean . En la figura 1 se pued e ver el espec tro de -90
-96
un son ido de violonce llo. 500 1k 2k 5k 10k 20k
100 200
La ca ntidad de armón icos es aquí muy grande. Sin embargo, se oye clara- Frecuencia (Hz)
mente una sola altu ra to na l. En estos casos el sistema auditivo presta más aten-
c i ón a la salida de un hi potético centro de procesa miento de la altura (que Figura 1. Espectro de un son ido de violonce llo
se ñala una úni ca sensac ión de altura to na l) que a las características de la altu-
ru espectral o prim aria del son ido. Si se desea oír en det alle cada comp onente
nisludo es necesario inhibir el mecani smo anterior, ope ración que dem and a un bilidad a la fase del siste ma auditivo- Co mo esta sensibilidad desaparece para
t icmpo considerab le y que exp lica la dificul tad de percibir por separado los ar- frecuenc ias por encima de los 5 kHz, la teoría tem poral no explica la percep-
iu único s superiores en los son idos de corta duración. Se deno mina audición ció n de la altu ra tona l a altas frecuencias.
mlCllítica a esta última forma de oír y audición sintética a la pr írnera.?
A lgunos auto res, entre e llos Terhardt, sugieren q ue la capacidad para sin-
t ctizar gran cantidad de armónicos en una únic a altura ton al se aprende du - 1. PERCEPCi ÓN DE LA ALTURA T ONAL EN SINUSO IDES
run rc la primera infan cia a partir de la reit erada. exposición a sonidos
peri ódicos, en especial la voz humana (Terhardt, E. et al. , 1982). A comienzos del siglo xx el psicólogo Hermann Ebbinghaus postul ó que se de-
A lo largo de este capítulo nos enco ntraremos constantemente co n dos be remover toda la inform ación superflua en el estudio de los estímulos y sus
teo r ías que trat an de explicar la percepció n de la altura tona l. Una de ellas es respuestas psíquic as. A partir de esta regla, que mezcla principios to mados de
la rcorfa del lugar (véase cap. 1, apartado 4) , que parte de dos postulados distin- las ciencias físicas y una mala lectu ra del teorema de Fourier, se impu so una
lusoEl primero esta blece que el oído efectúa un aná lisis espectral en el interior tradici ón en la que se emplean casi exclusivamente seña les sinusoidales para
de la c óclea: diferentes frecuencias excitan diferentes lugares de la membrana los experimentos de psicoacú stica. En con secuencia, también se utili zaron es-
hasilar, en una especie de organi zación ton ot ópica. El segundo postul ado afir- tímulos sinusoidales para estudiar la percepci ón de la altura tonal. Sa bemos,
lila que la altu ra to na l se relacion a con el patrón espac ial de excitació n produ - sin emb argo, que las sinusoides son seña les de prueba inadecuadas porque la
cido por el estímulo. La primera hip ót esis es aceptada por la casi to talidad de altura to na l se asoc ia en gran medida a la per iodicidad de los est ímulos armó -
I, .s invcst igadore s, mientras que la segunda todavía es mat eria de discusión . nic os complejos, qu izá por nu estra capacidad para agrupar los diferentes com-
U nn Il'oría alte rna t iva a la teoría del lugar es la teoría temporal, que sugiere que ponentes espec trales presentes en la voz human a. La altura to na l origina da en
la alllira se relacion a con el patr ón temporal de los impulsos neurales origina- una sinu soid e result a imprec isa e inestable, como puede comprobar cualquier
dos en e l est ímulo. C omo los disparos de las células nerviosas tienden a ocurrir oyente ante una melodía realizada con tonos puros -habituales en las seña les
('1\ una parti cular fase de la forma de onda, intervien e nec esariamente la sensi- de espera de los contes tadores telefónicos.
Ad emás, cuand o los estímulos son simples y poseen solamente un a sola
¡ I'.. r "¡" lIIplo, ( j"rard l orisey tuvo que ralentar las masas sonoras en Pan iels, compuesta en
frecuencia destacada, la altu ra tona l se confunde en part e con la altu ra espec-
1')71, para "u.. s(· pudier a o ír la evolució n de cada co mponente (parcia l) aislado. tral. En cierto sentido, un a sin usoide contiene su propio tim bre , ya que al rea-
135
IH
Iizar un barrido ascen dente en frecuen cia del úni co armón ico presente (la si- lo largo del tiempo. Para la teoría del lugar ambas habilid ades están relacion a-
nusoidc misma) se excitan sucesivamente zonas adyace n tes en la memb ran a das, pues dependen del filtr ado en frecuencia de la cóclea. Para las teorías
hasilar. El resultado perceptu al es un glissando aco mpañado de un ca mbio temp orales la relación no es tan marcada.
co ntinuo del co lor ton al. Un ejemplo tradici on al de esta confusión entre al- El limen -mínima variación dete ct able en frecuencia- permite evaluar la
I m :1 rona ] y espec tra l lo brinda la escala de altura, ex presada en mels, que se discriminación en frecuenc ia y crece mon ótonamente con el valor de la fre-
muestra en la figura 2. cuenc ia del estímulo slnusoida l.' En las figuras 3 y 4 se pueden observar sus va-
Los valores de altura en mels, elaborados a partir de estím ulos sinusoidales, lores absolutos y relati vos. El valor relativ o del limen, expresado en relación con
d ifieren notablemente de los obten idos a partir de seña les armónicas complejas. frecuencia central Fe, tiende a ser men or a frecuen cias centrales y aumenta a
Para algunos auto res, la escala en mels describe simplemente el brillo tímbri co medid a que el estímulo se desplaza hacia los extremos del espectro audible. Por
de los son idos simples y no es aplicable a la altura to na l ta l como se la entien- ejemplo, el limen absoluto es aprox imadamente Lif = 2 Hz para una frecuencia
de en la práct ica musical. A prin cipi os de la década de 1970, Fred Attneave y central de 1.000 Hz y corresponde a un limen relativ o de 0,2%.
IZich ard O lson postularo n que para estudia r las escalas musicales se deben Es habi tu al realizar las ex per iencias de med ición del limen a part ir de dos
emplear las seña les complejas q ue se usan en la prácti ca musical concreta métod os: la variación en frecuencia de sin usoides aisladas y la var iació n en
(A rrneave y O lson , 1971) . Los experimentos que realizaron a part ir de este frecuenc ia de la señal mod ulador a en un dispositiv o de frecuencia modul ada
postu lado diero n resultados mejor cor relac ionados con un vínculo logar ítm ico ( FM DL).4 Los resultados de las experiencias de FMDL se utili zan, por eje mplo, en
cutre la frecuenc ia del estímulo y altura tonal que la escala de mels, al men os el cálcul o de los índices de inteligibil idad de la palabr a en siste mas de co mu-
dentro del rango de las frecuen cias fund amentales que se emplean en música. . nic ación. En el capítu lo IX desarrollaremos este tópico.
C ontrar iamente a lo predi ch o por la teoría del lugar, el DLF no varía con
Discriminación en frecuencia la frecuencia del mismo modo que la band a crítica y dism in uye al aumentar la
sonor idad del estímulo. A partir de estos dato s la mayor ía de los investigado-
( :OIll O ya señalamos, es ne cesar io dist inguir entre selectividad en frecuencia, res se incl inan por las teorías temporales al propon er sus model os, aunque los
q ue es la hab ilidad para d ist inguir com pone ntes en un son ido complejo, y dis- result ados experimentales sugieren que existe un mecani smo temp oral para las
crilll inación en frecuencia, la capaci dad para de tec ta r ca mbios de frecuencia a bajas frec uencias y un mec ani smo to no tópico para altas frecuencias.
Zwicker y Henning crearo n un model o mixto que produjo result ados con-
3000 .-----.--.----r-,---r--.----r---,----" sistent es con los valores medidos de DLF y de FMDL (Zwicker y Fastl , 1999). Es-
te modelo esta blece que el limen está det erminado por la información temp oral
2500 -l , ¡ ; , (sen sibilidad a la fase) para frecuen cias de hasta 5.000 H z -la sensibilidad a la
fase decrece al llegar a 2 kHz y desaparece a 5 kH z. Por encima de 5.000 Hz
2000 tanto el DLF y como el FMDL parecen respond er a una suerte de teoría del lugar.
(j)
ID
E
-; 1500 Variación de la altura tonal con la sonoridad
.3
<i:
1000 Stevens constató en 1935 , a partir de est ímulos sin usoida les, que la altura to-
nal varía con la sonoridad del estímulo (Steven s, S. S., 1935), En la figura 5
500 se muestran los resultados del experimento origina l.
1() 20 50 100 200 500 1000 2000 5000 10000 J Se la co noce co mo DLF por sus iniciales en inglés (difference limen in frequency) y, como
Frecuencia (Hz) tal, pertenece al con junt o de parám etros de discr imin ación agrupados como "m ín imas di-
feren cias perceptibles" (JND, de jusr noriceable difference).
Fi¡:ul'a Z. 1 ~ ( 'I : l(" i l 'J1 \ vn rrc alruru (m edid a en mels) y frec uenc ia 4 FMDL (difference limen in modulation frequency),
I \(\ 137
15 -T--~--~-~---,---~-~~
100,0 ..+ t+ ..·,·· ·+..· ·· !· ..· · ·..· + i - .._ + /c, ¡ j 8000!Hz
;
5600 Hz
50,0 -+ ++ + + ¡- ·_¡· ·..;······..·/~ ·¡ ..·.._ - _ · · ·,i.._·· j 10 ~ _ ; ¡..¡ ··················t
¡ ¡
1 .
~ 5
...................i
~
"-
5,0 -+ ++ +· ·;;···..· ·.. j,.-<·.., ·· f · ·¡·· ·· _L _ .; j
~ .........! .....1000..~z.....
0 +'~~=--r---+---+--=;k1~:t!=l
1
<l ~
~
0,5
+.. . + Shower y Biddulph (1931)
· 1O ~ ¡ ¡ ¡ ·.. ¡ "k
100 Hz
-15 +----+--;.......--+---',--+---+----l
o 125 250 500 1000 200 0 4000 6000 8000 12000 40 50 60 70 80 90 100
Nivel son,?ro (to nes)
Fre cuencia (Hz)
FiJ.:lIfa 3. Limen abso luto en frecuencia para estímu los sin usoid ales. En la medici ón de Figura 5 . Variaci ón de la altu ra co n el ni vel son oro
Shower y Bíddulph se emplearon FMDL
Aunque los datos actuales son menos profundos que los medid os por Ste-
vens , el fenómeno ocurre y, para señ a les alejadas del centro del espec tro audi-
ble, la vari ac ión en a ltura tonal puede superar el 5%. Este fenóme no no tiene
aún exp licació n teór ica.
La variac ión de la altura tonal con la sonor idad desapar ece cuand o el es-
.~ 0,02
tímulo está cons tituido por señales armónicas complejas y no es, por lo tanto,
e LRF (DLF)
Q) apreciable en la mayoría de los son idos que se usan en música.
::>
o LRF FM 10 Hz(FMD LF)
~
.!l1
ro 0,01 ....
e
-o 2. PERCEPC iÓN DE LA ALTURA T ONAL EN ESTlMULO S A RMÓNI COS COMPLEJOS
.~ . 'o,
c.
fe?
c. 0,005 A pesar de la gran cantidad de estud ios realizados a partir de est ímulos sinu-
e
Q)
soidales, la altura to na l es un rasgo propio de los son idos tón icos der ivados de
.~
ro señales periódicas complejas, cuyo espectro es aprox imadamente arm ónico.
~
e El nacimiento del concepto de altura tonal está asociado al desarrollo his-
Q)
:5 0,002 tórico de los modelos exp licat ivos de la relac ión frecuencia-a ltura y del per-
250 500 1000 2000 4000 8000 feccionam iento de los métodos de medici ón en psicoac ústica, En el siglo XIX,
Frecue ncia central (Hz) Fechner llegó a la idea de q ue existe un a transformación logar ítmica del estí-
mulo físico a part ir del uso de métodos diferenciales para sus experimentos. A
Fi¡:U r:l 4. Limen rclutivo en frecuencia para estímu los sinusoida les. El FMDL se o btiene con
mediados del siglo XX, Stevens compa ró las alturas tonales provenientes de es-
un a ruod ulac i ón en frecu en cia
t ímulos sin usoida les y prop uso la esca la de mels . Sus resultados difie ren de los
de Fechner, en particu lar en los extremos de l registro. Más tarde , Sheppard
11H 139
sostuvo que amb os métodos resultan incorrectos a la hora de eva luar y da r res- similar al aná lisis clásico de Fourier, para determ inar las compo nentes sinusoi-
puesta a la cuestión de la alt ura tona l, y que se debe centrar el estudio en la dales de la seña l compleja. La segunda etapa consiste en el reco nocimien to de
tasa de repetición de Fourier de la señal acústica . los esquemas o pat ron es que det erminan la altura ton al conforme a la salida
Sin duda, hayal menos dos diferentes clases de altura tonal: la que deri- de la primer a et apa.
va de est ímulos diacrónicos o sucesivos y la que proviene de estímu los sincró- En el año 1962 Schouten realizó un a expe riencia que provocó la apari -
nicos o simultáneos. Aunque la esca la de mels no es una escala apropiada para ció n de gran ca ntidad de modelos teóric os que inten taron dar cuenta de los
usos musicales, captura sin emb argo algún aspecto importante relacionado resultados (Schouten ,] . F. er al. , 1962) . A partir de sinusoides modul adas en
con la altura tonal de los son idos diac rónicos. A lgunos datos estadísti cos, co - amplitud gene ró, en primer térm ino, seña les co n tres co mpone n tes de 1.800 ,
mo la mayor cantidad de intervalos cerrados en e l rango central de frecuen- 2.000 y 2.200 H z. La altura to na l percibid a co rrespo ndía, como era de espera r;
cias, están relacion ados con la escala de mels. También tiene algo que ver con a la de un a sinusoide de 200 H z, funda mental de Fouri er del trío de armón i-
el liril ]o de los son idos, tal como comentáramos antes. cos anteriores. Luego gene ró otra seña l co n compone ntes de 1.840, 2.040 y
La teor ía del lugar clásica tiene dificultades a la hora de describir la per- 2.240 Hz (qu e son los armó nicos 46, 51 y 56 de un a fundamen tal de 40 Hz).
cepción de seña les comp lejas ya que, por lo gene ral, la altura ton al no co- Los oyentes, sin emb argo, percibían un son ido co mpuesto cuya altura tona l
rrespo nd e a la posición de l máxim o de exc itació n en la membran a basilar. predo mina nte era similar a la de una sinusoide de 204 Hz, junto a dos alturas
U na demostr ación co ncl uyen te la provee el fenómeno de la fund amental re- secundarias que se podí an asocia r con sin usoides de 185 y 227 H z. Ni nguno
const ruida o fantasma, descrito por Schouten en 1940 com o e l "residuo" de de los sujetos que parti ciparon de la experiencia percibió la altura cor respon-
batido de un grupo de armó n icos co nsecut ivos.5 La perc epci ón de este resi- diente a la fundamental de Four ier de 40 H z.
duo no requi ere ac t ividad en el punto de la MB que responde a un a sin usoi- El mod elo propu esto por Wa lliser, en 1969, para ex plica r estos resultados
de de altura similar. Tiemp o desp ués, Lickl ider (9 56) dem ostr ó que la co nsta de dos pasos: 1) se ca lcula la altu ra det erm inada por la diferencia de
a ltura del residu o persiste aún cuando los ca na les en la MB co rrespo nd ientes frec uenc ia en tre parci ales vecinos (la tasa de repet ición de la env ol vente) y
a la fund amental de la serie armó n ica se en masca ran con ruid o de baja fre- 2) se busca el subarmón ico del compo ne nte de men or frecuen cia que mejor se
cuenc ia: los son idos de baja frecuenc ia qu e se perciben, asoc iados al resid uo ajuste a la frecu en cia encont rada en el paso primero ." Este modelo aplicado al
de bat ido, apa rece n a partir de los ca na les exc itados por los componentes de ex perimento de Sch outen da 200 H z en la primera operación (1) y 204, 4 H z
med ia y alta frecu en cia de la seña l. (1.840 Hz / 9) en la segunda operac ión (2). Esta últ ima es la frecuenc ia que
Varios mode los fueron propue stos par a explic ar la inc ide ncia de la fun - det er mina la altura to na l.
da mcnta l reco nstru ida en la percepción de la altura ton al. Una primera cla - En 1972 Terdhardt sugirió, inspi rado en el model o de Walliser, que la al-
se de model os, los llamados modelos de reconocimiento de patrones, asume qu e tura residual es un subarmón ico de un compone nt e dominante y discrimina-
la alt ura de un son ido com plejo se de riva de las seña les neurales corre spon - ble, sea o no el de menor frecuencia. C uando los parciales está n muy próx imos
clientes a los estí mulos primarios en la membran a basilar, por ejemplo las fre- en frecuen cia no pueden discriminarse y resulta imposible oír la altura resi-
cucnc ias de los parciales ind ivid ua les. La segunda clase de modelos sost iene dual. Estimó que los parciales dominantes caen en la región espectral com-
que la percepc ión de la altura tonal se asienta en la eva luació n de int erv a- prendida ent re 500 y 1.500 Hz.7
los te mpora les. Veam os cada un a con det alle . Unos años después, Terdh ardt sugirió que la capacidad necesar ia para ha-
ce r uso del mecani smo propuesto en su model o apare ce en una fase tem pran a
Modelos de reconocimie n to de patrones del aprendizaje, en la que esta mos expuestos sobre todo a los son idos del ha-
140 141
bla (Terdha rdt, E., 1974) . Afirm ó que apren de mos a asoc iar la frecuenc ia de a) 1 2 3
un compo ne nte del estímulo con los subarmón icos del mismo: la estimulación
de un solo armón ico produc e alturas probab les a las frecuen cias de los subar-
m ónicos, C uando un comp lejo armón ico se presenta, la mayor cantidad de
coincidencias a la frecuenci a de la funda mental determina la altura ton al de l
son ido. Para son idos no armónicos (como el de la expe riencia de Scho uten )
no hay coincidencias exactas y la sensació n de altura no resulta tan precisa.
b) l' 2' 3'
Q ueda claro que este modelo requiere del aná lisis de más de un parcial de la
seña l de ent rada.
Más o men os en la misma época , Goldstei n prop uso un modelo en el que
- V
la altura tona l de un son ido comp lejo es derivada por un procesador centra l
que recibe información sólo de la frecuenc ia de cada component e, soslayando
la información aportada por la amplitud y la fase (Goldste in, J. L., 1973 ). El
procesador presume que todos los est ímulos son periód icos y que todos sus es- Figura 6 . For mas de onda de dos seña les mod uladas en amplitud. En el primer caso, la
pectros comprenden armón icos sucesivos. Los errores de estimac ión de la fun- port ador a (2.000 Hz) es un múlti plo exacto de la modul adora (200 Hz) y el período entre
damental ocurren al estimar el número de armón ico apropiado . Ap licado al picos correspond ientes ( 1-1', 2, 2' ) es de 5 rns, En el segundo la frecuencia de la porta dora
experimento de Schouten, los armón icos de 204 Hz exp lican razon ablemente aumenta a 2.040 Hz y el int ervalo ent re picos es algo menor a 5 ms
bien los com ponentes de 1.836, 2.040 y 2.244, pero no dan cuenta con igual
exac titud las frecuencias de 185,5 Hz y de 226,7 Hz - cercanas a las de 185 y
227 Hz percib idas en el exper imento original. en la estructura fina de la onda en la membran a basilar (Sc houten registró la
Los modelos de recon ocimi ento de patrones depen den de la resolución seña l en el pun to de máxima oscilación en la MB) . Si hay más de un interva-
espectral de la memb ran a basilar, pero no implican necesar iamente el uso de lo temporal posible, la altura tonal corresponde a la cresta más prominente. Si
información tonotópica per se como una med ida de la frecuencia. se considera la representación de la seña l a nivel neural adquiere sign ificación
el intervalo temporal ent re los disparos nerviosos similares. Si el sistema '.'con-
Modelos temp oral es tase" simplemen te la cantidad de disparos por segundo, el modelo de Schou-
ten no podría funcionar.
Para dar cu enta de su célebr e experime nto, Sc houten prop uso un modelo
basado en el patrón temporal que desar rolla la onda del estímulo en la mem- Evidencia experimental rel evante a cada modelo
brana basilar. Segú n su model o, la altu ra tonal es det erminada por la perio-
dicid ad de los parciales involucrados en la determ inac ión del residuo. El peso La región de existencia de la alturaresidual
relati vo de cada parci al depende de su capacidad para atraer la ate nc ión del
oyente, ya sea por sono ridad o por co ntraste con est ímulos previos. De acuerdo con la teoría de recon ocim iento de pat ron es, la altura residual só-
La gran difere ncia ent re los modelos temporales y los modelos de recono- lo se puede perc ibir cuando al men os uno de los componentes sinusoida les del
cimiento de patrones es que estos últimos requieren que más de un parcia l sea estímulo puede ser oído en forma separada . Es decir, que necesita ser discrimi -
discriminable del co mplejo para que se perciba la altura del residuo, mientras nable. Si el estímulo posee únicamente armón icos muy altos no resoluble s la
que los primeros sólo piden que los parciales int eractúen, no que sean discri- altura residual no debería percibirse.
min ables (no es nece sario que sean perc ibidos separados). Ritsma enco nt ró que el carácter tonal de la altura residual existe ún ica-
En la figura 6 se muestran los resultados tem porales del experimento de mente dentro de una región de frecuencias limit ada, que llamó la región de
Scho uten, existencia (Ritsma, R., 1962). C uando el núm ero del armón ico es muy grande
La altura residual se deter mina por el int ervalo temporal ent re máximos (por enc ima de 20 O más) se oye un zumbido de altura indefinible. Tiempo
142 143
después, Plomp hall ó que la a ltura residu al puede percibirse para tasas de re- Evidencia del rol de mecani smos centrales de procesamiento
petición de hasta 1.400 Hz, dato co mpa tible - aunque no idéntico- co n la pro-
puesta de Ritsma (Plornp, R., 1967) . Houtsma y G old stein encontraron q ue es posibl e percibir alturas residuales
A co ntrapelo de las h ipótesis anteriores, Moore esta bleció qu e para armó - cuand o los armó n icos sucesiv os se presentan alte rna dos entre los dos oídos,
nicos de orde n elevado h ay un ran go de te rminado en el cua l se puede oír una por eje mplo los armónicos pa res al o ído dere ch o y los impares al izqu ierdo (es-
a ltura residu al aun cuando ninguno de los armón icos pueda oí rse po r sepa ra- tímul os d ic óticos): este hecho no puede ex plica rse co nforme a los modelos
do (Moore, B., 1995 ). Los mod elos de reconoci miento de pat rones no puede n que requ ieren la interacción de los co mpone ntes en la mem bran a basilar co -
dar cuen ta de este hech o. De tod os modos hay que apuntar que los soni dos ge- mo e l de Sc ho uten (Ho utsma y Goldste in, 1972) . Implican necesariam ente la
nerados ún icam ente a partir de armó n icos elevados no defin en tan claramen- ex iste ncia de un proceso neural ce ntra l. Los mod elos temporales pueden, sin
te la altura residua l como aque llos qu e co ntiene n armó n icos más bajos. embargo, explicar el recon ocimiento de la altura residu al a partir de secue n-
A unque la altura residu al se perc ibe mejor en presencia de gran cantidad cias de disparos neuronales en lugares de procesami ento superiores, más allá de
de compo ne n tes armón icos, Houtgast reportó qu e si el contex to lleva al suje- la membran a basilar, en los qu e se enc uentra la inform ación proveniente de los
ro a centrar la atenc ión sobre alturas de un ran go particular, aun un solo armó- dos o ídos .
nico es capaz de evocar la percepción de un a altu ra residual grave (Houtgast,
T., 1976) . C uando la información senso rial se vuelve ambigua, como ocurre en Alturas tonales basadas únicamente en información temporal
presen cia de ruido, esas alturas potenciales se perciben con más facilid ad .
En un experimen to secuenc ial de H all y Peters, en el qu e tres armó n icos Mill er y Taylor inv esti garon la sensac ión de altura to na l provocada po r seña -
sucesivos de 40 ms de dur ac ión se presentaban separa dos por 10 ms de silencio, les de ru ido blan co qu e se co necta n y desconec tan periódi cam ente, cuyo es-
los son idos se o ían disoci ados en cond icio nes de labor ator io (Hall y Pet ers, pectro asoc iado no posee máxim os n i m ínimos destacados (Miller y Taylor,
1981) . Pero en presencia de ruido la altura residual asoc iada, correspondiente 194 8) . Encont raro n qu e para un a frecu encia de co n mutac ión co mprendida
a los armónicos en presentac ión sinc rón ica, se vo lvía perceptible. Parece ser entre 100 y 2.000 Hz la mayorí a de los sujetos per cibi eron un a cie rta altura to-
que el ruido hab ilit a la aparición de un mecan ismo sintético de perce pción de nal. Llegaron incl uso a const rui r melod ías reconoc ibles.
la altura. Estas experiencias demu estr an la exis tenc ia de mecan ismos tem porales en
la percepción de la altu ra to nal, pues los modelos de recon oc im iento de pa-
El principio de dominación tro nes no puede n dar cue nt a de sus resultados.
De acue rdo co n la teoría de reconocimiento de pat rones, los armó nicos d is- Modelo de Brian Moore de l mecanismo para la percepción
c riminables de menor frec ue nc ia so n los más impo rta ntes para det erm inar la de la altura tonal en sonidos complejos
a ltura to nal. En ca mbio, para las teo rías te mpo rales los más imp o rtantes so n
los de mayor frecuenc ia. La a ltura residu al se h a observad o úni cam ente La evi de nc ia experime ntal revela qu e la percepción de un a altura to na l parti-
cuando los armó n icos est án presentes a frec ue nc ias por debajo de 5.0 00 Hz, cular no depe nde de la ac tiv idad locali zada en un lugar específico de la mem -
región qu e coincide co n la efectivida d del procesam iento de la información bran a basilar, o de la act ividad de un único grupo de neu ron as periféricas. Se
te mpo ral. sabe que la altura to na l induc ida por est ímulos complejos armó n icos es obte-
Ri tsma sugirió que los arm ónicos 3, 4 y 5 dominan la sensación de altura n ida, en gene ral, a partir de la interacció n de los armó n icos más allá de la fun -
to na l en la región de 100 a 400 H z (Ritsma, R., 1967) . Plomp coincidió en da mental de la serie. Por lo tanto , es posible pe rcibir alturas to na les sim ilares
parte con este postulado, pero consideró qu e la región no se define en cu anto provenientes de patrones espectrales diferentes, que co mpro meten distintos
al número de armó n ico, sino que es fun ción de la frecuencia absoluta (P lornp, esquemas en la act ividad basilar o neural. Para estí mulos peri ódicos que con -
R., 1967) . Para altu ras tonales agudas son importantes los prim eros armó n i- tiene n un gran rango espec t ral los primeros arm ónicos, hasta el quinto , tien-
cos , mientras qu e para alturas tonales graves cobran importancia los armón i- de n a dom inar el perc ep to aud itivo. Dichos armón icos cae n en un a zona en la
cos por enc ima del qu into. que es posib le discriminarlos - reso lverlos- por separado y el proceso puede ex -
144 145
plicarse sobre la base de los modelos de reconocimiento de patrones. Sin ern- ci ón corresponde a la que se enc uentra en la entrada. A modo de ejemplo, en
hargo, se puede percibir un a altura residual aun cuando los componentes son la figura 8 se aprecia la salida de diferentes filtros auditi vos ante un tren de im-
demasiado altos co mo para ser discriminados por separado. Este hecho no pue- pulsos de 200 pulsos por segundo.
de ser explicado po r los modelos de reconocimiento de patron es, pero sí por La segunda etapa consiste en la transducción de la salida de los filtros an-
los modelos tem porales, ter iores en impulsos nerviosos.
Parece que n inguna de las teorías expuestas hasta aquí pucde dar cuenta La tercera etapa defi ne un disposit ivo ca paz de ana lizar los interva los en-
por sí sola del conjunto de datos experimenta les. Brian Moore propuso un mo- tre máximos a cada frecuen cia central Fe (véase la figura 8 ).
delo cualita tivo que combina elementos tanto de la teoría de recon ocimiento En la cuarta etapa se comp aran los int ervalos temporales presentes en los
de pat ron es como de las teorías temporales (Moore, B., 1997) . Otros modelos, diferentes canales y se buscan los patrones comunes a varios de ellos. Este cir-
co mo los de Van N oordem (1982) , Patterson (1987) y Mcddis y Hcwitt (1991) cuito ta mb ién debe int egrar la inform ación a través del tiemp o. En general, el
ta mb i én comb ina n aspectos de las dos teo rías, aunque los algoritmos rnatern á- intervalo temp oral más frecuente corre spond e a la compo ne nte fund amental.
ricos difieran signi ficat ivamente en cada caso. El modelo de Moore (esquema- En la quinta etapa los va lores de los intervalos temp orales más prom inen-
rizado en la figura 7) consta de cinco etapas. tes llegan a un mecan ismo de decis ión q ue seleccio na un o de ellos. Este cir-
La prim era et apa está definid a por los filtros audit ivos en la membran a ba-
silar. Responden a los armón icos que son aproximada mente sinusoida les en su
[orrna y que pueden resolverse. La respuesta de los filtro s a los armón icos más Hz
altos co mbina varios de ellos por band a crít ica, y no pueden discr iminarse. 6400 1-.. -..
~ ~
.--
Aunq ue la form a de onda de salida de la etapa es co mpleja, la tasa de repet í- 5080
4032 ~" ~"
Entrada
3200 ~
acústica
2540
lA,
rv v
"
'v
,
banco de 2016
filtros
pasabanda 1600
1270
Transducci6n 1008
nerviosa
800
Análisis de los 635
intervalos
entre picos 504
400
Combinaci6n de
intervalos con 317
frecuencias centrales
252
200
Selecci6n de los
intervalos más 159
prominentes
Tiempo
Altura Figura 8. Simu lación de las respuestas de la MB ante un tren de impulsos de 200 pps.
tonal
Los nú meros de la izquierda indican cada una de las frecue ncias centra les FC,
Figura 7. Modelo esquemático para la percepción de la altura tona l de Brian Moore que correspon den a las formas de onda de salida de cada filtro
146 147
cuita incorpora la memori a y la atención , y puede ser influido tanto por los es- 3. L A A LTURA TONAL COMO UN MEDIO MO RFOFÓRICO
tímulos inmed iat amente precedentes como por el contexto y las 'condiciones
genera les de presentación. La altura to na l final (señal de salida del model o) A principi os de la década de 1970 A ttneave y Ol son estableci eron un nu evo
cor responde al int erv alo seleccio nado. criterio que permite clasificar de manera diferente los parámetros del son ido .
El model o de Moore explica satisfactor iamen te gran ca n tidad de eviden - Aunque existe n otros atributos para la organ izac ión de los son idos -com o el
cia expe rimental. A cont inuac ión mencion aremos algun a de las situac iones timbre, la sono ridad y la local ización espacial- sólo la altu ra tonal y el tiem-
que logra resolver. po const ituyen medi os capaces de portar formas, o medios morfofóricos8 (A tt -
• C uando la altura residual se obtie ne a partir de unos pocos arm ón icos ele- ne ave y O lson , 1971) . De acuerdo con los auto res, e l espacio visual es un
vados (por ejemplo, el 12, 13 Y 14) que no pueden resolverse por separado, resul- medi o morfofórico: un tri án gulo se puede trasladar --o rota r- y sigue siendo el
ta débil y ambigua. Este hecho explica por qué los primeros armón icos tiend en a mismo tri án gulo , su identid ad se mantiene bajo ciertas ope rac iones de tran s-
dominar en la percepción de la altura. La altura asociada a los armón icos supe- formac ión. De man era similar las estruct uras generadas a partir de la altura
riores se hace más clara si aumenta el número de armónicos presentes. to na l, tales como melod ías o funcion es armónicas , pueden ser transportadas
• Un pequeño grupo de armón icos muy altos no genera la sensac ión de al- hacia arriba o hacia aba jo y aún ser reconocid as co mo las mismas: la infor-
tura to na l, hech o que se puede exp licar en términos del limit ado ran go de in- mación estruc tu ral que poseen result a invari ante frent e a los tran sportes en
te rvalos temp orales que pueden ser ana lizados por el grupo de neuron as de cada altura ton al." El tiemp o tambi én es un medio morfofóric o poderoso. Pero
frecuenc ia cen tra l. Para armónicos por enc ima del 15, el int ervalo te mpora l co- otras di mens iones ut ilizadas en música (como la sonoridad, el ti mbre y la lo-
rrespond iente a la fund amental cae fuera del ran go que puede ana lizar el cana l ca lización espacial) no lo son . Por ejemplo, no se logra el mismo grado de
que respond e a esos armó n icos (este dat o es muy import ante en el model o de preserv ación de la informac ión estructura l ac tuando sobre la sono ridad. En el
Moore ). siglo xx va rias co rrient es musicales inten taron co mpone r piezas a partir de
• C uan do los armó n icos supera n los 5 kH z la estructu ra fina de la form a esca las de sonor idad, de ataques o de otros par ámetros sonoros , pero fracasa-
de onda a la salida del filtro de la primera etapa no se preserva en el pat rón ron en el intento de equi parar su ca pacidad est ruct ural a la de la altura to na l
te mpora l de los impulsos nerviosos. o e l tiemp o. !O
• La altura de est ímulos que no presentan picos espectra les, co mo el rui- En la misma línea, el psicólogo cogni tivi sta Michael Kubovy distinguió
do blan co interrump ido per iód icamen te , se percib e en el model o a través de entre atributos dis¡Jensables e indispensables (Kubovy, M., 1981) . En visión la I
los int erv alos temp orales present es en los ca na les de altas frecuencias centra- posición espac ial es un at ributo ind ispensa ble, mientras que el co lor es dispen-
les FC, que posee n mayores anc hos de banda y por lo tanto mayor definici ón sable, hecho relacion ado con su incapacid ad an alítica frente a los co lores: al
te mpora l (preserv an la estr uctura temporal fina de la forma de onda). La altu- mezclar azul y amarillo vemos un nuev o co lor, el verde, pero no sus co rnpo- I
ra ton al de estos estímulos es débil. ne n tes ini ciales. En audición la altura to na l es un atributo ind ispensable,
• Si se incorpora un mecani smo co mparado r central de la informac ión mientras que la local ización espacial no lo es. La "ind ispensabilid ad" del espa- I
proveniente de ambos oídos luego de la tercera eta pa, se pueden interpretar cio en visión y de la altura tonal en audición es para lela al hecho que ambos
los fen óm en os dic óticos, son atributos correspondientes a medi os morfofóric os. Ent on ces el parámetro
El modelo se parece al de Terhardt en el tratami ento de los primeros armó- aná logo del espac io visual no es el espac io auditivo, sino la altu ra to na l. En la
n icos, pero este últim o no puede explicar la altura producida por los armón icos figura 9 se grafican las diferencias ent re atributos dispensable s e indispen sable s
superiores no discriminables. En el modelo de Moore los son idos de combina - en visión y en la figura 10 en audi ción.
ción juegan un rol en la determin ación de la altu ra. El más import ante (2fl - f2)
se percibe aun a bajas sonor idades y puede actuar como un armón ico inferior 8 Morphophoric medium en inglés.
m ás fácil de discriminar que algunos compone ntes del espectro de entrada. 9 El eje mplo clásico co nsiste en tran sportar un fragmenro musical un cieno int ervalo, por
ejemplo una quinta justa ascende nte .
El model o de Moore se utili za act ualmente en el diseño de tradu ct ores de
la Pode mos c itar aquí la pieza para piano Modes de valeurs et d'inrensirés, compuesta en 1949
altura to na l para sistemas codific ados a número ún ico, por ejemplo para dise- por O livier Messiaen (1908 -1992) , que emplea por primera vez la técni ca serial no sola-
ñar conversores de altura tona l desde una guita rra al siste ma MlD!. mente para las alturas sino tamb ién para las durac iones, los ata ques y las intens idades .
148 149
La 1 La 2 La 3 La 4 La 5 La 6
Figu ra 9. A tributos d ispensables e indispensab les en visión 55 110 2 20 440 880 1.760
11 12 13 14 15 16
11 11x2 12x2 13x2 14x2 15x2
Frecuencia (Hz)
Mi)) Do+Mi ~ Re)) Re))
Figura 11. Representación logar ítmi ca un idi mension al de la altu ra to na l
.&. .&. &.&.
Sin emba rgo, una esca la logarítm ica un idim ension al no refleja el he ch o
de que ciertos int ervalos, co mo las oc tavas y las quintas justas, poseen carac-
terísticas espec iales. Ciertos estudios etno musicológicos hasta pret enden de-
mostrar que dichos intervalos son culturalmente un iversales, pero el deb ate
sobre el punto sigue lejos de alca nzar una conclusión def ín ítíva.l-
Escucha dos Escucha dos Escucha una A med iados del siglo XIX Drob isch co nci bió un a representación tr idi-
notas: Do y Mi notas: Do y Mi nota: Re
mension al en form a de héli ce que distingue en tre la altura unidimensional
En la percepc ión auditiva la altura es indispe nsable, (a la que llamó pitch height) y la altura to na l (pitch croma según Drobi sch l.U
la posición es dispensable
En la figura 12 se puede aprec iar la versión de Shepard de la hélic e de alturas
Figu ra 10. Atributos d ispe nsab les e ind ispensab les en audic ión to na les.
En el esquema los son idos de cada familia ton al (por ejempl o tod os los la
a distancia de octava ent re sí) se hallan enco lumna dos: el La5 queda más cer-
ca del La4 que del Mi5, disposición que cor respo nde a la proximid ad según la
4. R EPRESENTA CIÓN GRÁFICA DE LA ALTURA TON A L consona ncia musical, al menos en la música to na l tradici on al.
Si se desea suprimir la altura ton al (croma) sin eliminar la altura unidi-
La represe ntación gráfica trad icion al de la alt ura ton al emplea una esca la lo- mensional (height) lo más senci llo es reempl azar las seña les armóni cas origina -
garítmica un idimens iona l de frecuencias que preserva los intervalos musicales les por ruido de banda angosta . En o tras palabras, se remu even los elem en tos
bajo diferentes tran sformacione s, pero no alcanza a describ ir las co mplejas re- que aporta n to nicidad y se dejan solament e los que cor responden a la altura
laciones que operan entre los intervalos musicales. En la figura 11 se puede ve- espectral del son ido . En ese caso la hélic e se redu ce a un solo eje vertical, el
rificar que las octavas ocupan segmentos de la misma lon gitud a lo largo del que defin e la altura unid imension al.
espectro audible. Lo mismo ocurre con el resto de los in terv alos.!'
. , 12 Como co ntraejem p lo, Unernoto co me nta q ue no existe un a palabra en el id iom a jap o-
11 Estr icrame n te , la represe ntación tradicional no descr ibe alturas ton ales sino las fr~cuen nés para design ar el interva lo de octava (Unernoro, T., 1989) .
c ias de los est ímulos asociados. l3 Dro bisch (1855 ), en Cook, P. (1999) .
150 151
LaS
La4 ~;t==========~MiS
Parcial
Do #
La
Do
L Desplazamiento
Ancho de banda
Sol# Fa#
Sol
Frecuencia (escala logarítmica)
Figura 12. Hélice de alturas rona les
Figu ra 13. Se ña l de Sheppard
Los sonidos de Sh eppard co nsiste n en una gran canti dad de compo ne ntes si-
nusoidales a distan cia de octava que abarcan por completo el ran go de fre-
cuencias audibles, modul ados en amplitud por un a envo lvente espec tral en
forma de campan a que tiend e a cero para altas y bajas frecuenci as (Risset , ].
~ Croma ~
c., 1978b) . La figura 13 muestr a el espectro de una seña l de Sheppard.
A medid a que transcurre el tiempo, la frecuencia de cada parcial se va co- Figura 14 . Toroide que permite representa r las relacion es de oc tava y de qu ima
rriend o h acia arriba, en un a suerte de glissando en octavas paralelas, mientras
que la amplitud es controlada por la envolvent e en forma de camp an a. Nue-
vos parciales ingresan en la parte grave del espectro a medid a que superan la tes, pero se percibe un incremento con tin uo de la altu ra ton al. Los son idos
barrera de l umbral de audibilidad, a la vez que los más agudos se reduce n has- que desciend en indefin idament e se obtienen de manera similar, desplazando
ta desaparecer. La cantidad de parciales y la energía de la seña l son constan - hacia abajo la frecuen cia de los comp on entes.
Una ilusión equiva lente a la de los son idos de Sh eppard se puede obtener
H Se puede hallar un par alelo visual en el grabado "Asce nd iendo y descendiend o'; de M. con el otro medio morfofórico conocido, el tiempo. Ligeti y Risset emplearo n
C. Escher, procesos de este tipo en varias de sus co mposiciones.
15 2 153
Percepción de intervalos musicales
Noam C ho msky distinguió entre competence (h abilidad para reconocer las re-
glas qu e gobiernan la lengua) y performance (habilida d para realizar un acto de
habla) en su teor ía de la gramá tica y la sintaxis. Aunque tengam os almacena-
das internamente las reglas de la len gua, deb ido a nuestr as limi taciones para
procesar y emit ir sentenc ias co mp lejas, much as veces no las aplica mos co rrec -
tame n te al oí r o produ cir frases completas. Del m ismo mod o, las reglas qu e go-
bie rnan las rel aciones interv álicas en mú sic a de be n se r co noc idas e
intern alizadas (es decir, "natural izadas") por los oyentes . Veam os algunos ca -
sos propi os de la música occide ntal tradicional, en la que dich as relaciones ya
han sido largam ente naturalizadas.
Dos sonidos cu yos est ímulos está n sepa rados por un intervalo de octa va
Figura 15. Hél ice toroida l que permite representar la altura to na l, la altura (heighr)
y las relac ione s de octava y de qu inta suena n , en algún sentido, de manera similar. En muchas culturas se les den o-
mina con el m ismo nombre dentro de la esca la musical (son, por ejemplo, los
son idos de la familia del Do ). Desde el pu nto de vista del estí mulo, la frec uen-
A unque la hélice de She ppa rd de la figura 12 preserva la relac ión de oc- cia de la segunda seña l se ajusta a un valor cerca no al doble de la frecuencia
tava, no registr a la importancia que posee n los interv alos de q uin ta en la mú- de la frecue nc ia de la prim era señal. En otros té rm inos , si la relación de fre-
sica ton al tradicion al. El toroid e de la figura 14 sí lo hace, pero pie rde la cuenc ias fund amentales es aproximadamente fl = 2 f1 se pe rcibe un inter valo
capacidad de grafica r la altura unid imensional (height). de oc tava. O tros interv alos puede n definirse tambi én a part ir de relac iones si-
Para repr esentar al mismo tiempo la altura unidimensional (height), la al- milares. A sí, un a quin ta justa corresponde a la relación fz = (3/2) i, y un a cuar-
tura tona l (croma) y las relacio nes especia les de oc tava y quinta es necesario ta justa a fz = (4/3) f l' Las relaciones son solamente aprox imadas pues la
un espacio de ci nco dimensiones. La hélice toro idal resultante sería similar a defin ició n de los interva los dep end e de gran ca ntidad de factor es, la mayor ía
la rep resentada en la figura 15. culturales, alguno de los cu ales verem os más adela nte.
S i ade más deseamos representar los interva los de ter cera mayor y tercera Las relac ion es an te riores , sin embargo , sólo se perciben claram ente
men or, impr escind ibles a la hora de definir la mod al idad de un aco rde, la fi- cua ndo las dos frecu encias se ubica n por deb ajo de 5.000 H z. Exist e gran
gura se co mplica hasta el punto de resultar impos ible de dibuj ar: So lame nte se ca ntida d de ev ide nc ia ex pe rime ntal qu e indica qu e los estímulos cuyas fre-
puede n -plan tea r las ec uaci ones algebraicas que co rrespo nda n a cad a mod elo. cue nc ias fund am entales (las que decid en la peri odicidad de la seña l comple-
ja ) supe ran el va lor de 5.000 H z no de finen la altu ra to na l. Por ejemplo, un a
secue nc ia de son idos no produce la sensación de mel odía por enci ma de los
5. ALT URA TONAL E INTERVA LOS MU SICA LES 5 kH z. Y los sujetos co n oído abso luto fracasan repetidam ente a altas frecuen-
cias . Estos dato s son consis te ntes co n el hech o ya visto de qu e a alrededor de
Un desarrollo qu e intente ex pone r la complej idad de la percepci ón de los in - los 5 kH z cambian los mecani smos de percepción de la altura: un mecani smo
rcrva los y de la generació n de escalas musicales requiere por lo menos un li- temporal ac túa a bajas frecue nc ias y un mecanismo to no tó pico lo hace a altas
hro completo.'> Aquí intentaremos presentar los tópicos más rele vantes sin frec uencias. Tanto el sen t ido de la altura to na l com o la sensibilidad a la fase
adentra rno s en el est ud io complet o de los pormenores propi os de la práctica se pierden más allá de los 5.000 H z.
mu sical. Pued e ser interesante rep asar el rango de frec uenc ias funda me n ta les qu e
aba rca el tecl ad o de un pia no mod erno: la frecu en cia más alt a no llega a
1I Este libro , en este moment o simple ex presión de deseo , tendr ía nat uralm ente un lugar en 4.200 Hz (véase la figura 16).
la co lecc i ón Música y Ci encia.
154 155
Frecuencia (Hz)
Interva los sincró nicos y diacrón icos
I
1 Los dos mecani smos que actúan en la percepción primaria de la altura, el ton o-
1 I
3729
4186
3951
008
Si7 tópico y el temp oral, se manifiesta n de man era diferente si se presenta n inte r-
3322 3530 La 7 valos sucesivos o diacrónicos o intervalos simultáneos o sincrónicos. C uando los
2960 3136 Sol 7
2794 Fa 7 est ímu los son diacrónicos, la sucesió n de inte rva los posee carácter melód ico.
2637 Mi7 La evaluació n de la diferen cia de altura ent re est ímulos --el in tervalo diacrón i-
2489
2218
- 2349
2039
1976
Re 7
00 7
Si 6
co- puede derivar únic amente de la evaluación de la distancia que existe ent re
puntos de vibrac ión en la mem brana basilar. Si los est ímulos son periódicos,
1865
1661
1480
= 1760
1568
La 6
Sol 6 con espectro armónico , se eva lúa la distan cia ent re los dos pat ron es de exc ita-
1397 Fa 6 ció n. En estos casos el mecan ismo ton ot ópico es el único que puede ac tivarse
1244 ,5 13 18,5 Mi 6
1108,7 1174,7 Re6 porque, al no actua r los dos estímulos al mismo tiempo, no es posible el aná li-
1046 ,5 00 6 sis tem poral simultáneo ent re ambos. En la figura 17 se aprecia un gráfico tem-
932 ,3
830,6 - 937,8
880
Si 5
La 5
poral de las seña les que indu cen un intervalo diacrón ico de quinta justa.
Juzgamos los intervalos sucesivos casi de man era táct il, comp arando el
740
- 784
698 ,5
Sol 5
Fa 5
622 ,3
554 ,4
- 659 ,3
587 ,3
Mi5
Re5
punto de máxim a exc itació n del segundo estí mulo con el rec uerdo del punto
de máx ima exci tac ión de prim ero. En este caso , el rol de la memor ia de co rto
523,3 0 05 tér mino resulta det erm inant e. Si ade más ac túa la memoria de largo térm ino,
493 ,9 Si 4
466, 2
415 ,3
370 - 440
392
349 ,2
La 4
Sol 4
Fa 4
hecho que ocurre en alrededor del 1% de la pobl ació n, se dice que el oye nte
posee oído absoluto . El oídoabsoluto es la habilidad de reco nocer la altu ra to-
na l de un sonido sin compararla con una referen cia ce rcana en el tiemp o.
3 11,1
277 ,2
- 329,6
293,7
Mi4
Re4 En cam bio, cuand o los estí mulos se presentan de man era sincrón ica, la
26 1,6 00 4
246,9 Si 3 manife stación simultá nea de dos o más son idos posee ca rácte r armó n ico. 16 La
233,1
207 ,7
185 - 220
196
174,6
La 3
Sol 3
Fa 3
eva luac ión de la diferencia de altu ra entre estímu los --el in te rvalo sinc rón ico-
155 ,6 164,8 Mi 3
138,6
- 146 ,8
130,8
Re 3
00 3
La Mi
116,5
103,8
92,5
- 123 ,5
110
98
Si2
La 2
Sol 2
iD
~
"O
ro
"O
87,5 ' iij
Fa 2 c:
77,8 82,4 Mi2 Ql
E
69 ,3
- 73,4
65 ,4
61,7
Re 2
00 2
Si 1
58,3 55 La 1 nempo (ms)
51 ,9
46 ,3 49 Sol 1
~
43 ,7 Fa 1 Figura 17 . S~ña les asociadas a un interva lo diac rónico de quinta justa
38,9
34,7 - 41,2
36,7
32,7
Mil
Re 1
Do 1
29, 1 30,9 SiO 16 El término "ar món ico" se emp lea aquí en un sentido amplio y sign ifica ocurrenc ia simul-
27,5 La O tánea. De manera similar, en el párrafo anterior se habla de carácter melód ico para desc ri-
bir la ocurrencia sucesiva. Se pod ría trazar un correl ato con las estructuras verticales y
FiJ:ura 16. RanJ:ll de frccucnc ias fundamenta les de un pian o modern o horizontales en una partitu ra o en un sonograma.
15CJ 157
L_lj il-- jJjJ~ _¡_~LLLh
! !!
-[ ,-,-,-C
i
l---t~! ~1 __.~_
- ;- , 1-·,
-.-~ -4 -1 -i~
_J+-
--¡-_!+--±J --r-
I
l ' ~
1I
-- - i
iD
" _.- -,-I L ·;
----t--
~ I -t-
t 1-= ~-j =r~l- ~~
I ;
"O - ¡ -; ~ -- - - - ~-E
ro
"O
.¡¡; -!~!- - -;- -0--.
!
~-,
I I
e
Q)
E I I
- 1-- ,1
1- -·--1- :--;¡ l-I --
Figu ra 19 . Espectro de Fou rier asociado a un intervalo sincr óni co de qui nt a justa
Tiempo (ms)
Figura 18 . Seña les asociadas a un int ervalo sinc rón ico de quinta justa
puede derivar en este caso tanto de l mecani smo tonot ópico anterior co rno de l
aná lisis temporal simultáneo de las dos seña les. En este último caso la apari-
Figura 20. Espectro de Fou rier asociado a un intervalo sincrónico de qu int a justa desafinado
ción de batidos y son idos diferen ciales prevalece co rno cr iterio de consonan-
cia y correcta afinaci ón, al menos en la música to nal occidental.
Torne mos co rno eje mp lo un inter valo sincró nic o de qu inta justa. Ca- 1.320 Hz) y el segundo armón ico de Mi5 (otro Mi, pero esta vez de f 2 = 2 x
da vez que la se ñal más grave, un La4 de f = 440 H z co mp leta dos ci clos la 662 Hz = 1.324 Hz) con un período de batido de fb, = 4 Hz. El siguiente oc u-
más aguda , un M i5 de I> 660 H z completa 3, tal co mo se aprec ia en la fi - rre entre el sexto armónico de La4 (f6 = 2.640 Hz) y el cuarto armón ico de
gura 18. MiS (f4 = 2.648 Hz). A hora el período de batido es fb2 = 8 Hz. La secue ncia
La exacta coi nc idencia de fase cada dos ciclos del La4 -o tres del Mi5- continúa hasta, teóricamen te, alcanzar el límit e del rango audib le.
impide la apa rición de bat idos y diferenciales. El gráfico espect ral del int erva- En la música occi de nta l tradicion al, conso na nc ia armón ica y correcta afi-
lo anterior es el que se muestra en la figura 19. nación de acor des significa n mín imo batido. Por este mot ivo, para eva luar los
¿Q ué ocurre si desafin amos un poco esta quinta justa, por ejemplo, au- inte rva los sincrónicos preva lecen los crite rios temp orales -que aseguran el
mentand o la frecuencia del MiS apenas 2 Hz para llevarlo a 662 Hz? Ap are- control de los posibles batidos- sobre los criterios to no tó picos. Hay que acla-
cen necesariamente bat idos de primer orden que crecen en frecuencia a rar que en la música de much as culturas el bat ido ent re son idos no es consi-
medida que aumenta el orde n de los armón icos invo lucrados. dera do un elemento negativo o dison ante, sino que se lo int egra como part e
El batido más grave se da ent re el tercer armó n ico de La4 (un Mi6 de f 3 = de la textu ra del son ido.
158 159
17'. 17'. 17'. del marco cultural de referencia. Dichos intentos de universalizar el concepto
~
o de consonancia son rebatidos al confrontarlos con la gran cant idad de lengua-
- e :;t: e jes musicales no occidentales en los cuales no se cumplen . Inclu so dentro del
área de la música occidental misma se crearon, a partir de fines del siglo XIX y
o principios del xx, sistemas que redefinen complet amente la noción tradici on al
Figura 21. Oc tav a diacrón ica ejec utada con un violín de cons onanc ía.F Un estudi o exhaustivo del tema necesariamente debería
contemplar el desarrollo contextua] e h istórico de cada lenguaje musical parti-
cular. Dicho estudio no podrá soslayar el aná lisis de las comb inacione s de altu-
17'. ~
~
ras tonales, de sus camp os de acción y de las jerarquías relativas que ocupan en
O
los diferentes sistemas musica les. En otras palabras, el estud io que imagina mos
e e tendría que enc arar ampli amente un análisis escalíst ico completo de cad a sis-
o tema musical.
Consonancia y disonancia
160 161
Capítulo VI
Timbre
Ap rend imos en nu estra eta pa esco lar q ue el son ido t iene por atr ibutos la altu-
ra, la int ensidad , la dura ción y el timbre. El tim bre se refería a c ierta cualidad
del son ido que nos permite recon ocer los instrumentos de una orquesta o dis-
tinguir entre son idos diferentes. Pero, a diferencia de la altura, de la inten si-
dad y de la dur ación , el timb re no es un atr ibuto perceptual de descripci ón
senc illa.
Ent endemos la perce pció n co mo un proceso en el que usamos la inform a-
ció n prov ista por nu estros sent idos para arma r representacio nes mentales de l
mund o que nos rodea. U na parte import ante en esta tarea es deci dir q ué par-
tes de la est imulación sensorial co rresponde n a l mismo objeto o eve nto físico,
y cuáles no. La necesidad biológica del timbre tam bién puede ser co mprend i-
da desde una perspect iva evo lut iva, a partir de la ada ptac ión del sent ido del
oído para proporci on ar inform ación sobre la base de las vibracion es mecáni-
cas del aire.
Bregman opina que el timbre surgió de la necesidad de dist inguir ent re dos
objetos auditivos cuando éstos no pueden identificarse a partir de parámet ros
simples (Bregrnan , A., 1994) . Si un rasgo audit ivo se mantiene dentro de lími-
tes un idimensiona les, como ocurre con la altura to na l, podemos ope rar hasta
una cantidad máxima de cinco o seis ele mentos indiv idua les a la vez. Para ma-
neja r simultá nea mente una mayor cant idad de unidades de informac ión se re-
quieren más dimension es y el tim bre apo rta ría esas dimensiones adic iona les.
Según Shepard , el sistema percep tual de los ani males nace co n la incor-
poración senso rial de las regularidades propi as del ambiente en el cual han
evolucionado. ' Por ejemplo, somos muy sensibles a ciertos aspectos del soni -
do que no se modifican dura nte el recorrido entre la fuente y el oyente, como
la altura tonal. Por e l contrario, somos práct icamente insensib les a las carac-
ter ísticas que varían de man era aleator ia co n el contexto, como la fase y la in-
163
tensidad relativa de los componentes en una señal compleja. De acuerdo con acústica . Hasta se podría dudar de su competencia en tanto definición . Impli-
esta concepción , sostenida por gran cantidad de investigadores, los parámetros ca, por ejemplo, que los sonidos a los que se le puede asignar timbre poseen al-
"fuertes" que determinan el timbre de los sonid os est ar ían relacion ados con las tura tonal; luego, los sonidos no tónicos -com o los de un platillo o de un
ca racteríst icas de la seña l acúst ica que resisten la distorsión propi a del med io tambor-, ¡no poseen timbre! Sól o nos qued an dos posibil idades: desistim os de
que nos rodea. estudia r más de la mitad de los son idos que nos interesan , o buscamos otra de-
fin ición . C omo veremos más adela nte, este enunciado está profun damente in-
fluido por el model o acústico clásico de timbre.
l . DEFIN ICIONES DE TIMBRE Además, ¿q ué sign ifica "dos son idos similares"? ¿Alcanza esta semejanza a
la ubic ación espacial, o a la tasa de repetición si existier a ? ¿Difiere el timbre
El primer probl ema que aparece al estudiar el concepto de timbre es la vague- de un registro estereofónico de un a trompet a si uno intercambi a los can ales
dad y ambigüedad del término. Rep asemos las dos definicione s más utili zadas. derech o e izquierdo ? ¿Es dist into el timbre de dos notas de una flaut a del t im-
1. Una man era clásica de defin ir timbre es asociándo lo a las fuent es acús- bre de tres notas del mismo instrumen to ? Son demasiadas preguntas sin res-
ticas de origen. En música, los nombres de los instrumentos se usan como eti - puesta, y qu izá co nvenga aquí repet ir la opin ión de Bregman sobre el pun to:
quetas para denotar los timbres, por ejemplo "timbre de flauta " o "timbre de "Creo que la definición de timbre de la ASA deb ería ser la siguien te : 'No sabe-
violín" . Si uno desea comunicar la impresión general dada por un son ido, este mos cómo definir el timbre, pero no es ni la sonoridad ni la alt ura tonal'"
métod o de nombrarlo puede ser adecuado. Las etiquetas nominales actúan de (Bregman, A., 1994).3
modo aná logo a los nombres de los colores: el término "rojo" es suficiente pa- Una posible explicació n del lugar especial que ocupan la sono ridad y la
ra pedir un to mate madu ro en una verdulería, pero result a dem asiado amplio y altura ton al en la definición acadé mica es que ambos parámetros son unidi-
vago para describir los miles de "rojos" que se usan en la industria gráfica . Del men sion ales y de fácil control en los exp erim entos de ac ústica y psicoac ústi-
mismo modo, hablar de "sonido de flaut a" no nos sirve para diferenciar entre ca. Otro moti vo es sin dud a el lugar preponderante que ocupó [a a ltura ton al
los son idos de dos flauta s diferentes, ni para distinguir los son idos que obtienen en las inve stigacione s acústic as aplic adas tanto a la música occide ntal como a
dos flautistas del mismo instrumento. C omo ejemplo, podem os mencionar la la no occiden tal, al men os hasta la década de 1980.
mutación que ocurrió con el concepto de ruido blanc o: en principio describe Sin duda, el timbre es más que un simple cat álogo de son idos o que lo que
una característica físico-m atemática de una señ al acústica de 'espectro plano, qued a de un son ido al quitarle la sono ridad y la altura ton al. Necesitamos, por
pero se convirtió ent re los músicos electroacúst icos en una nue va un idad cul- lo visto , una nu eva definici ón . Sería con veniente que esta nu eva definici ón
tural, el "ruido blanco" como un timbre más de su repert or io. contemple una descripción sencilla de los elem entos que usamos para perci bir
Como veremos más adelante, el uso del timbre a man era de et iqueta im- el timbre y que, en lo posible , se relacione claramente co n las seña les acúst i-
plica el reconocimiento del son ido sobre la base de un esquema previo en el cas que lo causan. Hace años que los investigadores en ac ústica y los músicos
que la memoria auditiva juega un papel central. electroacústicos trabajan para desarrollar una colección ordenada de términos
2. La definición académica de timbre se puede enc ontrar, por ejemplo, en tímbricos descriptivos, aunque con resultados inciertos.
el apartado sobre terminología acústica del ASA. Es repetid a hasta el can san cio Las definicion es tradic ion ales de timbre presentan otra dificultad. Un
en multitud de normas y textos, y dice men os de lo que no dice: "timbre es el eve nto físico puede comprender m ás de una ocurrenc ia: los pasos de un a per-
atributo de la sensación auditiva en términos del cual un oyente puede juzgar sona, la lluvia sobre un a chapa, los sonidos granu lados que se usan en elect roa-
que dos son idos similares, con igual sonoridad y altura to na l, son d íferentes't.? cústica, varios instrumen tos de música toc and o una secuen cia isorrítmica, etc.
Ésta es, quizá, la definición menos comprometida de toda la historia de la Todos estos ejemplos se oyen com o unidades aca badas pues forman parte de
una representación perceptual coherente, pero no se adaptan con facilidad a
la noción limitada de sonido que aparece en las definiciones de timbre. El con-
2 Am erican Sta ndar ds Association (1960) , traducción de GB. Esta definición es defendida,
ent re otros, por Cro wder, aunque impone una restricción tempo ral que se suma a las co n-
dicion es origina les (Crowde r, R. G., 1989). Otros auto res (Plomp, R., 1976) restringen la 3 Miche l C hion es más sarcástico: U[OO .) 'altura, int ensidad, duraci ón, timbre' equiva le a 'al.
definición a la clase de los sonidos complejos estacion arios en el t iempo. tura, peso, edad, fison omía genera l' loo.)" (C hion, M., 1998) .
164 165
cc pro de objeto auditivo, que ana lizaremos en detalle en el capítulo VII I y que recen proven ir) de la misma fuente acúst ica y descubrir las propied ades que fa-
comprende la fusión de las diferentes ca racterís t icas de la seña l de entrada en cultan la categorización tímbrica de los objetos audit ivos. .
una ún ica imagen cohe rente, resulta much o más adec uado en estos casos. En lo que sigue presentaremos algunos de los model os explicativos más
destacados sobre el timbre. Al final de esta part e resum iremos las ca racterísti -
cas que, a nuestro juicio, sintetizan el estado actual de la cues t ión.
2. EsTUD IOS y MODELOS EXPLICATIV OS SOBRE EL TIMBRE
El modelo clásico
El t imbre de un sonido es un rasgo perceptua l de naturaleza diferente a la de
los otros rasgos ya ana lizados, co mo la altura to na l o la sono ridad. Porejern- El model o clásico empleado para explic ar el timbre -al men os en los instru-
plo, no es posible ordena r los sonidos de men or a mayor en una sola dim en- mentos de música- establecía que, así como la frecuencia fund amental det er-
sión tímbrica: e l timbre es, en consecuenc ia, un rasgo mul tidimension al. min a la altura percibida y la intensidad física la sono ridad , el timbre tiene
Durante los últi mos dosc ientos años se estudió co n cie rto detalle el tim- origen en la amp litud y distribució n del espectro pro medio de la señal acúst i-
bre de los sonidos. Se realizaron gran cantidad de estudios expe rimentales y se ca . El modelo esta ba basado en la ley acústica de O hm, enuncia da en 1843,
propusieron una pluralid ad de model os exp licativos , tan to desde el punto de según la cual el oído es ca paz de discriminar los armón icos que compo ne n un a
vista de la seña l ac úst ica co mo del de las represent acion es psíquicas de los so- seña l periódica, pero no puede percibir las diferen cias de fase entre los com-
n idos. Cas i todas las expe riencias se dedicaron al estudio del timbre en los ins- pon entes. En la figura 1 se pueden ver los oscilogramas de cuatro seña les pe-
tru mentos de música. En la mayoría de los estudios el tim bre no es riódicas con igual espectro de pot encias y diferentes fases relati vas ent re
considerado como un objeto de est ud io en sí mismo, sino como una ca racte- armónicos . Si pudié ramos oí rlas no enco nt raríamos diferencias apreciables.
rística perceptiva que permite identificar una categoría particu lar de fuentes De modo más preciso, la ley ac ústica de O hm estab lece que un oyente
sonoras. no puede distinguir ent re dos seña les con la misma distribución de frecuen-
Las seña les preferidas en los est udios de laborator io son mayo ritariamen- c ias y amp litudes en los armón icos, pero co n un a distri bución de fases dife-
te estac iona rias en el t iemp o - sinu soides o co mbinac iones de sinusoides-, rente. En este model o el timbre depende úni camente del espec tro de
pues son fáciles de producir, de controlar y de medir. Aunque las seña les esta- po te nc ias de la o nda, que es sólo un a part e del aná lisis completo de Fouri er
cio na rias son muy raras en la naturaleza, los ca ntos y gritos de much os an ima- (Basso, G., zooio.
les se les pueden aproximar por tramos. Los sonidos generados por algunos Según la tradición , el defen sor más destaca do del modelo clásico fue Her-
instrumentos de música también poseen segmentos que se puede n equipa rar a rnan va n Helmholtz. Sin emba rgo, Helmholtz tuvo la precaució n de limitar su
ondas estac iona rias. O tros grupos de est udio emplean pulsos de ruido, blanco alcance a las seña les estaciona rias: "Ciertas caracte ríst icas particulares de los
o rosa, en vez de seña les estac iona rias de te rmin istas. De nu evo la elección re- son idos de varios instrumentos depend en del modo que co mienzan y cesan
cae sobre un artefacto técni camente simple. Aunque los pulsos de ruido son [oo .]", de man era que estudió solamente "[...] las peculiaridades de los son idos
más habituales en la naturaleza que las seña les estaciona rias, ocurren muy ra- musicales que continúan uni form emente"." Los seguidores del model o -casi
ramente en estado puro. Como sabe mos, el uni verso acúst ico que nos rodea es todos los físicos, ac ústicos y músicos hasta bien ent rada la década de 1960-,
muy complejo y todo intento de simplificación imp lica riesgos recon ocidos. no tu vieron la prud encia de Helmholtz y proclamaron resuelto el asunto.? A
Muchos de los desvíos y desajustes que apa recen entre los modelos acús ticos lo sumo, recon ocían que la teoría estaba limitada a las ondas estaciona rias pe-
sobre el timbre y la realidad ambiental -o musical- tien en su orige n en un a riód icas que, según ellos, compon ían la mayor parte de las seña les de los ins-
extrapo lación incorrecta de los resultados de los ex perimentos de laborator io trum en tos de música.
a situaciones acústicas rea les.
A l margen de las h erramientas metodológicas adoptadas, la mayoría de los
4 Helmholt z, H. von (1885-1954) . Trad. de GB.
modelos y teorías sobre el timbre int entan vincular ciertos parámetros de la se- 5 Sin inte nción de agotar la lista , esta posición se puede ver reflejada en los trabajos de Ray-
ña l acúst ica con las consec uencias perce ptua les asociadas, co mprender nuestra leigh ( 1945), C ulver (1947), Olson (1952), Benade (1960), Beranek (1962), Backus
capacidad para asigna rle un idad a los diferentes son idos que provien en (o pa- (1969), Feyman (197 1) y Sundbe rg (199 1).
166 167
a) o
~ Vv ~ ry y
o
"O Flauta
-20
:E -20
Ci
E -40
«
-60
Tiempo
iD
llu
:3. -20
b)
ª
"O
Ci
E
-40
«
~
Frecuencia
Figura 1. a) Osc ilogramas de cua tro seña les periódicas con igual espec tro de potencias y
d iferent es fases relati vas; b) espect ro de potencias de las seña les anteriores
Frecuencia (kHz)
Llevar esta teoría a la realid ad no fue tarea simple. Se sabía desde princi- Figura 2. Espectros de sonidos de diferentes instru mentos según Wedin y G oud e (H andel ,
S., 1995)
pios del siglo XX que los espectros de los sonidos varían en el tiemp o, así,que
la pregun ta cent ral fue: ¿cuál de todos los espectros sucesivos debía tomarse
para determinar el timbre del son ido? La respuest a la dio Hall en 1937 al es- bre a medid a que ca mbiaba de frecuencia. La conclusión del experimento es
tablecer que se debían promediar temporalmente los espectros, y que el resul- categóric a: no existe una relación uno a un o entre form a de onda y timbre.
tado de est e promedio er a el responsable del t imbre.P Un ejemplo Uno de los pilares del model o clásico se desmoronaba.
representati vo de estudio experimental basado en el model o clásico se puede Otra cue stión que generó un intenso deb ate fue la de la invarianciadel
apreciar en la figura 2. timbre an te un cambi o de frecuencia. Para que el timbre no varíe, ¿deben con-
Si el timbre es consecuencia de la distribución de los armón icos o, ex- servarse las relaciones de amplitud entre armón icos para preservar la forma de
puesto de otra manera, de la forma de onda estacion aria, un a señal cuya for- onda escalada, o deben conservarse las posiciones absolutas de la envolvente
ma se mantiene no debería sufrir mod ificaciones tímbricas. Pero un o de los temporal ? El model o clásico sosten ía claramente la primera opción. En un cé-
experimentos acúst icos más simple s contradice esta afirm aci ón." La form a de lebre tr abajo, Slawson dem ostró que el model o también fracasaba en ese pun-
onda de una sinusoide no cambia al cambiar su frecuencia, pero si se gen era to (Slawson , W., 1968) . En la figura 3 se pued en ver las dos opciones . Los
un glissando que recorra buena part e del ran go aud ible pocas personas dirán oyentes juzgaron que la alternativa 1 cons erv a mejor el timbre que la alterna -
que el t imbre perm anece inmutab le. En realidad, a bajas frecuenc ias la sinu- tiv a 2 -defendida por el model o clásico.
solde suena blanda y oscura, mientras que a altas frecuencias parece dura y bri- Durante el año 1926, en pleno auge de la teoría clásica, Metfessel publicó
llnnrc." [La sinusoide, el "ladrillo" con el que se pretendía construir el edifici o un artíc ulo en el que ponía en dud a la simplista prop osición "forma de onda es-
del rimbre poseía, a su vez, un timbre particular! O peor aún, mut aba de tim- tacionaria igual timbre" (Butler, D., 1992) . La inversión temporal de una seña l
de audio -posible desde la aparici ón del registro magnético durante la segunda
guerra mundial-, en la que se mantiene sin cambios el espectro de potencias
t,Hall ( 1937) , en Cook, P. (1999).
'1El cxpcrimcnro fue realizado por prim era vez por Koh ler en 1915 (Risset y Wessel, 1999) .
promed io pero se alteran las fases relati vas, demostró que había algo más que
H Q ue en un rexro sobre el timbre este mos usan do palabras como "duro", "oscuro " o "bri-
distribu ción espectral en el tema del timbre (cualquiera puede comprobar el
llant e", to madas en préstamo de otros sent idos, demu estra lo lejos que estamos de tene r re- cambio dramático que se oye al invertir temporalmente un registro de piano,
suc ito e l asunto, por ejemplo medi ante el uso de software de audio en una computadora) .
168 169
a)
1 3 45 678 9 10 Número de armón ico dos y para predecir o crear otros nunca experiment ados. Durante el siglo pa-
"O
IJ··jlj !
ro
"O
sado se potenció la necesiclad de ap licar las n uevas tecnologías a la co nstruc-
'iij
e
Ql 1.. I ·.. Espectro original
ción y a la simulación de instrumen tos musicales. La llegada de la en ergía
E 1 ..
eléctrica primero, del con tro l electró n ico después y, por último, de la síntes is
I l"k digita l, permitió grad ualmente la construcció n de son idos a parti r de la des-
cripción física de las seña les asociadas a tales son idos. El mayor esfuerzo tec-
Frecuenc ia (Hz)
nológico se apoyó en los tratados de ac úst ica que repet ían , obv iamen te, el
b) 2 3 4 5 Número de armónico model o clásico. En la mayorí a de los casos el prod uct o de la sínt esis instru -
"O
ro ! mental se parecía muy poco al instru ment o or iginal. Los son iclos resultaban
"O
'iij
e
Ql
•• •• 1
I Alterna tiva 1
Conservación de las
apagados, carentes de identidad y de in ter és." La con clusión fue entonces evi-
E '. I rormantes espectrales
dente: la descr ipción física de la ca usa del t imbre era inadecuada, pues fallaba
170 171
el br illo. ¿Es posible de scribir las diferencias de timbre entre los sonidos a par- breo La hipótesis principal establecía que los oyentes emplean la correlación
tir de un número pequeño de dimensiones, como ocurre con elcolor ? Para entre diferencias espectrale s para percibir el timbre de los son idos. Aunque
responder a est a pregunta se emplea el métododelanálisis multidimensional, me- Plomp permite la apari ción de nuevas dimensiones perceptuales en casos par-
diante el cual se procesan estadísticamente los juicios de los oyentes sobre el ticulares (por ejemplo, la "tasa de ruid o" es decisiva para evaluar el sonido de
grado de similitud entre dos sonidos elegidos de un conjunto restringido. La un cascabel) , sugiere que siempre se reducen en última instancia a no más de
hip ótesis de trabajo del método afirma que ex iste un número limitado de di- tre s. Simplemente, cada son ido polariza el ca mpo perceptual de acuerdo a sus
mensiones capaces de describir la totalidad de los timbres posibles. Si dos so- características particulares.
nidos t ienen un valor cercano en una dimensión, son sim ilares en esa Aunque el modelo de Plomp introduce el análisis multidimensional en el
dimensión aunque no lo sean en las otras. Bregm an lo explica de la siguiente estud io de la per cepción del timbre, sigue fiel al modelo espectral estát ico de
man era: "Cuando comenzamos a pensar en las sim ilitudes entre cosas, inme- la teoría clásica. Quizá por eso su mej or resultado se ha obten ido con sonidos
diat amente no s damos cuenta que un a cosa puede parecerse a otra de mane- cuyo cuerpo es muy est able en el tiempo, como lo son los que generan los tu-
ras diferentes. Una pelota se pare ce a algunos juguetes en su redondez, a otros bos de órgano. En la figura 4 se aprecia un dia grama bidimensional en el que
en su color rojo , a otros en su tamaño, [oo .] el hecho de que algo pued a pare- se comparan los ju icios sobre los son idos de los tub os reales con sus simulacio-
ce rse a otras cosas de diferentes maneras llev a naturalmente a la idea de la ne s espectrales. La dimensión vertical describe la cantidad de arm ónicos supe-
existenc ia de dimensiones de sim ilitud'U? rior es (de men or a mayor cantidad), mientras qu e la horizontal es producto de
A continuación de scribiremos tres de stacados estudios de análisis multi- un a combinación complej a de propiedades espectrales.
dim ensional sobre el timbre. Una de las críticas más importantes que se le han hecho a este tipo de aná -
lisis es que dep end e fuertemente del conjunto de sonidos elegidos. En ciert a me-
Estudios de Plomp. En 1967 Re in ier Plomp de scubrió que las diferencias tírn- did a, para cada conjunto de datos se obtiene n resultados diferentes. Ad emás, las
bricas se correlaci onaban bien con diferencias en el espectro cuando se co nsi-
deraban los niveles de 18 bandas de tercio de octava, apena s mayore s que las
bandas críticas. Dicho de otra forma , el t imbr e se relacion arí a con el patrón o Órgano
espectra l de excitación del sonido. C omo hay 37 bandas críticas cubriendo to- o-« A Sintetizador
do el rang o audible habr ía que considerar otras tantas dimensiones. Para co- Regal
rroborar est as conjeturas decidió reali zar un estudio sistemático. Los primeros
trabajos de evaluación multidimensional fueron reali zados entre 1960 y 1976
Tr~ 1 Cromome
(Pl omp, R ., 1967 , 1976) . Emple ó como datos de partida son idos de violín,
viola, violoncello, oboe, clarinete, fagot , trompeta, corno francés y trombón. Lengüetas ~pasón4'
Jl
Determinó que los juicios sobre diferencias entre los son idos podían resolver- J.
se con sólo tre s dimensiones perceptuales. .!p~
I
En una segunda etapa intentó detectar la cla se de información acústica Q1Diapasón 8'
usada para determinar el timbre. Analizó físicamente las señales de los instru- f:/aUfas
Diapasón
mentos filtrándolas en 15 bandas de tercio de octava, siguiendo aproximada- GedaC~
Octava 2'
mente la distribución de las bandas críticas en el o ído. A partir de la conjetura
Waldllute
de que las 15 bandas no eran totalmente independientes unas de otras, redu-
jo tod a la informaci ón espectral a cuatro dimensiones básicas. La intención de
Plomp era rotar y acomod ar estas cuatro dimensiones físicas para ajustarl as a R:!e
las tres dimensiones perceptuales deriv ada s del análisis de diferencias en tirn -
Figura 4. Repr esentac ión bid ime nsion al del timbre de son idos de órgano (círcul os) versus
10 Bregman, A. (1994) . Trad . de GB. son idos de órgano sinte tizados (tri án gulos) (Rasch y Plomp , 1999)
172 173
Espectro
diferenc ias en el timbre "estát ico" de Plomp no son suficientes para definir un ang osto
objeto audi tivo, en part e porq ue la seña l acústica puede ser alterada espect ral-
ment e por las reflexion es en una sala. En la época de los trabajos citados se sa- 1
bía que el recon ocimien to de los instrum entos musicales, por ejemplo, depend e
~
con fuerza del ataque y de la estructura temp oral de la envo lvente din ámica del ü
al
a.
son ido.' ! Sin embargo, Plomp no incorporó factores temporales en su modelo. '"
y ~
-o
'0
Modelo de Grey. Entre 1975 y 1979 [oh n G rey realizó una serie de experien- :::l
.J:J
'C
cias te ndientes a construir un espacio tím brico vec to rial, similar al que se em- 1ií
i5
plea para describir los colores. En la prim era de cllas empl eó dieciséis son idos
de la misma altura , intensidad y dur ación , prove n iente s de 12 instrum entos
Espectro
tónicos (es decir, de altura ton al defin ida) . Digitalizó las señales, las simplifi- ancho
có reemp lazando las microvariacion es tempora les por secc iones rectilíneas, y
se las presentó de a pares a veinte oyent es. Los sujetos debían cuant ificar la si-
militud ent re los son idos de cada par med iante el uso de una escala graduada
- -
de uno a treinta. G rey interpret ó que las distan cias psicológicas se pod ían co -
Figura 5. Represen ración tridim en sional de similirudes t írnbricas. O boes (0 1, 02 ); corno
rrelacionar negativamen te con las similitudes percib idas. En otras palabras, a
inglés (EH) ; fagot (BN) ; c larinete airo en Mib (C l ): c larinete bajo en Sib (C2); saxofón
menor similitud , mayor distanc ia tí mbrica. Los resultados de esta experiencia alto mf (X l ): saxofón airo p (X2); saxofón soprano en Sib (X3) ; flaura (FL); trom peta
fuero n graficados en el espac io vectorial tr idimen sion al de la figura 5. Ca da (TP ); corn o francés (FH ); tromb ón co n sord ina (T M ), violon cello sul ponricello (SI) ,
dim en sión , aunque obte n ida por aná lisis multidimen sion al, representa. los norm al (S2) y sul casto (S3) (Grey, J., 1975)
atributos físicos q ue G rey con sideró mejor apareados con las respuesta s per-
ceptuales obten idas (G rey, J., 197 5) .
~ \
ro
@> .9 'ü
La dimen sión vert ica l (Y) representa la distribución de la energía en los '"
o
c:
Q)
:::l
~@" Q't
el
oQ)
parciales armón icos de la señal. Se trata principalmente de una dimensión es- c:
" .... <{
.:
ro
[Jectral. Se puede pen sar en ella como representando el grado de "brill o" del so- 'ro
ID
nido, y en los aná lisis tradicion ales queda definid a por la envo lvente espectral. ro
'0
La dimensión horizontal (X) representa en parte el grado de fluctuación de la
10> c:
Q)
ro c:
~
:::l
envo lvente espec tral durant e el desarrollo del son ido y en parte el grado de sin- -, o "§~
~ e
~
Q)
cro nismo en el ataque de los diferent es armón icos. Es una dimensión espectro- c: Q)
® al w E
~~
"O
,~
i5
temporal, den ominada "flujo espectral" por Krumh an sl (McAdams y Bigand , o
Ol
c:
1994). Permite distinguir ent re son idos de evo lución estática y son idos de evo- ro
o:: ro
lución dinámica. La te rce ra dimensión (Z) representa la presencia de vibracio- ~ ' 'ü
c:
Q)
:::l
nes inarmón icas prev ias a la part e armón ica prin cipal del sonido. Se puede @' ' o o
.. @ s:
o ~
hablar de una "calidad de ataque" y es esenc ialmente una dimensión temporal. e
-c J!!
«
En una publi cación de 1977, Grey ilustró dos de las proyeccion es bidi -
mension ales de su espacio tridimension al con los diagr amas tiemp o-energía-
frecuencia (TEF) de las señales de los instrumen tos (figura 6 ). Sincrónicos
Parciales
Asincrónicos
•
Dimensión 2
11 El ejemplo clásico en esa época co nsistía en inverr ir tem poralmen te un registro de audio:
Figura 6. Ejemp lo de una proyección bid imen sion al del espacio de tim bres
la envolvente espectral pro med io no ca mbia, pero el timbre sí lo hace. -r
(los instrum entos son los mismos de la figura 5) (Grey, J., 1977)
175
174
Las conclusiones que el auto r extrajo de este estudio, y de otros similares, diciones diferentes: señ ales complet as, sólo los prim eros milisegund os de las
fueron muy valiosas. En primer lugar, con stat ó que la repre sentación mental señ ales (ataqu es) y señales completas menos los ataques (es decir, el cuerpo y
del co njunto de t imbres es relativamente esta ble y más o menos id éntica en- la extinción) (Iverson y Krumhan sl, 1993). C omo en el estudio de Grey , los
tre un suje to y otro. Se comp robó que un ca mbio en una dimensión física par- sujetos juzgaron la similitud de cada par de instrumentos tomados de un total
ticu lar (por eje mplo en la envo lvente espec tral) provocaba un desplazami ento de 16. Los juicios de similitud fueron no tabl emente consiste ntes en las tres
en la di mensió n perceptiva correspo ndie nte ("b rillo" en este caso) . En ciertas condicion es impuestas. Los autores graficaron parte de los result ados en el es-
ocas iones se producían tamb ién desplazam ientos en otras dim en sion es. Quizá pacio bidimen sion al de la figura 7.
la conclusión más controvert ida esté relac ion ada con la co nt inuidad de las La d imensión perceptual horizontal está relacion ada con las diferentes
tra nsicio nes tímbri cas: "N o hay front eras perceptuales marcadas en la identi- en volv entes de amplitud . Los instrumentos de ataque rápid o, como los de per-
ficació n en tre dos son idos int erpo lados [...]la ausenc ia de límites abruptos y cusión , se enc uentran a la izquierda, mientras que los de ataque gradual, como
la sens ibilidad al contexto sugiere que, definidas estrictamente, las tran sicio- los de vie nto, a la derecha. La d imensión vert ical está asoc iada con la env ol-
nes no se perciben ca tego rialmente".'! vente espectral (el br illo aumenta hacia arriba). lverson y Krumhan sl sostie -
De acuerdo con las expe riencias de Grey, es probable que ex ista n distin- nen que los oyentes basan sus juicios en las prop iedades acústicas que se
tas estrategias perceptuales asociadas a la d iscriminación tím brica, que se ac- en cuentran en la tota lidad del desarrollo del son ido . El proceso físico de ge-
tivan en funci ón de la ca racterística particular más pronunciada - te mpora l o neración vincula fuert em ente las diferentes part es entre sí. El ataque, el cuer-
espec tra l- del son ido en cuestión. Qui zá estas diferencias en las respuestas es-
tén fundamentadas en la polari zación de la ate nción hacia lo que los oyentes
I~ o6
selecc ionan, en un proceso precon sciente, como la caract eríst ica tí mbrica dis- Alaques
tintiva en cada caso.
Frecuencia Tonos sin ataques
Se puede pone r en dud a la h ipót esis de G rey según la cual son idos extre-
Perfil espectral
mada mente complejos no difieren entre sí más que en ciertas di mensio nes más ancho
]
únicas no codi ficables en dimension es co nt inuas. Un buen eje mplo se en -
cuentra en la preeminencia de armón icos impares en el clarinet e, que contri-
buye a su ide ntificación más que otros dat os acústicos específicos co mo la
envo lvente de amplitud , En ca mb io, en los sonidos en los que la envolven te Perfil espectra l
más angosto
de amplitud posee características destacadas, co mo en el trom bón o la flauta,
ésta prima en la identificación por sobre la estruct ura armón ica.
Co n tod o, la más profunda de las objeciones a los modelos basados en es-
pacios vectoriales ataca direct amente su naturaleza: un espac io vectori al es
ID Frecuencia
Envolvente de amplitud
J~
esenc ialmente lineal. Sa bemos, sin embargo, que en la percepci ón del timbre
ocu rren grandes saltos y bifurca cio nes marcadamente alinea les. U n modelo
como el de Grey quizá sirva solamente para descr ibir regiones tí~bricas aco -
tadas, con compo rta mie ntos lineales locales, ocupadas por sonidos de ca racte-
JD] Jt]J
Tiempo Tiempo Tiempo
176 177
po y la extinc ión son interd ependienres y no se co ntradice n . Este argume nto ta y baja frec uenc ia, y se parece al "b rillo" presente en casi todos los estudios
exp licaría la causa por la cua l co n sólo un a parte del soni do --el ataq ue o el sob re ti mb re. La segunda dime nsió n en importan cia -"compacto-dispe rso"-
cuerpo , segú n e! caso- pod emos identificar su timbre. O tra co ncl usión deri va- permi te sepa rar los sonidos tó n icos del ruido . En esta exper iencia, co mo en to-
d;, de este est ud io esta blece qu e los datos que usam os para perc ibir e! timbre das las de su clase, el resultado es muy sens ible a la selecc ión inici al de son idos .
dependen del contexto. La repr esentación psíqui ca resultante es fun ción tan- Por ejemplo, la dimensi ón "compacto-d isperso" no hubiera apareci do si no se
lo de la dur ación, inten sidad y envolvente espec tra l de la seña l acúst ica, co- incluían pulsos de ruido entre los estímulos de partid a.
mo de! ban co de sonidos almacena dos en la memori a del sujeto, su estado de Otra pos ibilidad de ace rcamiento verba l al timbre la dan las "experiencias
ate nción y su experie nc ia previa. En este punto, los auto res decl aran la prob a- de ca mpo", en las qu e simp lemente se recopilan y clasifican los tér mi nos que
hle inexistencia de in var iantes acústicas subyace ntes en la pe rcepc ión del tim- las perso nas -músicos o no músicos, según e l casc--, usan para describir los so -
hre de los sonidos. n idos. Aquí la d ificultad está dada por la multiplicidad de unive rsos lingüísti-
cos existentes, aun dentro de una misma comunidad. Los mejores trabajos son
Conclusiones sobre los modelos mul ridimensiona les. A pesar de la gran cantidad los q ue restri nge n las muestras a un un iverso mu y aco tado. Dos buenos eje m-
de info rmac ión que aportaron hasta la fech a, los intentos tendientes a enco n- plos son los trabajos de Kenda ll y Carta rette , en los que anal izan los té rminos
tr ar un número redu cido de dimension es no han llegado a resultad os co ncl u- que apa rece n en el trabajo de Van Bismark citado y en el trat ado de orques-
yen tes. Ningun o de ell os dem ostr ó qu e las dimension es sugeridas son tación de W alter Piston (Kend all y Carta rette , 1993) . El fin práctico más sig-
co mpleta mente adec uadas, aun dentro de un univ erso restringido de estímu- n ificat ivo de esta clase de est ud ios es obte ne r un dicc ionar io de términos qu e,
los. Nu estr a ob jeción al model o de Grey puede exte nde rse, en menor o mayor al alimentar un siste ma basado en una red neural , perm ita q ue los músicos
medida, al resto de los est udios sobre el timbre basados en el aná lisis mult id i- co ntrolen de man era verba l c iertos programas de síntesis por co mp utadora.
me nsional,
Modelos de análisis por sín tesis
Modelos verbales
El t imbre de los son idos ta mb ién se puede estud iar desde un a pe rspectiva to -
Desde un a perspectiva d istinta, Von Bismar k inte ntó redu cir el n úmero de va- ta lme nte d iferente , que parte de la producción antes que del aná lisis. La idea
riab les necesarias para determ inar el t imb re a partir de la verbalización de las ce n tra l co ns iste en el desar roll o de model os de síntesis que permitan gene rar
percepciones (Bismark, G., 1974) . Que es, de hech o, lo que hacemos habitual- soni dos sinté ticos indistinguibles de los son idos "na tura les" qu e se desean
mente cuando tratamos de describir un sonido en un a co nversación. Sele cci o- imitar. S i ambos so n idos, el sintético y el origina l, se oye n exac ta me n te igua-
nó 35 son idos diferentes y le pidi ó a los oyentes que los califiquen , co n un valor les, entonces la descripción ac ústica del soni do -ado ptada para elabo rar e l
de 1 a 7, co n relación a 30 cua lidades o dim en siones d iferentes. C ada dimen - modelo- es ace rtada. El métod o se denom ina análisis por síntesis . [ ean C la u-
sión se defin ió a part ir de un a pareja de adjetivos co ntrar ios co mo "duro- blan- de R isset ilustr a el proceso en un d iagram a sim ilar al de la figura 8 (R isset y
do", "seco -vivo", "opaco-brillante" y así hasta llegar a las 30 incluid as en el Wesse l, 1999 ).
estud io. Los sonidos proven ían de generado res de seña les periódicas comp lejas, Quizá un ejemp lo cé leb re sirva pa ra acla rar el procedimiento usua l en es-
con un número variable de armó nicos, y de pulsos de ruido rosa. Se hacían pa - ta clase de investigacio nes . En la década de 1960 R isset y Max Ma thews in-
sar a través de filt ros que los mod ificaban de acuerdo co n det erm inadas envol - te ntaron, sin éxito, imitar los son idos de los instrumento s de bro nce. La teoría
ventes espec tra les, ent re las que figuraban las correspo nd ientes a las vocales en clásica - con sus espec tros está ticos - fallaba co mp leta me nte, y el intento por
idiom a alemán. Aplicando el método de selección de compon entes principa- dot ar a las señales de un co mpo rta m iento temporal senc illo --compuesto por
les, el autor reduj o las 30 dimen siones verb ales origina les a cuatro dimensiones un ataque, un cuerp o y un a extinción- tamp oco mejorab a mucho los resulta-
perceptuales. Las dos dim en sion es más destacadas representaban los pare s dos (Risset y Math ews, 1969) . Para destr abar la cuestió n, registraron magné -
"punzan te -apaga do" y "compacto -disperso". La dim en sión más importante ticamente el son ido de un a trompeta real ejecutada por un profesional. La
-definida por el par "punaan re-apagado"- se relacionó co n el centro de grave - grabac ión fue reali zada mediante el método de aná lisis sinc rón ico de altu ra en
dad del espectro de la seña l, que depend e de la relación entre la ene rgía de al- una cá mara anecoica --con un tiempo de reverb eración muy bajo- para e lirni-
178 179
2
o 50 100 150
TIempo (ms)
F igura 9. Resu ltado del análisis sinc rónico de altura del sonid o de una trompeta (Basso,
G.,2001a)
60
.-
ro
~
nar los efectos acúst icos propios de una sala no rmal. El aná lisis sincró ni'co pre - "O
ro 5
supo ne que la seña l es cuasi- periódica y describe el desarrollo de cada armóni- "O
'¡¡;
c: 30 3. . . '
co indivi dual en el tiem po. El result ado de un aná lisis de esta clase se muestr a ~
.s
en la figura 9.
A part ir de este aná lisis del son ido orig ina l, los auto res simularon la seña l ' .. - .. , "
.............__ ~ _- _ _ _ _.-
simp lificándo la de dos man eras: eli minaron las fluctu acion es de alta frecuen-
cia y aprox imaro n las curvas por tramos lineales. La señal sintetizada quedó o 50 100 150
TIempo (ms)
como la qu e se ve en la figura 10.
Las dos seña les resu ltaro n ind istinguibles cuand o se las co mparó audi tiva - Figu ra 10 . Sí ntes is de la señal anterior simplificada
mente. Las simplificac iones, por lo tanto, no afectaro n los datos rele vantes
presentes en el son ido origina l.
tímbrica; 5 ) la proporción de armó n icos superiores aumenta sign ifica tiva-
A unque el modelo era simple, para la época resultaba muy costoso a n i- mente con la intensidad. Empleand o estos nu evos co noci mie ntos lograron
vel co mputaciona l (en el estud io origina l se simularo n las evo luciones tem- crear un model o computaciona lmente más eco nó mico que superó exitosa-
pora les de los primeros 13 armó nicos ). A parti r de sucesivas simplificacio nes, men te la pru eba de discrim inación auditiva
Risset y Mathews encontraron qu e: 1) la variación temporal del espect ro es El ejemplo anterior, aunq ue limitado a unos pocos sonidos de tromp eta,
crít ica para det erm inar el timbre; 2) las variac iones de alta frecu encia y pe- ilustra las característ icas y ventajas del anális is por síntesis. Para empezar, per-
que ña amplitud no se per ciben; 3 ) la dinámi ca del creci mie nto de cada ar- mite evaluar cada parámet ro del sonido de manera individual, un o por vez,
mónico define gran parte del timbre de los bronces; 4) existe una forrnan re ev ita ndo la complejísima tarea de lid iar con espac ios mul tid irnensionales en
ubicada entre 1.000 y 1.500 H z de gran importan cia para la d iscri~inación los que no se sabe bien qué cosa produ ce cada efecto perceptual. N o menos
180
181
importante, saca provecho inm ediato del ava nc e tecnológico en los ca mpos promedio alcanza una relación de 2 a 1 (en el can to no profesion al es de 3 a l ) .
de la acústica y de la info rmática, a la vez que impulsa n uevas inves tigacio- Pese a esta amplitud de valores espectrales, se compro bó que un ca mbio de ape-
nes y desarro llos. Los modelos de aná lisis por síntesis han demostrado ser efi- nas 5% en la frecuenc ia de alguna de las tres primeras formantes puede reducir
caces para gene rar co noc imie nto cie nt ífico y téc nico, redu cir la ca ntidad de drást icamente la ca pacidad de identificación de una voz conoci da .
infor mació n necesaria para exp resar una seña l acústica, prod ucir va riantes y A unque aparentemente la frec uenc ia fun dam ental, la frec uencia de las
mod ificaciones nunca expe rimentadas y controlar la prosodia musical en formant es --espec ialmen te entre 1.000 y 2.500 Hz- y el anc ho de ba nda de
t iempo real. las formantes participan en la identificación de la voz human a, se presume que
Una descr ipción det allada de las técnicas empleadas contendría la h isto- la informac ión acústica relevan te depend e de las ca racte ríst icas particulares
ria de la electroa cústica durante los últimos 60 años . Só lo para enumera rlas, de cada locu tor (Van Domme len, W., 1990). En otros términos, no existe un
pode mos cita r la sín tesis adit iva, la síntesis sustract iva, la síntesis alineal o glo- conjunto fijo de datos invariantes que se apliquen a todas las situac iones. Por
bal - a este grupo pertenece la síntesis por FM de C ho wn ing- , el modelado fí- eje mplo, puede ocurrir que la seña l ac ústica de la voz del hablante A posea
sico y, ac tua lment e en desarrollo, la síntes is basada en princi pios pcrceptuales. cierta cantidad de inform ación especí fica, de la cual el oyente extrae un sub-
conjunto de dat os adec uado para su identificación. Pero en el caso del hablan-
Estudios sobre el timbre en la voz humana te B el subconjun to ante rior podr ía resultar inapropiado, y e l oyen te debe
elegir otro diferente.
Parece que poseemos capacidades audit ivas espec iales para co mprende r la voz
hum an a, que no empleamos para oír el resto de los son idos. Es algo similar a Estudios sobre el "color" del sonido
lo q ue oc urre en la decodificación visual de los rostro s. Se sabe q ue para el re-
conocimien to del rostro de una person a se usan recursos diferentes de los que Un grupo particular de est ud ios fue or ientado sobre lo qu e se llamó el "co-
se usan para percibir el resto del ca mpo visua l (existen person as que no pue- lor " del son ido. El co lor del son ido no tiene, según sus defensores , propieda-
den dist inguir los o bjetos, pero que leen perfectamente los rostros, y vicever- des temporales y se aplica a los atri butos estacion ari os del son ido , no a los
sa). Q uizá estas capa cidades tengan que ver con la importancia socia l de la transitorios. De acue rdo co n Wayne S lawson, "u n so n ido puede ca mbiar de
inform ación y con lo parecidos que son los rostros - y las voces- entre sí; es co lor a lo largo del tiemp o, pero e l ca mb io en sí mismo no es un co lor ind e-
probable que se necesite ciert a capac idad potenciada y específica para distin- pend iente . N o más que un cambio en un color v isua l puede ser un color in-
guir entre una voz y otra. Por otra parte, ex iste fuerte ev ide ncia de q ue la pa- dependie n ce'l':' Slawson intentó desc ubrir el modo de co ntro lar el color del
labra y la música se procesan en lugares diferent es de la corte za ce rebral. sonido mientras ca mbia la altura to na l, la sono ridad o algún otro rasgo del so-
A nteriormente se creía que cada uno de los hemi sfer ios cerebrales estaba es- n ido. Propu so un siste ma de co ntrol basado en el modelo físico de fuente y
pecia lizado en uno de estos dom inios, pero en la actualidad se sabe que ta nto filtro. Por ejemplo, en un a guita rra la cuerda es la fuente de oscilació n y la
la produ cción co mo la percepc ión de música y palabra invo lucran varios sub- caja de resonan cia el filt ro. A partir del model o propu so una ser ie de reglas
procesos, cada uno de e llos lat eralizado de modo diferente. Por ejemplo, se de co ntrol y tran sform ación.
descu brió qu e las tareas de discr iminación y de identificación (que implican 1. El color del son ido está asoc iado con el filt ro, no con la fuente. Para
un acceso al léxic o verbal) son ind ependientes y está n localizadas en diferen- manten er el color consta nte se deben mantener con stantes las característica s
tes lugares de la corteza. del filtr o.
El problema de la identificación tímbrica de las voce s es much o más di- 2. Para mantener el co lor del son ido constante se debe mantener la en-
fícil qu e en el caso de los demás son idos. N o sólo porque pod emos identificar volvente espectral con stante.14
miles de voce s diferentes (contra un grupo reducido de etiquetas tímbricas 3. El color del son ido posee cuat ro dim ensiones independientes: apertu-
gene rales), sino por el pequeño ran go de variación de los rasgos no tímbricos ra, agudeza, lasitud y pequeñez.
en la voz. Sabemos que las frecu en cias fund amentales t ípicas e n hombres,
mujeres y niños están comprendidas entre 80-240, 140-450 y 170-600 H z, IJ Slawson (1985) , en Butler, O. (1992). Trad. de G B.
respectivamente. Y que el rango de variación en frecuencia para un hablante 14 Esta regla no es más que una variación de la anterior.
182 183
~d
4. Para transponer un color respecto a un a dimensión, se debe agregar un
valor co nsta nte en esa d imen sión.
5. Para invertir un co lor respec to a una dimensión, se debe invertir el sig-
no del valor en esa d imensi ón.P a b
Estas reglas definen claramente un espacio vectori al , similar al espacio
de los co lores visual es propuesto por Schrodinger, A lo co ntrove rsia l de la Tiempo
co njetura, Slawson le sumó c iertas afirmaci ones qu e se pued en ca lifica r, por Figura 11. Diagramas de Lo de dos son idos d iferentes (Lo , Y. O., 1987)
lo men os, de arriesgadas: "e l color del son ido aparece com o un elemento mu-
sica l viabl e que puede ser somet ido a un control estructura l preciso , en todo
aná logo al que se le aplica a la altura tonal". Aquí aparece por prim era vez el
deb ate sobre la capac idad del timbre para sustentar transformaciones estruc- sobre soni dos co mplejos pro pios de la vida co tid iana. C~mentaremos brev e-
tu rales o, d icho de otro mod o, sobre la cap acid ad morfofórica del timbre (m ás mente cuatro de ellos.
adela nte de sarrollaremos este punto). Al margen de la auda cia de las afirma - 1. D. J. Freed estud ió los son idos produ cidos por d iferentes baqu et as al
cio nes de Slawson, en sus conjeturas se perciben claros resab ios del modelo golpea r cu atro cacerol as de d ist into tam añ o (Freed , D. J., 1990) . A isló cu at ro
clásico del timbre. parámetros de "prev isión de timbre": la energía global, la distribución espectral,
En sinton ía con Slawson, Yee On Lo acepta qu e la envolve nte espec tral la velocidad de evolución espectral y la rapidez de alteración del evento. Las evalu a-
det ermina en gran med ida el timbre de los sonidos , pero se difer encia al asig- cio nes de los sujetos sobre el tip o (d ureza) de la baqueta empleada se mantu-
narle también gra n impo rta ncia a la evo lución temporal del espectro. A firma vieron to ta lmente independ ientes del tip o de cacero la golpea da , a pesar de
que percib imos los cambios especrra les a través de "cuadros" definidos com o que los estí mulos co ntenían informació n tan to sobre el exci tador co mo sobre
la mínima porción repetitiva de la onda. Esto s cu adros actúan co mo las tran- el resonador. Los parám et ros de previsión de timbre de Freed se co rrelaciona -
sic iones entre fonemas en la voz habl ada. A sí co mo los cuad ros prop orc ionan ron bien con las eva luac iones de la dur eza de la baqueta. A ctu alm ente se co n-
la micro estructura te mporal -del orden de los mil isegundos-, la rnacroestruc- tinúa investigando con el fin de ind ividu ali zar los índic es inva riantes qu e
tura -del orden de los segundos- está también co ns truida a partir de la conca- perm iten a los oyen tes ca racter izar y reconoc er al excitador y al resonador de
te na ción de cu ad ros. C om o apunta Lo: "El timbre es la evo lució n de los forma sepa rada .
cuadros't.!" Existen'ci ertos cu adro s cr ític os que definen los cambios importan- 2. B. H . Repp estud ió los sonidos qu e produc en las man os al aplaud ir. En-
tes a lo largo del tiempo. En el modelo de Lo , la percepción del ti mbre se fun- contró que los oyentes coi ncid ían al juzgar el sexo del "ap laudido r", aunque
da en tres parámetros: la disposición de los cuad ros críticos, la envolv ente de los juicios no siemp re co rrespondía n a l sexo real de la fuente (R epp , B. H .,
amplitud y la trayectoria de la altura to na l. En la figura 11 se aprec ian los dia- 1987) . Seg ún el autor este estud io refleja la influ encia de los este reo ti pos cul -
gramas de Lo para dos sonidos diferentes. tur ales aud it ivos.
El modelo de Yee On Lo se puede ver co mo un a versión cu antificad a di-a 3. Warr en y Verbrugge ana lizaron las respuestas aud it ivas frente a obje tos
feren tes ni veles de la concepci ón que asocia el t imbre con la evo lució n tem- de vidrio qu e rebo ta ba n o se romp ían (Warr en y Verbrugge, 1984) . Analizó la
poral del espectro de la señal. correspondencia entre patrones rítm icos, la inten sidad y las envolventes es-
pectrales y los juicios audi tivos asociados.
Eventos acústicos diferentes a la voz y a los sonidos musicales 4. N . J. Vande rveer estudió la ide n tificació n libre y la clasificación de
eventos acús ticos co mplejos co mo el t inti neo de llaves, el crepitar del papel,
Aunque la mayoría de los estudios sobre el ti mbre tratan sobre los son idos de etc. (Vanderv eer, N . J., 197 9) . Seg ún S. H andel, sería na tur al ind ica r los so-
la voz habl ada o de la mú sica, algunos inves t igadores centraron su ate nción nid os a partir del eve nto mecánico que los enge ndra, sin dud a a part ir de in-
va ria n tes tr ansform acionales (Handel, S ., 1989) . Los grupos esta ría n
parcia lmente determinados a partir de las propiedades acús ticas de los mat e-
15 Slawson (1985), en Butler, D. (1992). Trad. de GB.
16 Lo, Y. O. (1987)]. Trad. de GB. riales utilizados (es de cir, las inva riantes estr uctu rales).
184 185
A los estudios anteriores les cabe, potenciada , la crít ica que se le hace a midas. El recon ocimi ento es mayor cuan do se reemplazan las sílabas ausentes
casi todos los estudios sobre el timbre: depend en fuert emente del conjunto de por silencios que cuand o se en masca ran las mismas sílabas por un ruido. En el
son idos escogidos. segundo caso se reemplaza una sílaba por otra cosa, en el primero no.
• El brillo del sonido figura co mo un parámet ro sign ificat ivo en todos los
Resumen y conclusiones estudios mencion ados. La gran discusión gira en torno a la naturaleza de la en-
vo lven te espec tral. Al gunos auto res co nsideran que su importan cia guarda es-
Los resultados de los estudios men cion ados, y de otros similares, son muchas ve- trecha relación co n la frecuencia funda menta l de la señal, mientras que otros
ces cont radicto rios. En genera l, todos aceptan que la percepción del timbre de- sostie ne n que las band as de frecuen cia (en algunos casos las forrnantes ) deben
pende de la forma de onda en su conjunto, pero discrepan sobre cuáles de sus ocupar regiones espectrales absolutas. La mayor part e de la ev ide ncia experi-
característ icas deben considerarse relevantes . A modo de resumen , podemos es- mental confirma la segunda hip ótesis.
tablecer una serie de elementos, aceptados por la mayoría de los invest igadores, • C uando sonidos de un mismo género se hallan situados en contextos mu-
que int ervienen en la discriminación de los timbres instrumentales aislados. sicales de cie rta complejidad, en particular en texturas isorrítmicas, los índ ices
• La infor mac ión presente en el ataque de la seña l. de naturaleza temporal parecen perder importa ncia desde el punto de vista de la
• La informació n relativ a a la evo lución de la env olvente espectral, prin- discrim inación , en ben eficio de los índices ligados a la envolvente espec tral. Pa-
cipalmente en el cuerpo de la seña l. rece ser que, cuando la com plejidad aumenta (co mplejidad armón ica o cantidad
• La presenc ia de pequ eñ as variaciones aleatorias de frecuen cia en los de voces) las diferen cias temporales finas no son tan bien preservadas como las
compone ntes discretos de la seña l. diferenci as espect rales. Un buen eje mplo se puede enco nt rar en los corales pa-
Otras ca racte ríst icas se discriminan con mayor dificul tad: ra maderas en algunas sinfonías románticas . En esos fragmentos, los transitorios
• El grado de cohe rencia de la variació n en frecuen cia de los co mpo ne n- de las notas aisladas son men os importante s que la información presente en la
tes discreto s. parte del cuerpo de la seña l, ligada a la envolvente espectral.
• El grado de simplificació n en las variac iones de ampli tud y frecuenc ia • Ciertos son idos parecen poseer características o dim ension es tím bric as
(válido sobre todo para los model os de aná lisis por síntesis). ' exclusivas, no comp arables con las usuales en la mayorí a de los instrumentos .
La preemine ncia de armón icos impares en el clar inet e -cuya sola aparición so-
Esta en umeració n es vá lida solament e co mo referencia ya que de ben agregar- bre pasa en impo rta nc ia a las demás ca racte ríst icas de la seña l-, el particular
se nume rosas singularidades y excepcio nes . En la lista que sigue mencion amos transitor io de ata que de la trompet a, la presencia de ruido rosa en el sonido de
alguna s de ellas. un plat illo, la envo lvente de amplitud en el tromb ón y en la flaut a, son bue-
• Las variables significat ivas para la percepción del timbre musical exis- nos ejemplos de dim ension es tímb ricas part iculares no ex trapolables a la tota-
ten en, al men os, dos niveles tem porales diferentes: un nivel se asienta en los lidad de los instrumen tos de música.
ca mbios que ocurren en algunos milisegund os y el otro registra las var iacio nes
más lentas, del orden del segundo.
• C uando el estudio permite que participen las característ icas de a taque 3. PROPIEDADES PART ICULARES DEL T IMBRE
de los sonidos, éstas dominan por sobre los ot ros factores presentes en la señal
ac ústica. Solamente el brillo, det erminado por la distribuci ón espectral, per- A contin uac ión describiremos algunas de las prop iedades particulares de la
manece presente como un factor tímbrico de impo rta ncia. Un error sistemá- percepción audit iva q ue fuero n ana lizadas, y en algunos casos descub ier tas, a
tico cometido por muchos invest igadores que pret enden elim inar el ata que de parti r de las in vestigacion es sobre el timbre de los son idos.
la seña l aparece al seccio na rlo abruptame nte: lejos de elim inar el ataque, se lo
reempl aza por otro de band a anc ha . I7 Algo similar ocurre en los exp erimen- Constancia del timbre
tos de restauración fon émica, en los qu e ciertas sílabas de un a frase son supri-
Es ev idente que existe alguna form a de invaria ncia o de consta nc ia tímb rica,
17 Este efecto es co nsec uenc ia de l princi p io de in det erm inación acústico (Basso , G ., 200 Ia ). que se comprueba en el hech o de que una fuente acústica puede recon ocerse
186 187
en una gran varied ad de circunstanci as. Por ejemplo, un saxo se identifica co- xofón-, al margen de la existencia o no de otras característ icas menos sign ifi-
mo tal a l margen de la altura tonal o de la din ám ica que esté generando . Se lo cativas. Lo interesante en e! caso del timbre es que e! conjunto de rasgos im-
recon oce sin dificultad aun si lo oímos a través de un medio tan distorsivo co- prescindibles no es el mismo para todos los son idos, corno ya vimos en el
mo una pequeña radio portátil o a través de una puerta de madera . La voz de apartado anterior.
una person a con ocida se identifica en una hab itación silenciosa o en una reu-
nión muy concurrida, en la que se mezcla con otras voces, con la música y con ¿TImbres metaméricos?
los ruidos de propi os de la fiesta . Los espectros que nos llegan son muy dife-
rentes en tod os estos casos. Sin emb argo, la noci ón de constancia tímbrica no El sentido de la aud ición es claramente ana lít ico con relación a las alturas to-
se co mprende bien a partir de los estud ios clásicos de discriminación . nales, relac ion adas con la frecuencia fund amental de la seña l acústica. Es de-
¿Existen correlatos físicos que den cuenta de esta constan cia tímbrica en cir, en presen cia de un a mezcla espectral distinguirnos cada uno de los
diferentes contextos? Para recon ocer el timbre único de una voz se debe~ ele- comp onentes de la mezcla. Por ejemplo, cuand o combinarnos un Do y un Mi
gir, aislar y ana lizar las partes de la seña l que aporta n la información adecua- oímos tanto la tercera mayor (la combinación) co rno cada una de las notas in-
da. Una mala elección implicará un cambi o en el timbre percibido y una dividu ales. En contraste, el sent ido de la vista no es ana lítico con relación a
iden tificación equi vocada. En este punto result a int eresante destaca r que la los colores, relacion ados co n la lon gitud de las ondas lumínicas: al mezclar
envolvente espectral de una seña l ac ústica sufre, ine vitablemente, modifica- azul y amarillo vernos el color verde (la combinación), pero ya no percibimos
cione s importantes ent re l a emisión y la recepción. Ya sea por la acció n de fil- e! azul y el amarillo que lo forman. Esta característica de la visión permite
trado en el medio de prop agación, o por distor sión en las reflexion es y crear co lores met amér icos, causados por espec tros d iferentes pero indi stingui-
refracciones que puedan ocurrir, el espectro que le llega al oyente depende de bles a la vista. ¿Existe n los tim bres met am éricos o, lo que es equivalente, dos
la geome tría límite del espacio acúst ico y de la ubicaci ón de la fuente y el re- seña les físicas diferentes que se oigan exactamente igual? De acuerdo co n los
cepto r en dicho espacio (expresado con mayor precisión, la alteración del es- estud ios realizados hasta ahora, la respuesta es no (al menos en un sentido es-
pectro dep ende de la imped ancia compleja que encuent ra la seña l en el tricto , pues se pueden hallar dos seña les diferentes que cumplan un a misma
trayecto emisor-receptor) . 18 Las variaciones temp orales, en espec ial las de pe- función tímbri ca -por ejemplo en una fusión de objetos audi tivos- aunque se
queñ a escala presentes en el ataq ue, preserv an mucho mejor el patrón estruc- los pueda discrim inar) .
tural original luego de transform aciones como las anteriores. Se supone que Por otro lado ¿existe un "uníson o tímbrico", más allá del caso trivi al de
estos patrones temporales invari antes cumplen un a función destacada en la dos son idos de igual int ensidad y altura to na l? Es decir, dos son idos de diferen -
percepción de la co nsta nc ia tímbrica. te altura ton al e idént ico tim bre (¿no sería éste e! ideal de un con stru ct o r de
Habitualmente recon ocernos sin error el timbre de los son idos , lo que sig- pianos?). Al gunos autores creen que sí, aunque sus argumentos no son plena-
nifica que elegirnos los elementos de inform ación adecuados en contextos en- mente convincentes (Van Noorden, L., 1975 ; Erickson, R., 1975) . Otra carac-
teramente diferentes. Corno en el caso de las con stan cias visuales, la terística de la audició n, relacion ada con lo anterior, es la inexistencia de
constancia del timbre sólo puede ser explicada en func ión de com plicados alguna cosa parecida a una "oc ta va tím brica": no es posible obtene r un ciclo
procesos en las et apas superiores del tratamiento neura!. El trat amiento de las de timbres a partir del cual con struir una "esca la tímbrica", a semejanza de la
seña les de entrada al sistema audit ivo, o de las repre sentacion es auditi vas pri- escala de alturas to na les. Por supuesto , lo anterior no es más que otra forma de
marias, no alcanza para dar cuen ta de! fenómeno. decir que el t imbre es un rasgo multidimen sion a!.
Corno ocurre en e! recon ocim iento visual de los rostros, se supone que la
apa rición de cier tos rasgos específic os alcanza para situar un son ido en una ca- El timbre como un medio morfofórico
tegoría tímbrica particular -por ejemplo, para reconocerlo corno son ido de sa-
En el capít ulo V men cion arnos la posibilid ad de clasificar los rasgos ac ústicos
18 De aq uí surge la fragilidad de la altura espectral ant e la men or modific ación de la seña l
en morfofóri cos, capaces de portar formas inva riantes, y no morfofóricos. C o-
acúst ica. Esta propiedad, opues ta a la solidez que presenta la altura tonal frente a modifica- mentamos que la altura to na l y e! tiemp o const ituye n medios morfofóri cos po-
ciones similares o superiores, se desarrolla en Basso , G . (20 01a) . dero sos. Sin emb argo, tanto Attneave y Ols on , com o más adelant e Michael
188 189
Kubovy y Roger Shepard, conside raro n el timbre co mo un medio no rnorfo-
fór ico, Es ev ide nt e que a partir de l timbre no se puede codificar la misma cla - Capítulo VII
se de inform ación estruc tura l que se obt iene operando con la altura tonal.
S in e mbargo, descartar toda ca pacidad de organ ización estructu ral cim enta- Percepción auditiva del espacio
da en la modul ación tímbrica no parece razonabl e. La cod ificación fon éti ca
del habla se asie nt a prin cipalm ente en las variacion es del timbre en funci ón
del tie mpo , y la armonía musical puede ser co nside rada como un a parti cular
cod ificación del t imbre de los sonidos (cada func ión ton al posee un "color"
par tic ular) . "?
Timbre y atención
Para ana lizar la percepci ón audi tiv a del espac io es usual distingu ir entre loca-
U na característic a destacada de la percepción auditiva se relacion a con la lización y lat eralización . El térm ino localización se refiere a los juicios vert idos
atención . Si compa ramos las propiedades de los eve ntos y rasgos acúst icos que sobre la dirección y distan cia a la que se encuent ra un a fuente ac ústic a, que
nos perm iten manten er la atenc ión selectiva, veremos que son (casi) las mis- pueden o no coin cidir con su ubicación física. El término lateralización se usa
mas que se emp lean para discriminar y preservar el tim bre de un son ido an te para describir la localización aparente de un son ido "en la cabeza" del oyente.
ca mbios de co ntexto. En ambos casos el acento está puesto sobre el esfuerzo La lat eralización puede verse co mo una versión de laboratorio de la localiza-
r ara identificar y seguir auditivamente un objeto acúst ico particular. ción y es un compone nt e central en el diseñ o de ca mpos acústicos virt ua les.
Para caracterizar a l espacio acúst ico vamos a emplear coorden adas esféri-
cas cuyos parámetros son el ángulo de azimut El, el ángulo de elev ación O y la
4. COMENTARIO FINA L distanci a r a la fuente, tal como se ve en la figura l .
C omenzaremos nuestro estudio de la percepc ión espacial con el caso par-
Lo visto en este capí tulo vale solament e para caracter izar el t imbre de un úni- ticular de los estímu los sinusoida les estacionarios. Más adelante veremos lo
co objeto audit ivo. Tod avía no conside ramos las ca racte rísticas que debe po- que ocurre co n las señales generalizadas, variables en el tiemp o y de espectro
seer una seña l acúst ica para que percibamos Lino o una mult iplicidad de compu esto .
objetos acúst icos, terna que será desarrollado en el capítulo VIII.
La concl usión lógica de este capítulo esta ría dada por el an á lisis de los
li SOS musicales del tim bre, quizá ordenados de acuerdo co n su progresión his-
Plano
tórica. Pero tal empresa ocuparía, por lo men os, un libro similar a éste. Así que frontal
lo dejamos para más adela nte.
Plano
horizontal
1'1 En la música conte mporá nea la d isti nción ent re armonía y timbre resulta muc has veces
desd ibujada, co mo puede comprobarse en piezas com o AventuTes de Liget i y Modulations de
G risey. ' Figura 1. Siste ma de coord en adas esféricas: e, azimut; 0, elevación; T, distan cia
190 191
1. L OCALIZACIÓN DE SINUSOIDES 30
: : : ., , , , ., ,
,
20
tica que causa la cabeza al interponerse entre la fuente y el oído más alejado. Angu la horizonta l desde el frente (azimut)
En la figura 2 se puede ver la diferencia interaural de int ensidad (un) en
funci ón del azimut e. La frecuencia de la señal sinusoida l generada por la Figura 2. Diferen cia inreraura l de int ensidad (no) en func ión del azimut e y de la frecuencia
fuente se emplea com o parámetro de la famili a de curvas.
Una cabeza humana promedio se puede aproximar a una esfera de alrede-
dor de 20 cm de diámetro . A cau sa del fenómeno de difracci ón la cabeza no el t iemp o que le lleva a la onda alcanzar cada un o de los oídos . La ITO varía
va a provocar un a sombra acústica nítida por debaj o de 1.700 Hz, y va a resul- ent re O y 690 ms para seña les cuyos áng ulos de azimut cor respo nden a 0 ° y
tar acúst ica mente transparente por debajo de 500 Hz. C omo puede verse con 90 °, respectivamente. C om o un a onda ac ústica que se propaga en el aire tar-
claridad en la figura 2, la lJO es ínfim a a frecuencias por debajo de los 500 Hz, da 30 us en recorrer 1 cm , para ir de un oído al o tro nec esita aprox imada-
pero puede llegar hasta 20 dB a frecuencias elevadas. En otros términos, la di- mente 700 us.
fracción de las ondas en la cabeza limit a la eficacia del mecani smo de detec- Si las señales son estricta mente sinusoida les, un a diferen cia de tiemp o
ció n de diferencias int eraurales de int en sidad a la parte superior del espectro equivale a una diferen cia de fase. A bajas frecu encias la inform ación conte-
audible. nid a en la diferencia de fase es sign ificat iva, pero a a ltas frecuen cias la lo ngi-
En cuanto al mínimo cambio detectable en la lID, se ha comprobado que tud de onda es menor que la dist an cia entre o ídos y la difer enc ia de fase
llega a 1 dB para señales front ales siempre que la frecuenci a de la señal supe - prov ee dat os amb iguos. A una lon gitud de onda de 23 cm , similar a la distan -
re los 1.000 Hz. cia promedio en tre oídos, le corre sponde un a frecuencia de 1.500 H z. Si la
Un buen ejemplo relacionado con la liD lo pro vee la reproducción este - señal posee 10 kH z entran va rios ciclos co mpletos en esa distan cia y la fase
reofónica bicanal , en la que casi tod a la información espaci al está codificada dej a de apor ta r inform ación espacial unívoca. En la figura 3 se pueden apre-
úni cam ente en términos de diferencias de intensidad (esto no es así, deb emos ciar estas dos situac iones.
aclarar, en los registros de audio bien cuid ados en los que se contempla tam - Los movim ientos de la cabeza reducen en part e la ambigüedad de fase, pe-
bién la in for mación de fase). ro ésta resulta muy grande para frecuencias por enc ima de los 1.500 H z y el
mec an ismo de ITD pierde tod a efectividad.
Diferencia interaura1 de tiempo En la figura 4 se aprec ia la diferencia de recorrido en funci ón del áng ulo
de entrada de las señ ales que llegan a los oídos.
Para fuentes acú sticas ubic adas fuera del plano medi o del oyente, la diferen- Si den ominamos r al radi o de la cabe za, la diferencia de recorrido des:
cia interaural de tiempo (ITD) aparece co mo consecuencia de la diferencia en d = r () + r sen ()
192 193
En la figura 5 se puede ver e! gráfico de las diferen cias temporales de lle-
gada en func ión de! ángulo e. La curv a se quiebr a a 90 ° por simetría bilateral.
(ñ
.so 0,6 1/1\..
V "- t\.
Tan importa n te como la IT D es el mínimo cambio de ángulo perceptible c.
E 0,5
(M A A). C uando e! azimut e es cero los umbrales de detección para cambios en ~ / 1\
el ángulo de llegada son muy pequeñ os, de! orden de l Oa 2° -que correspo n- Ql
"O 0,4
/ \
den a una diferenc ia temporal de 1 0~. Para otros ángulos horizontales de lle- ~
:E 0,2
J 1\
azimut de 60° e! MAA no puede discern irse. ro
.¡;
~
e
0,1
/ 1\
~
i5 0,0
/ 1\
a) ~ ~ ~ ~ ~ 1~ 1~1~ 1~ 1~
Baja frecuencia Figu ra 5 . Diferenc ia interaural de tiempo IT D en fun ción del azimut
14
(ñ ,q
b) o ... II
"O 12 I I
~ I
I
I
I
~
a> ... ; :I
~
I
:o 10 1 ,
'O I
I
I
,
"
ro
o b '
I
I
I
I
"S
8 I
I
I
,
Alta frecuencia
"O
o 0 . . -0
:o 60°
E 4
ro
u •
Figura 3 . Pérdid a de efect ividad de la IT D a alta frecuenc ia por con fusión de fase. o
E 2
El mecan ismo no puede distinguir ent re la locac ión de [as fuentes 1'1 y 1'2 si emit en a a lta 'c
frecuenc ia ~
0°
O
200 500 1000 2000 5000 10000
Frecuencia (Hz)
Figu ra 6. Mín imo cambio de ángulo perceptible (MAA) en funci ón de la frecuen cia .
El pará me tro variable es el azimut 9
194 195
Batidos binaurales
196 197
1",
terior y posterior. Es decir, permite local izar fuen tes ubicadas en el plan o me -
dio , imposib les de resolver con la lID y la ITD (Butler, D., 1969 ).
Hoy está aceptado que el pabellón auricular mod ifica el espectro del estí-
Amplitud 10dB
.. ~\ ro.
e
0°
18°
---- /
0°
mu lo en función del áng ulo de inc idencia de la onda en relaci ón con el eje
'j 1"\,'\h\ JJ
18°
medi o de la cabeza. La acción del filtro se mide co mparand o el espectro del (\\ / \\ 1/ I 36°
./ 1\ '\ / A .\ )/
est ímulo ex te rior con el espectro de la seña l en la entrada del can a l aud itivo 36° 54°
./
externo. La razón , expresada en dB, se conoce como la funci ón de tra nsfe ren-
cia de la cabeza (HRTF) l y se pued e apreciar en la figura 8.
La información pro vista por el pabell ón auricular, dado su tam año - unos '8
r6
54°
72°
90°
»>
./
¡....-.... .::>
- /\"
¡......-----
/('\ '/
Ir\~ / A r:
72°
90°
27 cm 2- , es efecti va a frecuenc ias por encima de los 6 kHz. Entre 500 H z y
6 kH z la ca beza, act ua ndo como pantall a, funciona de manera sim ilar.
cri
~ 106°
.>
¡---.... .----J
/'\\ / ' f'
106°
"'\ I
~
En exp erimentos co n ruid o de banda angosta , la elevación apa rente deri- ------- f'. 126°
va de la coincidencia entre los picos de la HRTF y la frecue ncia ce ntra l del rui-
do. Por ejemplo, un ruid o d iótico centrado en 8 kHz se oye "arriba" al mar gen
126°
144°
-----.-/
--------
'"'\~ (\' IJ
/
144°
dos con la dirección de la fuente acúst ica, es necesario que distinga entre los V
picos y va lles relacion ados con la dirección (filtros HRTF) y los propios de la
0,2 0,5 2 5 10 15
fuente y de las reflexiones generadas en las superficies cercanas. Esto sign ifica
qu e el cono cimien to previo de la fuente y de las condic iones acú sticas del am- Frecuencia (kHz)
biente es relevante. Sin embargo, com o cada pab ellón auricular provee filtros
Figura 8 . Funci ones de tra nsferenci a desde e! camp o externo ,has ta la entrada de l canal
d iferentes y conocidos, se los puede separar de los datos espectrales externos. 3
aud itivo externo ( HRTF) con e! ángulo horizontal com o par ámetroe
G . Plenge presentó evidencia de que cuando un sujeto no está fam iliarizado
co n las características de la fuente y de l ambien te acú stico la localizac ión mo-
noaura l se degrada (P len ge, G ., 1974) . Pero en compensación se requieren
dade s d e fase típicas de las sin uso ides. Si el espectro cubre un gran rango de
muy pocos segundo s para entrar en la nue va situa c ión. Esta acomodación espa-
frec uencias, las ambigüedades de fase pueden ser superada s a travé s de compa -
cial es de gran imp ortancia en la aud ic ión y ejecución de música en vivo .
raci ones entre los canales del filtro auditivo involucrados. D. W. Gr~ntham
co nsideró que la d iferencia interaural de tiempo debe definirse a pa rtir de se-
Empleo de dat os es pec t ra les en la localización binaural
ñales de espectro de ba nda y prop uso llam arla verdadera ITD (G rantha m, G .,
199
198
para sinusoides de 1.000 Hz recortadas por una ventana rectangular de 1,4 s; tren de pulsos. Los clics luego de l primero apo rta n poca info rmación para la
y 28 us para clics de 1 ms de duración (tén gase en cuenta que 10 /lS cor res- localización . E. R. Hafter presentó evidencia de q ue un disparo adec uado -un
ponden a un desplazamiento lat eral de 1°). Los umb rales de IT D para tren es de pulso de ruido de baja intensidad o un hueco (gap) en el tren de clics- puede
impulsos repe tidos fuero n del orden de los 10 /lS (Klumpp y Eady, 1956 ). desac tiva r la adap tac ión binaur al. En su experimento los clics que aparecen
luego de la perturbac ión son más efectivos q ue los anteriores - adaptados- pa -
Localización en función de la frecuencia ra localizar espacia lmente la fuente. Hafter y Buell dicen: "[...) El siste ma au-
ditiv o se vuelve insensible a los datos interaurales luego del ataque, a la vez
La disc rimi nación de la posic ión lateral sobre la base de los ret ardos temp ora- que mon itorea el entorno a la espera de nuevas condiciones. Cuand o algo
les entre los dos oídos depende principalmente del contenido de baja frecuen- inespe rado oc urre, el entorno espacial es nu evamente exa minado" (Hafter y
cia de señales de banda ancha, por ejemp lo clics. Por debajo de 1.500. H z las Buell, 1990).
fases de las oscilaciones de decai miento en la onda de los dos oídos puede n
compararse, proveye ndo info rmac ión sobre los t iempos de llegada relativos de Interferencia binaural
los clics. Para frecuenc ias por enc ima de 1.500 Hz la información de la estruc-
tura fina del decaimiento se pierde. Sólo queda la referida a la envolvente de Los ruidos de baja frecuenc ia deg radan fuertemente la lateral ización de las se -
dec aimiento. ñales de alta frecuen cia, mientras que la recíp roca no es cierta. Una interpre-
tación de la inte rferencia bina ural establece que ésta resulta de la fusión de la
1mportancia de las disparidades en el cuerpo de la señal señal y del ruido en una imagen auditiva única, no jerarquizada.
El siste ma auditivo bin aural parece procesar sólo el ataq ue del co nj unto en un
200 201
-- - -- - - -- • C uando oc urre lo an ter ior, la locación de la fuente est á dete rmi nad a
Iln¡;;r~a~ió;; s-;'n; orial- .
'"
-1:
~ -P~:e~a~o~
--
monoaural
I Procesador I-P~:e~a~o~ ~
• Si el estímulo retrasado es lo suficiente in tenso , entre 10 y 15 dB por
enci ma del primero, el efecto no ocurre.
• Se asume cor rien te me nte qu e e l efecto trabaj a más efecti vam ente cuan-
-T--- '
I binaural monoaural I
o L_ -
I T
do ambos estí mulos se parec en. P Dive nyi demostr ó, sin embargo, qu e las di-
Estimulación 1.
de la cóclea I I 1
Eslimulación
-, de la cóclea
feren cias espectrales no cuen tan si se mantiene la envolvente temporal
(D iven yi, P, 1992) . Esta co ncl usión es razona ble, pues las reflex iones puede n
mod ificar el espect ro de la seña l por distor sión armóni ca .
• El efecto es más notorio en el plano hori zon tal , aunque ta mbién apare-
r -
I
--
Filtro del
-- I
ce en el plano med io.
~;
• El efecto de precede ncia puede to ma r a lgún tiempo en aparecer (m uy
importa nte en grandes salas e iglesias) .
• C iertas modi ficac iones en las con dic iones acú st icas del ambiente pue -
den destruir ternp orariarnente el efecto de preceden c ia.
• La habi lidad para detect ar ca mbios en el interv alo temporal del estí mu-
Figu ra 9. Mode lo esquemát ico de Blauert para la aud ició n espac ial lo ret rasado puede mejorar notab lemente con la prác t ica.
El efec to de preced encia no inv o lucra un a co mpleta supresión de la infor-
mación de los "ecos". El oye n te pued e distinguir cualitativame n te cualq uier
4. EL EFEcrO DE PRECEDENC IA ca mb io en el pat rón tem poral de los estímulos. Es más, este patrón aporta in-
formac ión sobre la sala y la posición de los objetos y paredes en ella. El efec-
Sabemos q ue e l senti do de la aud ic ión , a diferencia de la vista, se co ncentra to de precedencia seguramente aparece en un ni vel relati vam ente a lto del
en las fuentes acús ticas antes que en las reflex iones provocadas por los obje - proceso cog n itiv o , Parece que los posib le "ecos" son sup rimidos después de ha-
tos de l entorno. U n eje mplo co t id iano ocurre al locali zar la ubicación de un a ber sido evaluado s com o co ns istentes con las expectat ivas del oyente en rela-
fuente acúst ica en un a sala reverb erante donde la mayor parte de la ene rgía ción co n la fuente acúst ica y a l ambiente. C uando ocurre un ca mbio
proviene de reflex ion es. Wallach (1949) y Hass (1951) investigaron este fe- inesperado la máscara del efecto de precedencia puede retirarse mom entán ea-
nóm en o con dos seña les asincrón icas y los resultados pued en sintet izarse en mente. En e l gráfico de la figura 10 se puede ver co n clarid ad la región de va-
las siguientes reglas. lidez del efecto de precedencia.
• Dos son idos sucesivos se percib en co mo un o solo si el inter valo te mpo- En la región supe rior las reflexion es superan los lím ites del efecto de pre-
ral entre ellos es lo sufic ientemente co rro . El límite super ior es de 5 ms para cedencia y se las perci be com o ecos aislados, en la pa rte intermedi a las refle-
clic s y de 40 rns para son idos de carác ter co mp lejo, com o pa labra y música. x iones apo rta n inform ación espa cia l del entorn o acústico, y en la región
202 203
20 r-----,,....--r--r--r----,----r--r-----.
10 Altav oz 2
Cñ Eco
:!:!. .: // I\~
.5 O
9
"x
al
Pos ición ~
¿-
o:: Alta voz 1
al
.; -10 del oyente
al
"O
~ -20
Z Figu ra 11. Sistem a de refuerzo electr oacúst ico co n dos altavoces distantes ent re sí
-30
Reflexión
inaudible
. ' ••!3
A
-40 O 10 20 30 40 50 60 70 80
Retardo de la reflexión (ms)
Altavoz 2
Figura la. Región de validez del efect o de preceden cia
Altavo z 1
infer ior las reflexion es se vuelv en ina udibles. C uando las reflexion es poseen
retardos iguales o men ores a 1 ms aparece el fenó meno de filtro en peine, q ue
se oye co mo una especie de co loraci ón espectral."
Tiempo de recepción (ms)
204 205
Rango del efecto
Hass o de precedencia
iñ
I Altavoz 2
:E. con retardo
"C
Altavoz 1 de señal
ro
"C
"¡¡;
e
al
E
TIempo (ms)
Figu ra 14. Diagrama remporal en e l pum a de recepc ión luego de insta lar el disposirivo de
retardo
Figura 15. Co nstanc ia visual de tam a ño, La ca beza más ce rca na al observador rien e el
5. PERCEPCIÓN DE LA DISTA NCI A mismo tamaño que la "gran ca beza" alejada
Hasta aho ra ana lizamos los mecani smos empleados para det erminar la direc -
ción de llegada de las ondas ac úst icas desde un a fuente exte rna . N os queda por diada en det alle, la distan cia aparente de la fuente ac úst ica que defin e la pers-
ver de q ué man era evaluamos la distancia a la que se en cuentra dicha fuente . pectiva auditiva compo ne un a importante dim en sión psicoacústic a. Los inves-
En e l siste ma de coorde nadas esféricas de la figura 1, al com ienzo de este ca- tigador es que desarrollan dispositivos acúst icos para el cine y sistemas
pítulo, nos falt aría determinar la distancia r a la que se encuentra la fuente. multimedia han concentrado gran part e de su interés en el perfecci on amien-
to de modelos virtu ales de perspectiva auditiva.
Perspectiva auditiva La sonor idad, cuando interviene co mo un parámetro de entrada para eva-
luar la distanc ia de las fuentes acúst icas, deja de ser un correlato unidimensio-
La perspec t iva acústica, a l igual que su co nt raparte visual, es una import ante nal de la intensidad física para con vert irse en un rasgo co mplejo q ue involu cra
fuente de inform ación ambiental. Las imágenes acúst icas de gran desarrollo en más de una dimensión . Los objetos en el mund o son, en general, de tamaño
azimut se reducen a un punto a grandes distancias. Por ejempl o, el ancho acús- constante, pero la imagen de un objeto en la retina crece y decrece cuand o és-
tico a/larente de una orquesta sinfón ica, muy grande en las primeras butacas de te se acerca o se alej a de nosotros . Este hecho es conocido como constancia de
la plat ea, disminuye a unos pocos grados al oírla en un parque a 300 m de dis- tamaño. En la figura 15 se puede apreciar una ilustración clásica de la constan-
tan cia.s El efecto es equivalente al de las líne as paralelas que convergen en el cia visual de tamañ o.
infin ito. Si cont inuamos desarrolland o la ana logía con el sent ido de la vista, En el dominio de la audición la constancia de la sonoridad funciona de mo-
se podr ía decir que la sonori dad disminu ye con la distan cia ta l como ocurre do aná logo a la con stanci a de tamañ o para el sentido de la vista. Si un a fuen-
co n el ta maño aparente de los objetos y que la definición t ímbrica se atenúa te acúst ica de int ensidad con stante se aleja de nosotros a camp o libre , la
de modo similar a l gradiente de color en la visión . 6 Aunque no siempre estu- intensidad física que nos llega disminuye prop orcionalmente con el cuadrado
de la distancia. No debe sorprendemos entonces que una fuente cuya intensi-
dad decrece parezca alejarse. Es decir, también podemos experimentar la sen-
~ El panimetro subjetivo emp lead o en ac ústica de salas se den omina "anc ho aparente de la
lucn t e" ( AWS) , bien cor relacio nado co n el facto r obje tivo de espac ialidad (I-IACC) . sación de oír una fuente acú stica que disminuye de intensidad sin alejarse -un
(, La ana logía co n el sent ido de la vista, aunque inexac ta, resulta útil para ejemplificar los instrumento musical en decrescendo-, cuyo equi valente en el camp o visual po-
d iferentes aspec tos imp licados en la percepción de la perspecri va auditiva. drí a ser un globo q ue se desinfl a.
206 207
Imaginemos un experimento: un oyente observa a dos cantantes, una cerca- Canta fuerte. pero lejos
na y \<1otra alejada . La cantante cercana produce un sonido pp, mientras que la
(11 rn cmite el mismo son ido pero en ff. Los son idos poseen la misma altura tona l
---1----
Q)
c ib ía. En la figura 18 se esquematiza una situación simétrica a la de la figura 16. c:-
"" :J
.e : CJ) I
o~
Una fuente de información adiciona l la prop orci ona la reverberación del
recin to . La relac ión en tre la intensidad de la rev erberación y la onda dir ect a
es interp retada por el oye n te co mo un índ ice de distan cia. En un espacio ce - pp
rrado t ípico la intens idad de l ca mpo rever berante no varía co n la d istan c ia a
la fuente, mien tras que el sonido dir ect o sí lo hace. Sabemos, por experiencias
previas, que el nivel del ca mpo reverb erante depende de la intensidad de la
fuen te q ue lo excita y usa mos este co nocimie nto para eva lua r la intensidad y
dista ncia de las fue ntes acústicas en recintos ce rrados .
En la figura 19 se comparan dos seña les inmersas en el mismo ca mpo re-
vcrbera n re. La seña l A se ubic a a cinco unidades de distan cia del oyente y po-
see una inten sidad relati va se is veces men or q ue la seña l B, a un a distan cia de
dos unidades. A mbas llegan al punto de recepción co n la misma intensidad di- Dltura
Menos parciales y cambios en la envolvente
recta. S in embargo, la relación con el campo reverberan te aporta la inform a- espectral debidos al cambi o de altura
c ión necesaria para ev ita r la co nfusión de distan cias sin necesidad de apela r a
diferencias espe ctrales. Figura 17. Espacio distancia-intensidad-frecuencia según C howni ng
209
20/1
Aunque la an alogía con el sentido de la vista nos ha resultado útil hasta
aho ra, debe seña larse que la con stancia de sonor idad es más comp leja que la
consta nc ia de tamañ o: pocos objetos visuales varían de tamaño ante nuestros
ojos (como en el ejemplo de un globo que se desinfl a) , pero las fuen tes acús-
tic as varían norm almente de int en sidad en lapsos muy breves, especialmente
en música. Por eso quizá el mecani smo de percepción asoc iado a la co nsta n-
cia de sonor idad necesite inform ación relacion ada co n índ ices espectrales y
con la int erp ret ación de la relac ión seña l directa/señ al reverb erante. La eva-
luación aislada de la int ensidad parece no alcanzar.
En gene ral, los juicios auditivos sobre la distan cia a la q ue se enc uentra
una fuente acúst ica son relati vamente imprecisos, y los errores co n relación a
la distancia física son del orde n del 20% en sit uac iones normales.
Es interesante descr ibir lo que ocurre cua ndo los oyentes son privados de
algunos de los datos men cion ados. Por eje mplo, en el ca mpo libre no actúa el
sistema de evaluación de la perspectiva relacion ado con la reverberación y la
FiJ(lIra 18. Percepción de la d istan cia: los son idos de ambas cantantes posee n para e l
precisión de los juicios co n relación a la distancia se reduc e sign ificativamen-
"Yl' Il~e la ~nisma intensidad, pero la composición espectral le permite al oyente sabe r que
la lilas a lejada ca nta en ff te. Estas situac iones se han estu diado en experiencias de laborat ori o, con
fuentes sinusoida les ubicadas en cá maras ane co icas, en las se preserv a sola-
mente la informac ión relacion ada con la inte nsidad física.
La habi lidad para percibir el movim ien to lat eral de una fuente acústica se mi-
B de empleando el mínimo ángulo de movimiento audible (MAMA). Los ex perimen -
u tos han mostrado que el sistema auditivo es poco sensible al movimiento de
ro
u
.¡¡; las fuentes acús ticas, aunque se co mporta mejor ante movim ientos lentos. Pa-
e Señal
ra desplazamientos angulares del o rden de los ISO/s, el MAMA es de 5°. Pero pa-
.
ID
directa
.E
.... ra mov imientos angulares veloces, del orden de los 900/s, el MAMA crece hasta
llegar a 21°.
El efecto Doppler, responsable del ca mbio de altura en las sirenas de las
ambulancias cuando pasan a nue stro lado, es una importante fuente de infor-
mación sobre el ca mbio en el sentido del movimi ento relat ivo en tre el emisor
acústico y el oyente. Es un fen óm en o físico que hace que la frecuencia aparen -
"I te en el pun to de recep ción aumente si éste se acerca a la fuente y qu e dismi-
nu ya si se aleja de ella. En la figura 20 se ilustra el caso con un a fuente acúst ica
2 3 4 5 6 en movim iento hacia un receptor en reposo.
Distancia de la fuente Si la fuente se enc uentra qu iet a la onda acústica llenar á la distan cia FR
que la separa del rece ptor en un tiemp o tu = FR/c , con e como la velocidad
FiJ(lIra 19 . Raz ón seña l d irecta /ca mpo reverberan te en func ión de la d istan cia
del son ido en el a ire. La lon gitud de o nda en este caso es A. = FR / f ~t. Pero
210
211
Espacio acústico virtual
si la fuente se desplaza h ac ia el receptor a vel ocidad VF la onda ac ústica reco-
rre rá en el mismo tiempo un a distancia menor F'R. La fue n te se h abrá movi-
do en ese lapso una distancia F' R - FR = VF Ót y la nueva longitud de onda será
A' = F'R / f Ót. Tom ando en cuenta la relaci ón gene ral v = Af y luego de algu-
nas ope rac iones a lgebraicas senci llas se tiene qu e:
f' = ~f
c - VR
El efecto Dop pler se emp lea desde h ace t iempo en música electroacúst ica a Espacio acústico real
parti r de módulos específicos de procesamie nto. Casi no es n ecesario co me n-
ta r la imp ortan cia qu e tiene un a bu ena simulació n Doppler en el caso de los
Figur a 21. Ca mpos acúst icos defin idos por un siste ma esrereofón ico bican a l
efectos especiales para c ine y mul t imedi a.
En cuanto a la pe rcepc ión de l efecto, se reduce a la perce pc ión de un a va-
riación co ntin ua de frecu encia , que ya exa mina mos en el capítulo IIJ.
( IT D) Yde inte ns idad (no) qu e apo rta n las seña les qu e le llegan a ambos o í-
dos. En un siste ma electroacú st ico de rep roducc ión, sin emba rgo, a la infor-
7. CAM POS ACÚST ICOS VIRTUALES maci ón anterior se suma n las refer encias espac iales codi ficad as en la seña l
gra bada .
En un ca mpo acús t ico h abitual , con el oyente in me rso en su interior, la in - Por ejemp lo, el regist ro de un co ncie rto en un gran aud ito rio contiene in-
formac ión espac ial depende de los conocid os dato s espectrale s, tempor ales formac ión sobre la reverberación y las ca racterísticas espectro-temporales de
la sala. Asimismo , es func ión de los v ínc ulos espaciales entre cada instrumen-
to y ca da un o de los micrófonos ut ilizados. C uando esta grabación se rep rodu-
ce en otro rec in to a través de un siste ma ester eofónico bícanal, el ca mpo
ac úst ico que perci be el oye nte se desdobl a entre: a ) un campo acústicoreal, qu e
es en el qu e está in merso y que de tec ta a partir de los sonidos qu e él mismo
produce -como voz h ab lad a, ruidos de pisada s, et c>- y b) un campoacústico vir-
tual gene rado por la fuente electroacústica a par tir de las referencias codifica-
\ I V \ ]CV
) das en el regist ro origina l. En la figura 2 1 se puede ve r un esq uema qu e ilustra
v,
{LA A R dicha situac ión."
F'
7 Por supuesto que el térm ino "rea l" está emp leado aq uí co mo un a etiq ueta práct ica, sin
Figura 20. Efecto Do ppler co n un a fuente F en movim iento a velocidad VF hac ia un re- co nnotaciones ep istemológicas. En cie rto sent ido, por supuesto, ambos ca mpos ac ústicos
cepto r R en reposo son "reales" a su manera.
2 12
213
La situac ión ideal sería que el campo acústico real no interfiriese negat i-
vamente co n el espacio ac ústico virtua l que define la grabac ión . Pero esto Capítulo VIII
oc urre po r lo general en salas de aud ición cuidadosa mente d iseñad as, por Percepción de objetos auditivos
eje mp lo un a sala de control de un est udio de grabación . Lo habitua l es que el
campo ac ústico de la sala rea l degrade la informac ión espa cial qu e co ntiene n
las señales electroac úst icas. Au nq ue en el ejemplo nos refer imos a un sistema
cstereofón ico bicanal, lo mismo ocurre co n los demás siste mas de espac ializa-
c ión electroacústi cos que ex iste n en el mercado, tales co mo las diferentes ve r-
siones conoc idas como surround o las que se derivan de la codifícacl ón Blum lein
origina l.f
A lbert Bregman llamó análisis auditivo de escenas al proceso que permite reu -
nir en un a un idad perceptiv a e l conj unto de datos provenie n tes de un a fue n-
te acúst ica exte rna (Bregman, A ., 1994). Estrict am ente, cada oído no recoge
más que los cambios te mporales de la presión acústica en el tí mpa no que le
cor respo nde. U n agregado auditivo es, según Bregman, la asociación de las par-
tes del espec trog rama neu ronal (conjunto de datos sensor iales) que parecen
perte ne cer a un mismo eve nto perceptu al. Una fuente acúst ica es un a entidad
K Por ejemplo, Dolby-Surround, Dolby-D igital, THX, A mbisoni cs y muchos otros. física que genera ondas en el aire. U n agregado audi tivo es un percep to cau-
2 14 2 15
sacio por un grupo de elementos sonoros que se experimenta como un todo y mo gráfico. Es muy difícil distinguir cada comp on ente en la mezcla final, pero
que parece ema nar de una única fuente acústica externa. ' Normalmen te, las real izamos esta operación inmediatam ente con el oído (si pudiéramos reprodu-
propiedades emergentes que definen cada agregado están correlacion adas con cir las seña les en un equip o de audio) gracias al proceso de agrupamient o per-
las propiedades de los objetos físicos asociados. ceptu al. Cada una de las fuentes co rresponde a un solo agregado acúst ico.
En visión se pued e describir el problema del aná lisis ópt ico del ambiente Parece haber diferentes mecan ismos de segregac ión auditiva q ue respon-
en té rminos del correc to agrupamiento de las regiones est imuladas en la ima- den en funció n de la tarea a realizar. C uando los oyentes intentan manten er
gen ret iniana. En nue stro caso ¿q ué elementos se deb en agrupar para ensam- int egrada en un solo agregado una secuencia de son idos, la segregac ión es in-
blar un son ido o, mejor aún , un objeto acúst ico ? No es posible co mparar las voluntar ia y opuesta a sus int enci on es. Pero cuando los sujetos se esfuerza n en
estrat egias de agrupamiento de amb os sentidos pues existe una diferencia cru - separar los son idos la segregac ión aparece como un proceso de selecc ión pro-
cial en el modo en que usamos la en ergía acústica y la lumínica para obtener vocado por la ate nc ión . La existe nc ia de estos dos mecani smos explica los di-
información del mund o ex te rior. En audición, hacemos uso de la ene rgía emi- ferentes resultados que se ob tiene n en las pruebas experim entales cuando se
tida por los objetos (las fuentes acústicas) y cas i no to mamos en cuenta la varía alguna ca racterística acústica en la seña l de ent rada . Las diferencias t ím -
ene rgía reflejada en ot ros objetos físicos. Se podr ía afirmar que ex isten al me- bricas ent re sonidos musicales, por eje mplo, faci lita n mucho la segregación.
nos tantas fuentes acústicas como objetos sonoros en una situac ión n orm al. Pero si la secuenc ia se basa en ot ro factor de agrupamiento diferente, como
Las reflexiones -que cambian en funci ón del contexto espac ial- degradan la puede ser la variación de la altura to na l, las diferencias tímbric as no provocan
inform ació n que nos llega de cada una de las fuentes. En con secuencia, nece- ne cesariamente la segregación.
sita mos aten uar la información que llega por reflexión y co locar en primer pla- El sistema auditivo emp lea diferentes datos para separar los objetos aud it i-
no la q ue nos llega dir ectamente (en una sala de conc iertos situa mos vos. En lo que sigue describiremos los más destacados. Debe ten erse en cuenta
auditivamente el pian o en el esce na rio, aun cuand o gran part e de su energía que no siempre se utilizan todos los datos en todos los casos: el agrupamiento
nos llega por reflexión desde las paredes y el cielorr aso de la sala). Por el co n - perceptu al no es un proceso a "todo o nada". En una situación comp leja se ob-
trario' la inform ación visual está causada prin cipalmente por la reflexión de la serva con frecuen cia que e l dato saliente enmasca ra y oscurece a los menos
luz en los objetos de interés. Encende mos una lámpara no porq ue nos intere- acent uados, mecanismo que nos permite manten er la eficiencia perceptu al aún
se mirarla, sino para ver por reflex ión los objetos de la sala. A diferencia de la cuando no esté presente toda la información esperada . En el caso del timbre,
gran cantidad de fuentes acúst icas que nos aco mpaña n desde siempre, hub o que depend e de una gran cantidad de ent radas auditivas conc urrentes, el con -
una sola fuente de luz a la vez a lo largo de gran part e de nu estro recorrid o evo - texto juega un papel determ inante a la hora de decidir cuál dato es sign ificati-
lutivo. En resumen , los datos audit ivos y visua les son diferentes y se comple- vo, y cuál no lo es.
mentan para brind arn os un pan orama verosímil del mundo exte rior. El "efecto de cafetería" (o "coc kta il party") pon e de man ifiesto la eficac ia
de nu estra capacid ad para separar los d iferentes objetos audit ivos. Podemos
mant ener una conversación sin inconvenie nt es en un ambien te con gran con -
2. I NFORMACIÓN UT ILIZADA PARA SEPARAR LOS OBJETOS AU DIT IVOS taminación por ruido . Sin embargo, si registramos con un micrófon o dicha
con versación y la reprodu cimos más tarde habremos perdido algunos datos
La fusión o fisión simultá nea de la información audit iva y la construcc ión de esencia les para sepa rar la figura acúst ica del fondo de ruido y el discurso se
agregados son ejemplos de organ ización perceptual. A part ir de el los ana liza- vuelve in intelig ible.
mos el entorno ac úst ico al distribuir los dat os sensoriales ent re los d iferentes A contin uació n descr ibiremos los rasgos de la inform ación acúst ica que
objetos audit ivos potenci ales. Podemos ilustrar la distinción entre los concep- permi ten agrupar o separa r los diferentes objetos ac úst icos entre sí.
tos de fuente acústica y de agregado acústico a part ir de las señales de la figura
l. En ella se ven varias ondas acústicas aisladas que se han reunid o en el últ i- Annonicidad y frecu en cia fu ndamental
I Es una traducci ón (quizá no muy feliz) de auditory stream ("corriente", "flujo") . C reemos, Un con junto de parcia les perfecta mente armónicos tien den a fusiona rse en un
sin embargo. que el ténnino "agregado " describ e ace ptab lemente la idea de Bregman . solo artefacto percep tual, pues compa rte n la misma altura to na l, definid a por
216 217
-t
-a Voz humana
la componente fund amen tal de la serie. De acuerdo co n este criterio, si dos es-
-3
-4
tím ulos simultáneos de espectros perfectamente armónicos tienen diferentes
-6
frecuencias fund am entales, se oyen sepa rados .? Una desafin ación de! 3% es
~ =~~
-O -21 suficien te para qu e un armó n ico se perci ba segregado de! complejo (siempre
.:3 - 1+t-+++++l+I--H
:.a.E -2 1
-15
que su dur aci ón exced a los 400 ms) . Para el son ido complejo resta nte , e! efec-
<t: .~~
to de la desafinación de! armón ico es sim ilar al que oc urre cuando se reduce
-.
-4 e! nivel del armó n ico en cuest ión hasta vo lverl o inaudible. La fusión por ar-
-3
-a
-t L- --'- ----'--_---' monicid ad fue uti lizada desde e! medioe vo para combinar los registros de ór-
~~O M ' ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ l gano y co nsti tuye un recurso clásico en orquestac ión .
Tiempo (segundos)
-,-z
-3 Impresora Disparida des en el ataq ue
-4
-6
I
~ r~v ~
1
,vv ' ''W ~I VIJ\,J " ¡V Y~V 1V - y
, :
V' VlJ IYV V V ~
!
Rasch in vestigó la h abilidad para o ír un son ido co mplejo en presencia de otro
semejante (R asch, R. A. , 1978) . C uando la única diferencia entre ambos es la
frecuen cia funda me ntal, la seña l debe estar por enci ma de los -20 dB respec-
<{ -9 ¡
-6
to de! sonido en mascarante. Pero si la seña l co mienza 30 ms antes del en mas-
-4
carante, se la perci be aun cu and o su n ível llega a ape nas -60 dB (figur a 2). La
-,-,
-3
seña l puede seguir percibiéndose aun que cese de inmediato después del ataque
~~~ 15~~~~~~~~~~~~~~~~~ 1
Tiem po (segundos) del son ido en masca ran te (este efecto se relacion a co n e! fen óm en o de co nt i-
nuidad que veremos más ade lan te j.! El va lor de 30 ms cor respo nde apro xima-
-,
-t
Alarma
-3
-4 damente a las imp recisiones de ataque qu e se encuentran co n frecuencia en la
-6
música instrume n ta l. Esta capacida d de agrupa miento por disp ar idad en e!
ataque refue rza la idea trad icional de que las asincro n ías son un factor impor-
tante en la percepción sepa rada de las voces en la música polifónica.
En un experimento relacion ado co n las disparid ade s temporales en el ata-
qu e, Rob erts y Moore dem ostr aron qu e sin usoides extra ñas agregadas a un a
-4
--,, L-
·3
.....J
vocal pued en influir en su ca lidad t ímbrica, pero qu e esta influ encia se redu -
0,005 0,010 0,015 0,020 0,025 0,030 0,035 0,040 0,045 0,050 0,055 0.000 O,CM 0,070 0,075 0,000 0,005 coso 0.095 0,1 ce not ab lemente si el elem ento ex traño apa rece antes o después del in icio de
Tiempo (seg undos)
la voca l - se segrega de ella (M oore, B., 1997) .
-,-a
Mezcla
i¡~l\~.~W~
Contraste con sonidos previos
La perc epción de un estí mulo es afectada por los estí mulos inmedi atamente
precedentes. En gene ral, al nuevo estí mulo se le resta algo así como e! "nega-
tiv o espectral" de los anter iores.
-4 - ¡ I I
-3 •
.,-,
L-_ _~_--'-_"._"._"._".__=_=_=_=:_:_:':
_==_==_=:_:'
2 Las relacion es entre espec tro ar mó nico, periodic idad y ton icidad se ex pon en en el
Tiemp o (segundo s) Apé nd ice I.
3 Algun os canta ntes lo util izan para conseg uir pianissimos sorpren dentes (y, est rict amente
Figu ra 1. C uatro seña les sepa radas reunidas en el último gráfico ha blando, inaudibles a no ser por el mecanismo citado).
218 219
Enmascarante
1I1\1 \
\
"tJ
.~
a.
'11
E
<l;
.'
,----"~'---...,
"tJ
.€
a.
E
<l;
: Señ al
Tiempo
1/ I \ Frecuencia
Figura 3 . Espec tro de potencia de dos seña les suces ivas. El tercer gráfico representa e l
Figura 2. Experimento de Rasch espec tro perc ibido por e l oye nte
Tam bién se ver ifica un efecto similar cuando oc urre un cambi o en el estí- Localizaci ón de la fue nte
mulo, que puede ser interp retado co mo que el estímulo de par t ida se sustra e del
csr lmu lo fina l. El rasgo modificado se separa perceptualmente del resto y la par- Mu ch as veces las d iferencias espaciales juegan un papel importante en el an á-
te del estímulo que permane ce est able se reduc e hasta su nivel de adaptac ión. lisis aud itivo del entorno al facilitar o dificultar la segregac ión basad a en otros
Un eje mplo notab le de lo an te rior se da al o ír un estímulo con un a estruc- fact ore s." Sabem os, por ejemplo, qu e un a seña l se detect a con mayor faci lidad
rura espec tra l particular, seguido in med iatament e por ruid o blan co (espect ro cuando su ubicación espaci al difiere de la del ruido enmascarante.
plan o) . El ruido blanco aislado puede ser descri to co mo "no coloread o". Sin Shackleton y sus colegas inve stigaron la habilidad para identificar cada
embargo, en la secuenc ia completa se oye un a estructura espec tral "col orea- vocal en un conjunto de dos voca les conc urren tes. Encontraron que una dife-
da" , q ue co rrespo nde al espectro de la primera señal in vert ido (figura 3 ). rencia de frecu encia fund amental entre las do s mejora la identificac ión en un
22%, mientras que un retardo de 400 Ils --corre spondientes a una diferencia en
C orrela ción de los cambios en amplitud y frec uencia azimut de 45°-la mejora sólo 7% (Shack leton, T. M. et al., 1992) . En resumen,
el mecanismo de segregació n espectral parec e ser más poderoso que el espacial.
IZasch tamb ién notó que , aun cuando dos sin uso ides co miencen en sincro n ía La pregunta es, entonces, ¿por qué los human os no le dan prioridad absolu ta al
es posible ac rece ntar la separación perceptual modulando en frecuen c ia la m ás índ ice espacial ? Y la respuesta se enc uentra en la base de nuestra estrateg ia au-
aguda (R asch, R. A., 197 8) . Este proc edimiento permite reducir el umbral de ditiva, centrada en la percepción de fuentes y no de reflexiones acúst icas. Las
pe rcep c i ón de la seña l de mayor frec uencia en 17 dB . En realid ad , el experi- seña les provenientes de la fuente pued en haber sido reflejados muchas veces en
ment o de Rasch no es más que un caso par ticu lar de una característ ica gene-
ra l de la percepción aud it iva: los son idos qu e presentan ca mbios "co herentes" 4 Recordemos que la localización de la fuente se refiere al mund o físico mientras que la la-
tiend en a fusiona rse perceptualm ente, mien tras los qu e presentan variacion es teralización de l son ido pertene ce al uni verso de las representac iones me nta les (véase el ca-
incoh erentes entre sí tienden a segregars e, pítu lo VII ).
220 221
fati zar part e de la infor mación cuand o e l contexto -o la tarea imp uesta- se lo
demanda. En algunas ocasiones la local ización (o la lat eralización) del son ido
ocupa un lugar fund amental en la segregación de los objetos auditivos . Un
buen ejemplo lo brinda nuestra ca pac idad para man tener una co nversación en
ambientes muy ruid osos.f
222 223
Es muy sencillo realizar el siguiente experimento: se generan digitalmen-
+ te tres series armón icas con la misma fundamental, que se funden perceptual-
c:
-c
'¡¡;
mente en un solo objeto acústico -se oyen com o si estuv ieran origina das en la
~ misma fuente. Si a cada serie armónica se le agregan pequeñas fluctu acion es
a.
no correlacionadas (que pueden ser tres vibratos diferentes), cada serie se se-
para de las restantes y se las oye com o si provinieran de tres fuentes distintas
emitie ndo en uníson o.
Los siste mas audi tivo y visual parecen trat ar la periodic idad y la simetría
+
c: de un a man era similar, pero co n diferente grado de resolución . Por eje mplo ,
-o
'¡¡; la vista no de tecta con facilidad la aperiod icidad de la segunda seña l de la fi-
~
a. gura 6, al no contar co n la ayuda de las líneas que indica n los períodos que
aparecían en la figura 5. Tamp oco nos percatam os in medi ata mente de que tres
de los edificios son men os simé tricos respecto del eje ce nt ral que los otros dos.
El siste ma audit ivo, en cont rapart ida, detect a inm ed iat amente un grado simi -
Figur a 5. Comparación enr re una seña l per iódica y una seña l cuasi periód ica
lar de disparidad .
Tanto el sistema visual como el audit ivo pierden par te de su capacid ad de
at ención -se podría decir que se "descon eét an"- cuando aparecen simetrías o
periodicidades perfect as, aún dur ante un tiemp o breve, y fallan a l intentar ex -
+
c: traerles información relevante.
-o
'~
a.
r-t--t-\-+--+-/-t-+-+--,I-+--+--4-r-....:......
Percepción de secuencias rítmicas
••
•• ••
••
adve rtidos , los subsiguientes puede n ser anticipados. Handel demostró, en se-
cuencias repetitivas segmentadas por pausas, q ue el principio de agrupa mien-
••
•• ••
••
to per ceptual pred om inante se basa en la estruct ura tem po ral ; otros
parámet ros, com o la altura tonal, pasan a segundo plan o (H andel, S., 1989) .
••
•• ••
•• En otras palabras, la estruct ura temporal -Handel la llamó timing- de los ele-
••
•• •• mentos es más importante para determinar el ritm o subjet ivo que la estructu-
224 225
timb re. Si la secue nc ia se perci be como un todo se prod uce fusión rítmica, y in te rna lizado y operaría aun si el auditor no está familia rizado con la señal fí-
cuando apa rece dividida en varios pat ron es diferentes se produc e fisión rítmi- sica en un caso particular. Que el siste ma audi tivo interpreta una transforma-
ca. Bregman sugirió que cada agrupamiento producido por la fisión rítmica co - ción súb ita de las prop iedade s ac ústicas co mo el inicio de un a nu eva seña l, o
rresponde a un objeto audi t ivo diferente. Dowling dem ostró qu e la que haber oído previamente un son ido pot encia la percepción de su ocurren-
segregación ocurre también cuando las seña les sucesivas difieren en intensi- cia futura , son hech os que nadi e cuestiona. Aunque nosotros nos inclinamos
dad o en ubicación espacia l.f por el modelo acústico, la propuesta de Ca doz no deja de tener cierto atract ivo.
A lgunos co mposito res -no tablemente Bach- han aprove cha do la segre- Las regularidades físicas han sido corroboradas experimentalmente y son una
gació n prod ucida en sonidos muy separados en frecuenc ia -por eje mplo en las buena guía práctica, aunq ue qu izás no deriven de una co mprensió n perceptual
¡Jarritas para violín solo-, o la fusión de los son idos de dos instrumentos en una profu nda de la natur aleza de los procesos físicos invol ucrados.
sola melodía (para que el efecto tenga lugar los instrumen tos de ben ten er tim- De ac uerdo con el modelo físico, las regularidades que pueden emp learse
bres y locaciones similares) . para agrupar element os en un úni co objeto aud itivo son:
• Regular idad 1: es ex tremadamente raro que dos son idos, que co mien-
Percepción del orden temporal ce n y te rmine n exac ta men te al mismo tiempo, no posean alguna relación en-
tre sí.
Puede ser difícil esta blece r el orden temp oral de sonidos que parecen provenir • Regularid ad 2: progresión de una transform ación : a) las propiedades de
de diferentes fuentes acúst icas. Las person as no en trenadas necesitan duracio- un son ido aislado t ienden a modificarse de man era continua y lenta; b) las
nes de 200 ms para esta blecer el orden de cuatro eventos no relacion ados y prop iedades de una secuenc ia de son idos to mados de la misma fuente t iend en
muy diferentes. Este result ado qui zá provenga de la segregació n en d iferentes a modificarse lentamente.
corrientes audi tivas, donde los soni dos pa rece n flotar un os con respecto a • Regularidad 3: cua ndo un cuerpo vibra per iódica mente, sus vibraciones
otros en el t iempo subjetivo. dan nacimien to a un patrón acústico do nde las frecue ncias de las componen-
G iovanni Vicario demostró que no es posible ordena r temp oralm ente dos tes son múlt iplos de una misma frecuencia fundamen tal.
corrientes de son idos de alta y baja frecuencia cuando la separación exce de las • Regularidad 4: la mayor ía de las mod ificacion es que afecta n a una fuen-
tres octavas." En su experimento, cuan do los sonidos sucesivos se un ieron co n te ac ústica afecta a todos los compo nentes del son ido resulta nte, de man era
glisados en frecuen cia la tend en cia a separarse en diferentes co rrientes se re- idént ica y simultá nea .
dujo, aun cuando los glisados no fueran completos . La co nt inuidad perfect a
ent re tonos no es necesaria para reducir la fisión en tre las dos secuencias: si un El fen óm en o de reducción del enmascaramiento por com odul ación con s-
ca mbio en frecuencia "apunta" hacia el próximo son ido , el oyente puede se- titu ye un buen ejemplo de regular idad del tipo 4. 10 En el experimento clásico
guir el patrón de cont in uidad más fácilmente. Las tran sicion es bruscas ta m- de Don ald Hall se emite una seña l sinusoida l superpuesta a un ruido de ban-
bié n ayuda n a ev ita r la segregac ión en diferentes co rrientes aud itivas e das múltiples. Si el ruido se mantien e está tico el sonido de prueba es enmas-
interv iene n considerab lemente en la percepción de la palabra. ca rado, pero si e l ruido en rnascara n te fluct úa sincrónica mente en amplitud, la
percepció n de la señal se restablece. El oyente agrupa a las difere ntes bandas
Re gularidad en los datos físicos de ruido en un solo obje to auditivo a partir de su movimient o co mún. El so-
n ido de prueba, está tico, se segrega del resto .
Los teóri cos que propon en el modelo físico para describir la repre sentación
mental de un o bjeto auditivo, co mo C laude Ca doz, sost iene n que aprove cha - Redundancia de la información
mos ciertas caract erísticas de las fuentes físicas para compone r el an álisis au-
ditivo de esce nas (C adoz, C. et al., 1993) . Este mecani smo sería luego Como hemos visto , ex isten muchas estrategias de agrupamien to e interpret a-
ció n de los dat os sensoriales. Esta multiplicidad es necesaria porque cada un a
8 Dowling (I968) , en Moore, B. (I 997).
9 Véase este tema en el puma 4 del capítulo IV. \0 Véase este tema en e l puma 5 del capítulo 1lI.
226 227
de ellas, por separado, está sujeta al error. Por ejemplo, la estrateg ia que agru- necesario para exp licar por qué los seres h uman os vemos el mundo co mpue s-
pa los sonidos por su origen espacial puede ser ineficaz en amb ientes muy re- to de objetos distintos. La capacid ad de percibir objetos -piedra s, árboles, la-
verberantes. La que se basa en relac iones armón icas puede fallar si se dr idos o viento- debía esta r originada en operacio ne s efectuadas por e l sistema
enc uen tra con son idos ina rmónicos o ruidos de banda . Las que busca n simili- nervioso central. Advert ir que la percepción de objetos sepa rados no es sólo
tudes secuencia les pueden ser burladas ante son idos discontinuos o cambi an- producto de .las sensaciones periféricas fue una de las más import antes cont ri-
tes. La utilización en paralel o de varias relac iones de agrupamiento co nst ituye buciones de la escuela de la Ges ta lt.
hab itualmente una protección contra el fallo de una de ellas. C uando la in- Según la teoría de la G estalt los hechos psíquicos son formas, unidades or-
formación que recibe es contradictoria, el aud itor simplemente se puede de - gán icas que se ind ividua lizan en el ca mpo espacial y temporal de percepci ón
clarar incapaz de penetrar los comp lejos sonoros. La ex tre ma rareza de tale s o de represent ación . Las formas dep enden, en el caso de la percepción , de un
casos test imonia la potencia de análisis de l siste ma auditivo human o. conj unto de factores sensori ales objetivos. La percepción de las diferentes cla-
ses de elemen tos y de las diferentes clases de relacion es corresp onde a de ter -
min ados modos de organ ización de un todo , que dep ende a la vez de
3. PRINCIPIOS GENERALES DE ORGAN IZACIÓN PERCEPTUAL cond iciones objet ivas y subjetivas. La corre spondencia que se pued e estable-
y T EORÍA DE LA G ESTALT cer entre las partes de un todo articulado y cie rtos elementos objet ivos no se
mantiene, en gene ral, cuand o esos mismos elemen tos pertenece n a otro con-
Junto a sus descubrimientos fundacion ales en física y fisiología de la percep- junto objetivo. En otras palabras, una parte en un todo es algo dist into a esa
ción , Helmholtz es conocido también como un precursor de la psico logía cog- part e aislada o en otro todo, a cau sa de las prop iedades que deb e a su lugar y
nitiva. Formu ló el principio de la inferencia inconsciente, que establece que función en cada un o de ellos. El ca mbio de un a condic ión objet iva puede pro-
nuestro sistema visual "construye" objetos tridimension a les a partir de los da- ducir un cambio local en la for ma percibid a, o traducirse en un cam bio radi-
tos presentes en el espaci o bidim ensiona l de la ret ina . A parti r de l princi pio ca l de la forma emergente.
de Hel mholtz se desarrolló la teoría de la Ge stou. Ésta se in icia en 191 2 con un El objetivo inicial de la teoría de la Ge sta lt con siste en esta blecer, por
art ículo de Max Werthe imer sobre el mov imie nt o aparente, que exp lica la ilu- medi o de la ex perienc ia, un conjunto de condiciones de existencia de las for-
sión que posibilita la existencia del cine. El autor deduj o que la percepción de mas perceptuales y de leyes de transformación de dichas form as. Para que és-
un todo (el movimiento) era radica lmente diferente de la percepción de sus tas se muestren eficaces no es necesario que exista una corre spondencia
component es (las imágenes estáticas). La teoría tuvo un gran desarro llo du- rigurosa entre los elementos del estímulo objet ivo y los elem entos de la form a
rante los siguientes 50 años . Sin embargo, aunq ue la descripción de los fen ó- -de hech o, la cor respondencia di rect a gene ralmente no ex iste y, en tod os los
menos percept uales post ula da por los gest a lti stas no ofrecía rep aros casos, no se mantie ne constante.
impor tantes, la argumentación teórica se mostró insuficiente para fund amen- Los teóricos de la escuela afirmaro n que el proceso fisiológico que result a
tar sus leyes y la escuela cayó en cierto descrédito en la déc ada de 1970. En la de un conjunto de excitaciones tiende a organ izarse espon tá nea ment e si-
act ual idad, se han retomado sus principios generales de orga nizac ión percep- guiend o ciert as leyes de estru ctura, independientes en principio de las sign ifi-
tual, que describen a grandes rasgos las carac terísticas de la percepción , pero caci ones agregadas por la ed ucación. En la ac tua lidad existen teorías sobre la
se han dejado de lado los modelos exp licativos orig ina les. Casi todos los psi- percepción que contradicen tal afirmación. Se rán comentadas más adela nte.
c ólogos especializados en la percepción ace ptan hoy la operat ividad de las le- Los tr abajos de los psicólogos gestalt istas llevaron a enu nciar cinco le-
yes de la G estalt , aunq ue las justifican a partir de proceso s y mec ani smos yes y dos principios generales qu e permiten agrupar los estí mu los qu e pro-
diferentes. vie ne n de una misma fuen te, y segregar los q ue no lo hacen. En general,
Los gestaltistas, a difere nc ia de los estr uct uralistas, en tendía n que la per- un a reg la a islada no siempre perm ite la fusión o fisión per ce ptu al y var ias
ce pción no podía reducirse a una mera suma o ser ie de sensaciones , sino que de ellas deben actua r juntas para q ue emerj a la forma fin al (Ko h ler, Koffka
respondía a la configuración total de la que aque llas forman parte. "El todo es y Sande r, 1962).
distinto que la suma de sus partes" sint et iza un o de sus axio mas básicos, en el En lo que sigue describiremos brevemente las leyes y los principios gene-
que las propiedades emergentes ilustran el concepto gestáltico de organizac ió n rales de organ ización q ue propo ne la teoría de la Ge stalt.
228 229
Leyes de la Ge stalt
Los psicó logos de la Ge stalt centraron sus estud ios en el sentido de la vista.
Co n a lgunas adaptaciones, sus cinc o leyes y dos princip ios de organ izació n se
:lplican también a la aud ición . l l
ro
'0
e
Ql
:J
U
e
u,
• ••• ••• ,.
Ley de fJroximidad Tiempo
•••••• za depende del co nte xto o de la ta rea impuesta al oyente. Van N oorden
demostró que la similitud de timbre puede impo nerse a la similitud de altur a
ton al, al men os bajo ciertas ci rcunsta nc ias (Van N oord en, L., 1975) .
•• •• ••
Circules agrupados por proximidad
En la figura 10 se observa la ley de semeja nza aplicada a la vista y en la fi-
gura 11 se puede ver el espec trog rama de dos co rrientes perceptu ales agrupa-
das por semejanza tímbrica.
Figura 7. Ley de prox imidad
ro
'0
e
Ql
ro
'0
e
•••• •• Figu ra 10. Ley de semejanza
:J Ql
:J
•••• ••
U U
~
u, e
u,
•••••• • ••••• ro
•
'0
e
Ql
Tiempo Tiempo :J
U
~ \
Figu ra 8. Agrupami ento de sonidos por proximidad de alt ura
u,
\
Tiempo
11El orde n y aun el núm ero de leyes varía según el auto r que se consulte. El que expo ne-
mos aquí es el m ás frecue nte en la literatura sobre e l tema. Figura 11. Agrupamien to de sonidos por semeja nza de ti mbre
230 231
Ley de cierre
suave y conti nua. Los cambios bruscos indican que una nueva fuente se ha acti-
vado. Por ejemplo, si la alternancia entre sonidos agudos y graves se inte rcala con
La ley de cierre esta blece q ue las figuras incompletas t ienden a completarse y
los glisados en la direcció n adecuada, se reduce la segregación en dos corrientes
a ser percibidas co mo una un idad cerrada. En la figura 12 se ve una serie de
percepruales. En la figura 15 se puede apreciar el correlato auditivo de esta ley.
rect án gulos.
En la voz hab lada, grandes ca mbios inespe rados en la frecue ncia funda-
Bajo ciertas co nd iciones un son ido enmascarado puede o írse como si fue-
mental dan la impresió n de que un nuevo hablante se ha incorpo rado. Este
ra co nt inuo aún sin serlo (e n todo caso, no exis te ev idencia senso rial de su
efecto requi ere un "co noci mie nto" de las reglas norm ales de entona ció n. La
cont inuidad). Se lo sigue "oyendo" aú n cua ndo ha cesado. En la figura 13a
segregació n auditiva produce silencios ilusorios en cada cor riente d urante la
percibimos que la señal de banda angosta no presenta ni nguna solución de
part e de la seña l atrib uida a la ot ra corr iente.
cont inuidad. Puede oc urrir, sin embargo, q ue result e discontin ua en los tramos
enmascarados (figura 13b) .
Ley de destino común
Ley de continuidad o de buena forma
Por la ley de dest ino común los objetos que presentan un patrón de movi-
miento común tiend en a percib irse como una unid ad. Ejem plos clásicos son
La ley de con t in uidad estab lece que los ele mentos q ue forman parte de un pa-
las bandadas de pájaros o los grupos de maratonistas.
trón cont inuo tie nde n a percib irse co mo una unid ad. En la figura 14 ve mos
Esta ley es de eno rme importanci a en audición. Los diferentes componen-
dos líneas que se cruzan, aunque son pos ibles o tras configurac iones.
tes en frecuencia proveni entes de la misma fuente acústica varían usualmente
Esta ley, aplicada a la audición , hace uso de nu estro conoc imiento de las pro-
de una man era cohere nte. Tienden a comenzar y terminar juntos, cambian de
piedades físicas de las fuentes acústicas que mod ifican sus pará metros de manera
int en sidad a la par y altera n sus frecuencias de manera asociada. Por eso si dos
III III
• • • • •• • ••
°ü °ü
c:
1Il
::>
u
c:
1Il
::>
1\ III
u
e
u.
e
u. V V 'o
e
1Il
• •
::>
u \
• \
1Il
Tiempo Tiempo
u:
• • •• • \
232
233
Circulos agrupados por movimiento común
Figura 16. Ley de dest ino común (las ondas do bles representa n movimien tos en paralelo)
• • • • • • • • • • • •• • • •• • • •• • • •
Figur a 18. Figura y fond o
•• ••
.. .. : ..• • • • • •
••••
• •• G racias al pr inc ipio de figura y fond o se esta blece un a jerarqu ía entre los
objetos de in terés y el med io neutro que, aunq ue pueda estar const itu ido por
exc itac iones comp lejas y heterogéneas , es desplazado a un grado inferior de di-
Tiempo feren ciación . La segregación percep tua l entre figura y fondo no ocurre de ma-
Figu ra 17. Agrupamiento de sonidos por movimiento común nera mecán ica. A l oír una conversación o una melodía en un amb iente con
un gran ruido de fond o, seguim os al objeto aud it ivo que cont enga mayor sen-
tido en funci ón del contexto o de nuestro interés partic ular. C uando los índ i-
o más componentes de un son ido complejo expe rimentan el mismo tipo de ces de diferen ciación no son evidentes se producen figuras ambiguas o
cam bios al mismo tiemp o, son agrupados y perc ibidos como provenient es de la ilusio nes figura-fo ndo, situaciones que se aprovechan en e l mimetismo y en el
misma fuente. En la figura 17 las dos líneas melódicas que se mueven en para- camuflaje.
lelo tienden a agruparse ent re sí. El principio de pertenencia (t am bién conocido como principio de corres-
Con relación a la ley de 'destino común, hay dos fact ores que se destacan ponde ncia ) expresa que si un compone n te simple es usado para la form ación
a la hora de sintet izar sonidos para crear nuevos objetos auditi vos. El prim ero de una co rriente perceptual, no puede emp learse en la formación de una se-
tie ne qu e ver con la forma y sincron ismo del ataq ue, y el segundo con la sin- gunda corr iente. En la figura 18 no pueden verse a la vez la copa y los rostros .
cro nía de las modulacion es (de amp litud o frecuencia) en el desarrollo te m- Parece que ate ndem os a una corriente perceptual a un tie mpo, y el resto for-
pora l de los compo nentes que se pretende n agrupar. ma parte del fon do. A lgunos autores han aceptado, no obstante, que el prin -
cipi o de pertenencia auditivo puede debilitarse en ciertas ocasiones: un
Principio de figura y fondo elemento sonoro puede oí rse com o parte de más de una corriente perceptiva. I
En el caso de las tex turas po lifónicas se ha prop uesto la posib ilidad de perci- \
Ten emos la capacidad visual de distin guir una figura del fond o contra el cual bir más de una figura a la vez. I
aparece. Tambi én somos capaces de distin guir la melodía que ejec uta un solista El papel de la atenc ión es determinante en la selección de los ele mentos "
destacada por sobre la masa orquestal y de comprender el discurso de locutor de que van a formar part e del obje to acústico que ocupará la función de figura.
radio a pesar del ruido de fond o. Sin embargo, todos estos estímulos nos llegan La ate nc ión actúa sobre la ent rada auditiva para seleccionar ciertos rasgos del
desde el campo perce ptivo periférico sin jera rquización alguna. En la conoc ida son ido para su aná lisis co nsc iente. Empleamos nu estra sensibi lidad a los cam-
imagen de la figura 18 se pueden ver alte rnativamente dos rostros o una copa, bios en la seña l acúst ica para dirigir la ate nci ón hacia nuevos y pote nc ialmen-
según cuál de los campos visuales consideremos como figura y cuál como fond o. te impo rtantes eve ntos del ento rno. Cuando un aspecto del son ido cambia,
234 235
mien tr as el resto se mantiene co nsta nte, llama la atenció n del oyente: se co n-
viene en figura. El efecto "cocktail party" o la audición de una voz que se des-
taca del resto en una pieza polifónica son buenos ejem plos de elecciones
nrcn ciona les. Neisse r sugirió que la ate nc ión aparece una vez real izado un aná-
lisis preatentivo de las diferentes corrie ntes perceptivas (N eisser, u., 1967 ).
Sin embargo, este proceso no es de un solo sentido : se sabe que la ate nció n
puede influir en la form ación de cor rientes perceptivas.
El principio de pregnancia fue formulado por Koffka del siguiente modo: "la or-
ganización psicológica será siempre tan excelente como las cond iciones domi-
nant es lo permitan " (Guill aume, E , 1975). Se ent iende aquí por "excelencia" a
la intervención de propiedade s como regularidad, simetría, armonía de conjun-
to, homogeneidad, equilibrio, máxim a sencillez, etc. En otr as palabras, para agru- Figur a 19. Triángulo de Kanizsa
par el campo perceptu al recurrimos a la men or cantid ad posible de información .
Este principi o opera empleand o simultánea mente varias leyes de la Ges talt,
En la figura 19 se ha dibujado el trián gulo de Kani zsa. La interpreta ción
más eco nó mica en términos de informació n es supo ne r que ex iste un triángu - Como se escribió :
lo blanco que se supe rpone a tres círc ulos y al trián gulo delineado, y no la mu-
r-""-:::I
cho más compleja e improbable alineación de tres ángulos y tres pac man.
En el enmasca ramiento por ruido ocurre algo similar. Es más eco nó mico Violín I
1 .10
.
en términos de información supo ne r que el sonido en masca rado cont inúa en O I tf · I
I....J
presencia del ruido, que interpreta r una comp leja operac ión sinc rónica de ac -
tivaci ón-desac tivac ión. j .10 ~
Se puede aprecia r un eje mplo notable de agrupamiento, en el q ue inter- Violín 11
,) ~---.---
viene n varios prin cipios gestá lticos a la vez, al comienzo del movimiento fina l lo.--"
de la sexta sinfonía de Tchaikovsky. En el siste ma superior de la figura 20 se
ven las partes de los vio lines 1 y 11 tal como figuran en la partitura, mientras
que en el segundo siste ma está escrito lo que casi todos los oyentes perciben. Como se percibe :
En este caso se opo ne n entre sí algunas de las leyes de agrupamiento exa mi-
1 .10
nadas. Por semejanza tímbrica y de alturas se fusion an los son idos provenien-
Violín I
tes de ambos grupos instrumentales y luego se reagrupan de acuerdo con el
princip io de pregnancia. En esta segunda fase intervienen las leyes de conti- 4J
--= I
I
- tf ' ., .---.---
' 1}
compone n te espacial si se dispon e la orquesta en el escena rio de tal modo que
los primeros y los segundos violines queden alejados ent re sí, a ambos lados del Figura 20 . Reagrupam ient o melódico en el cuarto movimien to de la sexta sinfon ía ("Pa-
director, como ocurre en la form ación orquesta l "a la alemana" . r ética") de Tch aikovsky
236 237
Isomorfismo
Capítulo IX
l.os creado res de la escuela de la G estalt trataron de fundamentar su teoría en Percepción del habla
i érmin os fisiológicos. Postularon una conex ión muy direct a entre la experiencia
perceptiva, la fisiología y e! mund o físico a través de! principio de isomarfismo,
que afirma que una experienc ia subjetiva y e! disposit ivo neural asociado rie-
ncn estructu ras formales similares.
Se trata cla ramente de una postu ra monista en la que los procesos físicos,
fisiológicos, psico lógicos y cultu rales tien en la misma base rea l: la form a físi-
ca . La física se convierte aq uí en la c iencia funda ment a l a to mar como refe-
rcncia exp lica tiva últim a. Esta co nce pción se manifie sta, por eje mp lo, en las
nu merosas co mpa raciones entre el mundo físico y e! psicológico a las qu e re- Resulta evidente que la percepción de! habla no depende simplemen te de ele-
curre Koh ler: "[...] de! mismo modo que en el campo físico (por ejemp lo e! mentas invariantes accesibles directamente en la onda acústica. Por ejemplo,
campo eléct rico ), en e! ca mpo psicológico hay tam bién una estructurac ión es- los patron es de la señal acústica que corresponden a una palabra se modifican
pontán ea que obedece a princ ipios dinámicos" (Ko h ler, W., 1972).l2 de manera compl eja en función de los sonidos que la preceden y que la suceden,
Para estos investigadores la teoría de las formas físicas y e! isomorfismo y un fon ema que resulta altament e probable en determinado contexto lingüísti-
psicofísico const ituyero n e l asiento teórico de la doctrina. A l afirmar que en co va a ser "oído", aun en ausencia de los datos acústicos correspondientes . El
la naturaleza inorgánic a se enc uentran modos de ser del tipo "formal", libera- reconoc imiento de la palabra depende también de indicadores semánt icos, sin-
ron la barrera que separa los procesos no orgá n icos de los proc esos fisiológicos tácticos y circunstanc iales. La import ancia de estos ind icadores se potencia a
en e! siste ma nervioso cen tral. El marco teó rico fue tomado de la teorí a de! medida que aument a e! ruido presente en e! ca nal de comun icación.
campo electromagnético vigente a principios de! siglo xx . C ite mos nueva- A unq ue este capítulo trata sobre la percepción de! habla, convi ene repa-
mente a Kohler: "[...] los procesos fisiológicos neurales con q ue se asoc ian los sar primero brevement e el mecani smo de fonación human o.
hech os perceptua les está n en cada caso local izados en un medio co nt in uo, y
los hec hos que oc urren en un a parte de ese medio in fluyen sobre los que t ie-
nen lugar en ot ras regiones, en la med ida direct a en que las propiedades de 1. EL APARATO VOCA L Y LA FONACiÓN
IZ Trad. de Ju lio G uillén. te, por ejemplo, ent re Madrid , Buenos Aires y La Haban a. Co mo referencia co mparativa,
11 Trad. de Jul io G uillén.
el inglés posee alrededor de 40 fonemas.
238 239
El aparato vocal al
Cuerda s Cuerdas
vocales vocales
El aparato voca l human o se pued e d ividir en tres partes principales qu e son: falsas falsas
un n reserva de aire a mayor presión que la atmosférica, un canal de salida don-
Cartílago Cartílago
ele el a ire pued e ser in terrumpido o modulado, y un a cavidad resonante qu e Tiroides Tiroides
(j lt ni las seña les que se emiten al ext erior. Cuerdas Cuerdas
La reser va de aire a presión, llam ada presión subglót ica , se locali za en los vocales vocales
verdaderas verdaderas
pulmones. Su capacidad prom edio es de tres a cuatro lit ros y puede llegar has-
ta se is d urante un a inspiración pro funda . Movemos alrededo r de med io lit ro
durante la respirac ión pausada, pero un cantante entrena do es capaz de utili -
zar hasta ci nco lit ros en un a sola ex ha lac ión .
En el bo rde supe rior de la tráquea se ub ica un a especie de cav idad ca rt i-
laginosa llam ada lar inge, qu e la co mun ica con el tracto voca l, término qu e in-
c luye la garganta y la cavid ad naso bucal. Dentro de la laringe se hallan las
cuerdas (o mem bran as) vocales, enca rgadas de estr echar u ocl uir el paso de ai-
re a parti r de la acc ión de varios pequ eñ os músculos. La apert ura con form a de
V en tre las cue rdas voca les se denomina glotis. La glot is mide aprox imada -
men te 2 cm de largo y 1 cm de anc ho cuando está to ta lme n te abierta . En la
figura 1 se pue de ve r el co rte lat eral de la pa rte supe rio r del apa rato voca l, y Figura 2. Vista frontal y superior de una laringe humana
en la figura 2 se ven dos co rtes esque máticos de la laringe.
En fonación, la caja toráxica ap lica una presión subgl ót ica un poco ma-
yor qu e la presión atmosférica - entre 1,005 y 1,04 atmósferas- qu e fuerza al
a ire a pasar por la glotis y qu e hace vibrar las cue rdas vocales, cuya apert ura
estática es regulad a por el ca rt ílago ar ite noides . Las cuerdas voca les, a su vez,
vibran a un a frecu encia co ntrolada por la presión subglót ica y por la tensión
aplicada a sus pequ eños múscul os. Para el habla normal, las frecuencias se ex-
tiend en en un rango qu e va de 140 a 400 Hz en las mujeres y de 70 a 200 H z
en los hombres. Estos rangos pueden exte nde rse una octava o más en el ca nto.
En la fona ción participa n va rios mecani smos difere ntes du rante la producción
de ondas. Las consonantesplosivas, que son seña les transitori as que se producen
al bloquear y luego abrir repentinamente el tracto vocal, tienen un desarrollo
temp oral en el que prim ero aparece un ataque similar a un impulso de gran pre-
sión, seguido por un bre ve interv alo en el qu e la vibración se aten úa rápid a-
mente. En la figura 3 se ve el gráfico temporal de la co nso na nte plosiva fk/.
Esta seña l, transitoria y no peri ód ica,.posee un espec tro de banda anc ha
F i~ur.1 l. Corte lateral de la parte superior del aparato vocal hum ano y, por sup uesto, ca rece de altura ton al. Las plosivas se dividen en sordas (lp/ ,
240 241
+
+
"O
ª
C.
E
«
"O
.ªE
C.
«
Tiempo
Tiempo
Figu ra 3. G ráfico temp oral de la co nsona nte /k/ Figura 4. G ráfico te mpora l de la consona nte /sh/
/t/ y /kJ) y sonoras (lb/, /d/ y /gJ). En estas últimas, las cue rdas vocales se po- aprox imadamente armón icos. En otras palabr as, las vocales sí poseen altura
nen en vibración y una vocal suena inmediat amente después -unos 30 ms- de ton al definida. Se producen por la modul ación periódica de la apertura glóti-
la conso na nt e. Como el carácter tran sitori o de las plosivas hace que conten- ca. Tan to la frecuencia de vibració n de las cuerdas vocales como la form a de
gan poca energía, los cantantes gen eralmente las exa geran para equilibrarlas onda result ante están det erminadas casi completa ment e por la laringe. La fre-
en sonor idad con respecto a las vocales. cuencia fund amental, que define la periodicidad y la altura ton al, depende de
Las consonantes fricativas (ls/, /z/, /sh/ , Ii/, /f/, /v/ , etc .) producen una tur - la presión subglótica y de la tensión y apertura de las cuerdas voca les. El trac-
bulencia en el a ire que fluye a través de una pequeña abert ura a mayor velo- to voca l, tapizado de tejid o bland o, casi no devuel ve energía hacia la larin ge.'
cidad que la velocid ad crít ica . Aunque se puede sostener esta clase de señales Las diferentes posicion es de la lengua, por ejemplo, modifican la acc ión de fil-
en el tiempo, son estaci on arias solamente en el sentido q ue lo es el ruido blan- trado y det erminan cuál voca l se va a emitir, pero no alteran la periodicid ad
co. Sus ondas son no periódic as y el espectro es de band a ancha . En la figura base de la seña l que emiten las cuerdas voca les.
4 se aprecia el gráfico temp oral aislado de la con son ante fricati va /sh/ . En la figura S se pued en observar las formas de onda que parten de la la-
Aunque el tracto vocal pueda enfati zar algunas frecuencias de la band a ringe para tres niveles de int en sidad diferentes. A mayor int ensidad aumenta
total gene rada por una cons on ante fricati va (por ejemplo, 6 kHz para la /s/ o sign ificat ivamente la cantidad de armón icos en el espec tro.
3 kH z para la /shJ) no se destaca ningun a frecuencia en particular y el son ido De la laringe surgen ondas aproximadamente periódicas que se parec en,
result ante es no tón ico. Existen otros son idos como las consonantes nasales según el caso, a una onda tri an gular o una onda diente de sierra con gran can-
(lm/, /n/, /ñ/) , las vibrantes (lr/, /ITJ), ete., pero los modos de producción no di- t idad de armón icos. El sonido que se registra en la laringe se siente como un
fieren en esencia de los ya vistos." zumbido con altura tonal definida, no como los sonidos mucho más agradables
A diferencia de las con son antes, las vocales se mantienen estable s en el que oímos cuando el locutor emite por la boca. Esta gran diferen cia acúst ica
tiemp o, sus formas de onda son prácticamente periódic as y sus espectros son se deb e a la acción de los filtros de reson ancia del tracto voca l.
Z No pretendemos cubrir aquí el panora ma com pleto de los fon emas del españo l. Tamp oco 3 Aquí falla la difundid a ana logía ent re el aparato voca l hu man o y los instrum entos de
empleamos los símbo los recomendados por la Internacion al Phon etic Assoc iatio n (IPA), vien to del grupo de los bronces : la campana de estos últ imos devuel ve hacia la boquilla un
que exigirían un a descripción de tall ada . Quien desee ampliar en el tem a deb erá recurri r a gran porcenta je de ene rgía en cada ciclo. Así se esta blecen las ondas estac ionarias necesa-
textos específicos de fon ética y fon ología. rias para su func ion amiento.
242 243
a)
bl 2:o1AA~
liempo -. Frecuencia
lil
;:;~ ' ~ I
la
:~ o 1 2 3 o
-10
~ 1
e) ~"
"O
lal
s
ªa.
~ :~
10
O
I~
O
E ·'0 -!: 10 , ·' 0
-c ·20
ca o
r
.'"
O 2 3 'i ·10
· 20
-eo
- ·20 ·40
Frec uenc ia 1kHz)
liempo Frecuenci a G) -30
.2:: a 1 2 3
' SO
O
Z
Frecuenc ia 1kHz)
Fi¡.:ura 5. Formas de o nda y espectros tom ados en la laringe: a ) señal débil, b) señ al de me-
, lialla int en sidad y e) seña l muy int en sa
lul
"'~ 'Oo
:10
10 · 10
O · 20
Fo rma n tes -10 -30
-:10 .."
-30 ' SO
o 1 2 3 o
lil t ra cto vocal se puede aproximar a un tubo de 17 cm de largo, cerrado en un ex- Frec uen c ia 1kHz)
I remo por las cuerdas vocales y abierto en el otro a través de la cavidad naso bucal.
C ada vocal define un a geometría partic ular del tracto voca l, como se pue- Figu ra 7. Efecto de filtro de l tracto voca l sobre un a seña l periód ica proven iente de las
de ver en la figura 6. cuerdas voca les
Cada configurac ión partic ular del trac to voca l, a su vez, modifica las ca-
ruc rcrfsticas espectrales del filtro acústico correspondie nte , Lo que oímos es,
en definiti va, una señal periód ica gene rada en la laringe y filtrada por el trae-
lo vocal. En la figura 7 se puede ver cómo la misma onda, emitida por la fa-
ringe, adopta envo lventes espec tra les diferentes para cada voca l. En este nación partic ular de forrnantes, tres o cuatro según el caso. Sin emba rgo, es
ejemplo se oye siempre la misma altura ton al, pero con tres alturas espec trales posible distinguirlas con claridad a partir ún icament e de las dos prim eras. Si
se const ruye un gráfico cartes iano que posea la frecuen cia de la primera for-
dilcrcnt cs (las voca les /i/, /a/ y /uf).
rnant e en abscisas y la de la segunda forrnante en ordenadas, se obtie ne un es-
La cav idad naso buca l posee resonancia de ban da media porq ue el tej ido
pacio bidimensional en el que cada punto co rresponde -idealmente- a una
hlnndo que la tapiza absorbe gran cantidad de energía acústica . Cada una de
voca l. En la vida real, por supuesto, existe gran variabi lidad no sólo entre un
cstus zonas de resonancia, en las que se refuerza la amplitud de los componen-
hablante y otro, sino hasta en la misma persona en diferentes momentos de l
les espectrales, se denomina fonnante. Cada vocal corresponde a una comb i-
245
244
a)
3000 1
1 ejemplo, en la figura 8 se compara n las regiones de recon ocimi ento voca l pa-
1
2500 . 1 1
-----r- -- - í - -- -- T----- 1
ra voces masculin as y femeni nas.
1 1 1
1 1 1
O
1 1
100
Región de sobrecarga
O 200 400 600 800 1000 1200 1400
90
F1 (Hz)
iD 80
~
Figu ra 8 . Region es de reconocimie nt o voca l para las dos primeras forrnanres del espa ño l ~ 70
o
c:
riop latense; a ) voces masculinas, b) voces femen inas o
(f)
60
c:
'0 50 N'
'¡¡; Ivel de cresta de I
~ . a palabra
a. 40
NIVel medio d I
día. Por lo tan to hay un rango de valores para cada par de forrnan tes (una re- Q)
"O 30
e a palabra
gión en el gráfico de la figura 8) que cont iene informac ión sobre la misma vo- ~ 20 Nivel mlnimo de I
t3
ca l (Aronson, L. et al., 2005). Q)
a.
a Pa./abra
(f) 10
Q)
Los ran gos se supe rponen en algunos casos y los mismos sonidos pueden a; o Nivel eficaz total de la
>
p~ rc ibirse en dos form as diferentes. Por lo gene ral, sólo un a de las interpr et a- Z -10
palabra : 69 dB a 1 metro
ciones tien e sentido en su contexto y la adoptamos automát ica men te de ma- -20 Umbral de audibilidad para
nera precon sciente. Una de las razones de la gran extensión de las áreas para -30
sonidos de espectro continuo
cada voca l es que las mujeres, los hombr es y los niños no poseen el mismo ta - 270 380 490 630 770 920 1070 1230 1400 1570 1740 1920 2130 2370 2660 3000 3400 3950 4650 S600
maño de tract o vocal y no pueden producir exac ta mente las mismas forman- Frecuencias centrales de las bandas de igual contribución
tes. Los oyentes evalú an las características acústicas gene rales del locutor al indice de articulación
antes de decidir las formantes que le van a corresponder a cada vocal. Co mo Figur a 9 . N iveles espec tra les de emisión para una voz masculina
246
247
\
\
270' 270' a)
5.000
o 2 3 4
Tiempo (5)
180'+-+-+-4r:---;I-.+--& O' 180-t--+....I,jH~+-+-J- O'
b)
5.000
90' 90'
1.000 Hz 4.000 Hz
N
270' ~
<ti
'ü 2.500
eQ)
::>
u
Q)
1 80"+-+---fJH~-I--+--H-
u:
1.000
-
90' O 2 3 4
10.000 Hz Tiempo (5)
Figura 10. Direcrivida d de voz humana en el plano vertical Figura 11. Son ogramas de banda ancha y de band a angosra
2. R EPRESENTA CIÓN GRÁRCA DE LOS SONIDOS DEL HABLA lor que proporcion a una buena resoluc ión te mpo ral (1/ 300 s), pero que no
permite observar los armónicos ind ivid uales de una señal periódica. Los sa no-
Co mo los espectros de los son idos del habla varían en el tiemp o -no son estáti _ gramas de band a angosta posee n norm almente band as de 45 Hz, suficiente pa-
cos-, para estudiarlos se usan trad icion almente gráficos carte sianos tiempo/fre- ra distinguir los armón icos, pero no para diferen ciar indi vidualmente los
cuenc ia que se denominan sonogramas. El problema con estas form as de rápid os impul sos glót icos. En la figura l 1 se pueden ver dos sonog rarnas de di-
representación es que, como todo siste ma pasivo de aná lisis de ondas, depen- ferente ancho de band a.
den del límite impuesto por el principio acúst ico de indeterminación. Resulta Nu estro oído puede resolver con gran det alle y (casi) simultá nea ment e los
imposib le obtener simultánea mente gran resolución en el t iemp o y la frecuen- aspec tos temp orales y espec tra les de una seña l acúst ica, co mo ocurre cuando
cia. Una solución de co mpro miso consiste en alte rna r sonog ramas de banda oímos un a sucesión ráp ida de acor des. Sin embargo, no viola el pr incipio ac ús-
anc ha y de banda angosta. En los primeros la band a t ípica abarca 300 H z, va- t ico de inde terminación po rque posee la ca pacidad de activar y desactivar r á-
248 249
Existe evidencia de espec ializac ión cerebra l rel acionad a con la percep ci ón
de! h abl a. Por eje mp lo , se h a probad o q ue interv iene n difer entes regiones
de! cer eb ro en la per cep c ión de los son idos de! habl a y en la de los soni dos
ambien ta les en general. S i se aplica n simultá n ea me nte a los dos o ídos est í-
N mulos diferentes -por eje mp lo dos frases distintas- e! estímulo h ablad o pre-
e. sente en e! o ído derecho -que se procesa en e! hemi sferio cerebra l izquier do-
'e"
'ü 2.500
es co mprend ido co n mayor fac ilida d . Lo co ntrario oc urre en e! caso de la
al
'"o~ mú sic a.
u,
1.000 Experiencias con tom ografía computada y resonancia magn ética de mos-
traron que , mientras qu e los soni dos ambientales y musicales son procesados
en ambos hemi sferi os ce rebrales, los son idos de! habl a est imulan casi exclusi-
o 2 3 4
vame nte el hemisferi o izquierdo. Esta caract erística esta ría basada en la nece-
TIempo (5) sidad de mantener cercanos todos los centros in volucrados en e! tratamiento
de las señales del habl a, a fin de permitir la detección de sus pequeñas tran si-
Figura 12. Espectrograma aud it ivo ciones -del orden del mili segundo. De otro mod o, si la información tuviera
que viajar entre hemisferios, estas transiciones se perd erí an debido al exc esi-
vo tiempo involu crado en la comunicación.
pidam ente los senso res de la membran a basilar, co rrigiendo así el anc ho de A continuac ión nos referimos a algunas de las ca racteríst icas particulares
banda efec tivo de acue rdo a la tarea impuesta." de la percepción de l habl a, q ue nos perm iten decodifica r co n eficac ia los fo-
Como ninguno de los sonogramas trad icionales representa lo qu e e l oído nem as en un a amplia vari edad de situac iones y co ntextos.
detect a realm ente , algunos autores crearon los espectrogramas auditivos, en los
que e! anc ho de banda de cada frec uencia de aná lisis iguala a la banda crítica Tasade ocurrenciade los sonidos del habla
que co rrespo nde a su frecu encia ce ntral (C arlson, G ranstrom y Hunnicutt,
1982) . En la figura 12 se muestr a el espectrograma aud it ivo de! regist ro de voz En e! habl ar rápido pued en oc urrir 30 fonem as por segundo. Liberman espe-
ha blada de la figura 11. En este caso se pueden observar a la vez los armó ni - culó que est a tasa supe ra la resolu ción temporal del siste ma audi tivo (Líb er-
cos en bajas frecuenc ias y las transic iones rápidas a altas frec uencias. rnan , A . et al., 1967) . S in embargo, la evidencia reciente indica qu e es
C uando se co mpara un registro acústico de voz hablada co n su represen- posible identificar secue ncias donde cad a fon em a dura ape nas 10 ms, a un a
t~ción gráf ica lo primero que llama la ate nc ión es qu e los silencios general- tasa de ocurrenc ia de 100 fonem as por segundo . A esa ve loci dad no se perci-
mente no correspo nden a los espac ios entre palabr as. Una de las mayores be cada evento por sepa rado, pero se puede seguir audi t iva rnen te e! patrón
d ificultades a la hora de ana lizar gráficamen te esta clase de seña les es det ermi- sonoro globa l.
nar el mod o en que la secuencia de son idos se segmenta en sílabas y palabr as.
Variación de los daros acústicos
3. CARACTERÍST ICAS PARTI CUL AR ES DE LA PERCEPCIÓN DEL HA BLA La percepción de! mismo fonema puede estar determinada por diferentes da-
tos acústicos. Por ejemplo, una consonante fric ativa "a com od a" sus bandas
Aunque e! tema sigue siendo motivo de controversia entre neurólogos y de ruid o de acuerdo con la vocal que la sucede: voc ales diferentes dan lugar,
lingüi st as, es probable qu e en el ser humano hayan ev olucionad o mec anis- inevitablemente , a diferentes tr an sici ones entre forrn antes. Una sola transi-
mos espec iales dedicados a la percep ción de los so n idos propios del habla. ción de la señal acúst ica puede contener información so bre varios fonemas
vecinos.
4 El control acti vo de la mem bran a basilar se vio en el capítu lo 1, punto 4.
250 251
Modo lingüístico Transiciones
de las formantes
: : Régimen estacionario:
No hay un continuum en la perc ep ción de los son ido s del h abl a, la per cep- ~ :
Una
~'
de la vocal
.
:
c i ón es d icotómica. En general , los sonidos son percibidos com o lin gü íst i- .~ de ~. . Formante 3
cos o co mo no lingüísti cos. Se puede ac t ivar el mod o lin güísti co dándole :¡¡ estas { W: :
G~ :
c ie rtas instru cciones al oyente, pero una vez ac ti vado es mu y difícil rev er- ~ :""OIIIiI! • Formante 2
tir el proceso. , Formante 1
U na de las consecu encias de esta carac te ríst ica de la perc epci ón de l
habl a es nu est ra inc apacid ad par a o ír los soni dos propios del lenguaje en TIempo
t érm inos de sus parámetros acú sti cos. Los per cibimos co mo un a co rr iente Presentación normal (diótica)
ún ica de pal abr as y las descripciones "acú sticas" son, cas i siemp re, confusas.
Pa ra lograr una aud ición limpia de los dato s acús t icos es necesari o aislar ca -
da fone ma y saca rlo de conte xto . Sólo a partir de ese mom ento se desacti -
va el mod o lin güísti co.
Resulta casi innece sari o menci on ar la importancia q ue ti en e esta ca-
racte ríst ica en la percepción de canciones y piezas líri cas, en las que coe x is-
ten ele me ntos propios del mod o lin güíst ico (el texto) y. no lin güíst ico (la
música) .
Percepción dual
Base Transiciones aisladas
(a un oldo) (al otro oído)
En la década de 1970 Rand realizó por primera vez un experimen to q ue de-
mostró la ex istencia de lo que se con oce como percepción dual (Rand , T. e, Presentación dicótica
1974 ). Más adela nte , Liberman perfeccion ó la experien cia de Rand de la si-
guiente manera: se presenta a un oído la part e de la seña l prop ia de una síla- Figura 13 . Esquema del experimento de Liberman sobre la percep ción dual
ba a la cual se le ha quitado la tr ansición del ter cer forrnante, y al otro la part e
está tica del tercer forman te más los dos prim eros forrnantes co mpletos (L íber-
man, A., 1995). Los oyen tes dic en percibir la sílaba completa en el prim er oí- Integración audiovisual
do y sólo un cort o zumbido en el o tro . En la figura 13 se aprecia la descr ipción
esquemát ica de dich o experimento. A l decodifi car un mens aje habl ado le prestamos ate nción a un a gran canti-
Según Liberm an, los resultados obte n idos ind ican que ex isten módul os dad de datos no acústicos . Los movimi entos de la cabe za, de las manos y, en
separados que proc esan, por un lado, los sonidos del habla y, por otro , los de- particul ar, de los labios del hablante pued en influ ir sign ificativamen te en la
más son idos. Esta conclusión concuerd a con los datos obten idos a parti r de la percep ción del h abl a.
observació n direc ta de la ac t ividad corti cal durante la audició n . Es interesante men ci on ar aquí un exp erimento en el que se presenta
Una de las consecuencias int eresantes asoc iadas a este fenó meno es que un vid eo con el aud io modificad o a un grupo de espec tado res (McGurk y
se viola el principi o de separación espacial que sostiene que un elemento ac ús- MacD on ald, 1976). En la imagen aparece un locuror diciendo "tata" jun-
tico dado no puede ser asigna do a más de un a fuente a la vez. Parece que el to a l aud io del mismo locutor pronunci ando la palabra "ma ma" . Los oyen -
mecani smo de perce pción lingüíst ico es tan poderoso que , bajo cierta s cir- tes dicen o ír "na na" , sin expresa r riin guna duda - oyen "nana" con
cunstanc ias, permite agrupar elementos acúst icos aún cuando éstos proven- cl aridad-v v se sor prenden a l oír el aud io a islado , libre de to da información
gan, o aparenten provenir, de fuentes diferentes. visual.
252 253
l'crcc/>ción categórica C uando aprendemos a entender las palabras de un lenguaje partic ular, presta-
mos ate nción a las diferencias acústicas que afecta n su sign ificado e ignoramos
Una consecuencia de la perce pció n en modo lingüístico es nuestra capacidad las que no lo afectan. U na vez que aprende mos a distinguir entre ambos gru-
para ubicar cada fone ma en un a det erm inada categor ía individua l. Cuando pos, nos cuesta oír las diferencias acústicas que no atañen al significado. Esta
varía de manera continua algún parámetro acúst ico de la señal, por eje mplo la exp licació n da cuenta de la dificultad para oír diferencias entre fone mas en un
frecuencia de una formante, no oímos una serie de peq ueños cambios grad ua- lenguaje no familiar. Kuhl enco nt ró que los n iños nacen con habilidades rele-
les, sino que perci bimos saltos "cuánticos" entre un fone ma y otro. Este fenó- vantes respecto del len guaje que parecen depen der de mecan ismos generales de
meno se deno mina percepción categórica y no ocurre usualmente con los la percepció n auditiva: no responden de manera específica a una lengua en par-
son idos ambientales. No se d istinguen los cambios acúst icos de la señal cuan- ticular. Pero a los seis meses la percepció n de los bebés ya está polarizada por la
do éstos caen en la misma categoría, pero se percib en co mo muy grandes si exposició n a una lengua específica . Kuh l propuso la teoría del magnetismo del
provocan un salto de ca tego ría. La percepción ca tegó rica se nos presenta co- lenguaje nativo, en la que la expos ición a una lengua en partic ular resulta en la
mo evide nte cuando tratamos de comprender un discurso en una len gua q ue formac ión de representacion es almace nadas de categorías foné ticas, que gene-
no do mina mos completa men te: las confusiones frecuentes se deben a una in- ran "protot ipos" de cada catego ría. Los prototipos ac túa n como iman es percep-
suficiente com petencia respecto de las ca tegorías fon ém icas de esa lengua. tuales: la percepción categorizada es una con secuencia natural. La teoría de
La percepci ón de vocales estac iona rias es muy diferente pues los peq ue- Kuhl es compatible con la h ipótesis de que el ce rebro funcion a como un siste-
i111S ca mb ios físicos son percibidos con facilidad. Según Liberman, esto oc urre ma que opera en la frontera del caos.
porq ue las voca les aisladas está n much o menos cod ificadas y se las oye como
sonidos co rrientes, no ca tegor izados lingüísticamente. N o obsta nte, las voca-
les de ntro de una secuencia de l habla se co mpo rta n de man era similar a las 4. M O DELOS DE PERCEPCiÓN DEL HABLA
consona ntes, es decir, de manera altame nte codificada .
Un ejemp lo de percepc ión codificada y ca tegor izada de sonidos no perte - Teoría motora
nec ientes al habla es la percepción de las a lturas musicales en un siste ma es-
ca lístico determi nado. En música tonal, las funciones armónicas ta mbién Esta teoría establece que los objetos de la percepc ión de la pa labra son tra ta-
está n altamente categorizadas. dos co mo gestos fonéticos del hablant e, representados en el ce rebro co mo co-
Existe n tres hi pótesis principales elaboradas para explicar la percepción mandos de movimient o invariantes relac ionados con cie rtas configuraciones
categórica. En la primera, Pisoni considera que la memoria auditiva para los lin güíst icas significativas (Liberman y Mattingly, 1985). Estos gestos no se
patrones ac ústicos de las consona ntes decae rápidamente y q ue cuando debe- mani fiestan directament e en la señal acús tica.
rían ser procesa dos en la iden tificación ac ústica del fone ma ya se han perdi- El modelo es inco mp leto pues no especifica cómo se logra la tran sform a-
do: la disc riminación fina del estímu lo dentro de esta ca tego ría de fone mas es ción entre la seña l acústica y los gestos percibidos. Segú n Klatt, "es más una
imposi ble (Pisoni , O. B., 1973). Para fone mas más largos e inte nsos, co mo los filosofía que una teoría de la percepción del habla" (Klatt, O. H., 1989 ).
de las voca les prolon gadas, los patro nes ac ústicos pueden ret en erse en la me-
moria audit iva por períodos mayores, pudiendo rea lizarse sobre e llos operacio- Teoría de los rasgos invariantes
nes de discriminación similares a las operadas en los sonidos en gene ral.
En la segunda hip ótesis K. Steve ns sugiere que las cat egorías y los límit es A su vez, Ste vens y Klatt defienden una teoría en la que la percepción se da en
en el habla han evolucionado con el fin de explota r la sensibilidad natu ral del una serie de etapas que inclu yen un conjunto de det ectores fon éticos (Klatt, O.
sistema auditivo (Stevens y Blumstein, 1981). Esta hip ótesis no da cuenta de H., 1989) . La primera etapa ocurre en el sistema audit ivo periférico (filtrado, su-
muchas de las operacio n es carac te rísticas necesarias para la aparición de la presión lateral, adaptació n y sensibilidad a la fase) . La segunda con sta de una ba-
percepción ca tegó rica. tería de detectores acústicos (de tectores de ataque, de cambio espectral, de
Una tercera hip óte sis, formulada por Kuhl , con sidera que la percepción forman tes y de periodicidad). La tercera eta pa la form an una serie de detectores
categórica surge de la experiencia con el propio lenguaje (Kuhl, P. K., 1993). de rasgos fon éticos y sus decision es son específicas de una lengua determinada,
254 255
Finalmente, aparecen etapas de aná lisis de segment os y búsqueda de léxico. las interferencias, para compensar las distorsiones de la señal (por ejemplo en
Este model o está basado en la suposición de que es posible encontrar un una línea telefónica) y para superar la mala articulación de un locutor.
mnpco relativamente invariante entre los patrones acústic os y los son idos del
habla. Sus detractores señ alan el carácter inevitablemente secuencial de las Resistencia del habla frente al deterioro de la señal
ope raciones involucradas.
Es remarcable la resistencia del habla frente a varias formas de distorsión se-
Modelo de red neuronal vera. Los métodos de teste o de articulación las han catalogado en : cantidad de
ruido de fondo, cambios en el espectro de frecuencia y recorte de picos.
El modelo de McClelland y Elman es cone xio nista y está basado en las teorías Cantidad de ruido de fondo. La inteligibilidad de sílabas aisladas resulta sa-
de las redes neu ron ales (McClelland y Elman, 1986). Asume que existen tres tisfactoria con una relación señal/ruido (SiR) de +6 dB. Sin embarg o, las pala-
niveles de representación, cada uno de los cuales contiene un idades de proce- bras resultan inteligibles aún para relaciones SiR negativas si integran
sarn ien to altament e interconectadas llamadas nod os. En el nivel más bajo, los sentencias bien formadas , en particular si el oyente está familiarizado con el
nodos representan rasgos fonéticos, en el siguiente representan segmentos fo- tema, o si el habla y el ruido provienen de lugares diferentes.
nétic os, y en el último nivel representan palabras. Por ejempl o, el nod o corres- Cambios en el espectro de frecUencia. Se ha demostrado que, contra la afir-
pondi ente a un fonema específico puede disparar hacia dos o tres nodos mación tradicional, no hay componentes en frecuencia esenciales para la co-
cor respond ientes al nivel de los rasgos asociados normalmente con dichos municación. Se puede cortar una señal de habla con un filtro de banda
íone mas. La activación excitatoria o inhibitoria puede fluir en ambas direccio- pasante de Oa 1.800 Hz, de 1.800 a 20.000 Hz o de 1.000 3 2.000 Hz, y no per-
nes, desde nivele s más bajos hacia otros más elevados, o vicever sa. der mucho en inteligibilidad.
Este modelo permite explicar varios aspectos de la perc epción del habla, Recorte de picos. Si se coloca un circuito que recorte la señal de entrada al
la les como la restauración perceptiva de fonemas "perdidos", la percepción ca- 2% de su amplitud promedio queda una onda casi rectangular de período varia-
rcgorizada y la armon izació n de datos. Es uno de los modelos comp atibles con ble y se pierde la informac ión aportada por la forma de ond a original. Sin em-
la teoría de la percepción caótic a. bargo, se obtienen tasas de articulación entre el 80 y el 90%: son necesari os sólo
dos bits para codificar la amplitud sin perder casi nada de inteli gibilidad. Por su-
puesto que el sonido no resulta "natural" y es imposible reconocer al locutor.
5. LA BÚSQUEDA DE INDICADORES ACÚSTICOS INVARIANTES En resumen, el sistema de comunicación humano ha evolucionado de tal
forma que puede operar bajo una gran variedad de condiciones adversas. Sin es-
Cale y Sco tt not aron que la percepción del habla involucra la identificación tas capacidades el teléfono no existiría, o sería extra ordinariamente complejo.
simultánea de, al men os, tres tipos de datos cualit ati vamente diferentes: indi-
cado res acústicos invariantes, ind icadores dep endi entes del contexto e indica-
dores asentados en la envolvente dinámica de la onda (C ale y Scott, 1974) . 6. INTELIGIBILIDAD DE LA PALABRA
En otras palabras, cada sílaba contiene dato s invariantes y dato s dependientes
del contexto. Existe evidencia de que la env olvente dinámica de la onda pro- La inteligibilidad del discurso se refiere a la exactitud con que un oyente pro-
vee información sobre la comp osición fonémica de la señal y de que, en cier- medio puede entender una palabra o una frase hablada. En una situación nor-
\ 0 grado , el sistema auditivo está capacitado para dec odificar los estímulos del mal parte de la inform ación se extrae del contexto y de las señales visuales que
habla basánd ose únicamente en las variaciones de la amplitud en el tiempo. acompañan a la fonación y, por lo tanto, es posible entender el significado in-
La naturaleza multidimensional de la información acústica permite un alto ni- cluso si solamente una fracción de las unidades acústicas discretas se oye co-
vel de redundancia en la señal del habl a. Coexisten diferentes dat os que per- rrectamente. En otros casos el oyente queda limitado a valerse únicamente de
miten la identificación de un fonema det erminado, aunque con uno solo de la información acústica, como ocurre en los sistemas de comunicación no pre-
dios se lo pueda reconocer. La redundan cia sirve para superar las ambigü eda- senciales, por ejemplo el teléfon o o las grandes salas en las que se emplea re-
des inherentes al discurso hablado, para minimiz ar la influencia del ruido y de fuerzo electroacústico.
256 257
U n fone ma es inteligible cuand o se lo oye de forma clara y puede ser di- 100
ferencia do del resto de los fone mas de la misma lengua. La misma definici ón Silencioso • Ruidoso .
puede ap licarse a un discurso artic ulado , aunque aquí actúan facto res contex-
ruales de importancia. <Jl
90
III
~ .
~
Veamos primero qué ocurre con los fone mas aislados. En este caso el pun -
.o
ro 1)
~ 80
a.
to crítico en cuanto a la inteligibilidad son las co nsona ntes , pues al ser más
~
al
"C
déb iles que las voca les se pueden en mascara r con mayor facilidad. e 1:(·
-o 70
'ü 1'.-1 r~ 1"
ro
:; IJ
Ensayos de articu lació n u
t: •
ro 60
al
"C
La investigación en esta área co menzó co n el desarrollo de los sistemas telefó- al
.¡¡¡-
nicos a fines del siglo XIX y de la radiofonía a princ ipios del xx. Los primeros eal SO
1,:
E
intentos para definir numéricamente la inteligibi lidad fuero n los ensayos de ar- o ~.~
Q.
1-
ticulación, que cons isten en pruebas de campo en las que un locu tor lee un 40
kl l· o
conjunto de fonemas o palabras de una lista confeccionada al azar. Para ev itar
la influencia de elementos no fonét icos, las secuencias carecen de sent ido lin- o
~ r: 1\ I ~
L...--
2 3 4
güístico y las sílabas están ordenadas de manera estocástica. Es habitual el uso
Locutores
de listas estanda rizadas para permitir la comparación entre ensayos. 5 Los oyen-
tes, distr ibuidos en la sala de una manera predeterm inada, anotan los fon emas Figu ra 14 . Resultado de un ensayo de a rt icu laci ón de palabra a part ir de cuatro locu tores
o palabras que creen oír. El resultado de l test es el porcentaje de palabras co- d iferentes
rrectas -que coinc iden con la lista origina l- para cada oyente. Ad emás de los
facto res acústicos específicos que ana lizaremos más adelante, los ensayos de Silencioso . Ruidoso .
100
articulació n son muy sensibles a las características parti culares de cada locu-
tor y de cada oyen te. En las figuras 14 y 15 se pueden ver los resultados obte- <Jl
Figu ra 15. Resultado de un ensayo de art iculación de pa labra ob ten ido con siete oyentes
5 En idioma ing lés se utiliza la lista defini da en el "Harvard P.B.SO word score" . ubicados'en la misma posició n. El locu tor fue siempre el mismo
258 259
80% permite comprender el discurso sin esfuerzo. Cu and o baja al 70% los Se enco ntró que un discurso grita do es más difícil de entender que uno a ni -
oyentes deben concen trarse con esmero para entender las sen tencias y, por de- veles medios, al margen del ni vel acústico final en el oído de los oyen tes. Es-
bajo del 60%, en la mayoría de los casos la inteligibilidad resulta insuficiente. te efecto de sobrecarga, que ya ana lizamos en este cap ítulo, se debe a los
Los ensayos de articulación , aunque brindan valiosa informac ión sobre la cambios en los transito rios del ataque y en la entonación de las formantes de
inteligibilid ad, son muy costosos en tiemp o y recursos, yen algunos casos pue- la seña l. Para simplificar los cálcu los la sobrecarga se suele tratar de la siguien-
den resultar imposibles de realizar. En la actu alidad se usan prin cipa lmente pa- te manera: en primer lugar, para altos n iveles de emisión se reduce la razón se-
ra verificar los modelos durante el desarro llo de métodos objetivos de ñal-ruid o perm itid a en el can al un valor de -4dB cada vez que la seña l supera
medición y predicción de la inteligibilid ad. en 10 dB el valor base de 75 dBA (med idos a 1 m del emisor). En segundo lu-
gar, se asume que los niveles de emis ión co mprendi dos entre 45 y 75 dBA que
Medición indirecta y predicción de la in teligi bilidad no llegan a los oyentes co n valores super iores a 80 dBA no requieren correc-
ció n por sobrecarga.
Existen varios métodos disponibles para predecir la intel igibilid ad de h abla en En todo can al acústico hay siempre cie rto n ivel de ruido de fondo. El
un sistema de co mun icac ión o en el interior de un a sala. Cada uno de estos efecto más obvio del ruido de fondo es en mascarar la seña l del habla. C uan ti-
métodos se basa en el mismo principio fund amental, que consiste en hallar al- ficar este efecto es difícil dadas las d iferentes situac iones posibles, pero como
guna relación entre la seña l del hab la y el nivel del ruido que la interfi ere en estánda r de diseñ o se considera que cada decibel de ruido que se agrega por
el cana l de comunicació n . En esta relación inte rvienen los siguientes factore s enc ima de un nivel base de 45 dBA debe compensarse con un aumento de 0,6
mensurables: el ni vel y otras característica s acúst icas de la seña l emitida , el dB en la seña l hab lada.
nivel y com posición espectral del ruido de fond o, y la naturaleza del can al de La naturaleza del cana l de co municación tam bién puede afecta r dec isi-
co mun icación o de la sala. vame nte la inteli gibilidad del discu rso h ablado. S u infl uencia, beneficiosa o
En un ento rno tranquilo, una con versación produce un nivel de presión perjudicial, se puede evaluar a partir de la respuesta al impul so del ca na l. Si
sono ra entre 55 y 65 dBA medidos a 1 m del locut or; aunque en situac iones es- se tra ta de un a sala exis ten dos factores que se analiza n por sepa rado : el pa-
peciales el nivel puede alcanzar 96 dBA. Como los niveles varían sign ificativa- trón de reflex iones y la reverberación. En gene ra l, el recinto realzará la in-
mente ent re indi viduos, para el diseñ o de sistemas de comunicación se utilizan tel igibilid ad cuando proyec te cierta cantidad de ene rgía dentro del período
los casos más desfavorab les en lugar de los niveles promedio. La tabla 1 presen- de integraci ón de l discurso (de 35 a 50 ms) . Dado que el ruido de fond o se
ta los valores estandarti zados para el diseñ o de sistemas electroac ústicos en distribuye de man era uni forme en el tiemp o, toda reflexión tem pran a mejo-
grandes salas para prosa. Ca da valor se obtiene restand o un desvío estánda r al rará la relación seña l-ruido del sistema . Sin embargo, las reflexiones tardí as,
promedio. los ecos y un a reverb eración excesi va interfieren co n la seña l y tie nde n a re-
ducir la relación seña l-ru ido del cana l, det er iorand o la inte ligibi lidad del
Tabla 1
d iscurso.
Esfuerzo vocal dBA
Relación señal-ruido
Susurro 32
Suave 37 Probab lemente sea la más simple y senc illa de las relacion es que se usan para
Relajado 42 medir la inteligibilidad. Se la define como la resta ent re el promed io de largo
Normal (priv ado) 47 tiempo, o nivel sonoro continuo equivalente , de la seña l del habla en el pun-
Normal (púb lico) 52
Voz levant ada 57 to de recepción (LA eq . señal) Y el nivel promedio de largo tiemp o del ruido de
Int enso 62 fond o (LAeq. ruido) ' Ambos ni veles se miden en dBA:
Muy intenso 67
Grito 72 Relación señal-ruido (SR) = LA eq . señal - LA cq. ruido (dBA)
Máxim o 77
260 261
Las med icion es de inteligibilidad del discurso conforme a la relación señal-rui- Durante varias décadas, el Al Y los ensayos de articulación fueron los ún i-
do realizadas por Bradley sugieren una meset a de n ivelación por enci ma del cos métod os capaces de evaluar la int eligibilidad del habla. Se sabía que el ti -
valor SR = + 15 dBA. En otras palabras, mejorar el sistema más allá de este va- po y la complejidad de la seña l de prueba (palabras articuladas sin sen tido
lor no aumenta la inteligibilidad de l siste ma. El defect o de este índ ice es que cont ra palabras conectadas en una sent encia sign ificat iva) tie nen un impacto
no contempla la natu raleza acústic a del ca nal de co mun icación: relacion es de importante en los resultados. Sin embargo, la acúst ica de esos tiempos no po-
S R ópt im as pueden corresponder a una int eligibilidad deficiente si, por eje m- día diferenciar cuant itativamente ent re las dos secuencias. Tampoco incluí a
plo, la sala presenta un eco destacado. ele mentos propi os del ca nal de co mun icació n, co mo e l patr ón de reflexiones
o la reverberaci ón , n i cont emplaba algunos efectos psicoacústicos relevantes
Índice de articulación (Al) com o el en masca ramien to . Era necesario hallar otro mét odo de evaluac ión
que superase estas limitaciones.
El primer estudio sistemático y profund o sobre la inteligibilidad del habla fue
realizado por Harvey Flet cher dur ante la década de 1940 en los Laboratorios Índice de transmisión de la palabra
Bell. Fletch er y su equipo, a partir del estudio de la relación seña l/ruido de ca-
da banda de un te rcio de oc ta va, crearon el índice de articulación ( Al) , un ex- Introdu cid o por Stee ne ke n y Houtgast, el índice de tra nsmisión de la palabra
celent e métod o para evaluar los efecto s del ruido en la inteligibilidad. es básic amente un a ve rsión mejorad a del índ ice de la artic ulación
( ST I) 6
El Al es básicamente un a medid a de la int eligibilidad basada en el coci en- qu e incluye las d istorsiones tem por ales en el can al de comunicación (S tee-
te seña l/ruido en cinco bandas de octav a. El cálcul o del Al consiste en tres pa- nek en y Ho utgast , 1980) . El ST I se basa en las ex pe rie nc ias de det ección de
sos básicos: medición del cocie nte seña l/ruido eficaz para cada band a de modulaci ón descr iptas en el punto 3 del capítulo Il . Las seña les del habl a se
octava , aplicació n de un factor de co mpensación tab ulado para cada banda y co nsider an com o un flujo de ene rgía con va riacione s espec tro -te mpo ra les y
c álcu lo del valor med io. La siguiente ecu~ción sint et iza el procedimiento: el grado de preservación de estas va riac iones a tr avés del cana l de co mun i-
cació n se tom a co mo un a med ida de su fideli dad. Los autores argumentaron
que la conse rvaci ón de la envo lve nt e d inám ica imp lica la preservaci ón de
Al = ~ i (LA eq , señal - LAeq, ruido + 12) dB sus co mpone ntes de Fouri er en el pu nto de recepción . El n ivel continu o
30dB .=1 eq uiva len te de la seña l del h abla es sust ituido por un a seña l teó rica de prue-
ba, cuya intensidad es modu lad a po r una func ión sin usoida l co n un índ ice
en la que el factor de comp ensación G liI vale: de la mod ulació n m = 1. C ua lq uier deg rad aci ón de la seña l en el can al de
co mun icac ión aparece rá co mo un a reducci ón en el índ ice de la mod ula-
ci ón en el punto de recepc ión. S tee ne ke n y Houtgast aco nse ja n el emp leo
Frecuencia [Hz) GIiJ de señ a les mod ulador as de frecue nc ias comprendidas entre de 0,4 y 20 H z
pa ra re presentar el grado de intel igibil idad a todas las tasas de oc urrenci a
250 0.072 del habl a.
500 0. 144 Si f repr esenta la frecuencia de la señal modul adora y t es el tiem po en se-
1000 0.222
gundos, entonc es la int ensidad de la señal de prueba es modul ada por la fun-
2000 0.327 ción 1 +cos(21tft). El índ ice de modul ación en el punto de recepción es
4000 0.234 fun ción de la frecuencia y se calcula con la siguiente expresión, que se dedu-
ce de la repu esta discret a al impulso entre los ext remos del ca na l:
El índice de articulación no es sensible a los cambios en la reverberación y a la
presenc ia de distorsión temporal en el campo acúst ico, factores que sí contem-
plan los ensayos de articulació n. Por ello se limita su aplicación a campos acústi-
cos sin defectos ostensibles y con un tiempo de reverberación máximo de 0,5 s. 6 Del inglés Speech Tra nsmission Index.
262 263
(-j1rf~)
L ll,¡ e
Usando mediciones empíricas de las señales reales de prueba, es posible medir
el STI de cualquier sala o sistema de comunicación. Si se reduce el número de
n ri
m(f)=---- bandas de octava se puede construir un sistema mucho más sencillo y rápido
denominado RASTI,7 que permite determinar la inteligibilidad del habla en
L ~2n n tiempo real.
Si se recort a cad a cociente indiv idual a un valor limitado entre + 15 y -15 dB, Se sabe que la lectura de los labios permite que las person as hip oacú sicas par-
se calcul an las relaci ones SIR aparent es por bandas de octava y se promedian ticipen en una conversación. Las personas con oíd o normal tambi én se bene-
los valore s de las 14 bandas involucradas, queda: fician con la información visual y, si bien no les perm ite la comprensión
completa del discurso hablado, la recon strucción fonética en presencia de rui-
14
do se facilita al observar el rostro del locutor.
L (S/R) ap Se ha comprobado que la información lingüística se comprende mejor
(S/R) a = o_c_L._1 _
cuando se la transmite por televisión que por radio (Re isberg y McLean,
p 14
1987). MacLeod y Summerfield encontraron que el"beneficio de la lectura de
labios" corresponde a un aumen to promedio de 11 dB en la relación señal-rui-
El índice de transmisión de la palabra (STI) repre senta una razón linealizada do del sistema y Ostberg prob ó que el tamaño del monitor de video también
de la forma: contribuye en el mismo sentido (McLeod y Summerfield, 1987) . Estas obser-
(S/R) ap + 15 vacio nes confirman la idea intuitiva de que la información visual contribuye
STI=-~-
30 7 Del inglés Rapid Speech Transmission Index.
264 265
100
Apéndice 1
80
1!J'" Teorema de Fourier
~
8 60
2'"
'"
Q)
:::l
40
o.
'"~
Q)
"O
Q) 20
Se
Q)
~
O O
[L
El teorema de Fourier se puede enunc iar de la siguiente man era: "Toda función
-30 -20 -10 o peri ódica de período P pued e descomp on erse en una suma de sinusoides armó-
Relación Señal I Ruido (dB) nicas, de amplitudes y fases adecuadas, cuyo primer armónico o fund amental
posea período P".1 En otros términos, una suma de sin usoides armón icas gene-
Figura 16. Au mento de la inte ligibilidad en condiciones de ruido al agregar informac ión ra una onda periód ica cuyo per íodo coincide con el período de la sin usoide de
visual
menor frecu enc ia, llamado primer armónico o fundamental de la serie. El teore-
ma permite descomp oner y ana lizar cualquier funci ón per iódic a y h abi lita la
a mejorar la intel igibilidad, sobre todo en condicio nes adversas provocadas posibilidad de construir seña les per iódic as co mplejas a partir de una suma de
por la existencia de ru ido en el canal de comunicación. sin uso id és puras.
En la figura 16 se observa el resultado del experimento de Ben oit , en el Rec ord emos que una sucesió n es armón ica cuand o presenta una base y to -
que se midió la intel igibilidad en función de la razón seña l/ruido en dos situa - dos sus múltiplos. Es un caso part icular de suces ión aritmét ica en la que la ba-
ciones diferentes : sólo audición y aud ición más visión (Benoit , C. et al., 1994) . se aa coincide con la razón k (a n = aa + n k con k = aa). Por ejemplo, una
La visión es innecesar ia en condic ion es acústicas óptimas (SIR > O dB), sucesión armó n ica de base 5 es: 5, 10, 15, 20,25 , oo . , n x 5; y una de base 300:
pero resulta decisiva en condiciones acústicas alta mente degradadas (SIR = -24 300, 600, 900 , 1200 , ... , n x 300. La diferencia entre dos valores sucesivos, o
dB) en las que la informació n auditiva no alcanza para entender el discurso lin- razón de la sucesió n armónica, es igual al valor de la base. A sí en el último de
güíst ico. los ejemp los 1.200 - 900 = 300; 900 - 600 = 300, et cét era.
La disposición de las amplitudes y frec uencias de las sinusoides involucra-
das en la suma se den omina espectro de Fourier, y cada una de ellas toma el
nombre de componente de Fourier.
Aunqu e la complej idad de las operaciones matemát icas involucradas en
el cálculo de los armón icos es grand e, en la actualidad ex iste n numerosos pro-
gramas de computación que los realizan con gran eficiencia. A un sin realizar
grandes esfuerzos matemáticos podemos extraer n umerosas conclusion es cua-
litativas que son de util idad. Por ejemplo, el teor ema dice'que una función pe-
riódica posee un espectro armó n ico. Si tenemos una seña l periódic a y
1 En realidad existen cie rtas restricciones matem át icas: las funciones deben ser seccío na l-
mente co ntinuas además de periódicas . Afortunadamente, las que interv ien en en acústica
musical cumplen con estos req uisitos.
266 267
los motivos de su empleo en gran cantidad de ap licac ion es prácticas. La voz
humana y algun os instrumentos, co mo el vio lín o el oboe, generan señales que
2 h=2mm
se le apro ximan .
E Tiempo (ms)
.§. Reconstrucción de parciales por batido
.§ o
ro
a.
W
Vl
-1
Dos sin usoides de distinta frecuencia baten a un a tasa igual a la diferencia de
frecuenc ias entre ambas. Como las compone ntes de Fourier son sinusoides, es
-2 de espera r que este fenómeno tenga .lugar para todo par de comp onentes ar-
mónicos que se conside ren . Si fn y fmson las frecuencias de dos armónicos
Periodo
P= 10 ms cualquiera, la frecuencia de batido seráfb = fm - fn ' La frecuencia de batido en-
tre armó nicos siempre va a co inc idir con la frecuencia de algún armónico de
la serie. En particular, dos com pon entes consecutivas bate n a la frecuencia de
0,64 A=O ,64 mm la funda mental. Por ejemplo fz - f, = fl ; h - f2 = fl; ... ,fn - fn.! = fr·
E La armonicidad de un espec tro refuerza la periodicidad dada por su fun-
.§. f, =1/ P = 100 Hz
"C
dam ental. Incluso, aunq ue falte la fundamental, la frecuenc ia que le corres-
=ª
c. 0.32 r, = nf ,
E
ponde se reconstru ye a partir del batid o de sus armónicos . Este fenómeno , de
« Frecuencia (Hz)
gran importancia musical, se cono ce como fundamental perdida o fantasma de
0,213 .........., I I
la onda .
Un eje mplo de reconstrucción de la fundamental se da cua ndo se repro -
duc e música a través de un altavoz pequeño, incapaz de radiar ond as de baja
f, = 100 Hz f, = 500 Hz f,o = 1000 Hz
frecuencia . Como la mayoría de los instrum entos graves -contrabaj os, fagotes
o bajos eléctricos- produce n seña les espectralmente ricas en armónic os, se
Figura 1. Gráfico temporal y espectral de un a onda diente de sierra pueden oír los bajos de la música porq ue los primeros armó n icos se reconstru-
yen po r bat ido a pesar de no estar presen tes a la salida de l altavoz. El fenóme -
no de fund amental reconstruida ta mbién puede originarse durante el proces o
conocemos su período, sabe mos inmedi at amente: 1) que el espectro corres- de percepc ión . Ocurre, por eje mp lo, cuando dos seña les acceden, a través de
pondiente será armónico, y 2) cuáles serán las frecuencias de cada uno de los auriculares, de man era independient e a cada un o de los oídos : en ese caso no .
armón icos (la co rrespondiente al período de la señal origi na l y sus múlt iplos). ex iste bat ido físico, de man era que la fundamental se reconstruye en algún lu-
I)l:scon oceremos, h asta q ue se ap lique completo el teorema de Four ier, las am- gar de la cade na neural de procesamiento superio r.
plitudes de cada uno de esos armónicos .
Co mo ejemplo aplicare mos el aná lisis de Fourier a la función diente de sie-
rm dibujada en la figura 1. El espec tro resultante nos muestra que posee tod os
I( IS armónicos posibles desde la fund amental hasta el infin ito. La amplitud de
cada lino de ellos va decreci end o a medida que aumenta la frecuencia según la
Il:YA" = Al / n, siendo n el número del armón ico, Al la amplitud de la funda -
1IIl:IHal y Al1 la amplitud del armón ico número n , Por ejempl o, el quinto armó -
nico tend r á una amplitud As = A l / 5, cinco veces menor que la fund amental.
En teoría, se de ben sumar todos los infin itos armón icos para sintetizar
cxncramcnte una onda diente de sierra. Es esta gran riqueza armónica un o de
:lóH 269
Apéndice II
Principio acústico de indeterminación
La serie de Fourier se pued e aplicar úni camente a seña les perm an entes perió-
dicas cuyos espectros son siempre armón icos y de líneas. N o es posible ana li-
zar con ella el estado transitorio de una seña l, que se puede definir como el
intervalo temp oral en el que una onda evolucion a de un estado perm an ente,
o estacionario, a otro. Así como ha y seña les totalmen te transi torias -la gene -
rada por el golpe sobre un a mesa es un buen ejernp lo-, ex isten otras que pre -
sentan ca rac te ríst icas trans ito rias en el comienzo y en la ex t inción,
perm an eciend o relati vamente estables dentro de esos límites.
Por oposició n al estado perm an ente, en el que toda oscilac ión es un a
combinac ión de sinusoides de dur ación infinita, el estado transi to rio posee
una dur ación finit a y necesariamente oc urre por lo men os al comenzar y fina -
lizar un a seña l. Cu alqu ier mod ificación de las condicion es de oscilación en
medi o del desarroll o de un a onda, como el ca mbio en la amplitud o la frecuen -
cia de algun a componente, form a part e del estado transitor io. El efecto de vi-
brat o, que cons iste en una variación periódica de la frecuen cia y/o de la
amplitud de aprox imadamente 7 Hz, origina en muchos casos la supresión del
estado permanente en la porción de seña l a la que se aplica. En seña les sin es-
tado perm anente el estado tr an sitori o coincide con su dur ación.
J. B. Fouri er desarroll ó la tranfomuula o integral de Fourier para extender el
alcance de sus series a tod o tipo de seña les, sean perm an entes o tran sitor ias.
Una de las deriv aciones más importantes de la tran sformada de Fourier esta -
blece que las seña les lim itadas en el t iemp o poseen espectros de banda. Se
puede concluir, por simetría, que los espectros de líne as, armón icos o no, co-
rresponden a señales n o limitadas en el tiempo.
Todas las seña les reales, obviament e limitadas en el tiempo, poseen anchos
de banda no nul os. La onda que gene ra un diapasón posee una gran duración
y un pequeño ancho de band a, mientras que la que produce un tamb or se ex-
tingue rápidamente y ocupa un ancho de band a considerable . Podemos pregun -
tar por la existencia de alguna relación general entre duraci ón y anc ho de
271
\
iñ' espectro contendrá una sola línea (como era de esperar). Si se analiza un im-
:2-
i!!
o pulso de duración tlt ~ 0, e! ancho de banda tlf será 1 dividido (casi) cero que
e
se equivale a infinito. Este resultado confirma que e! espectro de un impulso es un
-o
.¡¡; ruido blanco con un ancho de banda infinito. En e! caso intermedio de una se-
~
o.
Q) ñallimitada en e! tiempo -de duración finita- e! principio se aplica sin incon-
"O
Frecuencia (Hz) venientes. En la figura 1 se ilustra lo anterior con los diagramas temporales y
~
Z
/it=oo
f espectrales de una señal sinusoidal, de un impulso y de una señal de duración
M=O intermedia.
iñ'
:2- El principio acústico de indeterminación impone un límite inferior, pero
~ no uno superior: e! producto de la duración por e! ancho de banda puede al-
~
e
'.¡¡;
0
canzar valores considerables. Por ejemplo, e! ruido en una avenida muy tran-
~
o.
sitada posee a la vez una duración (tlt) y un ancho de banda (tlI) muy grandes
Q)
"O liempo (ms) y no viola por ello la relación tlf X tlt ? l.
a;
>
Z Es importante destacar que e! principio de indeterminación no se refiere
/it=o . a una limitación en la tecnología de generación de ondas o en e! mecanismo
!'1f= 00
iñ' de percepción humano, sino que describe e! comportamiento físico propio de
:2-
o
i!! los fenómenos ondulatorios. No existe la posibilidad de construir una señal
e
se que a la vez esté bien determinada en la frecuencia (pequeño tlI) yen el tiem-
-o \
.¡¡; po (pequeño tlt), cualquiera sea la tecnología utilizada. En otras palabras, no
liempo (rns)
~
o.
Q)
"O
a;
\.
Fr~~encia (Hz)
se puede construir un sonido tan corto como e! de un tambor y a la vez tan tó-
nico como e! de una flauta.
>
Z
tlf X tlt ? 1
272 273
Referencias bibliográficas
Ando, Yoichi (1998), Architeetural Acoustics. Blending SoundSources, Sound Fields , and
Usteners, Nueva York, Springer-Verlag,
- et al. (1997a) , "Acoustic Design of a Conc ert Ha ll App lying rhe Theory of
Subjective Preference, and th e Aco ustic Measu rement after Construcction" ,
Acustica & Acta Acustica, 83.
- Y Den nis Noson (1997b) , Music and Concert Hall Acoustics, Londres, Academic
Press Limited.
- (1985), Coneert Hall Acoustics, Berlín, Springer-Verlag .
Aronson, L. et al. (2005) , "C aract erísticas acústicas de la vocales del españ ol rio-
platense", public ado en int emet por la Fundación Arau z.
Attneave, E y R. O lson (1971) , "Pitch as a Medium: A New Approach ro
Psychop hysical Sca ling", American}oumal of Psychology, vol. 84.
Backu s, J. (1969) , The Acoustical Foundations of Music, Nueva York, W.W. Narran &
Company Inc,
Barren S. (1994) , "C haos, Self-Organ izatio n and Psycho logy", American Psychologist,
vol. 49.
Basso, G. (2005) , "Orden gen erativo, fract ales y música", en Revista del Instituto
Superior de Música UNL , N 2 lO, Santa Fe.
- (2004) , "Variables de diseñ o en campos acústicos no expon en ciales", en Actas de
las Terceras Jorn adas de Acúst ica Elect roacúst ica y Ár eas Vinculadas (CADAE),
Buenos Aires.
(2002) , "Fractales y estructuras musicales a utos e rnejan tes", en Actas de XV
Conferencia Anual de la Asoci ación Argentina de Musicología, Buenos Aires.
- (200 Ia), Análisis espectral. La transformada de Fourier en la música, La Plata, Ed. A l
• j
Margen - UNLP.
- (200 Ib) , "Fractales, ruido l /f y música", en Acras del Encuentro Nacional 2001 de
Investigación en Artes y Diseño (ENIAD 2001) , La Plata.
- (2000), "Percepción auditiva. Nuevos enfoques", Bemal, UNQ, mimeo.
- .(1999), "El prin cipio de indeterminación en acústica musical", en Acras de la XIII
275
C onfcrencia Anual de la Asociación Argentina de Musicología, Buenos Aires. C ha lmers, D . (1 996) , "El pro blema de la co nciencia" , Investigación y Ciencia, N º 233 .
- (1998a) , "Modelos estáticos y dinámicos en acú st ica mu sical ", en Actas de la 2ª C hion, M . (1998) , "Du son a la chose : hvpotheses sur l'obj et so no re", L'analysemllSi-
Conferencia lberoanericana de Investigación MlISical, Lanús. cale, vol. 11.
- ,J. G ui llén y M . Liut (2000), "Condiciones ne cesar ias para el uso musical efic az del Colburn , H. S. (1 995) , "Cornputa t iona l models of binaural proc essin g", Auditory
desplazamiento acústico temporal", Actas del 11 Congreso Iberoamericano de Co mputation, Nueva York, Springer-Ver lag.
Acústica, Madrid . Cook, P. (1999) , Music, Cognition , and Computarized Sound, Cam bridge , MIT Press.
- er al. (1998a) , "Límites de aplicaci ón del de splazamiento ac úst ico temporal", en C how n ing , J. (1999) , "Perc eptual Fusion and Audi tory Perspective" , MlISic, C ognition ,
Actas de la XII lomadas Argentinas de MlISicología, Buenos Aires. and Computarized Sound, Cook (ed. ) , Cambridge, MIT Pre ss,
- ct al. (1998b) , "El desplazam iento acúst ico tempor al. Ajuste de la expe riencia y uso Cole, R. y B. Scott (1974), "Towa rd a theory of speech perception", Psychological
musical ", en Actasde las III lomaáas del lnstituro l ulio E. Payró, Buenos A ires. RellÍew, vol. 8 1.
I\ékcsy, G . Von (1960), Experimen rs in Hearing, Nueva York, Wil ey.- Crowde r, R. G . (1989), "lmagery for musical ti mbre", l oumal of Experimental
I\cnade, A. H . (1 976), Fundam entals of MlISical Acous ncs, Nueva York , Oxford Psychology: Human Perception and Performance, vo l. 15 .
U nive rsitv Press C ulver, C. A . (1947 ), MlISical Acous ncs, Filadelfia, Black iston.
- (1960) , Horns , Stríngs and Harmony, Nueva York, Anchor Books . Delgut e, B. (1987) , "Pe riphe ra l aud itory processin g of speech in forrn ation", en The
Ilcn o!t, c., T. Mohamadi y S. Kandel (1 994), "Effec ts of ph onetíc context on audio- Psychophysics of Speech Percepnon, Países Bajos, Nijhoff.
visua l inrelligibtlirv of French speech in noise'', l oumal of S/JCcch & Hearing Dennett, D. C. (1 993), Coscienza, Mil án, Rizzoli.
Hesearch. Deutsch, D. (1999 ), The Psychology of Musíc, Nueva York, A cademi c Press.
Ik r:mck, L. (1996) , Concert and Opera Halls : How chey Sound, Nu eva York, Acoust ica l - (1995), MlISicalIUlISions and Patadoxes, La [ oll a, Philomel R. In c.
So ciety of A me rica . - (1992), "Parado jas de la to na lidad musical", Investigación y Ciencia, N º 193.
- ( 1988 ), AcolIStical Measuremenrs , Woodbury, A cou stical Sociery of Am érica. - (19 75) , "Two-cha n ne l listening to musical sca les", l oumal of che Acousnccl Sociery
- ( 1962), MlISic, ACOlIStiCS, and Architecrure, Nu eva Yo rk, W ile y. of America, vol. 57.
- ( 1954 ), Acousncs, McG raw HiIl [trad ., (1961) , Acústica, Buen os A ires, Edi tori al Di Liscia, O . P. (2000), "Sparial lisren ing and its co rnpute r sirnulatio n in elec tro n ic rnusic",
H ispan o Ameri cana]. en <http://de pts.wash ington .edu/smccweb/co urses/40 1-3/402e xamps/spatial.h tm l>.
I\islllark, G. von (1974), "Sharpness as an attribute of rh e timbre of stea dy so unds" , Diven yi, P. (1 992), "Binaura l suppression of non ech oes", l oumal of Experimental
Acustica, vol. 30. Psychology: Human Perception and Performance, vol. 91.
I\laucrt , J. (1997), Spatial Hearing. The psychophysics of human sound localization, - y Zak arauskas, P. (1992), "The effect of bandwidth on aud ito ry localizat ion : An
Ca mbridge, MIT Press. est ima t ion th eorv mod el", Proceedings of rhe 12th Intemational Symposium on
I\rcgma n , A . (1 994) , Audiwry Scene Analysis, C ambridge, MIT Press. Hearing, Lond res, Pergam on Press.
I\row ne ll, W. E. et al. (19 85) , "Evoked Mechanical Response of lsol at ed Coch lea r - y Da n ner, W. (1977) , "Discn mina t ion of ti me in terva ls marked by brief aco ustic
Ou rer Hair Cells", Science, vo l. 227. pulses of va rio us intens it ies and spec tra", Percept . Psychophys., vo l. 2 1.
I\urlc r, R. A . (19 69) , "Mo na ura l and binau rallocali zation of n oise bursts vert ica lly in Du rlac h, N . I. y L. D. Braida (1969) , " ln te ns iry perception, I. Preliminary th eo rv of
th e medi an sagg íra l plan e", l oumal of Audirory Research, vo l. 3 . intensiry resolution ", 1.Acousr, SocoArner. , vo l. 46, pp . 372-383 .
I\ull cr, D. (1 992) , T he MlISician's Guide ro Perception and Cognition , Nueva York, Eh resma n, D. (197 8) , "Perce pt ion of t imb ral ana logies'', Rapp orts IRCAM N ° 13/78.
Sc h irmer Books . Erickson, R. (1975 ), Sound Srructure in MlISic, Berkeley, Un íversirv of Californ ia Press.
•adoz, C. et al. (1993) , "CoRDlS-AN IMA : a Modeling and S irnulation Svstern for Sound Fechner, G. (1 860), "Elementos de psicofísica ", publicado en internet.
and lmage Svnthesis-The General Forma lism", Computer Music loumol, vol. 17. Feyman , R. (1971) , Fesica, Panamá, Fondo Educ ativo Latinoameric an o .
C arlso n , R., B. Granstrorn y S. Hunnicutt (19 82), "A rnulti-language text-t o-speech Fin e, P. A. y B. Moore (1993), "Frequency ana lysis and musi cal ability'', MlISic
module" , Proceedings of ICASSP, vol. 82 . Percepnon, vo l. 11. .
C arlyo n , R. y B. Moore (1984) , " In te ns lrv d iscrimin ati on: asevere departure from Fletc he r, H ., W. A. Mu nson, (1933) , "Loud ness, its definition, me asurem ent and cal -
Wcber's Law", l oumal of che Acousncai Sociery of America, vo l. 76. culat ion", l oumal of che Acousnca! Sociery of America, vo l. 5.
276 277
Flerch er, H. (1995) , "Speech and Hearin g in Co mmun ication - ASA Ed ít íon", reim- Helmh oltz, H. von (1885 ), Die Lehre von den Tonempfidungen [trad. en inglés, (1954 ),
preso, Woodbury, Am erican Institut e of Physics. On me Sensation of Tone, trad. A. J. Ellis, Nu eva York, Dover Publications].
Frnissc P. (1967), Psychologie du temps, París, PUF. Henning, G . B. ( 1970), "Co mparison of th e effects of signa l durat ion on frequenc y and
Fraser, J. T. (1992), 11 Tempo, una Presenza SconosciuU!, Milán, Feltr inelli. arnplitude discriminat ion ", en Frequency analysis and periodiciry detection in hear-
Freed , D. J. (1990 ), "A uditory correlates of perceived mallet hardn ess for a set of ing, ed. Plom p, Leiden , Sijthoff.
rccorded percussive sound eve nts", Journal of me Acoustical Society of America, Hirsch , 1. J. (1959) , "A uditory perception of temporal order", Joumal of the Acoustical
vol. 87. Sociery of America, vol. 31.
Frccrnan, W. (1991) , "Fisiología de la percepción", Investigación y Ciencia, Nº 175. Ho urgast, T. (1976), "Subharmon ic pitc hes of a pure tone at a low S/N ratio", Joumal
Ga rdner, M. (1968) , "H istorical Background of th e Hass and/or Precedence Effect ", of the Acoustical Sociery of America, vol. 60.
Joumal of the Acoustical Sociery of America, vol. 43. - (1972) , "Psycho physical evidence for later al inh ibition in hearing", Joumal of the
Garner, W. R. y G . A. Miller (1947) , "The masking threshold of pure tones as a func- Acoustical Sociery of America, vol. 51.
tion of durati on ", J. Exp. Psychol., vol. 37. - y Steeneken , H.. (1984), "A mu lrí-language evaluation of th e RASTI-Method for
G lasbcrg, B. y B. Moore (1990), "Derivation of audito ry filter shapes from notched estimating speec h int elligibilit y in aud ito ría", Acustica, vol. 54.
noise data" , Hearing Research, vol. 47. Houtsma, A. y J. Go ldste in (1972) , "The central origin of th e pít ch of pure tones: evi-
Gocrtzel, B. (1993), The evolvingmind, Nu eva York, G ordon and Breach Sci. Pub. dence from musical int erval recognition", JoJrnal of the Acoustical Society of
Goldstein, J. L. (1973) , "An opt imum processor theory for the cent ral formation of the America, vol. 51. \
pitch of complex tone s", Journal of the AcousticalSociety of America, vol. 54. - , T. Rossing y W. Wagenaars (1987) , Auditory Dernosrrcnons, ASA (cd y libro).
Goode, R. L. et al. (1994), "N ew knowledge about the functi on of th e hum an ear: Iverson, P. y C. L. Krumhansl (1989) , "Pit ch and timbre interact ion in isolated ton es
developmenr of an improved model ", Am. J. O roí., vol. .15. and in sequences", Joumal of the Acoustical Sociery of America, vol. 86.
G rantham, D. (1995) , "Spatial hearin g and related phenomen a", en Hearing, ed. B. Iverson, P. y C. L. Krumhansl (1993), "lsolat ing the dynamic attributes of musical tim -
Moore, N ueva York, Academic. bre", Joumal of the Acoustical Sociery of America, vol. 94.
G reen, D. M. (1973) , "Tempora l acuity as a functi on of frequen cy", Joumal of the [avel, E. ( 1980), "Codi ng of AM tones in the ch inch illa auditory nerve: implicat ions for
Acoustical Sociery of America, vol. 54. the pitch of complex tones", Joumal of the Acoustical Sociery of America, vol. 68.
G rcy, J. (1975) , An Exploration of Musical Timbre, CCRMA, Stanford Un iversity. [ohnson , D. L. y H. Gie rke (1974) , "A udibility of infrasound ", Joumal of the Acoustical
G uillaume, P. (1975 ), Pisicología de la forma, Buen os A ires, Psique. Sociery of America, vol. 56.
Hnas, H. (1951), "Uber den eingluss eines einfachec hos auf die horsamkeit von Karz, D. (1967), Pisicología de la forma , Madrid , Espasa-Ca lpe,
sprache" , Acustica, vol. 1 [trad. al inglés, (1972) , "The influence of a single echo Kemp, D. T. (19 78), "Stimulated Acoustic Emissions from with in th e Aud itory
on th e audibility of speech", Joumal of the Audio Engineering Sociery, vol. 20). Svstern", Journalof the Acoustical Sociery of America, vol. 64.
Hafter, E. y T. Buell (1990) , "Restart ing [he adapted binaural systern", Joumal of the Kend all R. A. y E. C. Ca rterette (1993) , "Verbal attributes of simultaneous wind
Acoustical Sociery of America, vol. 88. instrument timbres: 11. Adject ives induc ed from Piston 's O rchestration", Music
Hall, J. W.y R. W. Pete rs (1981) , "Pitc h from nonsimultaneous successive harmon ics Perception, vol. 10.
in quiet and noise", Joumal of the AcousticalSociery of America, vol. 69. Kend all, R. A., E. C. Ca rterette y J. M. Hajda (1999), "Na tural vs. syn the tic instru-
Hall, J. W. et al. (1984), "Detection i~ noise by spectro-ternporal pattern analysis", ment tones", Music Perception, vol. 16.
Joumal of me Acoustical Society of America, vol. 76. Klatt , D. H. (1989) , "Review of selected models of speech perception" , en Lexical
- y M. Fern ánd ez (1984), "The role of rnonoaural frecjuency selectivity in binaural Representation and Process, Ca mbridge, MIT Press,
ana lysís'', Jounial of the Acoustical Sociery of America, vol. 76. Klumpp, R. y H . Eadv (1956) , "Sorne measurements of int eraural time differenc e
Hall, D. (1991) , Musical Acoustics, Californi a, Brooks/Cole Publishin g Company. thr esholds", Journal of the Acoustical Society of America, vol. 28.
Handel , S. (1995) , "Timbre perception and auditory object identifícation ", Hearing, Kohler, W. (1972) , Psicología de la forma . Su tarea y últimas experiencias, Madrid ,
ed. B. Moore , Nueva York, Academic Press. Biblioteca Nue va.
- (1989) , Listening, C ambridge , MIT Press. - , K. Koffka y E Sand er (1962), Pisicología de la forma , Buenos A ires, Paidós.
'1
278 279
Kunish i, Masakazu (1993), "A udición bin aural ", Investigación y Ciencia, N " 20l. MiIler, G . y W. Taylor (194 8) , "The perception of repeat ed burst of noise", Journal of
Krumha nsl, C. (1990) , Cognitive Foundations of Musical Piteh, Nueva York , Oxford the Acoustical Sociery of America, vo l. 20, pp. 171-182 .
University Press. Miyara, E (slO, "Introducción a la psicoacústica", mimeo.
- y R. Shepa rd (1979), "Q uantifica rion of th e H íerarchy of Ton al Function s Within Moore , B. (1997) , An intToduction ro the Psychology of Hearing, Londres, Academic
a Diato nic Co ntex t", Journal of Experimental Psychology : Human Percepnon and Press.
I'L'Tfcmnance, vol. 5. - (ed .) (1995), Handbook of Perception and Cognition: Hearing, Londres, Aca demic
Kuhovy, M. (19 81) , "Integral and sepa rable d imen sion s and the theory of ind is- Press.
pensable att rib utes", en PerceptuaI Organiza tion, Erlbaum, HilI sdale . - et al. ( 1993 ), "Comod ulation masking release in subj ect s with un ilat eral and bilat-
Kuh l, 1'. K. ( 1993), "In na te predi sposition s and the effects of experience in speech per- eral cochlear he aring impa irrnent", Journal of me Acoustical Sociery of America,
ception: The narive langu age magnet th eory", en Developmental nenrocogníuon. vol. 93.
S¡Jeech and [ace processing in the [iTst yeaT of life, Países Bajos, Kluwer Academic - Y B. Gl asberg (1983) , "Suggested forrnul ae for ca lculating audito ry-filter bandwidths
Publishers. and exciration pattern s", Joumal of the Acoustical Sociery of America, vol. 74.
l.íhcnnan , A. er al. (1967) , "Perceprion of the speech code ", Psychological Review, vol. 74. Nei sser, U. (1967) , Cognitive psychology, Nue va York, Applet on- C entury-Crofts.
l.ihcnnan , A. y Mattinglv, I. (1985) , "The motor theory of speech perception revisited ", Ol son, H. (1952), Music, Physics and Engineering, Nueva York, Dover Public ati on s.
Cognition, vol. 2l. Ostberg O. , B. Lindstrom y P. O . Renhall (1988), "C ontribution to speech intelligi-
l.ihcrman, A. M. (1995), Speech,'peTception, C ambridge, MIT Press. bilitv by different sizes of videophone displavs", Proc . of the WOTkshop on
Lo , Y. O . (1987) , "Toward a Theory ofTimbre", Stanford , CCRM A , Stanford University. Videophone Terminal Design, Turín.
Mc/vd arns, S. y E. Bigand (1994): Penser les sonso Psychologie cognitive de l'audition, Patterson , J. y D. Green (1970), "Discrimina tion of Transien t S igna ls Having 1dentical
París, PUF. Energy Spectra", Journal of the Acoustical Sociery of America, vo l. 48.
McAd ams, Stephen (1995), Localisation Auditive, París, (RCAM . Patterson, R. D. (197 6) , "A ud ítory filter sha pes deri ved with noise stimuii", JOltmal of
I
Mc lclland , J. L. Y J. L. Elman (1986) , "The TRA CE Model of Speech Perception ", the Acoustical Sociery of America, vol. 59.
Cognitive Psychology, vol. 18. Pickles, J. (1988) , An Inrroducnon ro the Physiology of Hearing, Sa n Diego, Academic
Mcfadden, D. (1989) , "Spectral differences in th e ability of temporal gaps to reset th e Press.
mec han isrns underlying ove rshoo t", loumal of the Acoustical Society of America, Pierce, J. R. (1991), "Per iodicity and Pitch Percept ion ", Joumal of the Acoustical Society
vol. 85. . of America, vol. 90.
McG iIl, W. J. y J. P. G oldberg (1968), "A Study of th e near-rniss in volving Weber's - (1985) , Los sonidos de la música, Barcelon a, Ed. Labor.
l.aw and pure-to ne intensity discrim ination ", Perception and Psychophysics, vol. 4. Pison i, D. B. (1973) , "A uditory and ph on etic memory codes in th e disc rimina tio n of
McU urk , H. y J. MacDonald (1976) , "Hea ring lips and see ing voice s: A new llluslon ",' co nsona nts and vowels", Percepr, Psychophys., vo l. 13.
Naiuse, vo l. 264. Plenge, G . (1974 ), "On th e differen ce bet ween localizati on and lateralizati on ", The
McLeod A. y Q. Summerfield (1987), "Q uantifving the contributi on of vision to Journal of the AcousticalSociety of America, vol. 56 .
specc h perception in noise", BritishJoumal of Audiology, vo l. 21. Plomp, R. (1976), Aspects of Tone Sensation, Londres, Academi c Press.
Majern ík, V. y J. Kaluzn (1979), "On the aud itory uncertainl y relat íon s", Acusncs, vol. - (1967) , "Pitch of cornplex tones ",Journal of the AcousticalSocieryof America, vol. 4l.
43. - y Levelt, J. M. (1965) , "Tona l Co nsonance and C rit ical Bandwith", Joumal of the
Mulluun D. G . (199 8), "Spat ial hearing mechanisms and sound reproduction ", trad. al Acoustical Sociery of America, 38.
espa ño l O . P. Di Liscia, aut~rizada por el auto r, en <http://www.unq.edu.ar/cme/ Pollack, I. (1968), "A ud itory pulsed Doppler discrirninati on" , Joumal of the Acoustical
pcrson ales/odili scia> . I Sociery of America, 44 , pp. 592-598
Muu hew, Robert (1975), "Acoustics in perspectíve", en Auditorium Acoustics, Londres, - (1953) , "The Inform ati on of Elementary Auditory Displays", Journal of me
Appli ed Scie nce Publishers. Acoustical Sociery of America, 25, pp. 765-769.
I
Mathews, M. y J. Pierce (1980) , "Harrnony and nonharm onic partials", Journal of the Rand , T. C. (1974) , "D ichoti c release from maskin g for speech", Journal of me
Acoustical Sociery of America , vol. 68. Acoustical Sociery of America, vol. 55 .
2HO 281
Rund ell, M. (1993), "Mental models and comp lex systems: the adaptive dyn amics of Shackleton , T. M., et al. (1992) , "Across frequency integration in a model of lat eraliza-
cog n ítio n", en intemet, tion", Journal ofme Acoustical SOOety of A meriea, vol. 9 1.
Rasch, R. A. (1978) , "T he percepti on of sirnultaneo us notes such as in polyph on ic Sh ailer, M. y B. Moore (1987), "G ap detecti on and th e aud itory filt er: ph ase effects
rnusic", Acusncc, vol. 40. using sinusoidal stimuli", Joumal of me Acaustieal Society of Ameriea, vol. 81.
R a~ch , R. y R. Plom p, (1999 ), "The percep tion of musical tones", en The psychology of Shep pard, R. N . (196 4) , "Circularity in j udgmenrs of Relativ e Pítch", Joumal of me
music, ed. D. Deutsc h, San Diego , Ac adem ic Press. AeousticalSociety of America, vo l. 35.
It aylc igh , L. (1945) , The Theory ofS ound, Londres, Dover. Slawson , W. (1968), "Vowel qu ali ty and musical timbre as functia ns of spectrum enve -
RCPJ1, B. H. (1987) , "The sou nd of two hands clapping", Journal of me Acoustical lope and fundame nt al freq uency", Journal of Acoustical Sociery of America, vol. 43.
Sociery of America, vo l. 8 1. Sod erqui st, D. R. (1970) , "Frequenc y ana lysis and the critic al band ", Psychonomic
Rcisberg D. y J. McLean (1987 ), "Easy to hear but ha rd to und erstan d: A lip-reading Science, vol. 21.
advan tage with in tact aud itory stimuli", en Hearing by eye: T he psychology of lip- Spiegel, M. E (1981) , "T hresholds for tones in maskers of various bandw idth s and for
reading, New Jersey, Lawrence Erlbau m A ssoc iates. signals of various band widths 3S a function of signa] frequency", Journal of me
R i s~et, J. C. (1986), "Pirch and Rhyth m Paradoxes: Comme nt on A udi tory Paradoxes Acoustical Sociery of America, vol. 69.
Based on Fract al Waveform ", Joumal of me AcousticalSociery of America, vo l. 80. Steeneken, H . y T. Hou tgast (1980) , "A ph ysical meth od for measuri ng speech -trans-
- (l 978a ), "Musical A coustics", París, Rap por ts IRCAM N ° 8. mission quali ty", Journal of the Acoustical Society of America, vol. 67.
- (l 978b) , "Paradoxes de Hauteur ", París, Rapports IRCAM N ° 10. Ste rn , R. y C. Trah iotis (1995) , "M odels of bin aur al in teraction" , en Hearing, ed. B.
- ( 1978c ), "Ha uteur et Tim bre des Sons ", París, Rapports IRCAM N° 11. Moo re, N ueva York, A cade mic Press.
- y M. V. Mathew s (1969) , "A na lysis of Musical ln strument Ton es", Physics Today, Steven s, K. y B1umstein, S . (1981) , "The search for in variant aco ustic cor relates of
vol. 22. ph on etic features", Perspectives on me study of speech, eds, P. Eirnas y J. Miller,
Rissct , J.c., y D. L. Wessel (1999), "Expl orati on of timbre by analysis and svn th esis", HiIlsdale, Lawren ce Erlebaum A ssociates.
en The Psychology of Music, ed. D. Deutsch , San Diego, Acadernic Press. Srevens, S. S. (1975) , Psychophysies: Introduction ca its Percepruei, Neural and Social
Rirsma, R. ( 1967), "Frequenci es dorn in ant in th e percep tion a f t he pitch of co mp lex Prospeces, Nueva York, W iley & Sonso
sound" , Journalof the Acoustical Sociery of America, vo l. 42. _ (1959), "On th e valid ity of loudness sca le" , Journal of me Acoustical Sociery of
- ( 1962), "Ex istence region of the to nal residu e", Journal of me Acoustical Society of America, vol. 3 1.
America, vol. 34. _ (1935) , "The relat ion of pitc h to ín rensitv," Joumal of me Acoustical Sociery of
RllCk, 1. y S. Palmer (199 1), "El legado de la psicología de la forma ", Investigación y America, vol. 6.
C iencia , N º 173. _ et al. (1937), "A scale for the measurem ent of the psych ological magnitude of
Rllcdcrer, Juan (1997), Física y psicafísicade la música, Buen os A ires, Rícordí. pit ch", Journalof the Acoustical Society of America, vol. 8.
Rulz, Ricard o (1995) , Ideas para el estudio de la organización psíquica, La Plata, UNLP. Sund ber g, J. (1991) , T he Science of MusicalSound, Sa n Diego, Ac ade mic Press.
Schaeffer, P. (1966 ), Traite des Objets Musicaux, París, Edition du Se uil. _ ( 1987), T he Science of me Singing Voice, DeKalb, N orthe rn lll inois U niversity Press.
- ( 1952) , A la Recherche d'une Musique Concrete, París, Edition du Seuil [trad . en _ y Lind qvist , J. ( 1973 ), "Musical octaves and pitch," Journal of theAcoustical Sociery
castellano, (1959) , ¿Qué es la música concreta?, Nueva Visión] . of America, va l. 54.
Scho urcn, J. E et al. (1962), "P itch of the residue", Joumal of [he Acaustical Sociery of _ y Verrillo , V. (1980 ), "O n the ana to mv of che ret ard : A stud y of timing in rnusic ,"
America, vo l. 34. Journal of meAcoustical Sociery of America, vo l. 68.
Sc k, A. (1994) , "Mod ulation det ect ion thresholds and critica l mod ulat ion frequency Terhardt, E. (1974) , "Pitch , conso nance and harm on y," Journal of the Acoustical Sociery
based in rand om amplit ude and frequ ency ch anges", Joumal of me Aeoustieal of America, vol. 55 .
Soeiery of Japan, vo l. 15. _ et al. ( 1982a ), "Pitch of complex signa ls according to virtual-pitch theory: Tests,
Se tha res, W. A. (1993 ), "Loca l Conso na nce and th e Relation sh ip betw ee n Ti mbre examples, and predic tion s", J . Acaust. Soc. Am. , 71.
and Scale", Journal of me Aeoustical Soeiery of Ameriea, vo l. 94. _ y W. Dixon Ward (1982b), "Recogn ition of musical key: Expl orato ry study", J .
Sc tharcs, W. A. (1998) , Tuning, Timbre, Speerrum , Seale, Londres, Springer-Verlag. Acoust. Soc. Am., 72.
282 283
U nc moto, T. (1989 ), "The psycho logica l structure of mu sic'', Proccedings of che Firsc
lntemationalConference on Music Perception and Cognition, Ki oro. Índice temático
Vand erv eer, N. J. (197 9) , "Ecological A cou stic s. Human per ception of environmenral
so unds", Doctoral Thesis, U n ivers ity Microfilms N o. 8004002.
Van Dom mele n W. (1990 ), "Aco ustic parameters in human speaker recog n it ion",
Lang Speech, vo l. 33.
Van Noord en, L. (1975), "Te mpora l Coherence in the Perception of To ne Sequcnces'',
lnstituut voor Perceptie Onderzoek, Eindhoven.
Vica rio , G . B. (1997 ), "TIme in Psych ology", Sci. A m.
- ( 1967), Tempo Psicologico ed Eventi, Florencia, Gi un ti-Barbera .
A Blau ert, modelo de, 20 1
Vicm eister, N . F. (19 88) , "Psvchoph vsical aspects of aud ito ry intensity coding", en
Ad apt ación auditiva, 73, 82 Brillo del sonido, 187
Auditory Functions, ed. Edelm an, Nueva York , Wil ey.
Adaptación bínaural, 200
Wa llac h, H. et al. (1949 ), "The Preced en ce Effect in So und Local ízation ", American
Ada ptació n pato lógica, 74 C
[oumai of Psychology, vo l. 57 . Agregado auditivo, 215 Ca mpos acústicos virtuales, 212
Warr en, R . M . (1970) , "Elimination of biases in loudness jud gernen ts for ton es", Algoritm os psicoac ústicos Ca tego rías tempora les, 117
Joumal of the AcousticalSociery of America, vol. 48. de compresión, 113 Células ciliadas, 34
Warrcn, W. H . y R. R. Verbrugge (1 984 ), "A uditorv Percept ion of Breaking and Altura espectral, 133 Cóc lea (caracol), 32
Bounci ng Eve nts: A Case S tudy in Eco logica l Acoust ics'', Journal of Experimental A ltura residual, 140, 143 Color del sonido, 183
l'sychology: Human Perception and Performance, vol. 10. Altura ton al, 133 Co loració n espectra l, 204
Wcgcl, R. y C. Lan e (1924) , "The auditory masking of one sound by ano the r sound and Altura ton al en estímulos diacróni cos, 140 C ornodulaci ón, reducci ón del
A ltura tona l en estímulos sinc rónicos, 140 enmascaramiento por, LOS, 227
its probable relat ion to th e dynam ics of the inner ea r", Physical Review, vol. 23.
A ltura to na l, representación gráfica, 150 Co nducto coclear, 31
Wic r, G . c., W. [esteadt y D. M . Green (1 977) , " lmensi ty di scriminati on as a func t ion
An álisis auditivo del ento rno, 215 Co no de confusión espacial, 195
of frequencv and sensa tio n level", Journal of the AcousticalSociery of America, 6 1,
An álisis espect ro-temporal, 104 Conson ancia y disonancia, 160
pp. 169-177. ' Co nsonantes fricat ivas, 242
Aná lisis rnult idimen slon al, 171
Wc ssel, D. (1 978 ), "Low Dim ens ion al Control of Mu sical TIm bre" , París, Rappor ts A ncho de banda , 272 Co nsonantes nasales, 242
IRCAM N° 12. Ancho de banda rectangular equivalente, 92 Co nsonantes plosivas, 241
Whi ttl e, L. S. et al. (1972) , "T he aud ibility of low freq ue ncy sounds", J. Sound Vib., And o, modelo de, 51, L09, 20 1 Co nstancia de la sonoridad, 207
vol. 21. Aparato vocal, 240 Co nstancia del timbre , 187
Zwicker, E. (1 965) , "Te mporal effects in simulta neous mas king by whi te-noise burst", Ar móni cos, 267 Co nto rnos de igual sono ridad, 6 1
Journal of the Acoustical Sociery of America, vo l. 37. A tenc ión y timbre, 190 Co rresponde ncia tiempo-int ensidad, 200
- , G . Flottorp y S. S. Stevens (1957), "Crit ical Bandwidth in lo udness surnma t ion", e
Atributos dispensables indispensables, 149 Cor t i, órgano de, 3 1, 33
Joumal of the Acoustical Sociery of America, vol. 29. Audición analítica, 134
Audició n fuera de frecuencia, 94 D
- y H. Fastl (1999), Psychoacustics. Fac ts and Models, Berlín, Springe r-Verlag.
Audición sinté tica, 134 Datos espectra les, 198
- y H. Fast l (1990 ), Psychoacustics, Berlín, Sp ringe r-Verlag,
Aur iculares, 22 Decibel (unida d), 54
Zwislocki, J. J. y H. N . [ord an (19 86) , "On the relation of intensitv jnds to loudness Desborde acústico ("overshoot") , 77
Ayuda visual para la inteligibilidad, 265
and neural noise, Joumal of the Acoustical Socie ty of America, vol. 79. Desplazamiento acúst ico temporal, 128
B Desplazamiento permanente del umbral
Bandas críticas, 91, L03 (PTS) ,77
Batid os binaurales, 197 Desplazam iento te mporario del umbral
285
284
(TIS) ,75 Fonación, 24 1 Intensidad, cod ificac ión per iférica, 82 Modelo de supresión , 104
Detecc ión de asincro n ías, 127 Fonemas, 239 Intensidad , diferencia apenas per ceptible Modelos de doble población, 83
Detección de discontin uida des, 124 Formantes, 244 ( DAP ), 66 Mod elos tem po rale s, 142
Detecc ión de seña les en presen cia Fo urier, teor em a de, 267 Intensidad , di scr im inación de la, 66 Mod o ling üístico, 252
de ru ido , 77 Fourier, transformada de, 27 1 Intensidad , factor es espec tra les, 71 Moor e, mod elo de, 145
Diferen cia int eraural de inte ns idad (lID), Frecuencia, diferencia apenas perceptible Interferencia bin aural, 201 Morfofóri co, medio, 149, 189
190 (DAP) , 89 Intervalos di acrónicos, 156 MP3, cod ificac ión, 114
Diferencia int erau ral de tiempo ([TD) , 192 Fuente acús tica, 2 16 Interv alos musicales, 154
Dimensiones tímbri cas excl usivas, 187 Fun ción de t ransfe re ncia de la cabeza Inte rvalos sinc rónicos, 157 N
Disc rimi nación de parciales, 100 (HRTF),1 98 In var iancia de l timb re, 169 Ne rv io audi tivo, 40
Disparida des en el cu erpo de la se ña l, 200 Fun ción de transferen cia del o ído, 47 Inv ar iantes ac ústicas, 178 Neura l, respu estas de a lto ni vel , 48
Distorsión alineal, 110 Fundamental de Fourier, 134 , 140,267 Inv ersión temporal , 169 Nivel de intensidad (NI) , 57 , 61
Distor sión armó n ica , 47 Fundamental recon struida, 140,269 Is ófon as, c urvas , 6 1 Nivel de presión sonora (NPS) , 55
Distribució n de a rmónicos, 168 Fusión por armo n icidad, 2 17 Iso morfismo , 238 N iveles de um bral, 59
Dop pler, efecto, 2 11 Fusión po r ca mbios de a mpli tud y Iverson y Krumhansl, est ud ios de, 174
frecuencia, 220 . o
E Fusión por contraste con sonidos previos, 219 L O bjetos a udi tivos, 166,215
Ecos, 203 Fusión por disp arid ades en el ata q ue, 2 19 Ley de cierr e, 231 Ohm, ley acú sti ca de , lOO, 167
Ecos cocleares, 47 Fusión por locali zación de la fuente, 221 Ley de co ntin uida d, 233 O ído abso luto, 157
Efecto de ca fete ría, 2 17, 223 Fusión por periodi cid ad , 223 Ley de des ti no co mú n, 234 Oído ex te rno, 20
Efecto deprece de nc ia, 202, 222 Fusión y fisión rítm ica , 226 Ley de prox imidad, 230 O ído interno, 30
Emisión vocal, 24 7 Ley de semeja nza, 23 1 O ído medio, 24
Emis iones otoacús ticas, 3 7, 46 G Limen en frecuencia, 89, 137 Orden tempor al, 128, 226
Enmascaram ie n to, 101 G estalt , teor ía de la, 228 Lime n en inte nsidad, 66
En mascaram iento binaur al, 109 Goldste in, modelo de , 142 Lo, modelo de, 184 p
Enmascaramie nto no si multá neo, 106 G rey, mod elo de, 174 Loca lizac ión auditiva, 19 1 Pabellón auric ular, 20
Ensayos de art iculació n, 258 Loca lizac ión de seña les co mplejas, 197 Pascal (unidad), 54
Escala de alturas, 136 H Localización de seña les trans ito rias, 199 Patol ogía s aud iti vas , 77
Especializació n cere bra l para e l h abl a, 248 Hass, efecto , 20 2 Localizac ión mon oau ral, 197 Per cepción ca tegórica , 253
Espec tro de pot encia, mod elo del, 92 Hu esecillos del oído medi o, 26 Loc ali zación temporal , 129 Percep ción del habl a, 239
Espectrogramas audi tivos, 249 Loud ness, co ntrol de, 62 Pe rce pc ión del movimi ento , 2 11
Estado tr ansitor io, 271 Per cepción du al, 253
Estímulos sin usoida les, suma de, 71 Indi cador es acústicos invariantes e n el M Pérd ida de art iculación en consonantes, 265
Eustaquio, t rompa de , 26 habl a, 256 Medidor de nivel sonoro, 64 Perfil espectral, exam en del, 108
Excitac ión impulsiva, 44 Índice de arti culac ión, 262 Medid or es de so no ridad, 8 7 Perspectiva aud it iva, 206
Índice de t ransm isión de la pa labra, 263 Mel (un idad) , 136 Plomp, estudios de , 172
F Integración au diov isua l, 253 Mem brana basilar, 3 1, 43, 46 Potencia acús tica, 56
Factores espect rale s, 98 Integración tempo ral, 70, 119 Mem or ia de la inten sidad , 85 Presión d in ám ica , 54
Fase, informaci ón de , 39 Inteli gibilid ad de la palab ra, 257 Met am éricos, timbres, 189 Principio acústico de indetermi nació n , 95 ,
Fat iga aud it iva , 75 Inteligibilid ad , predicción de la , 260 Mínimo áng ulo de mov imiento 119 ,130,1 86,200, 248,271
Fcchner, ley de , 70 Intensidad ac úst ica, 56 pe rce ptible (MAMA) , 211 Principio de figura y fondo, 235
Filtros de modulación, 126 Intensidad , codificación co n tex tua ], 85 Modelo de cobertura, 104 Pri nci pio de inferencia inc onsciente, 228
Fletc her, ex per imento de , 91 Intensidad, codificación de la , 8 1 Mod elo de reconocim iento de pat ron es, Principio de pertenen cia, 235
Fon (un idad ), 61 Intensidad , codificación de rasgos , 85 141 Prin cipio de pregn ancia, 236
286 287
\1
,\
Propiedades emergentes, 228 'método de, 95
Psicofísica, ley, 62 Supresión lateral, 107
R T
Rango diná mico, problema del, 81 Tasa de ocurrencia en el habla, 251
Reclutamien to auditivo, 79 Tensor del tímpano, 29
Red neuronal, modelo de, 256 Teoría de los rasgos invariant es, 255
Reflejo acústico (en el oído medio), 29 Teoría del lugar, 42, 134
Refractario, estado, 38 Teoría del magnet ismo del lenguaje
Refuerzo electroacústico , 204 nativo, 255
Regularidad de datos físicos, 226 Teoría dob le, 196
Reissner, membrana de, 32 Teoría motora , 255
Relación señal/ruido, 93, 261 Teoría temporal, 134
Resistencia del habla, 257 Terdhardt , modelo de, 142
Resolución temporal, 118 Tiempo, problema de l, 117
Reson ancia de l filtro auditivo, 121 Timbre, 163
Resonancia del tracto voca l, 244 Timbre en la voz humana, estudios sobre
Resona ncia mecán ica el,182
(membrana basilar), 43 Timbre, defin iciones, 164
Reverbe ración , 208 Timbre, modelo clásico, 167
Risset y Math ews, método de, 180 Timbre, modelos de aná lisis por síntesis,
Ruido enmascarante de Patterson, 95, 119 177
Timbre, modelos verbales, 178
S T ímpano, 24
Scho ute n, experimento de, 142 Ton icidad, 134
Secuencias rítmicas, 225 Tonotopía, 42
Segregación auditiva, 217 Transducción en el oído medio, 27,3 7
Sensibilidad a la fase, 98
Seña les cuasi-periódicas, 223 U
Shepa rd, hélice de alturas to na les, 151 Umbral de audiblidad, 58
Shepard, sonidos de, 152 Umbral para estímulos complejos, 98
Sínte sis acústica, 170 Unísono tímbrico, 189
Slawson, estudios de, 183
Son (unidad), 63 V
Sonidos de combi nació n, 110, 112 Variación de datos acústicos en el habla,
Sonidos diferencia les, '110 251
Sonogra mas, 248 Vocales, 243
Sonoridad , 53 Van Békésy, esquema de, 101
Sonoridad, control de, 62 Voz humana, frecuencias fundamentales.
Stapediano, 29 182 .
Stevens, relación de, 64
Suma de locacion es, 203 W
Supresión, 82 Weber, fracción de, 68, 71, 84
Supresión de bandas por cobertura, , Weber, ley de, 68, 8 1
288